W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozprawa doktorska

Pobierz BibTeX

Tytuł

Speaker recognition based on transcoded speech for human-machine interfaces

Autorzy

[ 1 ] Instytut Automatyki i Robotyki, Wydział Informatyki, Politechnika Poznańska | [ D ] doktorant

Promotor

[ 1 ] Instytut Automatyki i Robotyki, Wydział Informatyki, Politechnika Poznańska | [ P ] pracownik

Promotor pomocniczy

[ 1 ] Instytut Automatyki i Robotyki, Wydział Informatyki, Politechnika Poznańska | [ P ] pracownik

Recenzenci

Wariant tytułu

PL Rozpoznawanie mówcy na podstawie transkodowanej mowy do interfejsów człowiek-maszyna

Język

angielski

Słowa kluczowe
EN
  • Speaker recognition
  • lossy encoding
  • GSM
  • gaussian mixture models
  • fixed-point arithmetics
PL
  • Rozpoznawanie mówcy
  • kodowanie stratne
  • GSM
  • mieszaniny gaussa
  • arytmetyka stałoprzecinkowa
Streszczenie

EN This dissertation presents results of research related to recognition of speakers from short utterances in application to automation systems. The transmission of speech by GSM and internet network was also considered. The aim of presented investigations was the analysis of the opportunity to extend speech controlled human-machine interface (HMI) with the functionality of speaker identification. The proposed methods of the use of voice activity algorithms, encoding and even GSM encoder type detection, and also the use of encoder-related speaker model, resulted in significant increase of the recognition performance. Additionaly, the hardware implementation was provided with the use of ARM processor, and fixed-point digital signal processor. Proposed improvements resulted in increase of recognition accuracy, especially for fixed-point implementation. This allowed also for the reduction of acquisition and processing resolution without reduction of recognition accuracy.

PL Rozprawa prezentuje rezultaty badań dotyczących rozpoznawania mówcy z krótkich wypowiedzi obniżonej jakości w zastosowaniach automatyki, z uwzględnieniem transmisji mowy przez sieć GSM oraz internet. Celem badań była analiza możliwości rozszerzenia, sterowanych za pomocą głosu, interfejsów człowiek-maszyna (human-machine interfaces, HMI) o funkcjonalność identyfikacji osoby wydającej polecenie głosowe. Zaproponowane metody detekcji aktywności mówcy, detekcji kodowania i kodera GSM, a także doboru modelu mówcy skorelowanego z koderem mowy wyraźnie zwiększyły skuteczność rozpoznawania. Przedstawiono także implementację na procesorze ARM, oraz stałoprzecinkowym procesorze sygnałowym. Uwzględnienie zaproponowanych metod zwiększyło skuteczność rozpoznawania przede wszystkim dla implementacji stałoprzecinkowej oraz umożliwiło redukcję rozdzielczości akwizycji i przetwarzania sygnału mowy.

Liczba stron

201

Dziedzina wg OECD

elektrotechnika, elektronika, inżynieria informatyczna

Dyscyplina wg KBN

automatyka i robotyka

Sygnatura rozprawy w wersji drukowanej

DrOIN 1833

Katalog on-line

to20179057

Pełny tekst rozprawy doktorskiej

Pobierz plik

Poziom dostępu do pełnego tekstu

publiczny

Pierwsza recenzja

Andrzej P. Dobrowolski

Miejsce

Warszawa, Polska

Data

12.02.2017

Język

polski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Druga recenzja

Andrzej Dobrucki

Miejsce

Wrocław, Polska

Data

28.02.2017

Język

polski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Status rozprawy

rozprawa doktorska

Miejsce obrony

Poznań, Polska

Data obrony

29.05.2017

Jednostka nadająca tytuł

Rada Wydziału Informatyki Politechniki Poznańskiej

Uzyskany tytuł

doktor nauk technicznych w dyscyplinie: automatyka i robotyka, w specjalności: interfejsy człowiek-maszyna

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.