Depending on the amount of data to process, file generation may take longer.

If it takes too long to generate, you can limit the data by, for example, reducing the range of years.

Article

Download file Download BibTeX

Title

Kaldi Toolkit in Polish Whispery Speech Recognition

Authors

[ 1 ] Katedra Sterowania i Inżynierii Systemów, Wydział Informatyki, Politechnika Poznańska | [ 2 ] Instytut Automatyki i Inżynierii Informatycznej, Wydział Elektryczny, Politechnika Poznańska | [ D ] phd student | [ P ] employee

Title variant

PL Narzędzia Kaldi w rozpoznawaniu polskiej mowy szeptanej

Year of publication

2016

Published in

Przegląd Elektrotechniczny

Journal year: 2016 | Journal volume: R. 92 | Journal number: nr 11

Article type

scientific article

Publication language

english

Keywords
EN
  • speech recognition
  • ASR
  • whispered speech
  • database
PL
  • rozpoznawanie mowy
  • ASR
  • mowa szeptana
  • baza danych
Abstract

EN In this paper, the automatic speech recognition task has been presented. Used toolkits, libraries and prepared speech corpus have been described. The obtained results suggest, that using different acoustic models for normal speech and whispered speech can reduce word error rate. The optimal training steps has been also selected. Thanks to the additional simulations it has been found that used corpus (over 9 hours of normal speech and the same of the whispery speech) is definitely too small and must be enlarged in the future.

PL W artykule przedstawiono automatyczne rozpoznawanie mowy. Wykorzystane narzędzia, biblioteki i korpus opisano w artykule. Uzyskane wyniki wskazują, że wykorzystując różne modele akustyczne dla mowy zwykłej i szeptanej uzyskuje się polepszenie skuteczności rozpoznawania mowy. W wyniku wykonanych badań wskazano również optymalną kolejność kroków treningu. Dzięki dodatkowym obliczeniom stwierdzono, że użyty korpus (ponad 9 godzin zwykłej mowy i drugie tyle szeptu) jest zdecydowanie za mały do dobrego wytrenowania systemu rozpoznawania mowy i w przyszłości musi zostać powiększony.

Pages (from - to)

301 - 304

DOI

10.15199/48.2016.11.70

URL

http://pe.org.pl/abstract_pl.php?nid=10238

License type

CC BY-NC-ND (attribution - noncommercial - no derivatives)

Open Access Mode

czasopismo hybrydowe

Open Access Text Version

final published version

Full text of article

Download file

Access level to full text

public

Ministry points / journal

14

This website uses cookies to remember the authenticated session of the user. For more information, read about Cookies and Privacy Policy.