Исследованы особенности спонтанной украинской речи с учетом их дальнейшего моделирования в процессе распознавания речи. Отдельное внимание уделяется акустической, фонетической и лексической компонентам системы распознавания речевого сигнала, прогнозированию ударений в словах и учету признаков спонтанности во время формирования речевых и текстовых корпусов для обучения системы. Предложенная базовая экспериментальная система распознавания спонтанной речи в реальном времени оперирует словарем до ста тысяч слов и позволяет набирать текст под диктовку.
Досліджено особливості спонтанного українського мовлення з метою їх подальшого моделювання в процесі розпізнавання мовлення. Особлива увага приділяється акустичній, фонетичній та лексичній компонентам системи розпізнавання мовленнєвих сигналів, прогнозуванню наголосів у словах та врахуванню ознак спонтанності під час формування усних та писемних мовленнєвих корпусів для навчання системи. Запропонована базова експериментальна система розпізнавання спонтанного мовлення в реальному часі оперує словником до ста тисяч слів і дозволяє набирати текст у режимі диктування.
Presented spontaneous speech-to-text real-time system allows for recognizing Ukrainian spontaneous speech, operates with a 100k word dictionary and provides typing text by voice for an ordinary user. Acoustic model parameters are estimated by 40-hour spontaneous speech corpus and 2 GB text data is used to build a 3-gram language model. Word error rate has dropped below 5% for common and mass-media lexicon. The system is available worldwide for evaluation purposes.