Моделирование особенностей спонтанной украинской речи в системах автоматического распознавания речевого сигнала

Домашня сторінка
→
Фізико-технічні та математичні науки
→
Відділення інформатики
→
Кибернетика и вычислительная техника
→
Кибернетика и вычислительная техника, 2012
→
Кибернетика и вычислительная техника, 2012, вип. 170
→
Переглянути статтю

Моделирование особенностей спонтанной украинской речи в системах автоматического распознавания речевого сигнала

Інші назви: Моделювання особливостей спонтанного українського мовлення в системах автоматичного розпізнавання мовленнєвих сигналів
Modeling of Ukrainian spontaneous speech features in automatic speech signal recognition systems

Тема: Информационные технологии и системы

УДК: 004.934

URI: http://dspace.nbuv.gov.ua/handle/123456789/45883

Посилання: Моделирование особенностей спонтанной украинской речи в системах автоматического распознавания речевого сигнала / В.В. Робейко // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 76-85. — Бібліогр.: 15 назв. — рос.

Дата: 2012

Завантажень: 1682

Моделирование особенностей спонтанной украинской речи в системах автоматического распознавания речевого сигнала

Анотація:

Исследованы особенности спонтанной украинской речи с учетом их дальнейшего моделирования в процессе распознавания речи. Отдельное внимание уделяется акустической, фонетической и лексической компонентам системы распознавания речевого сигнала, прогнозированию ударений в словах и учету признаков спонтанности во время формирования речевых и текстовых корпусов для обучения системы. Предложенная базовая экспериментальная система распознавания спонтанной речи в реальном времени оперирует словарем до ста тысяч слов и позволяет набирать текст под диктовку.

Досліджено особливості спонтанного українського мовлення з метою їх подальшого моделювання в процесі розпізнавання мовлення. Особлива увага приділяється акустичній, фонетичній та лексичній компонентам системи розпізнавання мовленнєвих сигналів, прогнозуванню наголосів у словах та врахуванню ознак спонтанності під час формування усних та писемних мовленнєвих корпусів для навчання системи. Запропонована базова експериментальна система розпізнавання спонтанного мовлення в реальному часі оперує словником до ста тисяч слів і дозволяє набирати текст у режимі диктування.

Presented spontaneous speech-to-text real-time system allows for recognizing Ukrainian spontaneous speech, operates with a 100k word dictionary and provides typing text by voice for an ordinary user. Acoustic model parameters are estimated by 40-hour spontaneous speech corpus and 2 GB text data is used to build a 3-gram language model. Word error rate has dropped below 5% for common and mass-media lexicon. The system is available worldwide for evaluation purposes.

Показати повний запис статті