Классификация фреймов речевого сигнала  в задачах дикторонезависимого  распознавания речи

Классификация фреймов речевого сигнала в задачах дикторонезависимого распознавания речи

Інші назви: Класифікація фреймів мовленнєвого сигналу в задачах дикторонезалежного розпізнавання мовлення
Speech signal frames classification in the tasks of speaker-independent speech recognition

Тема: Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск

УДК: 004.89, 004.93

URI: http://dspace.nbuv.gov.ua/handle/123456789/60256

Посилання: Классификация фреймов речевого сигнала в задачах дикторонезависимого распознавания речи / Т.В. Ермоленко, А.В. Жук // Штучний інтелект. — 2011. — № 4. — С. 87-95. — Бібліогр.: 5 назв. — рос.

Дата: 2011

Завантажень: 1499

Классификация фреймов речевого сигнала в задачах дикторонезависимого распознавания речи

Анотація:

В статье предлагается метод определения границ речи в поступившем речевом потоке с использованием автоматической настройки под шум окружающей среды и звукозаписывающего оборудования, а также алгоритм классификации фреймов речевого сигнала в терминах обобщенной фонетической транскрипции. Используемые параметры базируются на различных спектральных представлениях сигнала, отражают особенности спектральной плотности звуков речи, принадлежащих разным фонетическим классам, что обеспечивает дикторонезависимость процесса классификации.

У статті запропоновано метод визначення границь мовлення у потоці мовлення, що надійшов на вхід системи розпізнавання, з використанням автоматичного налаштування під шум оточуючого середовища та звукозаписуючого обладнання, а також алгоритм класифікації фреймів мовленнєвого сигналу у термінах узагальненої фонетичної транскрипції. Параметри, що було використано, базуються на різних спектральних представленнях сигналу, відображають особливості спектральної щільності звуків мовлення, які належать до різних фонетичних класів, що забезпечує дикторонезалежність процесу класифікації.

The method for voice activity detection in a captured speech stream with automatic adaptation to environmental and sound-capture hardware noises, and the algorithm for speech signal frames classification in the terms of generalized phonetic transcription are proposed in the article. The speaker-independence is reached because of the parameters used in the classification process. These parameters are based on different spectral representations of a signal and reflect spectral density species of speech sounds.

Показати повний запис статті