В статье предлагается метод определения границ речи в поступившем речевом потоке с использованием автоматической настройки под шум окружающей среды и звукозаписывающего оборудования, а также алгоритм классификации фреймов речевого сигнала в терминах обобщенной фонетической транскрипции. Используемые параметры базируются на различных спектральных представлениях сигнала, отражают особенности спектральной плотности звуков речи, принадлежащих разным фонетическим классам, что обеспечивает дикторонезависимость процесса классификации.
У статті запропоновано метод визначення границь мовлення у потоці мовлення, що надійшов на вхід системи розпізнавання, з використанням автоматичного налаштування під шум оточуючого середовища та звукозаписуючого обладнання, а також алгоритм класифікації фреймів мовленнєвого сигналу у термінах
узагальненої фонетичної транскрипції. Параметри, що було використано, базуються на різних спектральних представленнях сигналу, відображають особливості спектральної щільності звуків мовлення, які належать до різних фонетичних класів, що забезпечує дикторонезалежність процесу класифікації.
The method for voice activity detection in a captured speech stream with automatic adaptation to environmental and sound-capture hardware noises, and the algorithm for speech signal frames classification in the terms of generalized phonetic transcription are proposed in the article. The speaker-independence is reached because of the parameters used in the classification process. These parameters are based on different spectral representations of a signal and reflect spectral density species of speech sounds.