Научно-технический журнал УДК 004.934 А.В. САВЧЕНКО СЕГМЕНТАЦИЯ РЕЧИ НА ОСНОВЕ ВЕРОЯТНОСТНОЙ НЕЙРОННОЙ СЕТИ С ПРОВЕРКОЙ ОДНОРОДНОСТИ Предложен новый критерий сегментации речи, основанный на идее вероятностной нейронной сети с проверкой однородности. <...> Экспериментально продемонстрировано, что предложенный подход позволяет на 2-7% повысить точность распознавания гласных звуков в слоге по сравнению с традиционным критерием, основанным на сопоставлении с фиксированным порогом расстояния между очередным фреймом и предыдущим однородным участком. <...> Ключевые слова: автоматическое распознавание речи; сегментация речи; вероятностная нейронная сеть; проверка статистической однородности. <...> ВВЕДЕНИЕ Сегментации речи на соответствующие фонемам участки [1, 2] является одной из наиболее важных задач в направлении автоматического распознавания речи (АРР) [3]. <...> Известно [4, 5, 6], что повышение надежности сегментации приводит к резкому росту точности АРР. <...> Традиционный подход [4] основывается на введении метрики фиксированным порогом 0 в пространстве коротких (10-30 мс) фреймов и сопоставлении с расстояния между очередным фреймом и предыдущим однородным участком. <...> К сожалению, точность такого решения во многом зависит от правильного выбора порога 0 , при этом небольшая его вариация приводит к довольно значительному изменению качества сегментации. <...> В настоящей работе предлагается воспользоваться идеей, использованной нами ранее при синтезе выражения для вероятностной нейронной сети (Probabilistic Neural Network, PNN) с проверкой однородности [7]: проверка гипотезы об однородности нового фрейма с предыдущим однородным участком на основе оценки параметров распределения по объединенному сигналу [8]. <...> Такой подход оказался [7] значительно более устойчивым к изменению параметров по сравнению с классической PNN [9]. <...> ЗАДАЧА СЕГМЕНТАЦИИ И РАСПОЗНАВАНИЯ ФОНЕМ Пусть на вход поступает сигнал X. <...> Разобьем его на ряд непересекающихся фреймов <...>