Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 637401)
Контекстум
Электро-2024
Информационные системы и технологии  / №2 2014

СЕГМЕНТАЦИЯ РЕЧИ НА ОСНОВЕ ВЕРОЯТНОСТНОЙ НЕЙРОННОЙ СЕТИ С ПРОВЕРКОЙ ОДНОРОДНОСТИ (90,00 руб.)

0   0
Первый авторСавченко
Страниц7
ID486648
АннотацияПредложен новый критерий сегментации речи, основанный на идее вероятностной нейронной сети с проверкой однородности. Экспериментально продемонстрировано, что предложенный подход позволяет на 2-7% повысить точность распознавания гласных звуков в слоге по сравнению с традиционным критерием, основанным на сопоставлении с фиксированным порогом расстояния между очередным фреймом и предыдущим однородным участком
УДК004.934
Савченко, А.В. СЕГМЕНТАЦИЯ РЕЧИ НА ОСНОВЕ ВЕРОЯТНОСТНОЙ НЕЙРОННОЙ СЕТИ С ПРОВЕРКОЙ ОДНОРОДНОСТИ / А.В. Савченко // Информационные системы и технологии .— 2014 .— №2 .— С. 12-18 .— URL: https://rucont.ru/efd/486648 (дата обращения: 03.06.2024)

Предпросмотр (выдержки из произведения)

Научно-технический журнал УДК 004.934 А.В. САВЧЕНКО СЕГМЕНТАЦИЯ РЕЧИ НА ОСНОВЕ ВЕРОЯТНОСТНОЙ НЕЙРОННОЙ СЕТИ С ПРОВЕРКОЙ ОДНОРОДНОСТИ Предложен новый критерий сегментации речи, основанный на идее вероятностной нейронной сети с проверкой однородности. <...> Экспериментально продемонстрировано, что предложенный подход позволяет на 2-7% повысить точность распознавания гласных звуков в слоге по сравнению с традиционным критерием, основанным на сопоставлении с фиксированным порогом расстояния между очередным фреймом и предыдущим однородным участком. <...> Ключевые слова: автоматическое распознавание речи; сегментация речи; вероятностная нейронная сеть; проверка статистической однородности. <...> ВВЕДЕНИЕ Сегментации речи на соответствующие фонемам участки [1, 2] является одной из наиболее важных задач в направлении автоматического распознавания речи (АРР) [3]. <...> Известно [4, 5, 6], что повышение надежности сегментации приводит к резкому росту точности АРР. <...> Традиционный подход [4] основывается на введении метрики   фиксированным порогом 0 в пространстве коротких (10-30 мс) фреймов и сопоставлении с расстояния между очередным фреймом и предыдущим однородным участком. <...> К сожалению, точность такого решения во многом зависит от правильного выбора порога 0 , при этом небольшая его вариация приводит к довольно значительному изменению качества сегментации. <...> В настоящей работе предлагается воспользоваться идеей, использованной нами ранее при синтезе выражения для вероятностной нейронной сети (Probabilistic Neural Network, PNN) с проверкой однородности [7]: проверка гипотезы об однородности нового фрейма с предыдущим однородным участком на основе оценки параметров распределения по объединенному сигналу [8]. <...> Такой подход оказался [7] значительно более устойчивым к изменению параметров по сравнению с классической PNN [9]. <...> ЗАДАЧА СЕГМЕНТАЦИИ И РАСПОЗНАВАНИЯ ФОНЕМ Пусть на вход поступает сигнал X. <...> Разобьем его на ряд непересекающихся фреймов <...>