УДК 004.934.1'1 А.В. Савченко, канд. техн. наук (Национальный исследовательский университет «Высшая школа экономики», Нижний Новгород); e-mail: avsavchenko@hse.ru МИНИМУМА ИНФОРМАЦИОННОГО РАССОГЛАСОВАНИЯ∗ АВТОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ФОНЕТИЧЕСКОЙ ТРАНСКРИПЦИИ РЕЧИ НА ОСНОВЕ ПРИНЦИПА Поставлена задача автоматического построения транскрипции слитной речи. <...> Предложен новый критерий распознавания фонем на основе принципа минимума информационного рассогласования Кульбака–Лейблера и произвольных признаков – оценок спектральной плотности мощности речевого сигнала. <...> Проведено сравнение предложенного критерия с традиционными мерами близости для популярных оценок спектра (периодограмма, авторегрессионная оценка, гребенка полосовых фильтров). <...> Показано, что предложенный критерий характеризуется существенным повышением точности и надежности распознавания гласных фонем по сравнению с традиционными подходами. <...> Ключевые слова: автоматическое распознавание речи; принцип минимума информационного рассогласования; фонетический транскриптор. <...> Введение Принцип минимума информационного рассогласования (МИР) Кульбака–Лейблера [1] является эффективным инструментом для решения разнообразных задач в области автоматического распознавания речи (АРР) [2, 3]. <...> Однако далеко не все возможности принципа МИР в задачах АРР на данный момент получили необходимое освещение и развитие. <...> Так, до настоящего времени практически не оценивались преимущества рассогласования Кульбака–Лейблера перед традиционными мерами близости [4, 5] в задаче построения фонетического транскриптора (стенографа [6]) речи, который ставит в соответствие речевому сигналу последовательность фонем из определенного алфавита. <...> В ходе натурных испытаний сопоставляются по вероятности наличия правильного и доле верного решения в списке потенциальных решений несколько наиболее перспективных критериев распознавания минимальных звуковых единиц (МЗЕ) типа <...>