К вопросу о векторизации графических спектрограмм
УДК 004.934
К вопросу о векторизации графических спектрограмм
© А.М. Бонч-Бруевич, С.Б. Козлачков
МГТУ им. <...> Использование векторизации
обеспечивает возможность выделения индивидуальных признаков речи на основе
статистического анализа характеристик контуров на спектрограмме. <...> Каждый
из выделенных контуров является незамкнутой линией, содержащей информацию
об изменении мгновенной частоты и амплитуды компонента речевого сигнала
(речевого вокализма). <...> При этом учитываются следующие особенности речевого
сигнала: средняя скорость изменения частоты основного тона, минимальное расстояние между отдельными гармониками, взаимная корреляция уровня сигнала для
соседних следов фонообъектов. <...> В настоящей работе рассмотрен подход к формированию массива данных, описывающего графическую спектрограмму речевого
сигнала в векторном формате. <...> Показано, что представление графической спектрограммы как массива отдельных контуров дает новые возможности в области
анализа, синтеза, обработки и классификации речевых сигналов. <...> При оценке защищенности речевой информации, обработке акустических сигналов или идентификации диктора по голосу необходимо выделить информационные признаки в речевом сигнале. <...> Как
правило, для выделения используются следующие признаки: частотные (спектр, частота основного тона, спектральная плотность мощности); временные (огибающая, частота переходов через ноль); частотно-временные (графическая спектрограмма в виде полутонового
изображения). <...> Также применяются различного рода математические
модели сигналов и помех. <...> Использование математических моделей в
ряде случаев оказывается эффективнее, чем непосредственный анализ отсчетов сигнала. <...> Как показано в [1], речевой сигнал обладает сложной полимодуляционной структурой, что затрудняет создание адекватной модели. <...> Существующие математические модели речевого сигнала основаны на
описании <...>