Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634928)
Контекстум
Руконтекст антиплагиат система
Известия высших учебных заведений. Поволжский регион. Технические науки  / №4 2015

АЛГОРИТМ ПОСТРОЕНИЯ СТАТИСТИЧЕСКОГО ДИСКРЕТНО-КОНТИНУАЛЬНОГО ОПИСАНИЯ ДЛИТЕЛЬНОСТИ ЗВУКОВ ПОТОКА ОСМЫСЛЕННОЙ РЕЧИ ДИКТОРА (90,00 руб.)

0   0
Первый авторБойков
АвторыИванов А.И., Калашников Д.M.
Страниц15
ID552592
АннотацияАктуальность и цели. Основными проблемами при разработке алгоритмов и программ, реализующих аутентификацию по голосу, являются следующие: вариации голоса пользователя (голос способен изменяться в зависимости от состояния здоровья, возраста, настроения и т.д.); наличие шумовой компоненты. Решение этих проблем позволит применять голосовую технологию аутентификации, которая обеспечит наилучшую защиту персональных данных, простоту в применении, и которая является наиболее дешевой среди существующих технологий идентификации личности Материалы и методы. В работе использованы численные и цифровые методы обработки сигналов, спектральные методы, методы математической статистики и временных рядов, а также искусственного интеллекта и распознавания образов. В основу построения фрагментатора положена континуальнодискретная модель обработки речи, которая в сочетании с узкополосным фильтром позволяет определять среднюю длительность звука. Результаты. Показано, что качественный классификатор речи тон/шум должен давать выходные данные «0» и «1», длительность которых описывается континуально-дискретным распределением значений длительности интервалов между участками тональных звуков, распределенных по нормальным законам. Дискретная часть распределения образуется дискретным характером потока появления в речи тональных и шумовых звуков, а также их сочетаний (пар, троек, четверок и т.д.). Непрерывная (континуальная) часть распределения значений длин звуков обусловлена нестабильностью речи при смене темпа произношения. Приведен метод вычисления средней длины одного звука осмысленной речи. Данное исследование позволило построить автомат по определению средней длины звука на различных участках звукового сигнала. Выводы. Предложен численный алгоритм идентификации речи отдельного диктора, позволяющий производить синхронизацию участков речи. Использование разработанного алгоритма позволило уточнять значения параметров, характеризующих статистическое описание длительности интервалов между шумовыми звуками речи и между тональными звуками Проведенное исследование позволило построить автомат по определению средней длины звука на различных участках звукового сигнала. Полученные результаты являются базой для построения нейросетевых технологий аутентификации.
УДК004; 519.7; 519.6; 519.66; 612.087.1
Бойков, И.В. АЛГОРИТМ ПОСТРОЕНИЯ СТАТИСТИЧЕСКОГО ДИСКРЕТНО-КОНТИНУАЛЬНОГО ОПИСАНИЯ ДЛИТЕЛЬНОСТИ ЗВУКОВ ПОТОКА ОСМЫСЛЕННОЙ РЕЧИ ДИКТОРА / И.В. Бойков, А.И. Иванов, Д.M. Калашников // Известия высших учебных заведений. Поволжский регион. Технические науки .— 2015 .— №4 .— С. 64-78 .— URL: https://rucont.ru/efd/552592 (дата обращения: 01.05.2024)

Предпросмотр (выдержки из произведения)

Калашников АЛГОРИТМ ПОСТРОЕНИЯ СТАТИСТИЧЕСКОГО ДИСКРЕТНО-КОНТИНУАЛЬНОГО ОПИСАНИЯ ДЛИТЕЛЬНОСТИ ЗВУКОВ ПОТОКА ОСМЫСЛЕННОЙ РЕЧИ ДИКТОРА1 Аннотация. <...> Основными проблемами при разработке алгоритмов и программ, реализующих аутентификацию по голосу, являются следующие: вариации голоса пользователя (голос способен изменяться в зависимости от состояния здоровья, возраста, настроения и т.д.); наличие шумовой компоненты. <...> Решение этих проблем позволит применять голосовую технологию аутентификации, которая обеспечит наилучшую защиту персональных данных, простоту в применении, и которая является наиболее дешевой среди существующих технологий идентификации личности. <...> В основу построения фрагментатора положена континуальнодискретная модель обработки речи, которая в сочетании с узкополосным фильтром позволяет определять среднюю длительность звука. <...> Показано, что качественный классификатор речи тон/шум должен давать выходные данные «0» и «1», длительность которых описывается континуально-дискретным распределением значений длительности интервалов между участками тональных звуков, распределенных по нормальным законам. <...> Дискретная часть распределения образуется дискретным характером потока появления в речи тональных и шумовых звуков, а также их сочетаний (пар, троек, четверок и т.д.) <...> . Непрерывная (континуальная) часть распределения значений длин звуков обусловлена нестабильностью речи при смене темпа произношения. <...> Приведен метод вычисления средней длины одного звука осмысленной речи. <...> Данное исследование позволило построить автомат по определению средней длины звука на различных участках звукового сигнала. <...> Предложен численный алгоритм идентификации речи отдельного диктора, позволяющий производить синхронизацию участков речи. <...> Использование разработанного алгоритма позволило уточнять значения параметров, характеризующих статистическое описание длительности интервалов между шумовыми <...>

Облако ключевых слов *


* - вычисляется автоматически
Антиплагиат система на базе ИИ