Известия высших учебных заведений. Поволжский регион. Технические науки / №4 2015

АЛГОРИТМ ПОСТРОЕНИЯ СТАТИСТИЧЕСКОГО ДИСКРЕТНО-КОНТИНУАЛЬНОГО ОПИСАНИЯ ДЛИТЕЛЬНОСТИ ЗВУКОВ ПОТОКА ОСМЫСЛЕННОЙ РЕЧИ ДИКТОРА (90,00 руб.)

Первый автор	Бойков
Авторы	Иванов А.И., Калашников Д.M.
Страниц	15

90,00р

ID	552592
Аннотация	Актуальность и цели. Основными проблемами при разработке алгоритмов и программ, реализующих аутентификацию по голосу, являются следующие: вариации голоса пользователя (голос способен изменяться в зависимости от состояния здоровья, возраста, настроения и т.д.); наличие шумовой компоненты. Решение этих проблем позволит применять голосовую технологию аутентификации, которая обеспечит наилучшую защиту персональных данных, простоту в применении, и которая является наиболее дешевой среди существующих технологий идентификации личности Материалы и методы. В работе использованы численные и цифровые методы обработки сигналов, спектральные методы, методы математической статистики и временных рядов, а также искусственного интеллекта и распознавания образов. В основу построения фрагментатора положена континуальнодискретная модель обработки речи, которая в сочетании с узкополосным фильтром позволяет определять среднюю длительность звука. Результаты. Показано, что качественный классификатор речи тон/шум должен давать выходные данные «0» и «1», длительность которых описывается континуально-дискретным распределением значений длительности интервалов между участками тональных звуков, распределенных по нормальным законам. Дискретная часть распределения образуется дискретным характером потока появления в речи тональных и шумовых звуков, а также их сочетаний (пар, троек, четверок и т.д.). Непрерывная (континуальная) часть распределения значений длин звуков обусловлена нестабильностью речи при смене темпа произношения. Приведен метод вычисления средней длины одного звука осмысленной речи. Данное исследование позволило построить автомат по определению средней длины звука на различных участках звукового сигнала. Выводы. Предложен численный алгоритм идентификации речи отдельного диктора, позволяющий производить синхронизацию участков речи. Использование разработанного алгоритма позволило уточнять значения параметров, характеризующих статистическое описание длительности интервалов между шумовыми звуками речи и между тональными звуками Проведенное исследование позволило построить автомат по определению средней длины звука на различных участках звукового сигнала. Полученные результаты являются базой для построения нейросетевых технологий аутентификации.
УДК	004; 519.7; 519.6; 519.66; 612.087.1

Бойков, И.В. АЛГОРИТМ ПОСТРОЕНИЯ СТАТИСТИЧЕСКОГО ДИСКРЕТНО-КОНТИНУАЛЬНОГО ОПИСАНИЯ ДЛИТЕЛЬНОСТИ ЗВУКОВ ПОТОКА ОСМЫСЛЕННОЙ РЕЧИ ДИКТОРА / И.В. Бойков, А.И. Иванов, Д.M. Калашников // Известия высших учебных заведений. Поволжский регион. Технические науки .— 2015 .— №4 .— С. 64-78 .— URL: https://rucont.ru/efd/552592 (дата обращения: 20.05.2025)

Вы уже смотрели

Политика России на Северном Кавказе в первой четверти XVIII века

Политика России на Северном Кавказе в пе... 370,00 руб

Сервис plus №3 2017

Русский язык в национальной школе №4 201... 176,00 руб

Вестник ПСТГУ. Серия I. Богословие. Философия. Религиоведение №5 2023

Вестник ПСТГУ. Серия I. Богословие. Фило... 300,00 руб

Научный диалог №10 2024 500,00 руб

Современные подходы в подготовке баскетболистов и волейболистов: материалы Всероссийской научно – практической конференции с международным участием , 5-7 октября 2016 г.

Современные подходы в подготовке баскетб... 290,00 руб

Предпросмотр (выдержки из произведения)

Калашников АЛГОРИТМ ПОСТРОЕНИЯ СТАТИСТИЧЕСКОГО ДИСКРЕТНО-КОНТИНУАЛЬНОГО ОПИСАНИЯ ДЛИТЕЛЬНОСТИ ЗВУКОВ ПОТОКА ОСМЫСЛЕННОЙ РЕЧИ ДИКТОРА1 Аннотация. <...> Основными проблемами при разработке алгоритмов и программ, реализующих аутентификацию по голосу, являются следующие: вариации голоса пользователя (голос способен изменяться в зависимости от состояния здоровья, возраста, настроения и т.д.); наличие шумовой компоненты. <...> Решение этих проблем позволит применять голосовую технологию аутентификации, которая обеспечит наилучшую защиту персональных данных, простоту в применении, и которая является наиболее дешевой среди существующих технологий идентификации личности. <...> В основу построения фрагментатора положена континуальнодискретная модель обработки речи, которая в сочетании с узкополосным фильтром позволяет определять среднюю длительность звука. <...> Показано, что качественный классификатор речи тон/шум должен давать выходные данные «0» и «1», длительность которых описывается континуально-дискретным распределением значений длительности интервалов между участками тональных звуков, распределенных по нормальным законам. <...> Дискретная часть распределения образуется дискретным характером потока появления в речи тональных и шумовых звуков, а также их сочетаний (пар, троек, четверок и т.д.) <...> . Непрерывная (континуальная) часть распределения значений длин звуков обусловлена нестабильностью речи при смене темпа произношения. <...> Приведен метод вычисления средней длины одного звука осмысленной речи. <...> Данное исследование позволило построить автомат по определению средней длины звука на различных участках звукового сигнала. <...> Предложен численный алгоритм идентификации речи отдельного диктора, позволяющий производить синхронизацию участков речи. <...> Использование разработанного алгоритма позволило уточнять значения параметров, характеризующих статистическое описание длительности интервалов между шумовыми <...>

Облако ключевых слов *

* - вычисляется автоматически


	Для выхода нажмите Esc или