Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634794)
Контекстум
.
Информационно-управляющие системы  / №4 2017

ОЦЕНКА ГЕОМЕТРИЧЕСКИХ ИСКАЖЕНИЙ КОНТУРОВ ИЗОБРАЖЕНИЙ ГУБ В СИСТЕМАХ ВИЗУАЛЬНОГО ВВОДА ИНФОРМАЦИИ (160,00 руб.)

0   0
Первый авторХафизов Р. Г.
АвторыЯранцева Т. В.
Страниц5
ID633384
АннотацияПостановка проблемы: чтение по губам является одним из способов извлечения данных о речи из видеоинформации. Существующие системы распознавания речи по изображениям губ достаточно эффективно работают при фронтальном расположении говорящего к видеокамере, т. е. когда на изображениях наблюдаются только линейные искажения, не приводящие к изменению формы губ. При расположении говорящего к видеокамере под углом наблюдаются нелинейные искажения. Форма губ при этом изменяется. Вопросы компенсации нелинейных искажений практически не рассмотрены. Цель: разработка алгоритма оценки геометрических искажений контуров губ говорящего, который позволит усовершенствовать существующие системы ввода речевой информации из видеоданных. Результаты: предложена методика оценки геометрических искажений контуров губ в системах визуального ввода информации. Оценка параметра геометрического искажения производится по результатам вычисления нормированного скалярного произведения наблюдаемого контура изображения губ говорящего с преобразованными контурами при варьировании параметра искажения. Практическая значимость: предложенный алгоритм оценки вида и параметра искажения контура позволяет повысить эффективность распознавания искаженных контуров изображений губ говорящего в системах визуального ввода речевой информации из видеоданных.
Хафизов, Р. Г. ОЦЕНКА ГЕОМЕТРИЧЕСКИХ ИСКАЖЕНИЙ КОНТУРОВ ИЗОБРАЖЕНИЙ ГУБ В СИСТЕМАХ ВИЗУАЛЬНОГО ВВОДА ИНФОРМАЦИИ / Р. Г. Хафизов, Т. В. Яранцева // Информационно-управляющие системы .— 2017 .— №4 .— URL: https://rucont.ru/efd/633384 (дата обращения: 25.04.2024)

Предпросмотр (выдержки из произведения)

При этом одним из основных способов извлечения данных о речи из видеоинформации является чтение по губам, основанное на распознавании контуров губ [2, 3]. <...> Контурный анализ подразумевает такой способ обработки изображений, при котором обработке подвергается лишь контур изображения, в то время как обработка каждой точки изображения не требуется. <...> В настоящее время предложены различные подходы к выделению изображения лица человека и контура его губ. <...> В работе [3] для решения задачи распознавания контуров губ в видеопотоке используются цветные изображения, и цвет выбран в качестве 2 ИНФОРМАЦИОННОУПРАВЛЯЮЩИЕ СИСТЕМЫ главного источника информации при выделении контура губ. <...> В работе [5] предложено рассматривать контуры изображений губ как совокупность возможных реализаций некоторой случайной функции и для их анализа использовать теорию случайного контура [6, 7]. <...> Существующие системы распознавания речи по изображениям губ достаточно эффективно работают при фронтальном расположении говорящего к видеокамере, т. е. когда на изображениях наблюдаются только линейные искажения, не приводящие к изменению формы губ (изменение масштаба и угла поворота в плоскости кадра). <...> Вопросы же компенсации нелинейных искажений, при которых форма губ изменяется, практически не рассмотрены. <...> Математическая модель контура изображения губ Контур задается как комплексная случайная функция неслучайного аргумента l: X(l)ReX(l) + iImX(l). <...> Случайный контур X(l) рассматривается как совокупность его возможных реализаций 1(l), 2(l), …, n(l), где n — количество реализаций [6]. <...> Контур-реализация k(l) случайного контура X(l) представляет собой периодическую последовательность элементарных векторов, заданных в виде комплексных чисел: k(l)Rek(l) + iImk(l). <...> The example of linear distortion in the form of change of scale: а — µ > 1; б — µ1; в — µ < 1 При этом математическое ожидание случайного контура X(l) графически истолковывается как «усредненный контур», около <...>