Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634699)
Контекстум
.
Известия высших учебных заведений. Поволжский регион. Технические науки  / №1 2015

ЭФФЕКТ СНИЖЕНИЯ РАЗМЕРА ТЕСТОВОЙ ВЫБОРКИ ЗА СЧЕТ ПЕРЕХОДА К МНОГОМЕРНОМУ СТАТИСТИЧЕСКОМУ АНАЛИЗУ БИОМЕТРИЧЕСКИХ ДАННЫХ (90,00 руб.)

0   0
Первый авторВолчихин
АвторыИванов А.И., Серикова Н.И., Фунтикова Ю.В.
Страниц10
ID552542
АннотацияАктуальность и цели. В настоящее время большинство отраслевых методик оценки качества данных строятся на использовании классического критерия хи-квадрат, который хорошо работает на больших тестовых выборках. При оценке качества обучающих выборок и тестовых выборок биометрических данных нет возможности использовать большие тестовые выборки, состоящие из 200 экспериментально полученных значений. Обычно для обучения и тестирования искусственных нейронных сетей используются выборки из
УДК519.7; 519.66; 57.087.1, 612.087.1
ЭФФЕКТ СНИЖЕНИЯ РАЗМЕРА ТЕСТОВОЙ ВЫБОРКИ ЗА СЧЕТ ПЕРЕХОДА К МНОГОМЕРНОМУ СТАТИСТИЧЕСКОМУ АНАЛИЗУ БИОМЕТРИЧЕСКИХ ДАННЫХ / В.И. Волчихин [и др.] // Известия высших учебных заведений. Поволжский регион. Технические науки .— 2015 .— №1 .— С. 50-59 .— URL: https://rucont.ru/efd/552542 (дата обращения: 24.04.2024)

Предпросмотр (выдержки из произведения)

Поволжский регион УДК 519.7; 519.66; 57.087.1, 612.087.1 В. И. Волчихин, А. И. Иванов, Н. И. Серикова, Ю. В. Фунтикова ЭФФЕКТ СНИЖЕНИЯ РАЗМЕРА ТЕСТОВОЙ ВЫБОРКИ ЗА СЧЕТ ПЕРЕХОДА К МНОГОМЕРНОМУ СТАТИСТИЧЕСКОМУ АНАЛИЗУ БИОМЕТРИЧЕСКИХ ДАННЫХ Аннотация. <...> В настоящее время большинство отраслевых методик оценки качества данных строятся на использовании классического критерия хи-квадрат, который хорошо работает на больших тестовых выборках. <...> При оценке качества обучающих выборок и тестовых выборок биометрических данных нет возможности использовать большие тестовые выборки, состоящие из 200 экспериментально полученных значений. <...> Обычно для обучения и тестирования искусственных нейронных сетей используются выборки из 20 примеров. <...> В связи с этим возникает актуальная задача снижения на порядок размеров выборки экспериментально получаемых данных при сохранении уровня достоверности результатов статистического анализа. <...> В работе анализируется влияние ошибки квантования биометрических данных, возникающей из-за приближения функции плотности распределения значений экспериментальных данных их гистограммой. <...> Показано, что синтез гистограмм плотностей распределения значений значительно усиливают ошибки квантования данных, обусловленные малым числом примеров в выборке. <...> Это эквивалентно переходу от статистического критерия хи-квадрат к статистическому критерию Джини. <...> При этом на малых выборках ошибка квантования снижается до 5 раз при использовании одномерного критерия Джини. <...> Еще большего снижения влияния ошибок квантования удается достичь, если пользоваться многомерным обобщенным критерием Джини. <...> Доказано, что влияние ошибок квантования падает пропорционально корню размерности используемого критерия Джини. <...> При переходе от одномерного хи-квадрат критерия проверки статистических гипотез к использованию многомерного критерия Джини удается существенно снизить требования к размерам обучающих и тестовых <...>