Поволжский регион УДК 519.7; 519.66; 57.087.1, 612.087.1 В. И. Волчихин, А. И. Иванов, Н. И. Серикова, Ю. В. Фунтикова ЭФФЕКТ СНИЖЕНИЯ РАЗМЕРА ТЕСТОВОЙ ВЫБОРКИ ЗА СЧЕТ ПЕРЕХОДА К МНОГОМЕРНОМУ СТАТИСТИЧЕСКОМУ АНАЛИЗУ БИОМЕТРИЧЕСКИХ ДАННЫХ Аннотация. <...> В настоящее время большинство отраслевых методик оценки качества данных строятся на использовании классического критерия хи-квадрат, который хорошо работает на больших тестовых выборках. <...> При оценке качества обучающих выборок и тестовых выборок биометрических данных нет возможности использовать большие тестовые выборки, состоящие из 200 экспериментально полученных значений. <...> Обычно для обучения и тестирования искусственных нейронных сетей используются выборки из 20 примеров. <...> В связи с этим возникает актуальная задача снижения на порядок размеров выборки экспериментально получаемых данных при сохранении уровня достоверности результатов статистического анализа. <...> В работе анализируется влияние ошибки квантования биометрических данных, возникающей из-за приближения функции плотности распределения значений экспериментальных данных их гистограммой. <...> Показано, что синтез гистограмм плотностей распределения значений значительно усиливают ошибки квантования данных, обусловленные малым числом примеров в выборке. <...> Это эквивалентно переходу от статистического критерия хи-квадрат к статистическому критерию Джини. <...> При этом на малых выборках ошибка квантования снижается до 5 раз при использовании одномерного критерия Джини. <...> Еще большего снижения влияния ошибок квантования удается достичь, если пользоваться многомерным обобщенным критерием Джини. <...> Доказано, что влияние ошибок квантования падает пропорционально корню размерности используемого критерия Джини. <...> При переходе от одномерного хи-квадрат критерия проверки статистических гипотез к использованию многомерного критерия Джини удается существенно снизить требования к размерам обучающих и тестовых <...>