Аспирант и соискатель, № 1, 2014 ТЕХНИЧЕСКИЕ НАУКИ Информатика, вычислительная техника и управление Системный анализ, управление и обработка информации Хубаев Г.Н., доктор экономических наук, профессор Нзомвита Р., аспирант (Ростовский государственный экономический университет (РИНХ)) МЕТОДЫ ВЫЯВЛЕНИЯ НЕДОСТОВЕРНЫХ НАБЛЮДЕНИЙ В БОЛЬШИХ ОБЪЁМАХ ЧИСЛОВОЙ СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ Предложены методы выявления ошибочных наблюдений в больших объёмах статистической информации. <...> Показано, что «сжатие» исходной информации путем вычисления корреляционных матриц, средних значений коэффициентов корреляции, коэффициентов асимметрии и вариации позволяют обнаружить ошибки в больших объёмах числовых статистических данных. <...> Пусть n – количество строк в таблице числовых исходных данных (количество объектов любой природы), а m – количество столбцов (число показателей, характеризующих каждый объект, или число моментов фиксирования значений конкретного показателя). <...> Тогда уже при n, m≥100 количество представленных в таблице чисел превысит десять тысяч. <...> И разве возможно при таких объёмах числовой статистической информации визуально обнаружить ошибки в исходных данных, выявить наблюдения, достоверность которых сомнительна? <...> При составлении Рейтинга субъектов РФ за 2012 год РИА Новости, например, использовало «данные публикуемой официальной статистики. <...> Рейтинг строился на основе комплексного учета различных показателей, фиксирующих фактическое состояние тех или иных аспектов условий жизни, а также оценок удовлетворенности населения складывающейся в регионах ситуации в различных социальных сферах. <...> Источники информации для составления рейтинга: Росстат, Минздрав России, Минрегион России, Минфин России, Минприроды России, Банк России, сайты региональных органов власти, другие открытые источники. <...> При составлении рейтинга были отобраны 64 показателя, которые объединены в 11 групп, характеризующие основные <...>