Научно-технический журнал УДК 621.398:651; 62-519:651 А.В. КУЗНЕЦОВ, И.С. КОНСТАНТИНОВ, О.О. БАСОВ РЕГРЕССИОННАЯ МОДЕЛЬ РАЗНОСТИ СТРУКТУРНЫХ ПРИЗНАКОВ ТЕКСТОВЫХ ДОКУМЕНТОВ В статье на основе множественного регрессионного анализа предложена модель разности структурных признаков цифровых изображений оригинала и копии текстового документа. <...> Синтезирован алгоритм определения схожести данных документов на основе морфологического анализа их цифровых представлений, полученных путем сканирования. <...> Одной из актуальных задач современного документооборота можно считать задачу установления схожести (подлинности) бумажного документа при его получении исполнителем для ознакомления с цифровой копией его оригинала, согласованного, подписанного и утвержденного ответственными лицами [1]. <...> Широкое распространение офисных (планшетных) сканеров актуализирует задачу исследования методов установления схожести документов на основе морфологической (структурной) обработки изображений без нанесения специальных идентификационных признаков [2-4,13] и их применения в качестве дополнительных средств защиты бумажных документов от подделки в оперативном документообороте. <...> Морфологическая обработка отсканированных документов предусматривает описание изображения в виде иерархической структуры более простых компонент (подобразов), извлечение определенных компонентов, полезных для представления и описания (рис. <...> Рисунок 1 – Иерархическое структурное описание текстового документа следующие структурные компоненты документа: 1. <...> Количество строк строкN Основываясь на рекомендациях [5], для последующей обработки формализованы (подобраз B иерархической структуры, представленной на рисунке 1), определяемое из исходного цифрового изображения текстового документа. <...> Номера неполных строк N непол. строк (подобраз D): N непол. строк = [n непол. <...> строк1,.,n непол. строк i] , где 1 непол. строк ≤ N строк – элемент вектора N непол. строк , соответствующий <...>