Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 635043)
Контекстум
Руконтекст антиплагиат система
Информационные системы и технологии  / №1 2012

РЕГРЕССИОННАЯ МОДЕЛЬ РАЗНОСТИ СТРУКТУРНЫХ ПРИЗНАКОВ ТЕКСТОВЫХ ДОКУМЕНТОВ (90,00 руб.)

0   0
Первый авторКузнецов
АвторыКонстантинов И.С., Басов О.О.
Страниц10
ID487929
АннотацияВ статье на основе множественного регрессионного анализа предложена модель разности структурных признаков цифровых изображений оригинала и копии текстового документа. Синтезирован алгоритм определения схожести данных документов на основе морфологического анализа их цифровых представлений, полученных путем сканирования
УДК621.398:651; 62-519:651
Кузнецов, А.В. РЕГРЕССИОННАЯ МОДЕЛЬ РАЗНОСТИ СТРУКТУРНЫХ ПРИЗНАКОВ ТЕКСТОВЫХ ДОКУМЕНТОВ / А.В. Кузнецов, И.С. Константинов, О.О. Басов // Информационные системы и технологии .— 2012 .— №1 .— С. 112-121 .— URL: https://rucont.ru/efd/487929 (дата обращения: 04.05.2024)

Предпросмотр (выдержки из произведения)

Научно-технический журнал УДК 621.398:651; 62-519:651 А.В. КУЗНЕЦОВ, И.С. КОНСТАНТИНОВ, О.О. БАСОВ РЕГРЕССИОННАЯ МОДЕЛЬ РАЗНОСТИ СТРУКТУРНЫХ ПРИЗНАКОВ ТЕКСТОВЫХ ДОКУМЕНТОВ В статье на основе множественного регрессионного анализа предложена модель разности структурных признаков цифровых изображений оригинала и копии текстового документа. <...> Синтезирован алгоритм определения схожести данных документов на основе морфологического анализа их цифровых представлений, полученных путем сканирования. <...> Одной из актуальных задач современного документооборота можно считать задачу установления схожести (подлинности) бумажного документа при его получении исполнителем для ознакомления с цифровой копией его оригинала, согласованного, подписанного и утвержденного ответственными лицами [1]. <...> Широкое распространение офисных (планшетных) сканеров актуализирует задачу исследования методов установления схожести документов на основе морфологической (структурной) обработки изображений без нанесения специальных идентификационных признаков [2-4,13] и их применения в качестве дополнительных средств защиты бумажных документов от подделки в оперативном документообороте. <...> Морфологическая обработка отсканированных документов предусматривает описание изображения в виде иерархической структуры более простых компонент (подобразов), извлечение определенных компонентов, полезных для представления и описания (рис. <...> Рисунок 1 – Иерархическое структурное описание текстового документа следующие структурные компоненты документа: 1. <...> Количество строк строкN Основываясь на рекомендациях [5], для последующей обработки формализованы (подобраз B иерархической структуры, представленной на рисунке 1), определяемое из исходного цифрового изображения текстового документа. <...> Номера неполных строк N непол. строк (подобраз D): N непол. строк = [n непол. <...> строк1,.,n непол. строк i] , где 1 непол. строк ≤ N строкэлемент вектора N непол. строк , соответствующий <...>