Сканирование ветхих документов
Сканирование ветхих документов одна из важных проблем при организации электронного архива. Как правило, речь идёт либо о простой пересъёмке или сканировании данных и заполнении карточек для поиска, либо же полному переносу текстов документов в электронный вид. В последнем случае требуется машинное распознавание с последующей ручной проверкой или же полностью ручная работа по заполнению документов.
Учитывая разницу по времени и требуемым ресурсам между обычным распознаванием при сканирование ветхих документов и ручной работой по переносу данных в базу, требуется получить несколько простых решений для повышения качества распознавания.
Ниже приводится несколько советов:
- Первое, что необходимо сделать — это попытаться устранить механические повреждения; Как правило это означат необходимость зажима бумаг в специальный прозрачный сандвич для коррекции мятых или закручивающихся участков.
- В случае, если на ветхих документах заметны характерные тонированные пятна (или же если цвет бумаги из-за старости или повреждений стал приближаться к цвету текста) имеет смысл производить перенос документов и сканирование ветхих документов через цветной фильтр, соответствующий по тональности пятну. На практике это означает повышение контраста исходной матрицы для распознавания и большую точность отработки алгоритма. Профессиональные комплексы для распознавания архивных и музейных документов имеют либо набор светофильтров, либо используют программное разделение на цветовые каналы и выбор наиболее контрастного.
Можно выполнять распознавание в два этапа:
- Получение исходных документов, пакетная обработка их в графическом редакторе и отправка на распознавание. Как правило, это имеет смысл только в тех случаях, когда есть автоматическая аппаратура для сканирования, позволяющая переворачивать листы или же выполнять дозагрузку документов. Благодаря промежуточной обработке удаётся не только улучшить контрастность исходников для сканирование ветхих документов, но и устранить пыль, царапины и другие дефекты в автоматическом режиме.
- В повседневном распознавании существенно повысить точность работ можно путём увеличения разрешения сканирования, а также установкой последних версий программ распознавания с современными динамическими (обучающимися) алгоритмами, благо за последние 2-3 года в этой области был заметен существенный прогресс.
Таким образом, если вы хотите отсканировать ветхие документы, вы можете обратиться к специалистам. Компания «Столичный Архивист» имеет многолетний опыт по сканированию ветхих документов
Компания «Столичный Архивист» возьмёт на себя решение всех вопросов, связанных с сканированием ветхих документов и созданием электронного архива .