Организация архива компаний с помощью специалистов

Одна из важнейших проблем современного архивного дела - это структуризация и классификация документов мультимедийного типа, в частности, графических изображений, звукозаписей видеозаписей и смежных типов данных.

Так в чем же заключается проблема?

Проблема заключается в том, что принципиально невозможно формализовать творческие данные, которые могут служить для классификации. Попытка создания архива, как правило, упирается в вопрос разделения на нечёткие категории и принятие решений об отнесении к какой-либо из них. К счастью, в цифровых архивах компаний есть возможность проводить нечёткий поиск по мультимедийным данным.

Примеры подобного поиска:

  • Разделение графики по цветовой гамме;
  • Автоматическое распознавание звука на видео и использование подобных «субтитров» для поиска по тексту (реализовано в видеоархивах Google Youtube);
  • Поиск человека или иного образа на фотографиях, то есть нечёткое сравнение изображений;
  • Распознавание текста в графике и поиск по нему (используется в архивах компаний, обеспечивающих безопасность для поиска видеоданных по номерам автомобилей);
  • Поиск целой музыкальной композиции по отрывку или частотной диаграмме (используется для подписывания и классификации известной, но неописанной музыки).

Ещё 10 лет назад всё это казалось фантастикой, а 20 лет назад считалось попросту невозможным

Принципиальные возможности автоматизированной интеллектуальной обработки данных позволяют наиболее точно сортировать данные, что решает проблему архива компаний, имеющих большую базу данных, поиск в которой занимает больше времени, чем внесение новых данных. Кстати, данная проблема характерна для многих сложных информационных систем: в некоторых сферах уже всерьёз обсуждается профессия так называемого программиста-археолога, выполняющего поиск необходимой информации в глубоких слоях масштабных архивов.

Как же решается данная проблема?

Предполагается, что с появлением более совершенных систем обработки данных справочно-поисковые аппараты наследуются, то есть образуется сложная иерархия, которая и обуславливает эти сложности. Введение новых средств обработки позволяет ввести дополнительную нечёткую систему поиска и классификации, то есть использовать возможности обмена вычислительной мощности на время.

       Калькулятор стоимости архивных услуг