Архив компаний, выполняющих творческую работу
Одна из важнейших проблем современного архивного дела — это структуризация и классификация документов мультимедийного типа, в частности, графических изображений, звукозаписей видеозаписей и смежных типов данных.
Так в чем же заключается проблема?
Проблема заключается в том, что принципиально невозможно формализовать творческие данные, которые могут служить для классификации. Попытка создания архива, как правило, упирается в вопрос разделения на нечёткие категории и принятие решений об отнесении к какой-либо из них. К счастью, в цифровых архивах компаний есть возможность проводить нечёткий поиск по мультимедийным данным.
Примеры подобного поиска:
- Разделение графики по цветовой гамме;
- Автоматическое распознавание звука на видео и использование подобных «субтитров» для поиска по тексту (реализовано в видеоархивах Google Youtube);
- Поиск человека или иного образа на фотографиях, то есть нечёткое сравнение изображений;
- Распознавание текста в графике и поиск по нему (используется в архивах компаний, обеспечивающих безопасность для поиска видеоданных по номерам автомобилей);
- Поиск целой музыкальной композиции по отрывку или частотной диаграмме (используется для подписывания и классификации известной, но неописанной музыки).
Ещё 10 лет назад всё это казалось фантастикой, а 20 лет назад считалось попросту невозможным
Принципиальные возможности автоматизированной интеллектуальной обработки данных позволяют наиболее точно сортировать данные, что решает проблему архива компаний, имеющих большую базу данных, поиск в которой занимает больше времени, чем внесение новых данных. Кстати, данная проблема характерна для многих сложных информационных систем: в некоторых сферах уже всерьёз обсуждается профессия так называемого программиста-археолога, выполняющего поиск необходимой информации в глубоких слоях масштабных архивов.
Как же решается данная проблема?
Предполагается, что с появлением более совершенных систем обработки данных справочно-поисковые аппараты наследуются, то есть образуется сложная иерархия, которая и обуславливает эти сложности. Введение новых средств обработки позволяет ввести дополнительную нечёткую систему поиска и классификации, то есть использовать возможности обмена вычислительной мощности на время.