Модульность и технологичность
Не всегда необходимо внедрять весь комплекс работы с документами на предприятии сразу. Это может быть вызвано разными причинами: от нехватки средств в данный момент, до неспособности организации "с понедельника" резко перестроить свою работу. Поэтому система должна состоять из модулей, каждый из которых позволяет решить ту или иную задачу, причем эти модули могут без особого труда добавлены в работающую систему в произвольной последовательности. И что самое главное они по возможности должны быть независимы друг от друга, при сохранении глубокой интеграции между ними. Например, решение задачи автоматизации можно начать с решения задачи поддержки исполнения, а можно с электронного архива, но независимо от выбора, можно все равно прийти к полноценной системе. Невозможно найти систему, которая через 5 минут после инсталляции из коробки будет решать весь класс задач оптимальным образом для каждого пользователя (если, конечно, технология работы с документами в вашей компании полностью отвечают тем настройкам, которые поставляются с комплексом, что бывает крайне редко), но система должна требовать минимальное программирование и адаптацию под каждого пользователя. Выполнение данного принципа снижает цену, уменьшает время внедрения, что, естественно, повышает надежность в эксплуатации. Особое значение и важность для предприятий в настоящих условиях приобретает фактор простоты модификации настроек существующей системы силами обслуживающего персонала (Отдел разработки - это, безусловно, удобно, но довольно дорого для многих организаций), что может быть сопряжено с динамично изменяющимися внешними условиями на рынке.
Исходя из вышеизложенного, попробуем обрисовать составные части системы, работающей с документами:
система управления документами (СУД)
система массового ввода бумажных документов
функциональные блоки, интегрирующие СУД с различными источниками происхождения документов (офисные приложения, почта, факсимильные каналы, бумага, Internet и т.д.)
система автоматизации деловых процессов
Система управления документами
Ядром является система управления документами. К ее основным задачам относятся
Обеспечение регистрации поступающей информации (заполнение необходимых атрибутов документа)
Организация хранения документов
Поддержка устройств хранения разных типов (от быстрых магнитных дисков до стримеров, в том числе поддержка работы со съемными носителями).
Рис. 5.4.2. Схема.
Поддержка миграции документов между устройствами хранения в зависимости от изменения активности обращения к информации позволяет оптимизировать удельную стоимость хранения данных. Здесь может присутствовать как настраиваемая пользователем миграция документов, так и автоматическая. Технология автоматической миграции документов называется Hierarchical Storage Management, а продукты ее поддерживающие - HSM продуктами.
Автоматические операции с документами (как то, копирование, восстановление, уничтожение).
Организация индексирования документов для дальнейшего их быстрого поиска.
Сюда относятся поддержка индексов различных типов. Выделяют два основных типа. Атрибутивный индекс, когда документу присваивается набор текстовых, цифровых и других значений. Эти значения потом сохраняются в базе данных, и дальнейший поиск документа осуществляется по этим значениям. Например, Вновь созданному документу присваивается следующий набор
Тип документа: Договор
Создатель: Иванов
Дата создания: 18 Декабрь, 1995
Клиент: МММ
В дальнейшем поиск документа осуществляется по эти значениям. Например, показать все документы, которые имеют тип: Договор для клиента: МММ. Естественно, результаты поиска документа не однозначны и выдаются списком документов, из которого можно выбрать нужный Вам или продолжить поиск, уточнив критерии.
Другим широко применяемым типом индексирования документа является построение полнотекстового индекса по содержанию (слова, фразы) документа. Кроме того, все слова, входящие в документ, можно подвергнуть морфологической обработке. Морфологическая обработка нормализует каждое слово таким образом, что отсекает от него окончания, которые возникают в различных склонениях и падежах. Индекс строится уже не по всему многообразию слов, а по их нормализованному состоянию, что значительно сокращает его размер и расширяет воронку поиска. Кроме того применяются словари синонимов, которые позволяют расширить воронку поиска.
Вышеперечисленные два основных метода поиска документов не являются взаимоисключающими, они прекрасно дополняют друг друга. У каждого из них существуют вполне понятные преимущества и недостатки. Применение каждого из них зависит от конкретно стоящей задачи (например, если в организации имеется аналитический отдел или отдел безопасности и канал информации из СМИ, тогда возникает совершенное нормальное желание проводить анализ документов, поступающих из открытых источников, заполнять карточки для которых нет ресурсов - а анализировать нужно; здесь как раз мы переходим уже от понятия документа к понятию знание, что безусловно удобнее при работе тех категорий сотрудников, которые были упомянуты выше). В общем случае необходимо применять комбинацию из этих двух методов. Кроме того, существует метод семантического анализа содержания текста документа и выделения из него ключевых слов и помещения их в атрибутивную поисковую систему, что как бы сливает две системы поиска в одну. Отдельно стоит целый пласт задач, который подразумевает поиск и анализ информации, которая находится в нетекстовом формате - представьте себе, что необходимо выполнять поиск по мультимедиа-данным (звук, видео) или по изображениям (скажем, в газете промелькнула фотография человека и возникла необходимость подобрать видеоматериалы из видеотеки, где он присутствует). Конечно же, все необходимые функциональные блоки должны определяться на стадии предварительного проектирования системы, дабы в последствии избежать тупиковых ситуаций.