Базы данных аналитической разведки
Для обеспечения разведывательной деятельности создаются базы данных следующих разновидностей: документарные, гипертекстовые, фактографические, геоинформационные, семантические.
* * *
Документарная база данных содержит документы в том виде, в котором они попали к разведслужбе или были разработаны ею. По возможности каждый документ дополняется следующим материалом:
- классификационным кодом;
- резюме (т. е. кратким пересказом);
- набором дескрипторов (т. е. ключевых слов);
- аннотацией (т. е. оценкой значимости, достоверности, состояния и пр.);
- списком имеющихся в документе ссылок на другие документы базы данных;
- списком ссылок на данный документ из других документов базы данных;
- формуляром доступа к документу: кто, когда, в связи с какой задачей обращался к нему;
- произвольными комментариями к документу, оставленными теми, кто имел к нему доступ.
В качестве ключей поиска могут использоваться следующие атрибуты документа: автор, язык, страна, дата публикации, подготовившее документ учреждение и т. п.
Документ может быть размечен. Разметка осуществляется посредством шрифтов, цветов, ссылок, дополнительных знаков, рамок, подзаголовков, пунктов, смещений и т. д. Различается авторская разметка и комментаторская разметка. Для одного документа может храниться несколько вариантов разметки.
Возможные запросы к документарной базе данных аналитической разведки:
- найти все документы, относящиеся к указанной теме;
- найти все документы, содержащие указанные фразы в названии;
- найти все документы, содержащие указанные фразы в тексте;
- найти все документы, ссылающиеся на указанный документ;
- найти все документы, на которые ссылается указанный документ;
- и т. д.
* * *
Если в документарной базе данных всякий текст представляется как линейная последовательность строк, то в гипертекстовой - как иерархия или сеть фрагментов, связанных взаимными ссылками.
Гипертекст - набор текстовых фрагментов, не имеющих линейного порядка, но связанных взаимными ссылками. Р. А. Грайс: "Различия между гипертекстом и написанным в стандартной форме документом состоит в том, что в гипертексте мы обеспечиваем пользователей связями, необходимыми для перехода от одного фрагмента в тексте к другому; традиционная публикация может иметь или не иметь такие связи (ссылки), но даже если они определены, то часто не обеспечивают быстрого доступа к смежной информации, как это предлагает гипертекст." (ст. "Создание информационного пространства для потребителей с использованием гипермедиа")
Можно выделять гипертекстовые системы следующих типов:
1) статические (обновляемые редко), динамические (обновляемые часто);
2) малые (читаемые целиком), большие (читаемые выборочно);
3) открытые (содержащие "внешние" ссылки: на данные, содержащиеся в других компьютерах, подсоединенных к сети), закрытые (не содержащие внешних ссылок);
4) для применения готовых гипертекстов;
для разработки гипертекстов;
для разработки и применения гипертекстов (с возможностью быстрого переключения между тем и другим режимом).
5) справочные;
аналитические;
поддерживающие теоретическую работу;
поддерживающие практические решения.
Можно выделить два вида поиска данных в тексте:
1) целевой поиск (hunting retrieval): требования к объекту поиска четко формулируются перед началом поиска;
2) поиск просмотром (browsing retrieval): требования к объектам поиска не формулируются; пользователь просматривает объекты возможного выбора, пытаясь распознать тот, что ему нужен; цель поиска может уточняться в процессе поиска, поскольку, обозревая объекты возможного выбора, пользователь расширяет свои представления о предметной области.
Гипертекстовая система обеспечивает прежде всего "поиск просмотром" - посредством прокручивания, листания, движения по ссылкам. Но в гипертексте возможен и целевой поиск: к примеру, поиск указанной фразы, в том числе осуществляемый не только в текущем фрагменте, но и в ссылаемых фрагментах.
В гипертекстовых базах данных могут содержаться следующие данные:
- анализируемые;
- справочные;
- концептуальные;
- представляющие собой промежуточные результаты работы;
- представляющие собой окончательные результаты работы.
* * *
Фактографическая база данных содержит большое количество наборов данных, относящихся к одному или нескольким типам линейной структуры и предназначенных по преимуществу для представления их потребителю в табличной форме.
* * *
Геоинформационная база данных - набор данных, отражающих характеристики совокупностей точек поверхности или пространства, приспособленный для демонстрации этих характеристик на экране компьютера в виде географических карт.
Применения геоинформационных БД в аналитической разведке:
1) наложение двух карт, одна из которых представляет распределение фактора A, а другая - фактора B на одной и той же территории, с целью визуального выявления связей между распределением этих факторов;
2) наложение двух карт, одна из которых представляет распределение некоторого фактора на момент времени T1, а другая - на момент T2 на одной и той же территории, с целью визуального выявления характера изменений в распределении этого фактора.
* * *
Семантическая база данных (= "база знаний") - набор данных, который имеет структуру, приспособленную к осуществлению компьютерного логического вывода на основании этих данных. Является частью "экспертной системы" - компьютерного приложения, формирующего новые сведения посредством логического вывода.
Семантическая база данных пополняется в основном путем опроса экспертов, осуществляемого компьютерной программой.