Базы данных аналитической разведки

Для обеспечения разведывательной деятельности создаются базы данных следующих разновидностей: документарные, гипертекстовые, фактографические, геоинформационные, семантические.

* * *

Документарная база данных содержит документы в том виде, в котором они попали к разведслужбе или были разработаны ею. По возможности каждый документ дополняется следующим материалом:

- классификационным кодом;

- резюме (т. е. кратким пересказом);

- набором дескрипторов (т. е. ключевых слов);

- аннотацией (т. е. оценкой значимости, достоверности, состояния и пр.);

- списком имеющихся в документе ссылок на другие документы базы данных;

- списком ссылок на данный документ из других документов базы данных;

- формуляром доступа к документу: кто, когда, в связи с какой задачей обращался к нему;

- произвольными комментариями к документу, оставленными теми, кто имел к нему доступ.

В качестве ключей поиска могут использоваться следующие атрибуты документа: автор, язык, страна, дата публикации, подготовившее документ учреждение и т. п.

Документ может быть размечен. Разметка осуществляется посредством шрифтов, цветов, ссылок, дополнительных знаков, рамок, подзаголовков, пунктов, смещений и т. д. Различается авторская разметка и комментаторская разметка. Для одного документа может храниться несколько вариантов разметки.

Возможные запросы к документарной базе данных аналитической разведки:

- найти все документы, относящиеся к указанной теме;

- найти все документы, содержащие указанные фразы в названии;

- найти все документы, содержащие указанные фразы в тексте;

- найти все документы, ссылающиеся на указанный документ;

- найти все документы, на которые ссылается указанный документ;

- и т. д.

* * *

Если в документарной базе данных всякий текст представляется как линейная последовательность строк, то в гипертекстовой - как иерархия или сеть фрагментов, связанных взаимными ссылками.

Гипертекст - набор текстовых фрагментов, не имеющих линейного порядка, но связанных взаимными ссылками. Р. А. Грайс: "Различия между гипертекстом и написанным в стандартной форме документом состоит в том, что в гипертексте мы обеспечиваем пользователей связями, необходимыми для перехода от одного фрагмента в тексте к другому; традиционная публикация может иметь или не иметь такие связи (ссылки), но даже если они определены, то часто не обеспечивают быстрого доступа к смежной информации, как это предлагает гипертекст." (ст. "Создание информационного пространства для потребителей с использованием гипермедиа")

Можно выделять гипертекстовые системы следующих типов:

1) статические (обновляемые редко), динамические (обновляемые часто);

2) малые (читаемые целиком), большие (читаемые выборочно);

3) открытые (содержащие "внешние" ссылки: на данные, содержащиеся в других компьютерах, подсоединенных к сети), закрытые (не содержащие внешних ссылок);

4) для применения готовых гипертекстов;

для разработки гипертекстов;

для разработки и применения гипертекстов (с возможностью быстрого переключения между тем и другим режимом).

5) справочные;

аналитические;

поддерживающие теоретическую работу;

поддерживающие практические решения.

Можно выделить два вида поиска данных в тексте:

1) целевой поиск (hunting retrieval): требования к объекту поиска четко формулируются перед началом поиска;

2) поиск просмотром (browsing retrieval): требования к объектам поиска не формулируются; пользователь просматривает объекты возможного выбора, пытаясь распознать тот, что ему нужен; цель поиска может уточняться в процессе поиска, поскольку, обозревая объекты возможного выбора, пользователь расширяет свои представления о предметной области.

Гипертекстовая система обеспечивает прежде всего "поиск просмотром" - посредством прокручивания, листания, движения по ссылкам. Но в гипертексте возможен и целевой поиск: к примеру, поиск указанной фразы, в том числе осуществляемый не только в текущем фрагменте, но и в ссылаемых фрагментах.

В гипертекстовых базах данных могут содержаться следующие данные:

- анализируемые;

- справочные;

- концептуальные;

- представляющие собой промежуточные результаты работы;

- представляющие собой окончательные результаты работы.

* * *

Фактографическая база данных содержит большое количество наборов данных, относящихся к одному или нескольким типам линейной структуры и предназначенных по преимуществу для представления их потребителю в табличной форме.

* * *

Геоинформационная база данных - набор данных, отражающих характеристики совокупностей точек поверхности или пространства, приспособленный для демонстрации этих характеристик на экране компьютера в виде географических карт.

Применения геоинформационных БД в аналитической разведке:

1) наложение двух карт, одна из которых представляет распределение фактора A, а другая - фактора B на одной и той же территории, с целью визуального выявления связей между распределением этих факторов;

2) наложение двух карт, одна из которых представляет распределение некоторого фактора на момент времени T1, а другая - на момент T2 на одной и той же территории, с целью визуального выявления характера изменений в распределении этого фактора.

* * *

Семантическая база данных (= "база знаний") - набор данных, который имеет структуру, приспособленную к осуществлению компьютерного логического вывода на основании этих данных. Является частью "экспертной системы" - компьютерного приложения, формирующего новые сведения посредством логического вывода.

Семантическая база данных пополняется в основном путем опроса экспертов, осуществляемого компьютерной программой.

Наши рекомендации