Гипертекстовые информационные системы

Слово гипертекст (hypertext) буквально переводится как нели­нейный текст (nonlinear text). Элемент гипертекста — узел, дискрет­ный объект. Узлы, между которыми возможен переход, считаются смежными, а сама возможность перехода называется связью.

Для описания и анализа объектов систем, в которых основным отноше­нием является смежность (непосредственная связь) элементов, ис­пользуется теория графов.

В системе гипертекста ссылки вида «смотри также», подстроч­ные примечания, библиографические ссылки, внутритекстовые пометки, моделируются как ассоциативные связи, следуя которым можно читать материал в любом порядке.

Если речь идет о достаточно обширном материале с большим количеством связей, то возникает сложное гипертекстовое пространство (сеть). Формирова­ние, поддержание, исправление, наращивание и просмотр такой сети практически возможны только на компьютерной основе.

Гипертекстом часто называют как саму форму структурирова­ния текстового материала (нелинейную, сетевую), так и техноло­гию, без которой невозможна такая организация материала в широ­ких масштабах.

В гипертекстовых системах база данных не строится в соответ­ствии с какой-либо заблаговременно (до накопления информации) установ­ленной схемой связей, а организуется в виде открытой, свободно наращиваемой и изменяемой самим пользователем сети, узлы которой соединяются с уже имеющимися в базе узлами.

Следовательно, гипертекст не требует предварительной формализации знания, но предполагает лишь его дискретность и возможность явного указа­ния имеющихся связей между смысловыми единицами.

К достоин­ствам гипертекста относят широкие возможности автоматизирован­ного обучения. Гипертекст позволяет не только просмотреть боль­шую группу релевантных документов, но и изучить механизм образования ассоциативных связей.

Классические системы и средства информационного поиска ориентированы, в первую очередь, на пользователя, желающего вос­полнить некий пробел в своих знаниях, который он может точно сформулировать.

Однако многие пользователи не в состоянии четко сформулировать свои информационные потребности или просто желают подробнее ознакомиться с малоизвестной предметной обла­стью.

В этом случае поиск по дескрипторам или ключевым словам малоэффективен, часто они просто неизвестны пользователю.

В принципе, пользователь может работать с гипертекстовой сис­темой без знания специальных языков поиска и запроса. Вместо них используется «браузинг» («browsing») - операция просмотра уз­лов гипертекстовой сети по связи, движение от известной информа­ции к связанной с нею неизвестной, являющейся предметом поис­ка. Браузинг дает пользователю относительно легкий способ оты­скания релевантной информации без изучения запросного языка независимо от объемов БД.

Другой отличительной чертой гипертекста является способность интегрировать разнотипные виды информации (текст, таблицы, векторную и растровую графику, мультимедиа) в единую гиперсреду (hypermedia).

Системы гипертекста можно определить как системы, обеспечи­вающие создание нелинейных документов и взаимодействие с ними, или как системы ассоциативной организации и поиска ин­формации. Структурно гипертекстовая система включает в себя:

· графический интерфейс, обеспечивающий пользователю на­вигацию через широкие массивы информации, активацию связей и чтение содержания узлов с помощью окон просмотра и перекрывающихся диаграмм;

· систему автора гипертекста, т. е. средства создания и управле­ния узлами и связями;

· традиционный информационно-поисковый (IR) механизм: поиск по ключевым словам (КС), авторский поиск и т. д.;

· гипермедиа-машину управления информацией по узлам и связям;

· систему хранения: файловую систему или базу знаний, реля­ционную или объектно-ориентированную СУБД.

Гипертекстовая система предназначена для интерактивного взаимодействия авторов, администраторов и читателей (пользовате­лей).

Автор выбирает ключевые слова в тексте обрабатываемого доку­мента и выделяет их для пользователя, задает переходы между тек­стами, систему этих переходов.

Он обязан знать не только сам базо­вый материал, но и все возможные пути, которые предполагаемый оператор (читатель), возможно, выберет для использования.

Системный администратор-программист определяет методы, с помощью которых эти перемещения выбираются. Пользователю дана свобода выбора маршрута чтения. Ему предоставлено, хотя и большое, но конечное число передвижений, определенных автором.

Выделим следующие важные функции гипертекстовых информацион­ных систем.

1. Поиск текста по атрибутам, символьным строкам, создание, хранение и поиск различного рода подборок текста («папок»).

2. Поддержка ссылочных связей.

3. Поиск информации путем браузинга (быстрый просмотр).

4. Ведение наращиваемой системы документов вне априорно за­данной структуры.

5. Навигация по связям с целью изучения и освоения знания о соответствующей предметной области.

6. Выделение в ходе навигации «виртуальных структур».

7. Автоматическое построение из гипертекстовой сети связных текстов с использованием эвристических алгоритмов.

Наши рекомендации