Гипертекстовые информационные системы
Слово гипертекст (hypertext) буквально переводится как нелинейный текст (nonlinear text). Элемент гипертекста — узел, дискретный объект. Узлы, между которыми возможен переход, считаются смежными, а сама возможность перехода называется связью.
Для описания и анализа объектов систем, в которых основным отношением является смежность (непосредственная связь) элементов, используется теория графов.
В системе гипертекста ссылки вида «смотри также», подстрочные примечания, библиографические ссылки, внутритекстовые пометки, моделируются как ассоциативные связи, следуя которым можно читать материал в любом порядке.
Если речь идет о достаточно обширном материале с большим количеством связей, то возникает сложное гипертекстовое пространство (сеть). Формирование, поддержание, исправление, наращивание и просмотр такой сети практически возможны только на компьютерной основе.
Гипертекстом часто называют как саму форму структурирования текстового материала (нелинейную, сетевую), так и технологию, без которой невозможна такая организация материала в широких масштабах.
В гипертекстовых системах база данных не строится в соответствии с какой-либо заблаговременно (до накопления информации) установленной схемой связей, а организуется в виде открытой, свободно наращиваемой и изменяемой самим пользователем сети, узлы которой соединяются с уже имеющимися в базе узлами.
Следовательно, гипертекст не требует предварительной формализации знания, но предполагает лишь его дискретность и возможность явного указания имеющихся связей между смысловыми единицами.
К достоинствам гипертекста относят широкие возможности автоматизированного обучения. Гипертекст позволяет не только просмотреть большую группу релевантных документов, но и изучить механизм образования ассоциативных связей.
Классические системы и средства информационного поиска ориентированы, в первую очередь, на пользователя, желающего восполнить некий пробел в своих знаниях, который он может точно сформулировать.
Однако многие пользователи не в состоянии четко сформулировать свои информационные потребности или просто желают подробнее ознакомиться с малоизвестной предметной областью.
В этом случае поиск по дескрипторам или ключевым словам малоэффективен, часто они просто неизвестны пользователю.
В принципе, пользователь может работать с гипертекстовой системой без знания специальных языков поиска и запроса. Вместо них используется «браузинг» («browsing») - операция просмотра узлов гипертекстовой сети по связи, движение от известной информации к связанной с нею неизвестной, являющейся предметом поиска. Браузинг дает пользователю относительно легкий способ отыскания релевантной информации без изучения запросного языка независимо от объемов БД.
Другой отличительной чертой гипертекста является способность интегрировать разнотипные виды информации (текст, таблицы, векторную и растровую графику, мультимедиа) в единую гиперсреду (hypermedia).
Системы гипертекста можно определить как системы, обеспечивающие создание нелинейных документов и взаимодействие с ними, или как системы ассоциативной организации и поиска информации. Структурно гипертекстовая система включает в себя:
· графический интерфейс, обеспечивающий пользователю навигацию через широкие массивы информации, активацию связей и чтение содержания узлов с помощью окон просмотра и перекрывающихся диаграмм;
· систему автора гипертекста, т. е. средства создания и управления узлами и связями;
· традиционный информационно-поисковый (IR) механизм: поиск по ключевым словам (КС), авторский поиск и т. д.;
· гипермедиа-машину управления информацией по узлам и связям;
· систему хранения: файловую систему или базу знаний, реляционную или объектно-ориентированную СУБД.
Гипертекстовая система предназначена для интерактивного взаимодействия авторов, администраторов и читателей (пользователей).
Автор выбирает ключевые слова в тексте обрабатываемого документа и выделяет их для пользователя, задает переходы между текстами, систему этих переходов.
Он обязан знать не только сам базовый материал, но и все возможные пути, которые предполагаемый оператор (читатель), возможно, выберет для использования.
Системный администратор-программист определяет методы, с помощью которых эти перемещения выбираются. Пользователю дана свобода выбора маршрута чтения. Ему предоставлено, хотя и большое, но конечное число передвижений, определенных автором.
Выделим следующие важные функции гипертекстовых информационных систем.
1. Поиск текста по атрибутам, символьным строкам, создание, хранение и поиск различного рода подборок текста («папок»).
2. Поддержка ссылочных связей.
3. Поиск информации путем браузинга (быстрый просмотр).
4. Ведение наращиваемой системы документов вне априорно заданной структуры.
5. Навигация по связям с целью изучения и освоения знания о соответствующей предметной области.
6. Выделение в ходе навигации «виртуальных структур».
7. Автоматическое построение из гипертекстовой сети связных текстов с использованием эвристических алгоритмов.