Глава 2. Оптимизация когнитивной функции языка. §1. Компьютерная лингвистика37
§1. Компьютерная лингвистика37
гипертекста зависит и от количества информации, которая в нем содержится. Если узлов в сети гипертекста порядка одной-трех тысяч, то чаще всего используется жесткая архитектура, если же количество узлов достигает нескольких десятков тысяч или даже миллионов единиц, то мягкая структура оказывается более предпочтительной, поскольку кодировка жестких связей отнимает слишком много времени. Заметим, что структура Интернета часто функционирует как гипертекст мягкой архитектуры.
Технология построения гипертекстовых систем не делает различий между текстовой и нетекстовой информацией. Между тем включение визуальной и звуковой информации (видеороликов, картин, фотографий, звукозаписей и т. п.) требует существенного изменения интерфейса с пользователем и более мощной программной и компьютерной поддержки. Такие системы получили название гипермедиа или мультимедиа. Наглядность мультимедийных систем предопределила их широкое использование в обучении, в создании компьютерных вариантов энциклопедий. Известны, например, прекрасно выполненные CD-ромы с мультимедийными системами по детским энциклопедиям издательства «Дорлинг Киндерсли».
1.4.5. Некоторые гипертекстовые системы. Технологически в основе гипертекста лежат компьютерные программы, которые поддерживают следующие базовые функции:
• обеспечение быстрого просмотра информационного массива (брау-зинг);
• обработка ссылочных отношений (обращение и вызов фрагмента текста или другой информации, на которую производится отсылка);
• навигация по гипертексту, запоминание маршрута движения; представление пути движения в легко воспринимаемой форме;
• возможность формирования обычного линейного текста как результата движения по гипертексту;
• дополнение гипертекста новой информацией;
• введение новых отношений в структуру гипертекста (для систем с жесткой структурой).
Программные оболочки гипертекста, как правило, универсальны. Они могут использоваться в различных областях для создания тематически разных гипертекстов. Таковы, например, оболочка ZOG и разработанная на ее основе промышленная гипертекстовая система KMS (университет Карнеги-Меллон, США). Сферы применения этих гипертекстовых систем необычайно разнообразны — от работы с документацией и поддержки электронной почты до гипертекстов, предназначенных для экспертов, работающих над бюджетом. Имеются и специализированные системы. Так, система NoteCards (продукт компании «Xerox PARC») предназначена для аналитической работы, а система WE, моделирующая
особенности получения нового знания — для помощи в авторской работе. Наиболее популярны в настоящее время программные пакеты HyperCard компании «Apple». Они относительно просты в использовании. Гипертекст в оболочке HyperCard представляется в виде каталожных карточек. Пользователь с помощью довольно простого интерфейса организует структуру карточки и устанавливает связи между карточками. Пакеты HyperCard позволяют сочетать различные типы информации, в частности карточки могут включать графическую, звуковую и др. информацию. Следует отметить, что современные базы данных также включают поля для визуальной и звуковой формы данных (ср., например, базу данных ACCESS 7, работающую в среде Windows). Близка к HyperCard по своим свойствам и программа SuperCard фирмы «Silicon Beach». Некоторые системы гипертекста содержат специальные средства ориентации пользователя в гиперпространстве — карты или закладки, отмечающие наиболее посещаемые узлы гипертекста. Комплексом средств ориентации обладает система Hypergate Writer фирмы «Eastgate Systems Inc».
Место лингвистов в проектах по созданию гипертекстовых систем не определено еще достаточно четко, но лингвистическая поддержка гипертекстовой технологии необходима. Для гипертекстов с мягкой структурой требуется разработка семантических процессоров, устанавливающих отношения семантической близости между документами в автоматическом режиме. Гипертексты с жесткой структурой требуют установления системы смысловых отношений между компонентами гипертекста, что является одной из важнейших задач лингвистической семантики и лингвистики текста. Особая задача, которая не получила достаточного освещения в литературе по данной проблематике — отбор информации в узлы сети гипертекста. Эта сфера относится как к инженерии знаний, так и к работе лингвиста-прикладника, определяющего какие смысловые связи должны быть оставлены во фрагменте текста, помещаемого в узел системы гипертекста, а какие могут быть «обрублены», элиминированы. Принципы отбора семантических отношений определяются пракгическими задачами гипертекстовой системы.
Задание 1. Известно, что обычный текст содержит некоторые компоненты,
которые в большей степени характеризуют гипертекст. Например, оглавление, аппарат сносок и примечаний — все это инструменты создания нелинейности текста, обеспечения системы нелинейных переходов. Какие элементы гипертекста обнаруживаются в следующих текстах:
• в тексте библии и евангелий;
• в газетной, журнальной и щитовой рекламе;
• в словарях и энциклопедиях;
• в деловых и информационных справочниках типа «Москва — золотые страницы», «Досуг в Москве и Петербурге».