Поиск и классификация информации баз данных
Информация о темпах роста количества существующих баз данных научной информации наглядно свидетельствует о том, что перед пользователем, желающим провести поиск информации по интересующей его проблеме, стоит ряд серьезных задач, и в том числе одна из первых - это выбор баз данных, охватывающих тематику его информационной потребности.
Для решения этой задачи в большинстве крупных систем реализован специальный режим поиска (назовем его расширенным или expand-поиском), который дает возможность пользователю обратиться к общему (для всех баз данных выбранной информационной службы или для указанного подмножества (кластера) баз данных) словарному файлу (часто это так называемый Basic Index, содержащий слова из полей заглавий работ, ключевых слов и др.), задав один или несколько связанных основополагающих для данного запроса терминов и получив в ответ перечень баз данных с указанием количества отвечающих заданным терминам документов (записей) в каждой базе.
Далее пользователь может осуществить выбор наиболее "представительных" баз данных и затем искать уже в них, используя все штатные средства поиска и вывода найденной информации. При этом пользователь может осуществлять поиск, не переключаясь с базы на базу последовательно, а сразу в выбранном тематическом подмножестве баз данных (кластере).
Для этого пользователю предоставляются следующие механизмы поиска:
навигация во всем доступном информационном пространстве - наглядное предоставление пользователю логической структуры информационного пространства, организующей все информационные объекты системы, и средств работы с ней (частичное или полное раскрытие структуры, сокращение ее до заданных элементов и т.п.). Терминальными узлами структуры являются информационные объекты, которые пользователь может вызывать на экран непосредственно из этой структуры при работе с ней;
Лексический поиск - информационный поиск по свободной лексике русского языка (как современного, так и дореформенного) и языков, использующих латинский алфавит. При этом поиск по лексике русского языка должен проводиться с учетом его грамматических особенностей (изменения по падежам, наличие беглых гласных и т.п.). При составлении поисковых предписаний должно допускаться применение логических операторов И, ИЛИ, И-НЕ и операторов контекстного расстояния, учитывающих порядок следования операндов;
Символьный поиск - разновидность лексического поиска, где в качестве лексической единицы выступает определенная последовательность допустимых символов, например даты;
Атрибутный поиск - информационный поиск объектов по значениям их характеристик. Для текстовых объектов к таким характеристикам могут относиться "автор", "название", "место издания", "дата издания" и т.п. Атрибутный поиск должен допускать использование логических операторов И, ИЛИ, И-НЕ, а также возможность проведения поиска по значениям двух и более характеристик одновременно;
Результатом лексического, символьного или атрибутного поиска является совокупность информационных объектов, значения характеристик которых удовлетворяют условиям поискового предписания. Результаты поиска, как и другие списки, формируемые в системе, должны допускать сортировку по значениям любого поля, определенного как ключевое.
Просмотр содержания информационного объекта и его структуры: последовательный (например, страница за страницей) и выборочный (переход на любую заданную страницу или на любой элемент, отраженный в структуре). При этом структура и текст произведения должны быть синхронизированы - любое изменение положения в структуре вызывает соответствующее изменение положения в тексте, и наоборот. Многооконный режим работы, позволяющий пользователю одновременно видеть на экране два окна (как минимум) с разным содержанием;
Одновременный вывод на экран (в разных окнах) текстов двух разных произведений или двух экземпляров одного произведения;
Поддержка аппарата гипертекстовых и гипермедийных связей, обеспечивающего пользователю оперативный переход от объекта или некоторого его элемента к другому взаимосвязанному с ним объекту или его элементу. При этом допускается существование связей типа "один-к-одному" и "один-ко-многим";
Протоколирование сеанса работы пользователя с системой с возможностью перехода в любое из ранее существовавших состояний системы;
Установка закладок в тексте информационных объектов и возможность оперативного перехода на них;
Экспорт информации из системы с указанием на источник (собственно ЭИ или ЭБ и информационный объект, из которого копируется информация).
Но в реальной практике часто бывает так, что для обеспечения максимальной полноты информации, особенно при многоаспектном поиске, ресурсов одной службы недостаточно, и для получения пусть даже относительно небольшой доли (но, возможно, содержащей важные для пользователя сведения) дополнительной информации, необходимо привлечение ресурсов других информационных служб. Но тогда возникают сложности с освоением не одной, а нескольких информационно-поисковых систем, переформулированием запросов и т.п. В связи с этим на информационном рынке появились универсальные информационные и интеллектуальные шлюзы, представляющие собой специальные программные системы. Информационные шлюзы нацелены на облегчение доступа пользователя к ресурсам (базам данных) различных информационных служб и не предусматривают развитых средств помощи пользователю в выборе стратегии поиска и оценке результатов поиска. В интеллектуальных же шлюзах реализуются алгоритмы выбора баз данных, задачи формирования поисковых предписаний, а также ввод запросов на соответствующем языке, для чего используются методы искусственного интеллекта и элементы экспертных систем. Различные шлюзовые службы могут охватывать ресурсы двух и более центров обработки данных, а службы Easy Net, Easylink, Searchline и InfoMaster являются службами с мировой сферой деятельности.