Теоретические основы информационно-поисковых систем
Информационно-поисковая система это комплекс аппаратно-программых средств для поиска информации по определенным критериям, задаваемых пользователям и ее отображения.
Любая современная информационная структура формируется по следующим типовым принципам:
· однократный ввод и многократное использование информации;
· полнота удовлетворения информационных потребностей основных групп пользователей;
· оперативное пополнение ресурсов обязательными документами;
· комфортный доступ к ресурсам в off- и on-line режимах;
· выполнение как конкретных узко тематических, так и широких по тематике запросов.
При этом запросы, которые формируют пользователи информационных систем, реализуются следующими способами:
· сообщения, являющиеся ответом на запрос, хранятся в явном виде в базе данных, и процесс получения ответа представляет собой выделение подмножества знаний из файлов базы данных, удовлетворяющих запросу;
· ответ не существует в явном виде в базе данных и формируется в процессе логического вывода на основании имеющихся данных.
Таким образом под информационным поиском в информационно-поисковых системах понимается некоторая последовательность операций, выполняемых с целью отыскания документов (статей, научно-технических отчетов, описаний к авторским свидетельствам и патентам, книг и т.д.), содержащих определенную информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих собой ответы на заданные вопросы.
Массив элементов информации, в котором производится информационный поиск, называется поисковым массивом. Существующие виды информационного обслуживания представлены втаблице:
Признак классификации | Вид обслуживания |
По источнику инициативы | · принудительное; · по запросам потребителей |
По типам документов | · обслуживание опубликованными документами и/или их копиями; · обслуживание копиями неопубликованных документов (отчетов по НИР, диссертаций, переводов и т. п.) |
По направленности или адресности | · информационные издания (много адресов); · избирательное распределение информации (один адрес) |
По периодичности или срочности | · текущее оповещение; · ретроспективный поиск |
По способу доведения документов до потребителя | · непосредственная передача документов или их копий потребителям; · двухступенчатое обслуживание (вначале информационное издание, а затем – копии заинтересовавших потребителя документов |
По назначению, цели | · ознакомление; · для практического использования |
Примечание: Ретроспекти́ва (от лат. retrospectare — взгляд назад) — взгляд в прошлое, обозрение того, что было в прошлом.
Ретроспективный поиск информации - информационный поиск, проводимый во всем накопленном массиве документов или фактов по любому запросу, соответствующему тематике и виду информационного массива.
Способы реализации видов и форм обслуживания зависят от вида, назначения и способа реализации конкретной ИПС. Очевидно, что прочитать каждый документ библиотеки, чтобы найти необходимый, практически невозможно. Поэтому на протяжении истории развития информационного поиска разрабатывались и совершенствовались методы поиска.
Каждому документу, вводимому в поисковый массив, ставится в соответствии поисковый образ документа (ПОД), который представляет собой характеристику, отражающую основное смысловое содержание документа (этим ПОД отличается от кода, присваиваемого информационному элементу в фактографических ИС). В виде такой же краткой характеристики – поискового предписания или поискового образа запроса (ПОЗ) должны быть сформулирован и информационный запрос. Благодаря этому процедура поиска может быть сведена к простому сопоставлению поисковых образов документов с поисковым предписанием.
Для сопоставления ПОД и ПОЗ разрабатывают и применяют различные критерии поиска или критерии смыслового соответствия. Точность поиска определяется точностью отображения документов и запросов с помощью их поисковых образов и степенью совпадения ПОД и ПОЗ. Поэтому возможна неполнота выдачи документов, либо, напротив, «поисковый шум», которые представляют собой своеобразную плату за облегчение процедуры информационного поиска.
Процедура выражения основного смыслового содержания документа и информационных запросов на информационно-поисковом языке получила название индексирования и составляет существенную часть аналитико-синтетической обработки документов. Информационный поиск, таким образом, заключается в замене содержательного прочтения полного текста документов формальным «сличением» (сравнением на соответствие) их поисковых образов с запросами на языке индексов.
Информационный поиск реализуется при помощи информационно-поисковой системы, которая в абстрактном виде должна состоять из информационно-поискового языка, правил перехода на этот язык и критерия смыслового соответствия, определяющего объем выдачи документов или информации.