Средства поиска. Составление запроса. Контекстный поиск документов. Ключевые слова. Ситуации в СПС.
Профессиональная СПС должна предоставлять возможность поиска документов в различных ситуациях, зависящих от того, какой информацией о предмете поиска владеет пользователь СПС. Можно выделить следующие основные ситуации:
·пользователь знает (хотя бы приблизительно) реквизиты документов (например, номер, дату принятия, принявший орган);
·реквизиты искомых документов пользователю неизвестны, но предположительно известны слова и словосочетания, содержащиеся в тексте документа;
·требуется найти информацию по правовому вопросу, при этом пользователь не знает, в каких документах содержится эта информация, и затрудняется сказать, какие именно термины используются в документе, регулирующем этот вопрос.
На основе рассмотренных ситуаций и решений по ним в современных СПС можно выделить 3 основных вида поиска в компьютерных справочных системах:
·поиск по реквизитам документов (реквизитный),
·поиск по контексту (контекстный),
·поиск по специализированным классификаторам (тематический).
Прорыв, совершенный в сфере информационно-коммуникационных технологий в последние годы, привел к широкому проникновению интернета во все сферы деятельности и слои общества. Это обстоятельство потребовало от разработчиков СПС направить развитие программных технологий поиска информации в СПС в сторону унификации с интерфейсом поисковых систем в интернете и к разработке поиска с применением интеллектуальных технологий обработки правовой информации (интеллектуальный поиск), позволяющий моментально открывать списки нужных документов, путём формирования простого поискового запроса. Это, пусть новый и пока не основной, но очень значительный вид поиска, дальнейшее развитие и распространение которого уже, несомненно, получит продолжение. Пока что интеллектуальный поиск реализован только в коммерческих СПС. Это «Базовый поиск» (СПС «Гарант»), «Быстрый поиск» (СПС «Консультант Плюс») и «Интеллектуальный поиск» (СПС «Кодекс»).
1.1Поиск по реквизитам документа
Поиск документов по реквизитам довольно прост, и уже на самых ранних этапах становления справочных правовых систем программные технологии позволяли эффективно решать такую задачу. Любая СПС сегодня позволяет найти документ по одному или нескольким его реквизитам. Расширенный перечень реквизитов документа позволяет быстро и точно искать запрашиваемый акт. Среди реквизитов, характеризующих документ, пользователь может указать номер и дату принятия документа, номер акта, вид акта, название органа, принявшего акт, дату и номер регистрации в Минюсте России, источник и дату опубликования. При этом можно задавать несколько однотипных реквизитов, соединяя их различными логическими условиями (И, ИЛИ, КРОМЕ), вместо точной даты задавать различные диапазоны времени и т.д. При определении конкретного критерия поиска пользователь может вывести на экран список всех данных по определенному им реквизиту, что позволит избежать ввода критериев, на которые заведомо отсутствуют документы.
Поиск по реквизитам документа это наиболее простой, удобный и очевидный способ поиска. Однако он применим только в тех ситуациях, когда точно известны реквизиты конкретного документа. Основная проблема заключается в том, что в большинстве реальных ситуаций чаще всего требуется поиск документов, точные реквизиты которых заранее неизвестны. Другими словами, нужно найти документы, зная только общий смысл проблемы.
1.2Поиск по контексту
Если неизвестны реквизиты искомого документа, но известно, о чем идет в нем речь, то можно попытаться найти его по контексту, то есть по словам и словосочетаниям, встречающимся в тексте документа. В СПС должна быть предусмотрена такая возможность. Очевидно, что программная реализация данного инструмента является более сложной задачей, чем реализация поиска документов по формальным реквизитам. Это определяется объективными причинами, связанными с богатством естественного языка общения людей между собой по отношению к формализованному описанию ограниченного числа характеристик документа (его реквизитов).
На ранних стадиях развития справочных правовых систем возможности этих технологий позволяли задать несколько слов или словосочетаний, входящих в текст документа, и соединить их простейшими логическими условиями (И, ИЛИ, КРОМЕ). Затем появилась возможность учесть близость нахождения заданных слов в тексте документа. Например, задав для поиска два слова - ГЛАВНЫЙ и БУХГАЛТЕР,- можно было реализовать следующие возможности:
·найти все документы, где встречается хотя бы одно из этих слов: для этого надо соединить их логическим условием ИЛИ;
·найти все документы, где встречаются оба заданных слова: для этого надо соединить их логическим условием И;
·найти все документы, где заданные слова располагаются недалеко друг от друга: для этого надо было дополнительно указать, что слова обязательно должны располагаться в пределах заданного количества строк или слов.
Стандартом для технологий поиска в СПС по тексту документа в настоящее время является предоставление пользователю возможности задать поисковое выражение на естественном языке, так, чтобы при поиске нужных документов система сама учла близость расположения слов в тексте, нашла документы, где заданные слова встречаются в любых грамматических формах (с любыми окончаниями). Более того, желательно, чтобы поисковые технологии позволяли также учитывать возможные сокращения и синонимы. При этом остается важным сохранение возможности делать вручную ряд «тонких» настроек, например, регулировать близость слов в поисковом выражении, осуществлять поиск слов в определенной форме с определенным окончанием и пр.
1.3Поиск по специализированным классификаторам
Поиск по классификатору (тематический поиск) - это поиск по тематическому рубрикатору правовой информации. Данный вид поиска удобен для составления тематических подборок документов и для комплексного изучения правовой проблемы. Существует достаточно много разновидностей классификаторов. Общей чертой всех разновидностей поиска по классификаторам является то, что вся информация проходит предварительную обработку и рубрицируется. Это означает, что эксперт ставит в соответствие каждому элементу информационного массива (документу в целом или его части) определенный элемент классификатора, то есть таким образом указывается определенная рубрика. После такой обработки пользователь может выбрать интересующую его рубрику и получить всю подборку документов или их частей, которые были предварительно отобраны экспертом. Чаще всего в основе таких классификаторов лежит предмет правового регулирования, «тема» документа. При этом классификатор представляет собой систему юридических понятий (рубрик, ключевых слов, дескрипторов), отражающих содержание актов, которые составляют информационный массив.
В зависимости от расположения рубрик классификаторы можно разделить на иерархические и алфавитные.
В первой разновидности классификаторов рубрики расположены в иерархическом порядке, от общего к частному. Такое расположение рубрик более традиционно, оно напоминает оглавление книги и понятно абсолютному большинству пользователей. В разных базах данных используются различные классификаторы этой разновидности: Общеправовой классификатор отраслей законодательства (ОКОЗ), его модификации или другие независимые разработки.
Классификаторы второй разновидности разработаны на основе специальных словарей, состоящих из юридических понятий, расположенных в алфавитном порядке (в частности, к этой разновидности классификаторов относятся ключевые слова).
Каждая из этих разновидностей классификаторов (чаще вторая) может усложняться путем уточнения и увеличения количества юридических понятий, составляющих классификатор. Рубрики могут состоять из некоторого набора терминов и представлять собой описание определенной ситуации.
1.4Интеллектуальный поиск
При интеллектуальном поиске можно выбрать область поиска документов. «Быстрый» поиск осуществляется по всем установленным информационным блокам. Интеллектуальный поиск позволяет найти максимальное количество документов по интересующему пользователя вопросу даже тогда, когда пользователь не может его описать в понятиях тематического или «ситуационного» словаря. Пользователь описывает вопрос так, как он его, понимает, в виде поисковой фразы. Отметим, что в поисковой фразе можно использовать и значения реквизитов документа. Система анализирует поисковую фразу, отбрасывает «шумовые» слова и выделяет наиболее значимые. Проверка соответствия документа поисковой фразе происходит следующим образом:'
·вхождение всех значимых слов в название документа; вхождение всех значимых слов в текст документа;
·подсчет количества вхождений каждого слова в текст документа. Для каждого из отобранных документов устанавливается степень близости документа запросу («вес» документа). Список отобранных документов выдается в порядке убывания их «веса»
реквизит документ справочный интеллектуальный