Возможности программных средств информационно-правовых систем

2.1. Хранение и обработка больших объемов правовой информации

Как уже отмечалось, возможность компактного хранения большого объ­ема информации — одно из важнейших преимуществ любых компьютерных технологий. Правовая информация действительно характеризуется боль­шими объемами как существующей, так и вновь появляющейся информа­ции. К примеру, только информационный правовой комплекс Консуль­тантПлюс: Эксперт на 1 января 1999 г. содержал более 80 тысяч актов, или более 250 тысяч страниц информации. Ежемесячно в систему поступает бо­лее двух тысяч актов, или более шести' тысяч страниц новой информации.

Большие объемы информации, включаемые в СПС, накладывают две группы требований на используемую технологию. Первая группа связана с потребностями пользователей СПС, эти вопросы подробнее обсуждаются в следующих двух пунктах данного параграфа. Вторая группа требований к уровню и свойствам технологий связана с тем, что вводить и тщательно об­рабатывать большой поток информации достаточно сложно. Очевидно, что ежемесячное введение в базу данных двух тысяч документов не представ­ляет особого труда. Но если при этом вводимые документы связываются сотнями и тысячами ссылок как с документами, введенными ранее, так и между собой, если для них готовятся новые редакции, примечания, коммен­тарии и т.д., то процесс параллельной обработки такого количества доку­ментов становится серьезной проблемой. Для ее решения программная тех­нология должна быть хорошо продуманной и увязанной с организацией ра­боты десятков людей в информационном отделе компании-разработчика.

2.2. Основные поисковые и сервисные возможности

Можно выделить три основных вида поиска в компьютерных справоч­ных системах:

• поиск по реквизитам документов,

• полнотекстовый поиск,

• поиск по специализированным классификаторам.

Современные СПС предоставляют возможность эффективно рабо­тать с любым из этих видов поиска. Возможности мгновенного поиска с помощью комплекса поисковых инструментов —действительно совер­шенно новый уровень работы с информацией, который обеспечили ком­пьютерные технологии.

Важнейшее свойство программных технологий заключается в том, что они позволяют не просто в сотни раз быстрее искать конкретный фрагмент текста документа по тому или иному признаку, но и одновре­менно сочетать несколько поисковых инструментов. Это свойство позво­ляет прекратить споры о том, какой вид поиска более удобен и точен.

В действительности каждый вид поиска имеет свои достоинства и не­достатки, преимущества и ограничения при использовании. Оптималь­ный же результат может быть получен только при сочетании различных видов поиска и их параллельном использовании. Проанализируем каж­дый из этих видов поиска более подробно.

2.3 Поиск по реквизитам документа

Это наиболее простой, удобный и очевидный способ поиска. Под по­иском по реквизитам понимается поиск по номеру, виду документа, при­нявшему органу, дате принятия и т.д. Удобство и простота реализации этого вида поиска обычно не вызывают ни у кого особых вопросов. Одна­ко он применим только в тех ситуациях, когда точно известны реквизи­ты конкретного документа.

Основная проблема заключается в том, что в большинстве реальных ситуаций чаще всего требуется поиск документов без заранее известных точных реквизитов, только на основании общего смысла проблемы.

2.4 Полнотекстовый поиск (автоматический поиск по словам из текста документа)

Этот вид поиска основан на автоматической обработке текста. При за­просе на поиск тех документов, где встречается конкретное слово, авто­матически происходит перебор всего массива документов и выбор всех тех документов, где это слово встречается. Существуют быстрые алго­ритмы такого поиска, когда при первоначальном вводе каждого докумен­та все встречающиеся в нем слова вносятся в общий словарь, и в дальней­шем при поиске по любому слову из словаря можно мгновенно получить список всех документов, где оно встречается.

Более того, на основе полнотекстового поиска могут быть реализова­ны различные способы формирования поисковых запросов. Простейшим запросом является следующий: найти все документы, содержащие одно слово, например БУХГАЛТЕР. Более сложным вариантом запроса явля­ется запрос на поиск всех документов, содержащих два слова, например ГЛАВНЫЙ и БУХГАЛТЕР. Если эти два слова соединены логическим ус­ловием И, то будут отобраны только те документы, где есть одновремен­но оба слова. Если указаны два слова, соединенные логическим условием ИЛИ, то будут отобраны документы, где есть хотя бы одно из этих слов. Такие логические выражения могут быть еще более сложными.

При формировании сложных запросов дополнительно может исполь­зоваться признак близости слов. В запросе ГЛАВНЫЙ И БУХГАЛТЕР мо­жет быть указано, что слова должны находиться РЯДОМ, например в пре­делах 2 (или 3) строк.

Основное преимущество полнотекстового поиска состоит в том, что он не зависит от субъективных мнений или ошибок специалистов-раз­работчиков и всегда по любому слову дает возможность получить пол­ный и абсолютно точный список документов, где встречается искомое слово. Ничего не будет забыто и пропущено. Другими словами, на лю­бой запрос можно получить ответ, подготовленный по понятному для пользователя правилу, не зависящему от субъективной позиции обра­ботчика,

Но, конечно, у полнотекстового поиска имеются и свои недостатки. Во-первых, полученный список будет содержать много «шума», то есть те документы, где искомое слово используется не в нужном контексте и т.п. Во-вторых, не будут найдены те документы, где встречаются сино­нимы данного термина. Так, задав поиск по слову НЕСОВЕРШЕННО­ЛЕТНИЙ, невозможно автоматически получить те документы, где ис­пользуется выражение ЛИЦО, НЕ ДОСТИГШЕЕ ВОСЕМНАДЦАТИ ЛЕТ. Эта проблема частично решается усложнением задаваемых поис­ковых выражений, но все равно трудно во всех случаях добиться такой же точности, как при заранее проделанной «вручную» экспертной обра­ботке (см. следующий пункт).

2.5 Поиск по специализированным классификаторам

Существует достаточно много разновидностей классификаторов. Так, можно считать, что описанный выше в п. 2.2 данного параграфа поиск до­кументов по реквизитам также является поиском по классификатору. Та­кого рода классификаторы имеют жесткую структуру, не зависящую от субъективной точки зрения тех, кто обрабатывает информацию. Напри­мер, при поиске документа по его виду структура и состав соответствую­щего классификатора жестко и формально определены объективно су­ществующими видами документов (закон, указ, письмо и т.д.).

Однако в этом пункте мы будем рассматривать другой вид классифи­каторов, структура которых (в отличие от упомянутых выше) существен­но зависит от опыта и взглядов экспертов —обработчиков информации.

Общей чертой всех разновидностей поиска по этим классификаторам является то, что вся информация проходит предварительную обработку и рубрицируется. Это означает, что эксперт ставит в соответствие каждо­му элементу информационного массива (документу в целом или его час­ти) определенный элемент классификатора, то есть таким образом ука­зывается определенная рубрика. После такой обработки пользователь может выбрать интересующую его рубрику и получить всю подборку до­кументов или их частей, которые были предварительно отобраны экспер­том.

Чаще всего в основе таких классификаторов лежит предмет правового ре­гулирования, «тема» документа. При этом классификатор представляет собой систему юридических понятий (рубрик, ключевых слов, дескрипторов), отра­жающих содержание актов, которые составляют информационный массив.

В зависимости от расположения рубрик классификаторы можно раз­делить наиерархические и алфавитные.

В первой разновидности классификаторов рубри­ки расположены в иерархическом порядке, от общего к частному. Такое расположение рубрик более традиционно, оно напоминает оглавление книги и понятно абсолютному большинству пользователей. В разных базах данных используются различные классификаторы этой разновидно­сти: Общеправовой классификатор отраслей законодательства (ОКОЗ), его модификации или другие независимые разработки.

Классификаторы второй разновидности составлены на основе специаль­ных словарей, состоящих из юридических понятий, расположенных уже в ал­фавитном порядке.

Каждая из этих разновидностей классификаторов (чаще вторая) мо­жет усложняться путем уточнения и увеличения количества юридиче­ских понятий, составляющих классификатор. Рубрики могут состоять из некоторого набора терминов и представлять собой описание определен­ной ситуации. Такие ситуации, как правило, очень многочисленны и тре­буют определенного поискового аппарата.

Основной проблемой при использовании для поиска документов спе­циализированных классификаторов является то, что предварительная обработка документов происходит «вручную», то есть рубрицирование документов проводится конкретными специалистами компаний — разра­ботчиков СПС. Разумеется, такая работа не может полностью исключать ошибок, допускает субъективные решения при рубрикации и т.п. Отме­тим, что основное преимущество этого поиска — точное попадание в не­обходимый документ или даже норму — одновременно является и потенциальным недостатком, так как «точная» ссылка может быть про­ставлена ошибочно. К тому же чем детальнее проводится рубрицирова­ние, тем больше вероятность ошибок.

2.6 Дополнительные сервисные возможности

Программные технологии высокого уровня, кроме непосредственного поиска документов, обычно включают некоторые очень полезные сервис­ные инструменты. Отметим ряд возможностей, реализованных в систе­мах КонсультантПлюс.

• Возможность создавать собственные постоянные подборки доку­ментов по какой-либо проблеме (так называемые папки документов). При этом поиск возможен как по всей базе, так и по конкретным пап­кам. Пользователи, работающие на различных компьютерах, могут обмениваться такими папками. Это позволяет организовать коллек­тивную работу нескольких специалистов над общей проблемой.

• Возможность ставить закладки в тексте, что удобно при работе с большими документами.

• Наличие гипертекстовых связей между документами, позволяющих нажатием одной клавиши переходить из одного документа в другой.

• Экспорт документов в текстовый редактор Microsoft Word с уни­кальной возможностью конвертации текстовых таблиц в «раздвиж­ные» таблицы редактора, готовые к заполнению.

Заключение.

Информатика - это комплексная, техническая наука, которая систематизирует приемы создания, сохранения, воспроизведения, обработки и передачи данных средствами вычислительной техники, а также принципы функционирования этих средств и методы управления ними.

Основной задачей информатики как науки - это систематизация приемов и методов работы с аппаратными и программными средствами вычислительной техники. Цель систематизации состоит в том, чтобы выделять, внедрять и развивать передовые, более эффективные технологии автоматизации этапов работы с данными, а также методически обеспечивать новые технологические исследования. наиболее важный ресурс современного производства: он снижает потребность в земле, труде, капитале, уменьшает расход сырья и энергии

Информацию следует считать особым видом ресурса, при этом имеется в виду толкование «ресурса» как запаса неких знаний материальных предметов или энергетических, структурных или каких-либо других характеристик предмета. В отличие от ресурсов, связанных с материальными предметами, информационные ресурсы являются неистощимыми и предполагают существенно иные методы воспроизведения и обновления, чем материальные ресурсы. В связи с таким взглядом центральными становятся следующие свойства информации: запоминаемость, передаваемость, преобразуемость, воспроизводимость, стираемость.

Наши рекомендации