Выявление вторжений. Аудит системы защиты.
Типология поисковых задач.
В зависимости от характера задачи основной деятельности пользователя по степени соотношения известного/неизвестного в предмете поиска можно выделить три типа поисковых задач. К задачам первого типа относится поиск объекта, когда известно, что этот объект существует (например, поиск фактографии или трудов конкретного автора). Знания пользователя об искомом объекте полные, цель поиска – найти его документальное представление. Модель такого «атрибутивного» поиска может быть представлена как логическое выражение над именами понятий, задаваемыми терминами или их комбинациями. Второй тип задач – подбор информации по некоторой теме, например, для обзора научной проблемы, обоснования или поиска метода решения научной или практической задачи. Пользователь, уже обладая знаниями, определяет место задачи (как вновь вводимое понятие в системе уже известных понятий), ищет документы, содержащие материал, с необходимой полнотой раскрывающий новую для него тему, или дающий возможность построения нового метода решения задачи. Поисковая модель в этом случае – это частично известные понятия, связи или комбинации. Тематический поиск реализуется как последовательность атрибутивных поисков, каждый из которых соответствует определенному (априорно заданному) аспекту представления объекта поиска. Третий тип задач представляет собой проблемный поиск, который, по сути, является основной составляющей творческого процесса определения путей решения профессиональной задачи пользователя. Здесь изначально отсутствует четкость структуры знания: пользователь располагает отдельными фактами, возможно, не имеющими между собой доказанных связей. Проблемный поиск – это нахождение описаний объектов или их составляющих, актуально или потенциально существующих, и в совокупности, возможно, образующих целое, свойства которого возможно будут больше суммы свойств частей. То есть этим свойствам в явной форме могут не соответствовать «собственные» атрибуты, а новое свойство, например, может быть задано комбинацией уже известных атрибутов. Логическая поисковая модель для этого случая – поиск «похожих» документов, содержание которых некоторым образом ассоциируется с задачей пользователя.
Поиск направлен на локализацию (снятие) неопределенностей следующих видов.
Процесс поиска - последовательное изменение состояний (этапов) взаимодействующих подсистем (человека и автоматизированной информационно-поисковой системы), направленное на локализацию (снятие) неопределенностей следующих видов:
1) неопределенности соотношения «известного/неизвестного» в предмете
поиска (свойственна реальной Информационной Потребности);
2) неопределенности системы характеристических признаков для
структуризации предмета поиска (свойственна осознанной ИП);
3) лексической неопределенности, как фактора степени соответствия
информационно-поискового языка естественно-научному языку
предметной области (свойственна выраженной ИП);
4) неопределенности критериев сравнения поисковых образов
(адекватность формальных мер близости, реализованных в конкретных
автоматизированных информационно-поисковых системах);
5) неопределенности интерпретации поисковых образов документа
(субъективность и неполнота реконструирования пользователем смысла
найденных документов);
6) неопределенность тематического соответствия и степени полноты представления проблематики в данном информационном ресурсе.
Алгоритм поиска.
. тм — набор инструкций, описывающих порядок действий
исполнителя для достижения результата решения задачи за конечное число действий. Технологии (алгоритмы) поиска основываются на двух типах организации
массива объектов поиска – прямой и инвертированной. Рассмотрим пример организации и поиска информации в традиционных библиотеках. В случае прямой организации массива (хранилища) документы могут размещаться в последовательности, никак не связываемой с порядком какой-либо классификации или алфавита, в простейшем случае – в порядке их поступления. В инвертированном массиве документы могут быть,
например, разбиты на подмножества, которые, в свою очередь, упорядочены в соответствии с некоторой классификацией и обозначены идентификаторами.
Увеличение полноты поиска.
1) дополнительным индексированием документа (вплоть до индексирования несколькими методами каждого поля документа, включая полный текст);
2) расширением запроса за счет близкой по смыслу лексики, выбираемой пользователем или системой из дополнительных (метаинформационных) справочников, таких, как словари синонимов, тезаурусы;
3) использованием многостадийных итеративных процедур и/или нескольких механизмов поиска;
4) снижением точности запроса или порога выдачи, что позволяет, занижая требования к степени смыслового соответствия, увеличить вероятность попадания в выдачу истинно релевантных документов. Очевидно, что при этом в выдачу попадет во много раз больше нерелевантных документов и пользователь должен будет потратить больше времени на отбор истинно релевантных, но в некоторых случаях, этот вариант является единственно возможным для получения удовлетворительного результата.
Увеличение точности поиска.
1) использованием для индексирования словосочетаний, обычно дескрипторов ИПТ или
словосочетаний, приведенных к нормализованной форме;
2) использованием при построении поискового образа документа и/или запроса статистики словоупотреблений и/или лингвистических процессоров, что позволяет «взвешивать» термины;
3) использованием сложных критериев отбора, дифференциально учитывающих роль и
значимость терминов и терминологических конструкций;
4) использованием постобработки, упорядочивающей документы для просмотра, что
позволяет сократить время пользователя.
Запросы.
Пользовательский интерфейс представляет собой страницу с активизирующимися ссылками и строкой формирования запроса. Запрос – это фраза или ключевые слова, которые пользователь записывает в строке поиска. Результатом активизации поиска становится список документов. Поиск может быть простым и расширенным. Функцию уточнения запроса активизирует команда “искать в найденном”. При наличии нескольких наиболее популярных поисковых систем (Google, Яндекс и другие) для журналиста наиболее функциональной и полезной является система Альта Виста, которая ищет информацию и на русском, и на ряде иностранных языков, а также позволяет формулировать наиболее подробные запросы в виде связного словосочетания.