Гибридные поисковые системы

Кроме классических индексов и каталогов в Интернет существуют и гибридные поисковые системы, в которых можно воспользоваться и индексной базой данных и структурированными тематическими каталогами. Примерами таких гибридных серверов являются excite.com, yandex.ru.

Онлайновые справочники

Эти справочники также составляются людьми, но в отличие от Web-каталогов в них чаще всего отсутствует внутренний поисковый механизм. Пользователям приходится самостоятельно искать на сервере нужную информацию. Следует отметить, что в настоящее время таких онлайновых справочников становится все меньше.

Метапоисковые системы

Если попробовать отыскать нужную информацию с использованием нескольких поисковых серверов, то, скорее всего, обнаружится, что каждый из них нашел по ключевым словам набор документов, достаточно отличающийся друг от друга. Это связано с различными методами сбора информации и алгоритмами ведения индексной базы, заложенными в основе работы каждого сервера.

Поиск информации с последовательным использованием различных поисковых механизмов ведет к большим затратам времени. Стремление облегчить решение рассматриваемой задачи дало толчок развитию систем параллельного поиска, когда можно одновременно обратиться к целому ряду поисковых машин с одной страницы вашего браузера.

Подобный сервис получил название метапоисковые системы (metasearch engines). В простейшем варианте метапоисковые системы являются всего лишь интерфейсными программами, предоставляющими на одной странице одновременный доступ к нескольким серверам, где можно поочередно вводить ключевые слова в поисковом окне каждого из представленных поисковых серверов.

В Интернет существует достаточно большое число независимых метапоисковых серверов. Типичным представителем таких серверов является узел metasearch.com, однако простейшие метапоисковые серверы позволяют всего лишь сэкономить время для установки доступа к каждому из серверов в отдельности, не решая самой задачи параллельного поиска. Кроме рассмотренных, существуют также системы для поиска файлов (files.ru), людей (whowhere.com) и т. д.

Сегодня в WWW находятся около двух десятков лидирующих и активно конкурирующих между собой поисковых систем, а общее число поисковых серверов приближается к тысяче. В последние годы все большую популярность приобретают специализированные (тематические) поисковые механизмы, например, англоязычные системы поиска медицинской информации www.medexplorer.com, www.mwsearch.com, www.rxlist.com, русскоязычный медицинский тематической каталог www.medpoisk.ru, или англоязычный тематический каталог, посвященный медицинскому образованию – www.mededucation.com.

4.3. ПОИСКОВЫЕ СИСТЕМЫ ОБЩЕГО НАЗНАЧЕНИЯ

Ниже кратко описаны 2 поисковые системы.

4.3.1. Google (www.google.com)

Содержит наибольшее количество проиндексированных страниц. Имеет простой интерфейс, результаты отличаются высокой релевантностью. Определяет язык пользовательского компьютера и выдает интерфейс на нужном языке. Очень хорошо проиндексирован русскоязычный Internet. Возможности поиска на русском языке.

Гибридные поисковые системы - student2.ru

4.3.2 Yandex (www.yandex.ru)

В ходе выполнения практической части Вы ознакомитесь с механизмом поиска информации одной из поисковых систем – системой Yandex.

Гибридные поисковые системы - student2.ru

Yandex обладает развитым языком запросов, позволяющим осуществлять тонкий поиск. Для того, чтобы воспользоваться широким спектром возможностей, используйте страницу "расширенный поиск", где большая часть настроек Yandex задается простым образом.

Искомые слова. Здесь вы можете указать, какие слова обязательно должны встретиться в документе, каких быть не должно, а какие желательны (то есть могут быть, а могут не быть). Зоной поиска слова может быть как текст документа (слова находятся в одном предложении или всем документе), так и его заголовок, аннотация (тэг description), ссылка (подпись URL) или адрес (сам URL).

Страницы. Yandex умеет определять язык документа. Вы можете задать язык документа, где надо провести поиск: русский (кириллица) или не русский. В базе Yandex находятся только документы русскоязычного Интернета (по умолчанию в поисковую машину вносятся сервера в доменах su, ru, am, az, by, ge, kg, kz, md, tj, ua, uz), а также зарубежные сайты, представляющие интерес для русскоязычного поиска. Так же вы можете указать ограничение выдачи документов по дате и формат документа.

Внизу страницы вы можете посмотреть ваш запрос и все указанные параметры.

Гибридные поисковые системы - student2.ru

4.4. СОВЕТЫ ПО ПОИСКУ

Старайтесь использовать более конкретные запросы. Ищите больше, чем по одному слову. Слова "медицина" или "здоровье" дадут при поиске поодиночке большое число бессмысленных ссылок. Добавьте одно или два ключевых слова, связанных с искомой темой. Например, "традиционная медицина" или "психическое здоровье". Рекомендуем также сужать область вашего вопроса. Если вы интересуетесь лекарственными препаратами, то запрос "селективные бета-блокаторы" выдаст более подходящие документы, чем просто "блокаторы".

Проверяйте орфографию. Если поисковая машина не нашла ни одного документа, то вы, возможно, допустили орфографическую ошибку в написании слова. Проверьте правильность написания. Если вы использовали при поиске несколько слов, то посмотрите на количество каждого из слов в найденных документах (перед их списком после фразы "Результат поиска"). Какое-то из слов не встречается ни разу? Скорее всего, его вы и написали неверно.

Используйте синонимы. Если список найденных страниц слишком мал или не содержит полезных страниц, попробуйте изменить слово. Например, вместо "рефераты" возможно больше подойдет "курсовые работы" или "сочинения". Попробуйте задать для поиска три-четыре слова-синонима сразу. Для этого перечислите их через вертикальную черту (|). Тогда будут найдены страницы, где встречается хотя бы одно из них. Например, вместо "фотографии" попробуйте "фотографии|фото|фотоснимки".

Не пишите заглавными буквами. Начиная слово с заглавной буквы, вы не найдете слов, написанных с прописной буквы, если это слово не первое в предложении или не имя собственное. Поэтому не набирайте обычные слова с Заглавной Буквы, даже если с них начинается ваш запрос поисковой системе. Заглавные буквы в запросе рекомендуется использовать только в именах собственных. Например, "телепередача Здоровье".

Найти похожие документы. Если один из найденных документов ближе к искомой теме, чем остальные, нажмите на ссылку "найти похожие документы". Ссылка расположена под краткими описаниями найденных документов. Поисковая система проанализирует страницу и найдет документы, похожие на тот, что вы указали.

Используйте знаки "+" и"-". Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минуса. И наоборот, чтобы определенное слово обязательно присутствовало в документе, поставьте перед ним плюс. Обратите внимание, что между словом и знаком плюс или минус не должно быть пробела. Плюс стоит использовать в том случае, когда нужно найти так называемые стоп-слова, которые могут игнорироваться поисковым механизмом (в основном это местоимения, предлоги, частицы) Чтобы найти цитату из Гамлета, надо задать запрос "+быть или +не быть".

Попробуйте использовать язык запросов. С помощью специальных знаков вы сможете сделать запрос более точным. Например, укажите, каких слов не должно быть в документе, или что два слова должны идти подряд, а не просто оба встречаться в документе. Для этого можно использовать страницы расширенного поиска. Во многих случаях они помогают проводить углубленный поиск без знания синтаксиса запросов.

Искать без морфологии. Вы можете заставить поисковую систему не учитывать формы слов из запроса при поиске. Например, запрос !иванов найдет только страницы с упоминанием этой фамилии в мужском роде, а не города "Иваново", или фамилии Иванова в женском роде.

Ищите на нескольких серверах. Если на одном сервере ничего нужного не найдено, пробуйте искать на другом, третьем.

Сохраняйте найденную информацию, как на диск, так и при помощи закладок, созданных через меню Избранное.

Глобальный поиск информации в Internet производится не только по Web-страницам, но и по telnet-базам данных, телеконференциям и другим источникам информации. Для осуществления такого поиска необходимо знание всех основных существующих типов, ресурсов сети, понимание технических принципов их работы и особенностей доступа, а также владение предметом поиска.

В этой главе намеренно опущено описание поиска адресов E-mail, поиск в телеконференциях и т. д., т. к., освоив стандартные методики поиска, вы сможете без труда искать подобные материалы без чьих-либо советов.

ГЛАВА 5

Наши рекомендации