Внешний вид поисковых страниц
Внешне главные страницы поисковиков выглядят примерно одинаково и, если не брать во внимание дополнительные сервисы, содержат одни и те же основные элементы. Они естественны и просты. Практически любой человек, попав на первую страницу поисковой системы, может начать с ней работать. Внешний вид первой поисковой страницы для поисковой машины Google показан на рисунке 10.1.
На первой странице поисковой системы мы видим основные элементы поисковых страниц:
¾ поле поиска, куда необходимо внести ключевую фразу, при помощи которой мы задаем условия поиска необходимой нам информацию;
¾ кнопка «искать», на которую надо нажать для начала поиска;
¾ таблица найденных результатов, появляющаяся после того, как поисковая машина выполнила наш запрос.
Поисковые машины не только находят страницы, но и сообщают о находках много ценной информации!
За время существования поисковых машин выработался стандарт выдачи пользователю страниц результатов поиска. Разобравшись в форме выдачи результатов одной поисковой машины, можно уверенно пользоваться остальными поисковиками.
Каждый результат поиска содержит (см. рисунок 10.2):
1. Заголовок найденной страницы.
2. Отрывок из текста страницы, по которому видно, в каком окружении (контексте) используются нужные нам слова. Искомые слова в нем, как правило, выделены жирным шрифтом или отличаются по цвету от основного текста.
3. Полный URL (“Universal Resource Locator” - адрес в сети Интернет) страницы.
4. Размер страницы, дата последнего изменения (если поисковая машина в состоянии ее определить).
Рисунок 10.1 – Первая страница поисковой машины Google
5. Ссылка на копию страницы в базе поисковой машины. Если документ был изменен или сайт временно не работает, то сохраненная в базе поисковой машины копия вам все равно дает возможность ознакомиться с найденным документом.
6. “Похожие документы”. Некоторые поисковики анализируют содержание найденных по запросу страниц и группируют их по своим, внутренним критериям. Например – по близости словарей страниц, по одинаковым заголовкам, по совпадениям фраз, по количеству синонимов. К сожалению, пока еще данные алгоритмы далеки от совершенства и в “похожих страницах” не очень часто можно найти нечто, что действительно поможет в нашем поиске.
Также, в результатах поиска вы можете увидеть
7. Рубрику каталога или рейтинга поисковой машины (если сайт участвует в каталоге или рейтинге).
Рисунок 10.2 – Один из результатов поиска на запрос «вопросы экономики» в поисковой машине Google
Интернет - гигантское хранилище информации. Множество страниц, ценных и не очень, существуют безо всякого порядка и связанны между собой только случайными ссылками, зависящими от квалификации и личных пристрастий авторов сайтов. Однако пользователю необходимо ориентироваться в этом многообразии и находить, желательно за минуты, необходимую информацию.
В Интернет существует большое количество поисковых систем. По самым скромным оценкам, их более восьми тысяч. Разумеется, важно выбрать поисковую систему, в которой вы собираетесь искать, но и не менее важно правильно сформировать запрос, тогда быстрее будет получена необходимая информация. Вопросам правильного формирования запросов и будет посвящена эта статья.
Все крупные поисковики имеют специальный язык запросов, дающий широкие функциональные возможности для детализации поиска и экономии времени. Знание операторов языка запросов не только существенно облегчит вам жизнь, но и поможет находить информацию, добыть которую только с помощью простых запросов практически невозможно.
Язык запросов - мощный инструмент, который позволяет искать информацию, учитывая следующее:
¾ только на определенном сайте (или группе сайтов);
¾ опубликованную в строго заданном временном диапазоне;
¾ опубликованные на каком-либо из языков (например, русском).
При помощи языка запросов, можно искать текст на определенных участках страниц (в ссылках, в заголовках, в ключевых словах и др.). К сожалению, не существует общепринятого стандарта для операторов языка поисковых систем. Даже для основных операций разные поисковые системы имеют разные обозначения. Некоторые из них показаны в таблице.
Таблица 6 – Обозначение основных операций на популярных поисковых системах
Операторы языка запросов | Rambler | Yandex | |
Оператор обязательного присутствия | ANDили& | &или+ | + |
Оператор отсутствия слова | NOTили! | - | - |
Оператор выбора | ORили| | | | ~ |
Разберем поподробнее каждый из трех основных операторов.
Оператор обязательного присутствияслова в результатах поиска. Все три рассматриваемые поисковые машины выполняют этот оператор по умолчанию. Или, задавая в строке поиска, например, “Булгаков Мастер Маргарита” мы требуем, чтобы поисковик находил страницу, на которой содержатся все три слова.
Оператор отсутствия слова. Найденная страница не должна содержать данное слово. Например, вы ищете книгу Булгакова, но желаете получить текст для чтения, а не предложение купить эту книгу в интернет-магазине. В этом случае логично использовать в теле запроса конструкцию "Булгаков Мастер Маргарита -заказать -магазин". Данный запрос написан на языке Yandex. В поисковой строке Rambler следовало бы написать "Булгаков Мастер Маргарита !заказать !магазин".
Оператор выбора. Удобно использовать для поиска текста, содержащего слово или его синонимы. Предположим, мы ищем тексты, содержащие упоминание о городе Волгограде. Разумно было бы, для полноты поиска, использовать и его предыдущее название – Сталинград. Вот так будет выглядеть данный запрос на языке Yandex и Rambler: “Волгоград |Сталинград”. Следует отметить, что поисковые системы первое слово считают более важным, и в первых строках результатов поиска будут идти строки с «Волгоградом», «Сталинград» же появится только на более глубоких страницах.
Многие поисковые системы позволяют использовать в запросах для группирования круглые скобки.
Другой важный оператор – кавычки, "" - оператор строго соответствия. Сочетание слов, которые вы укажете в кавычках, будет учитываться системой как единое целое, поисковик будет искать все слова именно в данном порядке и без применения морфологического склонения слов. Попробуем найти в Rambler фразу “если не я, так кто же”. Фраза эта специальная, “трудная” для поисковиков т.к. содержит многочисленные стоп-слова. Стоп-слова – это предлоги, частицы, местоимения, которые настолько часто встречаются в тексте, что поиск по ним выдавал бы миллионы страниц и поэтому они, как правило, поисковыми системами игнорируются. Итак, если мы ищем без кавычек – результат поиска выглядит совершенно нерелевантно, похоже на случайный набор страниц (может быть это страницы пользователей, оплативших рекламу на поисковой системе). Если ищем с кавычками найдено то, что нужно. Обратите внимание если не поставить запятую в этой фразе, то ищется вроде бы та же самая фраза, кавычки стоят, но не найдено ни одного документа. В чем же причина? В запятой. Поисковые системы ищут полное совпадение фразы, заключенной в кавычки, вплоть до знаков.
Более подробно с операторами языка запросов поисковых систем можно ознакомиться на специальных страницах, описывающих их работу. Использование языка запросов очень сокращает время поиска. Однако, досконально знать язык запросов совсем не обязательно! Хотя языки поисковых запросов не очень сложны, ими редко пользуются. Очень хорошо, что на многих поисковых системах существуют расширенные формы запросов, заполнив которые, вы формируете сложный запрос, даже не имея представления о синтаксисе языка поисковой машины.
Кроме того, очень полезен и поиск в ссылках. Например - вы хотите найти не пространные рассуждения о популярном интернет-пейджере icq, а скачать его. Зайдите на страницу расширенного поиска, ну например, Rambler или любой другой поисковой системы. Введите в строке поиска "icq download". Выберите “поиск в гиперссылках”. То, что вам необходимо, найдется в первых же результатах поиска.
10.6 Порядок выполнения работы
1. Внимательно изучить методические указания к лабораторной работе.
2. Получить допуск на выполнение работы у преподавателя.
3. Вызовите программу Internet Explorer.
4. В строке адрес наберите www.google.ru.
5. Найдите информацию о современных поисковых системах.
6. В строке адрес наберите www.nigma.ru.
7. Найдите аналогичную информацию.
8. Сравните результаты поиска.
9. Составьте отчет в соответствии с требованиями, предъявляемыми к оформлению отчетов.
10. Свою рабочую папку с отчетами по лабораторным работам скопировать на сервер в папку STUDENTS, в папку с номером своей группы.
10.7 Оформление отчета
1. Титульный лист в соответствии с требованиями, предъявляемыми в институте к оформлению лабораторных работ студентов.
2. Цель работы.
3. Ход работы.
4. Письменные ответы на два (по заданию преподавателя) контрольных вопроса.
5. Выводы.
10.8 Контрольные вопросы
1. Что такое поисковые машины? Назовите основные части программного комплекса.
2. Что такое каталоги? Перечислите их достоинства и недостатки
3. Перечислите классы метапоисковых систем.
4. Дайте определение интеллектуальной поисковой системы.
5. Как группируются результаты поиска в интеллектуальной поисковой системе?
6. Назовите основные элементы поисковых страниц.
7. Какие элементы содержит каждый результат поиска?
8. Назовите преимущества использования языка запросов?
9. Существует ли общепринятый стандарт для операторов языка поисковых систем?