Поисковые системы и каталоги
Очень тяжелы первые шаги в Интернете. В Сеть мало войти, надо еще и знать, где и что можно отыскать. Волшебников, которые все знают и могут помочь вам ориентироваться в безбрежном море информации, хранящейся в недрах Всемирной сети, зовут Поисковыми Системами, или проще — поисковиками. Такие системы условно можно разделить на два типа, и первыми из них являются общедоступные поисковые системы, представляющие собой сайты, специализирующиеся на поиске и предоставлении по запросу пользователя любой интересующей его информации. Эти системы, в свою очередь, можно разделить на два подкласса — собственно поисковые системы (ПС), которые содержат в себе три основных компонента: поисковый робот, то есть программа, которая регулярно осуществляет сканирование максимально возможного количества доступных ей web-сайтов и заносит информацию о странице в индексы системы; индекс системы — основная база данных ПС, где хранятся преобразованные особым образом текстовые составляющие всех посещенных роботом html-страниц и прочих файлов и, наконец, система поиска — программа, которая обрабатывает запрос пользователя, находит в индексе документы, отвечающие критериям запроса, и выводит список найденных документов в определенном порядке. Кроме непосредственно ПС, в сети существуют и так называемые «рубрификаторы», или каталоги, представляющие из себя базы данных, в которые информация о новых сайтах вносится и обрабатывается операторами вручную. И тот, и другой сервисы имеют как достоинства, так и недостатки. Например, достоинства каталогов вытекают из ручной природы их пополнения, поэтому каждый сайт в базе данных каталога строго соответствует тематике раздела, в отличие от ПС, где робот производит анализ содержимого искомых сайтов по формальным признакам, что не всегда дает правильный результат. Кроме этого, при поиске в каталоге Вы можете перемещаться по рубрикам, разделам, подразделам и т.д. для того, чтобы получить ссылки, в максимальной степени соответствующие Вашим интересам. В то же время автоматические роботы ПС более оперативно отслеживают появление новых или исчезновение старых сайтов, а также изменение их наполнения. Поэтому в последнее время появилась тенденция к объединению достоинств обоих классов поисковиков в единые системы, которые, объединяя лучшие качества обеих систем, дополненные еще и рядом вспомогательных функций, превращаются в универсальные порталы, предназначенные как для входа пользователей в сеть, так и для обеспечения большинства их потребностей в различной информации.
Современные поисковые системы обрабатывают заявки пользователей на основе «запросов» — одного или нескольких слов, характеризующих искомую информацию. Большинство современных ПС имеют возможность применения простого запроса, когда в качестве поискового критерия вводится предложение на естественном языке, после чего система производит его нормализацию и только после этого приступает к его выполнению. Язык такого запроса достаточно прост: все слова следует вводить через пробел, допускается использование логических операторов AND, OR либо NOT (последний поддерживается не всеми системами). Более изощренной методикой поиска является использование расширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с поисковым механизмом. В этом случае используются дополнительные логические операторы, позволяющие более определенно сформулировать запрос. По последним данным, среди ПС у российских пользователей наибольшей популярностью пользуется Яндекс, причем его отрыв от делящих 2–3 места Рамблера и Аппорта превышает 20%, и все они значительно оторвались от идущих следом лучших зарубежных ПС — Google, Yahoo! и Alta Vista. В категории каталогов отрыв лидера, Rambler’s Top 100, имеющего популярность, превышающую 50%, от преследователей — просто подавляющий.
В пятерку лучших входят также российские системы List.ru, Апорт, Яndex и Пингвин. Лучший же зарубежный каталог, Yahoo!, находится лишь на 7-м месте.