Основы поиска информации в сети Интернет

Поисковый запрос может состоять из одного или не­скольких слов, в нем могут присутствовать знаки препи­нания. Составлять простые запросы можно, и не вдаваясь в тонкости языка запросов. Так, если ввести в поисковую строку несколько слов без знаков препинания и логичес­ких операторов, будут найдены документы, содержащие все эти слова (причем на ограниченном расстоянии друг от друга).

Регистр

В общем случае регистр написания поисковых слов и операторов значения не имеет, то есть дом и ДОМ, Not и nOt воспринимаются одинаково. И лишь иногда в целях повышения качества поиска регистр слов поискового зап­роса принимается во внимание.

Например, если запрос состоит из двух, трех или четы­рех слов, каждое из которых написано с большой буквы, то предполагается поиск по имени собственному, и авто­матически производится изменение ограничения расстоя­ния между словами запроса со значения по умолчанию на величину (п - 1) • 2, где п — количество слов запроса. Это позволяет находить группу слов запроса, внутри которой есть не более одного «лишнего» слова или знака препина­ния, например «Санкт-Петербург», «Л. Толстой».

Операторы

Запрос, состоящий из нескольких слов, может содер­жать операторы. Поиск операторов в документе не произ­водится, они служат лишь инструкцией поисковой маши­не. Все операторы поисковой машины бинарные, то есть имеют левую и правую часть, каждая из которых также является запросом (по умолчанию состоящим из одного слова). Для изменения сферы действия операторов (груп­пировки нескольких слов запроса в аргумент оператора) применяются скобки и кавычки.

Два запроса, соединенные оператором AND (логичес­кое И), образуют сложный запрос, которому удовлетворя­ют только те документы, которые одновременно удовлет­воряют обоим этим запросам. Иными словами, по запросу «город AND деревня»найдутся только те документы, которые содержат и слово «город»,и слово «деревня».

Сложному запросу, состоящему из двух запросов, со­единенных оператором OR (логическое ИЛИ), удовлетво­ряют все документы, удовлетворяющие хотя бы одному из этих двух запросов. По запросу «город OR деревня»найдутся документы, в которых есть хотя бы одно из слов «город»или «деревня»(либо оба эти слова вместе).

Оператор NOT (логическое И-НЕ) образует запрос, кото­рому отвечают документы, удовлетворяющие левой части запроса и не удовлетворяющие правой. Так, результатом поиска по запросу «город NOT деревня»будут все докумен­ты, в которых есть слово «город»и нет слова «деревня».

Если оператор явно не указан, используется оператор по умолчанию AND: находятся только документы, содер­жащие все слова запроса. Так, запрос «информация тех­нологии кредит»будет истолкован как «информация AND технологии AND кредит».На странице Расширенного поиска оператор по умолчанию можно заменить на OR (Искать слова запроса: хотя бы одно).

Поисковые машины (search engines)

Машины веб-поиска - это серверы с огромной базой данных URL-адресов, которые автоматически обращаются к страницам WWW по всем этим адресам, изучают содержимое этих страниц, формируют и прописывают ключевые слова со страниц в свою базу данных (индексирует страницы).

Более того, роботы поисковых систем переходят по встречаемым на страницах ссылкам и переиндексируют их. Так как почти любая страница WWW имеет множество ссылок на другие страницы, то при подобной работе поисковая машина в конечном результате теоретически может обойти все сайты в Интернет.

Именно этот вид поисковых инструментов является наиболее известным и популярным среди всех пользователей сети Интернет. У каждого на слуху названия известных машин веб-поиска (поисковых систем) – Яndex, Rambler, Aport.

Чтобы воспользоваться данным видом поискового инструмента, необходимо зайти на него и набрать в строке поиска интересующее Вас ключевое слово. Далее Вы получите выдачу из ссылок, хранящихся в базе поисковой системы, которые наиболее близки Вашему запросу. Чтобы поиск был наиболее эффективен, заранее обратите внимание на следующие моменты:

§ определитесь с темой запроса. Что именно в конечном итоге Вы хотите найти?

§ обращайте внимание на язык, грамматику, использование различных небуквенных символов, морфологию. Важно также правильно сформулировать и вписать ключевые слова. Каждая поисковая система имеет свою форму составления запроса — принцип один, но могут различаться используемые символы или операторы. Требуемые формы запроса различаются также в зависимости от сложности программного обеспечения поисковых систем и предоставляемых ими услуг. Так или иначе, каждая поисковая система имеет раздел "Help" ("Помощь"), где все синтаксические правила, а также рекомендации и советы по поиску, доступно объясняются (скриншот страничек поисковиков).

§ используйте возможности разных поисковых систем. Если не нашли на Яndex, попробуйте на Google. Пользуйтесь услугами расширенного поиска.

§ чтобы исключить документы, содержащие определенные термины, используйте знак "-" перед каждым таким словом. Например, если Вам нужна информация о работах Шекспира, за исключением "Гамлета", то введите запрос в виде: "Шекспир-Гамлет". И для того, чтобы, наоборот, в результаты поиска обязательно включались определенные ссылки, используйте символ "+". Так, чтобы найти ссылки о продаже именно автомобилей, Вам нужен запрос "продажа+автомобиль". Для увеличения эффективности и точности поиска, используйте комбинации этих символов.

§ каждая ссылка в списке результатов поиска содержит сниппет – несколько строчек из найденного документа, среди которых встречаются Ваши ключевые слова. Прежде чем переходить по ссылке, оцените соответсвие сниппета теме запроса. Перейдя по ссылке на определенный сайт, внимательно окиньте взглядом главную страничку. Как правило, первой страницы достаточно, чтобы понять – по адресу Вы пришли или нет. Если да, то дальнейшие поиски нужной информации ведите на выбранном сайте (в разделах сайта), если нет – возвращайтесь к результатам поиска и пробуйте очередную ссылку.

§ помните, что поисковые системы не производят самостоятельную информацию (за исключением разъяснений о самих себе). Поисковая система – это лишь посредник между обладателем информации (сайтом) и Вами. Базы данных постоянно обновляются, в них вносятся новые адреса, но отставание от реально существующей в мире информации все равно остается. Просто потому, что поисковые системы не работают со скоростью света.

К наиболее известным машинам веб-поиска относятся Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Среди русскоязычных можно выделить Яndex, Rambler, Апорт.

Поисковые системы являются самыми масштабными и ценными, но далеко не единственными источниками информации в Сети.

Каталоги (directories)

Наши рекомендации