Поиск информации с сети Интернет
Работа в сети Интернет практически всегда связана с необходимостью получения информации. Для этой цели служат различные системы поиска. Поисковые системы разрабатывались давно и с различными целями. В свое время даже выделяли специальный класс систем обработки информации – информационно-поисковые системы (ИПС). По мере развития систем управления базами данных информационный поиск как самостоятельное направление перестал разрабатываться, так как поиск данных в базах стал неотъемлемым элементом любой СУБД. С появлением Интернет положение изменилось – теперь данные нужно искать не в одной конкретной базе данных, а мировом информационном пространстве, что представляет собой гораздо более сложную задачу.
В последние несколько лет появились довольно удачные поисковые системы. Так как такие системы призваны обслуживать различные запросы, их принято называть поисковыми серверами. Они позволяют находить информацию в Web-страницах, в группах новостей и хранилищах файлов.
Стратегия современных поисковых серверов базируется на трех основных подходах:
§ создание индексов;
§ создание каталогов;
§ гибридный метод.
Поддержка Web-индексов предполагает создание и непрерывное пополнение огромной базы данных по индексируемым документам. Под индексами понимают специальные таблицы, которые указывают на место расположения (адреса Web-узлов) разнообразных терминов во всемирной сети. Сбор информации выполняется автоматически программами - роботами, которые просматривают серверы сети Интернет, анализируют встречающиеся в них слова и выполняют индексирование. В качестве примеров таких систем можно привести следующие системы:
Alta Vista | ® | http://altavista.digital.com ; |
HotBot | ® | http://www.hotbot.com; |
Open Text | ® | http://www.opentext.com . |
Поисковые системы этого типа обладают очень большими базами данных и высокой скоростью обработки запросов. Однако эффективность информационного поиска зачастую оказывается недостаточной.
Поисковые серверы, реализованные по принципу создания каталогов, формируются людьми, которые сами просматривают Web-узлы, читают электронную почту и телеконференции. Собранная таким образом информация помещается в тематические каталоги. Примером подобных систем могут служить системы:
Yahoo! | ® | http://www.yahoo.com; |
Magellan | ® | http://magellan.com. |
Качество таких поисковых серверов значительно выше. Кроме того, Web-каталоги имеют также внутренний поисковый механизм, который позволяет локализовать поиск по теме.
В гибридных системах поиска можно воспользоваться как индексной базой данных, так структурированными тематическими каталогами. Примером могут служить системы:
Lycos | ® | (http://www.lycos.com); |
Excite | ® | (http://www.excite.com); |
WebCrawler | ® | (http://www.webcrawler). |
Справочные системы отличаются от поисковых систем тем, что в них отсутствует внутренний механизм поиска. Примером справочных систем могут быть:
BigBook - тематический справочник | ® | (http://www.bigbook.com); |
Hoovers - алфавитный классификатор | ® | (http://www.hoovers.com). |
Стремление облегчить задачу поиска информации дало толчок к развитию систем параллельного поиска, называемых метапоисковыми системами.
В простейшем случае метапоисковые системы — программы, которые предоставляют доступ поочередно к нескольким серверам. Пример такой системы: http://home.microsoft.com/intl/ru/access/allinone.asp.
Процесс поиска во многих поисковых системах имеет приблизительно следующий алгоритм:
§ выполняется переход на начальную страницу поисковой системы, на которой находятся поля для формирования запроса или кнопка для выполнения начала поиска;
§ уточняется область поиска (наука, искусство, медицина, новости и т.д.);
§ вводится запрос на поиск в соответствии с правилами, принятыми в выбранной системе поиска. Возможно уточнение параметров запроса;
§ нажимается кнопка для начала поиска;
§ после появления на экране результатов поиска выполняется просмотр информации и сохранение наиболее важных для пользователя данных на диске.
Поиск информации при выполнении запроса выполняется не непосредственно в Интернет, а в базе данных поисковой системы. Возможно, что информация в первоисточнике уже не совпадает с информацией базы данных. Для минимизации этого несовпадения поисковые системы постоянно обновляют свои базы данных. При этом существует два способа обновления информации в базах данных поисковых систем:
§ разработчик Web-страниц самостоятельно добавляет ссылку на свою страницу в поисковую систему.
§ поисковая система запускает специальную программу, называемую роботом. Робот проверяет существование ранее найденных и наличие новых документов.
Для поиска информации с помощью поисковой системы Alta Vista, которая имеет на сегодняшний день самую большую базу данных и быстрый механизм поиска, необходимо:
§ установить связь с поставщиком услуг Интернета;
§ запустить программу Internet Explorer или другую программу навигации;
§ нажать кнопку Поиск. На экране появится список поисковых систем с полем запроса для поиска информации.
§ ввести информацию для запроса в поле ввода поисковой системы Alta Vista.
На рис.8.5 показан основной экран системы Alta Vista.
Рис. 8.5. Окно поисковой системы AltaVista
В большинстве случаев достаточно бывает простых запросов. Однако данная система реализует и сложный запрос, для которого используются логические операторы и синтаксические выражения. Синтаксические выражения – это любые слова и словосочетания или фразы. Над синтаксическими выражениями допустимы логические операции с помощью следующих логических операторов:
And | — | логическое ИЛИ; |
Or | — | логическое И; |
Near | — | аргументы, присутствующие в запросе, отстоят друг от друга в документе не более чем на десять символов; |
Not | — | обеспечивает отсутствие аргумента в документе. |
Alta Vista — это только одна из многих поисковых систем международного уровня с интерфейсом на английском языке, которая поддерживает поиск по проиндексированным страницам, поиск графических изображений, аудио- и видеоинформации, а также обширный тематический каталог.
Большой популярностью пользуется поисковая система Rambler (http://www.rambler.ru/) (рис.8.6), которая была изначально создана для возможности поиска по русскоязычным серверам и состоит из двух частей: поисковой программы-робота и базы данных. Первая часть является роботом, который может получать адреса документов через прокси-сервер или непосредственно с указанного узла, индексирует содержание документа и помещает результаты этого индексирования в базу данных.
Второй частью Rambler является собственно сама поисковая система. Она поддерживает различные логические операции между словами, а также усечения слов с помощью метасимволов. Пользователь может определить выходной формат документов, максимальное количество результатов поиска и т. д.
Rambler предоставляет информационные разделы по основным сферам человеческой деятельности - экономике, налогам, финансам, компьютерам, ценам, курсам валюты, политике и так далее..
Для поиска информации в русскоязычной части Интернет сегодня работает несколько систем, которые в значительной мере удовлетворяют потребности пользователей Интернет Росcии и стран ближнего зарубежья. К числу наиболее известных, кроме Rambler (http://www.rambler.ru/), относятся Апорт-2000 (http://www.aport.ru/), Яndex (http://www.yandex.ru/).
Рис. 8.6. Окно поисковой системы Rambler
Для получения адекватного результата поиска необходим опыт и соблюдение некоторых основных правил:
§ правильное правописание ключевых слов, используемых в запросе;
§ использование синонимов ключевых слов для расширения пространства поиска;
§ использование опций расширенного поиска, где действуют специальные синтаксические правила для применения булевых операций над ключевыми словами, предусматривается различие прописных и строчных букв, предлагается выбор способов ранжирования найденных документов и т. д.
Упражнение | |
Выполните поиск информации по теме «Маркетинг», используя различные поисковые системы. Проанализируйте результаты поиска. Объясните, почему результаты поиска с помощью различных поисковых систем оказались отличными друг от друга. |
Значительно улучшить результаты поиска помогают метапоисковые системы. В простейшем варианте метапоисковые системы являются всего лишь интерфейсными программами, предоставляющими на одной странице одновременный доступ к нескольким серверам, где Вы можете поочередно вводить ключевые слова в текстовом окне каждого из представленных поисковых серверов. В браузере Internet Explorer 6.0 предусмотрен легкий доступ и метапоисковой странице, расположенной на сервере Microsoft (http://home.microsoft.com/intl/ru/access/allinone.asp).Здесь находятся окна для ввода ключевых слов и поиска на следующих серверах:
1. Excite.
2. Yahoo! (Web-каталог).
3. Rambler.
4. Aport.
5. Yandex.
Пользователю Internet Explorer 6.0 достаточно лишь загрузить данную страницу, нажав кнопку Поиск (Search) на панели инструментов, выбрать поисковый cервер, и введя одно или несколько ключевых слов, нажать кнопку Поиск (Search).
В Интернет существует достаточно большое число независимых метапоисковых серверов: AccuFind SearchService(http://accufind.com/), SuperSearch Service (http://www.robtex.com/search/query.htm), MetaSearch (http://metasearch.com/).
Однако простейшие метапоисковые серверы позволяют всего лишь сэкономить время, необходимое для установления доступа к каждому из серверов в отдельности, не решая самой задачи параллельного поиска. Реальный одновременный поиск документов по целому ряду поисковых машин с выдачей совокупных результатов поиска обеспечивают сегодня несколько наиболее развитых метапоисковых серверов, одним из лидеров которых признан WebCompass фирмы Quaterdeck Corp.
Примечание | |
Количество систем поиска информации в Web очень велико. Наиболее правильным шагом на первом этапе является выбор одной или нескольких систем поиска и доскональное изучение их возможностей. Чем лучше вы изучите систему, тем эффективней будут результаты поиска. |
Информационные ресурсы
Поисковые системы являются отправной точкой для нахождения требуемой информации. Вместе с тем существует достаточное количество ресурсов Интернет по экономике, финансам, маркетингу, основам бизнеса в Интернет. Использование их может в значительной степени повысить эффективность поиска как в отношении затраченного времени, так и по качеству отобранного материала.
Общие и специализированные информационные ресурсы | |
http://www.forrester/com/ | Сайт исследовательской компании Forrester Research, выполняющей всесторонний анализ мировой Интернет-экономики |
http:/www.comcon-2/com/ | Сайт независимого профессионального исследовательского агентства Comcon2, выполняющего анализ рынка и средств массовой информации. |
http://www.m4u/ webprovider.com | Оценки и прогнозы ведущих исследовательских компаний по развитию различных направлений 'электронной коммерции. |
http://www.k2kapital.com/ | Информационно-аналитический сайт — крупнейший русскоязычный источник информации о зарубежных финансовых рынках. |
http://www.i-m.kiev.ua/ | Публикации, посвященные вопросам маркетинга в Интернет. |
http://www.rbc.ru/ | Российское агентство финансовой информации "РосБизнесКонсалтинг". |
http://www.finmarket.ru/ | Информационное агентство "ФИНМАРКЕТ" специализируется на информационном обеспечении профессионалов, работающих на финансовом рынке. |
http://www.cyberplat.com/ | Интегрированная платежная система CyberPlat. |
http://www.raexpert.ru/ | Рейтинговое Агентство "Эксперт РА", обеспечивающее информационно-аналитическою поддержку компаниям, работающим на российском рынке. |
http://www.e-management.ru/ | Консультационный центр развития электронного бизнеса. |
http://www.marketing.cfin.ru/ | Энциклопедия маркетинга |
Контрольные вопросы
1. Назовите основные этапы истории возникновения и развития сети Интернет.
2. Перечислите основные аппаратные и программные компоненты вычислительной сети.
3. Какой смысл вкладывается в термин «протокол»?
4. Что понимают под адресом в Интернет?
5. Что понимают под аббревиатурой TCP/IP?
6. Что понимают под IP-адресом?
7. Что понимают под DNS-именами?
8. Как передается и принимается информация в сети Интернет?
9. В чем состоит основная функция провайдера?
10. В чем особенность среды, которую принято называть WWW?
11. Что понимается под гипертекстом?
12. Перечислите основные виды сервиса, предоставляемого в сети Интернет.
13. Что общего и в чем состоит различие обычной и электронной почты?
14. Что представляет собой адрес электронной почты?
15. В чем особенность телеконференций?
16. В чем особенность сервиса IRC?
17. Что обозначают старшие элементы доменных имен?
18. Что понимают под URL-адресом?
19. Какой тип набора номера в основном используется в нашей стране?
20. Какие программы-навигаторы наиболее популярны в настоящее время?
21. Какие программы входят в состав Internet Explorer?
22. Как устанавливается объем памяти для временных файлов Internet Explorer?
23. В чем состоит назначение журнала Internet Explorer?
24. Как сохранить найденную в сети Интернет информацию?
25. Каким образом можно быстро вызвать недавно использованный адрес?
26. Зачем может потребоваться отключать загрузку аудио и видеоэффектов? Как это сделать?
27. Что понимают под автономной работой Internet Explorer?
28. Как изменить кодировку во время просмотра страницы?
29. В чем состоит основное назначение программы MS Outlook Express?
30. При подготовке электронного письма, что вводится в строках "Кому", "Копия", "Тема"?
31. Как отправить файл вместе с письмом?
32. Как инициировать процесс отправки/приема электронной почты?
33. Какие папки для почтовых сообщений поддерживает MS Outlook Express?
34. Как быстро ответить автору письма?
35. Что хранится в адресной книге?
36. Как добавить информацию в адресную книгу?
37. Как воспользоваться адресной книгой при подготовке потовых сообщений?
38. Что значит "подписать электронное письмо"?
39. Что понимают под телеконференциями?
40. Каких типов бывают поисковые серверы?
41. В чем состоит отличие индексов от каталогов?
42. Как работают программы-роботы?
43. Какие системы называют метапоисковыми? В чем их особенность?
Приведите примеры поисковых серверов различного типа?
Заключение
В этой главе были рассмотрен материал, который является, по сути, введением в Интернет. Мы познакомились со следующими основными вопросами:
§ История развития сети Интернет,
§ Сервисы сети Интернет.
§ Программное обеспечение для работы в сети Интернет.
§ Поиск информации в сети Интернет.
Знание и грамотное использование этих разделов, является основой для реализации маркетинговой деятельности в сети Интернет. От того, насколько полной будет Ваша информация о клиентах, партнерах и конкурентах, как быстро вы будете реагировать на события в мировой экономике и тенденции ее развития, зависит успех Вашей фирмы.
Список литературы, рекомендуемой к Главе 8
1. Новейшая энциклопедия Интернет. — М.: ОЛМА-ПРЕСС,2002.—607 с.:ил.
2. Принципы функционирования Интернета.—Спб.:Питер,2002.—384 с.:ил.