Структура и основные принципы работы сети Интернет

ТЕМА 3

ПОИСКОВЫЕ СИСТЕМЫ

Структура и основные принципы работы сети Интернет

Сущность Интернет

Под Internet понимают глобальное сообщество мировых сетей, которые используют Интернет для обмена данными. Интернет представляет собой глобальную компьютерную сеть, содержащую гигантский объем информации по любой тематике, доступной на коммерческой основе для всех желающих, и представляющую большой спектр информационных услуг. Интернет состоит из множества компьютеров, соединенных между собой линиями связи, и установленных на этих компьютерах программ. Интернет обеспечивает обмен информацией между всеми компьютерами, которые входят в сети, подключенные к ней. Тип компьютера и используемая ими операционная система значения не имеют.

Интернет появился аналогично большинству современных информационных технологий, как военная программа, направленная на повышение устойчивости системы обороны США.

2 января 1969г. Агентство перспективных исследовательских проектов (ARPA) Министерства обороны США начало работу над проектом связи компьютеров оборонных организаций. В результате была создана сеть ARPANET. ARPANET обеспечивала связь между университетами, военными учреждениями и предприятиями оборонной промышленности. В случае разрушения одной или нескольких линий связи система должна была уметь переключаться на другие линии. Спустя некоторое время в систему были встроены программы перемещения файлов и электронная почта. Принципы ее построения в дальнейшем были использованы при создании Интернет.

Следующим этапом в развитии Интернет было создание в 1983 году сети Национального научного фонда США – NSFNET. Эта сеть объединяла научные центры. Основой сети стали пять суперкомпьютеров, соединенных между собой высокоскоростными линиями связи. Пользователи могли подключаться к сети и использовать возможности этих суперкомпьютеров.

В 1987 г. сеть NSFNET состояла из 13 центров, соединенных высокоскоростными линиями связи. Центры располагались в разных частях США. Сеть NSFNET быстро заняла место ARPANET, которая была ликвидирована в 1990г. Так появилась сеть Интернет.

Одновременно были созданы национальные сети в других странах. Они стали объединяться. В 90-х годах появился Интернет в нынешнем виде. Сейчас internet объединяет тысячи разных сетей, расположенных по всему миру, к ней имеют доступ десятки миллионов пользователей. В России Интернет появился недавно. Бурный рост пользователей в России начался с 1996г.

Интернет скоро станет основным средством связи. Умение работать в Интернет является обязательным условием для достижения успехов практически в любой области деятельности.

Структура Интернет

Отличительной особенностью Интернет является высокая надежность. При выходе из строя части компьютеров и линий связи сеть будет продолжать функционировать. Такая надежность обеспечивается тем, что в сети Интернет нет единого центра управления. Если выходят из строя некоторые линии или компьютеры, то сообщения могут быть переданы по другим линиям связи. (схема 1)

Основными элементами Интернет являются локальные вычислительные сети (ЛВС). Если ЛВС подключена к Интернет, то и каждая рабочая станция этой сети может подключаться к Интернет. Существуют также компьютеры самостоятельно подключенные к Интернет. Это хост - компьютеры (host-хозяин). Центральная жила Интернет – оптоволоконный кабель с очень высокой пропускной способностью. Кроме того, информацию можно передавать с помощью спутниковых систем связи между континентами через космическое пространство.

Интернет представляет собой совокупность физически взаимосвязанных хост - компьютеров. Каждый подключенный к сети компьютер имеет свой уникальный адрес (InternetProtocol - протокол Интернета (IP- адрес)), по которому его может найти абонент из любой точки мира.

Пользователи подключаются к сети интернет через компьютеры специальных организаций, которые называются поставщиками услуг Интернет (провайдерами – provider). Провайдеры имеют множество линий для подключения пользователей и высокоскоростные линии связи для подключения к остальной части Интернет. Мелкие поставщики подключаются к более крупным.

Компьютеры подключенные к Интернет часто называются ее узлами или сайтами (site – место). Узлы установленные у провайдеров, обеспечивают доступ пользователей к Интернет.

Адресация ресурсов Интернет

Каждый ресурс в сети Интернет имеет свой уникальный адрес. В терминологии Интернета этот адрес называется URL(UniformResourseLocator - унифицированный указатель ресурса). URL записывается следующим образом:

протокол: // доменное_имя_сервера / путь

где:

протокол – наименование протокола, соответствующего той службе, которая осуществляет доступ к данному ресурсу;

доменное_имя_сервера– доменное имя сервера, на котором находится данный ресурс;

путь – обычный путь к файлу, содержащему Web-документ. В качестве разделителя имен каталогов и имени файла используется прямой слэш (/).

Основой системы WorldWideWeb является протокол HTTP (HyperTextTransferProtocol - протокол передачи гипертекста),который предназначен для передачи по Интернету Web-страниц. Поэтому адреса Web-ресурсов Интернета начинаются с имени этого протокола.

Например, запись вида: http://www.msu.ru/russian/recviz.html

Где http - протокол передачи гипертекста, соответствующий службе www; msu.ru - доменное имя Web-сервера; /russian/recviz.html - путь к файлу на сервере).

Доменное имя серверапредставляет его уникальный адрес в сети. Пользователю неудобно работать с числовым представлением IP-адреса. Поэтому предусмотрена другая форма записи этого адреса — доменное имя, которое является, как правило, содержательным и легко запоминается. Преобразование доменных имен в IP-адреса выполняется на специальных серверах DNS (DomainNameService - служба имен доменов).

Доменное имя включает, как минимум, два уровня доменов. Каждый домен отделяется от другого точкой. Иерархия доменных имен читается справа налево. Крайний правый домен является доменом верхнего уровня.

В настоящее время Интернет делится на домены верхнего уровня либо по географическому признаку, либо по роду деятельности тех или иных организационных структур.

Домены верхнего уровня, представленные географическим регионами, состоят из двух букв. Так, домен su указывает на принадлежность сервера к странам бывшего СССР, ru - России, uа - Украине, by - Белоруссии, de - Германии, nl - Нидерландам, uk - Великобритании, са - Канаде, fr - Франции.

Например, http://www.mos.ru

Домены верхнего уровня, представленные типами организационных структур (как правило, на серверах США), состоят из трех букв. Например:

com - коммерческие организации;

org - некоммерческие (общественные) организации;

net - сетевые организации;

mil - военные организации;

edu - образовательные учреждения;

gov - правительственные организации.

Например, http ://www.microsoft.com

Путь в адресе Web-документа может отсутствовать. В этом случае броузер загрузит домашнюю страницу Web-сервера (как правило, это файл index.htrnl корневого каталога).

Передача файлов по сети Интернет осуществляется с помощью специального протокола FTP (FileTransferProtocol - протокол передачи файлов). Файлы, которые пользователи получают и отправляют по этому протоколу, хранятся на FTP-серверах.

Адреса FTP-ресурсов в Интернете начинаются со слова ftp. Например, ftp://ftp.netscape.com (ftp - протокол передачи файлов, netscape.com - доменное имя FTP-сервера).

Браузер (программа обозреватель) InternetExplorer позволяет соединиться с FTP-сервером и работать с его файлами и папками точно также, как Вы работаете с ресурсами локального ПК при помощи Проводника.

Чтобы просмотреть содержимое какой-либо папки на FTP-сервере, нужно просто щелкнуть на ней левой кнопкой мыши. Чтобы узнать размер файла и прикинуть примерное время его загрузки, следует щелкнуть на нем правой кнопкой мыши и выбрать в контекстном меню команду Свойства. Чтобы начать загрузку файла, достаточно щелкнуть на нем левой кнопкой мыши.

Виды сайтов по уровню задач

Сайт визитка

Сайт-визитка состоит из 5-10 страниц с основной, неизменяемой информацией:

· Общая информация о компании;

· Общее описание товаров и/или услуг;

· Прайс-лист для скачивания;

· Контактная информация;

Сайт визитка может бытьстатическим (без системы управления) или динамическим (с системой управления сайтом).

Каталог товаров

Чуть, более продвинутый вариант Сайта-визитки; когда уже можно познакомиться с товарами или услугами компании, но купить прямо на сайте, по прежнему, еще нельзя.
Целью таких сайтов является ознакомление с их товарами и/или услугами и привлечение клиентов в офис (магазин) компании.

Интернет магазин

Сайт, предназначенный продажи товаров через Интернет и автоматизации сопутствующих бизнес-процессов. Содержит каталог продукции с ценами и систему заказов, интегрированную в автоматизированную систему предприятия.

Промо-сайт

Интернет-решение для популяризации и позиционирования группы продуктов компании, нуждающихся в отдельном продвижении (рекламе). Также, промо-сайт может быть посвящен отдельной акции компании.

Каталог компаний

Сайт, преимущественную часть контента (информационного наполнения) которого составляет информация о компаниях, магазинах, товарах и/или услугах и ценах, предложения от многих агентств, компаний или частных лиц.

Информационный сайт

Сайт, который содержит исчерпывающую информацию по какой-либо предметной области. Сайты этого типа содержат множество статей различных авторов, а также такие сервисы, как проведения опросов, голосования, рассылки и т.п.

Корпоративный сайт

Сайт, предназначенный для полной автоматизации деятельности компании. Может иметь интернет магазин, систему заказов, коммуникационные сервисы, электронный обмен документами, онлайн-переговоры и т. д.

Портал

Большой ресурс в сети Интернет, который предназначен для формирования сообщества людей с определенными интересами. Портал может объединять множество различных сервисов (телеконференции, рассылки, опросы), предоставлять доступ к различным внутрикорпоративным приложениям, предоставлять клиентам возможность покупки товаров, а партнерам - обмена информацией.

Интернет-браузеры

Браузер или веб-обозреватель (от англ. Webbrowser, МФА: [wɛb ˈbraʊ.zə(ɹ), -zɚ]; устар. броузер) — прикладное программное обеспечение для просмотра веб-страниц; содержания веб-документов, компьютерных файлов и их каталогов; управления веб-приложениями; а также для решения других задач. В глобальной сети браузеры используют для запроса, обработки, манипулирования и отображения содержания веб-сайтов. Многие современные браузеры также могут использоваться для обмена файлами с серверами ftp, а также для непосредственного просмотра содержания файлов многих графических форматов (gif, jpeg, png, svg), аудио-видео форматов (mp3, mpeg), текстовых форматов (pdf, djvu) и других файлов.

Функциональные возможности браузеров постоянно расширяются и улучшаются благодаря конкуренции между их разработчиками и высоким темпом развития и внедрения информационных технологий. Несмотря на то, что браузеры разных изготовителей базируются на разных технологических решениях, большинство современных браузеров придерживается международных стандартов и рекомендаций W3C в области обработки и отображения данных. Стандартизация позволяет добиться предсказуемости в визуальном представлении информации конечному пользователю независимо от технологии, которая использована для её отображения в браузере. Со времени начала применения браузеров во Всемирной паутине в начале 1990-х годов, из простого средства просмотра текстовой информации браузер превратился в комплексное прикладное программное обеспечение для обработки данных и обеспечения интерфейса между информационными ресурсами и человеком. В последние годы многие разработчики браузеров сосредоточили свои усилия на повышении удобства пользовательского интерфейса браузеров для их использования в аппаратных устройствах, в которых применяются сенсорные экраны.

Браузеры распространяются, как правило, бесплатно. Потребителям браузер может быть поставлен в форме самостоятельного (автономного) приложения или в составе комплектного программного обеспечения. К примеру, браузеры InternetExplorer и MicrosoftEdge поставляются в составе операционной системы MicrosoftWindows; MozillaFirefox — отдельно или в составе дистрибутивов Linux (например, Ubuntu); Safari — в составе операционной системы Mac OS X; GoogleChrome, Opera и другие браузеры — как самостоятельные приложения во множестве вариантов для различных операционных систем.

Первый веб-браузер был создан в 1990 году сэром Тимом Бернерс-Ли. Он назывался WorldWideWeb и позже был переименован в Nexus[3]. Но первым распространённым браузером с графическим интерфейсом был NCSA Mosaic. Исходный код этого одного из первых браузеров был открыт, и некоторые другие браузеры (NetscapeNavigator и InternetExplorer) взяли его за основу. Этот браузер имел свои недостатки, но почти все они были устранены в браузере NetscapeNavigator (некоторые сотрудники компании Netscape были из NCSA и участвовали в разработке Mosaic). Netscape выпустила NetscapeNavigator под разные операционные системы (UNIX, Windows, Mac OS) и добилась заметного успеха, в том числе и коммерческого. Это побудило компанию Microsoft выпустить свой браузер InternetExplorer.

В отличие от Netscape, Microsoft сразу выпускала локализованные версии IE. В 1995 году Microsoft выпустила операционную систему Windows 95, в ней не было встроенного браузера, но через некоторое время в обновление системы (Windows 95 OSR2) браузер (InternetExplorer 3.0) был встроен. К тому же Microsoft добавляла в свой браузер несовместимые со стандартами расширения языка HTML, и это можно считать началом войны браузеров, закончившейся монополизацией (более 95 %) рынка браузером от Microsoft.

Из-за потери рынка доходы компании Netscape упали, и её приобрела AOL, а исходный код браузера Netscape был выпущен под свободной лицензией MPL (MozillaPublicLicense). Название «Mozilla» изначально присутствовало в браузере от Netscape и означало сокращение слов Mosaic+killer. Однако этот код было решено не использовать, и вместо него для Netscape 6 с нуля был написан новый движок (Gecko), изначально ориентировавшийся на полную поддержку стандартов, на основе которого позже были созданы входящие в комплект MozillaSuite браузер, почтовый и irc-клиент и редактор веб-страниц.

WorldWideWeb для NeXT, вышедший в 1991 году, был первым веб-браузером.

Впоследствии в MozillaFoundation было принято решение поставлять и развивать браузер отдельно от общего пакета, и родился проект MozillaFirefox. Firefox содержит много возможностей, отсутствующих в IE или других браузерах, и постепенно набирает популярность.

Монополизация рынка браузером IE имела и другие последствия — Microsoft почти перестала развивать браузер, и он с 4-й до 6-й версии почти не менялся: хуже других браузеров поддерживал стандарты, отставал и по удобству использования, и по скорости работы, и по скорости отображения страниц. Такое положение сподвиглоMicrosoft вновь заняться браузером, и седьмая версия вышла с некоторыми изменениями (были добавлены вкладки, улучшена поддержка стандартов, поднята скорость работы и более удобный интерфейс). 19 марта 2009 года Microsoft выпустила 8-ю версию InternetExplorer[6], а 14 марта 2011 года 9-ю версию InternetExplorer и активно продвигает её на российском рынке совместно с такими компаниями, как Яндекс, Mail.ru и Рамблер.

В 1995 году появился браузер Opera. Первоначально Opera распространялась как условно-бесплатное ПО (shareware), этим, возможно, объясняется её низкая популярность в большинстве стран мира и высокая популярность в странах СНГ. Однако с 2005 года Opera также стала распространяться бесплатно.

Война браузеров была бы исключительно коммерческим делом корпораций, если бы основным приёмом в борьбе не стало добавление специфических, нестандартных возможностей к браузерам. Наибольшие различия возникали в поддержке JavaScript — языка сценариев, придающего интерактивность документам. В результате некоторые новые сайты с нововведениями плохо работали со старыми бразуерами.

В InternetExplorer 8 Microsoft сначала предлагали ввести HTML-комментарий, который бы указывал браузерам, какие версии движков использовать (заголовок DOCTYPE при этом должен был быть отменён, как малоиспользуемый), что вызвало возмущение сторонников стандартов, так как указания на использование стандартов не предусматривалось. Позже было объявлено, что IE8 будет по умолчанию использовать «режим стандартов» (англ. standardsmode), а не «режим совместимости» (англ. quirksmode), а при обнаружении соответствующего комментария использовать режим имитации предыдущей версии.

В 2008 году компания Google выпустила свой браузер — Chrome, основанный на свободном проекте Chromium. Браузер Chrome содержит некоторые новшества (изоляция сбоев, режим «инкогнито» и т. д.). Выпущены версии для Windows XP, WindowsVista, Windows 7, Linux, BSD и Mac OS X [7].

В начале 2009 года Microsoft объявила, что разрабатывает новый браузер, который будет называться Gazelle. Новый браузер будет применять принципы разделения ресурсов, характерные для многопользовательских операционных систем, что, согласно Microsoft, повысит его безопасность.

Google

Лидер поисковых машин Интернета, Google занимает более60 % мирового рынка, а значит, шесть из десяти находящихся в сети людей обращаются к его странице в оисках информации вИнтернете. Сейчас регистрирует ежедневно около50 миллионов оисковых запросов ииндексирует более 8 миллиардов веб-страниц.

Была разработана в1998 г. выпускниками Стэндфордского университета Сергеем Бриноми ЛариПейджем, которые применили для ранжирования документов технологиюPageRank, где однимиз ключевых моментов является определение"авторитетности" конкретного документа на основеинформации о документах, ссылающихся на него. Говоря общими словами, чем большедокументов ссылается на данный документ и чем они авторитетнее, тем более авторитетнымданный документ становится. Количественное значение авторитетности документа(другимисловами, взвешенное количество ссылок илиPageRank) относится к так называемымстатическим факторам(то есть независящим от конкретного запроса) и учитывается приопределении релевантности документа конкретному запросу как весовой коэффициент. Наряду сэтимGoogleприменил для определения релевантности документа не только текст самогодокумента, но и текст ссылок на него. Эта технология озволила ему обеспечить выдачудовольно релевантных результатов на фоне других оисковиков. Довольно быстроGoogle сталлидировать в различных опросах о такому оказателю, как удовлетворенность пользователейрезультатами оиска.

Google осуществляет поиск по документам на более чем35 языках, в том числе русском. Внастоящее время многие порталы и специализированные сайты предоставляют услуги поискаинформации в Интернете на базеGoogle, что делает задачу успешного позиционирования сайтов вGoogle еще более важной. Googleпроводит переиндексацию своей поисковой базы примернораз в четыре недели. Во время этого усовершенствования, неофициально называемогоGoogledance, происходит обновление базы на основе информации, собранной роботами за время, прошедшее с предыдущего усовершенствования, и перерасчет значенийPageRank документов.

Также существует определенное количество документов с достаточно большим значениемPageRank, информация о которых в поисковой базе обновляется ежедневно, однако значениеPageRankпересчитывается только во времяGoogledance. Нормированное значениеPageRank дляконкретного документа, загруженного в браузер, можно узнать, скачав и установивGoogleToolBar - специальную панель инструментов для работы с этим поисковиком. Не смотря на то, что в поисковике имеется форма для бесплатного добавления страницы в базу, Googleпредпочитает сам находить новые документы о ссылкам с уже известных и не будетиндексировать добавленную через форму страницу, если в его базе не найдется ни однойстраницы, ссылающейся на нее.

Yahoo

Одна из самых первых поисковых системи(создана Дэвидом Фило и Джерри Янгом в апреле1994года) по сей день остается и самой популярной из них, традиционно сочетая поиск, как поключевым словам, так и с помощью иерархического дерева разделов.

Нынешнее развитиеYahoo можно определить как движение в он-лайн, интерактивность. Yahoo быстро осваивает эту область Интернет-услуг, но возникает одна проблема: ядроYahoo! не былона это рассчитано. Не была в1994 году заложено в него"онлайновая" составляющая, ее"приклеил" Тим Кугл несколькими годами позже. Естественно возникает угроза хакерских атакчерез эту незащищенную область.

Одно из новшеств поисковой системыYahoo - панель задач для браузераFirefox,. Этотинструмент помогает пользоваться поискомYahoo, не заходя на официальный сайт, а лишьиспользуя функциональные кнопки панели.

1 сентября2005 года поисковикYahoo, которому принадлежит более200 миллионов адресовэлектронной почты по всему миру, анонсировал запуск новой системы поиска текстов, фотографий и других документов, содержащихся в письмах. Необходимость такого нововведения возникла вслед за увеличением объёма хранимых данных, ведь некоторые пользователи создают целые почтовые архивы. Подгоняемый конкурентомGoogle и его почтовым сервисомGmail, Yahoo для хранения почты предлагает отныне1 гигабайтбесплатного места, или2 гигабайта по годовому абонементу. "Как только вы получаетевозможность хранить больше информации, вам необходимы и расширенные поисковыевозможности", - объясняет Эрик Петерсон, аналитик компанииJupiterResearch.

Пользователи поисковой системыYahoo, в свою очередь, смогут теперь использоватьвозможности детализированного поиска слов в названии или непосредственно в тексте письма, атакже в присоединенных документах, не открывая их. Результат поиска отражается в трёхстроках с указанием всех атрибутов. На панели справа отображаются все похожие документы.

Найденные фотографии выводятся на экран в уменьшенном виде, что значительно облегчает поиск. Система также учитывает орфографические ошибки, позволяя искать слова лишь по первым буквам.

Для началаYahooпланирует предложить новую систему небольшому числу американских пользователей, а затем распространить её по всему миру. Со стороны клиентов это не потребуетникаких дополнительных усилий. "Когда услуга станет, доступна, в левом верхнем углустраницы вашего почтового ящика появится соответствующий баннер", - обещает компания.

По даннымcomScoreMediaMetrix, доменуYahooпринадлежит219 миллионов адресов электронной почты, что составляет31,5% мирового рынка, уступая лишьMicrosoft с221 миллионом пользователей сервисаHotmail (35,5% рынка).

Основное отличие русскоязычных поисковых систем от иностранных одно- это то, чтоглобальные поисковые системы, поддерживающие поиск на русском языке, не поддерживаютрусскую морфологию. В русскоязычной части сети Интернет работают около двух десятков поисковых систем, но подавляющие большинство пользователей работает лишь с несколькими, подробно остановимся на самых крупных:

Yandex

Яндекс - на сегодня наиболее популярная поисковая система, ежемесячно к ней обращаютсяболее35 миллионов пользователей Русскоязычной части Интернета. Начала свою работу вовторой половине1997 года учитывая морфологию русского языка. История компании"Яндекс" началась в1990 году с разработки поискового программного обеспечения в компании"Аркадия".

За два года работ были созданы две информационно-поисковые системы- МеждународнаяКлассификация Изобретений, 4 и5 редакция, а также Классификатор Товаров и Услуг. Обесистемы работали локально одDOS и позволяли проводить поиск, выбирая слова из заданногословаря, с использованием стандартных логических операторов. В1993 году"Аркадия" сталаподразделением компанииCompTek. В1993-1994 годы программные технологии былисущественно усовершенствованы благодаря сотрудничеству с лабораторией Ю. Д. Апресяна(Институт Проблем Передачи Информации РАН). В частности, словарь, обеспечивающий поискс учетом морфологии русского языка, занимал всего300Кб, то есть целиком грузился воперативную память и работал очень быстро. С этого момента пользователь мог задавать взапросе любые формы слов.

Слово Яндекс придумал за несколько лет до этого один из основных и старейших разработчиков поискового механизма. "Яndex" означает"Языковойindex", или, если по-английски, "Yandex" - "YetAnotherindexer". За4 года публичного существования Яndex возникли и другие толкования. Например, если в слове"Index" перевести с английского первую букву("I" - "Я"), получится"Яndex".

В начале1996 года был разработан алгоритм построения гипотез. Отныне морфологическийразбор перестал быть привязан к словарю- если какого-либо слова в словаре нет, то находятсянаиболее похожие на него словарные слова и о ним строится модель словоизменения. В этовремя Интернет в России только начинался. Еще через полгода стало очевидно, что ничто неотделяетCompTek от создания собственной глобальной поисковой машины. Объем Рунетасоставлял тогда всего несколько гигабайт. Осенью1997 года был открытYandex.Ru.

Помимо поисковой системы, сегодня Яндекс- огромный портал с целым набором широкоиспользуемых сервисов, такими как каталог, Яндекс.деньги, и другие. Официально поисковаямашинаYandex.Ru была анонсирована23 сентября1997 года на выставкеSoftool. Основнымиотличительными чертамиYandex.Ru на тот момент были проверка уникальности документов(исключение копий в разных кодировках), а также ключевые свойства поискового ядра Яндекс, аименно: учет морфологии русского языка(в том числе и поиск по точной словоформе), поиск сучетом расстояния(в том числе в пределах абзаца, точное словосочетание), и тщательноразработанный алгоритм оценки релевантности(соответствия ответа запросу), учитывающий нетолько количество слов запроса, найденных в тексте, но и"контрастность" слова(егоотносительную частоту для данного документа), расстояние между словами, и положение слова вдокументе. Сегодня Яндекс имеет внутри мощный поисковый робот, позволяющий производитьпоиск о самым различным критериям.

Rambler

Rambler - старейшая поисковая система российского Интернет, запущена в1996 году, на сегодня- вторая о популярности с обращением более25 миллионов посетителей в месяц. Помимо поисковой системы, сегодня Рамблер- один из крупнейших порталов русскоязычной частиИнтернета с большим набором широко известных сервисов, таких как каталог Рамблер, Рамблер-почта, Рамблер-ICQ или Рамблер-ТВ. По сути сегодня Рамблер- больше, чем просто поисковаясистема и набор сервисов, это крупная медиагрупа. Поисковая машина"Рамблер" начала работув октябре1996 года, на стартовом этапе содержала всего100 тысяч документов. "Рамблер" небыл первой отечественной поисковой системой, однако в первый год своего существования(когда весь русский веб с приемлемой степенью правдоподобия индексировался"Рамблером", "Апортом", "Русской поисковой машиной", а также шведской и калифорнийскойAltaVista) вынес основной груз поисковых запросов. Вторая версия"Рамблера" начала разрабатыватьсялетом 2000 года. В неебыли введены функции, давно уже имевшиеся в конкурирующих системах. Она учитываеткоординаты слов, обучена строгой и нечеткой морфологии, связывает поиск с каталогом, вкачестве которого используетсяTop100 (http://top100.rambler.ru/), группирует результаты поиска по сайтам, ищет по числам. Достаточно удачная архитектура продукта позволяет"Рамблер" иметь для поисковика количество серверов в2 раза меньшее, чем у"Яндекса", и в3 разаменьшее, чем у"Апорта".

Апорт

Апорт– третья по популярности на сегодня поисковая система с обращением более16 миллионов посетителей в месяц. Апорт позволяет пользователям осуществлять однотекстовыйпоискдокументовc учетом морфологии русского языка в запросах. Поисковая система построена наосновании новейших достижений в области информационного поиска и использует уникальныеалгоритмы сортировки найденных результатов. Разнообразные специализированные поиски(Знакомства, Товары, Новости, Рефераты, MP3 и др.) дают пользователям дополнительныевозможности находить различную информацию в Сети. В поисковую машину интегрирован одиниз крупнейших в Русскоязычной части Интернет каталогов Интернет-ресурсов "Апорт-каталог".

Поисковая машина"Апорт" была впервые продемонстрирована в феврале1996 года на пресс-конференции"Агамы" по поводу открытия"Русского клуба". Тогда она искала только по сайтуrussia.agama.com. Потом она начала искать по четырем, потом по шести серверам. Короче, деньрождения и фактический старт системы сильно"размазались" по времени, а официальнаяпрезентация"Апорта" состоялась только11 ноября1997 года. К тому времени в его базе был проиндексирован первый миллион документов, расположенных на10 тысячах серверов.

Создателем системы выступила компания"Агама" - разработчик программного обеспечения для платформыWindows, главным из которых являлся корректор орфографии"Пропись".

Лингвистические разработки"Агамы" использовались при создании поисковой машины, вкоторой, скажем, в отличие от"Рамблер", изначально учитывалась морфология слов иосуществлялась по желанию клиента проверка орфографии запроса.

Важнейшими свойствами первой версии"Апорта" являлся перевод запроса и результатов поискана английский язык и обратно, а также реконструкция всех проиндексированных страниц изсобственной базы(что означает возможность просмотра страниц, уже несуществующих воригинале).

«Апорт 2000» стал первой российской поисковой машиной, практически реализовавший двебазовых технологии американской поисковой машиныGoogle. Первая– учет"ранга страницы" (PageRank), который характеризует ее популярность(вычисляется о количеству ссылок наресурс из внешнего Интернета: вес ссылки с опулярного сайта выше, чем вес ссылки с менее популярного; ссылки, включающие слова запроса, имеют больший вес, чем, скажем, слово"здесь"). Вторая- обработка запроса, ориентируясь наHTML-код страницы. В"Апорт2000" учитывается также вхождение слов запроса вURL. Среди недокументированных особенностей- больший приоритет сайтам, получившим высшую и элитную лигу в каталогеAtRus.

Можно отметить и то, что"Апорт" первым устроил поиск по новостным лентам(какие быложные сведения о приоритете"Яндекса" в этом сервисе не распускал в свое времяInternet.ru). И, наконец, еще одно первенство"Апорта" - использование платной нулевой строки в выдаче(кстати, "Апорт" первым среди наших поисковиков начал покупать такой сервис уAltaVista, которая за небольшую плату выдавала его ссылку первой при запросе"RussianSearch"). Однако в"Апорте" нельзя купить не нулевое, а просто более высокое место для своего сайта в результатах поиска. Пользователи"Апорта" (в отличие завсегдатаев"Яндекса") мало пользуютсярасширенным поиском(на8000 загрузок простой страницы приходится300 вызовов страницы"Расширенный поиск").

Организация масштабируемости в архитектуре"Апорт2000" такова, что можно дробить поисковую базу"Апорта" на несколько отдельных баз, каждый маленький"Апорт" работает насвоем компьютере. "Апорт2000" считает, что весь Интернет оделен на фрагменты. После проведения поиска по этим фрагментам, пользователю интегрируется и выдается общий ответ.Добавлять новые маленькие"апортики" можно путем не очень сложной процедуры. В случаяхаварий отдельных машин выдаются несколько отличные от штатных интегральные результаты, что мы можем время от времени наблюдать.

Mail.ru

Национальная почтовая службаMail.ru – это не только поисковая система но и один изкрупнейших порталов российского Интернета. Ежедневная аудиторияMail.ru – более5 миллионов пользователей. Общее число регистраций со дня основания около 60 миллионов.

Mail.ru - самый быстроразвивающийся российский Интернет-ресурс. Через почтовые ящикиMail.ru ежедневно проходит более25 миллионов писем. Mail.ru занимает лидирующую позициюсреди бесплатных почтовых сервисов, предоставляя своим пользователям почтовый ящикнеограниченного размера с защитой от спама и вирусов, переводчиком, проверкой правописания, архивом для хранения фотографий и многое другое.

В1998-м году программисты, работающие в питерском офисе американской софтвернойкомпанииDataArt, создали новое ПО для почтового веб-сервера, которое в дальнейшемпредполагалось продавать западным компаниям. Чтобы протестировать сервис, его временновыложили в открытый доступ для российских пользователей, а сервис вдруг стал стремительно набирать популярность.

20 февраля2001 года произошло слияние двух крупных игроков российского Интернет-рынка, компанийPort.ru иnetBridgeпод брендомPort.ru. В результате объединения родилась компания, которая сразу заняла лидирующие позиции среди российских Интернет– холдингов по долерынка и охвату аудитории.

Первоочередная задача любой поисковой системы– доставлять людям именно ту информацию, которую они ищут.

Основные характеристики поисковых систем:

1. Полнота

2. Точность

3. Актуальность

4. Скорость поиска

5. Наглядность

В состав поисковой системы входят компоненты:

1. Модуль индексирования

2. База данных

3. Поисковый сервер

Подводя итог можно сказать что, как правило, несмотря на обилие поисковых систем, пользователь предпочитает обращаться к услугам лишь одной– двух из них(точно также как при обилии газет или новостных сайтов мы регулярно просматриваем лишь некоторые, привычные и любимые). Самой популярной поисковой системой в мире являетсяGoogle. Но, по оценкам аналитиков, на просторах Рунета чаше используется Яндекс.

ТЕМА 3

ПОИСКОВЫЕ СИСТЕМЫ

Структура и основные принципы работы сети Интернет

Сущность Интернет

Под Internet понимают глобальное сообщество мировых сетей, которые используют Интернет для обмена данными. Интернет представляет собой глобальную компьютерную сеть, содержащую гигантский объем информации по любой тематике, доступной на коммерческой основе для всех желающих, и представляющую большой спектр информационных услуг. Интернет состоит из множества компьютеров, соединенных между собой линиями связи, и установленных на этих компьютерах программ. Интернет обеспечивает обмен информацией между всеми компьютерами, которые входят в сети, подключенные к ней. Тип компьютера и используемая ими операционная система значения не имеют.

Интернет появился аналогично большинству современных информационных технологий, как военная программа, направленная на повышение устойчивости системы обороны США.

2 января 1969г. Агентство перспективных исследовательских проектов (ARPA) Министерства обороны США начало работу над проектом связи компьютеров оборонных организаций. В результате была создана сеть ARPANET. ARPANET обеспечивала связь между университетами, военными учреждениями и предприятиями оборонной промышленности. В случае разрушения одной или нескольких линий связи система должна была уметь переключаться на другие линии. Спустя некоторое время в систему были встроены программы перемещения файлов и электронная почта. Принципы ее построения в дальнейшем были использованы при создании Интернет.

Следующим этапом в развитии Интернет было создание в 1983 году сети Национального научного фонда США – NSFNET. Эта сеть объединяла научные центры. Основой сети стали пять суперкомпьютеров, соединенных между собой высокоскоростными линиями связи. Пользователи могли подключаться к сети и использовать возможности этих суперкомпьютеров.

В 1987 г. сеть NSFNET состояла из 13 центров, соединенных высокоскоростными линиями связи. Центры располагались в разных частях США. Сеть NSFNET быстро заняла место ARPANET, которая была ликвидирована в 1990г. Так появилась сеть Интернет.

Одновременно были созданы национальные

Наши рекомендации