ЛЕКЦИЯ 9. Работа в глобальной сети Интернет

Зарождением Интернета принято считать момент появления первой компьютерной сети, родиной которой в середине 60-х годов двадцатого века стала Америка.

В то время еще не существовало персональных компьютеров, и крупные американские университеты могли себе позволить 1-2 больших компьютера. Компьютерное время было драгоценным ресурсом, и на него заранее записывались. Люди работали ночами, чтобы ни минуты этого времени не пропало даром.

Наконец появилась идея соединить между собой компьютеры разных университетов, чтобы сделать возможным удаленное использование любого свободного в данный момент компьютера. Этот проект получил название ARPANET. К концу 1969 года были соединены компьютеры четырех университетов, и появилась первая компьютерная сеть.

Очень скоро обнаружилось, что сеть в основном используется не для вычислений на удаленном компьютере, а для обмена сообщениями между пользователями. В 1972 году, когда ARPANET уже соединял 23 компьютера, была написана первая программа для обмена электронной почтой по сети. Электронную почту оценили по достоинству, что побудило целый ряд государственных организаций и корпораций к созданию собственных компьютерных сетей. Эти сети обладали тем же недостатком, что и ARPANET: они могли соединять только ограниченное число однотипных компьютеров. Кроме того, они были не совместимы друг с другом.

В середине 70-х годов для ARPANET были разработаны новые стандарты передачи данных, которые позволяли объединять сети произвольной архитектуры, тогда же было придумано слово «Интернет». Именно эти стандарты, впоследствии получившие название протокола TCP/IP, заложили основу для роста глобальной компьютерной сети путем объединения уже существующих сетей. Их важным достоинством было то, что сеть считалась в принципе не стопроцентно надежной и предусматривались средства борьбы с ошибками при передаче данных. В 1983 году сеть ARPANET перешла на новый протокол и разделилась на две независимые сети - военную и образовательную. К этому времени сеть объединяла более тысячи компьютеров, в том числе в Европе и на Гавайских островах. Последние использовали спутниковые каналы связи.

Развитие Интернета получило новый импульс благодаря инициативе Национального научного фонда США (NSF) по созданию глобальной сетевой инфраструктуры для системы высшего образования (1985—1988). NSF создал сеть скоростных магистральных каналов связи и выделял средства на подключение к ней американских университетов, при условии, что университет обеспечивал доступ к сети для всех подготовленных пользователей. Интернет оставался преимущественно университетской сетью до начала 90-х годов, однако NSF сразу взял курс на то, чтобы сделать его в дальнейшем независимым от государственного финансирования. В частности, NSF поощрял университеты к поиску коммерческих клиентов. К 1988 году Интернет уже насчитывал около 56 тысяч соединенных компьютеров.

Настоящий расцвет Интернета начался в 1992 году, когда была изобретена новая служба, получившая странное название «Всемирная паутина» (World Wide Web, или WWW, или просто «веб»). WWW позволял любому пользователю Интернета публиковать свои текстовые и графические материалы в привлекательной форме, связывая их с публикациями других авторов и предоставляя удобную систему навигации. Постепенно Интернет начал выходить за рамки академических институтов и стал превращаться из средства переписки и обмена файлами в гигантское хранилище информации. К 1992 году Интернет насчитывал более миллиона соединенных компьютеров.

В настоящее время Интернет продолжает расти с прежней головокружительной скоростью. По оценке специалистов, количество передаваемой информации (трафик) в Интернете увеличивается на 30% ежемесячно. В 1999 году Интернет объединял около 60 миллионов компьютеров и более 275 миллионов пользователей, и каждый день в нем появлялось полтора миллиона новых web-документов. Эти оценки довольно приблизительны, потому что в Интернете нет центрального административного органа, который регистрировал бы новых пользователей и новые компьютеры. В Россию Интернет впервые проник в начале 90-х годов. Ряд университетов и исследовательских институтов приступили в это время к построению своих компьютерных сетей и обзавелись зарубежными каналами связи.

Ключевые слова: Интернет, www, web-страница, гиперссылка, URL-адрес, протокол TCP/IP, HTML, служба имен доменов DNS, браузер, провайдер, протокол, коммутируемое соединение, выделенное соединение, модем (внешний и внутренний), клиент/сервер, службы Интернета, протокол HTTP, FTP, Telnet, E-mail, SMTP/POP3, Mail List, Usenet, IRC, ICQ, поиск информации в www, язык запросов (на примере RAMBLER), поисковые каталоги, поисковые указатели, URL-адрес.




9.1. Интернет, основные понятия и определения

В дословном переводе на русский язык Интернет - это межсеть, то есть в узком смысле слова Интернет - это объединение сетей. Однако в 90е годы XX века у этого слова появился и более широкий смысл: Всемирная компьютерная сеть. Интернет можно рассматривать в физическом смысле как несколько миллионов компьютеров, связанных друг с другом всевозможными линиями связи, однако такой «физический» взгляд на Интернет слишком узок. Лучше рассматривать Интернет как некое информационное пространство.

Отдельный документ World Wide Web называют Web-страницей. Обычно это комбинированный документ, который может содержать текст, графические иллюстрации, мультимедийные и другие вставные объекты. Для создания Web-страниц используется язык HTML (HyperText Markup Language - язык разметки гипертекста), который при помощи вставленных в документ теговописывает логическую структуру документа, управляет форматированием текста и размещением вставных объектов.

Гиперссылки. Отличительной особенностью среды World Wide Web является наличие средств перехода от одного документа к другому, тематически с ним связанному, без явного указания адреса. Связь между документами осуществляется при помощи гипертекстовых ссылок (или просто гиперссылок). Гиперссылка - это выделенный фрагмент документа (текст или иллюстрация), с которым ассоциирован адрес другого Web-документа. При использовании гиперссылки (обычно для этого требует навести на нее указатель мыши и один раз щелкнуть) происходит переход по гиперссылке - открытие Web-страницы, на которую указывает ссылка. Механизм гиперссылок позволяет организовать тематическое путешествие по WWW безиспользования (и даже без знания) адресов конкретных страниц.

Адресация документов. Для записи адресов документов Интернета (Web-страниц) используется форма, называемая адресом URL. Адрес URL содержит указания на прикладной протокол передачи, адрес компьютера и путь поиска документа в этом компьютере. Адрес компьютера состоит из нескольких частей, разделенных точками, например www.intel.ru. Части адреса, расположенные справа, определяютсетевую принадлежность компьютера, а левые элементы указывают на конкретный компьютер данной сети.

Преобразование адреса URLв цифровую форму IР-адреса производит служба имен доменов (Domain Name Service, DNS). В качестве разделителя в пути поиска документа Интернета всегда используется символ косой черты «/» . http://www.vimvd.vrn.ru/itoovd/nauka.htm

Протокол ТСP протокол транспортного уровня. Он управляет тем, как происходит передача информации. Протокол IP — адресный. Он принадлежит сетевому уровню и определяет, куда происходит передача.

Протокол TCP.Согласно протоколу TCP, отправляемые данные «нарезаются» на небольшие пакеты, после чего каждый пакет маркируется таким образом, чтобы в нем были данные, необходимые для правильной сборки документа на компьютере получателя.

Когда мы работаем в Интернете, то по одной-единственной телефонной линии, можем одновременно принимать документы из Америки, Австралии. Пакеты каждого из документов поступают порознь, с разделением во времени, и по мере поступления собираются в разные документы.

Протокол IP. Теперь рассмотрим адресный протокол - IP (Internet Protocol). Суть состоит в том, что у каждого участника Всемирной сети должен быть свойуникальный адрес (IP-адрес). Без этого нельзя говорить о точной доставке TCP-пакетов на нужное рабочее место. Этот адрес выражается очень просто - четыре байтами, например: 195.38.46.11.

Структура IР-адреса организована так, что каждый компьютер, через который проходит какой-либо TСР-пакет, может по этим четырем числам определить, кому из ближайших «соседей» надо переслать пакет, чтобы он оказался «ближе» к получателю. В результате конечного числа перебросок TСР-пакет достигает адресата.

Поскольку один байт содержит до 256 различных значений, то теоретически с помощью четырех байтов можно выразить более четырех миллиардов уникальныхадресов (за вычетом некоторого количества адресов, используемых в качестве служебных). На практике же из-за особенностей адресации к некоторым типам локальных сетей количество возможных адресов составляет порядка двух миллиардов, но и это по современным меркам достаточно большая величина.

Средства просмотра Web. Документы Интернета предназначены для отображен в электронной форме, причем автор документа не знает, каковы возможности компьютера, на котором документ будет отображаться. Поэтому язык HTMLобеспечивает не столько форматирование документа, сколько описание его логической структуры. Форматирование и отображение документа на конкретном компьютере производится специальной программой - браузером(от английского слова brow).

Основные функции браузеров следующие:

• установление связи с Web-сервером, на котором хранится документ, и загрузка всех компонентов комбинированного документа;

• интерпретация тегов языка HTML, форматирование и отображение Web-страницы в соответствии с возможностями компьютера;

• предоставление средств для отображения мультимедийных и других объектов, входящих в состав Web-страниц;

• обеспечение автоматизации поиска Web-страниц и упрощение доступа к страницам, посещенным ранее;

• предоставление доступа к встроенным или автономным средствам для работы с другими службами Интернета.

Для работы в Интернете необходимо:

• физически подключить компьютер к одному из узлов Всемирной сети;

• получить IР-адрес на постоянной или временной основе;

• установить и настроить программное обеспечение – программы-клиенты тех служб Интернета, услугами которых предполагается пользоваться.

Организации, предоставляющие возможность подключения к своему узлу и выделяющие IР-адреса, называются поставщиками услуг Интернета (используется также термин сервис-провайдер, или просто провайдер). Они оказывают подобную услугу на договорной основе (за деньги).

Физическое подключение может быть выделенным или коммутируемым. Для выделенного соединения необходимо, как правило, проложить новую или арендовать готовую физическую линию связи (кабельную, оптоволоконную, радиоканал, спутниковый канал и т. п.). (≈100 Мбит/с).

В противоположность выделенному соединению коммутируемоесоединение - временное. Оно не требует специальной линии связи и может быть осуществлено, например, по телефонной линии. Коммутацию (подключение) выполняет автоматическая телефонная станция (АТС) по сигналам, выданным в момент набора телефонного номера. (≈ 50 Кб- 120 Кб/с). От типа линии связи зависит ее пропускная способность (измеряется в единицах бит в секунду).

Телефонные линии связи никогда не предназначались для передачи цифровых сигналов – их характеристики подходят только для передачи голоса, причем в достаточно узком диапазоне частот – 300-3400 Гц. Поэтому для передачи цифр, информации сигналы звуковой частоты модулируют по амплитуде и частоте. Такое преобразование выполняет специальное устройство – модем (название образовано от слов модулятор и демодулятор).

По способу подключения различают внешние и внутренние модемы. Внешние модемы подключают к разъему последовательного порта, выведенному на заднюю стенку системного блока. Внутренние модемы устанавливают в один из разъемов расширения материнской платы.

Службы Интернета

В простейшем понимании служба – это пара программ, взаимодействующих между собой согласно определенным правилам, называемым протоколами. Одна из программ этой пары называется сервером, а вторая – клиентом. Когда говорят о работе служб Интернета, речь идет о взаимодействии серверного оборудования и программного обеспечения с клиентским оборудованием и программным обеспечением.

Разные службы имеют разные протоколы. Их соблюдение обеспечивается и поддерживается работой специальных программ (клиентами). Таким образом, чтобы воспользоваться какой-либо службой Интернета, необходимо установить на компьютере программу, способную работать по протоколу данной службы.

Так, например, для передачи файлов в Интернете используется специальный прикладной протокол FTP (File Transfer Protocol). Соответственно, чтобы получить из Интернета файл, необходимо:

• иметь на компьютере программу, являющуюся клиентом FTP (FTP-клиент);

• установить связь с сервером, предоставляющим услуги FTP (FTP-сервером).

Терминальный режим. Исторически одной из ранних является служба удаленного управления компьютером Telnet. Подключившись к удаленному компьютеру по протоколу этой службы, можно управлять его работой. Такое управление еще называют консольным или терминальным. В прошлом эту службу широко использовали для проведения сложных математических расчетов на удаленных вычислительных центрах. В наши дни протоколы Telnet применяют для дистанционного управления техническими объектами, например, телескопами, видеокамерами, роботами. Каждый сервер, предоставляющий Telnet-услуги, обычно предлагает свое клиентское приложение. Простейший клиент Telnet входит в состав ОС Windows XP (файл telnet.exe).

Электронная почта (E-Mail).Эта служба также является одной из наиболее ранних. Ее обеспечением в Интернете занимаются специальные почтовые серверы. Почтовые серверы получают сообщения от клиентов и пересылают их по цепочкам почтовым серверам адресатов, где эти сообщения накапливаются. При установлении соединения между адресатом и его почтовым сервером происходит автоматическая передача поступивших сообщений на компьютер адресата.

Почтовая служба основана на двух прикладных протоколах: SMTP и POP3. По первому происходит отправка корреспонденции с компьютера на сервер, а по второму прием поступивших сообщений.

Списки рассылки (Mail List).Обычная электронная почта предполагает наличие двух партнеров по переписке. Если же партнеров нет, то достаточно большой поток почтовой информации в свой адрес можно обеспечить, подписавшись на списки рассылки. Это специальные тематические серверы, собирающие информацию по определенным темам и переправляющие ее подписчикам в виде сообщений электронной почты.

Служба телеконференций(Usenet). Служба телеконференций похожа на циркулярную рассылку электронной почты, в ходе которой одно сообщение отправляется не одному корреспонденту, а большой группе (такие группы называются телеконференциями или группами новостей).

Обычное сообщение электронной почты пересылается по узкой цепочке серверов от отправителя к получателю. При этом не предполагается его хранение на промежуточных серверах. Сообщения, направленные на сервер группы новостей, отправляются с него на все серверы, с которыми он связан, если на них данного сообщения еще нет. Далее процесс повторяется. На каждом из серверов поступившее сообщение хранится ограниченное время (обычно неделю), и все желающие могут в течение этого времени с ним ознакомиться. Распространяясь во все стороны, менее чем за сутки сообщения охватывают весь земной шар. Далее распространение затухает, поскольку на сервер, который уже имеет данное сообщение, повторная передача производиться не может.

Служба World Wide Web (WWW).Безусловно, - это самая популярная служба современного Интернета. World Wide Web - это единое информационное пространство, состоящее из сотен миллионов взаимосвязанных электронных документов, хранящихся на Web-серверах. Отдельные документы, составляющие пространство Web, называют Web-страницами. Группы тематически объединенных Web-страниц называют Web-узлами (альтернативный термин — Web-сайт или просто сайт). Один физический Web-сервер может содержать достаточно много Web-узлов, каждому из которых, как правило, отводится отдельный каталог на жестком диске сервера. От обычных текстовых документов Web-страницы отличаются тем, что они оформлены без привязки к конкретному носителю.

Адрес любого файла в Интернете определяется унифицированным указателем ресурса — URL. Адрес URL состоит из трех частей.

1. Указание службы, которая осуществляет доступ к данному ресурсу (обычно обозначается именем прикладного протокола, соответствующего данной службе). Так, например, для службы WWW прикладным является протокол HTTP (Hypertext Transfer Protocol — протокол передачи гипертекста). После имени протокола ставится двоеточие (:) и два знака «/»:

http://...

2.Указание доменного имени компьютера (сервера), на котором хранится данный ресурс: http://www.abcde.com...

3.Указания полного пути доступа к файлу на данном компьютере. http://www.abcde.com/Files/New/abcdefg.zip

Служба имен доменов (DNS). Когда мы говорили о протоколах Интернета, то сказали, что адрес любого компьютера или любой локальной сети в Интернете может быть выражен четырьмя байтами, например, так:

195.28.132.97

А только что мы показали, что каждый компьютер имеет уникальное доменное имя, например такое:

www.abcdef.com

Противоречия здесь нет, поскольку это просто две разные формы записи адреса одного и того же сетевого компьютера. Человеку неудобно работать с числовым представлением IР-адреса, зато доменное имя запоминается легко, особенно если учесть, что, как правило, это имя имеет содержание: www.microsoft.com. Переводом доменных имен в связанные с ними IР-адреса и занимаются серверы службы имен доменов DNS. Например, имя сервера записывается как несколько слов, разделенных точками, например: sport.kuban.ru. Это отражает иерархическую, или доменную, структуру службы DNS. В нашем примере «sport» - это имя компьютера в домене (второго уровня) «kuban», который принадлежит домену (первого уровня) «ru». Такая структура службы DNS обеспечивает, с одной стороны, уникальность имен компьюте­ров в пределах всего Интернета, а с другой стороны — четкое разделение административной ответственности.

Служба передачи файлов (FTP).Прием и передача файлов составляют значительный процент от прочих Интернет-услуг. Необходимость в передаче файлов возникает, например, при приеме файлов и программ, при пересылке крупных документов (например, книг), а также при передаче архивных файлов, в которых запакованы большие объемы информации. Служба FTP имеет свои серверы в мировой сети, на которых хранятся архивы данных. Со стороны клиента для работы с серверами FTP может быть установлено специальное программное обеспечение, хотя в большинстве случаев браузеры WWWобладаютвстроенными возможностями для работы и по протоколу FTP.

Служба IRC (Internet Relay Chat) предназначена для прямого общения скольких человек в режиме реального времени. Иногда службу IRC называют чат-конференциями или просто чатом. В отличие от системы телеконференций, в которой общение между участниками обсуждения темы открыто всему миру, в системе IRC общение происходит только в пределах одного канала, в работе которого принимают участие обычно лишь несколько человек. Каждый пользователь может задать собственный канал и пригласить в него участников «беседы» или присоединиться к одному из открытых в данный момент каналов.

Клиентские программы для работы с серверами и сетями, поддерживающими сервис IRC, например, одна из наиболее популярных – программа mIRC.exe.

ICQ. Эта служба - одна из нескольких существующих в Интернете служб для мгновенного обмена сообщениями (рис. 9.1). Если два человека подключены к Интернету одновременно, то, в принципе, им почти ничто не мешает общаться друг с другом напрямую. Единственная проблема - знание сетевого IР-адреса человека, подключенного в данный момент к Интернету. Большинство пользователей не имеет постоянного IР-адреса - такой адрес выдается им на временной основе в момент установления соединения. Название службы ICQявляется акронимом выражения I seek yoи – Я тебя ищу. Для пользования этой службой надо зарегистрироваться на ее центральномсервере (http://www.icq.com) и получить персональный идентификационный номер UIN.

Наши рекомендации