Сетевой сервис и сетевые стандарты. Программы для работы в сети Интернет

Интернет – единая глобальная сеть, соединяющая между собой огромное ко­­личество сетей по всему миру (от англ. InterNet - "межсеть", "сеть се­тей"). Интернет возник в 60-е годы в США в результате экспериментов по созданию жиз­неспособной сети, которую нельзя было бы вывести из строя, уничтожив один или несколько командных пунктов с центральными компьютерами.

Интернет – децентрализованная сеть, не имеющая собственника или органа уп­­равления (хотя у каждой входящей в нее сети есть собственник и системный ад­министратор), функционирующая и развивающаяся путем добровольного (в том числе коммерческого) сотрудничества различных организаций и поль­зо­ва­телей на основе общих соглашений и стандартов (протоколов). Заре­гис­три­ро­ван­ные и пронумерованные стандарты, протоколы, спецификации Интернета образуют систему элек­тронных документов RFC (Request For Comments – запрос для пояснений).

Организации обеспечивающие подключение и предоставление услуг Ин­тер­нета – провайдеры (англ. Internet Service Providers, поставщики услуг Интернет) связаны высокоскоростными ма­ги­с­тральными каналами (кабельными, волоконно-оптическими, спут­ни­ко­вы­ми, радиорелейными). Отдельный компьютер или локальная сеть могут под­клю­чать­ся к провайдеру по выделенной линии (постоянное соединение) или по ком­му­тируемой линии (временное подключение через модем и обычную теле­фон­ную сеть). Первый способ более дорог, но обеспечивает более высокую ско­рость передачи данных.

Сигнал модема может передаваться:

· по обычному телефонному каналу – ком­му­тируемой линии;

· по выделенной телефонной линии;

· на базе техно­ло­гии ADSL (англ. Asymmetric Di­gital Subscriber Line – асимметричная цифровая або­нентская линия) по обыч­но­му те­лефонному каналу, не занимая его и позволяя неза­ви­си­­мо и одно­вре­мен­но вес­ти телефонные переговоры.

Скорость передачи данных через коммутируемую телефонную ли­нию – око­ло 30 Кбит/сек для аналоговых телефонных линий и 60–120 Кбит/сек для циф­ро­­вых. Для выделенных телефонных линий скорость передачи до 2 Мбит/сек, для волоконно-оптических и спутниковых линий связи – сотни Мбит/сек.

Постоянные соединения, в зависимости от используемого сетевого оборудования и вида кабельного канала, обеспечивают скорости передачи данных до 20-40 Мбит/сек и выше.

Работа Интернета основана на базовом протоколе TCP/IP, внедренном в 1983 г. На самом деле TCP/IP представляет из себя набор протоколов и состоит из нескольких основных уровней. Так, транспортный протокол TCP (Transmission Control Protocol – протокол уп­­рав­ления передачей) обеспечивает разбиение данных на небольшие па­кеты (сегменты) перед отправкой и сборку после доставки, а протокол маршрутизации IP (Internet Protocol – меж­сетевой протокол) отвечает за выбор маршрутов по раз­лич­ным узлам и сетям между от­пра­ви­­те­­лем и получателем (возможно, раз­лич­ных для разных пакетов из од­но­го со­­общения). Пакеты данных, под­го­­товленные по этому протоколу, называют дейта­грам­ма­ми IP (или IP-па­кетами). Они вклю­ча­ют сегменты, подготовленные по протоколу TCP, к которым до­бавлены адреса отправителя и полу­ча­теля.

Эти протоколы выполняют и другие задачи, например, протокол TCP включает фун­к­ции не только транспортного, но и сеансового уровня, не укладываясь полностью в разделение по уровням модели OSI, так как были разработаны до ее появ­ле­ния.

Каждая из информационных служб (информационных сервисов) Интернета ре­­шает свои задачи, используя свои прикладные протоколы, опирающиеся на ба­зовые протоколы TCP/IP. Наиболее известные из них:

· "Всемирная паутина" www (от англ. World Wide Web) дает возможность перемещения в ин­формационном пространстве документов, книг, новостей, фотографий, ри­сунков, учебных курсов, справочных материалов и т.д.; в настоящее время WWW, фактически, претендует на роль основного носителя "коллективной памяти" человечества. Служба www ис­поль­зует протокол http и подробнее рассмотрена далее.

· Электронная почта или E-Mail (от англ. Electronic mail) позволяет обмениваться по сети электронными письмами, к ко­то­рым могут прилагаться дополнительные файлы. С помощью службы E-mail мож­но также пе­ре­давать сообщения на сотовый телефон, коммуникатор, факс, пейджер. Для от­прав­ки кор­респонденции используется протокол SMTP (англ. Simple Mail Transfer Protocol – простой протокол передачи почты), для по­лучения ее из своего почтового ящика на почтовом сервере – про­то­кол POP (англ. Post Office Protocol – протокол почтового отделения). Про­токол IMAP (In­ternet Message Access Protocol – протокол доступа к сообщениям Ин­­тер­нета) позволяет хранить почту в своем почтовом ящи­ке на поч­то­вом сервере. Для вло­жения в письмо произвольных файлов при­меняется стан­­­дарт MIME (Mul­­tipurpose Internet Mail Extension – мно­го­целевое рас­ши­­рение почты Ин­тернета). Правила формирования адресов элек­трон­ной поч­ты рас­смат­ри­ваются далее. Для работы с элек­тронной почтой используются почтовые программы Out­look Ex­press (вхо­дит в Microsoft Internet Explorer), Microsoft Outlook (вхо­дит в Mic­ro­soft Office), Netscape Messenger (вхо­дила в браузер Netscape Com­mu­nicator), The Bat! и другие клиенты E-mail.

· Служба передачи файлов между удаленными компьютерами исполь­зу­ет­ся для передачи крупных файлов (ар­хи­вов, книг и т.п.) по протоколу FTP (англ. Fi­le Transfer Protocol – протокол пе­ре­дачи файлов). Для работы с FTP нужен FTP-клиент, который может быть встроен в интернет-обозреватель, файловый менеджер или поставляться отдельным приложением. FTP-клиенты отличаются между собой возможностью использования многопоточности (скачивания частей файлов в нескольких параллельных процессах), поддержкой "докачки" файла после обрыва связи, ограничениями на максимальный поддерживаемый размер файла.

· Служба телеконференций (новостей, новостных групп) UseNet News (News­groups) обес­пе­чи­вает про­­смотр материалов по выбранной тематике, при­­сылаемых на сер­­вер те­­ле­конференции са­ми­ми пользователями. Ис­поль­­­­зуются также списки рассылки, формируемые с учас­ти­ем адми­нис­т­ра­­тора (модератора) кон­фе­рен­ции и рассылаемые подпи­сав­шимся або­нен­­там.

· До повсеместного распространения Интернета функции телеконференций во мно­гом выполняли электронные доски объявлений BBS (англ. Bulletin Board System – сис­­тема электронных бюллетеней), наиболее известной системой которых яв­ля­ет­ся сеть Fi­doNet. Подключение к BBS осуществляется по малым компьютерным сетям с од­ним сервером с по­мощью модемов че­рез теле­фон­ные линии.

· Служба интерактивного общения IRC (Internet Relay Chat – дословно, Ин­­­тернет–трансляция болтовни), которую часто называют чат-кон­фе­рен­циями или просто чатом, поддерживает коллективный разговор, участ­ни­ки которого набирают свои реплики на клавиатуре и видят сказанное дру­ги­ми на мониторе.

· Система интернет-пейджинга ICQ (от англ. "I seek you" – я ищу тебя, "аська" на жаргоне отечественных интернет-пользователей) дает возможность обмениваться сообщениями и файлами в режиме реального времени. Эта система обеспечивает поиск сетевого ад­реса абонента (постоянного или временного), если он в данный момент под­ключен к сети, по его персональному идентификационному номеру UIN (англ. Universal Internet Number), получаемому при регистрации на цент­раль­ном сервере данной службы.

· Служба Telnet служит для удаленного управления (по протоколу Telnet) че­рез Интернет другими ком­пьютерами и установленными на них про­г­рам­мами, например, под­клю­ченными к аппаратуре для проведения эк­спе­риментов или вы­пол­ня­ю­щи­ми сложные математические расчеты.

· Важными направлениями использования Интернета являются Интернет-те­ле­фония (IP-телефония) – передача телефонных разговоров и факсов по Интер­не­ту в ко­ди­ровке, соответствующей протоколу IP, трансляция по Интернету ра­дио- и те­ле­визионных передач, беспроводное подключение к Интернету с мо­биль­ных те­ле­фонов: непосредственно по протоколу WAP (Wireless Application Protocol – про­токол бес­про­водных приложений), или через компьютер по протоколу GPRS (General Packet Ra­­dio Ser­vi­ce).

· Шифрование передаваемой по Интернету информации обеспечивается протоколом SSL (Se­cu­red Socket Layer).

Каждый компьютер, подключенный к Интернет, получает уникальный (не­по­в­то­ряющийся) IP-адрес (то есть адрес, соответствующий протоколу IP). При по­с­­тоянном подключении этот адрес закреплен за ним, при временном – вы­де­ля­ется временный (динамический) адрес на сеанс. При этом компьютер, который постоянно подключен к сети и через который подключаются временные по­ль­­зователи, называют хост-компьютером (от англ. host – хозяин).

Физический IP-адрес представляет собой 32-битное (4-х байтовое) двоичное чис­ло, которое принято записывать, переводя каждый байт в десятичное число, и разделяя их точками. Это число кодирует сеть, через которую компьютер вхо­дит в Интернет, и номер компьютера в сети. В зависимости от допустимого чис­ла компьютеров сети разделяются на три класса (табл. 3).

Таблица 3. Классы сетей A, B, C

Класс Адрес сети Адрес ком­пьютера в сети Макс. число ком­пью­те­ров в сети Первое число IP-адреса
A 7 бит 24 бита 224 – 2 = 16 777 214 0 – 126
B 14 бит 16 бит 216 – 2 = 65 534 128 – 191
C 21 бит 8 бит 28 – 2 = 254 192 – 223
               

Например, адрес 197.98.140.101 соответствует номеру узла 0.0.0.101 в сети 197.98.140.0 класса C.

Чтобы отделить адрес сети от адреса хоста, используется маска подсети, также представляющая собой 32-битное число. По умолчанию сетям класса A соответствует маска 255.0.0.0, класса B – 255.255.0.0, а сетям класса C – 255.255.255.0, то есть, в двоичном представлении маски, позиции, соответствующие адресу сети, закрыты единицами. Маска подсети может использоваться и для других целей, например, для логического разделения локальных сетей на подсети меньшего масштаба.

Несколько IP-адресов зарезервировано для специальных целей, например, ад­рес 127.0.0.1обеспечивает обращение пользователя к себе самому (ис­поль­зу­ет­ся для тестирования программ и отладки Web-приложений на локальном сервере). Номер сети с номером компьютера, равным 0, обозначает всю эту сеть, а с максимально возможным номером (255 для сети C) – используется для широковещательного сообщения, отправляемого всем компьютерам сети.

Пользователям удобнее работать не с физическими адресами, а с доменными име­нами сетей и компьютеров в Интернет. Такое имя состоит из разделенных точ­ками символьных обозначений доменов (от лат. dominium – владение.) – фрагментов сети. Справа налево ука­зываются самый обширный, старший домен (первый или верхний уровень), затем более млад­шие, вложенные один в другой домены, и так далее до самого ле­вого до­ме­на, соот­вет­ст­вующего конечному узлу сети. В начале доменного имени перед именем сервера может указываться служба Интернета, в ко­то­рой работает данный узел сети (например, www. – "всемирная паутина" или ftp. – служба пересылки файлов). Часто домены третьего и ниже уровней называют субдоменами или поддоменами.

Домены верхнего уровня обозначают чаще всего двумя (страна) или тремя (тип ор­га­ни­за­ции) буквами. Некоторые из них приведены в табл. 4.

Например, microsoft.com – доменный адрес компании Microsoft в до­ме­не ком­мер­ческих серверов, а домен cit.sibstrin.ru может означать адрес субдомена локальной сети центра информационных технологий cit, яв­ля­ющейся поддоменом сети НГАСУ (Сибстрин) в домене русскоязычных сер­ве­ров ru.

Однозначное соответствие между физическими и доменными именами обес­пе­чивается специальной системой доменных имен Интернета – DNS (англ. Do­­main Na­me System), состоящей из компьютеров, которые на­зы­ва­ют DNS-сер­ве­рами (у каж­­дого домена есть обслуживающий его DNS-сервер). Поль­зо­ва­тель име­ет де­ло с до­мен­ными именами, а передача данных между ком­пь­ю­те­ра­ми осу­­щест­вля­ет­ся по фи­зическим адресам, автоматически определяемым пу­тем об­ращения к со­от­вет­ст­вующим DNS-серверам.

Таблица 4. Некоторые домены верхнего уровня

Домен верхнего уровня Страна Домен верхнего уровня Тип организации
ca Канада com Коммерческая
de Германия edu Образовательная
jp Япония gov Правительственная (США)
ru Россия int Международная
uk Велико­бри­та­ния net Компьютерная сеть
us США org Некоммерческая

На вершине иерархии DNS-серверов стоят серверы корневой зоны с именами a.root_servers.net, b.root_servers.net и т.д., дублирующие информацию друг друга. Локальный сервер, получив от машины-клиента запрос на соединение с некоторым адресом, передает его локальному DNS-серверу, который выделит из запроса доменное имя и либо найдет соответствующий IP у себя в базе данных, либо обратится к одному из серверов корневой зоны. Последний вернет указатель на DNS-сервер известного ему домена, в который входит запрошенный адрес, и полностью устранится из процесса. Такие вложенные запросы могут повторяться, причем каждый раз локальный DNS-сервер будет обращаться к серверу имен все более низкого уровня. Только после окончания этого многоступенчатого процесса DNS-сервер вернет преобразованный адрес компьютеру, сделавшему запрос, и пользователь сможет, наконец, увидеть на своем мониторе, что же за информация расположена по введенному им адресу.

Доменные имена и физические IP-адреса распределяются международным ко­ор­ди­на­ци­он­ным центром доменных имен и IP-адресов (ICANN), в который входят по 5 представителей от каж­дого континента (адрес в Интернет www.icann.org).

Для доступа к файлу (программе, документу) в Интернете нужно указать URL-адрес (англ. Uniform Resource Locator – унифицированный указатель ресурсов), состоящий из:

· названия протокола, используемого для доступа к файлу и отделенного от по­следующей части дво­ето­чи­ем и двумя косыми чертами;

· доменного имени компьютера, отделяемого от последующего содержимого косой чер­той;

· полного имени файла на компьютере (без указания логического диска), вклю­чающего (возможно) путь доступа (перечень вложенных каталогов), соб­ст­­­венно имя и расширение файла.

В URL-адресе могут использоваться только латинские буквы (строчные и про­писные буквы считаются различными) без пробелов. Путь и имя файла мо­гут от­сутствовать, что соответствует обращению к самому компьютеру (сер­ве­ру).

Например, URL-адрес вида http://www.students.informatika.ru/library/txt/klassika.htm означает, что файл klassika с расширением htm расположен в подкаталоге txt ка­та­лога library на сервере students домена informatika.ru. Этот сервер относится к службе www, а для дос­ту­па к файлу используется протокол http.

Адрес ftp://ftp.netscape.com/books/history.doc используется при получении фай­­ла history.doc, расположенного на сервере netscape коммерческого домена Ин­­тернета с использованием протокола передачи файлов ftp (службы ftp).

Весьма часто Вам встретятся URL, не содержащие имени html-файла, тем не менее, при вводе такого URL, мы все же попадаем на конкретную Web-страницу. Это означает, что документ имеет имя по умолчанию, которое может назначаться при администрировании сервера. Чаще всего это имя index.html, так что URL http://www.host.ru может означать совершенно то же самое, что http://www.host.ru/index.html. Префикс протокола http://, используемого по умолчанию, при записи полного URL также обычно опускают.

Для работы с электронной почтой необходимо зарегистрировать на одном из почтовых сер­веров Интернета свой почтовый ящик, которому присваивается адрес элек­трон­­ной почты. Такой адрес состоит из доменного имени сервера и за­пи­сан­но­го перед ним логина (имени почтового ящика, его выбирает пользователь при ре­ги­с­тра­ции). Две эти части адреса разделяются символом @ (читается "эт", в России часто ис­поль­зу­ют жаргонное выражение "собака").

Например, [email protected] – почтовый ящик абонента, выбравшего имя director на сервере contora.ru.

Как указано выше, ведущей и на­и­бо­­лее широко используемой на сегодняшний день службой Интернета является "Всемирная паутина" World Wide Web (www), которая охватила большой объем информационных ресурсов. В этой системе легко найти но­вости, справочные и нормативные материалы, книги, статьи, рефераты, программное обеспечение, мне­ния и советы экспертов практически по любой теме. Также в www содержится огромное количество мультимедийного контента, такого как графика и анимация, видео- и аудиозаписи, онлайн-игры и т.д.

Служба www основана на представлении документов в виде гипертекста – тек­ста, позволяющего не только последовательное прочтение. Суть дела состоит в том, что элементы гипертекста, такие как фразы, отдельные слова, рисунки могут отсылать к другим фраг­ментам это­го же текста или другим документам, расположенным, воз­мож­но, в другом ком­пьютере на другом сервере. Физическое местоположение адресуемого ссылкой сервера не имеет при этом значения. Ссылки (гиперссылки, ги­пер­свя­зи) обыч­но помечаются осо­бым цве­том и шрифтом, а переход по ним вы­пол­ня­­ет­ся ав­то­ма­тически после щел­ч­ка мышью по метке. Таким об­ра­зом, раз­но­об­разная ин­фор­ма­ция оказывается связанной между собой пе­ре­пле­та­ющейся па­утиной ссылок, а введенные в систему коллективные знания че­ло­ве­чества в оп­ределенной мере уподобляются индивидуальной памяти, спле­та­е­мой в одно це­лое ассоциациями и смысловыми связями.

Концепция www на основе гипертекстов была разработана в 1989 г. английским ученым Тимоти Бернерс-Ли для Европейской Лаборатории Физики элементарных частиц, базирующейся в Швейцарии и объединяющей физиков из различных стран мира. Сама кон­цеп­ция гипертекста была предложена американским ученым Теодором Хольмом Нельсоном в 1965 г.

Документ, представленный в WWW называют Web-страницей, а компьютер, на котором расположены такие документы – Web-сервером. Web-страницы соз­да­ются с помощью языка разметки гипертекстов HTML (англ. HyperText Markup Lan­gu­a­ge) или более мощного языка XML (англ. eXtensible Markup Lan­gu­a­ge – расширенный язык разметки), есть и другие форматы разметки.

Как правило, формат разметки позволяет определить гиперссылки и организацию текста, вклю­чая в него управляющие символы – теги (от англ. tag – метка, ярлык). Фор­ма­ти­ро­ва­ние Web-страницы на мониторе определяется как управляющими разметкой тегами, так и конкретными настройками компьютера. На Web-страницы мож­­но помещать рисунки в одном из трех основных гра­фи­чес­ких форматов Web – gif, jpg(jpeg), png, мультимедийные объекты (flash-анимацию, зву­­ковые и видео–файлы), формы для диалога с пользователем, эле­мен­ты уп­рав­­ления (ActiveX), запускающие программы. Такие программы чаще всего составляются на языке программирования Java (Ява), предназначенном для поддержки Web-страниц. Трансляторы с это­го языка являются ин­тер­претаторами, что позволяет писать универсальные про­г­раммы, работающие на разных ком­пь­ютерах и в разных операционных сис­те­мах.

Набор связанных в одно целое гиперссылками и переходами Web-страниц об­разует Web-сайт (он англ. site – место, позиция).

Для доступа к Web-страницам используется протокол передачи гипертекста HTTP (Hyper Text Transfer Protocol).

Просмотр Web-страниц и перемещение между ними в информационном про­­ст­­­ранстве сети по гиперссылкам (навигацию в сети) обеспечивают специ­а­ль­ные про­граммы Web-обозреватели ("навигаторы", самое частое наименование – браузеры, от англ. browsе – смотреть, пролистывать). Браузеры являются основными программами-клиентами сервиса www. В настоящее время на­и­бо­лее час­то используются браузеры Mozilla Firefox, Opera, Google Chrome (компании Google), Safari, Internet Explorer (компании Microsoft). В недавнем прошлом популярных браузеров было всего два - Internet Explorer и Netscape Navigator (компании Net­scape).

Браузеры постоянно развивались со времен зарождения WWW, становясь все более важной программой типичного персонального компьютера. Современный браузер — это комплексное приложение как для обработки и вывода различных составляющих web‑страницы, так и для предоставления интерфейса между web‑сайтом и его посетителями. Практически все популярные браузеры распространяются бесплатно или в комплекте с другими приложениями, например, браузер Internet Explorer входит в состав операционной системы Windows, браузеры Mozilla Firefox и Opera последних версий являются бесплатными программами, браузер Safari распространяется как часть операционной системы Mac OS.

Управление любым современным браузером достаточно стандартизовано. Как минимум, для комфортной работы в обозревателе необходимы следующие инструменты:

· адресная строка (панель адреса, панель навигации, Toolbar) содержит и позволяет ввести URL‑адрес требуемой страницы или путь к локально расположенному документу, а также размещает стандартные кнопки перехода по страницам ("Вперед", "Назад", "Обновить", "Остановить", "Домой"). В некоторых браузерах стандартные кнопки вынесены на отдельную панель инструментов;

· строка состояния (строка статуса) — нижнее информационное поле окна браузера, содержащее важную дополнительную информацию. Так, в процессе загрузки web‑страницы в строке состояния выводится информация о ее ходе, а при наведении курсора мыши на ссылку в строке состояния показывается соответствующий ссылке адрес URL;

· панель вкладок (иногда панель закладок, Tab bar) — позволяет открывать в текущем окне дополнительные web‑страницы и переключаться между ними. Концепция вкладок позволяет, не отказываясь от возможности открыть ссылку в новом окне браузера, более удобно управлять наборами одновременно открытых web‑страниц.

Указанные панели инструментов обычно включены изначально, а управлять ими можно из меню Вид (View) браузера.

Как правило, если не считать личных предпочтений, чаще всего пользователи Интернета работают с сайтами поисковых систем. Их использование очень просто – поисковые серверы Web выдают подборку всех известных им до­­кументов www, со­дер­жащих ключевые слова из сделанного пользователем запроса, при этом запрос делается на естественном языке. Са­мые известные и эф­фек­тив­ные в Рунете (русскоязычном сегменте Интернета) поисковые системы – Google, Яндекс и Mail.Ru.

Быстрота поиска информации в таких системах обеспечивается невидимой для пользователя ра­­ботой специальных программ ("поисковых роботов"), непрерывно сканирующих различные web–сайты и обновляющих списки встречающихся на них терминов (индексы поисковой сис­те­мы). Таким образом, реально поиск происходит не по "всем серверам Интернета", что было бы нереализуемо технически, а по базе данных поисковой машины, и отсутствие подходящей информации, найденной по запросу, еще не означает, что ее нет в Сети - можно попробовать воспользоваться другим поисковым средством или каталогом ресурсов. Базы данных поискового сервера пополняются не только автоматически. На любой крупной поисковой машине есть возможность проиндексировать свой сайт и добавить его в базу данных. Преимущество поискового сервера – простота работы с ним, недостаток – низкая степень отбора документов по запросу.

Как поисковыми серверами, так и отдельными разработчиками Web-сайтов формируются также рубрикаторы или каталоги – иерархические структуры тем и понятий, пе­ре­­двигаясь по которым пользователь может найти нужные документы или сайты. Пополнение каталога обычно производится самими пользователями после проверки введенных ими данных администрацией сервера. Каталог ресурсов всегда лучше упорядочен и структурирован, но требуется время для поиска нужной категории, которую, к тому же, не всегда легко определить. Кроме того, объем каталога всегда значительно меньше, чем количество сайтов, проиндексированное поисковой машиной.

Web-сайты также можно классифицировать с точки зрения технологии их разработки. Исторически сложившееся в русском языке словосочетание "язык HTML" не отражает того факта, что HTML и XML не являются языками программирования. Тем не менее, чаще всего современная Web-страница – динамическая, то есть, является результатом работы серверной программы, формирующей страницу в ответ на запрос пользователем того или иного адреса URL (в отличие от статической страницы в разметке HTML, хранящейся на сервере в виде файла с расширением .htm или .html). Основными языками серверного программирования являются PHP, Perl, Python и ряд других. Существуют и клиентские языки Web-программирования, такие как Javascript и VB Script. Программа на таком языке, включенная в текст Web-страницы, выполняется не на сервере, а на компьютере-клиенте, с помощью интерпретатора, включенного в браузер пользователя или отдельно установленного.

Наши рекомендации