Сетевой сервис и сетевые стандарты. Программы для работы в сети Интернет
Интернет – единая глобальная сеть, соединяющая между собой огромное количество сетей по всему миру (от англ. InterNet - "межсеть", "сеть сетей"). Интернет возник в 60-е годы в США в результате экспериментов по созданию жизнеспособной сети, которую нельзя было бы вывести из строя, уничтожив один или несколько командных пунктов с центральными компьютерами.
Интернет – децентрализованная сеть, не имеющая собственника или органа управления (хотя у каждой входящей в нее сети есть собственник и системный администратор), функционирующая и развивающаяся путем добровольного (в том числе коммерческого) сотрудничества различных организаций и пользователей на основе общих соглашений и стандартов (протоколов). Зарегистрированные и пронумерованные стандарты, протоколы, спецификации Интернета образуют систему электронных документов RFC (Request For Comments – запрос для пояснений).
Организации обеспечивающие подключение и предоставление услуг Интернета – провайдеры (англ. Internet Service Providers, поставщики услуг Интернет) связаны высокоскоростными магистральными каналами (кабельными, волоконно-оптическими, спутниковыми, радиорелейными). Отдельный компьютер или локальная сеть могут подключаться к провайдеру по выделенной линии (постоянное соединение) или по коммутируемой линии (временное подключение через модем и обычную телефонную сеть). Первый способ более дорог, но обеспечивает более высокую скорость передачи данных.
Сигнал модема может передаваться:
· по обычному телефонному каналу – коммутируемой линии;
· по выделенной телефонной линии;
· на базе технологии ADSL (англ. Asymmetric Digital Subscriber Line – асимметричная цифровая абонентская линия) по обычному телефонному каналу, не занимая его и позволяя независимо и одновременно вести телефонные переговоры.
Скорость передачи данных через коммутируемую телефонную линию – около 30 Кбит/сек для аналоговых телефонных линий и 60–120 Кбит/сек для цифровых. Для выделенных телефонных линий скорость передачи до 2 Мбит/сек, для волоконно-оптических и спутниковых линий связи – сотни Мбит/сек.
Постоянные соединения, в зависимости от используемого сетевого оборудования и вида кабельного канала, обеспечивают скорости передачи данных до 20-40 Мбит/сек и выше.
Работа Интернета основана на базовом протоколе TCP/IP, внедренном в 1983 г. На самом деле TCP/IP представляет из себя набор протоколов и состоит из нескольких основных уровней. Так, транспортный протокол TCP (Transmission Control Protocol – протокол управления передачей) обеспечивает разбиение данных на небольшие пакеты (сегменты) перед отправкой и сборку после доставки, а протокол маршрутизации IP (Internet Protocol – межсетевой протокол) отвечает за выбор маршрутов по различным узлам и сетям между отправителем и получателем (возможно, различных для разных пакетов из одного сообщения). Пакеты данных, подготовленные по этому протоколу, называют дейтаграммами IP (или IP-пакетами). Они включают сегменты, подготовленные по протоколу TCP, к которым добавлены адреса отправителя и получателя.
Эти протоколы выполняют и другие задачи, например, протокол TCP включает функции не только транспортного, но и сеансового уровня, не укладываясь полностью в разделение по уровням модели OSI, так как были разработаны до ее появления.
Каждая из информационных служб (информационных сервисов) Интернета решает свои задачи, используя свои прикладные протоколы, опирающиеся на базовые протоколы TCP/IP. Наиболее известные из них:
· "Всемирная паутина" www (от англ. World Wide Web) дает возможность перемещения в информационном пространстве документов, книг, новостей, фотографий, рисунков, учебных курсов, справочных материалов и т.д.; в настоящее время WWW, фактически, претендует на роль основного носителя "коллективной памяти" человечества. Служба www использует протокол http и подробнее рассмотрена далее.
· Электронная почта или E-Mail (от англ. Electronic mail) позволяет обмениваться по сети электронными письмами, к которым могут прилагаться дополнительные файлы. С помощью службы E-mail можно также передавать сообщения на сотовый телефон, коммуникатор, факс, пейджер. Для отправки корреспонденции используется протокол SMTP (англ. Simple Mail Transfer Protocol – простой протокол передачи почты), для получения ее из своего почтового ящика на почтовом сервере – протокол POP (англ. Post Office Protocol – протокол почтового отделения). Протокол IMAP (Internet Message Access Protocol – протокол доступа к сообщениям Интернета) позволяет хранить почту в своем почтовом ящике на почтовом сервере. Для вложения в письмо произвольных файлов применяется стандарт MIME (Multipurpose Internet Mail Extension – многоцелевое расширение почты Интернета). Правила формирования адресов электронной почты рассматриваются далее. Для работы с электронной почтой используются почтовые программы Outlook Express (входит в Microsoft Internet Explorer), Microsoft Outlook (входит в Microsoft Office), Netscape Messenger (входила в браузер Netscape Communicator), The Bat! и другие клиенты E-mail.
· Служба передачи файлов между удаленными компьютерами используется для передачи крупных файлов (архивов, книг и т.п.) по протоколу FTP (англ. File Transfer Protocol – протокол передачи файлов). Для работы с FTP нужен FTP-клиент, который может быть встроен в интернет-обозреватель, файловый менеджер или поставляться отдельным приложением. FTP-клиенты отличаются между собой возможностью использования многопоточности (скачивания частей файлов в нескольких параллельных процессах), поддержкой "докачки" файла после обрыва связи, ограничениями на максимальный поддерживаемый размер файла.
· Служба телеконференций (новостей, новостных групп) UseNet News (Newsgroups) обеспечивает просмотр материалов по выбранной тематике, присылаемых на сервер телеконференции самими пользователями. Используются также списки рассылки, формируемые с участием администратора (модератора) конференции и рассылаемые подписавшимся абонентам.
· До повсеместного распространения Интернета функции телеконференций во многом выполняли электронные доски объявлений BBS (англ. Bulletin Board System – система электронных бюллетеней), наиболее известной системой которых является сеть FidoNet. Подключение к BBS осуществляется по малым компьютерным сетям с одним сервером с помощью модемов через телефонные линии.
· Служба интерактивного общения IRC (Internet Relay Chat – дословно, Интернет–трансляция болтовни), которую часто называют чат-конференциями или просто чатом, поддерживает коллективный разговор, участники которого набирают свои реплики на клавиатуре и видят сказанное другими на мониторе.
· Система интернет-пейджинга ICQ (от англ. "I seek you" – я ищу тебя, "аська" на жаргоне отечественных интернет-пользователей) дает возможность обмениваться сообщениями и файлами в режиме реального времени. Эта система обеспечивает поиск сетевого адреса абонента (постоянного или временного), если он в данный момент подключен к сети, по его персональному идентификационному номеру UIN (англ. Universal Internet Number), получаемому при регистрации на центральном сервере данной службы.
· Служба Telnet служит для удаленного управления (по протоколу Telnet) через Интернет другими компьютерами и установленными на них программами, например, подключенными к аппаратуре для проведения экспериментов или выполняющими сложные математические расчеты.
· Важными направлениями использования Интернета являются Интернет-телефония (IP-телефония) – передача телефонных разговоров и факсов по Интернету в кодировке, соответствующей протоколу IP, трансляция по Интернету радио- и телевизионных передач, беспроводное подключение к Интернету с мобильных телефонов: непосредственно по протоколу WAP (Wireless Application Protocol – протокол беспроводных приложений), или через компьютер по протоколу GPRS (General Packet Radio Service).
· Шифрование передаваемой по Интернету информации обеспечивается протоколом SSL (Secured Socket Layer).
Каждый компьютер, подключенный к Интернет, получает уникальный (неповторяющийся) IP-адрес (то есть адрес, соответствующий протоколу IP). При постоянном подключении этот адрес закреплен за ним, при временном – выделяется временный (динамический) адрес на сеанс. При этом компьютер, который постоянно подключен к сети и через который подключаются временные пользователи, называют хост-компьютером (от англ. host – хозяин).
Физический IP-адрес представляет собой 32-битное (4-х байтовое) двоичное число, которое принято записывать, переводя каждый байт в десятичное число, и разделяя их точками. Это число кодирует сеть, через которую компьютер входит в Интернет, и номер компьютера в сети. В зависимости от допустимого числа компьютеров сети разделяются на три класса (табл. 3).
Таблица 3. Классы сетей A, B, C
Класс | Адрес сети | Адрес компьютера в сети | Макс. число компьютеров в сети | Первое число IP-адреса | |||
A | 7 бит | 24 бита | 224 – 2 = 16 777 214 | 0 – 126 | |||
B | 14 бит | 16 бит | 216 – 2 = 65 534 | 128 – 191 | |||
C | 21 бит | 8 бит | 28 – 2 = 254 | 192 – 223 | |||
Например, адрес 197.98.140.101 соответствует номеру узла 0.0.0.101 в сети 197.98.140.0 класса C.
Чтобы отделить адрес сети от адреса хоста, используется маска подсети, также представляющая собой 32-битное число. По умолчанию сетям класса A соответствует маска 255.0.0.0, класса B – 255.255.0.0, а сетям класса C – 255.255.255.0, то есть, в двоичном представлении маски, позиции, соответствующие адресу сети, закрыты единицами. Маска подсети может использоваться и для других целей, например, для логического разделения локальных сетей на подсети меньшего масштаба.
Несколько IP-адресов зарезервировано для специальных целей, например, адрес 127.0.0.1обеспечивает обращение пользователя к себе самому (используется для тестирования программ и отладки Web-приложений на локальном сервере). Номер сети с номером компьютера, равным 0, обозначает всю эту сеть, а с максимально возможным номером (255 для сети C) – используется для широковещательного сообщения, отправляемого всем компьютерам сети.
Пользователям удобнее работать не с физическими адресами, а с доменными именами сетей и компьютеров в Интернет. Такое имя состоит из разделенных точками символьных обозначений доменов (от лат. dominium – владение.) – фрагментов сети. Справа налево указываются самый обширный, старший домен (первый или верхний уровень), затем более младшие, вложенные один в другой домены, и так далее до самого левого домена, соответствующего конечному узлу сети. В начале доменного имени перед именем сервера может указываться служба Интернета, в которой работает данный узел сети (например, www. – "всемирная паутина" или ftp. – служба пересылки файлов). Часто домены третьего и ниже уровней называют субдоменами или поддоменами.
Домены верхнего уровня обозначают чаще всего двумя (страна) или тремя (тип организации) буквами. Некоторые из них приведены в табл. 4.
Например, microsoft.com – доменный адрес компании Microsoft в домене коммерческих серверов, а домен cit.sibstrin.ru может означать адрес субдомена локальной сети центра информационных технологий cit, являющейся поддоменом сети НГАСУ (Сибстрин) в домене русскоязычных серверов ru.
Однозначное соответствие между физическими и доменными именами обеспечивается специальной системой доменных имен Интернета – DNS (англ. Domain Name System), состоящей из компьютеров, которые называют DNS-серверами (у каждого домена есть обслуживающий его DNS-сервер). Пользователь имеет дело с доменными именами, а передача данных между компьютерами осуществляется по физическим адресам, автоматически определяемым путем обращения к соответствующим DNS-серверам.
Таблица 4. Некоторые домены верхнего уровня
Домен верхнего уровня | Страна | Домен верхнего уровня | Тип организации |
ca | Канада | com | Коммерческая |
de | Германия | edu | Образовательная |
jp | Япония | gov | Правительственная (США) |
ru | Россия | int | Международная |
uk | Великобритания | net | Компьютерная сеть |
us | США | org | Некоммерческая |
На вершине иерархии DNS-серверов стоят серверы корневой зоны с именами a.root_servers.net, b.root_servers.net и т.д., дублирующие информацию друг друга. Локальный сервер, получив от машины-клиента запрос на соединение с некоторым адресом, передает его локальному DNS-серверу, который выделит из запроса доменное имя и либо найдет соответствующий IP у себя в базе данных, либо обратится к одному из серверов корневой зоны. Последний вернет указатель на DNS-сервер известного ему домена, в который входит запрошенный адрес, и полностью устранится из процесса. Такие вложенные запросы могут повторяться, причем каждый раз локальный DNS-сервер будет обращаться к серверу имен все более низкого уровня. Только после окончания этого многоступенчатого процесса DNS-сервер вернет преобразованный адрес компьютеру, сделавшему запрос, и пользователь сможет, наконец, увидеть на своем мониторе, что же за информация расположена по введенному им адресу.
Доменные имена и физические IP-адреса распределяются международным координационным центром доменных имен и IP-адресов (ICANN), в который входят по 5 представителей от каждого континента (адрес в Интернет www.icann.org).
Для доступа к файлу (программе, документу) в Интернете нужно указать URL-адрес (англ. Uniform Resource Locator – унифицированный указатель ресурсов), состоящий из:
· названия протокола, используемого для доступа к файлу и отделенного от последующей части двоеточием и двумя косыми чертами;
· доменного имени компьютера, отделяемого от последующего содержимого косой чертой;
· полного имени файла на компьютере (без указания логического диска), включающего (возможно) путь доступа (перечень вложенных каталогов), собственно имя и расширение файла.
В URL-адресе могут использоваться только латинские буквы (строчные и прописные буквы считаются различными) без пробелов. Путь и имя файла могут отсутствовать, что соответствует обращению к самому компьютеру (серверу).
Например, URL-адрес вида http://www.students.informatika.ru/library/txt/klassika.htm означает, что файл klassika с расширением htm расположен в подкаталоге txt каталога library на сервере students домена informatika.ru. Этот сервер относится к службе www, а для доступа к файлу используется протокол http.
Адрес ftp://ftp.netscape.com/books/history.doc используется при получении файла history.doc, расположенного на сервере netscape коммерческого домена Интернета с использованием протокола передачи файлов ftp (службы ftp).
Весьма часто Вам встретятся URL, не содержащие имени html-файла, тем не менее, при вводе такого URL, мы все же попадаем на конкретную Web-страницу. Это означает, что документ имеет имя по умолчанию, которое может назначаться при администрировании сервера. Чаще всего это имя index.html, так что URL http://www.host.ru может означать совершенно то же самое, что http://www.host.ru/index.html. Префикс протокола http://, используемого по умолчанию, при записи полного URL также обычно опускают.
Для работы с электронной почтой необходимо зарегистрировать на одном из почтовых серверов Интернета свой почтовый ящик, которому присваивается адрес электронной почты. Такой адрес состоит из доменного имени сервера и записанного перед ним логина (имени почтового ящика, его выбирает пользователь при регистрации). Две эти части адреса разделяются символом @ (читается "эт", в России часто используют жаргонное выражение "собака").
Например, [email protected] – почтовый ящик абонента, выбравшего имя director на сервере contora.ru.
Как указано выше, ведущей и наиболее широко используемой на сегодняшний день службой Интернета является "Всемирная паутина" World Wide Web (www), которая охватила большой объем информационных ресурсов. В этой системе легко найти новости, справочные и нормативные материалы, книги, статьи, рефераты, программное обеспечение, мнения и советы экспертов практически по любой теме. Также в www содержится огромное количество мультимедийного контента, такого как графика и анимация, видео- и аудиозаписи, онлайн-игры и т.д.
Служба www основана на представлении документов в виде гипертекста – текста, позволяющего не только последовательное прочтение. Суть дела состоит в том, что элементы гипертекста, такие как фразы, отдельные слова, рисунки могут отсылать к другим фрагментам этого же текста или другим документам, расположенным, возможно, в другом компьютере на другом сервере. Физическое местоположение адресуемого ссылкой сервера не имеет при этом значения. Ссылки (гиперссылки, гиперсвязи) обычно помечаются особым цветом и шрифтом, а переход по ним выполняется автоматически после щелчка мышью по метке. Таким образом, разнообразная информация оказывается связанной между собой переплетающейся паутиной ссылок, а введенные в систему коллективные знания человечества в определенной мере уподобляются индивидуальной памяти, сплетаемой в одно целое ассоциациями и смысловыми связями.
Концепция www на основе гипертекстов была разработана в 1989 г. английским ученым Тимоти Бернерс-Ли для Европейской Лаборатории Физики элементарных частиц, базирующейся в Швейцарии и объединяющей физиков из различных стран мира. Сама концепция гипертекста была предложена американским ученым Теодором Хольмом Нельсоном в 1965 г.
Документ, представленный в WWW называют Web-страницей, а компьютер, на котором расположены такие документы – Web-сервером. Web-страницы создаются с помощью языка разметки гипертекстов HTML (англ. HyperText Markup Language) или более мощного языка XML (англ. eXtensible Markup Language – расширенный язык разметки), есть и другие форматы разметки.
Как правило, формат разметки позволяет определить гиперссылки и организацию текста, включая в него управляющие символы – теги (от англ. tag – метка, ярлык). Форматирование Web-страницы на мониторе определяется как управляющими разметкой тегами, так и конкретными настройками компьютера. На Web-страницы можно помещать рисунки в одном из трех основных графических форматов Web – gif, jpg(jpeg), png, мультимедийные объекты (flash-анимацию, звуковые и видео–файлы), формы для диалога с пользователем, элементы управления (ActiveX), запускающие программы. Такие программы чаще всего составляются на языке программирования Java (Ява), предназначенном для поддержки Web-страниц. Трансляторы с этого языка являются интерпретаторами, что позволяет писать универсальные программы, работающие на разных компьютерах и в разных операционных системах.
Набор связанных в одно целое гиперссылками и переходами Web-страниц образует Web-сайт (он англ. site – место, позиция).
Для доступа к Web-страницам используется протокол передачи гипертекста HTTP (Hyper Text Transfer Protocol).
Просмотр Web-страниц и перемещение между ними в информационном пространстве сети по гиперссылкам (навигацию в сети) обеспечивают специальные программы Web-обозреватели ("навигаторы", самое частое наименование – браузеры, от англ. browsе – смотреть, пролистывать). Браузеры являются основными программами-клиентами сервиса www. В настоящее время наиболее часто используются браузеры Mozilla Firefox, Opera, Google Chrome (компании Google), Safari, Internet Explorer (компании Microsoft). В недавнем прошлом популярных браузеров было всего два - Internet Explorer и Netscape Navigator (компании Netscape).
Браузеры постоянно развивались со времен зарождения WWW, становясь все более важной программой типичного персонального компьютера. Современный браузер — это комплексное приложение как для обработки и вывода различных составляющих web‑страницы, так и для предоставления интерфейса между web‑сайтом и его посетителями. Практически все популярные браузеры распространяются бесплатно или в комплекте с другими приложениями, например, браузер Internet Explorer входит в состав операционной системы Windows, браузеры Mozilla Firefox и Opera последних версий являются бесплатными программами, браузер Safari распространяется как часть операционной системы Mac OS.
Управление любым современным браузером достаточно стандартизовано. Как минимум, для комфортной работы в обозревателе необходимы следующие инструменты:
· адресная строка (панель адреса, панель навигации, Toolbar) содержит и позволяет ввести URL‑адрес требуемой страницы или путь к локально расположенному документу, а также размещает стандартные кнопки перехода по страницам ("Вперед", "Назад", "Обновить", "Остановить", "Домой"). В некоторых браузерах стандартные кнопки вынесены на отдельную панель инструментов;
· строка состояния (строка статуса) — нижнее информационное поле окна браузера, содержащее важную дополнительную информацию. Так, в процессе загрузки web‑страницы в строке состояния выводится информация о ее ходе, а при наведении курсора мыши на ссылку в строке состояния показывается соответствующий ссылке адрес URL;
· панель вкладок (иногда панель закладок, Tab bar) — позволяет открывать в текущем окне дополнительные web‑страницы и переключаться между ними. Концепция вкладок позволяет, не отказываясь от возможности открыть ссылку в новом окне браузера, более удобно управлять наборами одновременно открытых web‑страниц.
Указанные панели инструментов обычно включены изначально, а управлять ими можно из меню Вид (View) браузера.
Как правило, если не считать личных предпочтений, чаще всего пользователи Интернета работают с сайтами поисковых систем. Их использование очень просто – поисковые серверы Web выдают подборку всех известных им документов www, содержащих ключевые слова из сделанного пользователем запроса, при этом запрос делается на естественном языке. Самые известные и эффективные в Рунете (русскоязычном сегменте Интернета) поисковые системы – Google, Яндекс и Mail.Ru.
Быстрота поиска информации в таких системах обеспечивается невидимой для пользователя работой специальных программ ("поисковых роботов"), непрерывно сканирующих различные web–сайты и обновляющих списки встречающихся на них терминов (индексы поисковой системы). Таким образом, реально поиск происходит не по "всем серверам Интернета", что было бы нереализуемо технически, а по базе данных поисковой машины, и отсутствие подходящей информации, найденной по запросу, еще не означает, что ее нет в Сети - можно попробовать воспользоваться другим поисковым средством или каталогом ресурсов. Базы данных поискового сервера пополняются не только автоматически. На любой крупной поисковой машине есть возможность проиндексировать свой сайт и добавить его в базу данных. Преимущество поискового сервера – простота работы с ним, недостаток – низкая степень отбора документов по запросу.
Как поисковыми серверами, так и отдельными разработчиками Web-сайтов формируются также рубрикаторы или каталоги – иерархические структуры тем и понятий, передвигаясь по которым пользователь может найти нужные документы или сайты. Пополнение каталога обычно производится самими пользователями после проверки введенных ими данных администрацией сервера. Каталог ресурсов всегда лучше упорядочен и структурирован, но требуется время для поиска нужной категории, которую, к тому же, не всегда легко определить. Кроме того, объем каталога всегда значительно меньше, чем количество сайтов, проиндексированное поисковой машиной.
Web-сайты также можно классифицировать с точки зрения технологии их разработки. Исторически сложившееся в русском языке словосочетание "язык HTML" не отражает того факта, что HTML и XML не являются языками программирования. Тем не менее, чаще всего современная Web-страница – динамическая, то есть, является результатом работы серверной программы, формирующей страницу в ответ на запрос пользователем того или иного адреса URL (в отличие от статической страницы в разметке HTML, хранящейся на сервере в виде файла с расширением .htm или .html). Основными языками серверного программирования являются PHP, Perl, Python и ряд других. Существуют и клиентские языки Web-программирования, такие как Javascript и VB Script. Программа на таком языке, включенная в текст Web-страницы, выполняется не на сервере, а на компьютере-клиенте, с помощью интерпретатора, включенного в браузер пользователя или отдельно установленного.