Общие сведения об Интернете.
Доменные адреса компьютеров
Интернет – это всемирная компьютерная сеть, объединяющая в единое целое десятки разнородных локальных и глобальных компьютерных сетей. Общее количества компьютеров, подключенных к Интернету, исчисляется в настоящее время десятками миллионов и стремительно продолжает возрастать.
Для идентификации компьютеров в сети Интернета используется так называемая доменная система имен. Доменом называется некоторая область сети (от английского domain – область), которой присваивается собственное имя. Каждый домен может входить в домен более высокого уровня и в то же время может включать в себя домены более низкого уровня. Имена доменов и конкретных компьютеров в доменах задаются последовательностями букв, цифр и возможно некоторых специальных символов. Для указания какого-либо компьютера в Интернете его доменный адрес представляется следующим образом: сначала указывается имя компьютера, затем – имя домена, в который этот компьютер входит, затем – имя следующего домена (в который входит предыдущий домен) и т.д. Указанные части доменного адреса разделяются точкой. Например, адрес www.mpei.ac.ru определяет компьютер с именем www , который входит в домен с именем mpei (домен самого нижнего уровня). В этот домен входят компьютеры МЭИ. В свою очередь, домен mpei входит в домен второго уровня ac, объединяющий домены различных учебных заведений и научных организаций. Наконец, домен верхнего уровня ru включает все домены, территориально расположенные в России. Аналогично, адрес alpha.math.msu.ru определяет компьютер с именем alpha , входящий в сеть механико-математического факультета (math) Московского государственного университета (msu), состоящего в домене верхнего уровня ru.
Замечание 1. Выделение имен в пределах каждого домена осуществляется специально уполномоченными организациями, отвечающими за эту часть сети.
Замечание 2. Всего на данный момент существует около 150 доменов верхнего уровня, соответствующих различным странам. Для них приняты двухбуквенные обозначения: ru – Россия, de – Германия, ca – Канада, uk – Великобритания, fr – Франция, gr – Греция и т. д.
Полный список кодов стран можно получить с анонимного FTP-сервера ftp://ftp.wisc.edu .
Замечание 3. Для доменов верхнего уровня в США используются следующие обозначения: gov – правительственные учреждения, edu – учебные заведения, mil – военные учреждения, net – организации, отвечающие за разработку и поддержку компьютерных сетей, com – коммерческие организации, org – прочие организации.
Для доменов международных организаций используется сокращение int (например, www.nato.int ).
4.2. Основные службы (сервисы) Интернета.
Для обеспечения различного рода информационных услуг в Интернете предусмотрены соответствующие службы (называемые, обычно, сервисами). Именно эти службы сделали Интернет привлекательным для широкого круга пользователей. В основе организации сервисов в Интернете лежит концепция клиент-сервер. Эта концепция является одной из основных при организации взаимодействия различных программ как на одном компьютере, так и на различных компьютерах сети.
Программа, предоставляющая какие-либо услуги (сервисы), называется сервером, а программа, потребляющая эти услуги, - клиентом. Заметим, что на любом компьютере могут работать как программы-клиенты, так и программы-серверы. Однако, поскольку функционирование программ-серверов связано с большим расходом ресурсов (например, дисковой памяти для хранения больших баз данных), то, обычно, программы-серверы устанавливаются на специальных мощных компьютерах, которые также называются серверами.
Для каждого типа сервиса в Интернете жестко определяется протокол (правила) взаимодействия между клиентами и серверами, При соблюдении этого протокола клиентами одного и того же сервера могут быть самые разные компьютеры-клиенты (будь то IBM PC, Macintosh, рабочая станция Sun или что-то другое).
Благодаря развитию сервисных программ сеть Интернет стала доступной даже для неспециалистов. Обычно пользователь не задумывается о том, как его компьютер подключен к сети и как она функционирует. Пользователю необходимо только знать возможности сервиса и правила работы с ним.
К числу основных в Интернете обычно относят следующие виды сервисов.
Электронная почта (E-mail). Эта служба является одной из первых услуг, реализованных в Интернете, и широко используется до настоящего времени. Посредством E-mail можно обмениваться письменными сообщениями с другими пользователями, присоединяя к этим сообщениям, при необходимости, любые файлы.
Группы новостей (UseNet). Эта служба также позволяет пользователям обмениваться сообщениями, но процесс общения ограничивается рамками некоторой группы пользователей. Такие группы новостей называются так же телеконференциями. В отличие от E-mail клиент UseNet направляет сообщение не индивидуальному адресату, а всем участникам телеконференции. Каждая телеконференция имеет свой адрес и посвящена какой-либо теме. По некоторым данным количество телеконференций в Интернете превышает 10000. Поэтому телеконференции в UseNet организованы в виде категорий и подкатегорий. Основными категориями верхнего уровня являются следующие:
· sci - прикладные науки;
· soc - общественные науки и искусство;
· rec - развлечения, спорт, отдых, музыка, игры;
· news - новости и информация о UseNet;
· clari - новости, распространяемые только по подписке;
· comp - вопросы, связанные с компьютерами;
· biz - реклама и другие вопросы, связанные с бизнесом;
· talk - общение (разговор) на любые темы;
· kl2 - вопросы дошкольного и среднего образования;
· misc - материалы, которые не подпадают ни под одну из предыдущих категорий;
· alt - альтернативная иерархия групп новостей.
Диалоговые конференции (Internet Relay Chat – IRC или просто Chat). Эта разновидность телеконференций обеспечивает возможность «живого» диалога («болтовня» в реальном времени), включая реальные аудио и видеовозможности.
Передача файлов (File Transfer Protocol - FTP). Эта служба также была реализована в Интернете одной из первых. Она позволяет просматривать каталоги и файлы FTP-сервера, а также копировать (пересылать) файлы между клиентом и сервером. Для установления соединения с FTP-сервером необходимо указать его доменное имя, затем ввести имя подключающегося пользователя и его пароль, после чего становится возможной пересылка данных. Отметим возможность так называемого анонимного ftp (anonymous ftp), в котором не предполагается предварительная регистрация пользователя на FTP-сервере. Анонимный FTP позволяет сделать те или иные файлы доступными всему сетевому сообществу. Эти файлы могут содержать, в частности, общедоступное (бесплатное) программное обеспечение, демонстрационные версии платных программных продуктов, документацию, библиотеки компьютерных изображений и многое другое.
Всемирная паутина ( World Wide Web – WWW ). В настоящее время WWW – это наиболее развитая информационная служба Интернета. WWW определяется как глобальная распределенная гипертекстовая и мульти-медийная информационная система. Она позволила связать в единое целое разнородную информацию, хранящуюся на разных компьютерах. Главная отличительная особенность WWW состоит в использовании гипертекстовой организации документов, т.е. файлов, с которыми работает WWW. Эти документы называются обычно Web-страницами. Гипертекст – это документ, который наряду с обычной текстовой и графической информацией содержит ссылки на другие документы, включая и мультимедийные (графические, звуковые и видео). Для создания гипертекстовых документов используется специальный язык HTML (HyperText Markup Language), который позволяет задать необходимую разметку текста и встроить в него необходимые ссылки. При выводе Web-страницы на экран части текста, которые являются гипертекстовыми ссылками, выделяются цветом. Кроме того, при попадании на них курсор мыши принимает вид указательного пальца. Гипертекстовые ссылки позволяют легко просматривать части одного документа в произвольном порядке (не обязательно в порядке их следования) и легко переходить от одного документа к другому (независимо от места его размещения в сети). Для этого достаточно просто щелкнуть левой клавишей мыши по соответствующей гипертекстовой ссылке.
Для работы с WWW используются специальные программы-клиенты, называемые навигаторами, обозревателями или браузерами ( от английского browse – просматривать). Одной из таких программ является рассматриваемый ниже обозреватель Internet Explorer 5.0. Помимо просмотра Web-страниц при работе с WWW браузеры дают возможность пользоваться и другими сервисами Интернета (посылать электронные письма абонентам сети, получать файлы с анонимного FTP и др.). Это позволяет считать WWW интегральной службой Интернета.
Как уже указано, WWW или World Wide Web переводится на русский язык как "всемирная паутина". Это название связано с неупорядоченностью структуры данного вида Internet-сервиса. Если ftp и Gopher построены в виде иерархической структуры, то строение WWW действительно напоминает запутанную паутину, – любой WWW-документ может адресоваться к любому другому документу.
Если основными объектами для ftp-серверов являются каталоги и файлы, а для Gopher – система меню, то основным объектом WWW является гипертекстовый документ. Гипертекст (hypertext) – это любой текст, который содержит ссылки на другие документы или перекрестные связи – слова или фразы в документе, которые являются "чувствительными" и могут выбираться читателем, причем такой выбор вызывает извлечение (загрузку на компьютер) и отображение другого документа.
Простой на первый взгляд механизм построения ссылок оказывается довольно сложной задачей, т.к. можно построить статические ссылки, динамические ссылки, ассоциированные с документом в целом или только с отдельными его частями, т.е. контекстные ссылки. Дальнейшее развитие этого подхода приводит к расширению понятия гипертекста за счет других информационных ресурсов, включая графику, аудио- и видеоинформацию, до понятия гипермедиа. Идея WWW заключается в применении гипертекстовой модели к информационным ресурсам, распределенным в сети Интернет.
При этом четырьмя краеугольными камнями WWW являются:
· язык гипертекстовой разметки документов HTML (HyperText Markup Language);
· универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);
· протокол обмена гипертекстовой информацией НТТР (HyperText Transfer Protocol).
· универсальный интерфейс шлюзов CGI (Common Gateway Interface).
Идея HTML – пример чрезвычайно удачного решения проблемы построения гипертекстовой системы при помощи специального средства управления отображением. На разработку языка гипертекстовой разметки существенное влияние оказали два фактора: исследования в области интерфейсов гипертекстовых систем и желание обеспечить простой и быстрый способ создания гипертекстовой базы данных, распределенной на сети.
В настоящее время WWW является наиболее развитой информационной службой Интернета. Уже сейчас WWW объединяет более миллиарда гипертекстовых документов. Такие документы применительно к WWW называют Web-страницами. При выводе Web-страницы на экран (в окне обозревателя) части текста, которые являются гипертекстовыми ссылками, обычно выделяются цветом. Кроме того, при попадании на них курсор мыши принимает вид указательного пальца. Гипертекстовые ссылки позволяют легко осуществлять переходы и тем самым как просматривать части одного документа в произвольном порядке (не обязательно в порядке их следования), так и осуществлять переход от одного документа к другому независимо от их местонахождения. Программы просмотра гипертекста получили название browser. Используемые русские переводы: браузер, навигатор, обозреватель.
Вторым краеугольным камнем WWW стала универсальная форма адресации информационных ресурсов. Universal Resource Identification (URI) представляет собой довольно стройную систему, учитывающую опыт адресации и идентификации e-mail, Gopher, WAIS, telnet, ftp и т.п. Но реально, из всего, что описано в URI, для организации баз данных в WWW требуется только Universal Resource Locator (URL). Без наличия этой спецификации вся мощь HTML оказалась бы бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к распределенным ресурсам сети. В URL можно адресовать как другие гипертекстовые документы формата HTML, так и ресурсы e-mail, telnet, ftp, Gopher.
4.3. Адресация ресурсов Интернета.
Информационными ресурсами в Интернете являются файлы разного вида. Для адресации этих ресурсов используется унифицированный указатель ресурса (Uniform Resource Locator или сокращенно URL), который называется также адресом ресурса или ссылкой. В общем случае URL состоит из трех частей:
1) название сервиса (http:// для службы WWW, ftp:// для передачи файлов, news: для службы новостей и др.);
2) доменное имя компьютера (или его числовой эквивалент, называемый IP-адресом);
3) полное имя файла или Web-страницы (т.е. включая путь в дереве каталогов компьютера до нужного файла).
Рассмотрим следующие два примера URL.
1) http://www.mpei.ac.ru/homepages/myfile.html - в этом примере префикс http:// определяет сервис WWW (по имени протокола, используемого в этом сервисе, HyperText Transfer Protocol), средняя часть www.mpei.ac.ru – это доменное имя WWW-сервера, а окончание /homepages/myfile.html – это полное имя нужной Web-страницы (файла с именем myfile.html, который размещается в каталоге homepages).
2) http://www.host.com/files/are/here.html – в этом примере URL адресует файл (Web-страницу) с именем here.html, который находится в подкаталоге are каталога files на Web-сервере с доменным именем www.host.com .
Адреса в формате URL явно указываются при навигации в Интернете, а также встраиваются в гипертекстовые ссылки в Web-страницах.
Замечание 1. Имя файла или Web-страницы в URL может быть опущено. В этом случае подразумевается начальная страница Web-сервера или корневой каталог FTP-сервера.
Замечание 2. При работе с электронной почтой и службой новостей в URL, как правило, доменное имя сервера не указывается, так как оно задается в настройке соответствующей клиентской программы.