Тема 3. Базовые пользовательские технологии Интернет
1. Всемирная информационная сеть WWW. Программы просмотра – браузеры.
2. Электронная почта. Виды почтовых ящиков общедоступных почтовых серверов. Специальные почтовые программы.
3. Службы прямого общения пользователей.
4. Телеконференции. Система телеконференций Usenet.
Всемирная информационная сеть WWW. Программы просмотра – браузеры.
Internet сделал возможным свободный обмен информацией невзирая на расстояния и государственные границы. Однако, на первом этапе его существования ресурсы были доступны при помощи программного обеспечения, ориентированного лишь на пересылку файлов и неформатированного текста. Приверженцы Интернет приходили в восторг, если им удавалось "скачать" файл с новой "игрушкой", переслать пару строк приятелю по электронной почте или подключить персоналку к "большой" машине в режиме удаленного терминала. В конце концов физики Тим Бернерс-Ли (TimBerners-Lee) и РоберКайо (RobertCailliau) из Женевского CERN решили разработать инфраструктуру, позволяющую братьям-физикам по всей Европе обмениваться результатами исследований через Интернет в виде привычного для научных работников отформатированного и иллюстрированного текста, включающего ссылки на другие публикации. Так было положено началоWorldWideWeb, Всемирной Информационной Паутине, которая к настоящему времени оплела своими сетями практически весь компьютерный мир и сделала Интернет доступным и привлекательным для миллионов пользователей.
Идея Т. Бернерс-Ли заключалась в том, чтобы применить гипертекстовую модель к информационным ресурсам, распределенным в сети, и сделать это максимально простым способом. Он заложил три краеугольных камня системы из четырех существующих ныне, разработав:
- язык гипертекстовой разметки документов HTML (HyperTextMarkupLan-guage);
- универсальный способ адресации ресурсов в сети URL (UniversalResourceLocator);
- протокол обмена гипертекстовой информацией HTTP (HyperTextTransferProtocol).
Позже команда NCSA добавила к этим трем компонентам четвертый – универсальный интерфейс шлюзовCGI(CommonGatewayInterface).
WWW – это распределенная информационная система мультимедиа, основанная на гипертексте.
Тот факт, что это распределенная система означает, что информация хранится на огромном множестве так называемыхWWW-серверов (servers), то есть компьютеров, на которых установлено специальное программное обеспечение и которые объединены в сеть Интернет. Пользователи, имеющие доступ к сети, получают эту информацию при помощипрограмм-клиентов (clients), называемыхпрограммами просмотра WWW-документов (WWW-browsers).При этом программа просмотра посылает по компьютерной сети запрос серверу, хранящему файл с необходимым документом.В ответ на запрос сервер высылает программе просмотра этот требуемый файл или сообщение об отказе, если файл по тем или иным причинам недоступен. Взаимодействие клиент-сервер происходит по определенным правилам, или, как говорят иначе,протоколу. Протокол, принятый в WWW, называетсяHyperTextTransferProtocol, сокращенно – HTTP.
Информация включает в себя не только текст, но и двух- и трехмерную графику, видео и звук.
Информация в WWW представляется в виде документов, каждый из которых может содержать каквнутренние перекрестные ссылки, так иссылки на другие документы, хранящиеся на том же самом или на любом другом сервере. Такие ссылки называютгиперссылками (hyperreferences)илигиперсвязями (hyperlinks). На экране компьютера в окне программы просмотра ссылки выглядят как выделенные каким-либо образом (например, другим цветом и/или подчеркиванием) участки текста или графики. Выбирая гиперссылки,пользователь программы просмотра может быстро перемещаться от одной части документа к другой, или же от одного документа к другому. При необходимости программа просмотра автоматически связывается с соответствующим сервером в сети и запрашивает документ, на который сделана ссылка. Именно по этому принципу построена вWindowsсистема подсказок (Help), с той лишь разницей, что гипертекстовая система подсказокWindowsне является распределенной.
Итак, WWW-документ может содержать стилизованный и форматированный текст, графику и гиперсвязи с различными ресурсами Internet. Чтобы реализовать все эти возможности, был разработан специальный язык, названныйHyperTextMarkupLanguage (HTML), то есть,язык разметки гипертекста. Документ, написанный на HTML, представляет собойтекстовый файл, содержащийсобственно текст, несущий информацию читателю, ифлаги разметки (markuptags). Последние представляют собой определенные стандартом HTML последовательности символов, являющиеся инструкциями для программы просмотра; согласно этим инструкциям программа располагает текст на экране, включает в него рисунки, хранящиеся в отдельных графических файлах, и формирует гиперсвязи с другими документами или ресурсами Internet. Таким образом,файл на языке HTML приобретает облик WWW-документа только тогда, когда он интерпретируется программой просмотра.
Практически любая информация, которая предоставляется в публичный доступ, отображается средствами WWW. Если какая-то информация не может быть помещена в WWW, то это обусловлено некоторыми ограничениями и недостатками WWW. Во-первых, соединение между клиентом и сервером WWW одноразовое: клиент посылает запрос, сервер выдает документ, и связь прерывается. Это значит, что сервер не имеет механизма уведомления клиента об изменении или поступлении новых данных.
Следующая проблема WWW — отсутствие централизации. Не существует единого каталога ресурсов WWW. Однако использование специализированных поисковых серверов, которые ищут необходимые сервера по заданным критериям, позволяет частично решить эту проблему.
Наиболее распространенной службой Интернет являетсяпоиск информации в WWW. Для эффективного поиска информации в WWW простого ввода данных не достаточно. Ведь существуют миллионы электронных сайтов и сотни миллионов ссылок, которые позволяют не опытному пользователю запутаться в многообразии различной информации и просто захлебнуться в большом количестве сайтов.
Именно для того, чтобы ранжировать и упорядочить запросы в сети Интернет существуют специальные поисковые системы, которые отличаются полнотой и достоверностью предоставляемой информации, а также высокой скоростью доступа к той или иной информации.
С одной стороны, для поисковой системы учитываются тип ресурсов, который может нести ту или иную задачу, а с другой стороны, выбор инструментов поиска, который обслуживает то или иное информационное поле, в зависимости от его результативности.
Настоящими, реальными носителями информации в сети Интернет являются поисковые машины (автоматические индексы) и каталоги. Эти поисковые машины обеспечивают все этапы обработки информации от ее получения с узлов – первоисточников и до предоставления пользователю возможности поиска. Именно поэтому, такие машины, зачастую называют автономными системами. Эти поисковые системы имеют различие и по принципу отбора той или иной информации, а также по алгоритму сканирующей программы автоматического индекса, а также и регламентом поведения сотрудников каталога, который отвечает за регистрацию в поисковой системе.
В российском Рунете широкой известностью пользуются такие поисковые системы, как www.google.ru, www.yandex.ru, www.rambler.ru.