Вопрос45.Универсальная форма адресации информационных ресурсов.
URI (Uniform Resource Identifier, Универсальный идентификатор ресурса) (RFC 2396, August 1998) - компактная строка символов для идентификации абстракного или физического ресурса. Под ресурсом понимается любой объект, принадлежащий некоторому пространству. Включает и переопределяет определенные ранее URL (RFC 1738/RFC 1808) и URN (RFC 2141, RFC 2611).
URI предназначен для уникальной идентификации любого ресурса.
Некоторые подмножества URI:
URL (Uniform Resource Locator, Универсальный указатель ресурса), - подмножество схем URI, который идентифицирует ресурс по способу доступа к нему (например, его "местонахождению в сети") вместо того, чтобы идентифицировать его по названию или другим атрибутам этого ресурса.
IP-адрес или соответствующее ему доменное имя позволяют однозначно идентифицировать компьютер в сети Internet, но дело в том, что на компьютере может присутствовать множество различной информации в различных форматах, например, в виде файлов, электронных сообщений, страниц и т.п. Для того, чтобы можно было безошибочно получать нужную информацию и в нужном формате используется строка символов, которую называют универсальный указатель ресурса или URL (Universal Resource Locator). Эта строка однозначно идентифицирует любой ресурс в сети Internet. Именно такая строка отображается в поле «Адрес» обозревателя Internet Explorer, когда мы «гуляем» по Internet (см. далее).
Рис. 1.7. Структура URL - универсального указателя ресурса.
Универсальный указатель ресурса состоит из:
Протокол – это набор правил (см. далее), по которым происходит обмен информацией. В данном примере использован наиболее часто используемый протокол http:// – протокол передачи гипертекста.
Доменное имя или IP-адрес, который позволяет однозначно идентифицировать компьютер (сервер) в сети Internet, содержащий нужную информацию.
Путь, состоящий из имен папок, разделенных символом / (слэш), последовательно открывая которые можно «добраться» до нужной информации. В данном примере искомая информация находится в папке info, в других случаях путь может быть длиннее, например, products/mpress/library, здесь искомая информация находится в папке library, находящейся в папке mpress, которая в свою очередь располагается внутри папки products.
Примечание: многие серверы сети Internet в отличие от компьютеров пользователей чувствительны к регистру букв, в котором представлены имена папок и файлов, поэтому папка info и папка Info или INFO – это разные папки, но чаще всего имена файлов и папок пишут строчными (маленькими) буквами.
Имя файла, который содержит нужную информацию. В нашем примере информация находится в файле search.html, в котором содержатся советы по поиску на поисковом сервере yandex.ru.
Примечание: если имя файла не указано, то используется имя файла по умолчаниюindex.htm (index.html), либо default.htm (default.html).
Поскольку весь URL набирать с клавиатуры достаточно долго и неудобно, то можно вводить только доменное имя (www в некоторых случаях также можно опускать), а все остальные его части, такие как протокол, путь и имя файла будут подставлены по умолчанию.
Общепринятые схемы (протоколы) URL включают:
ftp — Протокол передачи файлов FTP
http — Протокол передачи гипертекста HTTP
https — Специальная реализация протокола HTTP, использующая шифрование (как правило, SSL или TLS)
gopher — Протокол Gopher
mailto — Адрес электронной почты
news — Новости Usenet
nntp — Новости Usenet через протокол NNTP
irc — Протокол IRC
prospero — Служба каталогов Prospero Directory Service
telnet — Ссылка на интерактивную сессию Telnet
wais — База данных системы WAIS
xmpp — Протокол XMPP (часть Jabber)
file — Имя локального файла
data — Непосредственные данные (Data: URL)