Сайт состоит из нескольких гипертекстов, связанных взаимными ссылками
Гиперссылка – это имена гипертекстов, расположенных на сайтах.
Для чтения гипертекстов используют специальные программы - браузеры.
Наиболее популярны:
- NETSCAPE NAVIGATOR фирмы NETSCAPE.
- INTERNET EXPLORER фирмы MICROSOFT.
Результат работы браузера – загрузка гипертекста по указанному адресу.
Если неизвестен адрес, то для поиска информации в Интернете используют:
- Каталоги.
- Поисковые системы.
Каталоги содержат:
- Имена сайтов.
- Имена серверов по отраслям.
Каталоги составляются редакторами, которые просматривают каждый новый сайт до его включения в каталог.
В процессе наполнения каталогов могут участвовать и разработчики сайтов при их регистрации в поисковых системах.
Интерфейс каталогов содержи список разделов, в котором отображены ссылки на URL – адреса наиболее важных документов. Каждая ссылка имеет аннотацию(краткое содержание документа).
В Российском секторе Интернета к крупнейшим каталогам относятся:
· WWW.RU – основной каталог российских сайтов.
· LIST.RU - электронный каталог российских сайтов.
· STAR.RU – электронный каталог лучших сайтов.
Каталоги позволяют найти сайты и зарегистрировать новые сайты и сервера.
Поисковые серверы Интернета делят на 2 группы:
- Поисковые системы общего назначения.
- Поисковые системы специального назначения.
Поисковые системы общего назначения позволяют найти документы в WWW по ключевым словам и/или с помощью иерархической системы каталогов.
Поисковые системы специального назначения позволяют искать информацию в виде файлов в архивах и системе поиска адресов электронной почты. Это Российская файловая поисковая система (WWW..files.ru) и {WWW.Filesearch.ru}.
БД поисковых систем заполняются роботизированными системами. Специальные программы – роботы (“пауки”) постоянно обходят Интернет в поисках новой информации, которую они вносят в БД.
БД в Интернете содержат URL – адреса и информацию, связанную с этими адресами.
Мощные “пауки” обходят Интернет за несколько дней.
Показателями качества поискового сервера являются:
- Объем БД (количество документов).
- Скорость обхода Интернета ”поуком” (скорость обновления информации в Интернете).
- Возможность расширения поиска с использованием языка запросов.
- Разной структурой системы каталогов.
YANDEX | RAMBLER | APORT | |
ОБЪЕМ БД на начало 2001г | Более 31 млн. документов | Более12 млн. документов | Более 14 млн. документов |
Каталоги | 17 разделов | 56 разделов | 14 разделов |
Язык запросов | И(пробел, &) ИЛИ(|) | И(AND, пробел, &) ИЛИ(|, OR) | И(AND, пробел) ИЛИ, OR) |
Наиболее используемые русские поисковые системы:
- YANDEX.RU – наиболее удобная система.
- RAMBLER.RU – наиболее популярная система.
- APORT.RU – наиболее простая система.
Международные поисковые системы, которые имеют каталоги на русском языке:
- LYCOS. RU – европейская система поиска(Лайкос).
- GOOGLE.RU – международная система поиска.
Международные поисковые системы, которые позволяют делать запросы на русском, английском, испанском, французском и немецком языке:
- ALTAVISTA
- INFOSEEK
- YAHOO
В окне поисковой системы задаются ключевые слова.
Результат работы поисковой системы – перечень ссылок на гипертексты и сайты с их названием и краткой аннотацией.
Процесс загрузки WEB – страницы:
- Заданное пользователем доменное имя сервера ищется в инрархической БД доменной системы имен (DOMAIN NAM SYSTEM -DNS), которая хранится на DNS – серверах.
- Если в БД DNS имя сервера найдено, то начинается поиск самого сервера и ожидается отклик от него.
- Если сервер найден, то производится соединение с сервером по IP – адресу (цифровому).
- Загружается WEB – страница и связанные с ней мультимедийные объекты (графические и звуковые файлы).
Если WEB – страница расположена на локальном компьютере, то в поле ”Адрес” вводят полной путь к файлу.
Кроме того, WEB – страницу можно загрузить командой ”Файл - Открыть”.
Установка правильной кодировки WEB – страницы:
WEB – страница – это текстовый файл с тэгами HTML, поэтому при просмотре русскоязычных страниц возникают проблемы с кодировкой, которые надо уметь менять.
Браузеры могут отображать информацию в любой кодировке.
Существует 6 различных кодировок:
- CP – 866 (MS - DOS).
- CP- 1251 (Windows).
- KOI8-R (UNIX).
- MAC (MAC OS)
- ISO
- UNICODE
ПРОТОКОЛЫ СЕТИ ИНТЕРНЕТ
Протокол Интернета TPC/IP:
· TCP (Transmission Control Protocol)
· IP (Internet Protocol)
Правила передачи информации в Интернете называют IP – INTERNET PROTOCOL (Протокол Интернета).
IP протокол работает так:
· Данные помещаются в специальный конверт (пакет), к нему добавляется цифровой адрес ПК, которому предназначена информация.
· Пакет отправляется в ближайший к отправителю маршрутизатор, который решает, куда отправить пакет.
Протокол управления передачей информации в Интернете называют TCP – Transmission Control Protocol.
TCP протокол работает так:
· Большие объемы разбивают на порции, каждая порция идет своим путем.
· Иногда часть данных теряется, и их отправляют повторно.
· Получатель собирает все пакеты и получает нужную информацию. Т.к. в Интернете оба протокола используют вместе, то принято говорить, что работает протокол TPC/IP.
ВЫВОД: Разбивка на пакеты повышает надежность передачи, но из – за возвратов уменьшается скорость доставки пакетов.
Билет №4