Типы и функциональное назначение Web-серверов и прокси-серверов
Для эффективной работы в сети Интернет необходимо хорошо представлять возможности различных типов Web-серверов и их функциональное назначение, различные категории Web-серверов могут использоваться как элементы интегрированной программы маркетинга фирмы
Специалисты в области сети Интернет группируют Web-серверы в две основные группы: серверы управления трафиком (Web Traffic Control Sites) и конечные серверы (Destination Sites). Пользователь с помощью серверов первой группы ищет необходимые ему ресурсы, с помощью серверов второй группы пользуется ими.
Серверы управления трафиком в свою очередь делятся на серверы — поисковые системы, серверы-каталоги, серверы с комбинированной системой поиска, инициирующие серверы.
Серверы — поисковые системы предназначены опознавать другие серверы Internet с помощью поиска по ключевым словам базы данных, которая состоит из проиндексированного содержания Web-серверов Internet. Примером поисковых систем могут служить международная система Alta Vista и российская Rambler.
Поисковые системы включают в себя три основные части:
1) спайдеры (Spaider, Crawler, Robot) — программы, которые посещают Web-серверы, считывают и индексируют полностью или частично их содержимое и далее следуют по ссылкам, найденным на сервере. Спайдеры возвращаются на Web-серверы через определенное время, например каждый месяц, и повторяют индексацию страниц;
2) индексы поисковой системы, которые представляют собой хранилище информации предельно большого размера. В нем хранятся копии текстовой составляющей всех страниц, которые посетил и проиндексировал спайдер;
3) программа сортировки по релевантности.Релевантность — это характеристика, которая определяет, насколько полно тот или иной документ отвечает критериям, указанным в запросе пользователя. Программа, разыскивая информацию в соответствии с запросом пользователя, перебирает индексы поисковой системы и выдает ее в порядке убывания релевантности найденных документов.
В каждой поисковой системе работает свой собственный спайдер, каждая поисковая система индексирует страницы своим особым способом, параметры релевантности при поиске по индексам тоже различаются. Поэтому запрос по определенным ключевым словам или выражениям в каждой из поисковых систем обычно порождает различные результаты.
Серверы-каталоги выполняют в сети Интернет функцию, аналогичную поисковым системам, однако поиск осуществляется пользователем самостоятельно по иерархически организованной тематической структуре каталогов. Примером международного сервера-каталога является Yahoo!, российского — Russia on the Net.
Серверы с комбинированной системой поиска — поисковые системы, которые имеют в себе каталог. При этом индексы для собственно поисковой системы получаются от слайдера, а каталог пополняется заинтересованными лицами самостоятельно с помощью регистрационной формы принятой на серверах-каталогах или персоналом, обслуживающим сервер (модераторами системы).
Инициирующие серверы реализуют комплексный подход к обслуживанию клиентов по сравнению с серверами, перечисленными выше. Наряду с функциями поиска информации и соединения с ними пользователей они предоставляют более широкое информационное обеспечение. Наиболее крупные из них называются порталами, которые представляют собой сочетание информационного наполнения, пользовательского сообщества и базовых услуг, таких, как, например, электронная почта. Основными элементами порталов являются каналы — подкатегории, на которые разделяется вся информация сервера для упрощения поиска интересующих данных; электронная почта, дискуссии — встроенные средства диалогового взаимодействия для создания форумов с целью обмена идеями и организации встреч с другими пользователями; покупки — инструменты для поиска нужных пользователям товаров с заданными характеристиками.
Все порталы обладают примерно одинаковой комбинацией информационного наполнения и набора услуг. Различия определяются тем, насколько успешно интегрированы все функции и насколько удачно выбраны технологии для внутренней организации сообществ пользователей, Web-страниц, электронной почты и мгновенной пересылки сообщений. Порталы различаются также с точки зрения простоты работы с ними и настройки на нужды конкретного пользователя.
Конечные серверы, в которых, исходя из выполняемых функций, выделяют серверы присутствия в сети Интернет, информационные серверы, интерактивные магазины.
Серверы присутствия в сети Интернет обеспечивают виртуальное присутствие фирм в виде информации о них, их товарах и услугах в среде сети Интернет. Специалисты довольно условно делят их на два вида: рекламные серверы и информирующие серверы.
Рекламный сервер состоит из одной или нескольких Web-страниц, которые содержат представленную в различных формах (графика, текст, фотографии, видеоизображения и пр.) рекламную информацию. Представление информации ориентировано на конечного пользователя. Основное воздействие на потребителей оказывается за счет учета психологических особенностей человека главным образом в эмоциональной сфере.
Информирующие серверы обеспечивают пользователю детальную информацию о фирме, ее товарах и услугах. Ориентированы не на эмоциональное, а на рациональное восприятие информации пользователем.
Информационные серверы главной задачей ставят предоставление информации о событиях и явления в различных областях деятельности общества. Информационные серверы по признаку оплаты для доступа к ним могут быть платными и бесплатными. Оплата может взиматься как за доступ к информации, хранящейся на сервере, так и за право размещать информацию на нем. Примером сервера, предоставляющего платную информацию по широкому спектру рыночных отношений, является Web-сервер Информационная коммерческая система «Международные информационные рынки» (ИКС МИР). Следует заметить, что это название тяжеловесно, но его аббревиатура является маркетинговой удачей. Бесплатные услуги по размещению и использованию информации очень часто предоставляют Web-серверы, специализирующиеся на обслуживании рынка недвижимости. Их маркетинговый и коммерческий интерес в таком решении вопроса очевиден.
Интерактивные магазины. Функции Web-сервера, работающего в этом режиме, сводятся к следующему: предоставить клиенту информацию о товаре или услуге, получить от него заказ, получить оплату заказа (при использовании онлайновых платежных систем), отправить оплаченный товар (в том случае, когда товар может пересылаться по сети Интернет, например, он является программным продуктом, базой данных, видеоизображением, музыкой и пр.). В отличие от традиционных форм торговли здесь может предлагаться большое количество товаров и услуг, для потребителей обеспечиваться любая информационная поддержка, необходимая для принятия решения о покупке, может персонализироваться процесс взаимодействия с каждым из клиентов с учетом его предшествующего взаимодействия с магазином и его дальнейших планов.
Под этим термином в настоящее время подразумевается целый спектр решений различного масштаба и назначения. Условно можно выделить автоматический магазин и торговый автомат. В первом случае автоматически обрабатываются заказы, резервируется товар на складе, корректируются остатки. Это накладывает высокие требования на корпоративную систему автоматизации бизнес-процессов. Система должна обеспечить автоматическое выполнение всех действий, связанных с продажами, и иметь внутренние механизмы контроля для выявления внешних ситуаций. В случае реализации торгового автомата задачи, выполняемые сервером, завершаются приемом заказов. Дальнейшая обработка заказа производится по традиционной схеме. В случае если речь идет об обычном товаре, для учета остатка на складе в сервер вводится лимит продаж.
Прокси-сервер — это сервер, который служит своеобразным буфером между пользователем и сетью Интернет. Прокси-серверы используют для того, чтобы обеспечить эффективный и безопасный доступ в сеть Интернет. Часто их устанавливают в различных организациях для обеспечения взаимодействия локальной сети с глобальной сетью Интернет.
Для эффективности работы прокси-серверов используют кэширование. Оно предназначено для ускорения доступа к документам и снижению трафика, проходящего через сеть Интернет. Механизм кэширования можно представить следующим образом. Предположим, что клиент сети скачал через данный прокси-сервер какой-то файл. Если после этого другой клиент, подключившись к этому же прокси-серверу, захотел скачать тот же файл, что был затребован ранее, то он получит его намного быстрее, нежели первый. Это произойдет из-за того, что файл был помещен прокси-сервером в кэшпамять и при повторном запросе он уже не выкачивался заново, а был взят из кэш-памяти прокси-сервера. Именно поэтому сокращается время ожидания его вторым клиентом. Следует иметь в виду, что не могут быть кэшированы документы, доступ к которым открывается только после внесения абонентской платы, или документы, для доступа к которым требуется пройти аутентификацию.
Существуют пассивное и активное кэширование:
Пассивное (passive caching) заключается в том, что прокси-сервер просто ожидает запрос и лишь после этого осуществляет поиск нужного документа, а также определяет, нужно ли производить кэширование.
Технология активного кэширования (active caching) состоит в следующем. Прокси-сервер в те моменты, когда активность пользователей снижается, пытается предугадать, какие из документов с большей вероятностью будут затребованы, и извлекает их. Для того чтобы ускорить доступ к ресурсам, крупные компании устанавливают сразу несколько прокси-серверов. Все прокси-серверы разделяют на две группы: прозрачные (transparent) и непрозрачные (no transparent).
Прозрачные прокси-серверы при различного рода запросах покажут реальный IP-адрес, непрозрачные при любых запросах не выдают реальный IP-адрес. Таким образом, посещение сайтов, доступ к FTP-архивам становится анонимным. Владелец ресурса не сможет узнать IP-адрес клиента, тип браузера, операционную систему, страну пребывания, информацию о провайдере. Он может узнать лишь адрес прокси-сервера — реальный адрес клиента не «виден» за пределами прокси-сервера. Следует помнить, что лишь небольшое число прокси-серверов позволяет скрывать IP-адрес, давая новый. Также не все непрозрачные прокси-серверы являются полностью анонимными. Некоторые из них позволяют администратору посещаемого сайта, определить не только IP-адрес прокси-сервера, но и IP-адрес, с которого происходит обращение к прокси-серверу, т. е. реальный IP-адрес клиента.
Использование непрозрачного прокси-сервера дает возможность получить информацию с сайта, который меняет ответ в зависимости от страны, из которой отправлен запрос. Такой прокси-сервер позволит также зайти на Web-узел конкурентов анонимно.
Дополнительная безопасность для клиента создается за счет того, что при использовании непрозрачного прокси-сервера всякий нападающий на клиента будет атаковать его прокси-сервер, который имеет соответствующую степень защиты. Прокси-серверы позволяют пользователям за счет кэширования экономить время в сети, оставаться анонимными при использовании непрозрачных прокси-серверов, но следует учитывать тот факт, что при использовании прокси-серверов тратится лишнее время на подключения к ним.
Статистические данные о поведении посетителей Web-серверов могут быть получены из так называемых log-файлов сервера. Провайдер услуг поддерживает log-файлы, в которых содержится информация по каждому запросу ресурса с сервера. В них имеются следующие сведения: домен места, откуда пришел пользователь, дата и время посещения, команда, файл запроса, по какой ссылке он попал на сервер, какой браузер он использует и на какой платформе. Этот файл не содержит информации об электронном адресе пользователя, а только представляет название его домена. Например, для логистического анализа полезен домен, характеризующий географический регион пользователя, значительный маркетинговый интерес представляют данные о том, откуда посетитель попал на сервер. Провайдер имеет возможность установить программное обеспечение, осуществляющее статистический анализ перечисленных выше данных, и по согласованному графику отправлять результаты по электронной почте владельцу сервера.
Другим эффективным методом логистического анализа является использование файлов «cookies». Это небольшие файлы, находящиеся на компьютере пользователя и позволяющие Web-серверу идентифицировать браузер пользователя. Когда пользователь посещает Web-сервер, последний запрашивает уникальный идентификационный номер браузера. Если браузер не имеет такового, то сервер присваивает его данному браузеру посредством передачи файла «cookies» с определенным уникальным числом. Использование этих файлов позволяет отслеживать информацию о поведении пользователя в сети Интернет, дает возможность Web-серверам увеличивать функциональные возможности, выполнять различные задачи по индивидуальному взаимодействию с каждым пользователем. Основное положительное качество файлов «cookies» для логистики состоит в возможности индивидуализировать подход к каждому клиенту. Интернет-сообщество относится к использованию этих файлов неоднозначно, поскольку они позволяют собирать персональную информацию и тем нарушать право на свободу личной жизни. На рынке существуют программы, позволяющие фильтровать установку этих файлов или очищать от них жесткие диски компьютеров.
Организации, координирующие деятельность сети Интернет
Internet Society (ISOC) — профессиональное сообщество, занимающееся вопросами деятельности и развития сети Интернет, способами его использования, а также техническими, социальными и политическими последствиями такого использования. Сообщество предоставляет поддержку группам и организациям, участвующим в использовании, управлении и развитии сети Интернет, проводит собрания, на которых обсуждаются вопросы технического и организационного характера; предоставляет информацию о сети Интернет. Internet Societyвыпускает бюллетень Internet Society News.
Internet Architecture Board (IAB). Входит в состав ISOC. Координирует развитие протоколов TCP/IP, представляет на рассмотрение ISOC результаты исследований. Объединяет в своем составе различные группы по развитию Internet: IESG, IETF, IRTF, IANA, CERT.
Internet Engineering Steering Group (IESG). Группа работает по правилам и процедурам, устанавливаемым советом ISOC, входит в структуру IAB. Занимается рассмотрением стандартов и техническими работами для IETF. Анализирует состояние дел и заключительные редакции предложений по стандартам. Состоит из выборных членов IETF.
Internet Engineering Task Force (IETF). Входит в структуру IAB. Общественная организация, отвечающая за разработку стандартов на протоколы и архитектуру Internet. При возникновении любой проблемы, связанной с архитектурой сети Интернет, из добровольцев собирается специальная группа. Рабочие группы IETF специализируются на отдельных проблемах по мере их возникновения. Рассмотренные проблемы могут быть направлены в IESG на рассмотрение и утверждение. Заседания IETF проводятся трижды в год.
Internet Research Task Force (IRTF). Входит в структуру IAB. Эта организация концентрируется на развитии технологий, которые могут понадобиться в будущем по вопросам развития TCP/IP, поиска информационных ресурсов, безопасности и защиты информации.
Network Information Center (NIC) — центры сетевой информации. Это организации, ответственные за распределение сетевых IP-адресов и регистрацию имен доменов. Снабжают пользователей документацией и информацией о сети Интернет. Каждый NIC, собирая многочисленные источники в одном месте, дает возможность быстро выяснить, какая информация доступна в Internet по основным темам. Хранит информационные документы для быстрого ознакомления исследователей сетевых технологий с новыми идеями — RFC (см. ниже), другую документацию, справочники, доклады по Internet.
InterNIC— центр сетевой информации (NIC) в США. Объединяет три организации, осуществляющие разделение функции: регистрация IP-адресов, доменов .com — Network Solution, Inc. (Херндон, Вирджиния), справочные услуги и сопровождение баз данных — AT&T, информационные услуги — General Atomic (Сан-Диего, Калифорния).
Reseaux IP Europeans (RIPE) — организация, предназначенная для сотрудничества европейских поставщиков услуг сети Интернет, создана в 1989 г. Ее цель — техническая и организационная координация общеевропейской сети. Объединяет более 60 организаций по всей Европе.
Russian Institute for Public Networks (RIPN) — Российский институт общественных сетей, образован в 1992 г. Комитетом высшей школы России, Российским исследовательским центром «Курчатовский институт» и его компьютерным центром. Эта структура была создана с целью разработки системы коммуникаций в интересах проведения исследований и совершенствования образования, координация развития IP-сетей России, помощи исследовательским и образовательным организациям в предоставлении доступа к сети Интернет через общественные сети. Российский институт общественных сетей в рамках NIC для доменов xSU/RU выполняет следующие задачи: регистрацию IP-адресов из блока, выделенного для RIPN Европейским координационным центром RIPE, администрацию корневого домена «RU», сопровождение документации по Internet, поддержка каталога персон и организаций.
Документация сети Интернет представляет собой следующие документы:
Request for Comments (RFC) — информационные документы для быстрого ознакомления исследователей сетевых технологий с новыми идеями. В 1969 г. был сделан первый шаг в издании серии RFC. Вначале RFC документы печатались на бумаге и распространялись по почте. Архивы документов RFC можно свободно найти на многих компьютерах сети Internet по E-mail, FTP, WWW. Сейчас RFC представляют собой результат работы групп IETF и IRTF над стандартами. Любой человек может подготовить документ, оформив его в виде RFC. После рассмотрения предложений в группе IETF документ будет представлен Редактору, который присуждает документу очередной RFC-номер. Документы серии RFC являются исключительно информационными документами, однако разработчики предпочитают придерживаться данных в них рекомендаций.
For Your Information (FYI) — документы «для ознакомления» — входят в серию RFC. Эти документы также содержат информацию по основам сети Интернет, однако рассчитаны на более широкую аудиторию. Документы «для ознакомления» являются подмножеством RFC и имеют FYI-номер и RFC-номер.
Standart Document (STD) — серия документов, имеющих силу стандарта Internet, входящая в подмножество RFC. У документов есть свой STD-номер и RFC-номер.
Frequently Asked Questions (FAQ) — часто задаваемые вопросы, документы, оформленные в виде вопросов и ответов. В результате обсуждения на конференциях определенной темы формируется круг вопросов, которые задают большинство пользователей. Добровольцы собирают самые частые и интересные вопросы и наиболее полные ответы на них. Затем документ публикуется в конференции, доступно любому желающему. Так появляется документ FAQ на определенную тему, который впоследствии может быть изменен и дополнен. FAQ — это опыт многих пользователей, собранный в одном документе.
ЛЕКЦИЯ 3.