Типы и функциональное назначение Web-серверов и прокси-серверов

Для эффективной работы в сети Интернет необходимо хорошо представлять возможности различных типов Web-серверов и их функциональное назначение, различные категории Web-серверов могут использоваться как элементы интегрированной программы маркетинга фирмы

Специалисты в области сети Интернет группируют Web-серверы в две основные группы: серверы управления трафиком (Web Traffic Control Sites) и конечные серверы (Destination Sites). Пользователь с помощью серверов первой группы ищет необходимые ему ресурсы, с по­мощью серверов второй группы пользуется ими.

Серверы управления трафиком в свою очередь делятся на серверы — поисковые системы, серверы-каталоги, серверы с комбиниро­ванной системой поиска, инициирующие серверы.

Серверы — поисковые системы предназначены опознавать другие серверы Internet с помощью поиска по ключевым словам базы дан­ных, которая состоит из проиндексированного содержания Web-сер­веров Internet. Примером поисковых систем могут служить междуна­родная система Alta Vista и российская Rambler.

Поисковые системы включают в себя три основные части:

1) спайдеры (Spaider, Crawler, Robot) — программы, которые посещают Web-серверы, считывают и индексируют полностью или частично их содержимое и далее следуют по ссылкам, найденным на сервере. Спайдеры возвращаются на Web-серверы через определенное время, например каждый месяц, и повторяют индексацию страниц;

2) индексы поисковой системы, которые представляют собой хра­нилище информации предельно большого размера. В нем хранятся копии текстовой составляющей всех страниц, которые посетил и проиндексировал спайдер;

3) программа сортировки по релевантности.Релевантность — это характеристика, которая определяет, насколько полно тот или иной документ отвечает критериям, указанным в запросе пользователя. Программа, разыскивая информацию в соответствии с запросом пользователя, перебирает индексы поисковой системы и выдает ее в порядке убывания релевантности найденных документов.

В каждой поисковой системе работает свой собственный спайдер, каждая поисковая система индексирует страницы своим особым способом, параметры релевантности при поиске по индексам тоже различаются. Поэтому запрос по определенным ключевым словам или выражениям в каждой из поисковых систем обычно порождает различные результаты.

Серверы-каталоги выполняют в сети Интернет функцию, аналогичную поисковым системам, однако поиск осуществляется пользователем самостоятельно по иерархически организованной тематической структуре каталогов. Примером международного сервера-каталога является Yahoo!, российского — Russia on the Net.

Серверы с комбинированной системой поиска — поисковые систе­мы, которые имеют в себе каталог. При этом индексы для собствен­но поисковой системы получаются от слайдера, а каталог пополняет­ся заинтересованными лицами самостоятельно с помощью регистрационной формы принятой на серверах-каталогах или персо­налом, обслуживающим сервер (модераторами системы).

Инициирующие серверы реализуют комплексный подход к обслуживанию клиентов по сравнению с серверами, перечислен­ными выше. Наряду с функциями поиска информации и соединения с ними пользователей они предоставляют более широкое информа­ционное обеспечение. Наиболее крупные из них называются порта­лами, которые представляют собой сочетание информационного наполнения, пользовательского сообщества и базовых услуг, таких, как, например, электронная почта. Основными элементами порталов яв­ляются каналы — подкатегории, на которые разделяется вся информация сервера для упрощения поиска интересующих данных; элек­тронная почта, дискуссии — встроенные средства диалогового взаимодействия для создания форумов с целью обмена идеями и ор­ганизации встреч с другими пользователями; покупки — инструменты для поиска нужных пользователям товаров с заданными характе­ристиками.

Все порталы обладают примерно одинаковой комбинацией информационного наполнения и набора услуг. Различия определяются тем, насколько успешно интегрированы все функции и насколько удачно выбраны технологии для внутренней организации сообществ пользователей, Web-страниц, электронной почты и мгновенной пе­ресылки сообщений. Порталы различаются также с точки зрения простоты работы с ними и настройки на нужды конкретного пользо­вателя.

Конечные серверы, в которых, исходя из выполняемых функций, выделя­ют серверы присутствия в сети Интернет, информационные серверы, ин­терактивные магазины.

Серверы присутствия в сети Интернет обеспечивают виртуальное присут­ствие фирм в виде информации о них, их товарах и услугах в среде сети Интернет. Специалисты довольно условно делят их на два вида: рек­ламные серверы и информирующие серверы.

Рекламный сервер состоит из одной или нескольких Web-страниц, которые содержат представленную в различных формах (графика, текст, фотографии, видеоизображения и пр.) рекламную информа­цию. Представление информации ориентировано на конечного пользователя. Основное воздействие на потребителей оказывается за счет учета психологических особенностей человека главным образом в эмоциональной сфере.

Информирующие серверы обеспечивают пользователю детальную информацию о фирме, ее товарах и услугах. Ориентированы не на эмоциональное, а на рациональное восприятие информации пользо­вателем.

Информационные серверы главной задачей ставят предоставление информации о событиях и явления в различных областях деятельно­сти общества. Информационные серверы по признаку оплаты для доступа к ним могут быть платными и бесплатными. Оплата может взиматься как за доступ к информации, хранящейся на серве­ре, так и за право размещать информацию на нем. Примером серве­ра, предоставляющего платную информацию по широкому спектру рыночных отношений, является Web-сервер Информационная ком­мерческая система «Международные информационные рынки» (ИКС МИР). Следует заметить, что это название тяжеловесно, но его аббревиатура является маркетинговой удачей. Бесплатные ус­луги по размещению и использованию информации очень часто пре­доставляют Web-серверы, специализирующиеся на обслуживании рынка недвижимости. Их маркетинговый и коммерческий интерес в таком решении вопроса очевиден.

Интерактивные магазины. Функции Web-сервера, работающего в этом режиме, сводятся к следующему: предоставить клиенту информацию о товаре или услуге, получить от него заказ, получить оплату заказа (при использовании онлайновых платежных систем), от­править оплаченный товар (в том случае, когда товар может пересылаться по сети Интернет, например, он является программным продуктом, базой данных, видеоизображением, музыкой и пр.). В отличие от традици­онных форм торговли здесь может предлагаться большое количество товаров и услуг, для потребителей обеспечиваться любая информаци­онная поддержка, необходимая для принятия решения о покупке, может персонализироваться процесс взаимодействия с каждым из клиентов с учетом его предшествующего взаимодействия с магази­ном и его дальнейших планов.

Под этим термином в настоящее время подразумевается целый спектр решений различного масштаба и назначения. Условно можно выделить автоматический магазин и торговый автомат. В первом случае автоматически обрабатываются заказы, резервируется товар на складе, корректируются остатки. Это накладывает высокие требова­ния на корпоративную систему автоматизации бизнес-процессов. Система должна обеспечить автоматическое выполнение всех действий, связанных с продажами, и иметь внутренние механизмы кон­троля для выявления внешних ситуаций. В случае реализации торго­вого автомата задачи, выполняемые сервером, завершаются приемом заказов. Дальнейшая обработка заказа производится по традицион­ной схеме. В случае если речь идет об обычном товаре, для учета ос­татка на складе в сервер вводится лимит продаж.

Прокси-сервер — это сервер, который служит своеобразным буфе­ром между пользователем и сетью Интернет. Прокси-серверы использу­ют для того, чтобы обеспечить эффективный и безопасный доступ в сеть Интернет. Часто их устанавливают в различных организациях для обеспечения взаимодействия локальной сети с глобальной сетью Интернет.

Для эффективности работы прокси-серверов используют кэширование. Оно предназначено для ускорения доступа к документам и снижению трафика, проходящего через сеть Интернет. Механизм кэширования можно представить следующим образом. Предполо­жим, что клиент сети скачал через данный прокси-сервер какой-то файл. Если после этого другой клиент, подключившись к этому же прокси-серверу, захотел скачать тот же файл, что был затребован ра­нее, то он получит его намного быстрее, нежели первый. Это про­изойдет из-за того, что файл был помещен прокси-сервером в кэш­память и при повторном запросе он уже не выкачивался заново, а был взят из кэш-памяти прокси-сервера. Именно поэтому сокра­щается время ожидания его вторым клиентом. Следует иметь в виду, что не могут быть кэшированы документы, доступ к которым откры­вается только после внесения абонентской платы, или документы, для доступа к которым требуется пройти аутентификацию.

Существуют пассивное и активное кэширование:

Пассивное (passive caching) заключается в том, что прокси-сервер просто ожидает запрос и лишь после этого осуществляет поиск нужного документа, а также определяет, нужно ли производить кэширо­вание.

Технология активного кэширования (active caching) состоит в следующем. Прокси-сервер в те моменты, когда активность пользовате­лей снижается, пытается предугадать, какие из документов с боль­шей вероятностью будут затребованы, и извлекает их. Для того чтобы ускорить доступ к ресурсам, крупные компании устанавливают сразу несколько прокси-серверов. Все прокси-серверы разделяют на две группы: прозрачные (trans­parent) и непрозрачные (no transparent).

Прозрачные прокси-серверы при различного рода запросах покажут реальный IP-адрес, непрозрачные при любых запросах не выдают ре­альный IP-адрес. Таким образом, посещение сайтов, доступ к FTP-архивам становится анонимным. Владелец ресурса не сможет узнать IP-адрес клиента, тип браузера, операционную систему, страну пре­бывания, информацию о провайдере. Он может узнать лишь адрес прокси-сервера — реальный адрес клиента не «виден» за пределами прокси-сервера. Следует помнить, что лишь небольшое число про­кси-серверов позволяет скрывать IP-адрес, давая новый. Также не все непрозрачные прокси-серверы являются полностью анонимны­ми. Некоторые из них позволяют администратору посещаемого сай­та, определить не только IP-адрес прокси-сервера, но и IP-адрес, с которого происходит обращение к прокси-серверу, т. е. реальный IP-адрес клиента.

Использование непрозрачного прокси-сервера дает возможность получить информацию с сайта, который меняет ответ в зависимости от страны, из которой отправлен запрос. Такой прокси-сервер позво­лит также зайти на Web-узел конкурентов анонимно.

Дополнительная безопасность для клиента создается за счет того, что при использовании непрозрачного прокси-сервера всякий нападающий на клиента будет атаковать его прокси-сервер, который имеет соответствующую степень защиты. Прокси-серверы позволяют пользователям за счет кэширования экономить время в сети, оставаться анонимными при использовании непрозрачных прокси-серверов, но следует учитывать тот факт, что при использовании прокси-серверов тратится лишнее время на под­ключения к ним.

Статистические данные о поведении посетителей Web-серверов могут быть получены из так называемых log-файлов сервера. Провайдер услуг поддерживает log-файлы, в которых содержится информа­ция по каждому запросу ресурса с сервера. В них имеются следующие сведения: домен места, откуда пришел пользователь, дата и время по­сещения, команда, файл запроса, по какой ссылке он попал на сер­вер, какой браузер он использует и на какой платформе. Этот файл не содержит информации об электронном адресе пользователя, а толь­ко представляет название его домена. Например, для логистического анализа полезен домен, характеризующий географический регион пользователя, значительный маркетинговый интерес представляют данные о том, откуда посетитель попал на сервер. Провайдер имеет возможность установить программное обеспечение, осуществляю­щее статистический анализ перечисленных выше данных, и по со­гласованному графику отправлять результаты по электронной почте владельцу сервера.

Другим эффективным методом логистического анализа является использование файлов «cookies». Это небольшие файлы, находящие­ся на компьютере пользователя и позволяющие Web-серверу иденти­фицировать браузер пользователя. Когда пользователь посещает Web-сервер, последний запрашивает уникальный идентификацион­ный номер браузера. Если браузер не имеет такового, то сервер присваивает его данному браузеру посредством передачи файла «cookies» с определенным уникальным числом. Использование этих файлов позволяет отслеживать информацию о поведении пользователя в сети Интернет, дает возможность Web-серверам увеличивать функцио­нальные возможности, выполнять различные задачи по индивиду­альному взаимодействию с каждым пользователем. Основное поло­жительное качество файлов «cookies» для логистики состоит в возможности индивидуализировать подход к каждому клиенту. Ин­тернет-сообщество относится к использованию этих файлов неодно­значно, поскольку они позволяют собирать персональную информа­цию и тем нарушать право на свободу личной жизни. На рынке существуют программы, позволяющие фильтровать установку этих файлов или очищать от них жесткие диски компьютеров.

Организации, координирующие деятельность сети Интернет

Internet Society (ISOC) — профессиональное сообщество, занима­ющееся вопросами деятельности и развития сети Интернет, способами его использования, а также техническими, социальными и политичес­кими последствиями такого использования. Сообщество предостав­ляет поддержку группам и организациям, участвующим в использо­вании, управлении и развитии сети Интернет, проводит собрания, на которых обсуждаются вопросы технического и организационного характера; предоставляет информацию о сети Интернет. Internet Societyвыпускает бюллетень Internet Society News.

Internet Architecture Board (IAB). Входит в состав ISOC. Координи­рует развитие протоколов TCP/IP, представляет на рассмотрение ISOC результаты исследований. Объединяет в своем составе различ­ные группы по развитию Internet: IESG, IETF, IRTF, IANA, CERT.

Internet Engineering Steering Group (IESG). Группа работает по пра­вилам и процедурам, устанавливаемым советом ISOC, входит в структуру IAB. Занимается рассмотрением стандартов и техничес­кими работами для IETF. Анализирует состояние дел и заключительные редакции предложений по стандартам. Состоит из выборных членов IETF.

Internet Engineering Task Force (IETF). Входит в структуру IAB. Об­щественная организация, отвечающая за разработку стандартов на протоколы и архитектуру Internet. При возникновении любой про­блемы, связанной с архитектурой сети Интернет, из добровольцев собира­ется специальная группа. Рабочие группы IETF специализируются на отдельных проблемах по мере их возникновения. Рассмотренные проблемы могут быть направлены в IESG на рассмотрение и утверж­дение. Заседания IETF проводятся трижды в год.

Internet Research Task Force (IRTF). Входит в структуру IAB. Эта ор­ганизация концентрируется на развитии технологий, которые могут понадобиться в будущем по вопросам развития TCP/IP, поиска ин­формационных ресурсов, безопасности и защиты информации.

Network Information Center (NIC) — центры сетевой информации. Это организации, ответственные за распределение сетевых IP-адре­сов и регистрацию имен доменов. Снабжают пользователей докумен­тацией и информацией о сети Интернет. Каждый NIC, собирая многочис­ленные источники в одном месте, дает возможность быстро выяснить, какая информация доступна в Internet по основным темам. Хранит информационные документы для быстрого ознакомления ис­следователей сетевых технологий с новыми идеями — RFC (см. ни­же), другую документацию, справочники, доклады по Internet.

InterNIC— центр сетевой информации (NIC) в США. Объединя­ет три организации, осуществляющие разделение функции: регист­рация IP-адресов, доменов .com — Network Solution, Inc. (Херндон, Вирджиния), справочные услуги и сопровождение баз данных — AT&T, информационные услуги — General Atomic (Сан-Диего, Кали­форния).

Reseaux IP Europeans (RIPE) — организация, предназначенная для сотрудничества европейских поставщиков услуг сети Интернет, создана в 1989 г. Ее цель — техническая и организационная координация об­щеевропейской сети. Объединяет более 60 организаций по всей Ев­ропе.

Russian Institute for Public Networks (RIPN) — Российский институт общественных сетей, образован в 1992 г. Комитетом высшей школы России, Российским исследовательским центром «Курчатовский ин­ститут» и его компьютерным центром. Эта структура была создана с целью разработки системы коммуникаций в интересах проведения исследований и совершенствования образования, координация раз­вития IP-сетей России, помощи исследовательским и образовательным организациям в предоставлении доступа к сети Интернет через обще­ственные сети. Российский институт общественных сетей в рамках NIC для доменов xSU/RU выполняет следующие задачи: регистра­цию IP-адресов из блока, выделенного для RIPN Европейским коор­динационным центром RIPE, администрацию корневого домена «RU», сопровождение документации по Internet, поддержка каталога персон и организаций.

Документация сети Интернет представляет собой следующие документы:

Request for Comments (RFC) — информационные документы для быстрого ознакомления исследователей сетевых технологий с новыми идеями. В 1969 г. был сделан первый шаг в издании серии RFC. Вначале RFC документы печатались на бумаге и распространялись по почте. Архивы документов RFC можно свободно найти на многих компьютерах сети Internet по E-mail, FTP, WWW. Сейчас RFC пред­ставляют собой результат работы групп IETF и IRTF над стандарта­ми. Любой человек может подготовить документ, оформив его в виде RFC. После рассмотрения предложений в группе IETF документ бу­дет представлен Редактору, который присуждает документу очеред­ной RFC-номер. Документы серии RFC являются исключительно информационными документами, однако разработчики предпочита­ют придерживаться данных в них рекомендаций.

For Your Information (FYI) — документы «для ознакомления» — входят в серию RFC. Эти документы также содержат информацию по основам сети Интернет, однако рассчитаны на более широкую аудиторию. Документы «для ознакомления» являются подмножеством RFC и имеют FYI-номер и RFC-номер.

Standart Document (STD) — серия документов, имеющих силу стан­дарта Internet, входящая в подмножество RFC. У документов есть свой STD-номер и RFC-номер.

Frequently Asked Questions (FAQ) — часто задаваемые вопросы, до­кументы, оформленные в виде вопросов и ответов. В результате об­суждения на конференциях определенной темы формируется круг вопросов, которые задают большинство пользователей. Доброволь­цы собирают самые частые и интересные вопросы и наиболее пол­ные ответы на них. Затем документ публикуется в конференции, до­ступно любому желающему. Так появляется документ FAQ на определенную тему, который впоследствии может быть изменен и дополнен. FAQ — это опыт многих пользователей, собранный в од­ном документе.

ЛЕКЦИЯ 3.

Наши рекомендации