И технологии программирования 7 страница

Обычно пользователи идентифицируют Интернет со службой WWW (World Wide Web — Всемирная паутина). Но это далеко не так, ибо WWW — одна из многочисленных служб Интернета. По анало­гии Интернет можно сравнить с системой транспортных магистра­лей, а виды сервисов Интернет — с различными службами доставки.

В число наиболее часто используемых служб Интернет входят электронная почта, WWW, служба новостей Интернет, передача фай­лов по протоколу FTP, терминальный доступ по протоколу Telnet и ряд других служб.

Электронная почта. Электронная почта возникла раньше, чем Интернет, однако она не только не устарела, но, напротив, является наиболее массовой службой Сети и постоянно приобретает новых пользователей. Электронное письмо, как и обычное, содержит адре­са отправителя и получателя. В него можно вложить графическое изображение или иной файл — точно так же, как в конверт с пись­мом можно положить открытку или фотографию. На него можно поставить электронную подпись, которая играет ту же роль, что и подпись в обычном письме. Однако служба e-mail давно обошла по популярности традиционную почту: ежегодно'в мире рассылается более 600 млрд электронных писем. Чем же вызвана такая популяр­ность? Для ответа на этот вопрос перечислим достоинства электрон­ной почты.

В отличие от телефонного звонка электронная почта может быть прочитана в удобное время, что особенно важно с учетом разницы во времени между часовыми поясами. Следует также отметить демо­кратичность электронной почты: отправляя электронное письмо хоть самому президенту, вы не рискуете отвлечь его от текущих дел. К удобствам электронной почты следует также отнести возможность рассылки писем сразу большому количеству получателей, высокую скорость доставки, удобство пересылки вложенных файлов. Хране­ние писем в базе данных почтового клиента позволяет осуществлять быстрый поиск и сортировку почтовых отправлений. Кроме того, электронная почта в несколько сот раз дешевле обычной почтовой рассылки.

Обычно в момент регистрации доступа в Интернет сервис-про­
вайдер предоставляет пользователю дисковое пространство под по­
чтовый ящик: адрес этого почтового ящика (E-mail Account Address),
имя пользователя (E-mail Account Login Name) и пароль (E-mail
Account Password). Пароль для доступа предоставляется в целях пре­
дотвращения несанкционированного доступа к почте. Адрес элект-
ронной почты имеет формат: имя_пользователя @ имя_домена, на­
пример [email protected].

Часть слева от значка @ — это имя почтового ящика (E-mail Account Name) на сервере, из которого владелец этого адреса заби­рает письма (в данном примере — Ivanov). Как правило, имя пользо­вателя совпадает с именем почтового ящика. Часть справа от значка @ называется доменом и указывает на местонахождение этого почтового ящика. Нужно отметить, что но­сителем адреса электронной почты является вовсе не конечный пункт доставки, т.е. не адрес вашего домашнего компьютера, а адрес сер­вера, на котором вы будете получать почту.

Электронная почта построена по принципу клиент-серверной архитектуры. Пользователь общается с клиентской программой, ко­торая, в свою очередь, общается с почтовым сервером. Очевидно, что процедуры отправки и получения почты требуют разной степени идентификации личности, поэтому существуют и два разных прото­кола — на отправку, и на прием писем.

Для передачи, писем используются протокол SMTP (Simple Mail Transfer Protocol — простой протокол пересылки почты) и соответ­ственно SMTP-серверы. Чаще всего отправка почты происходит с почтового сервера вашего Internet-провайдера, хотя, в принципе, это не обязательно. Обычно SMTP-серверы не требуют идентификации,

поэтому вы можете отправить письмо с любого такого сервера. Для приема почтовых сообщений в настоящее время наиболее часто ис­пользуется протокол РОРЗ (Post Office Protocol — протокол почтово­го офиса), который контролирует право пользователя забирать по­чту из ящика и поэтому требует предоставления имени пользователя и пароля.

Рассмотрим конкретный пример работы почты. Пусть некий владелец электронного ящика с адресом [email protected] на почтовом сервере abc.ru пишет письмо владельцу почтового ящика с адресом [email protected] на сервере xyz.com.

Для того чтобы подготовить письмо, он вызывает клиентскую программу, создает текст сообщения и в графе Кому указывает адрес получателя [email protected]. Если отправитель не имеет постоянного подключения к Интернету, то после нажатия кнопки Отправить он устанавливает сеанс связи с провайдером и начинает получать на­копившуюся почту и отправлять подготовленные письма. Порядок приема почты обычно зависит от текущих настроек почтовой про­граммы. Нередко письма складываются в определенную папку и от­правляются другой командой после установки связи с провайдером. Процесс загрузки на локальный компьютер вновь поступивших пи­сем и'отправления новых писем на сервер называется синхронизаци­ей учетной записи.

После того как вы подключились к Интернету, клиентская про­грамма соединяется с почтовым сервером и передает серверу почто­вый адрес получателя [email protected] и текст самого сообщения. При отправке почты клиентская программа взаимодействует с сервером исходящей почты, т.е. с SMTP-сервером, по протоколу SMTP, под­ключаясь к порту с номером 25. Процедура отправки электронной почты заключается в копировании вновь подготовленных сообщений из базы клиента в базу почтового сервера (в нашем случае — серве­ра abc.ru).

Рассмотрим этот процесс более подробно. После того как пись­мо доставлено на сервер отправителя, SMTP-сервер последнего дол­жен связаться с сервером получателя. Для этого ему необходимо знать IP-adpec SMTP-сервера, получающего почту для адресов из домена xyz.com. Чтобы узнать этот адрес, он обращается к DNS-cepeepy и задает ему вопрос: Каков IP-адрес SMTP-сервера, получающего по­чту для адресов из домена xyz.com?

DNS-сервер выдает IP-адрес, после чего SMTP-сервер на abc.ru может соединиться с SMTP-сервером на xyz.com. Если по какой-либо причине SMTP-сервер на abc.ru не может связаться с SMTP-серве­ром на xyz.com, то послание встает в очередь для отправки. Обычно через каждые 15 минут производится попытка переслать послание из очереди. Через четыре часа отправителю будет послано сообщение о проблеме, а спустя пять дней большинство серверов прекращают попытки и возвращают отправителю недоставленную почту, так что бесследно ваше письмо не исчезнет.

Как только SMTP-серверу на abc.ru удается связаться с SMTP-сервером на xyz.com, он передает послание. Сервер xyz.com опреде­ляет, существует ли пользователь с именем vasya, и передает посла­ние в ящик vasya.

После того, как почта оказалась на сервере xyz.com, получатель имеет возможность скачать ее оттуда. При получении почты, нако­пившейся в вашем почтовом ящике, клиентская программа получа­теля взаимодействует с РОРЗ-сервером по протоколу РОРЗ. Посколь­ку при входе в Интернет вы уже сообщаете свой пароль и логин, то обычно при получении почты дополнительного введения этих дан­ных не требуется (следует отметить, что в принципе пароль на доз-вон и доступ к ящику не всегда один и тот же). Ваш почтовый кли­ент связывается с РОРЗ-сервером и передает команды, которые определяют передачу копий посланий электронной почты на локаль­ную машину клиента.

WWW — самый популярный сервис Интернета. Именно он, бла­годаря своей относительной простоте и наглядности для пользова­телей, сделал столь массовыми обращения к ресурсам Сети.

В самом общем плане WWW — это система Web-серверов, под­держивающая документы, форматированные специальным образом. Служба WWW реализована в виде клиент-серверной архитектуры. Пользователь с помощью клиентской программы (браузера) осуще­ствляет запрос той или иной информации на сервере, а Web-сервер обслуживает запрос браузера. Браузер ~ это программа, обеспечива­ющая обращение к искомому ресурсу на сервере по его URL, интер­претирующая полученный результат и демонстрирующая его на кли­ентском компьютере.

Протокол, по которому происходит доставка Web-сервером до­кумента Web-браузеру, носит название HTTP (Hypertext Transfer Protocol — протокол передачи гипертекста). Гипертекст — это текст, содержащий гиперссылки, связывающие слова или картинки доку­мента с другим ресурсом (с каким-нибудь еще документом или с иным разделом этого же документа), при этом подобные связанные сдова или картинки документа, как правило, выделяются, обычно с помощью подчеркивания. Пользователь может активировать эту связь щелчком мыши. Поскольку современные электронные документы содержат не только текст, но и любую мультимедийную информацию (текст, графика, звук), в качестве ссылок стали использовать не толь­ко текстовые, но и графические объекты. Со временем понятие ги­пертекста было расширено до понятия гипермедиа. Гипермедиа — это метод организации мультимедийной информации на основе ссылок на разные типы данных.

Особенно продуктивной идея гипертекста оказалась примени­тельно к объединению цифровой информации, распределенной на серверах во всем мире.

WWW — это глобальная гипертекстовая система, организован­ная на базе Internet. WWW представляет собой механизм, при по­мощи которого связывается информация, доступная посредством многочисленных Web-серверов во всем мире. Web-сервер — это про­грамма, которая умеет получать http-запросы и выполнять в соответ­ствии с этими запросами определенные действия, например запус­кать приложения и генерировать документы.

Документ, доступный через Web, называют Web-страницей, а группы страниц, объединенные общей темой и навигационно, — Web-узлами, или Web-сайтами. Один аппаратный Web-сервер может со­держать несколько Web-сайтов, но возможна и обратная ситуация, когда огромный Web-сайт может поддерживаться группой Web-сер­веров. Тот факт, что навигация не требует знаний о местоположении искомых документов, как раз и является основным удобством и при­чиной популярности службы WWW.

В браузерах реализованы две основные функции: запрос инфор­мации у Web-сервера и отображение ее на клиентском компьютере. Кроме того, браузеры обладают дополнительными сервисными фун­кциями, такими как упрощение поиска, хранение закладок, указы­вающих на избранные страницы, и др.

Популярность WWW обусловлена тем, что можно не только про­сматривать чужие страницы и иметь доступ к огромному количеству информации, представленной на сотнях миллионов компьютеров, но и создать собственные ресурсы и таким образом донести любую ин­формацию до всех будущих посетителей сайта. Иными словами, WWW — это глобальный механизм обмена информацией: одни люди помещают информацию на Web-серверы, а другие ее просматрива­ют. Создав Web-сайт, владелец может поместить туда информацию различного рода: текст, графику, звук, анимацию, которая станет до­ступной для всех посетителей этого ресурса. С появлением в Сети вашей страницы информация о вас или о вашей фирме станет дос­тупна сотням миллионов пользователей круглосуточно семь дней в неделю. Количество информации, которое может быть предоставле­но посетителю, практически не ограничено по времени, в отличие от радио или телевидения.

7.9,7. Поиск в интернете

Бытует мнение, что в Интернете есть все, но найти там что-либо

, практически невозможно. Впрочем, противоположная точка зрения,

взятая на вооружение поисковой системой Яндекс, гласит, что найти

в Интернете можно все. Видимо, для того чтобы находить, нужно

|уметь искать.

Для поиска в Интернете предназначены различные инструмен­ты: поисковые машины, индексированные каталоги, метапоисковые системы, тематические списки ссылок, онлайновые энциклопедии и (справочники При этом для поиска разного рода информации наи­более эффективными оказываются различные инструменты. Рассмот­рим каждый инструмент в отдельности.

Индексированные каталоги содержат информацию, иерархически структурированную по темам. Тематические разделы первого уровня определяют широко популярные темы, такие как спорт, отдых, на­ука, магазины и т.д. В каждом разделе есть подразделы. Таким обра­зом, путешествуя по дереву каталога, можно постепенно сужать об­ласть поиска. Дойдя до нужного подкаталога, вы находите в нем , набор ссылок. Обычно в каталоге все ссылки являются профильны­ми, поскольку составлением каталогов занимаются не программы, а люди. Очевидно, что'если вы ищете информацию по некоторой ши­рокой теме, то целесообразно обратиться к каталогу. Если же вам необходимо найти конкретный документ, то каталог окажется мало эффективным поисковым средством. Один из наиболее популярных каталогов в России - List.ru находится по адресу http://mail.ru/. Кро­ме каталогов общего назначения в Сети много специализированных каталогов. Если внутри отдельной темы каталога находится огром­ное количество ресурсов, возникает проблема выбора. В некоторых каталогах имеется сортировка по популярности, например в катало­ге Яндекс сортировка идет по индексу цитирования

Тематические списки ссылок - это списки, составленные группой профессионалов или коллекционерами-одиночками. Часто узкоспе­циализированная тема может быть раскрыта одним специалистом лучше, чем группой сотрудников крупного каталога. Тематических коллекций в Сети очень много,,' поэтому давать конкретные адреса не имеет смысла

Поисковые машины. В ответ на запрос мы обычно получаем длин­ный список документов, многие из которых не имеют никакого от­ношения к теме запроса. Такие документы называются нерелевант­ными, т.е. не относящимися к делу. Таким образом, релевантный документ — это документ, содержащий искомую информацию. Оче­видно, что от умения грамотно делать запрос зависит процент полу­чаемых релевантных документов. Доля релевантных документов в списке всех найденных поисковой машиной документов называется точностью поиска. Если все найденные документы релевантные, то точность поиска составляет 100 %. Если найдены все релевантные документы, то "полнота поиска - 100 %. Таким образом, качество по­иска определяется двумя параметрами: точностью и полнотой поис­ка. Эти величины взаимозависимы, т.е. увеличение полноты снижа­ет точность, и наоборот.

Поисковая машина состоит из двух частей: робота, или паука, и поискового механизма. База данных робота формируется в основном им самим (робот сам находит ссылки на новые ресурсы) и в суще­ственно меньшей степени - владельцами ресурсов, которые регист­рируют свои сайты в поисковой машине. Помимо робота, который обходит все предписанные серверы и формирует базу данных, суще­ствует программа, определяющая рейтинг найденных ссылок.

Принцип работы поисковой машины сводится к тому, что она опрашивает свою базу данных по ключевым словам, которые пользо­ватель указывает в поле запроса, и выдает список ссылок, ранжиро­ванный по релевантности.

Поиск по индексу заключается в том, что пользователь формиру­ет запрос и передает его поисковой машине. В случае, когда у пользо­вателя имеется несколько ключевых слов, весьма полезно использо­вание булевых операторов. Текст, в пределах которого проверяется логическая комбинация, называется единицей поиска. Это может быть предложение, абзац или весь документ. В разных поисковых систе­мах могут использоваться различные единицы поиска. После того, как пользователь сделал запрос, поисковая система обрабатывает синтаксис запроса и сравнивает ключевые слова со словами в индек­се. После этого составляется список сайтов, отвечающих запросу, они ранжируются по релевантности, и формируется результат поиска, который и выдается пользователю.

Существует огромное количество поисковых систем. Наиболее популярная на Западе поисковая система — Google (www.google.com). Всемирно популярный каталог Yahoo! в качестве поисковой систе­мы использует именно Google. В Рунете самыми популярными по­исковыми системами являются Яндекс (www.yandex.ru) и Рамблер (www.rambler.ru).

Метапоисковые системы. Так как Интернет развивается стреми­тельными темпами, то рост количества документов происходит быс­трее, чем поисковые системы успевают их проиндексировать. Отсю­да следует, что даже если в Сети и есть то, что вы ищете, вовсе не обязательно, что об этом знает та поисковая машина, к которой вы обратились. Велика вероятность, что нужный документ проиндекси­рован другой поисковой системой. Поэтому существуют службы, по­зволяющие транслировать запрос сразу в несколько поисковых сис­тем, — это метапоисковые системы. Однако пользоваться ими во всех случаях не следует. Если документов по теме много, то метапоиск, возможно, даже вреден, поскольку смешивает разные логики ранжи­рования. Но если документов по теме мало, то метапоиск может быть полезен именно потому, что объединяет большое число поисковых систем.

Очень удобной в этом отношении является отечественная про­грамма ДИСКо Искатель (www.disco.ru).

Онлайновые энциклопедии и справочники. Очень часто нужно най­ти не документ, содержащий то или иное ключевое слово, а имен­но — толкование искомого слова. Одной из крупнейших онлайновых энциклопедий является ресурс Яндекс.Энциклопедии (http:// encycl.yandex.ru/). Этот проект содержит 219 968 статей из 14 энцик­лопедий, в том числе из БСЭ и Энциклопедии Брокгауза и Ефрона. К крупным относится и Энциклопедия.Кирилла и Мефодия, кото­рую можно найти по адресу www.km.ru.

Особенно актуальным является поиск толкований терминов по информационным технологиям, которые развиваются так быстро, что уследить за появлением новых терминов очень сложно. Единствен­ный ресурс на русском языке, который можно назвать компьютер­ным энциклопедическим словарем, — это проект Компьютерная энциклопедия Кирилла и Мефодия (http://www.megakm.ru/pc/), преду­сматривающая поиск не только по термину, но и по тематической структуре. Объем словаря терминов - 700 статей. Объем англоязыч­ного словаря FOLDOC (Free On-line Dictionary Of Computing; http:// wombat.doc.ic.ac.uk/) - более 13 тыс. терминов.

7.9.8. Практические рекомендации

1. Используйте различные инструменты для поиска информации
разного профиля. Поиск в каталоге дает представление о структу­ре вопроса, поисковая система позволяет найти конкретный до­кумент.

2. Избегайте общих слов, осуществляя поиск в поисковой машине.
Чем уникальнее ключевое слово, по которому осуществляется
поиск, тем скорее вы его найдете. Логика здесь очевидна, одна­
ко факты позволяют лучше понять ситуацию: 400 наиболее час­
то употребляемых слов русского языка со всеми словоформами
(около 2 тысяч) составляют одну треть всех слов в среднестати­стическом тексте, а частотный список на 8 тыс. слов покрывает
уже 80 % всех словоупотреблений в текстах.

3. Ищите больше чем по одному слову. Сократить объем ссылок
можно, определив несколько ключевых слов. Используйте синонимы.

4. Не пишите прописными буквами. Избегайте написания ключево­го слова с прописной буквы. В ряде поисковых систем заглавные буквы позволяют искать имена собственные, например фир­ма Intel.

5. Используйте функцию Найти похожие документы. Если один из
найденных документов ближе к искомой теме, чем остальные,
нажмите на ссылку Найти похожие документы.

6. Пользуйтесь языком запросов. С помощью языка запросов можно сделать запрос более точным.

7. Пользуйтесь расширенным запросом. Во многих поисковых си­стемах есть форма расширенного запроса, в которой можно ис­пользовать основные механизмы сужения поиска.

8. Пользуйтесь метапоисковыми системами, если по теме мало до­кументов.

Наши рекомендации