Принцип работы сети интернет
В основе интернета заложен хребет – суперкомпьютеры соединенные между собой высокоскоростными узлами связи. В дальнейшем по постоянной связи информация передает провайдеру.
Интернет поддерживает единый протокол TCP/IP.
Протоколом называют набор соглашений о правилах формирования и форматах сообщений интернет и о способах обмена информацией между абонентами сети.
Различают 2 типа протокола интернет:
1. Базовые протоколы – отвечающие за физическую пересылку электронных сообщений любого типа между компьютерами Интернет.
2. Прикладные – более высокого уровня, отвечающие за функционирование специализированных служб интернет.
Каждый компьютер, подключенный к интернет имеет уникальный физический адрес (IP адрес), составленный из 4 десятичных чисел разделенных точками. Например, 192.168.42.2. такие адреса имеют как компьютеры обычных пользователей, так и супер компьютеры входящие в хребет интернет. Но запомнить эти физические адреса очень сложно. Поэтому стали применять осмысленные буквенные обозначения разделенные запятыми. www.armavir.ru. Это буквенная запись физического IP – адреса. Перевод из одного адреса в другой осуществляет служба имен доменов (DNS).
Передача информации в интернет имеет 2 главные особенности:
1. Пакетная передача - в исходном узле сети сообщение разделяется на части – пакеты. Каждый пакет снабжается служебным заголовком, содержащим адрес отправителя, адрес получателя, номер пакета, контрольную сумму, и другую служебную информацию. В конечном пункте из полученных пакетов сообщение восстанавливается. Пакетная передача позволяет передавать по каналу связи одновременно сообщения разных пользователей: никто не простаивает в очереди. Если на линии возникают помехи, заново приходится передавать только поврежденные пакеты, а не все сообщение целиком.
2. Коммутация пакетов - коммутация пакетов - информационные пакеты в каждом узле передаются следующему доступному узлу по маршруту следования. Прохождением пакета по сети управляет служебная часть пакета – заголовок. Таким образом связь между исходной и конечными точками не устанавливается, маршрутизацией пакетов управляет служебная информация записанная в заголовке пакета. Эту информацию использует маршрутизатор узла - устройство с ПО, которое определяет (возможно при помощи обращения к маршрутизатору других узлов) соседний узел, в который надо передать пакет для его продвижения к пункту назначения. Передача в данном режиме обладает высокой надежностью в ячеистых сетях: если прямые линии выходят из строя, то пакеты доходят до пункта назначения обходными путями. В интернете нет центра управления, но существует международная не правительственная организация ISOC – Internet Society, которая утверждает сетевые стандарты (протоколы) и следит за адресной дисциплиной в сети.
2 февраля 2012 г.
Принципы поиска информации.
Отыскать нужные сведения в веб где опубликованы миллионы страниц не просто. Обычно при поиске веб страниц с использованием поисковой системы в качестве результата выдается очень большой объем информации. Например, список с адресами тысяч страниц, которые содержат указанный термин. Поэтому чем сильнее вы сузите диапазон поиска, тем точнее будет результат. Так, если орнитолог-любитель хочет получить специализированные данные о каких-либо птицах, то ему следует указать конкретный их вид (например, «синие цапли»), а не искать общую информацию о пернатых.
Умение «сузить фокус» служит залогом успешного поиска в Веб. Несколько используемых для этой цели методов, применимых в большинстве поисковых систем:
1. С использованием одного или нескольких слов (китайская кухня)
2. Знак плюс (+) для включения слов и знак минус (-) для их исключения (+пингвины -хоккей)
3. Фраза в кавычках «Жизнь на Марсе»
4. Логический поиск (кошки AND дрессировка NOT зоопарки)
Чтобы получить более подробную информацию о методах поиска характерных для конкретной поисковой системы просмотрите ее файл справки. Где описаны присущие им правила и принципы осуществления поиска. Если обычные методы не приносят желаемого результата, попытайтесь ввести критерии поиска с учетом синтаксиса, применяемого в данной системе.
Умение составлять булевы выражения и заключать фразы в кавычки - это, несомненно, полезная техника, и овладение ею необходимо. Но она не в состоянии обеспечить 100 % результат. Подлинное искусство поиска требует активных умственных действий и принятия решений на каждом шагу.
Для повышения эффективность поиска, запрос лучше формировать с применением так называемой сложной системы построения запросов. Для каждого сервера она своя, однако базовые операции поддерживаются всеми основными поисковыми системами. Те операторы, которые наиболее часто применяются для формирования запроса в российских поисковых система
Основные операторы, используемые при формировании запросов в российских поисковых системах
Оператор | Rambler | Yandex |
И | AND, & | &&, + |
или | OR, I | I |
НЕТ | NOT, ! | ~ ~, - |
Группировка | () | () |
Словосочетания | He применяется | “” |
Советы, которые позволяют повысить эффективность поиска в интернете:
· Прежде чем что-нибудь искать, определитесь с терминологией. Правильно поставленный вопрос — это уже половина ответа!
· Прежде чем подключаться к сети в поисках нужной информации, постарайтесь найти отправную точку из других источников (ссылки на интернет-адреса из газет и журналов).
· Поиск желательно начинать с редко встречающихся слов продвигаясь от частого к общему. Найдите специализированный узел по близкой тематике и уже на основе его оценки, а также полноты и качества приведенного материала принимайте решение о переходе на страницу «Ссылки», если таковая присутствует, и расширяйте тематику. Чем более грамотно оформлен сайт и чем четче и полнее представлена там информации, тем больше вероятность того, что указанные на нем ссылки приведут к веб-странице, содержащей ответ на ваш вопрос.
· Обращайте внимание на количество найденных документов. Чем мощнее и больше база данных, тем точнее должен быть запрос.
· Отмечайте для себя сайты, авторы которых кажутся вам компетентными в тех или иных вопросах. Сохраните адреса таких сайтов в папку «Избранное» и в следующий раз, прежде чем приступить к анализу интересующей вас проблемы, пройдите по этим ссылкам.
Тематические каталоги.
Поисковые инструменты интернета можно распределить по следующим категориям:
1. Каталоги
2. Метапоиск
3. Коллекции ссылок
4. Рейтинги
5. Индексы
Понятие каталога:
Для поиска информации в интернете используют интернет каталоги, построенные по иерархическому принципу (от общего к частому).
Задача.
Найти в интернете материалы по собакам породы Пинчер.
Воспользуемся каталогом list.ru в корневом списке разделов выберем позицию домашний очаг, как наиболее подходящую. На новой странице в подкаталоге выбранного раздела «кошки и собаки» выбираем позицию «породы собак». Число 221 в скобках указывает число ссылок по этой теме. Выбор на ной странице очевиден. Выбираем «пинчеры». Открывается страница с 3 ссылками на сайты про пинчеров. Ссылки снабжены комментариями (размещаются авторами каталога) и дополнительные информации (дата публикации ссылки в каталоге, география ссылки, ее популярность). Щелкаем на сайт и попадаем на сайт pincher.ru. где приступаем к поиску нужным материалов. Спускаясь по каталогу от корня (главной страницы) к листу (сайт ПИНЧЕР.РУ), мы прошли довольно длинный путь по иерархическому дереву. Можно было сэкономить время, воспользовавшись системой поиска по ключевой фразе на главной странице.
Результат поиска – 12 сайтов. Среди них три, которые мы нашли раньше из раздела:
Домашний очаг > Кошки и собаки > Породы собак > Пинчеры,а 9 из других разделов каталога. Поисковая машина сайта List.ru выполнила поиск в собственном каталоге, но можно выбрать и другую зону поиска.
Энциклопедия mail.ru. List.ru обращается к энциклопедии Рубрикона.
В словарях
Поиск по картинкам
Устройство каталога
Интернет-каталог представляет собой сайт, страницы которого имеют тематическую иерархию. На главной странице расположен список внутренних ссылок на основные темы каталога. На страницах-потомках – список внутренних ссылок, детализирующий тему родителя. На страницах-листьях – список внешних ссылок на сайты по данной теме.
Внешние ссылки на страницах-листьях снабжаются кратким описанием содержания сайта и дополнительной информацией (дата внесения в каталог, географическое расположение сайта, язык сайта, популярность сайта в каталоге).
Внешние ссылки могут располагаться в каталоге не только на листьях иерархии.
Перейдём, например, с главной страницы каталога list.ru в раздел «Автомобили». Наверху этой страницы помещён список потомков раздела:
· Авто-мото инфо
· Мотоциклы
· Авто и закон
А ниже – внешние ссылки на все сайты этого раздела.
Для удобства просмотра всех 5 675 ссылок этого большого раздела они распределены по нескольким последовательным страницам и снабжены страничным линейным меню. Перед списком ссылок приводятся дополнительные меню, которые позволяют выбрать способ сортировки, а также уменьшить количество предъявляемых записей, указав регион и тип сайта. Помимо тематической иерархии, в каталоге часто предусматривается алфавитный указатель, который также может быть построен на иерархической основе.
Например, на главной странице тематического каталога List.ru есть ссылка «Алфавитный указатель». Щелчок на ней загружает алфавитную страницу.
Пополняется каталог двумя способами:
1. Авторы каталога находят интересные ресурсы.
2. Владельцы сайтов отправляют заявку на размещение в каталоге своего ресурса.
Ресурс размещается в каталоге после рассмотрения заявки авторами каталога (заявка может быть и отклонена).
В каталоге List.ru ссылка, приглашающая занести ресурс в раздел, располагается рядом со страничным меню. Заявка на регистрацию ресурса записывается в страничные формы и выполняется за несколько шагов (на первом шаге проверяется, не заполняет ли форму робот, а также анализируется введённая ссылка).
Достоинства и недостатки каталога
Записи в каталог помещаются людьми – владельцами каталога. Отсюда все плюсы и минусы этого инструмента.
Плюсы
· Информация в каталогах хорошо структурирована, значит, её легко искать.
· Кроме общих, в Интернете много специализированных каталогов (туризм, автомобили, развлечения) – это также облегчает (конкретизирует) поиск.
· Каждая ссылка на сайт снабжена кратким описанием ресурса.
· На страницах-листьях каталога располагается совсем немного ссылок – их просмотр (в поисках нужного сайта) не займёт много времени.
Минусы
· Каталоги содержат сравнительно небольшие наборы записей и не могут претендовать на охват значительной части Интернета.
· Набор записей каталога отражает субъективные предпочтения авторов.
· Содержание каталога с трудом поспевает за быстро меняющимся Интернетом.
Правда, в хороших каталогах (например, в каталоге Яндекса) содержится целый штат «дятлов» – программ, которые «простукивают» сайты по ссылкам каталога. Если сайт недоступен в течение нескольких дней, он снимается с публикации. Как только сайт начинает отвечать, он автоматически появляется в каталоге.
Каталоги предназначены для поиска сайтов по заданной теме, а не конкретной информации на их страницах. Например, при помощи каталога трудно найти ответ на вопрос «кто такой Чичиков?» или «что такое каталог?».
Популярные каталоги
· Каталог Yahoo. Адрес в Интернете: www.yahoo.com
· Каталог Апорт. Адрес в Интернете: www.aport.ru
· На время написания статьи – самый популярный каталог Рунета. Адрес в Интернете: list.ru. Этот каталог с 2001 года входит в состав универсального сайта (портала) mail.ru
· Каталог Refer.ru. Адрес в Интернете: www.refer.ru. Refer.ru был запущен в эксплуатацию в 2000 году. Каталог имеет очень детализированную структуру, которая удобным образом представляется на странице в виде дерева ссылок.
· Каталог Яндекс. Адрес в Интернете: yaca.yandex.ru
В дополнение к обычной рубрикации по темам (Бизнес, Дом, Развлечения, Отдых и пр.), Яндекс предлагает классификацию сайтов по типу содержащейся в них информации (Справки, Товары и услуги, Публикации и пр.). Кроме того, можно уточнить запрос по региону.
Сайты в рубриках расположены по убыванию их тематического индекса цитирования (ИЦ). Индекс цитирования учитывает количество ссылок на сайт с других сайтов, придавая этим ссылкам разный «вес» (значимость) в зависимости от авторитетности ссылающегося сайта.
Метапоиск.
Базы данных поисковых систем интернета отличатся и по объему и по содержанию. Кроме того вычисления релевантности результатов выполняется разными алгоритмами.
Релевантность – числовая характеристика отражающая степень соответствия полученных результатов ожиданием пользователя.
Вот почему мощный яндекс порой не выдает нужного результат на обозримом количестве первых ссылок. А менее мощный апорт неожиданно выкладывает горячую информацию на первую страницу.
В сложных случаях приходится пользоваться услугами нескольких поисковых систем. Именно поэтому в Сети завоёвывают популярность поисковики нового типа: метапоисковые машины.
У этих поисковиков нет собственных баз данных. Они обращаются к «настоящим» поисковым системам (индексы, каталоги, рейтинги), переадресуя им запрос пользователя, а затем суммируют результаты, удаляя дублирующиеся записи и сортируя сводный список по релевантности.
Кроме метапоисковых систем в Сети существуют более простые мультипоисковые машины или мультипоисковые формы – они не суммируют результаты, полученные от поисковиков, а предлагают их для обозрения в отдельных окнах.
Адрес в Интернете: xrambler.ru
Примеры популярных метапоисковых систем рассмотрим более подробно.
MetaBot
Адрес в Интернете: www.metabot.ru
Возможность явного задания набора поисковиков отсутствует.
Если выбран «русский» поиск, он выполняется при помощи серверов:
Рамблер
Апорт
AltaVista
MSN
Для поиска по всему миру используются:
AltaVista
MSN
В дополнение к обычному поиску MetaBot поддерживает язык запросов, в котором присутствуют элементы, работающие так же, как в Яндексе:
Элемент языка | Пример запроса | Описание |
" " | газета из рук в руки | Поиск точной фразы |
+ | карта + московской области | Обязательное включение объекта |
- | + отдых –отдых в турции | Исключение объекта |
| | фото | фотография | снимок | Поиск страниц, содержащих любой из объектов, связанных знаком | |
MetaBot утверждает, что использование этого синтаксиса приведёт к корректной переадресации запросов используемым поисковым системам.
Nigma
Адрес в Интернете: nigma.ru
Есть возможность явно задать набор систем поиска.
В каждой результирующей записи присутствует ссылка на поисковики. Кроме того, для каждого запроса система создаёт мини-каталог, по разделам которого разносит найденные записи (кластеризация), – это очень удобно.
Например, по результатам запроса Дуванов Nigma «на лету» построила такой каталог:
Коллекция ссылок.
Это систематизированное собрание ссылок на ресурсы сети. Коллекцию ссылок можно найти на любом правильном сайте в разделе ссылки, где авторы сайта помещают гипертекстовые переходы на ресурсы связанные с темой своего сайта.
Выделяют 2 вида коллекций ссылок – традиционные (схематические коллекции). Найти страницу с такой тематической коллекцией просто. На нее обычно указывает позиция главного меню сайта с соответствующим названием.
Сайт ListSoft: www.listsoft.ru – Коллекция всевозможных программ и утилит для Windows: ссылки на страничку с загрузкой, описание программы, комментарии.
Сайт autor.ru: autor.ru – Коллекция литературных ссылок: библиотеки, книжные магазины, литературные порталы, официальные страницы писателей.
Социальные сервисы предназначенные для создания и сопровождения коллетивных проектов.
Социальный сервис – del.icio.us – народные коллекции ссылок
Wiki – открытые коллективные гипертексты – Wikipedia, youtube.ru – народные коллекция видеоклипов Блоги.
Рейтинги
Рейтинг (или топ) — это каталог, в котором ссылки на сайты внутри категорий сортируются по популярности сайтов.
При подсчете популярности учитываются:
· Хиты (визиты) — общее число заходов на сайт.
· Хосты — количество уникальных посетителей за отчетный период (день, неделю, месяц).
Если пользователь посетил новый для себя сайт 10 раз, то число хитов этого сайта увеличивается на 10, а число хостов — на 1.
Для включения в каталог рейтинга владелец сайта размещает на страницах своего сайта (на главной и, возможно, на других узловых страницах) счетчики владельца рейтинга.
Счетчик представляет собой небольшой HTML-код, содержащий скрипт (программу). Когда посетитель открывает в Интернете страницу со счетчиком, скрипт связывается с сервером рейтинга и добавляет единицу к счетчику хитов сайта, а также к счетчику его хостов, если пользователь посетил сайт впервые в течение отчетного периода.
Уникальность посетителя (хост) определяется по IP-адресу компьютера, с которого была выполнена загрузка страницы сайта со счетчиком.
Рамблер: top100.rambler.ru
Spylog: dir.spylog.ru
Mail: top.mail.ru
Directrix: directrix.ru
Индексы
Каталоги и рейтинги удобны для поиска сайтов по теме, но они плохо помогают, когда нужно найти конкретную информацию или фрагмент текста, содержащий определенные ключевые слова.
Кроме того, каталоги и рейтинги охватывают лишь очень небольшую часть Интернета, и даже в ней плохо отслеживают изменения, которые происходят в Интернете каждый день.
Более мощным инструментом поиска с широким охватом Сети являются индексы (поисковые системы, поисковики) — сервера, которые автоматически, при помощи специальных программ (их называют пауками) постоянно сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных.
Когда пользователь выдает запрос в индекс, поиск выполняется уже не в Интернете, а в базе данных индекса, и поэтому отнимает очень мало времени.
На сервере индекса располагаются:
· База данных по страницам Интернета: сами страницы в сжатом виде и словарь по ним (индекс).
· Программы для сбора страниц Интернета (пауки).
· Программа для поиска информации в базе данных.
· Сайт, на котором пользователь может записывать запросы на поиск и просматривать результаты.
Рис. 1.56. Устройство индекса Интернета