Способы поиска информации в web
Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.
Существуют три основных способа поиска информации в Интернет:
1. Указание адреса страницы.
2. Передвижение по гиперссылкам.
3. Обращение к поисковой системе (поисковому серверу).
Способ 1: Указание адреса страницы
Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.
Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).
Способ 2: Передвижение по гиперссылкам
Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.
Способ 3: Обращение к поисковой системе
Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.
На помощь приходят специальные поисковые системы (их еще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы: Яндекс (yandex.ru), Google (google.ru) и Rambler (rambler.ru
Поисковая система
Поисковая система — веб-сайт, предоставляющий возможность поиска информации в Интернете.
Вопрос 23
Полнотекстовый поиск (автоматический поиск по словам из текста документа). Этот вид поиска основан на автоматической обработке текста. При запросе на поиск тех документов, где встречается конкретное слово, автоматически происходит перебор всего массива документов и выбор всех тех документов, где это слово встречается. Существуют быстрые алгоритмы такого поиска, когда при первоначальном вводе каждого документа все встречающиеся в нем слова вносятся в общий словарь, и в дальнейшем при поиске по любому слову из словаря можно мгновенно получить список всех документов, где оно встречается. Более того, на основе полнотекстового поиска могут быть реализованы различные способы формирования поисковых запросов. При формировании сложных запросов дополнительно может использоваться признак близости слов в тексте. Например, в запросе ГЛАВНЫЙ И БУХГАЛТЕР может быть указано, что слова должны находиться РЯДОМ в пределах 2 (или 3) строк.
У полнотекстового поиска имеются и свои недостатки. Во-первых, полученный список будет содержать «шум», то есть документы, где искомое слово используется не в нужном контексте и т.п. Во-вторых, не будут найдены такие документы, где встречаются синонимы данного термина. Так, задав поиск по слову НЕСОВЕРШЕННОЛЕТНИЙ, невозможно автоматически получить документы, где используется выражение ЛИЦО, НЕ ДОСТИГШЕЕ ВОСЕМНАДЦАТИ ЛЕТ.
Вопрос 24
Поиск по специализированным классификаторам. Существует достаточно много разновидностей классификаторов. Общей чертой всех разновидностей поиска по классификаторам является то, что вся информация проходит предварительную обработку и рубрицируется. Это означает, что эксперт ставит в соответствие каждому элементу информационного массива (документу в целом или его части) определенный элемент классификатора, то есть таким образом указывается определенная рубрика. После такой обработки пользователь может выбрать интересующую его рубрику и получить всю подборку документов или их частей, которые были предварительно отобраны экспертом. Чаще всего в основе таких классификаторов лежит предмет правового регулирования, «тема» документа. При этом классификатор представляет собой систему юридических понятий (рубрик, ключевых слов, дескрипторов), отражающих содержание актов, которые составляют информационный массив.
В зависимости от расположения рубрик классификаторы можно разделить на иерархические и алфавитные.
В первой разновидности классификаторов рубрики расположены в иерархическом порядке, от общего к частному. Такое расположение рубрик более традиционно, оно напоминает оглавление книги и понятно абсолютному большинству пользователей. В разных базах данных используются различные классификаторы этой разновидности: Общеправовой классификатор отраслей законодательства (ОКОЗ), его модификации или другие независимые разработки.
Классификаторы второй разновидности разработаны на основе специальных словарей, состоящих из юридических понятий, расположенных в алфавитном порядке (в частности, к этой разновидности классификаторов относятся ключевые слова).
Каждая из этих разновидностей классификаторов (чаще вторая) может усложняться путем уточнения и увеличения количества юридических понятий, составляющих классификатор. Рубрики могут состоять из некоторого набора терминов и представлять собой описание определенной ситуации.
Вопрос 25
С помощью e-mail можно посылать сообщения, получать их в свой электронный почтовый ящик, отвечать на письма корреспондентов, рассылать копии писем сразу нескольким адресатам, переправлять полученное письмо по другому адресу, использовать вместо адресов (числовых или доменных имен) логические имена, создавать несколько подразделов почтового ящика для разного рода корреспонденции, включать в письма различные файлы, пользоваться системой «отражателей почты» для ведения дискуссий с группой корреспондентов.
Для доставки письма необходимо знать электронный адрес получателя. Адрес электронной почты состоит из имени пользователя и домена, на котором он зарегистрирован, соединенных знаком @ (читается «эт», на компьютерном сленге «собака» или «лягушка»). Например, [email protected] — это адрес электронной почты пользователя ivanov, зарегистрированного на портале KM.RU. На пути к адресату письмо проходит несколько почтовых отделений (узлов). Процесс поэтапного определения пути письма называется маршрутизацией (routing). Адрес пишется только латиницей; большие и маленькие буквы в почтовом адресе не различаются. Если адрес написан неправильно, письмо или не дойдет вовсе, или попадет не к тому адресату.
Электронная почта не требует одновременного присутствия обоих абонентов на разных концах линии. Письмо одновременно может быть послано нескольким абонентам. E-mail не обладает приватностью обычной почты, не следует доверять электронному письму конфиденциальных сведений.
Хотя электронная почта может рассматриваться как частный случай передачи файлов, она имеет ряд особенностей, не привычных для стандартных процедур пересылки файлов. Во-первых, отправитель и получатель почти всегда люди, а не машины. Это означает, что система электронной почты состоит из двух различных, но тесно взаимосвязанных частей: одна обеспечивает взаимодействие с человеком (например, составление, редактирование, прочтение сообщений), другая — передачу сообщений (например, рассылка по спискам, обеспечение передачи). Другое различие между электронной почтой и средствами передачи файлов общего назначения состоит в том, что почтовые послания представляют собой четко структурированный документ. Во многих системах каждое послание сопровождается большим количеством дополнительных полей. Они включают в себя имя и адрес отправителя, имя и адрес получателя, дату и время отправки письма, перечень тех, кому направлена копия письма, уровень значимости, степень секретности. Почтовые программы для персональных компьютеров используют разные протоколы для приема и отправки почты.
Вопрос 26
Топология шина (или, как ее еще часто называют общая шина или магистраль) предполагает использование одного кабеля, к которому подсоединены все рабочие станции. Общий кабель используется всеми станциями по очереди. Все сообщения, посылаемые отдельными рабочими станциями, принимаются и прослушиваются всеми остальными компьютерами, подключенными к сети. Из этого потока каждая рабочая станция отбирает адресованные только ей сообщения.
Достоинства топологии “шина”:
· простота настройки;
· относительная простота монтажа и дешевизна, если все рабочие станции расположены рядом;
· выход из строя одной или нескольких рабочих станций никак не отражается на работе всей сети.
Недостатки топологии “шина”:
· неполадки шины в любом месте (обрыв кабеля, выход из строя сетевого коннектора) приводят к неработоспособности сети;
· сложность поиска неисправностей;
· низкая производительность – в каждый момент времени только один компьютер может передавать данные в сеть, с увеличением числа рабочих станций производительность сети падает;
· плохая масштабируемость – для добавления новых рабочих станций необходимо заменять участки существующей шины.
Топология “кольцо”
Кольцо – это топология локальной сети, в которой рабочие станции подключены последовательно друг к другу, образуя замкнутое кольцо. Данные передаются от одной рабочей станции к другой в одном направлении (по кругу). Каждый ПК работает как повторитель, ретранслируя сообщения к следующему ПК, т.е. данные передаются от одного компьютера к другому как бы по эстафете. Если компьютер получает данные, предназначенные для другого компьютера – он передает их дальше по кольцу, в ином случае они дальше не передаются.
Достоинства кольцевой топологии:
· простота установки;
· практически полное отсутствие дополнительного оборудования;
· возможность устойчивой работы без существенного падения скорости передачи данных при интенсивной загрузке сети.
Однако “кольцо” имеет и существенные недостатки:
· каждая рабочая станция должна активно участвовать в пересылке информации; в случае выхода из строя хотя бы одной из них или обрыва кабеля – работа всей сети останавливается;
· подключение новой рабочей станции требует краткосрочного выключения сети, поскольку во время установки нового ПК кольцо должно быть разомкнуто;
· сложность конфигурирования и настройки;
· сложность поиска неисправностей.
Кольцевая топология сети используется довольно редко. Основное применение она нашла в оптоволоконных сетях стандарта Token Ring.
Топология “звезда”
Звезда – это топология локальной сети, где каждая рабочая станция присоединена к центральному устройству (коммутатору или маршрутизатору). Центральное устройство управляет движением пакетов в сети. Каждый компьютер через сетевую карту подключается к коммутатору отдельным кабелем При необходимости можно объединить вместе несколько сетей с топологией “звезда” – в результате вы получите конфигурацию сети с древовидной топологией. Древовидная топология распространена в крупных компаниях. Мы не будем ее подробно рассматривать в данной статье.
Топология “звезда” на сегодняшний день стала основной при построении локальных сетей. Это произошло благодаря ее многочисленным достоинствам:
· выход из строя одной рабочей станции или повреждение ее кабеля не отражается на работе всей сети в целом;
· отличная масштабируемость: для подключения новой рабочей станции достаточно проложить от коммутатора отдельный кабель;
· легкий поиск и устранение неисправностей и обрывов в сети;
· высокая производительность;
· простота настройки и администрирования;
· в сеть легко встраивается дополнительное оборудование.
Однако, как и любая топология, “звезда” не лишена недостатков:
· выход из строя центрального коммутатора обернется неработоспособностью всей сети;
· дополнительные затраты на сетевое оборудование – устройство, к которому будут подключены все компьютеры сети (коммутатор);
· число рабочих станций ограничено количеством портов в центральном коммутаторе.
Среди сетевого оборудования можно выделить следующие виды:
- Сетевые карты – контроллеры, которые предназначены для приема сигналов из сети и передачи сигналов в сеть.
- Терминаторы – специальные резисторы, производящие затухание сигналов на концах сети.
- Концентраторы – центральные устройства сети или кабельной системы, пересылающие пакеты из своего порта на все порты системы. Их разделяют на пассивные и активные. Пассивные – пропускают сигнал без усиления, а активные – усиливают и передают полученные сигналы.
- Повторители – устройства, которые усиливают входящий сигнал на расстояние одного сегмента сети.
- Коммутаторы – это центральные устройства сети, которые управляются программным обеспечением и позволяют сократить трафик за счет передачи приходящего пакета только конечному адресату.
- Маршрутизаторы – устройства, которые позволяют фильтровать широковещательные сообщения и маршрутизировать и переадресовывать пакеты из одной сети в другую.
- Мосты – это устройства, соединяющие два сегмента и передающие трафик между ними. Они также конвертируют и усиливают сигналы для кабелей различного типа, что позволяет расширить размеры сети без нарушений ограничений длинны кабеля.
- Шлюзы – аппаратно-программные комплексы, которые соединяют разнородные сетевые устройства или сети. Они решают проблемы самых разных систем администрации и протоколов.
- Мультиплексоры – специальные офисные устройства, которые поддерживают множество цифровых абонентских линий.
- Межсетевые экраны – некие сетевые устройства, которые контролируют поступающую и исходящую информацию сети, тем самым обеспечивая ее защиту.
Вопрос 27
Internet – всемирная информационная компьютерная сеть, представляющая собой объединение множества региональных компьютерных сетей и компьютеров, обменивающих друг с другом информацией по каналам общественных телекоммуникаций (выделенным телефонным аналоговым и цифровым линиям, оптическим каналам связи и радиоканалам, в том числе спутниковым линиям связи).
Информация в Internet хранится на серверах. Серверы имеют свои адреса и управляются специализированными программами. Они позволяют пересылать почту и файлы, производить поиск в базах данных и выполнять другие задачи.
Обмен информацией между серверами сети выполняется по высокоскоростным каналам связи (выделенным телефонным линиям, оптоволоконным и спутниковым каналам связи). Доступ отдельных пользователей к информационным ресурсам Internet обычно осуществляется через провайдера или корпоративную сеть.
Провайдер - поставщик сетевых услуг – лицо или организация предоставляющие услуги по подключению к компьютерным сетям. В качестве провайдера выступает некоторая организация, имеющая модемный пул для соединения с клиентами и выхода во всемирную сеть.
Основными ячейками глобальной сети являются локальные вычислительные сети. Если некоторая локальная сеть непосредственно подключена к глобальной, то и каждая рабочая станция этой сети может быть подключена к ней.
Существуют также компьютеры, которые непосредственно подключены к глобальной сети. Они называются хост - компьютерами (host - хозяин). Хост – это любой компьютер, являющийся постоянной частью Internet, т.е. соединенный по Internet – протоколу с другим хостом, который в свою очередь, соединен с другим, и так далее.
Для подсоединения линий связи к компьютерам используются специальные электронные устройства, которые называются сетевыми платами, сетевыми адаптерами, модемами и т.д.
Практически все услуги Internet построены на принципе клиент-сервер. Вся информация в Интернет хранится на серверах. Обмен информацией между серверами осуществляется по высокоскоростным каналам связи или магистралям. Серверы, объединенные высокоскоростными магистралями, составляют базовую часть сети Интернет.
Вопрос 28
Компьютерная сеть – это совокупность компьютерного и сетевого оборудования, соединенного с помощью каналов связи в единую систему. Для создания компьютерной сети нам потребуются следующие компоненты:
· компьютеры, имеющие возможности для подключения к сети (например, сетевая карта, которая есть в каждом современном ПК);
· передающая среда или каналы связи (кабельные, спутниковые, телефонные, волоконно-оптические и радиоканалы);
· сетевое оборудование (например, коммутатор или роутер);
· сетевое программное обеспечение (как правило, входит в состав операционной системы или поставляется вместе с сетевым оборудованием).
Компьютерные сети принято подразделять на два основных вида: глобальные и локальные.
Локальные сети (Local Area Network – LAN) обладают замкнутой инфраструктурой до выхода на поставщиков услуг интернета. Термин “локальная сеть” может описывать и маленькую офисную сеть, и сеть большого завода, занимающего несколько гектаров. Применительно к организациям, предприятиям, фирмам используется термин корпоративная сеть – локальная сеть отдельной организации (юридического лица) независимо от занимаемой ею территории.
Корпоративные сети являются сетями закрытого типа, доступ к ним разрешен только ограниченному кругу пользователей (например, сотрудникам компании). Глобальные сети ориентированы на обслуживание любых пользователей.
Глобальная сеть (Wide Area Network – WAN) охватывает большие географические регионы и состоит из множества локальных сетей. С глобальной сетью, которая состоит из нескольких тысяч сетей и компьютеров, знакомы все – это Интернет.
Системному администратору приходится иметь дело с локальными (корпоративными) сетями. Обычный пользовательский компьютер, подключенный к локальной сети, называется рабочей станцией. Компьютер, предоставляющий свои ресурсы для общего использования другим компьютерам сети, называется сервером; а компьютер, обращающийся к совместно используемым ресурсам на сервере – клиентом.
Существуют различные виды серверов: файловые (для хранения общих файлов), серверы баз данных, серверы приложений (обеспечивающие удаленную работу программ на клиентах), web-серверы (для хранения web-контента) и другие.
Загрузка сети характеризуется параметром, называемым трафиком. Трафик – это поток сообщений в сети передачи данных. Под ним понимают количественное измерение числа проходящих по сети блоков данных и их длины, выраженное в битах в секунду. Например, скорость передачи данных в современных локальных сетях может быть 100Мбит/с или 1Гбит/с
В настоящее время в мире насчитывается огромное количество всевозможного сетевого и компьютерного оборудования, позволяющего организовать самые различные компьютерные сети. Все многообразие компьютерных сетей можно разделить на несколько видов по различным признакам:
По территории:
· локальные – охватывают небольшие территории и располагаются внутри отдельных офисов, банков, корпораций, домов;
· региональные – образуются путем объединения локальных сетей на отдельных территориях;
· глобальные (интернет).
По способу связи компьютеров:
· проводные (компьютеры соединяются посредством кабеля);
· беспроводные (компьютеры обмениваются информацией посредством радиоволн. например, по технологии WI-FI или Bluetooth).
По способу управления:
· с централизованным управлением – для управления процессом обмена данных в сети выделяется одна или несколько машин (серверов);
· децентрализованные сети – не содержат в своем составе выделенных серверов, функции управления сетью передаются по очереди от одного компьютера другому.
По составу вычислительных средств:
· однородные – объединяют однородные вычислительные средства (компьютеры);
· неоднородные – объединяют различные вычислительные средства (например: ПК, торговые терминалы, веб-камеры и сетевое хранилище данных).
По типам среды передачи сети разделяются на оптоволоконные, с передачей информации по радиоканалам, в инфракрасном диапазоне, через спутниковый канал и т.д.
Вы можете встретить и другие классификации компьютерных сетей. Как правило, системному администратору приходится иметь дело с локальными проводными сетями с централизованным, либо децентрализованным управлением.
Вопрос 29
Для того чтобы при обмене данными компьютеры, объединенные в сеть, действовали согласованно, разработан ряд стандартов и правил, называемых протоколами. Весь набор сетевых протоколов, на которых базируется Интернет называется TCP/IP (ти си пи ай пи). Название образовано из аббревиатур двух базовых протоколов — TCP, отвечающего за гарантированную транспортировку данных по каналам связи, и IP, содержащего правила адресации.
Протоколы, входящие в семейство TCP/IP разделяются на уровни.
Физический уровень описывает среду передачи данных (будь то кабель, оптоволокно или радиоканал), физические характеристики такой среды и принцип передачи данных (разделение каналов, модуляцию, амплитуду сигналов, частоту сигналов, способ синхронизации передачи, время ожидания ответа и максимальное расстояние).
Канальный уровень описывает, каким образом передаются пакеты данных через физический уровень, включая кодирование (т.е. специальные последовательности битов, определяющих начало и конец пакета данных). Примеры протоколов канального уровня — Ethernet, IEEE 802.11 Wireless Ethernet, SLIP, Token Ring, ATM и MPLS.
Сетевой уровень изначально разработан для передачи данных из одной сети (подсети) в другую.
Протоколы транспортного уровня могут решать проблему гарантированной доставки сообщений («дошло ли сообщение до адресата?»), а также гарантировать правильную последовательность прихода данных. Транспортные протоколы определяют, для какого именно приложения предназначены эти данные.
На прикладном уровне работает большинство сетевых приложений. Эти программы имеют свои собственные протоколы обмена информацией, например, HTTP для WWW, FTP (передача файлов), SMTP (электронная почта), SSH (безопасное соединение с удалённой машиной), DNS (преобразование символьных имён в IP-адреса) и многие другие.
Вопрос 30
Система управления базами данных (СУБД) — совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих управление созданием и использованием баз данных.
Основные функции СУБ
1. управление данными во внешней памяти (на дисках);
2. управление данными в оперативной памяти с использованием дискового кэша;
3. журнализация изменений, резервное копирование и восстановление базы данных после сбоев;
4. поддержка языков БД (язык определения данных, язык манипулирования данными).
Специальным образом организованная и хранящаяся во внешней памяти ЭВМ взаимосвязанная информация (данные) о реальных объектах, называются базами данных (БД).
Совокупность базы данных и обслуживающих программ называется информационно-поисковой системой (ИПС).
Программное обеспечение, с помощью которого строится база данных, на основе которого создаются и функционируют ИПС, называется системой управления базами данных(СУБД). Они обычно ориентируются на один из типов структур данных: "деревья" (иерархические СУБД), сети (сетевые СУБД), отношение (реляционные СУБД).
Широко используются такие базы данных:
· справочники (телефонные, фармацевтические, научные)
· словари (иностранных слов, терминов)
· каталоги (библиотечные, музыкальные)
· картотеки (видеофильмов, медицинских карт, личных дел)
· расписания (уроков, движений поездов, автобусов)
· коллекции и т.д.
Устройства внешней памяти, предназначенные для хранения БД, должны иметь высокую информационную ёмкость и малое время доступа к хранимой информации.
В работе с СУБД возможны следующие режимы: создание, редактирование (внесение любых изменений в уже созданную базу данных), поиск, манипулирование (просмотр, копирование файлов, сортировка)