Поиск информации в Интернете

Для поиска информации в обычно используются три способа. Первый из них - поиск по адресу. Он применяется, когда пользователю известен адрес информационного ресурса, содержащего необходимую ему информацию. При организации поиска информации по адресу (форма адреса - IP, доменный или URL - в этом случае значения не имеет) пользователю достаточно просто ввести адрес ресурса в соответствующее поле браузера – программы, предназначенной для обеспечения доступа к сетевым ресурсам.

Второй – поиск с помощью навигации по гиперсвязям. При использовании этого вида поиска случае пользователь сначала должен получить доступ к серверу, связанному с соответствующей БД. После этого можно найти документ, используя гиперссылки. Очевидно, что этот способ удобен, когда адрес ресурса неизвестен пользователю. Для использования в качестве исходной точки для поиска при реализации этого способа предназначены Web-порталы - серверы, предоставляющие прямой доступ к некоторому множеству серверов. Доступные через портал серверы могут относиться к определенной системе (например - корпоративной) или различным системам и быть специально подобраны по видовому, тематическому или другим признакам документов и данных, содержащихся на их сайтах. Доминирующим сервисом портала является сервис справочной службы: поиск, рубрикаторы, финансовые индексы и т.д. Порталы являются совокупностями программных средств и заранее неструктурированной информации, которую эти средства превращают в структурированные данные по запросу конкретных пользователей.

Третий способ поиска предполагает использование поисковых серверов Интернета. Поисковыми серверами называют выделенные хост - компьютеры, в которых размещаются базы данных ресурсов Интернета. Пользовательский интерфейс такого сервера имеет поле для ввода ключевых слов, описывающих тему, интересующую пользователя. Эти слова сервер воспринимает как информационный запрос, в соответствии с которым он осуществляет поиск ресурсов и представляет список найденных документов пользователю.

Очевидно, что при реализации этого способа возможны ошибки как 1-го (пропуск цели), так и 2-го рода (информационный шум). Различаются две группы поисковых серверов: поисковые машины и предметные каталоги. Их отличие обусловлено способом создания и последующего пополнения базы данных ресурсов Интернета, которой данный сервер осуществляет информационный поиск. Так, поисковые машины имеют в своем составе специальную программу - поисковый робот. Она осуществляет постоянный мониторинг сети, собирает информацию с Web- страниц, индексирует их и фиксирует их поисковый образ в своей базе данных. В предметных каталогах база данных о документах Интернета формируется «вручную» специалистами-редакторами. Поскольку в Интернете отсутствует единое администрирование, постольку его информационные ресурсы постоянно меняются. В нём могут появляться новые и исчезать существующие документы. Частота обновления информации в документах для разных сайтов различна поэтому очень важно понимать, что при использовании информационно-поисковых систем для нахождения информации в Интернете, поиск осуществляется не на реальном пространстве документов Сети, а в некоторой модели, содержание которой может значительно отличаться от действительного содержания Интернет в момент проведения поиска. По степени охвата индексируемых ресурсов поисковые системы можно разделить на две группы: международные и русскоязычные. Первые индексируют все опубликованные в Интернете документы подряд. Вторые индексируют ресурсы, расположенные в доменных зонах с преобладанием русского языка. Список наиболее популярных систем:

Google Яндекс (44,4 % Рунета)

Yahoo! Rambler (10,6 % Рунета)

Bing Mail.ru (7,3 % Рунета)

MSN Nigma (0,5 % Рунета)

AltaVista Gogo.ru (0,3 % Рунета)

Ask Aport (0,2 % Рунета)

Необходимо упомянуть, что существует особая категория поисковых серверов – метапоисковые системы. Их принципиальное отличие состоит в том, что у них отсутствует собственная индексная база данных, и поэтому они, получив запрос пользователя, перенаправляют его сразу к нескольким поисковым серверам. Возможность одновременного использования нескольких поисковых серверов по одному запросу является очевидным преимуществом метапоисковых систем. Система Metabot.ru позволяет использовать для поиска ресурсов как международные, так и русскоязычные поисковые серверы.

Чтобы получить лучшие результаты поиска, необходимо запомнить несколько простых правил:

1. Не искать информацию только по одному ключевому слову.

2. Не вводить ключевые слова с прописной буквы;

3. Если в итоге поиска вы не получили никаких результатов, проверьте, нет ли в ключевых словах орфографических ошибок.

Современные поисковые системы предоставляют возможность подключения к сформированному запросу семантического анализатора. С его помощью можно, введя какое-либо слово, выбрать документы, в которых встречаются производные от этого слова в различных падежах, временах и пр.

Основные понятия и характеристики текстовых процессоров. MS Word 2007 (2010) и его новые функциональные возможности

В текстовом редакторе MS Office Word 2007 интерфейс приложения обеспечивает быстрое стилевое форматирование документа, что позволяет сэкономить время при задании формата текста и таблиц. Темы документов предоставляют возможность оформлять документы с использованием одних и тех же цветов, шрифтов и эффектов для достижения общего единства оформления. Возможность добавлять стандартные блоки готовых данных (Building Blocks) в Office Word 2007 сокращает количество ошибок, связанных с копированием и вставкой часто используемой информации, причем данные блоки легко обновлять и применять при групповой работе. Для вставки стандартной информации достаточно выбрать нужное содержимое в меню Building Blocks и поместить его в документ. Добавление в документ цитат и ссылок можно осуществить одним щелчком мыши, выполняя поиск по базам данных готовых ссылок.

Новая функция сравнения документов дает возможность более тщательно производить сравнение двух версий, включая выполненные перемещения текста и внесенные изменения, в том числе и в таблицах. Это может быть крайне важным при поиске в документе изменений. При сравнении можно также использовать новую панель обзора, состоящую из трех областей, две из которых отображают два сравниваемых документа, а третья – конечный документ, объединяющий изменения из первых двух документов. При этом одновременная прокрутка всех трех областей облегчает систематическое отслеживание изменений.

Новая функция проверки документов (Document Inspector) помогает перед их распространением выявлять и удалять из них нежелательные комментарии, персонально идентифицируемую информацию, скрытый текст и другие конфиденциальные данные. А снабдив документ цифровой подписью, вы подтвердите, что его содержимое с момента публикации не было изменено, и позволите другим пользователям убедиться в этом.

Новая функция связывания данных в Office Word 2007 предоставляет возможность динамического отображения сведений, хранящихся в информационных системах. Использование новых форматов Word XML позволяет легко обновлять хранилище данных в формате XML, находящееся внутри файла Office Word, обеспечивая тем самым своевременное обновление содержимого документа. Интеграция XML-документов путем связывания данных с источниками деловой информации позволяет организациям создавать и развертывать структурированные шаблоны документов, помогающие пользователям обеспечить достоверность информации в своих документах, не прибегая к обширному поиску во внешних приложениях, а используя элементы управления документами и связанными данными.

Элементы управления документами позволяют структурировать процесс их составления, устанавливая как обязательные конкретные типы информационных данных или добавляя разделы, не допускающие правки или изменения форматирования. Постоянный подсчет слов в реальном времени отслеживает их количество в документе прямо в процессе набора текста, а контекстная проверка орфографии помогает избежать неправильного словоупотребления. При этом стало проще получить статистические данные о документе.

Программа текстового редактора Microsoft Office Word 2007 содержит встроенное средство для записи и редактирования формул. Это средство не является самостоятельным приложением, это компонент текстового редактора Word 2007.

В Microsoft Office 2007 значительно улучшена система защиты документов. Существенно изменен формат файлов: теперь вместо OLE-контейнеров применяется легко читаемый формат XML. Однако если файл защищен паролем «на открытие», документ представляет собой OLE-контейнер, в котором находится информация о шифровании и сам зашифрованный документ. Для шифрования применяется широко известный и очень криптостойкий алгоритм AES. Длина ключа всегда 128 бит, что исключает возможность прямого перебора ключей. При формировании ключа происходит 50 тыс. преобразований по алгоритму SHA-1, исходными данными для которых являются пароль и число, уникальное для каждого документа. При этом скорость прямого перебора паролей значительно уменьшается и, по предварительным оценкам, составит около 500 паролей в секунду на современных процессорах Intel Core 2 Duo. Следовательно, стойкий пароль к документу Office 2007 восстановить практически невозможно. Единственным препятствием к использованию данной защиты является новый формат файлов, который пока не очень распространен.

21. MS Excel 2007 (2010): общая характеристика и функциональные возможности

Microsoft Excel — программа для работы с электронными таблицами, созданная корпорацией Microsoft дляMicrosoft Windows, Windows NT и Mac OS. Она предоставляет возможности экономико-статистических расчетов, графические инструменты и, за исключением Excel 2008 под Mac OS X, язык макропрограммирования VBA (Visual Basic for Application). Microsoft Excel входит в состав Microsoft Office и на сегодняшний день Excel является одним из наиболее популярных приложений в мире.

В Microsoft Excel вплоть до 2003 версии включительно, использовался свой собственный бинарный формат файлов (BIFF) в качестве основного. Excel 2007 использует Microsoft Office Open XML в качестве своего основного формата.

Несмотря на то, что Excel 2007 поддерживает и направлен на использование новых XML-форматов в качестве основных, он по-прежнему совместим с традиционными бинарными форматами. Кроме того, большинство версий Microsoft Excel могут читать CSV, DBF и другие форматы.

Microsoft Excel 2007 вводит множество новых форматов файлов:

Формат Расширение Примечания
Рабочая книга Excel .xlsx Стандартный формат рабочих книг Excel 2007. В действительности это сжатый ZIP-архив каталога XML документов. Является заменой бывшего бинарного формата .xls, хотя и не поддерживает макросы по соображениям безопасности.
Рабочая книга Excel с макросами .xlsm Та же рабочая книга Excel, но с поддержкой макросов.
Бинарная рабочая книга Excel .xlsb Та же рабочая книга Excel с макросами, но хранящая информацию в бинарном формате, открывая документы быстрее чем XML. В особенности часто используется для очень больших документов с десятками тысяч строк и/или сотнями колонок.
Шаблон Excel с макросами .xltm Шаблон, созданный как основа для рабочих книг, включена поддержка макросов. Заменяет старый формат .xlt.
Надстройка Excel .xlam Надстройка Excel, направленная на добавление дополнительных функциональных возможностей и инструментов.

API позволяет открывать таблицы Excel в ряде других приложений.

Ценной возможностью Excel является возможность писать код на основе Visual Basic для приложений (VBA). Этот код пишется с использованием отдельного от таблиц редактора.

Защита Microsoft Excel предоставляет несколько типов различных паролей: пароль для открытия документа, пароль для изменения документа, пароль для защиты листа, пароль для защиты книги, пароль для защиты общей книги. Все пароли, кроме пароля для открытия документа, можно удалить мгновенно, вне зависимости от версии MS Excel, в которой был создан документ. Единственным типом пароля, который может помешать злоумышленнику получить доступ к документу является «пароль для открытия». В MS Excel версии 95 и ранее, «пароль на открытие» преобразовывается в 16-битный ключ, который взламывается мгновенно. Ситуация кардинально изменилась в MS Excel 2007 — для шифрования стал использоваться современный алгоритм AES с ключем в 128 бит.

Наши рекомендации