Вопрос 21 URL – сетевой адрес документа. Поиск в Интернете. Поисковые службы в Интернете.
Построение запросов в поисковых службах. Приемы, форматы и кодировки при сохранении
Найденной в Интернете информации.
URL-адрес документа состоит из трех частей и, в отличие от доменных имен, читается слева направо. В первой части указано имя прикладного протокола, по которому осуществляется доступ к данному ресурсу. Для службы World Wide Web это протокол передачи гипертекста HTTP (HyperText Transfer Protocol). У других служб — другие протоколы. Имя протокола отделяется от остальных частей адреса двоеточием и двумя косыми чертами.
Второй элемент— доменное имя компьютера, на котором хранится данный документ. Со структурой доменного имени мы уже знакомы — его элементы разделяются точками. После доменного имени ставится косая черта.
Последний элемент адреса — путь доступа к файлу, содержащему Web-документ, на указанном компьютере. С записью пути доступа к файлу в операционной системе Windows мы уже знакомы, но здесь есть важное отличие. В Windows принято разделять каталоги и папки символом обратной косой черты «\», а в Интернете положено использовать обычную косую черту «/». Это связано с тем, что Интернет зарождался на компьютерах, работающих в операционной системе UNIX, а там принято разделять каталоги именно так.
В систему URL заложены следующие принципы:
Расширяемость - новые адресные схемы должны легко вписываться в существующий синтаксис URL; расширяемость достигается за счет выбора определенного порядка интерпретации адресов, который базируется на понятии "адресная схема". Идентификатор схемы стоит перед остатком адреса, отделен от него двоеточием и определяет порядок интерпретации остатка.
Полнота - по возможности любая из существовавших схем должна описываться посредством URL.
Читаемость - адрес должен легко пониматься человеком, что вообще характерно для технологии WWW, - документы вместе с ссылками могут разрабатываться в обычном текстовом редакторе.
Формат URL включает:
схему адреса (тип протокола доступа - http, gopher, wais, telnet, ftp и т.п.);
IP- или доменный адрес машины;
номер TCP-порта;
адрес ресурса на сервере (каталог или путь к файлу);
имя HTML-файла или метку;
критерий поиска данных.
Поиск в Интернете с помощью поля поиска
· В поле поиска введите несколько слов или фразу по интересующей вас теме, например «рецепт шоколадного торта». Старайтесь дать наиболее точное определение.
· Нажмите клавишу ВВОД или нажмите кнопку Поиск .
· Отобразится страница результатов поиска. Щелкните одну из ссылок для перехода на соответствующий веб-узел. Если необходимые сведения не найдены, нажмите кнопку Далее в нижней части страницы, чтобы просмотреть другие результаты, или выполните новый поиск.
· При открытии текстового файла приложением MicrosoftOfficeWord или другой программой — возможно, на компьютере с системным программным обеспечением на языке, отличающемся от языка, на котором был создан файл — кодировка помогает определить, как этой программе представить текст, чтобы он был читаемым.
Предполагаемое действие:
Кодировка текста
Выбор стандарта кодировки при открытии файла
Выбор стандарта кодировки при сохранении файла
Поиск стандартов кодировок, доступных в приложении Word
Кодировка текста
То, что отображается на экране в виде текста, на самом деле хранится в текстовом файле как числовое значение. Компьютер, используя стандарт кодировки, преобразует эти числовые значения в видимые знаки.
Стандарт кодировки представляет собой числовую схему, где каждому текстовому знаку из набора знаков соответствует числовое значение. Набор знаков может включать буквы алфавита, цифры и другие знаки. Разные языки обычно состоят из разных наборов знаков, поэтому существует много разных стандартов кодировки для представления наборов знаков, используемых в разных языках.
Разные стандарты кодировки для разных алфавитов
Стандарт кодировки, сохраняемый вместе с текстовым файлом, предоставляет информацию, необходимую для того, чтобы отображать текст на экране. Например, в кодировке «кириллица (Windows)» знаку Й соответствует числовое значение 201. При открытии файла, содержащего эту букву, на компьютере, использующем кодировку «кириллица (Windows)», будет прочтено числовое значение 201 и на экране отобразится знак Й.
Однако если тот же самый файл открыть на компьютере, использующем другую кодировку, то он отобразит знак, которому соответствует числовое значение 201, в том стандарте кодировки, который использует данный компьютер по умолчанию. Например, если компьютер использует стандарт кодировки «Западная Европа (Windows)», этот знак в оригинальном файле, созданном в кодировке «кириллицы», будет отображаться как É, а не Й, поскольку в кодировке «Западная Европа (Windows)» значение 201 отображает знак É.
Юникод: единый стандарт кодировки для множества алфавитов.
Чтобы избежать проблем, связанных с кодированием и раскодированием файлов, можно сохранять файлы в кодировке Юникод. Юникод включает наборы знаков для большинства языков, которые в наши дни используются на компьютерах.
Поскольку Word создан на основе Юникод, он автоматически сохраняет файлы в кодировке Юникод. Файлы в кодировке Юникод можно открывать и читать на компьютере с англоязычной системой независимо от того, на каком языке написан текст. Подобным же образом, если использовать англоязычную систему для сохранения файла в кодировке Юникод, файл может включать знаки, которые отсутствуют в западноевропейских алфавитах, в частности греческие, кириллические, арабские или японские знаки.
Нажмите кнопку MicrosoftOffice , а затем выберите команду Сохранить как.
Если нужно сохранить файл в другой папке, укажите путь и откройте ее.
В поле Имя файла введите новое имя файла.
В поле Тип файла выделите Обычный текст.
Нажмите кнопку Сохранить.
Если появится диалоговое окно MicrosoftOfficeWord - проверка совместимости, щелкните Продолжить.
В диалоговом окне Преобразование файла выберите параметр требуемого стандарта кодировки.