Информационные технологии Internet
Такое большое количество пользователей Сети делает ее очень привлекательной с точки зрения средства распространения информации. В настоящее время Internet широко используется как: средство коммерческой рекламы, огромный реферативный справочник, всемирная библиотека, всемирная справочная служба, средство индивидуального и группового информационного обмена, средство проведения конференций, мировой архив звуковой и видеоинформации и т.п.
Первым текстовым документом, который был специально предназначен для распространения по сети Internet, в то время ARPANET, был документ под названием "Программное обеспечение сетевого узла", который был разработан Стивом Крокером, одним из участников проекта ARPANET. Этот документ был подготовлен и распространен по сети в 1969 году. Работа Крокера положила начало библиотеке стандартов сети Internet - знаменитым Request For Comments. Из названия этих документов, буквально - "Материалы для комментариев", следует, что они предназначались для обсуждения сетевым сообществом и результатом такого обсуждения должен был быть некий стандарт на программное обеспечение или нормы поведения в сети. Каждый из участников обсуждения мог вносить любые замечания в документ, и после этого рассылал документ другим участникам дискуссии.
Второй важной вехой в деле распространения информации в Internet стало рождение системы телеконференций Usenet. Собственно, появление первой системы обмена новостями не связано непосредственно с Сетью. В 1979 году в университете штата Северная Каролина двумя аспирантами: Томом Траскотом и Джимом Элисом на базе протокола обмена сообщениями между компьютерами с операционной системой Unix -- UUCP было создано программное обеспечение электронной доски объявлений, при помощи которого они связали два компьютера. В 1981 году система была реализована на языке программирования "С" в университете Беркли аспирантами Маком Нортоном и Метом Гликманом и в 1982 году была выпущена свободно-распространяемая версия этой программы. В 1984 и 1986 годах система была переписана с учетом опыта распространения информации в ARPANET, а в 1986 году для системы новостей был разработан специальная форма обмена информацией - протокол Network News Transfer Protocol (NNTP), который был зафиксирован в качестве стандарта Internet под номером 977 (RFC-977). С этого момента система телеконференций Usenet становится одним из стандартных информационных ресурсов Сети.
Usenet - это огромная электронная доска объявлений, разделенная на части согласно интересам ее пользователей. Каждая группа новостей имеет свое название. Система названий имеет иерархическую структуру. Например, группа новостей, описывающих информационные технологии Internet называется comp.infosystems, что означает - группа "компьютеры" подгруппа "информационные системы". В свою очередь каждая подгруппа может быть разбита на новые подгруппы. Так группа comp.infosystems.www имеет более 10 подгрупп (comp.infosystems.www.misc, comp.infosystems.www.users, comp.infosystems. www.providers и т.п.)
В момент рождения Usenet задумывалась как средство обмена мнениями между коллегами по работе, затем ее стали использовать как средство общения групп пользователей Сети, объединенных определенным интересом. Это могли быть пользователи какого-нибудь программного продукта, скажем СУБД Oracle, или любители фантастики Толкиена. Однако очень скоро пользу Usenet осознали и рекламные агентства. В настоящее время боле 35% всех сообщений Usenet являются рекламными объявлениями специально подготовленными для распространения по Сети. Примером такого сорта является коммерческая группа новостей Relis акционерного Общества РЕЛКОМ. Долгое время новости распространялись в виде простых текстовых файлов, однако в последнее время, после появления специальных стандартов разметки текстовой информации ( языки Hypertext Markup Language и Standard Generalised Markup Language ), программные средства просмотра новостей стали позволять просматривать не только текст, но и графические образы, и короткие фильмы, прослушивать звуковые объявления.
Другим важным средством обмена информацией в Internet является электронная почта. Электронная почта появилась приблизительно в то же время, что и Usenet. Долгое время Usenet даже использовала для передачи новостей каналы электронной почты. Главной задачей электронной почты является обеспечение надежной и быстрой доставки корреспонденции от одного адресата другому. Пионером внедрения систем электронной почты в СССР являлась сеть РЕЛКОМ. Однако, как и по обычной почте, по электронной почте также возможно распространение периодических изданий. Этот способ опубликования на сети называется почтовыми списками. Почтовые списки (Listserv) появились впервые в компьютерной сети BITNET и завоевали всемирное признание. Как правило каждый список ведется специальным администратором или группой администрирования. В качестве примера такого списка можно назвать каталог программных средств фирмы Cognitive - известного производителя систем распознавания образов и оцифровки текстов.
Если в вашем распоряжении имеется телефон и он достаточно хорошо работает, т.е. способен поддерживать соединение абонентов в течении четверти часа, то преимущества электронной почты перед обычной очевидны. Первое преимущество - это скорость доставки. Если абоненты включен в глобальную сеть Internet непосредственно через IP-соединение, то он получит послание через несколько секунд. Если абонент имеет коммутируемое соединение с Internet, то скорость доставки ограничивается периодичностью его подключения, которую он определяет сам. В любом случае, пользователь точно получит послание в течение дня. Если учесть, что даже по Москве почта не ходит быстрее суток, а из Московской области в Москву ее доставляют почти неделю, то электронная почта выглядит на этом фоне просто сверхзвуковым лайнером на фоне черепахи. Что уж говорить о скоростях доставки обычной почты из дальнего и ближнего зарубежья. Иногда она просто не доходит.
Долгое время считалось, что электронная почта пригодна только для передачи текстовых сообщений, поэтому ее не рассматривали в качестве серьезного конкурента обычной почты при распространении подписных изданий. Такое мнение было основано на том факте, что передача больших фалов по коммутируемой линии дело довольно муторное. Как правило наша телефонная сеть не позволяет передать по линии связь файл размером в один мегабайт за один сеанс связи. Однако ситуация постепенно меняется, а это значит, что по почте становится возможным передача и графики и видео и другой нетекстовой информации. В странах Европы и США стало нормальной практикой электронная почта, в которую встроены графические картинки или аудио информация. Для сообщений этого рода разработан даже специальный формат -- MIME. Кроме того международная организация стандартизации ‑ ISO разработала еще один стандарт для передачи сообщений с нетекстовой информацией ‑ X.400. Важной особенностей, перечисленных выше стандартов является передача специально размеченного текста, что дает возможность при отображении сообщений на экране или при печати управлять стилем текста и шрифтами.
Еще одним большим преимуществом электронной почты является ее дешевизна по сравнению с обычной почтой. Особенно ясно это становится при отправке и получении международной корреспонденции. Разница в тарифах достигает одного двух порядков и это вообще-то понятно: не надо жечь керосин и гнать на другой конец света самолет или океанский лайнер. Тот же эффект просматривается и при сравнении с такими средствами связи как телефон или факс. Для того, чтобы не терять такое качество телефаксовой связи на графику многие почтовые сети используют специальные программы ‑ телефаксовые серверы. Суть работы телефаксового сервера заключается в том, что пользователь вместо того, чтобы связываться по международной телефонной связи для передачи телефаксового сообщения, отправляет его по электронной почте на телефаксовый аппарат, который находится недалеко от места получения факса. Совершенно очевидно, что при этом стоить такое отправление будет гораздо дешевле, чем непосредственная доставка.
Долгое время, до появления компьютерных сетей, информация в электронном виде хранилась в локальных информационных системах. Как правило, это были либо каталоги библиотек, либо реферативные журналы. Для получения доступа к этим системам нужно было устанавливать у себя программное обеспечение для работы с этими базами данных, и, затем, периодически докупать магнитные ленты с документами для актуализации содержания информационных массивов. Наиболее известным ресурсом такого рода являлись реферативные базы данных ВИНИТИ, которые хранили копии реферативных научно-технических журналов. В мире наиболее известной системой такого сорта являлись системы STN, Dialog, Индекс Цитирования Гардфилда и др. С появлением сетевых технологий трудно отказаться от такого богатого наследства с одной стороны, но чрезвычайно трудно весь этот объем материалов преобразовать в формы принятые при сетевом обмене информацией. Выход был найден в механизме доступа к информационным системам в режиме удаленного терминала. Собственно программное обеспечение удаленного терминала разрабатывалось для других целей (ARPANET все-таки - это оборонный проект), но оказалось чрезвычайно удобным и для удаленного доступа к старым информационным системам. Через удаленный терминал в сети Internet доступны каталоги многих библиотек США, словари, газеты, журналы и другая информация. Наиболее полным собранием адресов, по которым можно войти в режиме удаленного терминала является база данных Hytelnet, версии которой реализованы для компьютеров всех типов и большинства наиболее распространенных операционных систем.
После электронной почты обратим свое внимание на безусловного лидера среди технологий опубликования в Сети электронных ‑ файловые архивы Internet, которые называют еще FTP-архивами по имени механизма обмена информацией -- File Transfer Protocol. FTP- архивы первоначально создавались для обмена и хранения стандартов сети ‑ документов RFC и программного обеспечения. Но со временем они превратились в огромные многопрофильные хранилища данных. Из всего обилия информации, которая содержится в FTP-архивах Internet наибольший интерес с точки зрения электронных изданий представляют специальные проекты направленные на создание электронных копий знаменитых книг. Наиболее известными из них являются проект "Гуттенберг" и проект "Руттенберг". Первый призван создать архив электронных копий книг на английском языке, а второй архив книг на скандинавских языках. В настоящее в время в архиве "Гуттенберг" насчитывается 351 полный текст. Вот некоторые из них: Charles Dickens: The Chimes; Bible: Holy Bible; Henry Longfellow: The Song of Hiawatha; Doyle The Adventures of Sherlock Holmes; Mark Twain: The Adventure of Tom Sawyer.Lewis Carrol: Alice`s Adventures in Wonderland. Любопытно то, что в США создается архив славянских книг, который называется "Нестор", но здесь работы только в самом начале. Создание электронных копий книг сопряжено с рядом проблем. В настоящее время самой серьезной из них является проблема авторского права. Дело в том, что выше упомянутые проекты ставят своей целью создать публичные, т.е. бесплатные и доступные всем пользователям сети архивы. Но это означает, что тексты книг должны попасть в категорию свободно распространяемой информации или как ее называют на Западе -- Public Domain. Проект "Гуттенберг" разрешил эту проблему соответственно законодательству США, где в настоящее время к этой категории относятся тексты опубликованные до 1917 года. В проекте "Руттенберг" в 1995 году возникли неожиданно проблемы, связанные с тем, что проектом заинтересовался шведский парламент, и в настоящее время проект может оказаться на грани закрытия, т.к. публиковать материалы разрешено только до первого января 1996 года. Руководство проекта подготовило обращение в парламент страны с просьбой рассмотреть возможность продолжения работ. А пока набирает добровольцев для интенсификации работ по вводу информации.
В отечественно секторе Internet пока дело до таких масштабных акций не дошло, хотя подвижки в эту сторону есть. Наиболее интересным из проектов такого сорта является проект LIBWEB, финансируемый Российским Фондом Фундаментальных Исследований. Целью этого проекта является создание распределенного электронного каталога ведущих научных библиотек страны, доступ к которому будет осуществляться по российской части Internet. Хотя главной технологией поддержки этого проекта является World Wide Web, но возможен также будет и доступ по FTP.
Кроме таких фундаментальных работ, связанных с созданием электронного наследия человечества, существуют мене притязательные базы данных публикаций отдельных организаций. К таким системам относятся библиотеки юридической литературы Библиотеки Конгресса США, библиотеки препринтов университетов и научных центров, каталоги издательств и университетских библиотек. Как правило, литература в этих хранилищах представлена в виде файлов формата PostScript, либо файлов формата TeX. PostScript -- это стандарт de facto для печати документов. Этот формат был разработан фирмой Adobe и реализован для печати на лазерных принтерах. В настоящее время широко применяется в настольных издательских системах. Для любого типа печатающего устройства можно приобрести необходимый картридж для печати файлов формата PostScript. В сети Internet широко распространена программа преобразования файлов формата PostScript в форматы печатающих устройств - ghost. Другим стандартом, который продвигает фирма Adobe, является Portable Document Format (PDF). Данный формат специально предназначен для обмена информацией на электронных носителях. Для просмотра документов в этом формате по сети Internet можно получить специально разработанную фирмой свободно распространяемую программу Acrobat, реализация которой существует для всех распространенных компьютерных архитектур, начиная от обычных персоналок до высоко производительных рабочих станций. Формат TeX широко распространен в научной среде. Многие научные журналы принимают публикации авторов в этом формате. Фалы TeX, или его модификации - LaTeX, представляют из себя обычные текстовые файлы со встроенными в них командами разметки документа. TeX был разработан в Американском Математическом Обществе для стандартизации публикаций по математике. Формат обладает очень мощными средствами описания математических формул и таблиц, он также допускает использование встроенной графики. Типичным примером FTP-архива такого сорта является архив препринтов Международного Европейского Ядерного Центра (CERN), который, видимо, является одним из первых архивов такого рода.
От FTP-архивов, которые являются обычными иерархическими хранилищами информации перейдем к более современной информационной технологии опубликования информации на Сети - распределенной информационно-справочной системе Internet - Gopher. До 1995 года Gopher являлся самой динамичной информационной технологией Сети. Темпы роста числа Gopher серверов, т.е. программ, управляющих базами данных Gopher, опережали темпы роста серверов всех остальных технологий Internet. Gopher был разработан как информационная система университетского городка. Здесь, видимо следует пояснить, что университетские городки США отличаются от наших комплексов высших учебных заведений тем, что учебные и жилые корпуса университета, как правило, составляют единый комплекс и находятся на некотором удалении от крупных городов. Такая система называется университетским кампусом (campus). Вот для информационного обеспечения такого кампуса и был придуман Gopher. Само слово "Gopher" переводится на русский язык как "суслик". Но в данном случае имеется в виду совсем другой подтекст. Дело в том, что Gopher-ом или "сусличным" штатом называют штат Миннесота. "Сусликами" называют и жителей этого штата. Информационная система Gopher была разработана в 1989 году в университете Миннестоы, и названа в честь своего штата не без определенной доли юмора. Главным стержнем системы является идея представления всей информации в виде иерархического дерева. Разработчики Gopher считали, что такая форма очень понятно пользователям, т.к. они каждый день имеют дело с иерархическими каталогами библиотек и иерархической структурой файловой системы. Кроме того дерево Gopher прекрасно совпадало с иерархией подразделений университета и его организационной структурой. В 1990-1992 годах Gopher получает широкое распространение в других университетах США и Европы. С 1992 года специалисты Internet и энтузиасты Gopher стали говорить о Gopher-пространстве (GopherSpace), которое было образовано в Internet серверами Gopher. В 1993 году появляется универсальная поисковая машина Gopher - Veronica. Она дает возможность сканировать Gopher-пространство как простую текстовую базу данных, используя запросы построенные на использовании ключевых слов. К этому времени на Gopher стали обращать свое внимание и коммерческие организации. В частности такое издательство как O`Reilly организовало свой Gopher-сервер для опубликования на сети каталога издательства, журнала издательства и ряда других материалов. Прелесть Gopher заключалась в том, что текстовые файлы, которые хранились в FTP-архивах включались в качестве элементов Gopher-каталога без каких-либо их изменений. Кроме текстов Gopher позволяет обеспечить доступ и к графической информации и к звуковым записям и даже поисковым запросам, которые также являются элементом дерева Gopher-базы данных, однако, для просмотра этих документов необходимо наличие специальных программ просмотра, которые не являются составной часть Gopher-клиентов.. Ко времени появления Gopher в сети, развивая концепцию полнотекстовых архивов стали появляться новые проекты хранения литературных произведений. Одним из них является проект всемирной детской библиотеки. В настоящее время на одном из серверов Gopher хранятся книги 16 детских авторов, среди которых: Эдгар ПО, Льюс Кэрол, Фрэнк Баум, Роберт Стивенсон, Марк Твен, Даниель Дефо. Однако, появление Gopher не прибавило изобразительности электронным книгам. Это по-прежнему были обычные текстовые файлы. В рамках Gopher не было разработано никаких специальных механизма описания информации или управления ее отображением. Для представления текстовых страниц со встроенных в них графикой необходимо было делать графические копии этих материалов. Такие копии занимают слишком много места, поэтому перечисленные выше архивы и содержат только текстовую информацию. Правда издатели стали задумываться о едином формате хранения информации, который позволял бы использовать одну и туже копию документа как для обычного издания, так и для электронной публикации. К этому времени уже был разработан специальный стандартный язык разметки документов - Standard Generalised Markup Language (SGML), который в последнее время получает все большую популярность в качестве стандарта хранения и представления информации. Этот язык используется такими пионерами электронного опубликования, как O`Reilly Inc. и Chicago Business School Publishing. Правда это происходит в контексте развития другой информационной технологии Internet - World Wide Web или, в переводе на русский язык, "Всемирной паутины".