Основные этапы развития Интернета. Особенности веб-среды
В 1957 году Советский союз запустил в космос первый искусственный спутник Земли. Соединенные Штаты Америки посчитали, что это изобретение может составлять угрозу для безопасности страны и стать поводом для начала военных действий с Россией. Что бы иметь преимущество в случае нападении СССР, перед Агентством передовых оборонных исследовательских проектов США ( DARPA ) ставиться задача: в короткие сроки разработать компьютерную сеть для надежной и бы строй передачи данных между военными. Через несколько лет, а именно 29 октября 1969 года в 21 час между двумя исследовательскими университетами, находящимися на расстоянии 640 километров друг от друга, проходит первый сеанс компьютерной связи. Именно этот день принято считать рождением Интернета в США.
В 1969 году, 29 октября в 9 вечера, между первыми узлами данной сети, находящимися друг от друга на расстоянии в 640 километров - в Калифорнийском университете Лос-Анджелеса и в Стэндфордском исследовательском институте - провели первый сеанс связи. Оператор Чарли Клайн пытался выполнить удалённое подключение к компьютеру, находящемуся в Стэнфорде. Успешную передачу каждого введённого символа его коллега Билл Дювалль подтверждал по телефону. Вначале удалось отправить всего три символа « LOG «, после чего сеть перестала работать. Символы « LOG « должны были быть словом LOGON (команда входа в систему). В рабочее состояние систему вернули уже к половине одиннадцатого вечера и следующая попытка оказалась успешной. Эту дату и принято считать днём появления сети Интернет.
После первой успешной передачи данных в сети ARPANET следующим значимым этапом стала разработка в 1971 году первой программы для отправки электронной почты по сети. Данная программа мгновенно обрела популярность. К 1973 году в состав сети были включены первые зарубежные организации из Великобритании и Норвегии через трансатлантический телефонный кабель. С этого момента сеть стала считаться международной. В 70-х годах прошлого века основным предназначением сети была пересылка электронной почты. В то же время появляются первые почтовые рассылки, различные доски объявлений и новостные группы. Однако во взаимодействии с другими сетями, построенными на других стандартах, были большие проблемы. Бурное развитие различных протоколов передачи данных, а так же их последующая стандартизация в 82-83 годах и переход на «общий», объединяющий протокол TCP / IP решили данную проблему. Этот переход состоялся 1 января 1983 года. Именно в этом году сеть ARPANET закрепила за собой термин «Интернет».Следующим этапом развития была разработка системы доменных имён (англ. Domain Name System , DNS ), которая состоялась в 1984 году.
Так же в этом году появляется серьёзный конкурент сети ARPANET - межуниверситетская сеть NSFNet (англ. National Science Foundation Network ). Эта сеть была объединением множества мелких сетей, имела пропускную способность гораздо большую, чем у ARPANET , а так же высокую динамику подключения новых пользователей (около 10 тысяч машин в год). Гордое звание «Интернет» перешло к NSFNet .
В 1988 году был анонсирован протокол мгновенной передачи текстовых сообщений Internet Relay Chat ( IRC ), вследствие этого в Интернете стало возможным «живое» общение в чате в реальном времени.
В 1989 году знаменитый британский учёный Тим Бернерс-Ли предлагает концепцию Всемирной паутины. Он так же за два последующих года разрабатывает протокол HTTP , язык гипертекстовой разметки HTML и идентификаторы URI .В 1990 году сеть ARPANET , проиграв в конкурентной борьбе NSFNet , прекращает своё существование. Так же в этом году состоялось первое подключение к сети Интернет по телефонной линии ( Dialup access - «дозвон»).
год ознаменовался общедоступностью Всемирной паутины в Интернете.
год - появление знаменитого веб-брауз ера NCSA Mosaic . Быстрый рост популярности Интернета.
В 1995 году роль маршрутизации всего сетевого трафика Интернета возложили на себя сетевые провайдеры, а суперкомпьютеры NSFNet вернулись к роли исследовательской сеть. В этом же году был образован Консорциум всемирной паутины (W 3 C), призванный упорядочить веб-стандарты.
С 1996 году Всемирная паутина ( WWW ) почти полностью подменяет собой понятие интернет, и обгоняет по трафику протокол пересылки файлов FTP 1990-е годы произошло массовое объединение большинства существовавших сетей под флагом Интернет (хотя такие сети как Фидонет так и остались обособленными). Открытость технических стандартов во много способствовало быстрому росту сети. К 1997 году в Интернете насчитывалось около 10 млн. компьютеров и более 1 млн. доменных имён. Интернет - популярнейшее средство для обмена информацией.
Сейчас получить доступ в интернет можно через телефон, радио-каналы, сотовую связь, спутники связи, кабельное телевидение, специальные оптико-волоконные линии и даже электропровода. А с 22 января 2010 года прямой доступ в Интернет появился и на Международной космической станции. [ 7 ]
Возможность иметь практически мгновенный доступ ко всем источникам информации одновременно и при этом делать индивидуальный выбор - это уже чудо! Стоит войти в какую-нибудь информационно-поисковую систему - и вы получаете доступ ко всем, как кажется, областям знания.
Миллионы людей каждый день используют Интернет для различных целей. Наиболее распространенное применение - электронная почта (согласно опросу, проведенному в начале года Стенфордским институтом количественных исследований общества, почтой пользуются 90% опрошенных), которая приобрела особо важное значение и для граждан бывших союзных республик, устанавливающих связи с жителями зарубежья. К тому же, во времена кризиса Интернет оказался постоянным источником новостей и информации, в основном потому, что его нельзя полностью отключить.
К тому же Интернет предоставляет не только огромное количество всевозможной информации, но и возможность общения в реальном времени, используя специальные программы. Плюсы подобной электронной коммуникации - уничтожение расстояний, возможность отсроченного ответа, создание сообществ по интересам, а также, при желании, полная анонимность и создание легенды, т.е. возможность «существовать» в другой физической и моральной оболочке (хотя о пользе последнего плюса сейчас идет широкая дискуссия в обществе).
Во всех видах аудитории российского Интернета преобладают молодые образованные мужчины из семей с доходами выше среднего. По своему социальному положению это специалисты с высшим образованием (35 %), студенты, учащиеся (27 %) и предприниматели (10 %).
Примерно треть пользователей Интернета составляют люди до 24 лет, еще треть - от 25 до 34 лет. Средний возраст максимальной аудитории Интернета - 31 год. С ростом активности средний возраст уменьшается до 29 лет. Людей от 60 и старше в активных видах аудитории практически нет, а в максимальной менее 3 %.
Молодое поколение России воспринимает технологии Интернета как пока доступный не всем, но естественный элемент быта. Люди же старших возрастов не относятся к нему как к жизненной необходимости.
Так сложилось, что традиционной аудиторией Интернет-изданий была образованная прослойка общества, имеющая достаточно времени, средств и знаний для подобного времяпрепровождения. Интернет-СМИ охватывают лишь средний класс (если посмотреть на традиционную схему общества, которая представлена в форме треугольника, расширяющегося к низу), незначительно затрагивая высший класс общества. Основной потребитель Интернет-информации - человек со средним достатком, имеющий стабильную работу. Зачастую, это люди в возрасте от 16 до 45 лет. Образование высшее или средне-специальное. Люди с активной гражданской позицией и собственным мнением по основным вопросам жизни, политики и социума.[5]
Принципы работы журналиста в интернете
Действительно, чего проще - собирать информацию в интернете, монтировать ее и отправлять обратно в сеть, снабжая при необходимости краткими комментариями. Кажущаяся простота подобной журналистской работы вызвала стремительный рост веб-обозрений в 1996-1998 гг. Существует список «Все обозреватели», датированный 1997 г., насчитывающий не один десяток фамилий и названий, из которых к настоящему моменту уцелело меньше десятка.
Это явление само по себе интересно первоначальными стереотипами восприятия аудиторией массовой информации, распространяемой через интернет, как компиляционной, не имеющей собственного контента. Здесь мы видим действие одного из мифов интернета - рождение нового содержания в результате простого складывания информационных фреймов: идея + идея = три идеи. Этот механизм действительно может реализовываться при творческой, а не механической компиляции. Вторым фактором, обусловившим развитие веб-обзоров, является особенность открывшегося интернет-сектора информационного рынка, состоявшая в разной квалификации пользователей, склонных видеть в интернете всего лишь расширение обычных СМИ и не умеющих или ленящихся самостоятельно искать и анализировать необходимую им информацию.
Веб-обзоры выявили проблемы, характерные для неудачных авторских проектов: низкое литературное качество текста, неинтересное содержание и слабая авторская позиция.
Сеть демонстрировала неформальный, местами развязный и насыщенный жаргонизмами стиль письма, заимствованный из интерактивных сред (форумов, чатов, групп новостей). Этот стиль ориентировал, прежде всего, на общение. С содержательным насыщением интернета обострилась необходимость привлекать посетителей не только возможностью общения вообще , но и общения на конкретную актуальную для них тему. Появилась необходимость обеспечения новизны информации. Веб-обозреватели, которые только перепечатывали тексты, стали не интересны, так как посетитель, однажды добравшись до первоисточника, уже большее задерживался на клонах.
Авторская позиция должна быть яркой, ясной и обоснованной, при этом читательская позиция может не совпадать с авторской. Важно познакомиться с аргументацией оппонента. Посетителей сайта интересует авторское «я», проступающее сквозь качественную информацию (новизна, читабельность, позиция). Это правило не составляет исключений даже для VIP-персон и шоуменов. Сеть слишком насыщена информацией, чтобы заглядывать на страницы, исключительно из уважения к ее хозяину. Так что автору остается быть интересным не собой, а тем, что он может предложить посетителям своего сайта. Одной из детских болезней интернета являются проекты, целиком и полностью посвященные саморекламе (или самопрезентации). Это и авторские сайты, и сайты организаций. Домашние страницы таких сайтов, как правило, состоят из большой фотографии хозяина и текста с перечислением его должностей, званий и достоинств. Традиционный журнал с вашей фотографией и статьей о вашей персоне - весьма эффективный PR-ход. Аналогичное в интернет е - не только не полезная, но и вредная затея. Сеть слабо интересуется бытовыми подробностями личной жизни автора. Его кошки и собаки, какими бы милыми они не представлялись хозяину, воспринимаются как информационный шум, а заметки о чужих проблемах вызывают в лучшем случае недоумение. Показывать и презентовать себя можно только в текстах, значимых для аудитории. [ 8]
Технологии поиска в интернете
С каждым годом объемы Интернета увеличиваются в разы, поэтому вероятность найти необходимую информацию резко возрастает. Интернет объединяет миллионы компьютеров, множество разных сетей, число пользователей увеличивается на 15-80% ежегодно. И, тем не менее, все чаще при обращении к Интернет основной проблемой оказывается не отсутствие искомой информации, а возможность ее найти. Как правило, обычный человек в силу разных обстоятельств не может или не хочет тратить на поиск нужного ему ответа больше 15-20 минут. Поэтому особенно актуально правильно и грамотно научиться, казалось бы, простой вещи - где и как искать, чтобы получать ЖЕЛАЕМЫЕ ответ. Чтобы найти нужную информацию, необходимо найти её адрес. Для этого существуют специализированные поисковые сервера (роботы индексов (поисковые системы), тематические Интернет-каталоги, системы мета-поиска, службы поиска людей и т.д.). В данном мастер-классе раскрываются основные технологии поиска информации в Интернет, предоставляются общие черты поисковых инструментов, рассматриваются структуры поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем.технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи! При таком обилии информации остро встает вопрос: «Как сориентироваться в столь огромном и масштабном информационном пространстве?» В решении данной проблемы на помощь приходят поисковые инструменты.Поисковые инструменты - это особое программное обеспечение, основная цель которого - обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:
Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.
Поиск информации по запросу пользователя.
Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.
Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:
Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.
Индекс поисковой системы - это информационная база, содержащая результат анализа веб-страниц, составленная по определенным правилам.
Запрос - это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", , ~), математические символы (*, +, ?).
Схема поиска информации проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных web-страниц)Таким образом, если указать в строке поиска для каждого поискового инструмента одинаковой конструкции запрос, можно получить различные результаты поиска. Для пользователя имеет большое значение, какие документы окажутся в первых двух-трех десятках документов по результатам поиска и на сколько эти документы соответствуют ожиданиям пользователя. Большинство поисковых инструментов предлагают два способа поиска - simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее. Рассмотрим оба вида поиска на примере англоязычной поисковой машины. Например, AltaVista удобно использовать для произвольных запросов, «Something about online degrees in information technology», тогда как поисковый инструмент Yahoo позволяет получать мировые новости, информацию о курсе валют или прогнозе погоды.
Освоение критериев уточнения запроса и приемов расширенного поиска, позволяет увеличивать эффективность поиска и достаточно быстро найти необходимую информацию. Прежде всего, увеличить эффективность поиска Вы можете за счет использования в запросах логических операторов (операций) Or, And, Near, Not, математически х и специальных символов. С помощью операторов и или символов пользователь связывает ключевые слова в нужной последовательности, чтобы получить наиболее адекватный запросу результат поиска. [ 9 ]
Интернет-ресурсов в Глобальной сети становится все больше, а найти там необходимую информацию с каждым днем все труднее. Поэтому у всех участников рынка современных поисковых систем уже сложилось впечатление, что сегодняшние технологии поиска устарели и что необходимо менять саму концепцию поиска. В настоящий момент бесспорным лидером поиска все еще является Google - 47% всех пользователей Интернета выбирают именно этот сервис, далее идут Yahoo ! и MSN - 21 и 13% обращений соответственно, то есть в целом более 80% жителей планеты предпочитают именно эти поисковики. Одна ко ни один из трех главных поисковых серверов не может похвастаться высокой степенью лояльности среди своих постоянных пользователей: почти 71% из тех, кто искал в Yahoo !, также посещают иногда и один из двух других сервисов - Google или MSN Search , 70% из тех, кто искал в MSN , также пытали удачу в том или ином конкурентном поисковом механизме. Видя такую неудовлетворенность результатами поиска, создатели поисковых машин стараются совершенствовать свои поисковые механизмы и пытаются применять новые технологии поиска. Так, на портале Google был запущен так называемый самоконструктор (self - constructor ), где пользователи этой поисковой системы могут настроить процесс поиска по своему усмотрению. К примеру, если пользователя интересует погода, он с может видеть информер погодных условий именно в своем городе. А способ отображения новостей, вывод биржевых сводок и многие другие полезные вещи можно настроить в соответствии со своими интересами. Естественно, все подобные настройки пользователь сможет использовать, только пока он авторизован на сайте поисковика. С появлением этой технологии сайт Google во многом опередил своих конкурентов - старейшие порталы Интернета Yahoo ! и MSN .
Однако и портал Yahoo ! не остался в долгу и внедрил новую технологию поиск а Yahoo ! Mindset . При помощи этого средства те, кто хочет найти какой-либо товар, отделяются от пользователей, ищущих в Интернете информацию. И те и другие, естественно, довольны: высоколобые технари освобождаются от навязчивой торговой рекламы, а простые о быватели - от не нужных им технических сведений.
Сервис Yahoo ! Mindset ( http :// mindset . research . yahoo . com ), пока пребывающий в стадии бета-тестирования, пытается разделить первую сотню результатов поисковой выдачи на «коммерческие» и «академические» сайты. На странице выдачи разработчики поместили специальный слайдер, позволяющий пользователю самостоятельно задать отношение «коммерческий/академический». Подробнее ознакомиться с функциями Yahoo ! Mindset можно на страничке вопросов и ответов сервиса ( http :// min dset . research . yahoo . com / faq . php )., в свою очередь, тоже внедряет новые возможности фильтрации в готовящуюся к выходу новую технологию поиска, намереваясь радикально очистить поисковые результаты от Web -спама. Разработчики компании Microsoft в Маунтин-Вью, находящемся в Силиконовой долине, уже используют методы статистического анализа для обнаружения Web -сайтов, поставляющих такой спам.
Компания IBM предложила совершенно новую технологию поиска, которая основана на отказе от традиционного поиска по ключевым словам и внедрении технологии поиска по понятиям и фактам, применяющейся при обработке информации. Таким образом, IBM задумала предоставить своим клиентам такой поиск, при помощи которого ищущий мог бы задавать тему в общем, а поисковая машина при этом обрабатывала бы его наиболее релевантно.
По словам Артура Чикколо (Arthur Ciccolo), главы отделения поисковых технологий IBM Research, ведущие массовые поисковые машины (Google, Yahoo! и Microsoft) ориентированы на открытый сегмент Интернета, а не на поиск служебной информации. В отличие от них, IBM намерена предоставить сторонним разработчикам программного обеспечения оригинальную архитектуру управления неструктурированной информацией UIMA (Unstructured Information Management Architecture). Эта технология позволяет анализировать содержащийся в документах текст и распознавать скрытые в нем понятия, отношения и факты. Также IBM предлагает инструмент WebSphere OmniFind, позволяющий пользователям осуществлять поиск в неструктурированных данных различных форматов и на различных языках, содержащихся в базах данных, в файлах электронной почты, в аудиозаписях, изображениях и видеофрагментах. К тому же UIMA позволит интегрировать ПО для поиска, управления экспертными системами и анализа текста от разных производителей.
Представители компании IBM утверждают, что UIMA упростит совместную работу тех приложений от различных разработчиков, которые предназначены для управления знаниями, поиска, коммерческой разведки и анализа текстов. Данный механизм поиска корпоративных данных разрабатывался IBM Research на протяжении более четырех лет при участии ученых крупнейших университетов США и при поддержке Управления перспективных исследований Минобороны США (DARPA). В числе участников разработки UIMA - военные подрядчики Science Applications International, BBN Technologies и MITRE, а также медицинская фирма The Mayo Clinic.
Сегодня 15 компаний уже планируют использовать данную технологию, в частности Attensity, ClearForest, Cognos, Endeca, Factiva, Kana, Inquira, iPhrase, Inx ight, nStein, QL2, SAS, Schemalogic, Semagix, SPSS и Temis. Один из примеров применения новой технологии - совместное использование программных продуктов Attensity, ClearForest, iPhrase, Kana и IBM производителями потребительских товаров для обнаружения в сети жалоб покупателей на дефектные изделия и для поиска внутренней корпоративной информации, помогающей максимально быстро решить возникшие проблемы. Около десяти лет назад ряд разработчиков СУБД, включая Informix, которая затем была приобретена IBM, заяви ли о том, что в скором времени проблема неструктурированных данных будет решена. Тем не менее и сейчас, по оценке аналитиков, до 85% корпоративных данных хранится в неструктурированном виде вне баз данных.Ожидается, что технология UIMA начиная с конца теку щего года будет распространяться с помощью сайта SourceForge, на котором размещается ПО с открытым исходным кодом. Структуру UIMA уже можно бесплатно загрузить с сайта IBM AlphaWorks.В случае успеха проекта компания IBM готова после годичного использования перепродать данную технологию Google и Yahoo!. [ 10 статья ]