Идендификация запросов в интернете

Internet Protocol (IP) — межсетевой протокол. Относится к маршрутизируемым протоколам сетевого уровня семейства TCP/IP. Именно IP стал тем протоколом, который объединил отдельные подсети во всемирную сеть Интернет. Неотъемлемой частью протокола является адресация сети (см. IP-адрес) IP объединяет сегменты сети в единую сеть, обеспечивая доставку данных между любыми узлами сети. Он классифицируется как протокол третьего уровня по сетевой модели OSI. IP не гарантирует надёжной доставки пакета до адресата. В частности, пакеты могут прийти не в том порядке, в котором были отправлены, продублироваться (приходят две копии одного пакета), оказаться повреждёнными (обычно повреждённые пакеты уничтожаются) или не прибыть вовсе. Гарантию безошибочной доставки пакетов дают некоторые протоколы более высокого уровня — транспортного уровня сетевой модели OSI, — например, TCP, которые используют IP в качестве транспорта

. Основные понятия

Роботы (сокращённо «боты») — скрипты, выполняющие разного рода рутинные задачи, не требующие прямого контроля со стороны человека.

Помощники редактирования — специальные инструменты и скрипты, помогающие в редактировании, но требующие от пользователя принятия окончательного решения. Любые программы или инструменты, не позволяющие пользователю просматривать каждую правку и не дающие пользователю права самостоятельно отменить либо подтвердить любое изменение, считаются ботами.

Скрипты (обычно, но не обязательно, основанные на JavaScript) позволяют автоматизировать процессы, могут улучшать или расширять возможности MediaWiki.

[править]

Применение ботов

Так как боты:

потенциально способны править гораздо быстрее, чем люди;

подвергаются меньшему контролю, чем правки людей;

способны повлечь более серьёзные последствия при неисправности или неверном использовании;

к ним предъявляются высокие требования перед разрешением выполнения назначенных заданий. Использование неодобренных ботов или выполнение одобренными ботами неодобренных заданий запрещается, и в некоторых случаях может привести к блокировке учётной записи бота и санкциям в отношении ботовладельца.

Нужно заметить, что быстрые или полуавтоматические процессы также могут порой рассматриваться как боты. Если сомневаетесь — узнайте мнение сообщества.

[править]

Учётные записи ботов

Оператор должен создать отдельную учётную запись для работы бота. Имя учётной записи должно указывать на оператора либо выполняемые ботом функции. Кроме того, должно сразу становиться понятно, что правки выполняются автоматически; это, как правило, достигается путём включения слова «Bot» в начало или конец имени учётной записи. Инструменты, не причисляемые к ботам (например, AWB), не требуют отдельного аккаунта, хотя некоторые участники и создают для этого отдельные учётные записи.

За деятельность бота несёт ответственность его оператор, чьё имя должно быть явно указано на личной странице бота. В частности, ботовладелец несёт ответственность за возмещение любого ущерба, причинённого некорректно действующим ботом. Бот подчиняется всем правилам так же, как и остальные участники.

Учётная запись бота не должна использоваться для правок, не входящих в список назначенных боту заданий. В частности, не рекомендуется использовать аккаунт бота для ответа на сообщения, связанные с ботом, так как сообщения бота могут остаться не замеченными другими участниками. Ботовладельцы могут перенаправить страницу обсуждения бота на свою собственную.

CAPTCHA ([ˈkæptʃə]; от англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различия компьютеров и людей) — товарный знак Университета Карнеги — Меллона, в котором разработали компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. В Рунете часто транскрибируется как капча. Термин появился в 2000 году. Основная идея теста: предложить пользователю такую задачу, которую с лёгкостью может решить человек, но которую несоизмеримо сложнее решить компьютеру. По состоянию на 2011 г. примерно 200 миллионов CAPTCHA вводилось каждый день людьми в мире[1].

11. Блог (англ. blog, от web log — интернет-журнал событий, интернет-дневник, онлайн-дневник) —веб-сайт, основное содержимое которого — регулярно добавляемые записи (посты), содержащие текст, изображения или мультимедиа. Для блогов характерны недлинные записи вре́менной значимости, отсортированные в обратном хронологическом порядке (последняя запись сверху). Отличия блога от традиционного дневника обусловливаются средой: блоги обычно публичны и предполагают сторонних читателей, которые могут вступить в публичную полемику с автором (в комментарии к блогозаписи или своих блогах).

Людей, ведущих блог, называют бло́герами[1]. Совокупность всех блогов Сети принято называть блогосферой.

Для блогов характерна возможность публикации отзывов (комментариев, «комментов») посетителями. Она делает блоги средой сетевого общения, имеющей ряд преимуществ перед электронной почтой, группами новостей, веб-форумами и чатами.

Блог-платформа (блогохостинг, блог-служба) — это «коммунальный» сервис, предоставляющий пользователю «под ключ» движок и позволяющий вести блог, дневник без необходимости самостоятельно заниматься обслуживанием движка и программированием. Пользователю достаточно получить навыки работы с веб-сервисами, что гораздо легче. Обратная сторона такого удобства — невозможность полноценной настройки блога, за исключением шаблонов, определяющих его дизайн. Кроме того контент пользователя с правовой точки зрения находится под контролем владельца блог-платформы и принадлежит пользователю лишь номинально.[источник не указан 969 дней] Как следствие, последний ограничен в свободе самовыражения, что обычно прямо прописано в правилах предоставления сервиса (англ. TOS, Terms Of Service) и зачастую контролируется «конфликтной командой» (англ. AT, Abuse Team) владельца блог-платформы.

В течение последних двух лет сильно возросла популярность фотоблогов.[1] Современные молодые фотографы сейчас предпочитают не создавать собственных сайтов, а публиковать новые работы в блогах, так как блоги считаются серьёзной альтернативой СМИ. В зависимости от уровня предоставляемого сервиса блог-платформы можно условно разделить на три группы:

профессиональные: пользователю предоставляется индивидуальный движок блога, собранный (включая необходимые плагины) и настроенный согласно запросам пользователя. Доступа к коду движка пользователь, как правило, не имеет. Кроме того, предоставляется хостинг для файлов и ограниченная возможность запуска своих скриптов (или их подключения из готового перечня).

полупрофессиональные: пользователю предоставляется возможность аренды движка (нередко возможен выбор одного из нескольких движков). Возможностей индивидуальной настройки нет. Для хранения файлов предоставляется хостинг.

массовые: пользователю предоставляется учётная запись и аренда ресурсов сервера. Прямого доступа к данным у пользователя нет, только с использованием штатных средств движка.

Профессиональные и полупрофессиональные блог-платформы обычно платные, поскольку используют модель предоставления хостинга, адаптированного для ведения блога, плюс аренда приложения и обслуживание. Массовые блог-платформы редко бывают платными, поскольку предоставляют, по сути, не хостинг, а массовый веб-сервис. Из-за этого в профессиональных блог-платформах социальных связей между пользователями меньше, но они более таргетированные (целевые). На массовых же блог-платформах социальная связность выходит на первый план, подчиняя профессиональную.

12. Web 2.0 (определение Тима О’Рейли) — методика проектирования систем, которые путём учета сетевых взаимодействий становятся тем лучше, чем больше людей ими пользуются. Особенностью веб 2.0. является принцип привлечения пользователей к наполнению и многократной выверке информационного материала. Определение Тима О’Рейли нуждается в уточнении. Говоря «становятся лучше», имеют в виду скорее «становятся полнее», то есть речь, как правило, идёт о наполнении информацией, однако вопросы её надёжности, достоверности, объективности не рассматриваются.

По сути, термин "Web 2.0" обозначает проекты и сервисы, активно развиваемые и улучшаемые самими пользователями: блоги, wiki, социальные сети и т.д.

Появление названия Веб 2.0 принято связывать со статьей «Tim O’Reilly — What Is Web 2.0»[1] от 30 сентября 2005 года, впервые опубликованной на русском языке в журнале «Компьютерра» (№ 37 (609) и 38 (610) от 14 и 19 октября 2005 года соответственно) и затем выложенной под заголовком «Что за…»[2] веб-сайтом «Компьютерра online». В этой статье Тим О’Рейли увязал появление большого числа сайтов, объединённых некоторыми общими принципами, с общей тенденцией развития интернет-сообщества, и назвал это явление Веб 2.0, в противовес «старому» Веб 1.0. Несмотря на то, что значение этого термина до сих пор является предметом многочисленных споров, те исследователи, которые признают существование Веб 2.0, выделяют несколько основных аспектов этого явления. Первым, кто употребил словосочетание Web 2.0, стало издательство O’Reilly Media, специализирующееся на информационных технологиях. Произошло это в 2004 году. Немного позже глава издательства Тимоти О’Рейлли сформулировал часть принципов Web 2.0. За прошедшее время сфера Web 2.0 расширилась, вытесняя традиционные Web-сервисы, получившие название Web 1.0.

Web 2.0 не является технологией или каким-то особым стилем Web-дизайна. Для определения сути подходит определение Web 2.0 как комплексного подхода к организации, реализации и поддержке Web-ресурсов. Предлагаю рассмотреть наиболее известные «проявления» Web 2.0, с которыми, так или иначе, встречался каждый пользователь Интернета.

13. Создание любого сайта начинается с разработки его структуры, которая должна быть грамотной и логично продуманной. В противном случае Ваш веб-ресурс может превратиться в обычную свалку контента, где сложно будет найти необходимую информацию.

Стоит заранее определиться с тем, сколько на сайте будет разделов, подразделов и статей в каждом из них. Также в будущем уже созданной структуры сайта стоит всегда придерживаться, чтобы не возникло путаницы в размещении на веб-ресурсе информации.

Всего существует 6 основных структур: линейная, линейная с альтернативными вариантами, линейная структура с ответвлениями, решётчатая, древовидная и смешанная. Предлагаю подробней рассмотреть каждую из них.

1. Линейная структура.

Самая обычная структура сайта – линейная, в которой документы просто идут друг за другом (линейно), и посетитель просматривает их последовательно. В этом виде структуры контент не делится на категории и подкатегории, а поэтому все веб-страницы имеют одинаковый вес.

Казалось бы, что линейная структура очень проста и удобна для пользователя, однако это не так. Создать такую структуру конечно проще некуда: достаточно связать html-документы в нужной последовательности, на каждом из которых поставить ссылки «назад» и «далее» или сделать нумерованный список «1», «2», «3» и т.д.

Но здесь кроется главный недостаток: посетитель, попавший на любую веб-страницу сайта, вряд ли сможет найти интересующую его информацию, так как ему придётся сделать немалое количество переходов с одного документа на другой.

Линейная структура лишь оправдывает себя при создании электронных книг (e-book) или сайтов-презентаций.

2. Линейная структура с альтернативными вариантами.

Этот вид структуры очень похож на линейную, с тем лишь отличием, что пользователи имеют больше вариантов для поиска информации, а точнее выбор между 2-мя ветками.

В основном такая структура применяется при регистрации посетителя на сайте какой-то компании, предлагающей товары или услуги. Человек сначала попадает на главную страницу, после чего ему предоставляют возможность заполнить информацию о себе или перейти к изучению содержимого на сайте.

3. Линейная структура с ответвлениями.

Данная структура аналогична дороге с множественными ответвлениями от неё. Человек переходит с одной страницы на другую в строгой последовательности как при линейной структуре. Однако посетитель в случае необходимости может всегда перейти на другое ответвление, а затем возвратиться назад.

Основным достоинством линейной структуры с ответвлениями – это возможность перейти на неё с обычной линейной структуры. В этом часто возникает необходимость, когда на сайте сильно разрастается контент и посетителям становится сложнее искать определенные статьи.

4. Решётчатая структура.

Одна из самых сложных структур сайта, где все документы располагаются в разных ветках. Однако посетитель может легко перемещаться по этим веткам как горизонтально (слева направо или между ветками на различных уровнях), так и вертикально (сверху вниз).

Данный вид структуры характерен преимущественно для каталогов статей или ссылок. На первый взгляд она очень удобна для пользователей, но для обычных сайтов её лучше не использоваться.

Дело в том, что решётчатую структуру сложно создать, так как придётся долго копаться в коде или настраивать под неё CMS. Другой недостаток заключается в том, что при организации решётчатой структуры можно легко запутаться не только пользователю во время поиска информации, но и самому веб-мастеру при размещении контента.

5. Древовидная структура.

Самой оптимальной и часто используемой структурой многими веб-мастерами в настоящий момент является древовидная. На обычном html её практически невозможно организовать (да и не нужно), поэтому для её создания пишется движок или используется CMS.

Главным ещё достоинством стоит отметить то, что она прекрасно может подойти для любого вида сайта, будь то домашняя веб-страничка, сайт-визитка, корпоративный сайт, портал или каталог.

Смысл древовидной структуры заключается в том, что у человека на главной странице сайта есть выбор куда перейти: разделы, подразделы и конкретные документы. При переходе на любой уровень, пользователь может перейти в конец раздела, его начало, другой раздел или его подраздел, а также на главную страницу.

Всё это обеспечивает большую гибкость данной структуре. Однако при разрастании контента, практически невозможно будет соблюдать правильное соотношение между шириной и глубиной. В результате этого, посетителям, чтобы найти интересующую информацию, придётся сделать много лишних переходов по веб-страницам.

Более того, при разрастании контента поисковикам будет всё сложнее индексировать содержание сайта. Тем не менее, древовидная структура - лучшее, что может подойти для любого сайта.

6. Смешанная структура.

Эта структура характеризуется, присутствуем двух или более элементов выше перечисленных структур в одной, однако из-за сложности её реализации, она редко используется.

Наши рекомендации