Анализ инструментов Web-статистики
Основными методами сбора информации о поведении посетителей на сайте являются счетчики и использование статистики, получаемой при анализе лог файлов сервера.
1. Параметр | 2. Счетчики | 3. Анализаторы логов |
Стоимость установки и эксплуатации | Бесплатно или месячная оплата ($5-50/мес. и выше) | Разовая оплата или бесплатно. Встречается схема аренды ПО (ежегодная оплата) |
Трудоемкость установки и эксплуатации | Небольшая: требуется установка «кода» (фрагмента HTML) на всех страницах сайта (в шаблоне). | Требуется установка программы на сервере, где расположен сайт, либо регулярное копирование log-файлов на обрабатывающую машину. Для подсчета посетителей может потребоваться дополнительная настройка WWW-сервера. |
Доступность результатов анализа. | Real-time для данных за сегодня, с задержкой для длинных периодов. Подробные данные хранятся не слишком долго. | Обсчет требует времени, для сайтов с посещаемостью в тысячи посетителей в день и менее это время невелико. |
Доступность исходных данных (log-ф | Данные накапливаются у владельца сервиса, переход на другой сервис невозможен. Как правило, исходные данные долго не хранятся | Данные остаются у владельца сайта. |
Потери данных | Рядовое явление – при перегрузке сервиса счетчика часть посещений не считается. | Журнальные файлы могут быть утеряны из-за аварии или некомпетентности системного администратора. |
Счетчики и Лог-анализаторы: возможности, достоинства и недостатки.
Возможности:
Счетчик — это особая программа-сценарий (скрипт), которая при загрузке страницы сайта обращается к специализированному серверу статистики. В ответ на запрос на страницах сайта отображается логотип сервера статистики (в виде html-кода).
Вместе с html-кодом изображения счетчика на компьютер пользователя загружается клиентская программа-сценарий, которая собирает необходимые данные и передает их на сервер статистики. Для отслеживания повторных посещений сайта на жесткий диск компьютера пользователя записываются специальные файлы cookie (временные и постоянные). Временные сохраняются лишь во время работы браузера, постоянные хранятся на компьютере пользователя заранее заданное время или до тех пор, пока пользователь не удалит их самостоятельно или не переустановит операционную систему
Достоинства:
- Большой выбор программ в различных ценовых категориях:
- бесплатные базовые версии (ограниченный перечень наиболее важных и популярных отчетов);
- Простая и быстрая установка
- Высокая скорость получения данных (режим, близкий к реальному времени)
- Отсутствие дополнительной нагрузки на сервер
- Возможность сравнения аудитории сайтов (если статистика закрыта для свободного просмотра, обязательно знание паролей к данным сравниваемых сайтов)
- Возможность сделать срез аудитории (установить фильтр) по различным параметрам
- Актуальные и подробные данные относительно географии посетителей (страны, регионы)
- Возможность получения «глобальной статистики» (обобщенных данных по группам сайтов)
- Определение повторных визитов, а также частых и постоянных посетителей
- Возможность определения технических параметров и настроек компьютера пользователя
Недостатки:
- Возможные ограничения по срокам хранения данных из-за того, что данные хранятся на стороннем сервере (зависит от сервиса статистики, выбранного тарифа, типа отчетов)
- Потеря каждым последующим установленным счетчиком 5–10% информации о посетителях сайта
- Более низкая достоверность данных по сравнению с анализаторами логов
- Замедление работы сайта: чем больше счетчиков установлено на странице, тем медленнее она загружается
- Невозможность отслеживания загрузок файлов (мультимедиа, изображений и пр.)
- Набор получаемых отчетов ограничен возможностями сервиса статистики
- Полная потеря данных при переходе на другой сервер статистики
Лог-анализаторы Возможности:
Анализаторы логов извлекают и обрабатывают полезную информацию из журнальных файлов, находящихся на сервере сайта. Лог-файлы содержат следующие данные:
- обязательные (IP-адрес пользователя, URL запрашиваемой страницы, дату и время запроса);
- дополнительные (URL страницы, на которой пользователь находился перед переходом на сайт, вес отдаваемой страницы, версия клиентского браузера).
Журнальные файлы хранят историю доступа к каждой картинке, иконке, странице
Достоинства: - Высокая точность и достоверность: данные не теряются из-за погрешностей и перегрузок внешнего сервера статистики
- Гибкая подстройка под информационные потребности владельцев сайта (степень подстройки зависит от конкретной системы)
- Стабильность скорости загрузки сайта, поскольку браузеру не приходится загружать логотипы счетчиков и обмениваться информацией с внешним сервером
- Принадлежность данных статистики владельцу сайта: они хранятся у него любое количество времени (но есть ограничения по месту, т.к. логи сайта с 10000 уникальных посетителей в сутки – это около гигабайта данных)
- Возможность получения специфических отчетов: визиты роботов поисковых систем, информация о попытках хакерских атак, ошибки в навигации сайта (в том числе данные о страницах и файлах, которые не существуют, но запрашиваются пользователем), размер посещаемости сайта, количество поставленных закладок и др.
Недостатки: - Стоимость в пределах нескольких сотен долларов, т.к. эти программы в большинстве случаев платные, хотя встречаются и бесплатные варианты.
- Сложность установки, из-за чего могут понадобиться консультации специалистов.
- Существенные временные затраты на стадии внедрения
- Регулярные затраты времени на получение и обработку данных
- Вероятность безвозвратной потери данных вследствие человеческого фактора
- Отсутствие возможности сравнивать аудиторию сайта с аудиторией других сайтов
- Малая точность географических данных (для ее повышения нужно использовать постоянно обновляемую базу IP-адресов)
- Отсутствие возможности выявления повторных посещений (из-за неиспользования cookie), а также посетителей, заходящих на сайт через корпоративные сети, прокси-сервера (из офисов, интернет-кафе, университетов, локальных сетей)
- Невозможность определить разрешение экрана у пользователя, а также выполнение Java-скриптов