Вариационный ряд, распределение частот значений переменной (frequency distribution)
Математическое распределение, цель которого - подсчет ответов, связанных с различными значениями одной переменной (частот), и дальнейшее выражение их в процентном виде (частости).
Целью построения вариационного ряда является подсчет ответов респондентов, в которых приводятся различные значения переменной. Относительную частоту различных значений переменной выражают в процентах и называют частостями. Подсчет распределения частот значений переменной дает возможность построить таблицу, с указанием частоты, частости и накопленных частостей для всех значений этой переменной.
В табл. 15.2 представлено распределение частот осведомленности об Internet. Первая колонка содержит отметки, присвоенные различным категориям переменной, а вторая — коды, присвоенные каждому значению переменной.
Таблица 15.2. Распределение частот осведомленности об Internet | |||||
Отметка значения | Значение | Частоты (N) | Частости | Достоверные частости | Накопленные частости |
Плохо осведомлены | 0,0 6,7 20,0 20,0 10,0 26,7 | 0,0 6,9 20,7 20,7 10,3 27,6 | 0,0 6,9 27,6 48,3 58,6 86,2 | ||
Хорошо осведомлены | Итого | 13,3 3,3 100,0 | 13,8 Пропуск 100,0 | 100,0 |
Обратите внимание, что код 9 присвоен пропущенным значениям. В третьей колонке приведено количество ответивших респондентов. Например, три респондента отметили в анкете галочкой значение 5, указав, что они что-то слышали об Internet. В четвертой колонке приведен процент респондентов, отметивших в анкете галочкой данное значение. В следующей колонке показаны проценты, подсчитанные с учетом пропущенных значений. Если пропущенных значений нет, то колонки 4 и 5 идентичны. В последней колонке представлены накопленные частости после корректировки пропущенных случаев (ответов респондентов). Как видно, из 30 респондентов, участвующих в опросе, 10% отметили значение 5. Если исключить одного респондента с пропущенным значением, то частость увеличится до 10,3%. Накопленная частость, относящаяся к значению 5, равна 58,6. Другими словами, 58,6% респондентов с достоверными ответами показали значение осведомленности 5 или меньше.
Рис. 15. 1. Гистограмма распределения частот
Вариационный ряд помогает определить долю неответивших респондентов (в табл. 15.2 один респондент из 30 не ответил на вопрос), а также указывает долю ошибочных ответов. Значения, равные 0 или 8, соответствуют ошибочным ответам. Следует определить количество случаев с такими значениями и соответственно откорректировать результат. Кроме того, можно установить наличие выбросов, т.е. случаев с экстремальными значениями. При анализе распределения частот относительно размера домохозяйства (семьи) выбросами следует считать несколько семей, состоящих не меньше чем девяти человек. Распределение частот также определяет форму эмпирического распределения значений переменной. Частотные данные можно использовать для построения гистограмм или вертикальных столбчатых диаграмм, на которых по оси Х откладывают значения переменной, а по оси Y— абсолютные (частоты) или относительные (частости) значения. На рис. 15.1 представлена гистограмма для данных табл. 15.2. По гистограмме можно проверить, соответствует ли наблюдаемое распределение предполагаемому маркетологом распределению.
Для иллюстрации наших рассуждений рассмотрим следующий пример.