Описательная статистика
Одномерный анализ маркетинговой информации.
По каждому вопросу необходимо построить частотные таблицы одномерного анализа, в которых будет отражено количество пропущенных ответов, количество и проценты ответов по каждой переменной. Данные таблицы дополняют графический одномерный анализ.
Для этого следует обратиться к вкладке Анализ/Описательные статистики/Частоты, ввести в окно Переменные все переменные и отметить Вывести частотные таблицы. Нажать ОК.
В результате в начале документа появится таблица Частоты. В ней будут отражены валидные (пригодные к аналитической работе) и пропущенные ответы. Её следует экспортировать в документ отчета и проанализировать те вопросы, по которым будут иметься пропущенные ответы, после чего дать предложения по корректировке либо анкеты, либо процедуры отбора респондентов, чтобы в дальнейшем избежать ситуации появления пропущенных ответов, которая снижает результативность исследования.
Далее появятся таблицы частот, в которых будут отображены показатели:
Частота – количество ответивших респондентов по каждому варианту ответа;
Процент – доля ответивших по каждому варианту ответа;
Валидный процент – доля ответов без учета пропущенных;
Кумулятивный процент – доля валидных ответов с нарастающим итогом.
Здесь следует обращать внимание на обработку пропущенных ответов. В представленном выше случае напротив Валидные стоит 3 респондента без метки варианта ответа – это системные пропущенные ответы (в ячейке пусто, но не отмечено 999). Это может касаться переходных вопросов. Пропущенных в данном вопросе (отмеченных 999) 2 респондента. Но этот вариант представления результатов касается тех вопросов, в которых одновременно есть системные пропущенные ответы и пропущенные ответы, отмеченные 999. В случае, если в вопросе имеются только системные пропущенные ответы, результат будет следующим:
Т.е. пропущенные ответы (пустые ячейки во вкладке Данные) отразятся как системные. Это следует учитывать при обработке результатов.
Все полученные таблицы следует экспортировать в отчет, сделать выводы по каждому вопросу.
Далее рассчитываются показатели одномерного статистического анализа. Программа посчитает показатели только по метрическим переменным. Чтобы не нагромождать процедуру анализа, их можно отделить самостоятельно. В отчете должны быть представлены статистические показатели не менее, чем по 5 переменным, поэтому в случае отсутствия 5 количественных переменных, следует скорректировать вкладку Переменные (поменять шкалу измерения на количественную).
Анализ/Описательные статистики/Частоты, правой кнопкой мыши по переменным Сортировать по шкалам измерений, убрать значок Вывести частотные таблицы (они уже имеются), выбрать метрические переменные (порядковые, количественные) во вкладке Статистики выбрать показатели, которые следует посчитать (как представлено на рисунке), продолжить, ОК.
Экспортировать данные в отчет и дать пояснения показателей по каждой переменной.
Показатели расположения распределения ответов на кривой распределения:
среднее – определяется по средней арифметической простой;
медиана, которая представляет собой значение изучаемой характеристики, лежащее в середине ряда. Если число ответов четное, то медиана равна полусумме двух серединных значений, справа и слева от медианы находится одинаковое количество ответов;
мода - наиболее распространенное значение изучаемой характеристики;
сумма – сумма чисел всех ответов.
Показатели разброса полученных значений ответов:
стандартное отклонение показывает величину отклонения фактических значений от среднего по изучаемой выборочной совокупности;
дисперсия – стандартное отклонение в квадрате;
размах – максимум минус минимум;
минимум – наименьшее значение ответов
максимум – наибольшее значение ответов
стандартная ошибка среднего – величина для расчета доверительного интервала (без нормированного отклонения) – среднеквадратическое отклонение делить на корень из выборки; умножив её на нормированное отклонение, получим величину доверительного интервала по вопросу.
Показатели формы распределения:
эксцесс - показатель относительной крутости кривой распределения по сравнению с нормальным распределением. Если эксцесс положителен, то распределение более островершинно по сравнению с нормальным, если отрицателен – наоборот, если равен нулю – изучаемый показатель нормально распределен, асимметричность оценивает симметрию расположения значений изучаемой характеристики относительно средней. Если показатель асимметрии положителен, то данные скошены влево и вытянуты вправо – правосторонняя асимметрия (отклонение распределения в сторону положительных значений), если отрицательны – данные скошены вправо и вытянуты влево - левосторонняя асимметрия (отклонение распределения в сторону отрицательных значений). Асимметрия ниже 0,2 считается статистически незначительной, свыше 0,5 – значительной.
Пример анализа полученных показателей, вопрос по возрасту респондентов:
Итак, средний возраст респондентов по выборке 42 года, причем самому молодому участнику опроса 22 года, а самому возрастному – 74. Разброс в возрасте величиной в 52 года соответствует характеристикам выборки, поскольку к опросу предполагалась разновозрастная выборка. Половина выборки находится в возрасте до 42 с половиной года, половина старше данного возраста, следовательно, респонденты по возрасту в выборке распределены равномерно. Наибольшее число респондентов в выборке возрастом 32 года. Равенство медианы и среднего определяет нормальное распределение ответов, поэтому все соответствующие виды анализа с нормальным распределение возможны к выполнению. Отклонение в возрасте от среднего значения – 13 лет, что при учете размаха (от 22 до 74 лет) является предпосылкой большой вариации (13/42,5*100=30%), это соответствует требованиям к выборке – разновозрастность. Что касается формы графика распределения, то он менее островершинен (эксцесс отрицательный) и скошен влево (асимметрия, хоть невысокая – менее 0,5, но все же положительная). Следовательно, нет высокой концентрации респондентов в определенном возрасте (что соответствует разновозрастности выборки) и большее число респондентов старше 32 лет – правосторонняя асимметрия : правее моды скоцентрировано большее количество ответов, чем левее.
После проведения лабораторной работы студент должен представить: документы программного пакета (Пропущенные ответы, Частоты, Статистики); отчет в MS WORD, содержащий:
1) таблицу пропущенных ответов с анализом причин их появления и рекомендациями по совершенствованию анкеты или процедуры отбора респондентов;
2) таблицы частот по каждой переменной с пояснениями их результатов;
3) таблицы показателей одномерного статистического анализа по каждой метрической переменной с выводами (не менее 5 переменных).
Студентам заочной формы обучения следует представить в MS WORD таблицы частот по 5 переменным с краткими выводами , 2 таблицы одномерного статистического анализа по разным переменным с выводами по показателям анализа.