Тема 8 Процедура обработки и методы анализа данных
Вопросы
1. Значение подготовки информации для анализа данных. Функции преобразования данных
2. Табулирование данных: простая и перекрестная табуляция
3. Классы процедур анализа данных
4. Дескриптивный анализ: использование мер «центральной тенденции», мер вариации
5. Выводной статистический анализ. Оценка параметров и проверка гипотез.
6. Анализ существенности различий. Использование нулевой гипотезы.
7. Анализ связей: определение и интерпретация связей между переменными
1. Преобразование данных
Преобразование данных – перевод «сырых данных» в сжатую, осмысленную информацию, удобную для анализа. Оно включает их введение в компьютер, проверку на предмет ошибок, кодирование, представление в табличной форме (табулирование). Выделяют, по крайней мере, следующие четыре функции преобразования данных: обобщение, определение концепции (концептуализация), перевод результатов статистического анализа на понятный для менеджера язык (коммуникация), определение степени соответствия полученных результатов всей совокупности (экстраполяция).
1. Из-за неспособности человека анализировать большие массивы информации, необходимо исходные собранные данные представить в удобном для осмысления виде, т.е. их необходимо обобщить, выразить через ограниченное число понятных параметров.
2. Большинство статистических мер основано на определенных предположениях, которые определяют базу анализа собранных данных. Концептуализация направлена на оценку результатов обобщения. Например, слабый разброс оценок определенной марки продукта вырабатывает у исследователя одно суждение (концепцию), сильный — другое.
3. Коммуникация предполагает при интерпретации полученных результатов использование понятных для заказчика категорий. Например, если для него понятна такая статистическая мера как "мода", то она используется при представлении полученных результатов, если — нет, то результаты описываются на общепринятом языке.
4. Экстраполяция в данном случае предполагает определение, в какой степени данные выборки можно обобщить на всю совокупность
2. Табулирование данных: простая и перекрестная табуляция
Исследователь, осуществляя преобразование, старается найти зависимости среди собранных данных и в то же время достигнуть наиболее высокого уровня обобщения. Табулирование помогает исследователю понять, что означают собранные данные. Обычно полученные данные представляются в виде матрицы (таблицы), столбцы которой содержат ответы на различные вопросы анкеты, а ряды - респондентов или изучаемые ситуации. Табулирование – подсчет количества событий, которые попадают в различные категории.
Простая табуляция (линейная) –подсчет количества событий, которые попадают в каждую категорию, когда категории базируются на одной переменной. Простая табуляция служит исходной базой для построения гистограмм, полигона частот, расчета таких показателей, как: мода, медиана, арифметическое среднее, квартили, показатели вариации.
Пример простой табуляции:
Первый вопрос | Второй вопрос | ||
Вариант ответа | Число ответивших, % | Вариант ответа | Число ответивших, % |
87,8 12,2 | 46,3 14,6 2,4 34,1 2,4 | ||
Третий вопрос | Четвертый вопрос | ||
Вариант ответа | Число ответивших, % | Вариант ответа | Число ответивших, % |
12,2 2,4 12,2 31,7 31,7 9,8 | 34,1 2,4 26,8 7,3 26,8 2,4 | ||
Перекрестная табуляция –подсчет количества событий, когда категории базируются на двух или более переменных, рассматриваемых одновременно(перекрестный анализ). Это наиболее широко используемый прием анализа связе й между переменными в маркетинговых исследованиях. Последовательный ряд перекрестных табуляций носит название – кросс-табб.