Тема 8 Процедура обработки и методы анализа данных

Вопросы

1. Значение подготовки информации для анализа данных. Функции преобразования данных

2. Табулирование данных: простая и перекрестная табуляция

3. Классы процедур анализа данных

4. Дескриптивный анализ: использование мер «центральной тенденции», мер вариации

5. Выводной статистический анализ. Оценка параметров и проверка гипотез.

6. Анализ существенности различий. Использование нулевой гипотезы.

7. Анализ связей: определение и интерпретация связей между переменными

1. Преобразование данных

Преобразование данных – перевод «сырых данных» в сжатую, осмысленную информацию, удобную для анализа. Оно включает их введение в компьютер, проверку на предмет ошибок, кодирование, представление в табличной форме (табулирова­ние). Выделяют, по крайней мере, следующие четыре функции преобразования данных: обобщение, определение концепции (концептуализация), перевод ре­зультатов статистического анализа на понятный для менеджера язык (коммуни­кация), определение степени соответствия полученных результатов всей сово­купности (экстраполяция).

1. Из-за неспособности человека анализировать большие массивы информа­ции, необходимо исходные собранные данные представить в удобном для ос­мысления виде, т.е. их необходимо обобщить, выразить через ограниченное число понятных параметров.

2. Большинство статистических мер основано на определенных предположе­ниях, которые определяют базу анализа собранных данных. Концептуализация направлена на оценку результатов обобщения. Например, слабый разброс оце­нок определенной марки продукта вырабатывает у исследователя одно сужде­ние (концепцию), сильный — другое.

3. Коммуникация предполагает при интерпретации полученных результатов использование понятных для заказчика категорий. Например, если для него понятна такая статистическая мера как "мода", то она используется при пред­ставлении полученных результатов, если — нет, то результаты описываются на общепринятом языке.

4. Экстраполяция в данном случае предполагает определение, в какой степе­ни данные выборки можно обобщить на всю совокупность

2. Табулирование данных: простая и перекрестная табуляция

Исследователь, осуществляя преобразование, старается найти зависимости среди собранных данных и в то же время достигнуть наиболее высокого уровня обобщения. Табулирование помогает исследователю понять, что означают собранные данные. Обычно полученные данные представляются в виде матрицы (таблицы), столбцы которой содержат ответы на различ­ные вопросы анкеты, а ряды - респондентов или изучаемые ситуации. Табулирование – подсчет количества событий, которые попадают в различные категории.

Простая табуляция (линейная) –подсчет количества событий, которые попадают в каждую категорию, когда категории базируются на одной переменной. Простая табуляция служит исходной базой для построения гистограмм, полигона частот, расчета таких показателей, как: мода, медиана, арифметическое среднее, квартили, показатели вариации.

Пример простой табуляции:

Первый вопрос Второй вопрос
Вариант ответа Число ответивших, % Вариант ответа Число ответивших, %
87,8 12,2 46,3 14,6 2,4 34,1 2,4
Тема 8 Процедура обработки и методы анализа данных - student2.ru Тема 8 Процедура обработки и методы анализа данных - student2.ru
Третий вопрос Четвертый вопрос
Вариант ответа Число ответивших, % Вариант ответа Число ответивших, %
12,2 2,4 12,2 31,7 31,7 9,8 34,1 2,4 26,8 7,3 26,8 2,4
Тема 8 Процедура обработки и методы анализа данных - student2.ru Тема 8 Процедура обработки и методы анализа данных - student2.ru

Перекрестная табуля­ция –подсчет количества событий, когда категории базируются на двух или более переменных, рассматриваемых одновременно(перекрестный анализ). Это наиболее широко используемый прием анализа связе й между переменными в маркетинговых исследованиях. Последовательный ряд перекрестных табуляций носит название – кросс-табб.

Наши рекомендации