Дисперсионный анализ в ms excel

Пример1

Три различные группы из шести испытуемых получили списки из десяти слов. Первой группе слова предъявлялись с низкой скоростью -1 слово в 5 секунд, второй группе со средней скоростью - 1 слово в 2 секунды, и третьей группе с большой скоростью - 1 слово в секунду. Было предсказано, что показатели воспроизведения будут зависеть от скорости предъявления слов. Результаты представлены в таблице1:

№п/п Группа 1: низкая скорость Группа 2: средняя скорость Группа 3: высокая скорость

Таблица 1

Влияет ли скорость предъявления слов на объем их воспроизведения?

1. Запустить “Пакет анализа”.

В системе электронных таблиц Microsoft Excel имеется набор инструментов для анализа данных, называемый пакет анализа, который может быть использован для решения сложных статистических задач. Для использования одного из этих инструментов указать входные данные и выбрать параметры; анализ будет проведен с помощью подходящей статистической макрофункции, и результаты будут представлены в выходном диапазоне.

На вкладке Данные выберите команду Анализ данных.

Рисунок 2

Если такая команда отсутствует на вкладке Данные, то необходимо установить в Microsoft Excel пакет анализа данных через вкладку Файл команду ПараметрыразделНадстройки, или запустить программу установки Microsoft Excel. Установить флажок “Пакет анализа” (надстройки, установленные в Microsoft Excel, остаются доступными, пока не будут удалены).

Рисунок 3

Выберите необходимую строку в списке “Инструменты анализа”.

Введите входной и выходной диапазоны, затем выберите необходимые параметры. Для использования инструментов анализа исследуемые данные следует представить в виде строк или столбцов на листе. Совокупность ячеек, содержащих анализируемые данные, называется входным диапазоном.

2. Провести однофакторный дисперсионный анализ.

На вкладке Данные выбираем команду Анализ данных.

В списке инструментов статистического анализа выбираем Однофакторный дисперсионный анализ (Рисунок 4).

Рисунок 4 – Выбор инструмента анализа

В диалоговом окне режима (Рисунок 5) указываем входной интервал, способ группирования, выходной интервал, метки в первой строке/ Метки в первом столбце, альфа (уровень значимости).

Рисунок 5 – Диалоговое окно однофакторного дисперсионного анализа

Входной интервал – это ссылка на ячейки, содержащие анализируемые данные. Ссылка должна состоять как минимум из двух смежных диапазонов данных, организованных в виде столбцов или строк. Входной интервал можно задать при помощи мыши, или набрать на клавиатуре.

Группирование. Установите переключатель в положение “по столбцам” или “по строкам” в зависимости от расположения данных во входном диапазоне.

Метки в первой строке/ Метки в первом столбце. Установите переключатель в положение “Метки в первой строке”, если первая строка во входном диапазоне содержит названия столбцов. Установите переключатель в положение “Метки в первом столбце”, если названия строк находятся в первом столбце входного диапазона. Если входной диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут созданы автоматически.

Выходной интервал. Введите ссылку на ячейку, расположенную в левом верхнем углу выходного диапазона. Размеры выходной области будут рассчитаны автоматически, и соответствующее сообщение появится на экране в том случае, если выходной диапазон занимает место существующих данных или его размеры превышают размеры листа.

Новый лист. Установите переключатель, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки А1. Если в этом есть необходимость, введите имя нового листа в поле, расположенном напротив соответствующего положения переключателя.

Новая книга. Установите переключатель, чтобы открыть новую книгу и вставить результаты анализа в ячейку А1 на первом листе в этой книге.

В результате обработки данных получили следующее:

Однофакторный дисперсионный анализ  
             
ИТОГИ            
Группы Счет Сумма Среднее Дисперсия    
№ п/п 3,5 3,5    
Группа 1: низкая скорость 7,16666667 2,166666667    
Группа 2: средняя скорость 6,16666667 2,166666667    
Группа 3: высокая скорость    
             
             
Дисперсионный анализ            
Источник вариации SS df MS F P-Значение F критическое
Между группами 54,79166667 18,2638889 7,429378531 0,001563302 3,098391212
Внутри групп 49,16666667 2,45833333      
             
Итого 103,9583333        

Таблица 2 – Результаты однофакторного дисперсионного анализа

ИТОГИ:

“Счет” – число испытуемых. “Сумма” – сумма значений показателя по строкам. “Дисперсия” – частная дисперсия показателей.

ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA) представляет результаты однофакторного дисперсионного анализа, в котором первая колонка “Источник вариации” содержит наименование дисперсий. Графа “SS” - это сумма квадратов отклонений, “df” - степень свободы, графа “MS” - средний квадрат, “F” - критерий фактического F – распределения. “P - значение” - вероятность того, что дисперсия, воспроизводимая уравнением, равна дисперсии остатков. Определяет вероятность того, что полученная количественная определенность взаимосвязи между факторами и результатом может считаться случайной. “F - критическое” - это значение F – теоретического, которое впоследствии сравнивается с F – фактическим.

Результаты дисперсионного анализа (таблица 2) показывают, что скорость предъявления слов влияет на объем их воспроизведения с достоверностью более 99%.
Самостоятельная работа

Задача 1

Предположим, изучалось различие в продуктивности воспроизведения одного и того же материала трех групп испытуемых (по 5 человек), различающихся условиями предъявления этого материала для запоминания. Зависимая переменная (Y) – количество воспроизведенных единиц материала, независимая переменная (фактор) – условия предъявления (три градации, таблица 3). Проверьте на уровне значимости α=0,01 гипотезу о том, что продуктивность воспроизведения материала зависит от условий его предъявления.

условие1 условие2 условие3
№ участника Y № участника Y № участника Y

Таблица 3

Задача 2

Необходимо выявить, влияет ли расстояние от центра города на степень заполняемости гостиниц. Пусть введены 3 уровня расстояний от центра города: 1) до 3 км, 2) от 3 до 5 км и 3) свыше 5 км. Данные заполняемости представлены в таблице 1.

Таблица 1.

Расстояние Заполняемость
До 3 км 92 98 89 97 90 94
От 3 до 5 км 90 86 84 91 83 82
Свыше 5 км 87 79 74 85 73 77

Задача 3

Определите, влияет ли фактор образования на уровень зарплаты сотрудников фирмы на основании следующих данных (см. табл. 2).

Таблица 2.

Образование Зарплата сотрудников
Высшее 3200 3000 2600 2000 1900 1900
Среднее спец. 2600 2000 2000 1900 1800 1700
среднее 2000 2000 1900 1800 1700 1700

Задача 4

Исследователь сравнивает эффективность четырех разных методик обучения производственным навыкам. Для этой цели из всех выпускников ПТУ выбраны четыре группы учащихся, обучавшиеся, соответственно четырьмя разными методами. Эффективность методик оценивалась по сумме обработанных учащимися деталей в течение одного дня (см. табл. 3). Проверить гипотезу об отсутствии влияния регулируемого фактора (методик обучения) на продуктивность деятельности ученика

Таблица 3.

№ учащихся 1 группа 2 группа 3 группа 4 группа
 
 
     

Наши рекомендации