Параметрический корреляционный анализ
Лабораторная работа №10. Технологии статистических расчетов в MS EXCEL.
Цель: научиться использовать возможности MS Excel для проведения статистических расчетов.
Задачи:
1. Расчет коэффициента корреляции Пирсона и t-статистики Стьюдента.
2. Построение модели регрессии различными способами.
3. Выбор наиболее точной модели связи между двумя величинами.
Параметрический корреляционный анализ.
Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между выборками. Обычно связь между выборками носит не функциональный, а вероятностный (или стохастический) характер. В этом случае нет строгой, однозначной зависимости между величинами. При изучении стохастических зависимостей различают корреляцию и регрессию.
Корреляционный анализ состоит в определении степени связи между двумя случайными величинами X и Y. В качестве меры такой связи используется коэффициент корреляции.Коэффициент корреляции оценивается по выборке объема п связанных пар наблюдений (xi, yi) из совместной генеральной совокупности X и Y. Существует несколько типов коэффициентов корреляции, применение которых зависит от измерения (способа шкалирования) величин X и Y.
Для оценки степени взаимосвязи величин X и Y, измеренных в количественных шкалах, используется коэффициент линейной корреляции (коэффициент Пирсона), предполагающий, что выборки X и Y распределены по нормальному закону.
1. Линейный коэффициент корреляции— параметр, который характеризует степень линейной взаимосвязи между двумя выборками, рассчитывается по формуле:
где хi — значения, принимаемые в выборке X,
yi — значения, принимаемые в выборке Y;
— средняя по X, — средняя по Y.
Коэффициент корреляции изменяется от -1 до 1. Когда при расчете получается величина большая +1 или меньшая -1 — следовательно, произошла ошибка в вычислениях. При значении 0 линейной зависимости между двумя выборками нет.
Знак коэффициента корреляции очень важен для интерпретации полученной связи. Если знак коэффициента линейной корреляции — плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.
Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости.