Статистическое изучение связи методом корреляционно-регрессионного анализа

В статистическом изучении взаимосвязи между явлениями основными задачами является не только количественная оценка (наличие, направление и сила связи), но и аналитическое выражение зависимости результативного признака вследствие влияния на него факторных признаков. Для решения данной задачи используют метод корреляционно-регрессионного анализа.

Задачей корреляционного анализаявляется количественное определение тесноты связи между двумя признаками при парной связи или между результативным и несколькими факторными при множественной связи.

Задачи регрессионного анализа – выбор модели зависимости, установление степени влияния факторных признаков на результативный, расчет значений зависимой переменной (расчет уравнения регрессии).

Влияние вариации одного факторного признака на результативный наиболее полно в статистике отражает методология парной корреляции. Исследование парной корреляции осуществляется на основе корреляционного анализа, который предполагает последовательное решение ряда задач:

· Выявление связи;

· Описание связи в табличной и графической формах;

· Измерение тесноты связи;

· Формулировка выводов о характере существующей связи.

Задача выявления связи между факторным и результативным признаками может быть решена при помощи следующих приёмов:

- визуализации связи (построение и визуальный анализ корреляционного поля);

- использования результатов аналитической группировки и др.

Корреляционное поле представляет собой точечный график в системе координат {x,y}. Каждая точка соответствует единице совокупности. Положение точек на графике определяется величиной двух признаков – факторного и результативного. Точки корреляционного поля могут располагаться на графике хаотично, без всякой закономерности - тогда делается вывод об отсутствии связи между признаками; или определённым образом вдоль некоторой гипотетической линии – тогда делается вывод о существовании связи между признаками.

Использование аналитических группировок также информативно на начальном этапе выявления взаимосвязи между изучаемыми признаками. Метод аналитических группировок заключается в следующем: факторный показатель оказывает влияние на результативный показатель. Чтобы установить связь между показателями, аналитическая группировка всегда осуществляется по показателю-фактору. Затем по каждой группе отбираются соответствующие значения показателя-результата и рассчитывается его среднее значение. Этот метод определяет только наличие связи.

Для измерения направления и тесноты взаимосвязи между факторным и результативным признаками расчетным путем используется линейный коэффициент корреляции. Линейный коэффициент корреляции рассчитывается по формуле:

Статистическое изучение связи методом корреляционно-регрессионного анализа - student2.ru = Статистическое изучение связи методом корреляционно-регрессионного анализа - student2.ru , (5)

где Статистическое изучение связи методом корреляционно-регрессионного анализа - student2.ru , Статистическое изучение связи методом корреляционно-регрессионного анализа - student2.ru - оценки дисперсий величин Статистическое изучение связи методом корреляционно-регрессионного анализа - student2.ru .

После преобразований формулу (5) можно записать в виде:

Статистическое изучение связи методом корреляционно-регрессионного анализа - student2.ru (5.1)

Коэффициент корреляции представляет меру линейной зависимости между двумя переменными на фоне действия остальных переменных, входящих в модель. Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Абсолютное значение, равное единице, свидетельствует о том, что связь функциональная: -1 – обратная (отрицательная), +1 – прямая (положительная). Нулевое значение коэффициента указывает на отсутствие линейной связи между признаками, однако, это не говорит о том, что связи нет вообще, т.к. связь между изучаемыми признаками может быть и нелинейной.

Исследование взаимосвязей и воздействия случайных факторов в условиях массовых наблюдений выполняется с помощью экономико-статистических моделей. Модель является логическим или математическим описанием составляющих и функций, которые отображают существенные свойства объекта или процесса, подлежащего моделированию. Используя модель устанавливают основные закономерности изменения оригинала. В модели используют показатели, вычисленные для качественно однородных совокупностей. Модель выражается в виде функционального уравнения, на основании которого проводят вычисление средних значений моделируемого показателя, используя набор заданных величин. Модель позволяет выявить степень влияния отдельных факторов на результативный.

Модель может состоять из одного или нескольких факторов, исходя из этого различают однофакторные модели и многофакторные. Многофакторные модели содержат два и более факторов.

Рассмотрим основные проблемы статистического моделирования связи методами корреляционного и регрессионного анализа.

Наши рекомендации