Линейный парный регрессионный анализ

Все существующие связи между признаками классифицируют по степени тесноты, направлению, форме, числу факторов.

По степени тесноты связи делят на статистические и функциональные.

Статистическая связь - это такая связь между при­знаками, при которой для каждого значения признака-фактора Xпризнак-результат линейный парный регрессионный анализ - student2.ru может в определенных пределах принимать любые значения с некоторыми вероят­ностями; при этом его статистические (массовые) характе­ристики (например, среднее значение) изменяются по опре­деленному закону.

Статистическая связь обусловлена тем, что:

1) на результативный признак оказывают влияние не только факторы, учтенные в модели (которые мы исследуем), но и неучтенные или неконтролируемые факторы;

2) неизбежностью ошибок измерения значений при­знаков.

Модель статистической связи может быть представлена в общем виде уравнением: линейный парный регрессионный анализ - student2.ru

где линейный парный регрессионный анализ - student2.ru - зависимая переменная (предиктор, результативный признак), фактическое значение результативного признака;

Х – независимая переменная (регрессор);

линейный парный регрессионный анализ - student2.ru - детерминированная составляющая - часть результативного признака, сформировав­шаяся под воздействием учтенных известных факторных признаков;

U – случайная составляющая (случайный остаток).

Противоположной статистической связи является функциональная. Функциональной называется такая связь, когда каждо­му возможному значению признака-фактора линейный парный регрессионный анализ - student2.ru соответст­вует одно или несколько строго определенных значений ре­зультативного признака линейный парный регрессионный анализ - student2.ru . Определение функциональной связи может быть легко обобщено для случая многих при­знаков – линейный парный регрессионный анализ - student2.ru Модель функциональной связи в общем виде можно представить уравнением: линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru

По направлению изменений результативного и факторного признаков связи делят на прямые и обратные.

По форме связи (виду функции f) связи делят на пря­молинейные (линейные) и криволинейные (нелинейные).

По количеству факторов в модели связи подразделяют на однофакторные (парные) и многофакторные.

Одним из методов изучения стохастических связей между признаками является регрессионный анализ.

Регрессионный анализ представляет собой установле­ние аналитической зависимости между признаками. Он включает следующие этапы:

1) выбор формы связи (вида аналитического уравнения регрессии);

2) оценка параметров уравнения;

3) оценка качества аналитического уравнения регрес­сии.

Наиболее часто для описания статистической связи признаков используется линейная форма. Внимание к ли­нейной связи объясняется четкой экономической интерпре­тацией ее параметров, ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму.

Линейная парная регрессия сводится к нахождению уравнения вида:

линейный парный регрессионный анализ - student2.ru

где линейный парный регрессионный анализ - student2.ru и линейный парный регрессионный анализ - student2.ru – параметры уравнения регрессии;

линейный парный регрессионный анализ - student2.ru - часть результативного признака, сформировавшаяся под воздействием неконтролируемых или неучтенных факторов, а также ошибок измерения признаков.

Оценка параметров линейной регрессии проводиться по пространственной выборки (Yi Хi) линейный парный регрессионный анализ - student2.ru . Для получения оценок наиболее часто используют метод наименьших квадратов (МНК).

Метод наименьших квадратов дает наилучшие (эффективные и несмещенные) оценки параметров уравнения рег­рессии. Но только в том случае, если выполняются опреде­ленные предпосылки относительно случайного члена линейный парный регрессионный анализ - student2.ru и независимой переменной линейный парный регрессионный анализ - student2.ru .

МНК позволяет получить такие оценки параметров линейный парный регрессионный анализ - student2.ru и линейный парный регрессионный анализ - student2.ru , при которых сумма квадратов отклонений фактических значений результативного признака Y – от расчетных (тео­ретических) значений —Ŷ минимальна:

S=Σ(Y-Ŷ)2 → min.

Проиллюстрируем суть данного метода графически. Для этого построим точечный график по данным наблюдений линейный парный регрессионный анализ - student2.ru в прямоугольной системе координат (такой точечный график называют корреляционным полем). Попытаемся подобрать прямую линию, которая ближе всего расположена к точкам корреляционного поля. Согласно методу наименьших квадратов линия выбирается так, чтобы сумма квадратов расстояний по вертикали между точками корреляционного поля и этой линией была бы минимальной.

Y линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru            
             
Ŷ            
           
Y            
        X  
           
    X    
                 


Рисунок 1 - Корреляционное поле зависимости между X и Y.

В случае линейной парной зависимости:

линейный парный регрессионный анализ - student2.ru .

Значения линейный парный регрессионный анализ - student2.ru и линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru нам известны, это данные на­блюдений. В функции S они представляют собой констан­ты. Переменными в данной функции являются искомые оценки параметров – линейный парный регрессионный анализ - student2.ru и линейный парный регрессионный анализ - student2.ru . Чтобы найти минимум функции двух переменных необходимо вычислить частные произ­водные данной функции по каждому из параметров и приравнять их к нулю, т.е.

линейный парный регрессионный анализ - student2.ru

В результате получим систему из 2-ух нормальных линейных уравнений:

линейный парный регрессионный анализ - student2.ru или линейный парный регрессионный анализ - student2.ru линейный парный регрессионный анализ - student2.ru

Решая данную систему, найдем искомые оценки параметров:

линейный парный регрессионный анализ - student2.ru ,

линейный парный регрессионный анализ - student2.ru ,

где линейный парный регрессионный анализ - student2.ru , линейный парный регрессионный анализ - student2.ru и линейный парный регрессионный анализ - student2.ru - средние значения факторов Х, Y и их произведения.

В системе нормальных уравнений индексы опущены для облегчения запоминания .

Правильность расчета параметров уравнения регрессии может быть проверена сравнением сумм ΣY=ΣŶ (при этом возможно некоторое расхождение из-за округления расчетов).

Знак коэффициента регрессии линейный парный регрессионный анализ - student2.ru указывает направле­ние связи (если линейный парный регрессионный анализ - student2.ru , связь прямая, если линейный парный регрессионный анализ - student2.ru , то связь обрат­ная). Величина линейный парный регрессионный анализ - student2.ru показывает, на сколько единиц изменится в среднем признак-результат –Y при изменении признака-фактора – Х на1 единицу своего измерения.

Формально значение параметра линейный парный регрессионный анализ - student2.ru - среднее значение Y при Xравном нулю. Если признак-фактор не имеет и не может иметь нулевого значения, то вышеуказанная трак­товка параметра линейный парный регрессионный анализ - student2.ru не имеет смысла.

Оценка тесноты связи между признакамиосуществляется с помощью коэффициента линейной парной корреляции - линейный парный регрессионный анализ - student2.ru . Он может быть рассчитан по формуле: линейный парный регрессионный анализ - student2.ru ,

Для качественной оценки тесноты связи можно использовать следующую классификацию:

0.1- 0.3- слабая связь

0.3-0.5 – умеренная связь

0.5-0.7- заметная связь

0.7-0.9- тесная связь

0.9-0.99- весьма тесная (Здесь значения линейный парный регрессионный анализ - student2.ru взять по модулю).

где линейный парный регрессионный анализ - student2.ru - среднее квадратическое отклонение факторного признака, которое определяется по формуле:

линейный парный регрессионный анализ - student2.ru .

линейный парный регрессионный анализ - student2.ru - среднее квадратическое отклонение результативного признака, которое определяется по формуле:

линейный парный регрессионный анализ - student2.ru .

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии линейный парный регрессионный анализ - student2.ru .

Область допустимых значений линейного коэффици­ента парной корреляции от -1 до +1. Знак коэффициента корреляции указывает направление связи. Если линейный парный регрессионный анализ - student2.ru , то связь прямая; если линейный парный регрессионный анализ - student2.ru , то связь обратная.

Если данный коэффициент по модулю близок к еди­нице, то связь между признаками может быть интерпрети­рована как довольно тесная линейная. Если его модуль ра­вен единице линейный парный регрессионный анализ - student2.ru , то связь между признаками функцио­нальная линейная. Если признаки X и Y линейно независи­мы, то линейный парный регрессионный анализ - student2.ru близок к 0.

Дляоценки качестваполученного уравнения регрессиирассчитывают теоретический коэффициент детерминации - линейный парный регрессионный анализ - student2.ru . Коэффициент детерминации характеризует долю ва­риации (дисперсии) результативного признака Y,объясняе­мую регрессией (а, следовательно, и фактором Х), в общей вариации (дисперсии) Y. Коэффициент детерминации линейный парный регрессионный анализ - student2.ru принимает значения от 0 до 1. Соответственно величина линейный парный регрессионный анализ - student2.ru характеризует долю дисперсии Y, вызванную влиянием прочих неучтенных в модели факторов и ошибками специ­фикации.

δ2 Σ(Ŷ- линейный парный регрессионный анализ - student2.ru )2

R2yx= ____ = _____________

σ2y Σ(Y- линейный парный регрессионный анализ - student2.ru )2

где линейный парный регрессионный анализ - student2.ru - объясненная уравнением регрессии дисперсия Y;

линейный парный регрессионный анализ - student2.ru - общая (полная) дисперсия Y.

В силу теоремы о сложении дисперсий общая дисперсия результативного признака равна сумме объясненной уравнением регрессии линейный парный регрессионный анализ - student2.ru и остаточной (необъясненной) линейный парный регрессионный анализ - student2.ru дисперсий:

линейный парный регрессионный анализ - student2.ru .

Поэтому коэффициент детерминации может быть рассчитан через остаточную и общую дисперсии:

ε2 Σ(Y-Ŷ)2

R2=1- ____ = 1 - _____________

σ2y Σ(Y- линейный парный регрессионный анализ - student2.ru )2

где линейный парный регрессионный анализ - student2.ru - остаточная (необъясненная уравнением регрес­сии) дисперсия Y.

При парной линейной регрессии линейный парный регрессионный анализ - student2.ru .

Наши рекомендации