Однофакторные (парные) модели регрессии

Парная регрессия характеризует связь между двумя признаками: результативным и факторным.

Процесс построения модели парной регрессии включает следующие основные этапы:

1) выбор формы связи;

2) определение параметров уравнения связи и проверка адекватности регрессионной модели;

3) измерение тесноты связи и проверка значимости (надежности) показателей тесноты связи.

Выбор формы связи имеет решающее значение в корреляционно-регрессионном анализе. Все дальнейшие самые тщательные расчеты могут быть обесценены, если форма связи избрана неверно.

При выборе формы уравнения регрессии качественный анализ играет важную роль для раскрытия механизма формирования корреляционной связи. Пусть, например, измеряется связь между сроком сева и урожайностью. Чрезмерно ранний и чрезмерно поздний сев ведут к снижению урожайности, максимум которой достигается при севе в оптимальные сроки. Таким образом, с ростом факторного признака (срок сева) урожайность растет, а затем снижается. Зависимость такого рода может быть выражена, например, уравнением параболы.

При всей важности теоретического анализа следует, однако, учитывать, что социально-экономические явления очень сложны. Как правило, мы не имеем о них исчерпывающей информации, а внутренняя логика их связей мало изучена. Факторы, влияющие на то или иное явление, взаимно переплетаются и взаимодействуют друг с другом. Поэтому очень часто не удается сделать теоретически обоснованный вывод уравнения регрессии, т.е. формы связи, внутренне присущей изучаемому явлению. В ряде случаев на основе теоретического анализа могут быть высказаны лишь более или менее обоснованные предположения о том, что следует ожидать линейную или какую-либо нелинейную (криволинейную) связь, имеет ли ожидаемая криволинейная функция экстремальные значения и т.п. Так, в рассмотренном примере можно утверждать, что линия регрессии – некоторая кривая, имеющая оптимум, но это отнюдь не обязательно парабола. Более того, если явление мало изучено, иногда могут быть выдвинуты и различные гипотезы о механизме и форме взаимосвязи.

Для проверки этих предположений и гипотез может быть использован графический метод – построение графика групповых средних, полученных в процессе аналитической группировки. Ломаная линия, изображающая изменение групповых средних результативного признака ( Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru ) в зависимости от изменения группировочного фактора, называется эмпирической линией регрессии (эмпирической регрессией).

Наглядное представление о форме линии регрессии может дать график эмпирической линии регрессии (рис. 7.2).

На график корреляционное поле (рис. 7.1.) наносятся результаты аналитической группировки (табл. 7.4) Абсциссами этих точек являются средние значения факторного признака ( Однофакторные (парные) модели регрессии - student2.ru ), а ординатами – средние значения результативного признака ( Однофакторные (парные) модели регрессии - student2.ru ).

Если эмпирическая линия по своему виду приближается к прямой линии, это свидетельствует о наличии прямолинейной корреляционной связи между признаками. Если же эмпирическая линия связи будет приближаться к кривой (параболе, гиперболе, показательной кривой), то это дает основание считать, что в данном случае имеется

 
  Однофакторные (парные) модели регрессии - student2.ru

криволинейная корреляционная связь, чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг эмпирической линии регрессии.

В нашем примере можно предположить, что имеется прямая, прямолинейная сильная корреляционная зависимость между объемом собственных средств и привлеченными средствами.

Форма эмпирической линии регрессии дает возможность проверить, соответствует ли фактическое соотношение признаков тому или иному теоретически предполагаемому их соотношению. При этом нужно, однако, иметь, в виду, что при относительно небольшом числе единиц совокупности (числе наблюдения) форма эмпирической линии регрессии может изменяться при изменении число групп и их границ. Поэтому при небольшом числе наблюдений нельзя слишком полагаться на форму эмпирической линии регрессии, графический метод в таких случаях может оказаться недостаточно надежным.

Существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о том, что связь между ними линейная, а при обратной связи – гиперболическая.

Если факторный признак увеличивается в арифметической прогрессии, а результативный – значительно быстрее, то используется параболическая или степенная регрессия.

Если относительно формы связи могут быть выдвинуты разные теоретические гипотезы, а по виду эмпирической регрессии трудно судить о том, какой из этих гипотез наиболее соответствуют фактические данные, то в этих случаях строятся и решаются уравнения регрессии с различными формами связи, а затем с помощью специальных статистико-математических критериев оценивается их адекватность и выбирается та форма связи, которая обеспечивает наилучшую аппроксимацию (приближение) и достаточную статистическую достоверность и надежность.

Определение параметров уравнения связи и их значимости.

Аналитическая связь между факторным и результативным признаками описываются уравнениями:

прямой - Однофакторные (парные) модели регрессии - student2.ru ;

гиперболы - Однофакторные (парные) модели регрессии - student2.ru ;

параболы - Однофакторные (парные) модели регрессии - student2.ru и т.д.

Выбрав тем или иным путем форму связи и построив уравнение регрессии в общем виде, необходимо далее найти числовые значения его параметров.

Оценка параметров уравнения осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности.

Сущность метода наименьших квадратов заключается в нахождении параметров модели (а0 , 1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

Однофакторные (парные) модели регрессии - student2.ru .

Для прямолинейной зависимости:

Однофакторные (парные) модели регрессии - student2.ru .

Рассматривая f в качестве функции а0 , и а1 и проводя математические преобразования (дифференцирование), получаем:

Однофакторные (парные) модели регрессии - student2.ru ;

Однофакторные (парные) модели регрессии - student2.ru .

Откуда система нормальных уравнений для нахождения параметров линейной полной регрессии имеет следующий вид:

Однофакторные (парные) модели регрессии - student2.ru .

Решение этой системы в общем виде дает следующие значения параметров:

Однофакторные (парные) модели регрессии - student2.ru

Однофакторные (парные) модели регрессии - student2.ru

Иногда их удобно исчислить по следующим формулам, дающим тот же результат:

Однофакторные (парные) модели регрессии - student2.ru где Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru

или

Однофакторные (парные) модели регрессии - student2.ru ; Однофакторные (парные) модели регрессии - student2.ru .

Определив значения а0 , и а1 и подставив их в уравнение Однофакторные (парные) модели регрессии - student2.ru , находим значения Однофакторные (парные) модели регрессии - student2.ru , зависящие только от заданного значения х.

Корреляционное уравнение по форме похоже на уравнение функциональной зависимости, но по существу отличается тем, что оно справедливо лишь для совокупности, а не для отдельных явлений и зависит от объема совокупности (чем она больше, тем параметры уравнения типичнее).

В уравнении прямой параметр Однофакторные (парные) модели регрессии - student2.ru экономического смысла не имеет. Параметр Однофакторные (парные) модели регрессии - student2.ru является коэффициентом регрессии и показывает изменение результативного признака при изменении факторного признака на единицу.

Широкое применение линейных уравнений объясняется в значительной мере тем, что зачастую значения признака х в изучаемой совокупности варьируют в весьма узких пределах. Если кривизна линии регрессии невелика, то в этих пределах отрезок кривой может быть достаточно точно описан уравнением прямой.

Кроме того, многие нелинейные функции (степенная, показательная, гипербола, парабола второго порядка) путем логарифмирования или замены переменных преобразуют в линейную форму.

Решения типовых задач

№1. Имеются выборочные данные по 15 коммерческим банкам региона:

№ п/п х у № п/п х у № п/п х у

Построить однофакторную регрессионную линейную модель.

Решение: Предположим, что между объемом собственных средств и привлеченных средств существует линейная корреляционная связь, которую можно выразить уравнением прямой вида Однофакторные (парные) модели регрессии - student2.ru .

Для определения параметров Однофакторные (парные) модели регрессии - student2.ru и Однофакторные (парные) модели регрессии - student2.ru методом наименьших квадратов воспользуемся формулами Однофакторные (парные) модели регрессии - student2.ru , Однофакторные (парные) модели регрессии - student2.ru .

Таблица 7.7

Расчетные значения, необходимые для исчисления Однофакторные (парные) модели регрессии - student2.ru , Однофакторные (парные) модели регрессии - student2.ru , Однофакторные (парные) модели регрессии - student2.ru , Однофакторные (парные) модели регрессии - student2.ru , Однофакторные (парные) модели регрессии - student2.ru

Исходные данные Расчетные значения
№ банка Объем собственных средств, млн. руб. Объем привлеченных средств, млн. руб. Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru
-32,6 -27,6 -19,6 -9,6 -6,6 -5,6 -4,6 1,4 4,4 9,4 9,4 12,4 17,4 24,4 27,4 -127 -93 -77 -73 -55 -29 1062,76 761,76 384,16 92,16 43,56 31,36 21,16 1,96 19,36 88,36 88,36 153,76 302,76 595,96 750,76
  Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru

Продолжение таблицы 7.7

Расчетные значения
Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru   Однофакторные (парные) модели регрессии - student2.ru   Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru
4140,2 2566,8 1509,2 700,8 363,0 162,4 179,4 18,2 52,8 573,4 479,4 508,4 1531,2 2220,4 3726,4 -32 -27 -5 -19 -7 -12 -13 0,23 0,29 0,07 0,30 0,22 0,03 0,14 0,03 0,04 0,09 0,05 0,05 0,05 0,05 0,06
18732,0 1,70

Однофакторные (парные) модели регрессии - student2.ru Однофакторные (парные) модели регрессии - student2.ru .

Пользуясь расчетными значениями (см. Табл. 7.7.), подсчитаем параметры для данного уравнения регрессии:

Однофакторные (парные) модели регрессии - student2.ru ,

Однофакторные (парные) модели регрессии - student2.ru .

Следовательно, регрессионная модель объема привлеченных средств по собственным средствам банков для данного примера может быть записана в виде следующего уравнения регрессии:

Однофакторные (парные) модели регрессии - student2.ru .

Это уравнение характеризует зависимость среднего объема привлеченных средств банков от собственных средств. Расчетные значения Однофакторные (парные) модели регрессии - student2.ru , найденные по данному уравнению, приведены в таблице 7.7, гр. 9.

Если параметры регрессионного уравнения подсчитаны верно, то должно соблюдаться равенство сумм теоретических и эмпирических значений объема привлеченных средств, Однофакторные (парные) модели регрессии - student2.ru , а сумма разностей между эмпирическими и теоретическими значениями объема привлеченных средств должна быть равна 0 Однофакторные (парные) модели регрессии - student2.ru (гр.10. табл. 7.7).

В нашем уравнении регрессии параметр Однофакторные (парные) модели регрессии - student2.ru показывает, что с увеличением объема собственных средств одного банка на 1 млн. руб. объем привлеченных средств возрастает в среднем на 4,26 млн. руб.

Если исследуемые признаки имеют разные единицы измерения, для оценки влияния факторного признака на результативный применяется коэффициент эластичности.

Коэффициент эластичности рассчитывается для каждой точки по формуле:

Однофакторные (парные) модели регрессии - student2.ru ,

где Однофакторные (парные) модели регрессии - student2.ru - первая производная уравнения регрессии.

Он показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на 1%.

Средний коэффициент эластичности определяется для уравнения прямой по формуле:

Однофакторные (парные) модели регрессии - student2.ru .

Если зависимость величин результативного признака у от значений факторного признака х имеет форму гиперболической зависимости, то есть характеризуется корреляционным уравнением Однофакторные (парные) модели регрессии - student2.ru , то для определения параметров Однофакторные (парные) модели регрессии - student2.ru и Однофакторные (парные) модели регрессии - student2.ru методом наименьших квадратов находим две частные производные от функции Однофакторные (парные) модели регрессии - student2.ru , по Однофакторные (парные) модели регрессии - student2.ru и Однофакторные (парные) модели регрессии - student2.ru , приравниваем их к нулю, получаем систему нормальных уравнений:

Однофакторные (парные) модели регрессии - student2.ru .

Производим замену переменных Однофакторные (парные) модели регрессии - student2.ru , получаем следующую систему нормальных уравнений:

Однофакторные (парные) модели регрессии - student2.ru .

Параметры уравнения гиперболы можно вычислить по формулам:

Однофакторные (парные) модели регрессии - student2.ru

Однофакторные (парные) модели регрессии - student2.ru

Гиперболическая форма корреляционной связи используется при изучении зависимости уровня себестоимости единицы продукции от объема выпуска продукции.

Если зависимость величин результативного признака у от значений факторного признака х характеризуется корреляционным уравнением параболы второй степени Однофакторные (парные) модели регрессии - student2.ru , то это параболическая зависимость.

И парабола, и прямая являются частным случаем полинома n-ой степени вида Однофакторные (парные) модели регрессии - student2.ru .

Систему уравнений для определения параметров Однофакторные (парные) модели регрессии - student2.ru можно найти, приравнивая нулю частные производные от Однофакторные (парные) модели регрессии - student2.ru по Однофакторные (парные) модели регрессии - student2.ru . Решив систему, определяем параметры корреляционного уравнения.

Наши рекомендации