Уравнение регрессий и ломаная (эмпирическая регрессия). Ошибка уравнения регрессии. Значимость уравнения регрессии.
В отличие от односторонних связей зависимость между переменными Х и У бывает и двусторонней, т.е. такой, когда величина одного признака изменяется в зависимости от величины другого признака и наоборот. Например, изменение себестоимости продукции от производительности труда.
Динамика взаимной зависимости между переменными величинами получила название регрессия, а методика исследования регрессии носит название регрессионного анализа.
С первого взгляда кажется, что между динамикой рядов развития и рядов регрессии никакой разницы нет. Но это не так. Ряды развития выражают процесс, а регрессия по сути дела отражает лишь динамику связи, существующей между признаками Х и У, и прямого отношения к развитию признаков во времени или в зависимости от других причин не имеет. Поэтому и в методике обработки рядов развития и рядов регрессии существуют различия.
Математически регрессия выражается следующими тремя способами:
1) построением эмпирических рядов и графиков регрессии, которых всегда два: регрессия по У и по Х;
2) уравнениями, позволяющими по эмпирическим данным построить теоретическую, т.е. выровненную, линию регрессии;
3) коэффициентами, дающими суммарную характеристику двусторонней связи. Графически эмпирические регрессии изображаются обычно в виде ломаных линий.
На рис. 7.3 изображена эмпирическая и вычисленная линия регрессии У и Х.
Ряды регрессии выражаются не только графически, но и аналитически при помощи следующих уравнений
уравнение регрессии У по Х; (7.7)
уравнение регрессии Х по У; (7.8)
Здесь и - теоретические, т.е. вычисленные по эмпирическим данным, значения регрессии У/Х и Х/У; У и Х – средние арифметические рядов распределения ; R – коэффициент регрессии, который определяется по следующим аналогичным формулам:
- коэффициент регрессии У/Х (7.9)
- коэффициент регрессии Х/У, (7.10)
где ах= , а ау= .
Когда в расчет берутся не отклонения вариант от средних арифметических, а конкретные значения переменных величин У и Х, коэффициенты регрессии определяются по следующим формулам
(7.11)
(7.12)
В отличие от уравнений регрессии, характеризующих динамику связи между переменными Х и У, коэффициент регрессии дает лишь суммарную характеристику этой связи; он показывает насколько в среднем изменяется величина одного признака при изменении на какую-то величину другого признака. Поскольку регрессия выражается двусторонне, то и коэффициентов регрессии два: и . Коэффициент регрессии – ценный показатель, суммарной оценки связи между переменными величинами Х и У, рассматриваемыми в их динамике, в процессе развития признаков. Он дает основу точному количественному прогнозу при исследовании зависимых явлений.
Когда известны средние квадратические отклонения варьирующих признаков, т.е. σх и σу, а также вычислен коэффициент корреляции, коэффициенты регрессии определяются по формулам:
(7.13)
(7.14)
Коэффициент регрессии сопровождается средней квадратической ошибкой, которая вычисляется по следующим формулам:
(7.15)
(7.16)
Критерий достоверности коэффициента регрессии рассчитывается по следующей формуле
(7.17)
Если расчетное значение критерия достоверности окажется больше табличного значения при принятых уровнях значимости и числе степеней свободы, то сомневаться в достоверности коэффициента регрессии не приходится.