Обчислення та аналіз регресії. Наступним етапом дослідження є аналіз регресії
Наступним етапом дослідження є аналіз регресії. Аналіз регресії є складовою кореляційного аналізу в широкому розумінні.
У моделях множинної кореляції залежна змінна У розглядається як функція кількох незалежних змінних Х.
Припущення про існування лінійного рівняння множинної регресії може бути представлене у такому вигляді:
= +
Параметри наведеного рівняння знаходять, розв’язавши систему нормальних рівнянь:
Множинне кореляційне рівняння встановлює зв′язок між досліджуваними ознаками і дає змогу вирахувати очікувані значення результативної ознаки під дією включених в аналіз ознак - факторів, пов′язаних із даним рівнянням.У вузькому розумінні рішення кореляційних моделей охоплює операції по знаходженню числових значень параметрів досліджуваних залежностей.
При вивченні множинного кореляційного аналізу результативної ознаки із двома факторними аналітичне рівняння регресії має вигляд:
+
Параметри розраховують, розв′язуючи систему нормальних рівнянь:
Обчислення регресії з допомогою програми MS Excel « Регрессия ».
Таблиця 3. ВЫВОД ИТОГОВ | |
Регрессионная статистика | |
Множественный R | 0, 931140945 |
R-квадрат | 0,867023459 |
Нормированный R-квадрат | 0,854934683 |
Стандартная ошибка | 2,022646342 |
Наблюдения |
Множинний коефіцієнт кореляції відображує тісноту зв’язку між результативною ознакою і всіма факторами що вивчаються, оскільки він прямує до «0» (R=0, 931140945), отже зв'язок сильний.
Коефіцієнт детермінації (R2) показує, що варіація результативної ознаки У на 86,70% обумовлена впливом двох факторів Х1 і Х2. Решта варіації – 13,30% - це вплив випадкових не врахованих факторів.
Таблиця 4. Дисперсионный анализ | ||||||
df | SS | MS | F | Значимость F | ||
Регрессия | 586,8382 | 293,4191 | 71,7214 | 2,29893E-10 | ||
Остаток | 90,0041 | 4,0911 | ||||
Итого | 676,8424 | |||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |||||||
Y-пересечение | 19,75945397 | 5,389017997 | 3,666614953 | 0,001355157 | 0,001715342 | 30,9355932 | 8,583314732 | 30,9355932 | ||||||
Переменная X 1 | 0,220455594 | 0,041863777 | 5,266022495 | 2,77315E-05 | 0,133635434 | 0,307275754 | 0,133635434 | 0,307275754 | ||||||
Переменная X 2 | -6,400414083 | 1,793396124 | -3,568879176 | 0,001715342 | -10,11968999 | -2,681138178 | -10,11968999 | -2,681138178 | ||||||
Таблиця 5. ВЫВОД ОСТАТКА | ||||||||||||||
Наблюдение | Предсказанное Y | Остатки | ||||||||||||
30,86036131 | 1,139638691 | |||||||||||||
18,20186109 | 0,198138914 | |||||||||||||
31,91996051 | -1,919960511 | |||||||||||||
26,21653022 | -2,016530222 | |||||||||||||
28,45664713 | 2,643352871 | |||||||||||||
16,87912752 | -0,179127523 | |||||||||||||
28,79799321 | -2,597993207 | |||||||||||||
22,39766319 | -2,097663188 | |||||||||||||
27,26903965 | -2,169039646 | |||||||||||||
19,19036637 | -0,39036637 | |||||||||||||
26,22364802 | -0,52364802 | |||||||||||||
19,94418046 | -0,344180463 | |||||||||||||
22,93808344 | 2,761916557 | |||||||||||||
20,14331068 | -0,843310684 | |||||||||||||
16,41686294 | 1,183137059 | |||||||||||||
28,63445198 | 4,165548023 | |||||||||||||
24,60221913 | -0,602219126 | |||||||||||||
22,07764248 | -1,677642484 | |||||||||||||
31,98396465 | 1,116035348 | |||||||||||||
19,78061121 | 1,119388788 | |||||||||||||
28,02285374 | -1,62285374 | |||||||||||||
31,08790668 | -2,58790668 | |||||||||||||
28,57047586 | 3,329524143 | |||||||||||||
26,52943313 | 2,070566872 | |||||||||||||
19,1548054 | -0,1548054 | |||||||||||||
Сума залишків дорівнює нулю, а це свідчить про відсутність залежності залишків від значень факторів (сталість дисперсії).
Система показників таблиці «Вывод итогов» дає всебічну характеристику регресії. Крім того, в цій таблиці показані оцінки статистичної суттєвості кореляційних характеристик та оцінки характеристик гіпотетичної генеральної сукупності.
Як видно з табл.4, в нашому прикладі залежність урожайності описується рівнянням: Y=19,7595+0,2205X1-6,4004X2
З цього випливає, що збільшення якості грунту на 1 бал обумовлює зростання урожайності на 0,2205 ц/га, а збільшення затрат праці на 1 ц зернових на 1 люд.-год. обумовлює зниження урожайності на 6,4004 ц/га.
Варіація урожайності на 86,7% обумовлена впливом досліджуваних факторів, про що свідчить множинний коефіцієнт детермінації (R-квадрат=0,867023459).