Система нормальних рівнянь. Дослідження та розв’язок задачі (2.4).
Для розв’язання задачі (2.4) обчислимо частинні похідні по b0, b1 функції S = S(b0, b1). Маємо
¶ S / ¶b0 = - 2 yi – b0 – b1 xi),
¶ S / ¶b1 = - 2 (yi – b0 – b1 xi).
Прирівнюючи знайдені похідні нулю і виконуючи належні спрощення (рекомендується виконати їх самостійно), приходимо до системи двох рівнянь, в якій, підкреслимо, невідомими є параметри b0, b1:
b0 n + b1 S xi = S yi,
b0 Sxi + b1 S xi2 = S xi yi, (2.5)
де для спрощення запису індекси підсумовування опущено. Ця система носить назву системи нормальних рівнянь або нормальної системи. В одному з наступних розділів буде доведено, що розв’язок нормальної системи і справді є розв’язком задачі (2.4).
Розглянемо спочатку випадок існування та єдиності розв’язку системи (2.5). Тобто ми поки що вважаємо визначник даної системи відмінним від 0. Позначимо шуканий розв’язок (b0, b1); відносно b1 маємо (переконайтесь у цьому):
, (2.6)
де підсумовування ведеться по i від 1 до n. Розв’язок нормальної системи відносно b0 має такий вигляд:
b0 = , (2.7)
де та – відповідні середні арифметичні значення:
= (y1+…+ yn)/n , = (x1+…+ xn)/n.
2.3.1. Зауваження. Оцінка b1 параметра b1 може бути записаною також іншим чином:
. (2.8)
Дійсно, це твердження випливає з наступних рівностей
S(xi – )( yi – ) = Sxi yi – S yi – S xi + n = Sxi yi – n =
= Sxi yi – (S xi)(S yi)/ n.
Зручно ввести позначення:
Sx y = S(xi – )( yi – ), Sx x = S(xi – )2, Sy y = S( yi – )2.
Тоді маємо легкий для запам’ятовування вираз оцінки b 1:
b1 = Sx y / Sx x . (2.9)
Вище була введена функція
= = b0 + b1x (2.10)
Величина = є оцінкою функції регресії g(x) з рівності (2.2). Іноді зручніше використовувати дещо інший вираз для :
= + b1(x – ). (2.11)
Ця рівність одержується з (2.10) підстановкою замість b0 його виразу (2.7).
З рівності (2.11) одразу бачимо, що пряма лінія, яка зображує у декартовій площині залежність = , проходить через точку декартової площини з координатами ( , ).
Припустимо тепер, що визначник D системи (2.5) дорівнює 0. З’ясуємо, за яких умов це трапляється. Маємо
D = n S xi2 –(S xi)2.
Оскільки (S xi)2 = (S 1×xi)2, то за нерівністю Коші – Буняковського буде (S xi)2 S 12 × S xi2 = n S xi2, отже завжди
D ³ 0 (2.12)
Скористаємось відомою умовою наявності рівності в нерівності Коші – Буняковського. Бачимо, що коли ввести n-вимірні вектори 1= (1,…,1) і x = ( x1,…, xn), то рівність в (2.12) буде мати місце тоді і тільки тоді, коли вектори 1 і x будуть лінійно залежними. Це означає, що знайдуться такі сталі с1, с2, що одночасно не дорівнюють 0 і для яких виконується рівність
с1 ×1 + с2 × x = 0, (2.13)
де права частина – це нульовий вектор (0,…,0). При цьому випадок с2 = 0, очевидно, не може мати місця (бо інакше, оскільки тоді с1 0, буде 1 = 0). Тому з (2.13) випливає, що x = (с,…,с), де с – деяка стала. Це означає, що всі спостереження робляться в одній точці: x1 = … = xn = с. За вказаною умовою система (2.5) зводиться, фактично, до одного-єдиного рівняння
b0 n + b1nс = S yi, (2.14)
яке має безліч дійсних розв’язків.
2.3.2. Висновок. З розглянутого вище бачимо, зокрема, що нормальна система рівнянь (2.5) завжди сумісна, незалежно від того, дорівнює її детермінант 0 чи не дорівнює. В останньому випадку маємо єдиний розв’язок, що дається рівностями (2.6) ((2.8)) і (2.7). Перший випадок може трапитись тільки тоді, коли всі спостереження проводяться лише при одному значенні x. У цьому випадку вказана система має безліч розв’язків, кожен з яких може бути знайдений з рівняння (2.14).
РОЗДІЛ 3