Побудова регресійних моделей.
Це стосується побудови лінійної регресійної моделі з одним аргументом, тобто y(x1), в першій задачі, нелінійної регресії – в другій та лінійної регресійної моделі y(x1,x2) - в третій задачі. Розглянемо методику отримання цих моделей.
Математична лінійна регресійна модель y(x) має вигляд:
y(x) = bo + b1·x, (1)
де bo - вільний член, b1 - коефіцієнт впливу x на y. В завданні, що пропонується студенту, необхідно чисельно визначити значення bo та b1.
На площині yx наносяться точки i ( ), де N - число виборок, які відповідають значенням yi та xi. На отриманому полі, що називається кореляційним, проводиться пряма лінія y(x) таким чином, щоб відхилення yi від цієї лінії відповідали умові:
U = [yi - y(xi)]2 = min, (2)
де y(xi) - значення y (теоретичні), отримані з допомогою (1) при підстановці в цю формулу x = xi.
Особливо відмітимо, що пряма y(x) зовсім необов'язково повинна проходити через будь-яку експериментальну точку yi, але сума квадратів відхилень yi від y(xi) при цьому має бути мінімальною. Якщо вираз у формулі (2) поділити на N, то ми отримаємо більш зрозумілу умову:
U' = [yi - y(xi)]2 = min (3)
у вигляді вимоги забезпечення мінімуму дисперсії відхилень yi відносно лінійної математичної регресійної моделі y(x). Тому цей метод пошуку оптимального розташування y(x) на регресійному полі має назву "метод мінімізації середнього квадрату" або "метод мінімізації дисперсії відхилень".
Щоб забезпечити умову (2), необхідно взяти похідну від U по параметрам a та b, прирівняти її нулю; тоді отримані значення a та b відповідатимуть умові (2) або (3).
Отже:
U = [yi - (bo + b1·x)]2;
звідси отримаємо наступні рівняння, що підлягають нормальному розв'язку:
(4)
Розв'язок цієї системи відносно bо та b1 здійснюється за допомогою правил Крамера чи Дулітла, в результаті чого отримаємо наступні формули:
(5)
Якщо помножити вираз у формулі (5) для b1 на (-1) та поділити чисельник і знаменник на N, то можна отримати іншу форму запису цієї формули, більш зручну для користування.
(6)
Після закінчення розрахунків bо та b1 проводиться перевірка гіпотези про лінійність зв'язку між y та x за допомогою коефіцієнта лінійної кореляції R (як оцінити отриману модель на адекватність статистичним даним покажемо на прикладі двофакторної лінійної регресії):
(7)
Чим ближче значення /R/ до одиниці, тим вірогідніша лінійність y(x). При цьому знак R визначається знаком коефіцієнта b1 (якщо b1>0, то і R > 0 і навпаки). Вважається, що лінійна модель якнайкраще описує досліджуваний процес, якщо /R/≥ 0,7.
Зведення нелінійної регресії до лінійної. Наприклад, вигляд розташування точок на кореляційному полі нагадує форму деяких нелінійних функцій:
а) гіперболічна функція
Необхідні перетворення: вводимо заміну і отримуємо лінійну форму гіперболічної функції ;
б) експоненційна функція
Аналогічно: .
Подібні перетворення інших функцій зводяться в таблицю, наведену у завданні для самостійних робіт на побудову нелінійних регресій. Отримавши лінійну форму і застосувавши до неї метод найменших квадратів і табличний перехід до нелінійних параметрів регресії, матимемо нелінійну регресію.
Математична модель, що є лінійною моделлю з двома змінними (факторами) y(x1;x2), має вигляд:
y = bo + b1·x1 + b2·x2. (8)
Зробивши висновки, аналогічні для моделі y(x), можна отримати систему рівнянь відносно невідомих коефіцієнтів bo, b1, b2 у вигляді:
(x'1i)2 b1 + (x'1ix'2i)b2 = (x'1iy'i)
(x'2ix'1i)b1 + (x'2i)2 b2 = (x'2iy'i) (9)
де:
x'1iy'i = (x1iyi) – N (10)
(x'1i)2 = (x1i)2 – N( )2 (11)
x'2iy'i = (x2iyi) – N (12)
x'1ix'2i = (x1ix2i) –N (13)
(x'2i)2 = (x2i)2 – N ( )2 (14)
Після того, як величини, що входять в формули (10) - (14) розраховані, розв'язується система рівнянь (9) відносно bo, b1, b2 за допомогою правила Крамера.
Коефіцієнт b1 в моделі y = bo + b1x1 носить назву "повний коефіцієнт регресії", який відображає вплив x1 на y без урахування впливу x2 на y (цей вплив враховується певним чином в значенні b1).
Напроти, коефіцієнт b1 в моделі y = bo + b1·x1 + b2·x2 носить назву "частинний коефіцієнт регресії" (іноді - "чистий коефіцієнт регресії"), який відображає тільки вплив x1 на y, виключаючи повністю вплив x2 на y. Те ж саме стосується коефіцієнта b2. Тому потрібно пам'ятати, що врахування найбільшої (в розумних межах) кількості змінних поліпшує точність оцінки впливу кожної з розглянутих змінних.
Аналіз отриманих моделей.
Для оцінки моделей з багатьма змінними, а також з однією змінною, застосовуються наступні показники варіації:
1) Загальна дисперсія:
(15)
2) Факторна дисперсія, що відображує вплив тільки тих змінних, які розглядаються:
(16)
3) Залишкова дисперсія (дисперсія помилок моделі):
(17)
або в більш спрощеному вигляді
(18)
Відношення
(19)
називається коефіцієнтом детермінації (у випадку лінійної множинної регресії) або індексом детермінації (у випадку нелінійної множинної регресії). Фізично він характеризує частку впливу вибраних змінних хj в загальній варіації у.
(20)
де R – коефіцієнт множинної кореляції (або індекс кореляції для нелінійної регресії). Значення цього коефіцієнта, розрахованого за даною формулою (21), співпадає зі значенням R, розрахованим за формулою (9) для лінійної парної регресії. З урахуванням того, що , маємо ще одну розрахункову формулу:
(21)
тобто коефіцієнт кореляції розраховується по дисперсії помилок моделі і по загальній дисперсії . Розглянемо даний матеріал на конкретному прикладі.
Приклад. Визначити регресійну модель впливу капіталовкладень в розвиток виробництва (х1), розміру основного капіталу (х2) ті чисельності працюючих (х3) на прибуток, який отримає підприємство після року своєї діяльності, (у). Експериментальні дані отримані в результаті огляду семи аналогічних підприємств і занесені в таблицю (N=7).
У(тис.у.о.) | |||||||
Х1(тис.у.о.) | |||||||
Х2(тис.у.о.) | |||||||
Х3(тис.у.о.) |
Проведемо послідовний аналіз впливу:
1) капіталовкладень х1 на прибуток у (перша модель); 2) капіталовкладень х1 і основних фондів х2 на прибуток у (друга модель); 3) всіх трьох змінних х1, х2 і х3 на у (третя модель); і прослідкуємо як при цьому змінюються параметри моделі (чисті коефіцієнти регресії) і показники точності отриманих моделей. Розрахунок виконаний ПЕОМ із застосуванням програми “MATНCAD-2”. Приведемо деякі розраховані дані:
Для І моделі: маємо:
тоді
Для розрахунків дисперсій визначимо за отриманою моделлю значення і для порівняння з експериментальними даними занесемо їх в таблицю:
уі | |||||||
586,63 | 796,57 | 838,563 | 628,62 | 736,575 | 964,526 |
Застосовуючи формули (16), (17), (19) і (20), визначимо:
В дужках розраховані значення середньо квадратичних відхилень:
Для ІІ моделі: маємо:
; тоді
Представимо аналогічну таблицю:
уі | |||||||
589,874 | 753,461 | 825,904 | 645,904 | 821,079 | 950,258 |
і відповідні оцінки дисперсій та середньо квадратичних відхилень:
Оскільки s (ІІ) < s (І), а R(ІІ) > R(І), то можна зробити висновок, що ІІ модель більш точно описує модель в загальному вигляді.
Для ІІІ моделі: маємо:
; тоді
Таблиця матиме вигляд:
уі | |||||||
588,965 | 761,953 | 824,986 | 649,087 | 813,515 | 936,371 |
Відповідні значення :
Оскільки s (ІІІ) < s (ІІ), а R(ІІІ) > R(ІІ), значить дана модель більш точно описує взаємозв’язки в даному об’єкті. Те, що а3 < 0, означає неефективне використання чисельності працівників, або безпідставно збільшена заробітна плата (в межах тих даних, на яких базується даний аналіз).
Загальна теорія систем.
Будь-яка система управління (як технічна, так і організаційна) базується на двох основних принципах управління:
- управління по збуренню;
- управління по відхиленню.
Можлива побудова системи з використанням обох принципів одночасно, - така система є комбінованою. Кожен об'єкт управління має: змінну, якою управляють (φ); змінну, яка управляє (μ); збурення (λ).
Система управління по збуренню.Структурна схема системи, що реалізує принцип управління по збуренню має наступний вигляд:
Рис.1. Структурна схема системи управління по збуренню λ.
На рис.1 зображено: OY – об'єкт управління, що має вихідну змінну φ (наприклад, власний обсяг продажу), та дві вхідні змінні: μ – змінна, яка управляє (наприклад, ціна продажу), і λ – збурення, що впливє на φ, але не залежить від μ (наприклад, обсяг продажу конкурентів); Кр – регулятор (наприклад, регулятор ціноутворення), який змінює μ залежно від відхилення (ε) між завданням на продаж ψ та інформацією (λn) про збурення λ, що має місце на поточний час; компаратор ε = (ψ – λn), який порівнює ψ з λn та впливає на рішення про змінення змінної, яка керує (μ).
Коефіцієнти, що знаходяться в квадратах-блоках системи, означають відповідно:
Кλ – коефіцієнт впливу λ на λn, тобто λn = Кλ λ (якщо інформація про λ
надходить без перекручень, то Кλ = 1);
Кр – коефіцієнт впливу ε на μ, тобто μ= Кр ε = Кр(ψ – λn);
К1 та К2 – відповідно коефіцієнти впливу μ та λ на φ, тобто φ= К1μ + К2λ. По суті, φ = К1μ+ К2λ представляє собою лінійну математичну модель системи (наприклад, системи збуту автомобілів, якщо вважати К1 = – а та К2= – b).
Враховуючи сказане вище, можна визначити залежність φ від ψ та λ таким чином:
φ= К1μ+ К2λ = К1Кр(ψ – λn) + К2λ = К1Кр(ψ – Кλ·λ) + К2λ =
= К1Крψ – К1КрКλ·λ + К2λ
Накінець матимемо:
ψ= К1Крψ – (К1КрКλ – К2)λ (22)
Щоб забезпечити незалежність φ від λ, необхідне виконання умови К1КрКλ – К2 = 0, тобто КрКλ = К2 / К1. Якщо прийняти Кλ = 1 (інформація надходить без перекручень), то матимемо:
Кр =К1 / К2, (2) (23)
тобто необхідну величину коефіцієнта Кр, що забезпечить незалежність φ від λ.
Таким чином, маючи модель системи збуту автомобілів, як вказано в одному з варіантів завдання, можна визначити необхідне значення коефіцієнта ціноутворення Кр, який забезпечує незалежність власного обсягу продажу від обсягу продажу конкурентів шляхом відповідної зміни вартості продажу. Студенту залишається тільки правильно визначити, чи відповідає його варіант завдання розглянутому типу системи.
Система управління по відхиленню.На відміну від попереднього типу систем управління, системи цього типу мають безпосередній зв'язок змінної, якою управляють (φ), з компаратором системи (так званий зворотній зв'язок виходу зі входом). Структурна схема систем цього типу представлена на рис.2.
Рис.2. Структурна схема системи управління по відхиленню ε.
Позначення елементів системи прийняти ті ж, що і в попередній системі. Згідно з рис.2 зміна значення змінної μ, яка керує значенням φ, здійснюється з урахуванням відхилення ε= ψ – φn. Завдяки зв'язку між φn та φ, через коефіцієнт впливу Коз, система діє таким чином, щоб величина відхилення ε була мінімальною навіть тоді, коли має місце значне збурення λ. Відмітимо, що в першому завданні цієї самостійної роботи є як системи управління по збуренню, так і системи управління по відхиленню. Якщо запропонована система збуту автомобілів відноситься до систем цього типу (тобто керує ціною збуту згідно з коливаннями обсягу власного продажу), то в такому випадку розв'язок даної задачі необхідно проводити за допомогою формул, що приводяться нижче.
Математична модель об'єкту залишається в тому ж вигляді: φ = К1μ + К2λ, але з урахуванням ε= ψ – φn; φn = Коз·φ; μ= Кр·ε, будемо мати:
φ = (24)
що визначає залежність коливань φ від коливань завдання ψ та коливань збурення λ (для задачі, що пропонується в завданні, це залежність коливань обсягу продажу (Vn) від коливань завдання на продаж (ψ) та коливань обсягу продажу конкурентів (Vк). Всі ці змінні вимірюються у відсотках відхилення від сталого значення.
За допомогою формули (24) можна розрахувати коливання Vn (у відсотках) при заданих розмірах коливань Vk (у відсотках) та заданому значенні коефіцієнта регулятора ціноутворення при незмінності завдання (коли ψ = 0).
Неважко продемонструвати, що коливання ціни продажу (μ) визначається за формулою:
μ = (25)
При ψ = 0 можна визначити μ при заданих λ та Кр. У випадку, коли необхідно визначити коливання відхилення ε (у нашому випадку – це складські залишки непроданих автомобілів), розрахунки слід проводити за формулою:
ε = φ – φп = ψ - Козφ = (26)
Додамо наприкінці, що потрібно прийняти Коз = 1, якщо інформація про обсяги власного продажу надходить у систему без перекручень.