Методологічні аспекти структурної ідентифікації моделей систем.
Синтезу задовільної структури моделей систем в межах стохастичного підходу присвячені чисельні публікації. Розроблені різні методи стосовно класу поліноміальних моделей, серед яких слід виділити метод повного перебору усіх можливих структур поліноміальних моделей відомого степеня, методи послідовного виключення параметрів з поліноміальної моделі, послідовного “нарощування” структури поліноміальної моделі (метод включення) і т.д. В межах прийнятої в регресійному аналізі моделі випадкової, нормально розподіленої похибки, ці методи базуються на статистичних критеріях Стьюдента, Пірсона, чи Фішера. Порушення гіпотези про “нормальність” автоматично руйнує теоретичні обґрунтування використання вказаних критеріїв. Більш ефективними у цьому плані є алгоритми методу групового урахування аргументів. Однак, для оцінки “якості” побудованої моделі, в цих методах також використовуються статистичні оцінки.
За умов обмежених по амплітуді похибок експериментальних даних з невідомими законами розподілу застосування стохастичного підходу для задач структурної ідентифікації стає неможливим. В цих умовах найбільш придатними є методи аналізу інтервальних даних.
При розв’язувані задачі структурної ідентифікації статичного системи необхідно знайти загальний вигляд функції
(4.1)
яка буде адекватною моделлю об’єкта, де – істинне невідоме значення виходу системи; – вектор вхідних змінних; – задає початкову фіксовану кількість вхідних змінних, яку необхідно встановити на основі результатів експерименту.
Для ідентифікації залежності використовують результати експерименту, як і раніше представлені у вигляді початково заданої матриці значень вхідних змінних і відповідних інтервальних значень вихідної змінної (7.11).
У матриці можливе повторення стрічок, що означатиме повторення спостережень при одних і тих же вхідних змінних. При цьому отримуватимемо вибірку інтервальних оцінок вихідної змінної . Припустимо, що ця вибірка є випадковою, але також включає обмежену не випадкову похибку спостережень. Тобто розглядаємо модель змішаної інтервальної похибки , коли результати спостережень за вихідною змінною задаються у такому вигляді
, (4.3)
де – невипадкова обмежена похибка з відомим діапазоном можливих значень ; – випадкова похибка, що має симетричний (у загальному випадку невідомий) розподіл на відомому інтервалі .
Наведена вище задача ідентифікації залежності , є достатньо складною і в загальному випадку для отримання її розв’язку необхідно розглянути додаткові умови на клас функцій . Переважно залежність шукають серед лінійно-параметричних рівнянь у такому загальному вигляді:
, (4.4)
де – вектор невідомих базисних функцій, відомого класу (наприклад, поліноміальні функції). Розмірність цих векторів на початку процедури ідентифікації є заданою.
З врахуванням вище викладеного та співвідношень (7.11), (4.1), (4.4), задача структурної ідентифікації моделі “вхід-вихід” на основі інтервальних даних (7.11) зводиться до знаходження такої множини залежностей (4.4), які забезпечують умови сумісності інтервальної системи лінійних (відносно параметрів) алгебраїчних рівнянь (7.12).
Очевидно, що умови сумісності системи (7.12) можна забезпечити шляхом ускладнення структури моделі (збільшення кількості параметрів, входів, ступеня полінома).
При синтезі структури інтервальної моделі системи, важливим питанням є вибір критеріїв оптимальності. Розглянемо це питання детальніше.
З цією метою повернемося до системи нерівностей (7.12) і вважатимемо, що функція , яка задає структуру моделі шукається у класі поліномів. Відомо, що на скінченому наборі вузлів , нарощуючи степінь полінома, завжди можна знайти таку поліноміальну модель, яка задовольняє заданим інтервальним даним.
Нехай знайдена поліноміальна модель залежить від змінних , степені і включає параметрів . Однак вона може виявитися надто складною для аналізу і прогнозування. Внаслідок цього виникає необхідність знаходження поліноміальної моделі максимально простої структури. У випадку наявності групи моделей із структурою однакової складності, перевагу надаватимемо тій моделі, яка забезпечує найменшу похибку прогнозування , задану, наприклад, - та - критеріями оптимальності планів інтервального експерименту. Залежно від особливостей використання моделі, в поняття “простоти” (складності) структури моделі може вкладатися різний зміст. Найбільш типовими ситуаціями у даному випадку є виконання однієї із таких вимог: мінімізація степені полінома ; мінімізація кількості вхідних змінних моделі ; мінімізація кількості параметрів поліноміальної моделі , за умови забезпечення сумісності інтервальної системи лінійних алгебраїчних рівнянь (7.12)
Отже, для задач синтезу оптимальної структури, залежно від призначення та особливостей застосування інтервальної моделі статичної системи, заданої поліномом, необхідно використовувати одну чи декілька пар критеріїв: мінімізації степені полінома і похибки прогнозування; мінімізації кількості вхідних змінних моделі і похибки прогнозування; мінімізації кількості параметрів поліноміальної моделі і похибки прогнозування. При цьому необхідним є забезпечення сумісності системи (7.12).
У випадку поетапного зважування структур інтервальних моделей по критеріях вибраної пари, очевидно, пріоритетнішими будуть критерії, що мінімізують складність структури, оскільки критерій мінімуму похибки прогнозування інтервальної моделі вимагає значних обчислювальних витрат і на першому етапі, пов’язаному з оцінюванням великої кількості претендентів, його застосування є недоцільним.
Для знаходження оптимальної структури моделі можуть бути використані методи повного перебору можливих структур, послідовного включення і виключення параметрів поліноміальної моделі. Однак, у даному випадку вони будуються на аналізі властивостей системи інтервальних рівнянь.
Суть методу повного перебору в нашому випадку полягає в тому, що складаються всі можливі поліноми, обмежені заданим числом вхідних змінних і степеню .
Кожний із можливих поліномів підставляємо в систему (7.12). Виділяємо ті поліноми, які задовольняють усі нерівності системи і, отже, задані умови точності. Серед них формуємо групу поліномів найпростішої, у розумінні вибраного критерію складності структури. На другому етапі, серед поліноміальних моделей найпростішої структури вибираємо модель з найменшою похибкою прогнозування.
Очевидно, що із зростанням і , на етапі вибору поліномів найпростішої структури, кількість можливих комбінацій суттєво зростає. Внаслідок цього, реалізацію методу повного перебору на практиці можна застосовувати тільки у окремих простих випадках, наприклад, коли вхідні змінні мають фізичний зміст і їхня кількість є достатньо малою.
Зауважимо, якщо вдалося знайти поліном, що наближує дані з необхідною точністю, то додавання до нього довільних членів втрачає зміст, оскільки найкращою є модель, що на множині усіх адекватних моделей є найпростішою. Внаслідок цього, економнішими виявляються методи, побудовані на послідовному включенні або виключенні параметрів поліноміальних моделей.
У методі послідовного виключення вважаємо, що вихідна поліноміальна модель , яка задовольняє інтервальним даним, є задана. Структуру вихідної моделі можна встановити на основі попереднього аналізу даних чи виходячи із фізичних міркувань. Потім досліджуємо можливості спрощення цієї моделі, тобто виключення з неї окремих параметрів, спираючись на обраний критерій складності структури. Для виключення “сліпого” перебору необхідна цілеспрямована перевірка гіпотез відносно групи або окремих параметрів. При спрощенні початкової структури моделі досліджуємо можливість обнуління її окремих параметрів. Це пов’язано з перевіркою гіпотез інтервального аналізу у такому вигляді:
(4.6)
де - заданий підвектор вектора .
В межах інтервального підходу перевірка гіпотез (4.6) спрощується, а саме: гіпотеза приймається, якщо при обнулінні відповідних параметрів моделі, система інтервальних рівнянь (7.12) залишається сумісною.
Пояснимо головну ідею відбору претендентів на обнуління, на прикладі моделі, яка містить два параметри , : .
На рис. 7.5 наведено можливі варіанти розміщення множини розв’язків системи (7.12) при її сумісності у площині .
Аналізуючи рисунки, не важко виявити, що у випадку а) знаки параметрів є додатними , а у випадку б) вони від’ємні, тобто . Це означає, що гіпотеза рівності нулю принаймні одного параметра, виключається. В інших випадках можливе прийняття нульових гіпотез: - випадок в); - випадок г); або - випадок д); і - випадок ).
Розглянутий приклад дозволяє сформулювати два правила, які є справедливими для спільного m - вимірного випадку:
- якщо множина не перетинає межі октантів простору , то жоден параметр не може бути обнуленим;
- якщо множина включає нульову точку (випадок ), то приймається гіпотеза , тобто всі параметри можуть бути замінені на нулі.
а) б) в)
г) д) е)
Рис.7.5. Варіанти розміщення множини розв’язків .
В багатовимірному випадку таке наочне зображення, як на рис. 7.5, множини є неможливим, що вимагає заміни її локалізаційною множиною. Найбільш придатною в даному випадку є інтервальна локалізація множини розв’язків , тобто описаним m- вимірнимпрямокутним паралелепіпедом . У багатовимірному випадку прямокутний паралелепіпед можна задати через межі окремих параметрів , тобто інтервальним вектором з елементами
,
де .
У цьому випадку наближеною оцінкою точності інтервальних моделей може бути об’єм локалізаційного паралелепіпеда
= .
Із вище сформульованих правил витікає, що інтервальну модель системи не можна спростити, якщо межі усіх параметрів мають однакові знаки, а параметр можна обнулити, якщо його межі мають різні знаки.
На основі цього правила можливе застосування методу послідовного виключення, коли відповідно до обраного критерію спрощення структури: мінімізації степені, кількості вхідних змінних чи кількості параметрів поліноміальної моделі, з початкової моделі виключаються параметри, межі яких мають різні знаки. При цьому, якщо відразу декілька параметрів є претендентами на обнуління, недоцільно прирівнювати їх до нуля одночасно, оскільки можлива ситуація несумісності системи інтервальних рівнянь, а після обнуління параметра необхідно заново провести аналіз інтервальних даних і встановити межі решти параметрів.
У методі послідовного включення нарощуємо поліноміальну модель, послідовно переходячи від найпростіших до складніших структур. При додаванні нових параметрів моделі, як і у методі послідовного виключення, користуємося обраним критерієм спрощення структури. Процес зупиняємо як тільки побудована модель задовольняє системі інтервальних рівнянь (4.5) і при цьому усі її параметри є значущими.
Для зменшення кількості ітерацій процесу, найпростішу структуру слід вибирати виходячи із особливостей розподіленого об’єкта, для якого будується інтервальна модель.
Слід відмітити важливу особливість методів послідовного включення та виключення параметрів при синтезі найпростішої структури інтервальної моделі, а саме: найпростіша структура моделі не залежить від обраного методу локалізації і може бути встановлена на основі застосування найпростішого і найменш витратного з обчислювальної точки зору методу інтервальної локалізації параметрів моделі.
Використання вказаної особливості доцільно на другому етапі вибору оптимальної структури інтервальних моделей. Оскільки похибка прогнозування інтервальної моделі визначається розмірами множини локалізації параметрів, то серед сформованої на першому етапі групи поліноміальних моделей найпростішої структури вибираємо інтервальні моделі, отримані на основі локалізаційної множини у вигляді m- вимірногопрямокутного паралелепіпеда з мінімальним об’ємом V( ). Такий підхід дозволить уникнути складних процедур розрахунку значень - та - критеріїв, що задають оцінки похибки прогнозування інтервальної моделі на області експерименту.