Регрессионный анализ результатов моделирования
Регрессионный анализ дает возможность построить модель, наилучшим образом соответствующую набору данных, полученных в ходе компьютерного эксперимента. Под наилучшим соответствием понимается минимальное значение функции ошибки, которая представляет собой разность между прогнозируемой моделью и данными эксперимента.
Такой функцией ошибки при регрессионном анализе служит сумма квадратов ошибок.
Пример. Рассмотрим особенности регрессионного анализа результатов моделирования при построении линейной регрессионной модели. На рис. 10.5 показаны точки (xi, уi), i=1,2,…,N, полученные в компьютерном эксперименте с моделью системы.
Предположим, что модель результатов компьютерного эксперимента графически может быть представлена в виде прямой линии ŷ=φ(x)=b0+b1x, где ŷ – величина, предсказываемая регрессионной моделью.
Рис. 10.5. Экспериментальные точки и линия регрессии
Требуется получить такие значения коэффициентов b0 и b1, при которых сумма квадратов ошибок является минимальной. На рис. 10.5 ошибка ei, i=1,2,…,N для каждой экспериментальной точки определяется как расстояние по вертикали от этой точки по линии регрессии ŷ=φ(x).
Для каждой линии ŷi=b0+b1xi, i=1,2,…,N соответствующие выражения для ошибок будут иметь вид: ei= ŷi-yi= b0+b1xi–yi, а функция ошибки будет равна
Для того чтобы минимизировать эту функцию ошибки, следует записать необходимые условия экстремума для неизвестных параметров b0 и b1:
Решение этой системы двух линейных алгебраических уравнений дает значения b0 и b1, минимизирующие функцию ошибки.
Представив данные уравнения в матричном виде
отсюда получим:
где N – число реализаций при моделировании системы.
Часто в качестве меры ошибки регрессионной модели используется среднее квадратичное отклонение
Для нормально распределенных процессов приблизительно 67% точек находится в пределах одного среднеквадратичного отклонения σe от линии регрессии и 95% – в пределах двух отклонений 2σe.
Для проверки точности оценок b0 и b1 регрессионной модели можно использовать критерии Фишера или Стьюдента. Подобным образом оцениваются коэффициенты уравнения регрессии и для случая нелинейной аппроксимации.
10.4.3. Дисперсионный анализ результатов моделирования
При обработке и анализе результатов моделирования часто возникает задача сравнения средних выборок. Если в результате такой проверки окажется, что математическое ожидание совокупностей случайных переменных {у(1)}, {у(2)}, ..., {у(n)} отличается незначительно, то статистический материал, полученный в результате моделирования, можно считать однородным (в случае равенства двух первых моментов). Это дает возможность объединить все совокупности в одну и позволяет существенно увеличить информацию о свойствах исследуемой модели, а следовательно, и самой системы. Попарное использование для этих целей критериев Смирнова и Стьюдента для проверки нулевой гипотезы затруднено в связи с наличием большого числа выборок при моделировании системы. Поэтому для этой цели используется дисперсионный анализ.
Пример. Рассмотрим решение задачи дисперсионного анализа при обработке результатов моделирования системы в следующей постановке. Пусть генеральные совокупности случайной величины {у(1)}, {у(2)}, ..., {у(n)} имеют нормальное распределение и одинаковую дисперсию. Необходимо по выборочным средним значениям при некотором уровне значимости γ проверить нулевую гипотезу Н0 о равенстве математических ожиданий. Выявим влияние на результаты моделирования только одного фактора, т. е. рассмотрим однофакторный дисперсионный анализ.
Допустим, изучаемый фактор х привел к выборке значений неслучайной величины Y следующего вида: y1,y2,…, yk, где k – количество уровней фактора x. Влияние фактора будет оцениваться неслучайной величиной Dx, которая называется факторной дисперсией:
где – среднее арифметическое значение величины Y.
Если генеральная дисперсия D[y] известна, то для оценки случайного разброса наблюдений необходимо сравнить D[y] с выборочной дисперсией , используя критерий Фишера (F-распределение). Если эмпирическое значение Fэ попадает в критическую область, то влияние фактора x считается значимым, а разброс значений x – неслучайным. Если генеральная дисперсия D[x] до проведения компьютерного эксперимента с моделью неизвестна, то при моделировании необходимо найти ее оценку.
Пусть серия наблюдений на уровне yi имеет вид: y i1,yi2,…, yin, где n – число повторных наблюдений на i-м уровне. Тогда на i-м уровне среднее значение наблюдений равно:
а среднее значение наблюдений по всем уровням будет равно:
Общая выборочная дисперсия всех наблюдений вычисляется в соответствии с выражением:
При этом разброс значений y определяется суммарным влиянием случайных причин и фактора x. Задача дисперсионного анализа состоит в том, чтобы разложить общую дисперсию D[y] на составляющие, связанные со случайными и неслучайными причинами.
Оценка генеральной дисперсии, связанной со случайными факторами, будет определяться следующим образом:
а оценка факторной дисперсии
Факторная дисперсия наиболее заметна при анализе средних значений на i-м уровне фактора, а остаточная дисперсия (дисперсия случайности) для средних значений в n раз меньше, чем для отдельных измерений, поэтому можно найти более точную оценку выборочной дисперсии:
Умножив обе части этого выражения на n, получим в правой части выборочную дисперсию , имеющую (k–1) степень свободы. Влияние фактора x будет значимым, если при заданном γ выполняется неравенство:
Иначе влиянием фактора x на результаты моделирования можно пренебречь и считать нулевую гипотезу H0 о равенстве средних значений на различных уровнях справедливой (критерий Фишера).
Дисперсионный анализ позволяет вместо проверки нулевой гипотезы о равенстве средних значений выборок проводить при обработке результатов моделирования проверку нулевой гипотезы о тождественности выборочной и генеральной дисперсий. Дисперсионный анализ часто применяется при сравнительных исследованиях эффекта, получаемого, например, от различных методов лечения, обработки почвы, обучения и т.п.
Возможны и другие подходы к анализу и интерпретации результатов моделирования, но при этом необходимо помнить, что их эффективность существенно зависит от вида и свойств конкретной моделируемой системы.
П р и м е р и с с л е д о в а н и я САУ, п о д в е р ж е н н о й
д е й с т в и ю с л у ч а й н ы х в о з м у щ е н и й
Пример. Моделирование стохастической САУ в программном комплексе МВТУ 3.5 и обработка результатов с помощью статистической процедуры однофакторного дисперсионного анализа.
На рис. 10.6 приведена оптимизированная по квадратичному критерию модель системы автоматического управления гашением колебаний груза на подвесе [11], описываемая уравнениями состояния:
,
,
где , , , ,
σξ – помеха, действующая на точку подвеса с интенсивностью σ,
m – масса груза, g – ускорение свободного падения , L – длина подвеса.
Оптимальные значения коэффициентов синтезированного регулятора:
к1= –0,8552; к2=0,0922 получены для уровня помехи σ=1 м/с2и длины подвеса L=4 м.
Рис. 10.6. Модель САУ гашением колебаний груза на подвесе.
Схема моделирования возмущения по параметру a показана на рис. 10.7. Сигнал помехи, используемый в схеме, имеет вид, показанный на графике рис. 10.8.
Рис. 10.7. Модель возмущения по параметру.
Рис. 10.8. Исходный сигнал помехи.
Применительно к рассматриваемому примеру САУ гашением колебаний груза на подвесе в качестве фактора влияния A может быть принят порог срабатывания логического элемента в схеме моделирования (в дальнейшем – параметр k), влияющий на интенсивность вариации сигнала возмущения по параметру системы a(t). В качестве его уровней можно принять различные значения порога, а результирующим признаком считать какой-либо из показателей качества переходных процессов: например, время регулирования или такой интегральный показатель качества как среднеквадратическое отклонение (СКО).
Для того чтобы качественным образом оценить работу данной САУ, оптимально настроенной на подавление внешнего возмущения в виде нормально распределенного шума, достаточно визуально сравнить графики выходного сигнала – угла φ(t) отклонения подвеса от вертикали для случаев отсутствия и наличия возмущения по параметру (рис. 10.9).
Рис. 10.9. Переходные процессы в САУ гашением колебаний.
Видно, что система быстро справляется с внешним возмущением при отсутствии других возмущений (график 1). При дополнительном действии возмущения по параметру переходный процесс затухания колебаний значительно ухудшается (график 2), однако САУ за счет обратных связей продолжает бороться с возмущениями: колебания значительно медленнее, но все же затухают. Характер изменения текущего значения СКО для процессов изменения угла с рис. 10.9 показан на рис. 10.10.
Рис. 10.10. СКО, соответствующие процессам изменения угла отклонения подвеса.
Реализации вызванного сбоем прерывания сигнала в линии связи, обусловившие переходные процессы на рис. 10.9, приведены на рис. 10.11.
Рис. 10.11. Сигналы в линии связи, повлиявшие на процессы, показанные на рис. 10.9
С целью получения объективной количественной оценки для рассматриваемого примера проведена серия экспериментов моделирования и реализована процедура однофакторного дисперсионного анализа. В качестве результирующего признака взята среднеквадратическая ошибка переходного процесса по углу отклонения подвеса от вертикали, а в качестве фактора – параметр модели k, влияющий на случайную частоту и амплитуду сбоев в соединительной линии связи. Уровни фактора выбраны следующие: k={1,5; 1,25; 1,0;0,75;0,5}. При размере каждой из выборок N=20 для числа степеней свободы рассеивания за счет данного фактора m=4 и остаточного рассеивания за счет случайных ошибок наблюдений l=95 выборочная факторная и остаточная дисперсия соответственно равны Sk2=1472,47; Sост2=556,77. Выборочная статистика Fв= Sk2/ Sост2=2,65 для уровня значимости γ=0,05 превышает табличное критическое значение Fкр=2,46 распределения Фишера, поэтому гипотеза о равенстве влияний различных уровней фактора k на математическое ожидание результирующего признака (СКО переходного процесса) не принимается.
Зависимость средних значений результирующего признака от уровней фактора, подтверждающая сделанный вывод, показана на графике рис. 10.12.
Рис. 10.12. Зависимость средних значений СКО от фактора k по результатам экспериментов
Вопросы к главе 10
- Каким требованиям должны удовлетворять оценки, полученные в итоге статистической обработки результатов моделирования?
- Какие моменты случайной величины характеризуют случайное распределение?
- Какие величины используются на практике в качестве приближенных оценок случайного распределения?
- В чем заключается эргодическое свойство стационарных случайных процессов?
- Какой вывод позволяют сделать критерии согласия?
- В чем состоит корреляционный анализ результатов моделирования?
- Что является целью регрессионного анализа данных, полученных в ходе компьютерного эксперимента?
- Для чего и в каких случаях используется дисперсионный анализ?
ЗАКЛЮЧЕНИЕ
Изложенные выше основы теории компьютерного моделирования динамических систем представляют собой тот минимум сведений, который, на наш взгляд, необходим специалисту, вознамерившемуся проводить компьютерные эксперименты с целью более глубокого изучения и модернизации уже существующих или проектирования новых систем управления. Вместе с тем, продвижение инженера по пути совершенствования искусства моделирования невозможно без практики, поэтому для студентов инженерных специальностей, в том числе обучающихся по специальности 220301, предусмотрены лабораторный практикум и курсовая работа на базе программных систем МВТУ 3.5 и СИИМ РДО. Описание работы пользователя этих программных пакетов дано в соответствующих электронных инструкциях. Кроме того, студентам следует воспользоваться описаниями лабораторных работ, а также примерами выполнения курсовых работ по дисциплине «Моделирование систем».
При этом мы надеемся, что в процессе работы читателям пригодятся изложенные в данном учебнике методы и примеры планирования и реализации экспериментов компьютерного моделирования, а также способы обработки полученных результатов с целью получения выводов и принятия обоснованных решений.
СПИСОК ЛИТЕРАТУРЫ
1. Прегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ: Учебное пособие для вузов. – М.: Высшая школа, 1989. – 367 с.
2. Деруссо П., Рой Р., Клоуз Ч. Пространство состояний в теории управления / Пер. с англ. – М.: Наука, 1970. – 620 с.
3. Шеннон Р. Имитационное моделирование систем – искусство и наука. – М.: Мир, 1978.
4. Оре О. Графы и их применение / Пер. с англ. – М.: Едиториал УРСС, 2002. – 168 с.
5. Советов Б.Я., Яковлев С.А. Моделирование систем: Учебник. – М.: Высшая школа, 2001. – 343 с.
6. Емельянов В.В., Ясиновский С.И. Введение в интеллектуальное имитационное моделирование сложных дискретных систем и процессов. Язык РДО. – М.: АНВИК, 1998. – 427 с.
7. Норенков И.П. Основы автоматизированного проектирования. – М.: МГТУ им. Н.Э. Баумана, 2000. – 360 с.
8. Туо Дж. Сравнение четырех пакетов имитационного моделирования // Компьютеруик. – 1995, 35. С. 35–36, 55.
9. Клейнен Дж. Статистические методы в имитационном моделировании / Пер. с англ. – М.: Статистика, 1978. – 221с.
10. Шрайбер Т. Дж. Моделирование на GPSS. – М.: Машиностроение, 1980. – 592 с.
11. Рачков М.Ю., Харин Д.В., Управление перемещением транспортного робота с подвешенным грузом, Известия МГИУ, 3, 2006.
ПРИЛОЖЕНИЕ 1