Регрессионный анализ результатов моделирования

Регрессионный анализ дает возможность построить модель, наилучшим образом соответствующую набору данных, полученных в ходе компьютерного эксперимента. Под наилучшим соответствием понимается минимальное значение функции ошибки, которая представляет собой разность между прогнозируемой моделью и данными эксперимента.

Такой функцией ошибки при регрессионном анализе служит сумма квадратов ошибок.

Пример. Рассмотрим особенности регрессионного анализа результатов моделирования при построении линейной регрессионной модели. На рис. 10.5 показаны точки (x_i, у_i), i=1,2,…,N, полученные в компьютерном эксперименте с моделью системы.

Предположим, что модель результатов компьютерного эксперимента графически может быть представлена в виде прямой линии ŷ=φ(x)=b₀+b₁x, где ŷ – величина, предсказываемая регрессионной моделью.

Регрессионный анализ результатов моделирования - student2.ru

Рис. 10.5. Экспериментальные точки и линия регрессии

Требуется получить такие значения коэффициентов b₀ и b₁, при которых сумма квадратов ошибок является минимальной. На рис. 10.5 ошибка e_i, i=1,2,…,N для каждой экспериментальной точки определяется как расстояние по вертикали от этой точки по линии регрессии ŷ=φ(x).

Для каждой линии ŷ_i=b₀+b₁x_i, i=1,2,…,N соответствующие выражения для ошибок будут иметь вид: e_i= ŷ_i-y_i= b₀+b₁x_i–y_i, а функция ошибки будет равна

Регрессионный анализ результатов моделирования - student2.ru

Для того чтобы минимизировать эту функцию ошибки, следует записать необходимые условия экстремума для неизвестных параметров b₀ и b₁:

Регрессионный анализ результатов моделирования - student2.ru

Решение этой системы двух линейных алгебраических уравнений дает значения b₀ и b₁, минимизирующие функцию ошибки.

Представив данные уравнения в матричном виде

Регрессионный анализ результатов моделирования - student2.ru

отсюда получим:

Регрессионный анализ результатов моделирования - student2.ru

где N – число реализаций при моделировании системы.

Часто в качестве меры ошибки регрессионной модели используется среднее квадратичное отклонение

Регрессионный анализ результатов моделирования - student2.ru

Для нормально распределенных процессов приблизительно 67% точек находится в пределах одного среднеквадратичного отклонения σ_e от линии регрессии и 95% – в пределах двух отклонений 2σ_e.

Для проверки точности оценок b₀ и b₁ регрессионной модели можно использовать критерии Фишера или Стьюдента. Подобным образом оцениваются коэффициенты уравнения регрессии и для случая нелинейной аппроксимации.

10.4.3. Дисперсионный анализ результатов моделирования

При обработке и анализе результатов моделирования часто возникает задача сравнения средних выборок. Если в результате такой проверки окажется, что математическое ожидание совокупностей случайных переменных {у⁽¹⁾}, {у⁽²⁾}, ..., {у⁽ⁿ⁾} отличается незначительно, то статистический материал, полученный в результате моделирования, можно считать однородным (в случае равенства двух первых моментов). Это дает возможность объединить все совокупности в одну и позволяет существенно увеличить информацию о свойствах исследуемой модели, а следовательно, и самой системы. Попарное использование для этих целей критериев Смирнова и Стьюдента для проверки нулевой гипотезы затруднено в связи с наличием большого числа выборок при моделировании системы. Поэтому для этой цели используется дисперсионный анализ.

Пример. Рассмотрим решение задачи дисперсионного анализа при обработке результатов моделирования системы в следующей постановке. Пусть генеральные совокупности случайной величины {у⁽¹⁾}, {у⁽²⁾}, ..., {у⁽ⁿ⁾} имеют нормальное распределение и одинаковую дисперсию. Необходимо по выборочным средним значениям при некотором уровне значимости γ проверить нулевую гипотезу Н₀ о равенстве математических ожиданий. Выявим влияние на результаты моделирования только одного фактора, т. е. рассмотрим однофакторный дисперсионный анализ.

Допустим, изучаемый фактор х привел к выборке значений неслучайной величины Y следующего вида: y₁,y₂,…, y_k, где k – количество уровней фактора x. Влияние фактора будет оцениваться неслучайной величиной D_x, которая называется факторной дисперсией:

Регрессионный анализ результатов моделирования - student2.ru

где Регрессионный анализ результатов моделирования - student2.ru – среднее арифметическое значение величины Y.

Если генеральная дисперсия D[y] известна, то для оценки случайного разброса наблюдений необходимо сравнить D[y] с выборочной дисперсией Регрессионный анализ результатов моделирования - student2.ru , используя критерий Фишера (F-распределение). Если эмпирическое значение F_э попадает в критическую область, то влияние фактора x считается значимым, а разброс значений x – неслучайным. Если генеральная дисперсия D[x] до проведения компьютерного эксперимента с моделью неизвестна, то при моделировании необходимо найти ее оценку.

Пусть серия наблюдений на уровне y_i имеет вид: y _i₁,y_i₂,…, y_in, где n – число повторных наблюдений на i-м уровне. Тогда на i-м уровне среднее значение наблюдений равно:

Регрессионный анализ результатов моделирования - student2.ru

а среднее значение наблюдений по всем уровням будет равно:

Регрессионный анализ результатов моделирования - student2.ru

Общая выборочная дисперсия всех наблюдений вычисляется в соответствии с выражением:

Регрессионный анализ результатов моделирования - student2.ru

При этом разброс значений y определяется суммарным влиянием случайных причин и фактора x. Задача дисперсионного анализа состоит в том, чтобы разложить общую дисперсию D[y] на составляющие, связанные со случайными и неслучайными причинами.

Оценка генеральной дисперсии, связанной со случайными факторами, будет определяться следующим образом:

Регрессионный анализ результатов моделирования - student2.ru

а оценка факторной дисперсии

Регрессионный анализ результатов моделирования - student2.ru

Факторная дисперсия наиболее заметна при анализе средних значений на i-м уровне фактора, а остаточная дисперсия (дисперсия случайности) для средних значений в n раз меньше, чем для отдельных измерений, поэтому можно найти более точную оценку выборочной дисперсии:

Регрессионный анализ результатов моделирования - student2.ru

Умножив обе части этого выражения на n, получим в правой части выборочную дисперсию Регрессионный анализ результатов моделирования - student2.ru , имеющую (k–1) степень свободы. Влияние фактора x будет значимым, если при заданном γ выполняется неравенство:

Регрессионный анализ результатов моделирования - student2.ru

Иначе влиянием фактора x на результаты моделирования можно пренебречь и считать нулевую гипотезу H₀ о равенстве средних значений на различных уровнях справедливой (критерий Фишера).

Дисперсионный анализ позволяет вместо проверки нулевой гипотезы о равенстве средних значений выборок проводить при обработке результатов моделирования проверку нулевой гипотезы о тождественности выборочной и генеральной дисперсий. Дисперсионный анализ часто применяется при сравнительных исследованиях эффекта, получаемого, например, от различных методов лечения, обработки почвы, обучения и т.п.

Возможны и другие подходы к анализу и интерпретации результатов моделирования, но при этом необходимо помнить, что их эффективность существенно зависит от вида и свойств конкретной моделируемой системы.

П р и м е р и с с л е д о в а н и я САУ, п о д в е р ж е н н о й

д е й с т в и ю с л у ч а й н ы х в о з м у щ е н и й

Пример. Моделирование стохастической САУ в программном комплексе МВТУ 3.5 и обработка результатов с помощью статистической процедуры однофакторного дисперсионного анализа.

На рис. 10.6 приведена оптимизированная по квадратичному критерию модель системы автоматического управления гашением колебаний груза на подвесе [11], описываемая уравнениями состояния:

Регрессионный анализ результатов моделирования - student2.ru ,

где Регрессионный анализ результатов моделирования - student2.ru , , , ,

σξ – помеха, действующая на точку подвеса с интенсивностью σ,

m – масса груза, g – ускорение свободного падения , L – длина подвеса.

Оптимальные значения коэффициентов синтезированного регулятора:

к₁= –0,8552; к₂=0,0922 получены для уровня помехи σ=1 м/с²и длины подвеса L=4 м.

Регрессионный анализ результатов моделирования - student2.ru

Рис. 10.6. Модель САУ гашением колебаний груза на подвесе.

Схема моделирования возмущения по параметру a показана на рис. 10.7. Сигнал помехи, используемый в схеме, имеет вид, показанный на графике рис. 10.8.

Регрессионный анализ результатов моделирования - student2.ru

Рис. 10.7. Модель возмущения по параметру.

Регрессионный анализ результатов моделирования - student2.ru

Рис. 10.8. Исходный сигнал помехи.

Применительно к рассматриваемому примеру САУ гашением колебаний груза на подвесе в качестве фактора влияния A может быть принят порог срабатывания логического элемента в схеме моделирования (в дальнейшем – параметр k), влияющий на интенсивность вариации сигнала возмущения по параметру системы a(t). В качестве его уровней можно принять различные значения порога, а результирующим признаком считать какой-либо из показателей качества переходных процессов: например, время регулирования или такой интегральный показатель качества как среднеквадратическое отклонение (СКО).

Для того чтобы качественным образом оценить работу данной САУ, оптимально настроенной на подавление внешнего возмущения в виде нормально распределенного шума, достаточно визуально сравнить графики выходного сигнала – угла φ(t) отклонения подвеса от вертикали для случаев отсутствия и наличия возмущения по параметру (рис. 10.9).

Регрессионный анализ результатов моделирования - student2.ru

Рис. 10.9. Переходные процессы в САУ гашением колебаний.

Видно, что система быстро справляется с внешним возмущением при отсутствии других возмущений (график 1). При дополнительном действии возмущения по параметру переходный процесс затухания колебаний значительно ухудшается (график 2), однако САУ за счет обратных связей продолжает бороться с возмущениями: колебания значительно медленнее, но все же затухают. Характер изменения текущего значения СКО для процессов изменения угла с рис. 10.9 показан на рис. 10.10.

Регрессионный анализ результатов моделирования - student2.ru

Рис. 10.10. СКО, соответствующие процессам изменения угла отклонения подвеса.

Реализации вызванного сбоем прерывания сигнала в линии связи, обусловившие переходные процессы на рис. 10.9, приведены на рис. 10.11.

Регрессионный анализ результатов моделирования - student2.ru
Рис. 10.11. Сигналы в линии связи, повлиявшие на процессы, показанные на рис. 10.9

С целью получения объективной количественной оценки для рассматриваемого примера проведена серия экспериментов моделирования и реализована процедура однофакторного дисперсионного анализа. В качестве результирующего признака взята среднеквадратическая ошибка переходного процесса по углу отклонения подвеса от вертикали, а в качестве фактора – параметр модели k, влияющий на случайную частоту и амплитуду сбоев в соединительной линии связи. Уровни фактора выбраны следующие: k={1,5; 1,25; 1,0;0,75;0,5}. При размере каждой из выборок N=20 для числа степеней свободы рассеивания за счет данного фактора m=4 и остаточного рассеивания за счет случайных ошибок наблюдений l=95 выборочная факторная и остаточная дисперсия соответственно равны S_k²=1472,47; S_ост²=556,77. Выборочная статистика F_в= S_k²/ S_ост²=2,65 для уровня значимости γ=0,05 превышает табличное критическое значение F_кр=2,46 распределения Фишера, поэтому гипотеза о равенстве влияний различных уровней фактора k на математическое ожидание результирующего признака (СКО переходного процесса) не принимается.

Зависимость средних значений результирующего признака от уровней фактора, подтверждающая сделанный вывод, показана на графике рис. 10.12.

Регрессионный анализ результатов моделирования - student2.ru

Рис. 10.12. Зависимость средних значений СКО от фактора k по результатам экспериментов

Вопросы к главе 10

Каким требованиям должны удовлетворять оценки, полученные в итоге статистической обработки результатов моделирования?
Какие моменты случайной величины характеризуют случайное распределение?
Какие величины используются на практике в качестве приближенных оценок случайного распределения?
В чем заключается эргодическое свойство стационарных случайных процессов?
Какой вывод позволяют сделать критерии согласия?
В чем состоит корреляционный анализ результатов моделирования?
Что является целью регрессионного анализа данных, полученных в ходе компьютерного эксперимента?
Для чего и в каких случаях используется дисперсионный анализ?

ЗАКЛЮЧЕНИЕ

Изложенные выше основы теории компьютерного моделирования динамических систем представляют собой тот минимум сведений, который, на наш взгляд, необходим специалисту, вознамерившемуся проводить компьютерные эксперименты с целью более глубокого изучения и модернизации уже существующих или проектирования новых систем управления. Вместе с тем, продвижение инженера по пути совершенствования искусства моделирования невозможно без практики, поэтому для студентов инженерных специальностей, в том числе обучающихся по специальности 220301, предусмотрены лабораторный практикум и курсовая работа на базе программных систем МВТУ 3.5 и СИИМ РДО. Описание работы пользователя этих программных пакетов дано в соответствующих электронных инструкциях. Кроме того, студентам следует воспользоваться описаниями лабораторных работ, а также примерами выполнения курсовых работ по дисциплине «Моделирование систем».

При этом мы надеемся, что в процессе работы читателям пригодятся изложенные в данном учебнике методы и примеры планирования и реализации экспериментов компьютерного моделирования, а также способы обработки полученных результатов с целью получения выводов и принятия обоснованных решений.

СПИСОК ЛИТЕРАТУРЫ

1. Прегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ: Учебное пособие для вузов. – М.: Высшая школа, 1989. – 367 с.

2. Деруссо П., Рой Р., Клоуз Ч. Пространство состояний в теории управления / Пер. с англ. – М.: Наука, 1970. – 620 с.

3. Шеннон Р. Имитационное моделирование систем – искусство и наука. – М.: Мир, 1978.

4. Оре О. Графы и их применение / Пер. с англ. – М.: Едиториал УРСС, 2002. – 168 с.

5. Советов Б.Я., Яковлев С.А. Моделирование систем: Учебник. – М.: Высшая школа, 2001. – 343 с.

6. Емельянов В.В., Ясиновский С.И. Введение в интеллектуальное имитационное моделирование сложных дискретных систем и процессов. Язык РДО. – М.: АНВИК, 1998. – 427 с.

7. Норенков И.П. Основы автоматизированного проектирования. – М.: МГТУ им. Н.Э. Баумана, 2000. – 360 с.

8. Туо Дж. Сравнение четырех пакетов имитационного моделирования // Компьютеруик. – 1995, 35. С. 35–36, 55.

9. Клейнен Дж. Статистические методы в имитационном моделировании / Пер. с англ. – М.: Статистика, 1978. – 221с.

10. Шрайбер Т. Дж. Моделирование на GPSS. – М.: Машиностроение, 1980. – 592 с.

11. Рачков М.Ю., Харин Д.В., Управление перемещением транспортного робота с подвешенным грузом, Известия МГИУ, 3, 2006.

ПРИЛОЖЕНИЕ 1

Наши рекомендации

Анализ результатов моделирования.

Анализ результатов моделирования

Обработка и анализ результатов моделирования

Анализ и интерпретация результатов компьютерного моделирования

Обработка и анализ результатов компьютерного моделирования

Результаты моделирования и анализ полученных на модели результатов

Обработка и анализ результатов моделирования систем

Анализ и интерпретация результатов моделирования вс

Анализ результатов моделирования.

Обработка и анализ результатов моделирования

← Предыдущая страница | Следующая страница →