Методы статистического описания случайных величин, процессов и полей
ББК 39.52
Т5.1
Издательство «Машиностроение», 1985 г.
ПРЕДИСЛОВИЕ
Учебное пособие предназначено для студентов вузов, изучающих дисциплины «Статистическая динамика летательных аппаратов», «Оптимальное управление летательными аппаратами», «Системы управления летательных аппаратов» и близкие к ним по содержанию. Содержание первых двух дисциплин включает в себя изложение основ теории динамических систем при действии случайных возмущений и теории оптимального управления детерминированными и стохастическими динамическими системами. Третья дисциплина в значительной степени прикладная и базируется на первых двух.
Учебное пособие содержит материал, относящийся главным образом к первым двум дисциплинам. Оно может быть также использовано при изучении дисциплины «Системы управления летательных аппаратов», поскольку содержит ряд конкретных технических примеров применения современных статистических методов и методов оптимизации для синтеза систем управления полетом.
При пользовании данным пособием читателю необходима подготовка в объеме вузовской программы по таким дисциплинам, как «Теория автоматического управления», «Динамика полета летательных аппаратов», «Основы теории вероятностей и математической статистики», «Основы теории оптимального управления».
Авторы будут признательны всем читателям, которые пришлют критические замечания по содержанию книги.
ВВЕДЕНИЕ
Проектирование современных высокоточных систем управления в значительной степени связано с проблемой синтеза оптимальных стохастических систем. В эту проблему входят задачи, связанные с определением показателей функционирования систем в условиях случайных возмущений, т. е. с их статистическим анализом, задачи формирования оптимального управления такими системами, а также задачи по переработке информации, доступной измерениям, в информацию, необходимую непосредственно для управления. Следует отметить, что данной проблеме посвящено много работ. Однако основное внимание в них уделяется развитию общего теоретического аппарата применительно к задачам оптимизации систем, описываемых стохастическими дифференциальными уравнениями. Овладение этими методами, как правило, требует высокой математической подготовки и поэтому не всегда доступно инженерам, занимающимся проектированием реальных систем управления.
Цель учебного пособия — систематическое изложение вопросов применения стохастической теории управления к решению задач анализа и синтеза систем управления летательными аппаратами различного назначения на уровне той математической подготовки, которая дается в технических вузах. Учитывая, что в настоящее время развитие систем управления вообще и систем управления летательными аппаратами, в частности, характеризуется широким использованием цифровой вычислительной техники непосредственно в контуре управления, особое внимание в книге уделяется вопросам управления дискретными стохастическими системами.
Изложение большинства вопросов сопровождается примерами решения конкретных технических задач, связанных с анализом и синтезом систем управления летательными аппаратами.
Приводятся основные сведения из теории случайных величин, случайных процессов и случайных полей, необходимые для описания и анализа стохастических систем. Рассматриваются вопросы моделирования реализаций случайных величин и процессов на аналоговых и цифровых вычислительных машинах. Обсуждаются наиболее распространенные методы анализа точности систем управления. Кратко излагаются метод переходных функций и частотный метод анализа точности линейных систем. Более подробно рассмотрены вопросы применения метода статистической линеаризации и метода статистического моделирования для анализа точности нелинейных систем. Значительное внимание уделено различным аспектам практического использования методов анализа точности линейных и нелинейных систем, основанных на использовании теории марковских процессов. Изложение рассматриваемых методов сопровождается примерами решения различных задач анализа точности движения летательных аппаратов, таких, как движение в турбулентной атмосфере, сближение космических аппаратов на орбите, самонаведение крылатого аппарата, баллистический спуск в атмосфере и другие.
Рассматриваются задачи оптимизации стохастических систем управления. В качестве основного объекта исследования принимается дискретная динамическая система. Исследуются задачи программирования и синтеза оптимального стохастического управления. В первом случае предполагается, что текущая информация о состоянии объекта управления отсутствует. Во втором случае считается, что сигнал управления в каждый момент времени формируется на основе информации, полученной измерениями текущего состояния объекта. При этом различаются две ситуации: управление при полной информации, когда считается, что текущее состояние объекта измеряется точно и полностью, и управление при неполной информации, когда измерительная информация не позволяет точно определить текущее состояние объекта. Формулируются необходимые условия оптимальности, обсуждаются особенности применения численных методов математического программирования. Формулируются достаточные условия оптимальности. Предлагается метод решения задач при изопериметрических ограничениях. Обсуждаются различные приближенные методы синтеза оптимального управления, основанные на обычной и статистической линеаризации, а также метод параметров и комбинированный метод. Приводятся примеры решения конкретных технических задач с использованием этих методов. Такими задачами являются задачи формирования алгоритмов управления при переводе стационарного спутника Земли на заданную долготу с помощью двигательной установки большой и малой тяги, при коррекции траектории движения космического аппарата.
Задача синтеза оптимального управления стохастическим объектом при неполной информации рассматривается в байесовской постановке с использованием метода динамического программирования и понятия достаточных координат. Структура синтезируемой оптимальной системы представляется двумя последовательно соединенными блоками: обработки информации и оптимального управления. Для линейных моделей объекта управления, измерений и гаус-совских возмущений при квадратичном критерии оптимальности решение задачи синтеза обоих блоков осуществляется в явном виде. Для общего случая нелинейных моделей объекта управления и измерений предлагается синтезировать блок обработки информации, используя рекуррентные байесовские алгоритмы различной сложности.
ГЛАВА 1.
СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Величина х, принимающая в каждом новом опыте при фиксированных условиях опыта новое значение хi, где i — номер опыта, называется случайной. Значения хi, i=1,2, ..., случайной величины х, которые они принимают в отдельных опытах, называют реализациями случайной величины. Например, масса автоматического летательного аппарата в момент старта — случайная величина, изменения которой применительно к отдельным экземплярам (реализациям) аппарата обусловлены технологическими погрешностями его изготовления и подготовки к старту.
Моменты случайных величин
Моменты служат для описания основных свойств плотности вероятности случайной величины. Они содержат меньше информации о случайной величине по сравнению с плотностью вероятности, но часто более удобны при решении технических задач. В качестве моментов скалярной случайной величины чаще всего применяются математическое ожидание и дисперсия (или среднеквадратическое отклонение).
Математическим ожиданием некоторой функции y = f(x) случайной величины х называется интеграл
При f(x) = xR величина M[xR]=mxR называется начальным моментом R-го порядка случайной величины х. Начальный омент первого порядка тх называется математическим ожиданием случайной величины х:
По реализациям математическое ожидание тх может быть оценено как статистическое среднее
причем .
Разность менаду случайной величиной х и ее математическим ожиданием тх называется центрированной случайной величиной. Центральный момент R-го порядка скалярной случайной величины х определяется как математическое ожидание R-й степени соответствующей центрированной случайной величины:
Центральный момент второго порядка называется дисперсией случайной величины х:
По реализациям оценку можно рассчитать по формуле
причем .
Дисперсия характеризует рассеивание значений случайной величины х в окрестности ее математического ожидания тх. Наряду с дисперсией Dx в качестве меры рассеивания рассматривают и среднеквадратическое отклонение .
Центральные моменты высших порядков определяют аналогично. Например, центральный момент третьего порядка
Он характеризует асимметрию кривой плотности вероятности р(х). Если р(x) —симметричная функция с осью симметрии, проходящей через тх, то , а также все другие нечетные центральные моменты случайной величины х равны нулю.
В качестве характеристик вероятностной зависимости двух скалярных случайных величин х и у рассматривают их корреляционный момент
или коэффициент корреляции
вычисляемый при и .
По реализациям хi, уi, i= 1, п, случайных величин x и y их корреляционный момент можно оценить с помощью соотношения
Если случайные величины х и у связаны между собой линейной зависимостью у = ах + b, где а и b — произвольные неслучайные числа, то , а rxy=1 при а>1 и rxy = -1 при а<0.
Случайные величины х и у называют некоррелированными, если . Используя формулы (1.15), (1.10), нетрудно показать, что из независимости случайных величин следует их некоррелированность. Обратное утверждение в общем случае неверно. Иначе говоря, условие независимости случайных величин более сильное, чем условие некоррелированности.
Для векторной случайной величины х простейшими моментными характеристиками, наиболее часто рассматриваемыми при практических расчетах, являются вектор математических ожиданий тх и корреляционная матрица Кх- Составляющими вектора тх являются математические ожидания компонент вектора х, т. е. .
Корреляционной матрицей Кх случайного вектора х называется симметричная матрица, составленная из корреляционных моментов , и дисперсий составляющих вектора х:
причем .
Если все составляющие случайного вектора х взаимно некоррелированные, то этот вектор называют некоррелированным. Корреляционная матрица Кх некоррелированного вектора — диагональная, все ее внедиагональные элементы равны нулю.
Нормальное распределение
Конкретный вид распределения случайной величины х зависит от физической природы явления. Особое место среди всевозможных распределений занимает распределение Гаусса или нормальное распределение, поскольку именно такими или близкими к нормальному являются распределения многих случайных величин, рассматриваемых при анализе движения автоматических летательных аппаратов.
Нормальная плотность вероятности рг(x) скалярной случайной величины х описывается выражением
Она полностью характеризуется двумя параметрами: тх и Dx. Пользуясь соотношениями (1.12) и (1.14), можно убедиться в том, что параметр тх нормальной плотности вероятности есть математическое ожидание, a Dx — дисперсия этой случайной величины.
В соответствии с формулой (1.2) вероятность попадания гауссовской случайной величины х в интервал равна
После замены переменной х на вычисление интеграла в формуле (1.18) сводится к вычислению соотношения
Значения функции Лапласа Ф(х), определяемой соотношением (1.20), приведены в приложении 1. При проведении расчетов на ЦВМ их можно рассчитать с помощью стандартной подпрограммы.
При преобразованиях выражений, содержащих функцию Лапласа Ф(х), можно пользоваться следующими свойствами этой функции:
Нормальное распределение вероятностей n-мерного случайного вектора х описывается формулой
где тх— вектор математических ожиданий; Кх — корреляционная матрица; - определитель корреляционной матрицы.
В евклидовом n-мерном пространстве, координатами которого являются составляющие вектора х, плотность вероятности рг(х) постоянна на концентрических гиперэллипсоидах:
называемых гиперэллипсоидами рассеивания, где С — любое положительное число. Центром гиперэллипсоидов рассеивания является точка с координатами тх, направление главных осей совпадает с собственными векторами корреляционной матрицы Кх, а длина каждой из главных полуосей равна , где — собственное значение корреляционной матрицы Кх, соответствующее собственному вектору bi.
В двумерном случае нормальное распределение (1.22) принимает вид
(1.23)
Плотность вероятности (1.23) постоянна на эллипсах, называемых эллипсами рассеивания. Угол между главной осью эллипса рассеивания и осью Ox1 определяется с помощью выражения [8]
Если составляющие х1 и х2 вектора х некоррелированы, то направления главных осей эллипса рассеивания совпадают с направлениями осей системы координат Ох1х2.
На практике принято строить эллипсы рассеивания, главные полуоси которых равны где — С КО соответствующей компоненты; К — целое число.
1.1.4. Линейные и нелинейные преобразования случайных величин
При решении задач статистического анализа и оптимизации управления движением летательных аппаратов часто требуется определять моменты и распределения линейных и нелинейных функций случайных величин. Например, при переходе от одной системы координат к другой требуется уметь вычислить вектор математических ожиданий и корреляционную матрицу фазового вектора, описывающего состояние летательного аппарата относительно новой системы координат, если статистические характеристики фазового вектора относительно исходной системы координат известны.
Вначале рассмотрим случай линейного преобразования случайной величины. Пусть х и у — случайные векторы, связанные между собой линейным соотношением
где х — вектор размерности п; у — вектор размерности l; А — матрица размерности l×п; b — неслучайный вектор размерности l.
Используя соотношение (1.11) и учитывая (1.12), находим соотношение между тх и ту:
Вычитая (1.25) из (1.24), получаем соотношение между центрированными случайными величинами, из которого непосредственно вытекает соотношение между корреляционными матрицами Кx и Ку:
В частном случае при , т. е. когда х и у— скалярные случайные величины, имеем my=amx+b; Dy=a2Dx. При п=2 и l=1, т. е. если y=a1x1 + a2x2 + b, получаем my = a1m1+ a2m2 + b и , где K11, K12, K22, - элементы корреляционной матрицы Кx-
В случае нелинейной зависимости y=f(x), где x — скаляр,
т. е. для нахождения my и Dy недостаточно знать тх и Dx, а должна быть известна плотность вероятности р(х) аргумента х.
Пример.Рассмотрим преобразование гауссовской случайной величины х нелинейным звеном типа «реле» с уровнем насыщения А. Подставляя уравнение реле f(x)=A sign (x) и выражение для нормальной плотности вероятности (1.17)в соотношения (1.27) — (1.28) и учитывая свойства интеграла вероятности (1.21), получаем
Аналитически решение задачи определения плотности вероятности p(у) нелинейной функции y = f(x) от случайной величины х может быть получено лишь в том случае, когда существует взаимно однозначное соответствие между х и у, т. е. когда функция f(х) — монотонная.
Пусть f (x) монотонно возрастает. Тогда функция распределения F(y) может быть найдена с помощью соотношения
При взаимно однозначном соответствии между х и у из соотношения y=f(x) можно найти обратную функцию поэтому . Дифференцирование интеграла по переменной у, входящей в верхний предел, дает
где .
При монотонном убывании f(x)
Отсюда
Соотношения (1.31) и (1.32) можно переписать в виде одной формулы:
Пример.Пусть , а аргумент х распределен равномерно на интервале [0, 1], т. е.
Требуется найти p(y). Поскольку в данном , то и
Отсюда
1.1.5. Характеристическая функция и семиинварианты
При решении ряда задач наряду с функцией и плотностью распределения вероятностей используют характеристическую функцию случайной величины. Так называют функцию , являющуюся преобразованием Фурье от плотности вероятности:
Приведем некоторые свойства характеристических функций
Если — независимые случайные величины и
Математическое ожидание и дисперсию случайной величины можно найти, используя производные от логарифма характеристической функции :
Для гауссовской случайной величины х с математическим ожиданием т и дисперсией D
Производную R-го порядка логарифма характеристической функции в точке , умноженную на , называют семиинвариантом R-го порядка случайной величины. Первыми двумя семиинвариантами являются математическое ожидание и дисперсия, а семиинвариант порядка R есть рациональная функция первых R моментов случайной величины. В частности,
где
СЛУЧАЙНЫЕ ПРОЦЕССЫ
Спектральная плотность
Наряду с корреляционной функцией для статистического описания стационарных случайных процессов используют спектральную плотность . Так называют функцию частоты , являющуюся обратным интегральным преобразованием Фурье от корреляционной функции случайного процесса x(t):
В свою очередь, корреляционная функция процесса x(t) выражается через его спектральную плотность как прямое интегральное преобразование Фурье:
Полагая в (1.56) , получаем выражение для дисперсии Dx стационарного случайного процесса x(t) через его спектральную плотность:
Если в (1.55) и (1.56) перейти к тригонометрической форме представления и , то получим
При описании стационарных случайных процессов вместо может задаваться спектральная плотность, определяемая для положительных частот:
В этом случае корреляционная функция процесса должна вычисляться по известной спектральной плотности с помощью соотношения
а дисперсия Dx определяется с помощью формулы
Последнее выражение позволяет дать физическую интерпретацию спектральной плотности : она характеризует плотность распределения дисперсии стационарного случайного процесса по частотам непрерывного спектра гармонического разложения этого процесса.
Рассмотрим два примера определения спектральных плотностей стационарных случайных процессов по их корреляционным функциям.
Белый шум.Для белого шума , поэтому из (1.59) находим, учитывая свойство -функции,
Как видим, спектральная плотность белого шума остается постоянной на бесконечном интервале частот. Это указывает на физическую нереализуемость такого шума, поскольку для его реализации потребовалась бы бесконечно большая энергия источника такого шума. Равномерное распределение дисперсии на бесконечном интервале частот может также использоваться в качестве иного определения белого шума. Спектр солнечного света в оптическом диапазоне близок к равномерному. Учитывая эту аналогию, случайный процесс с равномерной спектральной плотностью называют белым шумом. Все другие случайные процессы, у которых функция .S'x(co) меняется по частоте, можно называть «окрашенными» шумами. На практике в качестве белого рассматривают любой окрашенный шум, спектральная плотность которого остается постоянной в пределах полосы пропускания системы, на которую этот шум действует.
Экспоненциально коррелированный процесс.Случайный процесс с корреляционной функцией вида
называют экспоненциально корреляционным. Спектральную плот-кость такого процесса можно найти с помощью формулы (1.55)
СЛУЧАЙНЫЕ ПОЛЯ
При исследовании управляемого движения летательных аппаратов некоторые факторы, как, например, плотность, температура, турбулентность в реальной (не стандартной) атмосфере, изменяются случайно в зависимости от координат рассматриваемой точки пространства и времени t.
Случайные факторы, аргументами которых являются векторы, называют случайными полями.
Если в состав компонент вектора аргументов поля входят только координаты пространства, то такое случайное поле называют пространственным. Если же в состав аргументов поля входит также и время, то случайное поле называют пространственно-временным.
Случайные поля бывают скалярными и векторными. Плотность воздуха в атмосфере р(х, у, z, t) и его температура Т(х, у, z, t) — скалярные пространственно-временные случайные поля. Турбулентность атмосферы w(x, у, z, t) есть векторное пространственно-временное случайное поле, поскольку скорость порывов ветра в турбулентной атмосфере да— это вектор, характеризуемый тремя составляющими wx, wv, wz.
Скалярные случайные поля
Обозначим вектором х= {х, у, z} вектор аргументов пространственного скалярного случайного поля и(х). Вектор х определен в области D возможного изменения координат х, у, z. Точку назовем точкой наблюдения поля. В каждой точке скалярного поля наблюдается скалярная случайная величина .
Скалярное случайное поле и(х) считается описанным полностью, если для произвольного числа точек наблюдения известен способ построения «-мерного совместного безусловного распределения вероятностей системы случайных величин .
В частности, если при любых , и любом п справедливо соотношение
то поле и(х) называется абсолютно случайным, и для его описания достаточно задать зависимость одномерной плотности рu(х) от координат х точки наблюдения этого поля.
Как и при описании случайных величин и процессов, для описания случайных полей часто пользуются их моментными характеристиками.
n-точечным начальным моментом порядка ti + ... + in скалярного поля и(х) называется математическое ожидание произведения соответствующих степеней возможных значений поля в n точках наблюдения:
Одноточечный начальный момент первого порядка
называется математическим ожиданием скалярного случайного поля. Оно характеризует среднее значение случайной величины и в каждой точке х области D.
Разность есть центрированное случайное поле. Среднюю величину произведения степеней возможных значений центрированного поля в n точках наблюдения называют «-точечным центральным моментом порядка :
Одноточечный центральный момент второго порядка
есть дисперсия скалярного поля u(х), а двухточечный центральный момент второго порядка
— его корреляционная функция. Дисперсия случайного поля характеризует рассеивание случайных значений поля в точке наблюдения, а корреляционная функция — корреляцию значений поля в двух его точках наблюдения х1 и х2.
Скалярное случайное поле может обладать свойствами однородности и изотропности. Поле и(х) называется однородным (строгая однородность), если его n -точечное совместное распределение не изменяется при переносе точек наблюдения этого поля на один и тот же вектор х0, т. е.
при любом х0 и любом числе точек наблюдения п.
Скалярное случайное поле u(х) называется однородным в широком смысле, если его математическое ожидание тu(х) является постоянным во всех точках области D, а корреляционная функция не изменяется при переносе пары точек наблюдения х1 и х2 на один и тот же вектор х0, т. е.
(1.69)
Иными словами, аргументом корреляционной функции однородного скалярного поля являются не координаты х1 и х2 точек наблюдения этого поля, а вектор соединяющий эти точки в области D. Свойство однородности скалярного случайного поля эквивалентно свойству стационарности случайного процесса.
Однородное скалярное поле u(х) называется изотропным, если корреляция между значениями этого поля в точках х1 и х2 не зависит от ориентации вектора , а зависит только от его длины . Таким образом, в рамках корреляционной теории изотропное скалярное случайное поле u(х) описывается двумя характеристиками: математическим ожиданием mu(x)=const и корреляционной функцией Ru(r).
Векторные случайные поля
Рассмотрим векторное пространственное случайное поле и(х), у которого аргумент х - вектор с координатами х, у, z, принадлежащий области наблюдения поля D, а и — вектор с проекциями их, иу, uz.
Проекции их(х), иу(х), uz(x) можно рассматривать как совокупность трех случайных полей. Статистическое описание этой совокупности эквивалентно статистическому описанию векторного поля и(х). В рамках корреляционной теории для описания совокупности скалярных случайных полей их(х), иу(х) и uz(x) требуется задать вектор их математических ожиданий ти(х) и матричную корреляционную функцию . Вектор математических ожиданий состоит из трех компонент , каждая из которых есть математическое ожидание соответствующей составляющей вектора и в точке наблюдения х.
Матричная корреляционная функция характеризует статистическую взаимосвязь между различными компонентами вектора и в двух различных точках наблюдения поля х1 и х2 в области D:
где
Если поле ы(х), у которого аргумент х состоит из трех компонент х, у, z, содержит три компоненты их, иу, иz, то матричная корреляционная функция имеет размерность 3×3. Элементы , и — автокорреляционные функции составляющих их, иу и иz векторного поля; остальные элементы— взаимные корреляционные функции между различными составляющими этого поля. Например, корреляция между компо-
нентами их и иу в точках наблюдения х1 и х2 характеризуется взаимной корреляционной функцией
где
При х1-х2=х, т. е. при совпадении двух точек наблюдения, матричная корреляционная функция векторного случайного поля u(х) обращается в его корреляционную матрицу Ku(x), диагональными элементами которой являются дисперсии составляющих их, иу, uz вектора и в точке х, а внедиагональными — взаимные корреляционные моменты этих составляющих.
Как и скалярное, векторное случайное поле может быть однородным и изотропным. Статистические характеристики однородного векторного случайного поля u(х) инвариантны относительно параллельного переноса точек наблюдения поля в области D на одинаковый вектор х0 произвольной длины. Для такого поля математическое ожидание есть постоянный вектор , a матричная корреляционная функция зависит только от вектора соединяющего точки наблюдения х1 и х2, и не зависит от положения точки х1 начала вектора в области D.
Для рассмотрения свойства и