Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Им. Р.Е. АЛЕКСЕЕВА»

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева

ВЕРОЯТНОСТЬ. ИНФОРМАЦИЯ. КЛАССИФИКАЦИЯ.

Рекомендовано Ученым советом Нижегородского государственного технического университета им. Р. Е. Алексеева в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению подготовки 230100 «Информатика и вычислительная техника» и 230400 «Информационные системы и технологии»

Нижний Новгород

УДК 005

Рецензент:

Доцент кафедры теоретической механики

Нижегородского государственного университета

им. Н.И. Лобачевского, кандидат физико-математических наук,

доцент А.Ф. Ляхов

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева

Вероятность. Информация. Классификация:учеб. пособие /

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева

Нижегор. гос. техн. ун–т им. Р.Е. Алексеева. – Н. Новгород, 2014. – 128с.

Рассматриваются базовые понятия теории вероятностей, теории информации и использование вероятностных и информационных методов в задачах диагностики сложных систем и в задачах обработки многомерных данных на примере классификации состояний биоценоза.

Учебное пособие предназначено для студентов, обучающихся по направлениям: 230100 «Информатика и вычислительная техника» и 230400 «Информационные системы и технологии»

Рис. 42. Табл. 6. Библиогр.: 10 назв.

УДК 005

  © Нижегородский государственный технический университет им. Р.Е. Алексеева, 2013 © Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева 2013
   

ВВЕДЕНИЕ

В настоящее время широко используется системный подход к решению задач анализа и синтеза объектов и процессов различной физической природы. Объект описывается как система, т. е., как структурированный состав, при этом свойства объекта определяются свойствами построенной системы, которая выполняет функцию модели объекта при решении поставленной задачи. Исследование свойств модели, моделирование свойств с использованием современных информационных технологий, и синтез на основе результатов моделирования новых объектов, процессов и концепций является основной частью научной и прикладной деятельности человека.

Описать состояние объекта как некоторой целостности минимальным количеством переменных (параметров, свойств) на ранних стадиях его изучения, как правило, не представляется возможным, не всегда удается даже определить их возможное количество. Поэтому на первом этапе возникает проблема с выделением наиболее информативной совокупности переменных, на основании которой можно было бы решить поставленную задачу, которая описывается заданной целевой функцией.

Кроме наблюдаемых переменных существуют еще скрытые переменные (компоненты), которые отражают структурные свойства объекта, законы, определяющие форму организации объекта. Совокупность значений наблюдаемых переменных называется многомерными данными в пространстве переменных.

К настоящему времени сформировалось несколько методов обработки многомерных данных, каждый из которых решает частную задачу. В настоящем пособии приведен обзор методов и подробно рассматривается метод классификации на примере анализа состояний биоценоза.

Для решения задач, связанных с обработкой многомерных данных, требуется соответствующий инструментарий, функции которого могут выполнять методы теории вероятностей, теории информации и математической статистики. Поэтому в пособии подробно описан их понятийный аппарат и способы решения конкретных задач.

ВЕРОЯТНОСТЬ

Основные понятия

Каждая наука начинается с определения объекта и предмета исследования, построения модели объекта, системы аксиом и с формирования основных понятий, на которых она базируется [1,3,4,5,7]. Поскольку определить понятие – это значит свести его к другим, более известным понятиям, то, очевидно, процесс должен где-то закончиться. Поэтому всегда существуют первичные понятия, которые строго не определяются, а только поясняются. Одним из таких понятий является понятие события.

В теории вероятностей объект исследования - это случайные явления различной физической природы.

Предметом теории вероятностей является математический анализ случайных явлений, выявление закономерностей в самих случайных явлениях независимо от их конкретной природы.

Событие – это любой факт, который может произойти при заданном комплексе условий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Достоверное событие – это событие, которое всегда происходит при заданном комплексе условий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Невозможное событие - это событие, которое никогда не происходит при заданном комплексе условий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Случайное событие – это событие, которое может произойти, а может и не произойти при заданном комплексе условий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Следует отметить, что достоверное, невозможное и случайное события остаются таковыми только при заданном комплексе условий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Комплекс условий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru – это совокупность контролируемых физических величин или параметров, которые описывают эксперимент, испытание, опыт и т.д. Задать комплекс условий – это значит задать значения указанных физических величин или параметров.

Эмпирическим основанием для построения теории вероятностей послужила устойчивость относительной частоты появления события. Если при n испытаниях событие Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru появилось Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru раз, то его относительная частота появления равна отношению Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Это свойство относительной частоты выражено в (одной из основных) аксиоме Колмогорова, согласно которой

Вероятность – это число Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , которое поставлено в соответствие данному событию. Значение вероятности иногда называют вероятностной мерой или весом события. Вероятность можно интерпретировать как степень возможности появления события.

Модель, лежащая в основе теории вероятностей, - это пространство элементарных событий, которое по определению представляет собой полную группу несовместных событий (исходов данного опыта, эксперимента) с заданной вероятностной мерой (законом распределения вероятностей).

События называются несовместными, если наступление одного из них исключает возможность наступления другого.

События образуют полную группу событий, если Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , где Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru – вероятность і– го события, т.е. вероятность появления события, которое не принадлежит данной группе, равна нулю.

Математическая модель события (в отличие от приведенного выше пояснения физического смысла события) – это любое подмножество в пространстве элементарных событий, чаще всего объединенных в подмножество по тому или иному свойству, признаку.

В теории вероятностей не исследуются причины, по которым события появляются с той или иной вероятностью. Основной ее задачей является разработка методов вычисления вероятностей, если известны вероятности элементарных событий или вероятности некоторых исходных событий.

Можно выделить четыре этапа вычисления вероятности события:

· построение пространства элементарных событий, которое определяется комплексом условий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru в данной задаче;

· выделение подмножества, т.е. события, вероятность которого необходимо вычислить по условию задачи, и событий, которые участвуют в решении задачи;

· вычисление вероятностей элементарных событий, которые входят в выделенное подмножество;

· вычисление вероятности выделенного события как суммы вероятностей всех образующих его элементарных событий.

Указанные этапы желательно представлять при решении любой задачи, но это не значит, что нужно скрупулезно следовать им.

Разработанные в теории вероятностей методы (теоремы) позволяют найти более короткие способы вычисления вероятностей по сравнению с указанным общим методом

В принципе, все вероятности событий являются условными, поскольку все события происходят при том или ином комплексе условий. Тем не менее, любой комплекс условий, который реализуется в данном эксперименте, можно считать полным начальным, т.е. без каких-либо ограничений, а соответствующие вероятности событий - полными или безусловными.

Часто полный комплекс условий можно представить как совокупность частных комплексов условий, которые образуют некоторую вероятностную структуру. Тогда вероятность некоторого события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru при частном комплексе условий можно назвать частной или условной вероятностью.

Рассмотрим следующий способ вероятностной организации совокупности комплексов условий. Пусть имеется Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru комплексов условий, каждый из которых реализуется в данном эксперименте с некоторой вероятностью Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Реализацию некоторого частного комплекса условий будем интерпретировать как появление события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru с вероятностью, равной Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru Все события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru образуют полную группу несовместных событий. Требуется вычислить полную вероятность события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , которое может наступить лишь при появлении одного из событий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru с известной условной вероятностью Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и при известных вероятностях Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Для событий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru можно записать формулу умножения вероятностей в виде

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Тогда полная вероятность

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

получается в результате суммирования двухмерного закона распределения Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru по всем событиям Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , которые требуется исключить, т.е. понизить размерность распределения. Полученное выражение для вычисления вероятности Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru называется формулой полной вероятности, геометрическая интерпретация которой представлена в виде вероятностной диаграммы (Рис. 1.4). Вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru равна сумме произведений вероятностей Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru на условные вероятности Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис.1.4. Вероятностная диаграмма

Из формулы умножения вероятностей следует, что

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Полученное выражение называется формулой Байеса, где Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru вычисляется по формуле полной вероятности.

Формула Байеса позволяет вычислить вероятность события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru при условии, что появилось событие Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . В этом случае события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru называются гипотезами и, как правило, обозначаются через Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru Можно дать следующую интерпретацию формулы Байеса. В результате опыта реализуется ненаблюдаемое событие Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru с априорной (доопытной) вероятностью, равной Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , и наблюдаемое событие Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , которое доставляет некоторое количество информации о реализованном событии Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . На основании полученной информации вероятности Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru могут быть переоценены по формуле Байеса, т.е. может быть вычислена апостериорная (послеопытная) вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Задача. Выше была задача про студента, который выучил 10 билетов из 25. Требовалось определить, в каком случае вероятность вынуть выученный билет больше, когда студент вынимает билет первым или вторым (билеты не возвращаются)? Задача была решена общим стандартным методом с построением полного пространства элементарных событий (рис. 1.2). Однако ее можно решить и с использованием формулы полной вероятности. Вероятностная диаграмма для этой задачи изображена на рис.5, где события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru состоят в том, что был вынут выученный билет соответственно при первом и втором вынимании билета; событие Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru - вынут невыученный билет при первом вынимании.

 

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис.1.5. Вероятностная диаграмма

События Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru образуют полную группу несовместных событий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru вычисляется классическим методом, а вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Условные вероятности вычисляются следующим образом. Появление события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru изменяет комплекс условий, при котором наступает событие Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , а именно: количество выученных билетов уменьшается до 9, а общее количество билетов уменьшается до 24, отсюда Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Аналогично вычисляется вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . По формуле полной вероятности вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Отсюда следует, что Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Задача. Выше была решена классическим методом следующая задача. Кубик бросают два раза. С какой вероятностью при первом испытании появится единица (событие Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru при условии, что при втором испытании выпало значение больше, чем при первом (событие Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru ).

Пространство элементарных событий для этой задачи изображено на рис.1.6. Эту задачу можно решить по формуле Байеса без построения полного пространства элементарных событий. В этом случае следует использовать вероятностную диаграмму.

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru
Рис.1.6. Вероятностная диаграмма

Слева изображены цифры, образующие пространство элементарных событий для первого кубика. Все события равновероятны Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Условная вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru вычисляется как вероятность того, что при втором испытании выпадет значение больше 1. Аналогично вычисляются остальные условные вероятности. По формуле полной вероятности находим:

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Условная вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru вычисляется по формуле Байеса: Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Задача. Рассмотрим пример оценки условной вероятности в случае непрерывной случайной величины. Мишень в виде круга радиуса Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru можно рассматривать как пространство элементарных событий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , если вероятность попасть в мишень принять равной единице (полная группа событий). Кроме этого, события можно считать несовместными, если размеры пули считать бесконечно малой величиной.

Стрелок делает Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru выстрелов, целясь в центр мишени, при этом пули будут распределены по всей мишени с некоторой плотностью, которую можно измерять количеством пуль (или весом пуль, поскольку все пули имеют одинаковый вес) приходящим на единицу площади. Выделим в мишени две фигуры (события) Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , и оценим вероятности их поражения. Очевидно, Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , где Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru -количество пуль, попавших соответственно в Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , в Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и в Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru - пересечение событий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . В частности, значение вероятности можно интерпретировать как вес соответствующего события по отношению к весу всего пространства Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , равному Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Кроме этого, можно ввести условную вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , т.е. вес события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , которое появляется вместе с Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru (вес пересечения Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru ) по отношению к весу события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Аналогично Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Для условной вероятности Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru подмножество Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru является пространством элементарных событий с плотностью распределения вероятностей, равной Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , где Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru - плотность распределения вероятностей в пространстве Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Благодаря делению на Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru подмножество Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru становится полной группой событий. Устойчивость относительной частоты Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru появления события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru при условии Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru является эмпирическим основанием для введения по аксиоме Колмогорова понятия условной вероятности Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Поскольку Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , то, заменяя относительные частоты соответствующими вероятностями, получим Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и аналогично Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru ( Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru ). Отсюда очевидной становится формула умножения вероятностей: Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Если имеет место равномерный закон распределения вероятностей в подмножестве Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , то значение вероятности Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru можно вычислить как отношение площади пересечения событий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru к площади Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Задача. Известно, что в результате Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru испытаний событие Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru появилось один раз. Какова вероятность того, что оно появилось при втором испытании? Вероятность появления события Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru при отдельном испытании равна Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Решение. Пространство элементарных событий для одного испытания состоит из событий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , которые в дальнейшем заменим соответственно на 1 и 0, а пространство элементарных событий для опыта состоит из 2n последовательностей. Необходимо вычислить условную вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , где Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru _ событие, состоящее в том, что в результате опыта появится последовательность, содержащая единицу на втором месте. Это подмножество последовательностей, каждая из которых содержит 1 на втором месте. Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru _ событие, состоящее в том, что последовательность будет содержать одну единицу. Пересечение событий Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru состоит из единственной последовательности 010000…0. Все Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru последовательностей в Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru равновероятны, поскольку вероятность каждой из них равна Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , так как испытания независимы. Поэтому применим классический метод вычисления вероятностей, согласно которому Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Закон распределения Релея

Пусть имеется вектор Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Координаты Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru – независимые центрированные случайные величины с одинаковым гауссовым законом распределения. Тогда двумерное распределение

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Определим плотность распределения амплитуды а и фазы φ вектора с координатами Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис. 1.10. Геометрическая интерпретация нелинейного преобразования

1 Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

1 Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru = Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru |det Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru | =

= Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru |det Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru ;

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru ,

0 Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru = Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru - закон распределения Релея.

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис. 1.11. Геометрическая интерпретация закона Релея

Вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru равна вероятности того, что конец вектора Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru попадет в кольцо с шириной, равной Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и радиусом, равным Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru (рис. 1.11).

Аналогично находится плотность распределения вероятностей фазы:

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Поскольку Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , то Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru независимые случайные величины.

Вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru равна вероятности того, что конец вектора Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru попадет в конус с углом, равным Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Этот результат широко используется при анализе узкополосного нормального шума.

Рассмотрим ещё один пример нелинейного преобразования. Пусть случайная величина Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru имеет закон распределения Релея

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru при Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и нулю при Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Нелинейное преобразование задается функцией Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , где у и х – реализации случайных величин Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Здесь область Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru определяется неравенством 0<ξ< Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru а область Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru - интервалом (0, Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru ) (рис. 1.12).

Из равенства Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru = Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru следует:

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru = Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru = Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

И

1 Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис. 1.12. Нелинейное преобразование Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

1.6.2. Геометрическая интерпретация нелинейного преобразования случайной величины.

На практике функцию g(x), которая описывает нелинейное преобразование, удобно аппроксимировать линейно-ломаной функцией, которая представляет собой последовательность отрезков разной длины, при этом точность аппроксимации повышается с уменьшением длин отрезков (рис. 1.13).

Таким образом, нелинейное преобразование можно аппроксимировать последовательностью линейных преобразований, каждое из которых отображает некоторую область на оси х в соответствую область на оси у, например, интервал [a b] – в интервал [d c] (рис. 1.13).

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис. 1.13. Аппроксимация нелинейной функции g(x) линейно-ломаной функцией

Некоторые особенности линейного преобразования проявляются в зависимости от расположения отрезка: горизонтального, вертикального и под некоторым углом. Эти особенности рассмотрим на конкретных примерах.

в)
б)
а)
Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис. 1.14. Геометрическое представление нелинейного преобразования случайной величины

а) Исходный закон распределения; б) нелинейное преобразование в виде z-функции; в) закон распределения случайной величины у, полученной в результате нелинейного преобразования

На рис. 1.14 продемонстрирован процесс нелинейного преобразования непрерывной случайной величины х в дискретную случайную величину Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

В этом случае вероятность p(-a) = p(x0<x), а вероятность p(a) = p(x<x0), при этом вероятность p(x0<x) равна площади под плотностью распределения Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru правее x0, а вероятность p(x<x0) – левее x0.

Закон распределения дискретной случайной величины можно описать в виде плотности распределения вероятностей, если воспользоваться дельта-функцией: Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , где дельта функция

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Геометрически δ-функция изображается стрелкой.

Дельта-функцию можно рассматривать как предел последовательности функций, площадь под которыми всегда равна единице, а значение в точке x=0 неограниченно растет. В частном случае δ-функцию можно получить как предел функции, изображенной на рис. , где значение ε является ее параметром.

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис. 1.15. δ-функция ______

При стремлении значения ε к нулю в пределе получается δ-функция.

Таким образом, наличие горизонтальных участков в линейно-ломаной функции всегда приводит к появлению δ-функций в плотности распределения Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru преобразованной случайной величины.

Рассмотрим преобразование случайной величины, линейно-ломаная функция которого содержит отрезок, расположенный под некоторым углом (рис. 1.16)

в)
б)
а)
Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис. 1.16. Геометрическое представление нелинейного преобразования случайной величины

а) Исходный закон распределения; б) нелинейное преобразование; в) закон распределения случайной величины у, полученной в результате нелинейного преобразования)

В этом случае вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , а вероятность Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Случайная величина х на интервале [c,d] преобразуется линейно с масштабным коэффициентом k, равным Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , при этом вероятностная мера интервала [c,d] сохраняется, то есть площадь под плотностью Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru на интервале [c,d]равна площади под плотностью Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru на интервале [-a,a]. Если масштабный коэффициент равен единице Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , то плотности Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru на этих интервалах совпадают при положительном значении тангенса угла наклона отрезка, а при отрицательном – совпадают плотности Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Таким образом, если длина интервала, равная 2а, увеличивается в k раз по сравнению с интервалом, равным (d-c), то во столько же раз уменьшается масштабный коэффициент по оси Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , что обеспечивает сохранение вероятностной меры.

Рассмотрим случай, когда линейно-ломаная функция содержит отрезок с вертикальным расположением (рис. 1.17)

а)
б)
в)
Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис. 1.17. Геометрическое представление нелинейного преобразования случайной величины (линейно-ломаная функция содержит отрезок с вертикальным расположением)

а) Исходный закон распределения, б) нелинейное преобразование; в) закон распределения случайной величины у; полученной в результате нелинейного преобразования)

Этот пример отличается от предыдущего только переносом δ-функции из точки a в точку m, при этом вероятностная мера отрезка (a, m) равна 0, поскольку он является отображением всего одной точки с вероятностной мерой, равной нулю.

В предыдущих примерах линейные преобразования считались взаимно- однозначными. Рассмотрим пример с взаимно-неоднозначным преобразованием (рис. 1.18).

в)
б)
а)
Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Рис. 1.18. Пример нелинейного взаимно-неоднозначного преобразования случайной величины

а) Исходный закон распределения, б) нелинейное взаимно-неоднозначное преобразование, в) закон распределения случайной величины у, полученной в результате нелинейного взаимно-неоднозначного преобразования)

В этом случае нелинейное преобразование необходимо представить в виде двух взаимно-однозначных преобразований, правее точки x0 и левее, и для каждого из них в отдельности получить результат преобразования. Окончательный результат получается как сумма отдельных результатов, поскольку события правее x0 и левее x0 несовместны. Окончательный результат изображен сплошной линией.

Функция регрессии.

Линейная функция регрессия.

В некоторых случаях вводится ограничение на вид возможных функций Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , например, ограничиваются классом линейных функций Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , которые записываются в виде Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru + Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru . Выбор оптимальной функции из этого класса, т.е. той, которая дает оценку с минимальной среднеквадратической ошибкой, сводится к определению коэффициентов Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

Функция Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru = Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru + Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , для которой среднеквадратическая ошибка

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

минимальна, называется функцией линейной регрессии, а соответствующие коэффициенты Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru – коэффициентами регрессии.

Обозначив через Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru средние значения случайных величин Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , коэффициенты регрессии можно определить, если сделать следующие тождественные преобразования:

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , где Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru - центрированные случайные величины.

Тогда Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , (1.2)

где Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru по определению дисперсии случайных величин Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru как среднее значение от центрированных случайных величин.

Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru = Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru

среднее от произведения двух центрированных случайных величин Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru называется корреляцией между этими случайными величинами. Иногда удобнее использовать коэффициент корреляции r = Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru = Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru , который определяется как среднее значение от произведения центрированных и нормированных случайных величин Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru и Д.В. Ломакин, Л.С. Ломакина, А.С. Пожидаева - student2.ru .

С учетом введенных обозначений можно произвести следующие тождественные преобразования выражения (1.2):