Модуль 4.Числовые характеристики случайных величин и векторов

Цель модуля:На основе расширения понятия интеграла как интеграла от непрерывной функции по вероятностной мере определить понятия числовых характеристик. Показать на основе механической и геометрической интерпретации распределения вероятностной меры вероятностный смысл числовых характеристик. Научиться вычислять значения числовых характеристики понимать их роль в изучении особенностейзаконов распределения случайных величин.

Использование определения интеграла Римана-Стилтьеса от непрерывной функции Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru по вероятностной функции P позволяет в единой форме и независимо от типа случайной величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , определять:

а) законы распределения функций случайных величин;

б) значения различных числовых характеристик случайных величин.

И в определении интеграла Римана, и в определении интеграла Римана-Стилтьеса областьQ Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru W, по которой производится интегрирование, разбивается на отрезки Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru В определении интеграла Римана при составлении интегральных сумм Дарбу используется мера Лебега – длина этих отрезков: Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . В определении интеграла Римана-Стилтьеса при составлении интегральных сумм, аналогичных суммам Дарбу, используется вероятностная мера этих отрезков: Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . В зависимости от типа вероятностной функции P интеграл Римана-Стилтьеса есть или сумма числового ряда, или определённый интеграл Римана.

Закон распределения случайной величины, записанный в одной из его форм с помощью вероятностной функции P или с помощью функции распределения Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , даёт нам всю информацию об исследуемой случайной величине Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Числовые характеристики дают меньше информации о характере распределения возможных значений случайной величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , но в них аккумулированы наиболее характерные её свойства, которые позволяют нам судить о некоторых важнейших особенностях случайной величины. Такими характеристиками являются начальные и центральные моменты случайной величины, а так же – функции от них.

Наиболее употребительными числовыми характеристиками являются математическое ожидание– среднее значение случайной величины и дисперсия– мера рассеяния, разброса значений случайной величины около её математического ожидания.

Знание числовых значений математического ожидания и дисперсии служит задаче формулирования выводов о случайной величине и первичного представления о характере распределения её возможных значений.

При исследовании многомерной случайной величины, помимо математических ожиданий и дисперсий её компонент, рассматриваются ковариационные моменты, показывающие наличие и силу статистической связи между компонентами. Если статистические связи между компонентами имеют линейный характер, то в качестве оценки силы этой связи используется коэффициент линейной корреляции.

Функция регрессии, какого бы вида она ни была, описывает изменение значений условных математических ожиданий одной из компонент случайного вектора при изменении другой компоненты. То есть функция регрессии описывает изменение средних значений одной из случайных величин, когда другая случайная величина изменяется в области своих возможных значений.

Модуль 5. Классическая предельная проблема теории вероятностей

Цель модуля:Показать, что решение многих практических задач (в математике и механике, экономике и финансах, физике и химии, биологии и геологии и т.п.) базируется на основе знания законов распределения случайных величин, являющихся суммами большого числа независимых случайных величин – факторов.Знание результатов решения классической предельной проблемы позволит принимать план действий и делать обоснованные выводы при решении задач математической статистики.

В предельной проблеме теории вероятностей изучаются законы распределения случайных величин, являющиеся суммамислучайных величин: Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , когда число слагаемых неограниченно возрастает Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Проблема называется классической потому, что мы рассматриваем последовательности Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru только таких случайных величин, у которых существует конечный начальный момент второго порядка, то есть Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Придерживаясь исторического аспекта в изложении предельной проблемы, сначала рассматриваем случайную величину, имеющую биномиальное распределение вероятностей Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

1) Если проводится большое число повторных независимых испытаний (n – велико), то решение практических задач проводится путём применения локальной и интегральной теорем Муавра-Лапласа, согласно которым:

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , где Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , где Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , где Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Суть этих теорем состоит в том, что при больших значениях n биномиальное распределение вероятностей хорошо аппроксимируется нормальным распределением N Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Причём с увеличением n точность аппроксимации возрастает.

То есть из интегральной теоремы Муавра-Лапласа следует, что для функции распределения случайной величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru будет справедливо:

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , где Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru - функция распределения нормального закона N(0,1).

2) Случайная величина Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru есть относительная частота наступления события Aпри проведении n испытаний. Теорема Бернулли утверждает, что при неограниченном увеличении числа испытаний с вероятностью близкой к единице, то есть практически достоверно, можно утверждать, значения относительной частоты будут очень мало отличаться от p -вероятности наступления события A в одном испытании:

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Суть этой теоремы состоит в том, что при неограниченном увеличении n относительная частота с вероятностью близкой к единице ведёт себя как постоянная величина p.

3) Если вероятность p наступления события A в одном испытании «очень мала», а проводится большое число испытаний то, согласно теореме Пуассона, хорошую аппроксимацию биномиального распределения вероятностей возможных значений случайной величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru можно получить, используя распределение Пуассона, то есть:

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , где Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Случайная величина Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , является суммой n независимых бернуллиевских случайных величин Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , каждая из которых есть результат проведения одного испытания, Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . То есть: Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Так как Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru и Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , то, заменив Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , интегральную теорему Муавра-Лапласа можно переписать так:

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Случайную величину Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru будем называть центрированной и нормированной суммой.

Интегральную теорему Муавра-Лапласа можно теперь сформулировать так:

Если Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , последовательность независимых, одинаково распределённых бернуллиевских случайных величин, то, при Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , последовательность функций распределения случайных величин Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru сходится к функции распределения нормального закона N(0,1):

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Аналогично теорему Бернулли можно, переписать так:

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Если обозначить: Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , то теорему Бернулли сформулируем так:

Если Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , последовательность независимых, одинаково распределённых бернуллиевских случайных величин, то, при Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , случайная величина Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru с вероятностью близкой к единице принимает значения, мало отличающиеся от нуля:

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Обращаясь к теореме Пуассона, рассмотрим «двойную» последовательность бернуллиевских случайных величин Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Для каждого nслучайные величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , имеют одинаковое распределение Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Вероятности Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru уменьшаются с изменением n. Обозначим Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Теорема Пуассона:

Если Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , но так что Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , то, при Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , случайная величина Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru имеет распределение вероятностей мало отличающееся от распределения вероятностей закона Пуассона, то есть:

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Суммируя всё, можем сказать, что для случайной величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , являющейся суммой независимых бернуллиевских случайных величин Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , в качестве предельного распределения вероятностей при Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru будет нормальное, вырожденное или пуассоновское распределение вероятностей.

Естественно возникает вопрос: «А если снять ограничение, состоящее в том, что случайные величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru - бернуллиевские? Какие ограничения надо наложить на последовательностьслучайных величин Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , чтобы их суммы Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru и Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru в качестве предельного при Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru имели, соответственно, нормальное, вырожденное и пуассоновское распределение вероятностей?».

Определяем три новых понятия: «Закон больших чисел», «Центральная предельная теорема» и «Закон малых чисел». Знакомимся с теоремами, в которых на последовательностислучайных величин Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru налагаются ограничения, при которых:

1) Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru имеет распределение, мало отличающееся от нормального ( Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru N(0,1));

2) Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru имеет распределение, мало отличающееся отвырожденного ( Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru );

3) Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru имеет распределение, мало отличающееся от распределения Пуассона ( Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru ( Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru )).

Необходимо уметь объяснить практическую значимость предельных теорем для последовательностей независимых случайных величин.

Математическая статистика

Модуль 6. Первичная обработка статистических данных. Точечные оценки числовых характеристик

Цель модуля:Узнать новую терминологию, понятия и определения математической статистики. Показать приёмы и правила первичной обработки статистических данных, принципы выбора точечных оценок числовых характеристик изучаемых случайных величин.

Математическая статистика - самостоятельная математическая дисциплина, имеющая свой словарь терминов, с которым мы знакомимся, как и при изучении теории вероятностей, путём введения основных понятий и определений. Изучение свойств введённых терминов и формулирование выводов, которые делаются по результатам обработки статистических данных, проводятся путём использования основных положений теории вероятностей.

Надо всё время иметь в виду, что все объекты и построения математической статистики являются экспериментальными моделями объектов и построений, которые вводились и изучались в теории вероятностей.

Первыми основными понятиями являются понятия «генеральная совокупность» и «выборка».

Генеральная совокупность– это все объекты, обладающие интересующим нас количественным признаком. Исследуемый количественный признак – случайная величина. Каждый объект генеральной совокупности имеет определённое значение количественного признака. Это значение количественного признака является одним из возможных значений случайной величины. Наблюдая объекты генеральной совокупности, мы фиксируем возможные значения случайной величины. Частота встречаемости возможных значений случайной величины определяется законом распределения вероятностей этой случайной величины.

Однако не всегда удаётся, а иногда просто невозможно, обследовать все объекты генеральной совокупности для определения значения количественного признака, которым они обладают. Для изучения случайной величины из генеральной совокупности отбирают некоторое количество объектов и определяют значения количественного признака, которым обладают эти объекты.

Полученные значения количественного признака Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru у этих объектов будут называться статистическими данными или выборкой из генеральной совокупности, если они репрезентативны. Под термином репрезентативность (представительность) мы понимаем, что полученные данные вполне отражают в общих чертах особенности количественного признака, которым обладают объекты генеральной совокупности.

Различные методики отбора объектов из генеральной совокупности, стремятся обеспечить репрезентативность получаемых данных. Мы отмечаем, что попадание каждого объекта в выборку должно быть независимым от остальных объектов. Измерения значений количественного признака у выбранных объектов должны проводиться по одной методике, в одинаковых условиях и одним и тем же инструментом.

Если полученная выборка Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru - репрезентативна, то на её элементы мы будем смотреть двояко. С одной стороны мы элементы выборки будем рассматривать как набор n чисел, являющихся значениями эмпирической случайной величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru. А с другой стороны - как на n-мерный случайный вектор Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru с независимыми, одинаково распределёнными компонентами.

При первичной обработке статистических данных строится вариационный ряд, являющийся, по существу, рядом распределения эмпирической случайной величиныМодуль 4.Числовые характеристики случайных величин и векторов - student2.ru. При этом мы считаем, что все элементы выборки - равновозможные, то есть Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Геометрическая иллюстрация вариационного ряда – гистограмма даёт наглядное представление о характере распределения вероятностей исследуемой случайной величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Теорема Гливенко показывает, что при Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru с вероятностью близкой к единице значения эмпирической функции распределения Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru будут очень мало отличаться от значений теоретической функции распределения Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru исследуемой случайной величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Случайная величина Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru имеет числовые характеристики Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru и другие. Значения этих характеристик мы не знаем, это – теоретические числа. По элементам выборки мы должны оценить эти теоретические числа - дать их точечные оценки. Так как эмпирическая случайная величинаМодуль 4.Числовые характеристики случайных величин и векторов - student2.ruпонимается нами как статистическая модель исследуемой случайной величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , то естественно принять значения числовых характеристик Модуль 4.Числовые характеристики случайных величин и векторов - student2.ruв качестве точечных оценок неизвестных значений числовых характеристик. Так как мы приняли, что Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , а эмпирическая случайная величинаМодуль 4.Числовые характеристики случайных величин и векторов - student2.ru -случайная величина дискретного типа, то Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . То есть предлагается эмпирическое математическое ожидание Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru - среднее арифметическое элементов выборки и эмпирическую дисперсию Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru принять в качестве точечных оценок.

Обобщая сказанное, теоретические числовые характеристики исследуемой случайной величины обозначим Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , а соответствующие эмпирические числовые характеристики, предлагаемые в качестве оценок, обозначим Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Любая точечная оценка Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru является функцией элементов выборки: Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Элементы, попавшие в выборку – случайные величины. Следовательно, функция Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru - случайная величина. Всякую функцию элементов выборки будем называть статистикой.

Но функций от элементов выборки можно придумать много. И каждую придуманную функцию можно предложить в качестве статистической оценки теоретической числовой характеристики. Возникает вопрос: «Как выбрать из множества предлагаемых точечных оценок наилучшую оценку?». Чтобы ответить на этот вопрос, мы должны сформулировать требования, исходящие из здравого смысла, и проверять выполнение этих требований к предлагаемым точечным оценкам. Та оценка, которая будет удовлетворять всем требованиям, будет наилучшей оценкой и будет принята в качестве точечной оценки неизвестного значения числовой характеристики.

Формулировки требований состоятельности, несмещённости и эффективности, предъявляемые к точечным оценкам, основаны на знании закона больших чисел и центральной предельной теоремы теории вероятностей. Логичность и справедливость этих требований не вызывает сомнений.

Рассматриваемые методы получения точечных оценок, позволяют обоснованным теорией вероятностей путём получать их и проверять выполнение сформулированных требований к ним.

Модуль 7. Интервальные оценки числовых характеристик

Цель модуля:Продолжить знакомство с приёмами первичной обработки статистических данных. Узнать три типа распределений случайных величин, которые используются при определении закона распределения различных функций статистических данных.

Кроме точечной оценки Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru значения теоретической числовой характеристики Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru изучаемой случайной величины исследователю иногда бывает необходимо знать интервал Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , в котором с достаточно большой степенью уверенности Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru (0,9; 0,95; 0,999,…)может находиться неизвестное значение числовой характеристики Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . То есть, при заданном уровне надёжностиМодуль 4.Числовые характеристики случайных величин и векторов - student2.ru,по имеющейся выборке Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru надо определить границы интервала Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru и Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru так, чтобы выполнялось неравенство:

Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru .

Вероятность Модуль 4.Числовые характеристики случайных величин и векторов - student2.ruназываетсядоверительной вероятностью, а интервал Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru - доверительным интервалом.

Ясно, что границы интервала, как функции элементов выборки, являются статистиками – случайными величинами: Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru и Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru . Значит для определения при заданной доверительной вероятности их числовых значений, надо знать закон распределения вероятностей этих статистик.

Наиболее часто в математической статистике используются три распределения вероятностей: распределение Пирсона, распределение Стьюдента и распределение Фишера-Снедекора. Случайные величины Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru и Модуль 4.Числовые характеристики случайных величин и векторов - student2.ru , подчиняющиеся, соответственно, этим распределениям, являются функциями независимых случайных величин, имеющих одинаковое нормальное распределение N(0,1).

Применение этих трёх распределений в математической статистике основано на предположении о нормальном распределении исследуемого количественного признака, определённого на генеральной совокупности, и некоторых статистик, что, в свою очередь, обосновывается центральной предельной теоремой теории вероятностей.

Наши рекомендации