Первичная обработка статистических данных.
Необходимо построить вариационные ряды. Построить гистограммы. Определить значения точечных оценок числовых характеристик случайных величин.
Интервальные оценки числовых характеристик случайных величин.
Построение доверительных интервалов для математических ожиданий и дисперсий. Приобретение навыков работы с таблицами специальных распределений математической статистики.
Статистическая проверка гипотез.
Решаются три задачи. Проверка гипотез о равенстве значений числовых характеристик некоторому фиксированному числу. Проверка гипотез о совпадении значений одноимённых числовых характеристик двух случайных величин.
Проверка гипотезы о виде закона распределения исследуемой случайной величины.
Критерий «согласия» Пирсона. Проверка гипотезы о совпадении законов распределения двух случайных величин.
Корреляционный анализ.
Оценка силы статистической связи между случайными величинами. Определение методом наименьших квадратов статистических оценок коэффициентов функции регрессии. Построение соответствующей геометрической иллюстрации.
Все задания выполняются последовательно по мере накопления теоретического материала. Студент представляет для зачёта каждое выполненное задание. Выполнение заданий предполагает использование персонального компьютера. Все задания представляются в распечатанном виде. После получения зачёта выполненные задания остаются у студента и могут в дальнейшем быть использованы как руководства по математической обработке статистических материалов.
Образцы статистических данных для выполнения индивидуальных заданий
Вариант № образец
Двумерная случайная величина дискретного типа
Длина слова (выборки и ) и количество гласных в этом слове (выборки и ) в орфографическом словаре русского языка.
№ | № | ||||||||
Вариант № образец
Двумерная случайная величина непрерывного типа
Рост (см) (выборки и ) и Длина окружности грудной клетки (см) (выборки и ) двух групп обследованных юношей-призывников.
№ | № | ||||||||
157,5 | 84,0 | 159,5 | 85,0 | 162,5 | 87,5 | 170,0 | 88,5 | ||
165,0 | 89,5 | 169,5 | 88,0 | 168,0 | 86,5 | 161,5 | 87,5 | ||
160,0 | 82,5 | 155,5 | 81,5 | 157,0 | 80,5 | 166,5 | 88,0 | ||
164,0 | 85,0 | 164,5 | 88,5 | 163,5 | 90,0 | 154,0 | 80,0 | ||
162,0 | 84,5 | 173,0 | 83,5 | 160,5 | 87,0 | 168,5 | 83,0 | ||
165,5 | 85,0 | 158,5 | 86,5 | 169,5 | 86,5 | 162,5 | 89,0 | ||
169,5 | 87,0 | 173,5 | 91,5 | 166,5 | 84,0 | 165,0 | 86,0 | ||
155,5 | 78,0 | 165,5 | 81,5 | 164,0 | 87,0 | 160,0 | 84,0 | ||
172,5 | 83,5 | 161,5 | 78,0 | 175,0 | 83,5 | 177,0 | 90,0 | ||
163,0 | 83,0 | 166,5 | 89,5 | 158,0 | 84,5 | 164,0 | 87,5 | ||
158,5 | 83,0 | 152,0 | 81,5 | 162,0 | 88,0 | 174,5 | 90,0 | ||
166,0 | 90,0 | 166,0 | 87,0 | 158,5 | 89,5 | 158,5 | 81,5 | ||
168,5 | 91,5 | 163,0 | 84,5 | 174,5 | 88,5 | 166,0 | 90,0 | ||
161,0 | 80,0 | 167,0 | 86,5 | 166,5 | 88,0 | 167,0 | 88,5 | ||
167,0 | 84,5 | 157,5 | 79,5 | 163,0 | 86,0 | 160,0 | 81,5 | ||
153,0 | 79,5 | 167,5 | 81,0 | 165,5 | 83,5 | 168,5 | 85,5 | ||
164,5 | 79,0 | 162,0 | 79,5 | 170,5 | 86,0 | 162,5 | 83,5 | ||
165,5 | 88,5 | 164,5 | 79,0 | 160,0 | 86,0 | 163,5 | 91,5 | ||
160,0 | 88,0 | 169,0 | 87,0 | 163,5 | 80,5 | 167,5 | 85,0 | ||
167,5 | 79,5 | 160,5 | 81,0 | 176,5 | 87,5 | 157,0 | 85,5 | ||
162,5 | 79,0 | 170,5 | 81,5 | 154,5 | 85,0 | 172,5 | 92,0 | ||
171,0 | 85,5 | 162,5 | 85,0 | 172,0 | 91,5 | 164,5 | 88,0 | ||
158,0 | 77,5 | 164,0 | 93,0 | 162,5 | 83,5 | 160,0 | 90,0 | ||
168,0 | 89,0 | 171,5 | 85,0 | 169,0 | 85,5 | 175,0 | 89,5 | ||
163,5 | 84,5 | 153,5 | 79,5 | 156,5 | 82,0 | 166,0 | 86,0 | ||
170,0 | 91,0 | 170,5 | 91,0 | 164,0 | 86,0 | 161,0 | 86,0 | ||
161,0 | 80,5 | 165,5 | 83,5 | 168,0 | 85,0 | 170,5 | 83,5 | ||
172,5 | 89,5 | 163,0 | 83,5 | 159,5 | 84,5 | 162,5 | 82,5 | ||
162,0 | 85,0 | 163,0 | 84,0 | 165,0 | 81,5 | 174,5 | 87,5 | ||
164,0 | 91,5 | 166,5 | 91,5 | 171,0 | 83,5 | 161,0 | 86,5 | ||
156,0 | 78,5 | 158,0 | 83,0 | 161,0 | 79,5 | 167,5 | 84,5 | ||
165,0 | 86,5 | 165,0 | 86,5 | 174,0 | 87,0 | 165,0 | 81,0 | ||
169,0 | 93,5 | 168,0 | 90,0 | 158,5 | 87,5 | 153,0 | 83,5 | ||
160,0 | 83,0 | 169,5 | 84,5 | 166,0 | 81,5 | 169,0 | 93,5 | ||
164,5 | 77,5 | 164,5 | 89,0 | 169,5 | 87,0 | 163,5 | 89,5 | ||
173,0 | 85,5 | 169,0 | 81,5 | 162,5 | 89,5 | 162,0 | 80,0 | ||
154,0 | 79,5 | 156,0 | 82,0 | 172,5 | 86,5 | 161,0 | 82,0 | ||
167,0 | 87,5 | 167,0 | 84,0 | 152,0 | 84,0 | 167,0 | 85,0 | ||
161,5 | 80,5 | 163,5 | 168,5 | 83,0 | 171,0 | 85,5 | |||
168,5 | 81,5 | 169,5 | 90,5 | 160,5 | 83,5 | 156,5 | 83,5 | ||
165,5 | 79,5 | 157,5 | 86,5 | 157,5 | 80,0 | 164,5 | 81,5 | ||
169,0 | 80,5 | 171,0 | 89,0 | 170,5 | 87,5 | 169,0 | 86,5 | ||
166,0 | 85,5 | 161,5 | 80,5 | 162,0 | 84,0 | 159,5 | 82,5 | ||
170,0 | 79,5 | 173,0 | 85,5 | 165,0 | 91,0 | 168,0 | 83,5 | ||
163,0 | 82,5 | 165,5 | 87,5 | 157,0 | 84,5 | 166,0 | 89,0 | ||
166,5 | 81,5 | 156,5 | 87,0 | 163,5 | 83,0 | 156,0 | 85,0 | ||
150,0 | 83,0 | 172,0 | 87,0 | 167,5 | 90,0 | 166,5 | 93,5 | ||
167,5 | 84,5 | 162,5 | 86,5 | 160,0 | 81,0 | 168,0 | 87,5 | ||
159,5 | 89,5 | 174,0 | 85,5 | 167,0 | 86,5 | 160,5 | 88,0 | ||
171,5 | 89,5 | 159,0 | 83,5 | 164,0 | 87,5 | 168,5 | 87,0 |
VII.ГЛОССАРИЙ
А
Аддитивная функция– функция множеств- элементов алгебры A, для которой из условия ø следует, что .
Алгебра множеств – система подмножеств A множества W, элементы которой удовлетворяют следующим требованиям:
а) A; б) для любых A и B, принадлежащих A, следует, что A и A;в) если A, то A.
Б
Борелевская алгебра множествB()– система подмножеств множества действительных чисел R, получающаяся путём применения операций объединения, пересечения и дополнения к элементам системы , где aи b – произвольные действительные числа.
В
Вероятностное пространство <W,A, P> -тройка объектов, где
W- множество элементарных исходов;
A - -алгебра случайных событий;
P – вероятностная функция.
Д
Дискретная случайная величина –случайная величина, областью возможных значений которой является не более чем счётное множествоD действительных чисел . Закон распределения вероятностей дискретной случайной величины задаётся путём определения набора положительных чисел , таких, что . Здесь: .
Дисперсия случайной величины - мера разброса значений случайной величины около её математического ожидания.
Доверительный интервал - интервал, в котором с вероятностью, не меньшей чем , находится значение неизвестной числовой характеристики , то есть интервал, для которого справедливо: .
З
Закон больших чисел (ЗБЧ)– совокупность теорем, в которых на последовательность случайных величин , налагаются условия, при которых их среднее арифметическое сходится по вероятности к постоянной величине – среднему арифметическому их математических ожиданий: .
И
Измеримое пространство <W,A> -пара объектов, где W - множество элементарных исходов,A -алгебраслучайных событий, на которой вводится числовая функция множеств , которая при выполнении условий нормированности и аддитивности, называется вероятностной мерой множества A.
К
Классическое определение вероятности – определение вероятности наступления случайного события, основанное на равновозможности реализации элементарных исходов конечного множества элементарных исходов W. Если мощность множества Wравна , а мощность подмножества A, являющегося случайным событием, равна , то по классическому определению вероятности вероятность наступления случайного события A будет равна .
Ковариационный момент– смешанный центральный момент второго порядка двумерной случайной величины:
.
Компонента случайного вектора–скалярная случайная величина , являющаяся проекцией случайного вектора наk-тую координатную ось . То есть, если и - проектор, отображающий в , то является композицией отображений:
.
Коэффициент линейной корреляции –мера статистической силы связи между случайными величинами. Вычисляется по формуле . Применяется в тех случаях, когда статистическая связь имеет линейный характер.
Критерий проверки основной гипотезы– случайная величина, статистика элементов выборки, закон распределения вероятностей которой зависит от предполагаемой гипотезы.
М
Математическое ожидание– числовая характеристика случайной величины, . Математическое ожидание есть среднее значение случайной величины . Интерпретируется как координата центра тяжести единичной массы распределённой на числовой оси.
Множество элементарных исходов –множество, элементами, которого является все возможные элементарные исходы. В результате проведения испытания всегда реализуется один, и только один элементарный исход.
Н
Начальный момент k-того порядка –числовая характеристика случайной величины, являющаяся значением абсолютно сходящегося несобственного интеграла от функции по функции распределения случайной величины, то есть: .
Независимость случайных величин.Случайные величины и называются независимыми, если закон распределения вероятностей одной из них не зависит от другой случайной величины.
Точнее: пусть случайные величины и являются компонентами двумерной случайной величины , принимающей значения в . Эти компоненты называются независимыми, если для любого множества B, B( 2), представимого как декартово произведение , и , будет справедливо:
,
Где и - частные вероятностные функции компонент.
Независимость случайных величин непрерывного типа –Случайные величинынепрерывного типа и (компоненты двумерного случайного вектора) будут независимыми тогда, только тогда, когда для любой пары выполняется равенство , где - плотность вероятности двумерного случайного вектора , а и - плотности вероятностей его компонент и .
Независимость случайных величин дискретного типа –Случайные величиныдискретного типа и (компоненты двумерного случайного вектора) будут независимыми тогда, только тогда, когда для любой пары выполняется равенство , где , а и .
Независимость случайных событий.Случайные события называются независимыми, если условная вероятность наступления любого из них равна его безусловной вероятности: или .
Непрерывная случайная величина–случайная величина, областью возможных значений которой является множество Dмощности континуум и положительной меры Лебега. Закон распределения вероятностей непрерывной случайной величины задаётся путём определения на этом множестве плотности вероятности - кусочно-непрерывной, неотрицательной функции, такой что .
Несмещённость точечной оценки.Точечная оценка числовой характеристики называется несмещённой, если .
О
Остаточная дисперсия –мера разброса значений одной из компонент (например ) двумерной случайной величины около её математического ожидания, вызванного внутренними свойствами этой компоненты. При линейном виде статистической связи между компонентами величина остаточной дисперсиикомпоненты равна , где -коэффициент линейной корреляции между компонентами и .
Ошибка Iрода –отклонение верной гипотезы . Возникает в том случае, когда при справедливости в реальности гипотезы наблюдаемое значение критерия попадает в критическую область . Вероятность ошибки Iрода равна .
Ошибка II рода –принятие неверной гипотезы . Возникает в том случае, когда при справедливости в реальности гипотезы наблюдаемое значение критерия попадает в область допустимых значений . Вероятность ошибки IIрода равна .
П
Повторные независимые испытания –серия одинаковых испытаний, в каждом из которых с постоянными вероятностями pиq может произойти только одно из взаимно противоположных событий Aили .
Плотность вероятности– неотрицательная, кусочно-непрерывная функция, удовлетворяющая условию: . Плотность вероятности описывает распределение вероятностей случайной величины непрерывного типа.
Р
Распределение - (распределение Пирсона) распределение вероятностей случайной величины , где все независимые случайные величины, имеющие нормальное распределение вероятностей N(0;1).
Распределение Стьюдента –(t-распределение) распределение вероятностей случайной величины , где все независимые случайные величины, имеющие нормальное распределение вероятностей N(0;1).
Распределение Фишера-Снедекора –(F-распределение) распределение вероятностей случайной величины .
Ряд распределения– таблица, состоящая из двух строк, с помощью которой задаётся закон распределения дискретной случайной величины:
.
Где или ; . Всегда .
С
Свёртка функций распределения –несобственный интеграл, определяющий функцию распределения случайной величины, являющейся суммой независимых случайных величин. Если , то функция распределения будет равна: , где и - функции распределения случайных величин-слагаемых.
Состоятельность точечной оценки.Точечная оценка числовой характеристики называется состоятельной, еслиона сходится по вероятности к этой точечной оценке, то есть: .
Статистика– любая функция элементов выборки : .
Сходимость по вероятности. Последовательность случайных величин сходится по вероятности к случайной величине (обозначение: ), если выполняется условие .
Сходимость по распределению. Последовательность случайных величин сходится по распределению к случайной величине (обозначение: ), если соответствующая последовательность функций распределения слабо сходится к функции распределения случайной величины ( ).
У
Условная вероятность -вероятность наступления случайного события A, вычисленная при предположении, что случайное событие B произошло. Определяется по формуле: .
Условная плотность вероятности -плотность вероятности условной случайной величины , является законом распределения вероятностей второй компоненты при любом фиксированном значении первой компоненты. Определяется по формуле:, где - плотность вероятности двумерной случайной величины , -частная плотность вероятности первой компоненты.
Ф
Функция распределения –функция , описывающая изменение вероятности случайного события при изменении x, то есть . Определяя функцию распределения , мы задаём закон распределения вероятностей случайной величины .
Функция распределения вектора -функция , описывающая изменение вероятности случайного события , где , при изменении , то есть . Определяя функцию распределения , мы задаём закон распределения вероятностей случайного вектора .
Функция регрессии –функция, описывающая зависимость значений условных математических ожиданий одной из компонент двумерной случайной величины от другой компоненты. Функция - функция регрессии компоненты на изменение компоненты . Функция - функция регрессии компоненты на изменение компоненты .
Х
Характеристическая функция –комплексно-значная функция действительного аргумента, являющаяся математическим ожиданием функции случайной величины , где , то есть: .
Ч
Частная функция распределения –функция распределения любой k-той компоненты вектора . Определение частной функции распределения основано на свойстве согласованности функции распределения многомерной случайной величины, например, если n=2, то и .
Частные распределения компонент случайного вектора -распределения вероятностей компонент вектора, являющихся скалярными случайными величинами. Частное распределение каждой компоненты получается как проекция вероятностной функции вектора на соответствующую координатную ось. Если и P вероятностная функция вектора, то частное распределение компоненты определяется равенством: , где B(). Аналогично, частное распределение компоненты определяется равенством: , где B().
Ц
Центральная предельная теорема (ЦПТ) –совокупность теорем, в которых на последовательность случайных величин , налагаются условия, при которых их центрированная и нормированная сумма сходится по распределению к нормальному закону N(0;1).
Э
Эффективная оценка–точечная оценка числовой характеристики, имеющая наименьшую дисперсию.
VIII.Вопросы для тестирования по курсу
«Теория вероятностей и математическая статистика»
1. Противоположным событием случайному событию будет событие:а) событие ;б) событие ;в) событие .
2.Вероятности наступления случайных событий и равны и . Эти случайные события: а) совместные;б) несовместные;в) взаимно противоположные.
3.Гипотезы, формулируемые при применении формулы полной вероятности, должны быть: а) попарно независимыми; б) попарно несовместными; в) взаимно противоположными.
4.Аддитивная функция множеств и удовлетворяет условию:а) всегда , если ;
б) всегда , если ;
в) всегда , если .
5.Требование счётно<