Статистическое распределение выборки

Глава 5 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

Математическая статистика – раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей. В математической статистике решаются две категории задач: оценивание и статистическая проверка гипотез. Первая задача разделяется на точечное оценивание и интервальное оценивание параметров распределения. Вторая задача заключается в том, что мы делаем предположение о распределении вероятностей случайной величины и решаем, согласуются ли эти значения параметров с полученными результатами наблюдения.

Выборочный метод

Совокупность всех подлежащих изучению объектов или возможных результатов наблюдений, проводимых в неизменных условиях над одним объектом, называется генеральной совокупностью.

Выборочной совокупностью (выборкой) называется совокупность объектов, отобранных случайным образом из генеральной совокупности. Число объектов в совокупности называется ее объемом. Считается, что объем генеральной выборки бесконечен. Конкретные значения выборки, полученные в результате наблюдений, называют реализацией выборки и обозначают Статистическое распределение выборки - student2.ru Выборки разделяются на повторные (с возвращением) и бесповторные (без возвращения). Выборка должна достаточно полно отражать особенности всех объектов генеральной совокупности, т.е. выборка должна быть репрезентативной.

Выборки различаются по способу отбора:

1) Простой случайный выбор – все элементы генеральной совокупности нумеруются и их таблицы случайных чисел берут, например, последовательность любых 30-ти идущих подряд чисел.

2) Типический отбор – производится тогда, когда генеральную совокупность можно представить в виде объединения подмножеств, состоящих из однородных объектов.

3) Механический – отбирают каждый сотый интервал.

4) Серийный отбор.

Статистическое распределение выборки

Пусть изучается случайная величина, над ней производится ряд независимых опытов. Величина Статистическое распределение выборки - student2.ru принимает то или иное значение. Пусть она приняла Статистическое распределение выборки - student2.ru раз значение Статистическое распределение выборки - student2.ru , Статистическое распределение выборки - student2.ru раз – значение Статистическое распределение выборки - student2.ru ,…, Статистическое распределение выборки - student2.ru раз – значение Статистическое распределение выборки - student2.ru . При этом Статистическое распределение выборки - student2.ru объем выборки. Значения Статистическое распределение выборки - student2.ru называются вариантами случайной величины Статистическое распределение выборки - student2.ru . Всю совокупность значений случайной величины необходимо ранжировать – расположить признаки по неубыванию. Полученная последовательность называется вариационным рядом. Числа Статистическое распределение выборки - student2.ru , показывающие сколько раз встречаются варианты Статистическое распределение выборки - student2.ru в ряде наблюдений, называются частотами, а отношение их к объему выборки – частостями или относительными частотами Статистическое распределение выборки - student2.ru , т.е.

Статистическое распределение выборки - student2.ru где Статистическое распределение выборки - student2.ru . (1)

Перечень вариантов и соответствующих им частот (или частостей) называется статистическим распределением выборки или статистическим рядом.

Пример 1: В результате тестирования группа из 10 абитуриентов набрала баллы: 5,3,0,1,4,2,5,4,1,5. Записать выборку в виде: вариационного ряда, статистического ряда.

Решение: а) проранжируем данные, получим вариационный ряд (0,1,1,2,3,4,4,5,5,5);

б) Считаем частоту и частости вариантов Статистическое распределение выборки - student2.ru , получим статистическое распределение выборки

Статистическое распределение выборки - student2.ru
Статистическое распределение выборки - student2.ru

Статистическое распределение выборки - student2.ru Получили вариационный ряд.

или

Статистическое распределение выборки - student2.ru
Статистическое распределение выборки - student2.ru Статистическое распределение выборки - student2.ru Статистическое распределение выборки - student2.ru Статистическое распределение выборки - student2.ru Статистическое распределение выборки - student2.ru Статистическое распределение выборки - student2.ru Статистическое распределение выборки - student2.ru

Статистическое распределение выборки - student2.ru Получили статистический ряд.·

В случае, когда число значений признака велико или признак является непрерывным, составляют интервальный статистический ряд. В первую строку таблицы статистического распределения вписывают частичные промежутки Статистическое распределение выборки - student2.ru , которые берут обычно одинаковыми по длине: Статистическое распределение выборки - student2.ru . Для определения величины интервала Статистическое распределение выборки - student2.ru можно использовать формулу Стерджеса: Статистическое распределение выборки - student2.ru , где Статистическое распределение выборки - student2.ru разность между наибольшим и наименьшим значениями признака, Статистическое распределение выборки - student2.ru - число интервалов Статистическое распределение выборки - student2.ru . За начало первого интервала рекомендуется брать величину Статистическое распределение выборки - student2.ru . Во второй строчке статистического ряда вписывают количество наблюдений Статистическое распределение выборки - student2.ru , попавших в каждый интервал.

Пример 2: Измерили рост (с точность до см) 30 наудачу отобранных студентов. Результаты измерений таковы: 178, 160, 154, 183, 155, 153, 167, 186, 163, 155, 157, 175, 170, 166, 159, 173, 182, 167, 171, 169, 179, 165, 156, 179, 158, 171, 175, 173, 164, 172. Построить интервальный статистический ряд.

Решение: Для удобства проранжируем полученные данные: 153, 154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165, 166, 167, 167, 169, 170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186. Статистическое распределение выборки - student2.ru непрерывная случайная величина. Статистическое распределение выборки - student2.ru ; по формуле Стерджеса, при Статистическое распределение выборки - student2.ru , находим длину частичного интервала

Статистическое распределение выборки - student2.ru .

Примем Статистическое распределение выборки - student2.ru . Тогда Статистическое распределение выборки - student2.ru . Исходные данные разбиваем на 6 Статистическое распределение выборки - student2.ru интервалов: Статистическое распределение выборки - student2.ru Подсчитав число студентов Статистическое распределение выборки - student2.ru , попавших в каждый из полученных промежутков, получим интервальный статистический ряд:

Рост [150-156) [156-162) [162-168) [168-174) [174-180) [180-186)
Частота
Частость 0,13 0,17 0,20 0,23 0,17 0,10

Одним из способов обработки вариационного ряда является построение эмпирической функции распределения.

Статистическое распределение изображается графически в виде полигона и гистограммы. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами Статистическое распределение выборки - student2.ru ; полигоном частостей - с координатами Статистическое распределение выборки - student2.ru . Варианты Статистическое распределение выборки - student2.ru откладываются на оси абсцисс, а частоты (частности) – на оси ординат.

Для примера 1 полигон частот имеет вид:

Гистограммой частот (частостей) называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины Статистическое распределение выборки - student2.ru , а высоты равны отношению Статистическое распределение выборки - student2.ru - плотность частоты. Очевидно, площадь гистограммы частот равна объему выборки, а площадь гистограммы частостей равна единице.

Пример 3: Построим гистограмму частот для примера 2.

Решение: Находим высоты прямоугольников: Статистическое распределение выборки - student2.ru Статистическое распределение выборки - student2.ru Статистическое распределение выборки - student2.ru . Если соединить середины верхних оснований прямоугольников отрезками прямой, то получим полигон распределения.

Наши рекомендации