Эмпирическая функция распределения, свойства
Вариационный ряд. Полигон и гистограмма.
Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:
§ Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными.
Вариационный ряд распределения состоит из двух столбцов:
В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант, выраженное через частоты или частости:
Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.
Частости( ) — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.
Графическое изображение рядов распределения
Наглядно ряды распределения представляются при помощи графических изображений.
Ряды распределения изображаются в виде:
§ Полигона
§ Гистограммы
§ Кумуляты
§ Огивы
Полигон
При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.
1. Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.
Домохозяйства, состоящие из: | одного человека | двух человек | трех человек | 5 или более | всего |
Число домохозяйств в % | 19,2 | 26,2 | 22,6 | 20,5 | 100,0 |
Гистограмма
Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).
На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.
Все население | В том числе в возрасте | ||||||||
до 10 | 10-20 | 20-30 | 30-40 | 40-50 | 50-60 | 60-70 | 70 и старше | Всего | |
Численность населения | 12,1 | 15,7 | 13,6 | 16,1 | 15,3 | 10,1 | 9,8 | 7,3 | 100,0 |
Рис.1. Распределение населения России по возрастным группам
Эмпирическая функция распределения, свойства.
Пусть известно статистическое распределение частот количественного признака X. Обозначим через число наблюдений, при которых наблюдалось значение признака, меньшее x и через n – общее число наблюдений. Очевидно, относительная частота события X<x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.
Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения x относительную частоту события X<x. Таким образом, по определению , где – число вариант, меньших x, n – объем выборки.
В отличие от эмпирической функции распределения выборки, функцию распределения генеральной совокупности называют теоретической функцией распределения. Различие между этими функциями состоит в том, что теоретическая функция определяет вероятность события X<x, тогда как эмпирическая – относительную частоту этого же события.
При росте n относительная частота события X<x, т.е. стремится по вероятности к вероятности этого события. Иными словами:
Основные свойства
Пусть зафиксирован элементарный исход . Тогда является функцией распределения дискретного распределения, задаваемого следующейфункцией вероятности:
,
где , а — количество элементов выборки, равных . В частности, если все элементы выборки различны, то .
Математическое ожидание этого распределения имеет вид:
.
Таким образом выборочное среднее — это теоретическое среднее выборочного распределения.
Аналогично, выборочная дисперсия — это теоретическая дисперсия выборочного распределения.
Случайная величина имеет биномиальное распределение:
.
Выборочная функция распределения является несмещённой оценкой функции распределения :
.
Дисперсия выборочной функции распределения имеет вид:
.
Согласно усиленному закону больших чисел, выборочная функция распределения сходится почти наверное к теоретической функции распределения:
почти наверное при .
Выборочная функция распределения является асимптотически нормальной оценкой теоретической функции распределения. Если , то
по распределению при .