Полигон частот. Выборочная функция распределения и гистограмма
Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Одним из них является полигон частот- ломаная, отрезки которой соединяют точки с координатами …, где откладываются на оси абсцисс, а – на оси ординат. Если на оси ординат откладывать не абсолютные , а относительные частоты, то получают полигон относительных частот.
Рис.1
Определение. Выборочной (эмпирической) функцией распределения называют функцию , определяющую для каждого значения х относительную частоту события Таким образом,
,
где – число вариант, меньших х, п – объем выборки.
Замечание. В отличие от эмпирической функции распределения, найденной опытным путем, функцию распределения генеральной совокупности называют теоретической функцией распределения. Функция определяет вероятность события , а – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, стремится по вероятности к .
Из определения эмпирической функции распределения следует, что ее свойства совпадают со свойствами . Именно.
1)
2) – неубывающая функция;
3) если – наименьшая варианта, то при ; если – наибольшая варианта, то при .
Графической иллюстрацией непрерывного признака является гистограмма, т.е. ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотами – отрезки длиной (гистограмма частот) или (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором – единице.
Рис. 2
Одной из задач математической статистики является оценка по имеющейся выборке значений числовых характеристик исследуемой случайной величины.
Определение. Выборочным среднимназывается среднее арифметическое значений случайной величины, принимаемых в выборке:
,
где – варианты, - частоты.
Выборочное среднее необходимо для оценки математического ожидания исследуемой случайной величины.
Определение. Выборочной дисперсией называется величина
,
а выборочным средним квадратическим отклонением– величина
Так же, как в теории случайных величин, можно доказать, что справедлива следующая формула для вычисления выборочной дисперсии:
.
Пример. Найти числовые характеристики выборки, заданной статистическим рядом
Другими характеристиками вариационного ряда являются:
- мода – варианта, имеющая наибольшую частоту (в предыдущем примере ).
- медиана- варианта, которая делит вариационный ряд на две части, равные по числу вариант. Если число вариант нечетно то . Если число вариант четно , то . В частности, в рассмотренном примере
Оценки начальных и центральных моментов (так называемые эмпирические моменты) определяются аналогично соответствующим теоретическим моментам:
-начальным эмпирическим моментом порядка k называется величина:
.
В частности, , т.е. начальный эмпирический момент первого порядка равен выборочному среднему.
- центральным эмпирическим моментом порядка k называется величина
.
В частности, , т.е. центральный эмпирический момент второго порядка равен выборочной дисперсии.