Точечные характеристики выборки (оценки параметров)
Вариационный ряд является статистическим аналогом (реализации) распределения признака (случайной величины Х). В этом смысле полигон (гистограмма) аналогичен кривой распределения - дифференциальной функции распределения случайной величины Х. Однако построение их достаточно громоздко. В то же время, на практике часто оказывается достаточным знание лишь числовых характеристик случайной величины (признака Х)- математического ожидания, дисперсии и т.д. Но числовые характеристики Х неизвестны и информация о них может быть получена только на основе изучения имеющихся опытных данных – выборки. В математической статистике принято говорить, что некоторые сводные характеристики выборки служат для оценивания (являются оценкой) числовых характеристик генеральной совокупности. Эти характеристики носят название точечных оценок выборки. Расчет их – следующий этап обработки опытных данных.
К точечным оценкам предъявляются требования несмещенности, состоятельности и эффективности.
Оценка параметра генеральной совокупности называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т.е.
.
Оценка параметра генеральной совокупности называется состоятельной, если она сходится по вероятности к оцениваемому параметру:
.
Эффективной называется та оценка, которая имеет наименьшую дисперсию среди других возможных оценок.
Рассмотрим эти оценки.
Выборочная средняя – (аналог математического ожидания с.в.) -средняя арифметическая значений вариант, рассчитанная по значениям вариационного ряда:
,
- варианты простого статистического ряда или середины интервалов вариационного; .
Выборочная дисперсия – (аналог дисперсии с.в.) - средняя арифметическая квадратов отклонения вариант от выборочной средней; служит характеристикой рассеяния вариант относительно выборочной средней:
.
Выборочная дисперсия не удовлетворяет свойству несмещенности, поэтому вводится также исправленная выборочная дисперсия
.
Желательно в качестве меры рассеяния иметь характеристику, выраженную в тех же единицах, что и варианты. Поэтому вводится среднее выборочное квадратическое отклонение:
.
Рассматривается также безразмерная характеристика – коэффициент вариации, который служит для оценки однородности опытных данных:
% .
Мода – варианта, которой соответствует наибольшая частота;
Медиана – значение признака, приходящееся на середину вариационного ряда (количество вариант меньших равно количеству вариант больших ).
Для дискретного ряда из нечетного числа членов медиана равна серединной варианте, для ряда из четного числа членов – полусумме двух серединных вариант.