Показатели формы распределения
На практике приходится встречаться с самыми различными распределениями. Однородные совокупности характеризуются, как правило, одновершинным распределением. Многовершинность свидетельствует о неоднородности изучаемой совокупности. При изучении распределений, отличных от нормального, возникнет необходимость количественно оценить это различие. С этой целью вводят такие характеристики, как асимметрия и коэффициент эксцесса. Для нормального распределения эти характеристики равны нулю. Поэтому, если для изучаемого распределения асимметрия и эксцесс имеют небольшие значения, то можно предположить близость этого распределения к нормальному.
1) Коэффициент асимметрии определяется по формуле:
.
Если =0, то ряд симметричен относительно моды.
При >0 скошенность вправо, средняя арифметическая правее моды, «длинная часть» кривой распределения расположена справа от моды. При правосторонней асимметрии .
При <0 скошенность влево, средняя арифметическая левее моды, «длинная часть» кривой распределения расположена слева от моды. При левосторонней асимметрии .
Напомним, что мода – точка максимума дифференциальной функции распределения.
В нашем случае:
=–0,3.
Коэффициент асимметрии отрицательный, следовательно “длинная часть” кривой, полученной на основании опытных данных, расположена слева от моды и средняя арифметическая левее моды (рисунок 3). Заметим, что в нашем случае коэффициент асимметрии близок к нулю.
Рисунок 3. – Левосторонняя асимметрия.
2) Коэффициент эксцесса определяется по формуле:
.
Если эксцесс положительный, то кривая имеет более высокую и острую вершину, чем нормальная кривая (островершинное распределение); если эксцесс отрицательный, то сравниваемая кривая имеет более низкую и "плоскую" вершину, чем нормальная кривая (плосковершинное распределение).
Замечание: . Если близок к –2, то кривая двухвершинная. При кривая распадается на две островершинные кривые, что говорит о неоднородности статистического материала.
В нашем случае:
.
Коэффициент эксцесса отрицательный, следовательно, вершина кривой ряда распределения ниже, чем у кривой нормального распределения.
Рисунок 4. – Плосковершинное распределение.
6. Точечные и интервальные оценки параметров
генеральной совокупности
Задачи математической статистики практически сводятся к оценке свойств генеральной совокупности по результатам случайной выборки.
Любую функцию от результатов выборочных наблюдений принято, называть статистикой (выборочной характеристикой). Статистики обычно и используются для построения статистических оценок параметров генеральной совокупности, когда точные значения этих параметров нам неизвестны. Статистику используемую как оценку параметра , называют точечной оценкой. Из точечных оценок в приложениях математической статистики наиболее часто используют среднюю арифметическую как оценку математического ожидания , выборочную дисперсию и среднее квадратическое отклонение , как оценки генеральной дисперсии и среднего квадратического отклонения .
В математической статистике в зависимости от задачи статистику рассматривают либо как случайную величину, либо как число (конкретную реализацию случайной величины). Возникает вопрос, каким требованиям должны отвечать точечные оценки, чтобы их можно было считать в каком-то определенном смысле "хорошими". Эти требования характеризуют понятиями несмещенности, состоятельности и эффективности.
Оценку называют несмещенной, если при любом объеме выборки n ее математическое ожидание равно оцениваемому параметру , то есть = .
В случае большой выборки оценка параметра называется состоятельной, если по мере роста числа наблюдений n (то есть в случае конечной генеральной совокупности объемом N или при в случае бесконечной генеральной совокупности) она стремится к оцениваемому параметру .
Несмещенная оценка параметра называется эффективной, если среди прочих несмещенных оценок того же параметра она обладает наименьшей дисперсией.
Точечные оценки параметров генеральной совокупности в нашем примере:
9,0548; 9,115; 9,097; 0,89;
0,7988; 9,8%; –0,3; –0,25.
Точечная оценка без указания степени точности и надежности малоинформативна, так как наблюдаемые значения статистики есть лишь значения случайной величины. Она может существенно отличаться от оцениваемого параметра при малом объеме выборки, что приводит к грубым ошибкам.
Интервальной оценкой параметра называют такой интервал , относительно которого можно утверждать с определенной, близкой к единице вероятностью , что он содержит неизвестное значение . Величину называют доверительной вероятностью или надежностью оценки параметра , , – некоторые функции от результатов выборочных наблюдений . Разность 2 = – между верхней и нижней границами доверительного интервала называют длиной доверительного интервала, а величину – точностью оценки.
Для построения интервальных оценок необходимо знать закон распределения статистики .
На практике закон распределения генеральной совокупности неизвестен. В этом случае пользуются приближенным методом построения доверительных интервалов, суть которого в следующем: если считать, что распределение выборочных характеристик в больших выборках асимптотически нормалью (для дисперсии это справедливо при , а для средней арифметической при ), то доверительные интервалы строятся следующим образом
.
где – оцениваемый параметр; * – выборочная оценка параметра; – стандартные ошибки выборочной характеристики (главный член среднего квадратического отклонения); – найденное по таблице значений функций Лапласа , соответствующее доверительной вероятности :
.
Стандартные ошибки:
а) выборочной средней :
б) выборочной дисперсии : ;
в) выборочного среднеквадратического отклонения :
г) выборочного коэффициента асимметрии :
д) выборочного коэффициента эксцесса :
е) выборочного коэффициента вариации :
ж) выборочной медианы : .
В нашем примере при имеем следующие стандартные ошибки:
а) выборочной средней :
б) выборочной дисперсии :
в) выборочного среднеквадратического отклонения :
г) выборочного коэффициента асимметрии :
д) выборочного коэффициента эксцесса :
е) выборочного коэффициента вариации :
ж) выборочной медианы :
Построим доверительные интервалы для параметров генеральной совокупности нашего примера при .
1) Для математического ожидания:
,
8,879619 9,229981.
2) Для дисперсии:
,
0,776699 0,820985.
3) Для среднеквадратического отклонения:
,
0,769908 1,017651.
4) Для коэффициента асимметрии:
,
-0,78765 0,172362.
5) Для коэффициента эксцесса:
,
-1,25322 0,666792.
6) Для коэффициента вариации:
,
8,489497 11,25207.
7) Для медианы:
,
,
8,87744 9,31656.