Точечные оценки законов распределения
Рассмотренные выше функции определяют поведение непрерывных СВ. В практике такое невозможно, т.к. все результаты измерения и случайные погрешности дискретные значения. При рассмотрении дискретных величин используются точечные оценки параметров, т.е. оценки выражаемые одним числом. В отличие от числовых характеристик оценки являются случайными величинами, зависящими от числа наблюдений n. Для получения точечных оценок ряд значений измерений xi - называемый выборкой должен быть представлена достаточным числом измерений. Точечные оценки могут быть состоятельными - при увеличении объема выборки стремятся по вероятности к истинному значению измеряемой величины (т.е. ), несмещеными - математическое ожидание которых равно оцениваемой числовой характеристики (т.е. ), эффективными - та несмещенная оценка, которая имеет наименьшую дисперсию (дисперсия ).
Состоятельными несмещенными точечными оценками являются: среднее арифметическое значение, дисперсия.
т.к. извлечение корня из дисперсии не является линейной операции, это приводит к смещению полученного результата.
Для его исправления вводят поправочный коэффициент k(n), где n - число наблюдений к(3)=1,13; к(¥)=1,03. МО и СКО являются случайными величинами, рассеяние этих оценок целесообразно оценивать с помощью СКО Sx и Ss.
Последней формулой оценивается погрешность определения СКО, где e - эксцесс. Эксцесс может быть определен двумя формулами:
Для нормального распределения e’ = 0, e = 3. - четвертый центральный момент используется для характеристики островершинности (плоско-) распределения:
В расчетах часто используется контрэксцесс, его значения лежат в диапазоне от 0 до 1. Для нормального закона он равен к = 0,6.
Третий центральный момент служит характеристикой асимметрии (скошенности), распределения. Здесь используется коэффициент асимметрии v. Для нормального закона он равен 0
р(х)
e > 3 р(х) v > 0 v = 0 v < 0
e =3
e < 3
х x
Оценки эксцесса и коэффициента асимметрии используются очень редко и находятся по формулам:
На практике необходимо получить не только точечную оценку параметров распределения (в виде числа), но и определить доверительные границы (доверительный интервал) внутри которого с заданной доверительной вероятностью Р (Р = 1 – q) находится истинное (искомое) значение результата измерений.
Доверительный интервал может быть получен двумя способами: с использованием коэффициента Стьюдента и Функции Лапласа. В обоих случаях необходимо найти точечные оценки: среднее значение и СКО, выбрать доверительную вероятность Р.
Затем при использовании коэффициента Стьюдента необходимо его определить по табл. в зависимости от числа измерений n и выбранной Р. Результат измерения может быть записан в виде:
Например: Р = 0,95; Хср = 100; n = 20; СКО = 2, оценка СКО = 0,45; t = 2,09.
[100 – 0,94 < Х < 100 + 0,94] = [99,06 < X < 100,94].
При использовании функции Лапласа интервал приобретет вид:
Например: Р = 0,95; Хср = 100; n = 20; СКО = 2, оценка СКО = 0,45.
F(zp) = 0,95/2 = 0,475; zp = 1,96; оценка СКО*zp = 0,882;
[100 – 0,88 < Х < 100 + 0,88] = [99,12 < X < 100,88]
Доверительный интервал по коэффициенту Стьюдента рассчитывается при числе измерений меньше 20, так как при числе измерений 20 - 30 распределение становится нормальным.
Если закон распределения параметра неизвестен и нет оснований утверждать, что он близок к нормальному, то используется функция Лапласа. В общем виде результат может быть записан: где t - положительное число, зависящее от n.