Определение точечных оценок закона распределения результатов наблюдений
В математической статистике под оценками понимают приближенные значения искомой (истинной) величины, полученные на основании результатов выборочного исследования и обеспечивающие возможность принятия обоснованных решений о неизвестных параметрах генеральной совокупности /1/.
Чтобы оценки истинного значения измеряемой величины были надёжными, представительными, к ним предъявляется ряд требований. При этом следует помнить о том, что, производя оценку истинного значения измеряемой величины по результатам измерений, мы пользуемся методами теории вероятностей, применяемыми для оценки неизвестных параметров функции распределения случайной величины /5, 6/, т. е. оценки являются случайными величинами. Так, для нормального закона числовыми параметрами распределения являются математическое ожидание и дисперсия. Обычно при обработке результатов измерений оценку математического ожидания в виде среднего арифметического значения сопоставляют с оценкой истинного значения измеряемой величины. Но истинное значение, как определено в разделе 1, является неизвестной нам величиной, имеющей единственное значение. Поэтому только с формальной точки зрения можно признать адекватными оценки математического ожидания случайной величины и истинного значения физической величины. Более того, некоторые результаты измерений находится ближе к истинному значению, чем среднее арифметическое значение результатов измерений. Формальным обоснованием указанной адекватности является то, что оценка параметров закона распределения случайной величины и оценка единственного истинного значения измеряемой величины выполняются по некоторому числу наблюдений, каждое из которых может рассматриваться как случайное событие.
Обработка результатов наблюдений предполагает вычисление математических оценок истинного значения измеряемой величины.
При многократных измерениях за оценку истинного значения измеряемой величины принимается координата центра опытного распределения. Статистическую обработку результатов наблюдений следует начинать с вычисления центра распределения, так как погрешность его нахождения влечет за собой неправильную оценку других характеристик (среднеквадратического отклонения – СКО, эксцесса, контрэксцесса, вида опытного распределения, оценки погрешностей результата измерений и др.).
Следует напомнить, что прямыми называются измерения, результат которых позволяет непосредственно получить искомые значения физических величин.
В условиях отсутствия сведений о виде и форме закона распределения результатов наблюдений (ограниченное число результатов, грубые СИ) среднее арифметическое значение не всегда может быть принято за оценку координаты центра распределения (центр кривой эмпирического распределения совпадает с оценкой математического ожидания только для нормального распределения).
В математической статистике известны несколько оценок координаты центра распределения: среднее арифметическое, медиана, мода, срединный размах, центр размаха.
Поскольку все перечисленные оценки являются точечными и выбор их неоднозначен, они должны, во-первых, сходится к оцениваемому значению при (состоятельные оценки), во-вторых, их математическое ожидание должно быть равно оцениваемому значению (несмещенные оценки), в-третьих, их выборочное распределение должно иметь наименьшую дисперсию (эффективные оценки) /1/. Остановимся на перечисленных свойствах оценок более подробно.
При увеличении числа независимых измерений оценка должна сходится по вероятности к математическому ожиданию случайной величины. Такая оценка называется состоятельной. Требование “состоятельности” предъявляется к статистическим оценкам при рассмотрении выборок большого объема (т. е. число измерений должно быть велико!).
Одним из условий получения надёжных оценок является требование к их несмещенности, которое заключается в том, чтобы при замене оценкой истинного значения не допускалась систематическая погрешность (в сторону увеличения или уменьшения относительно ). Это требование приводит к необходимости выполнения условия: математическое ожидание оценки должно при любом числе измерений совпадать с истинным значением величины.
Если выбранная несмещенная оценка по сравнению с другими возможными оценками имеет наименьшую дисперсию, то такая оценка является эффективной, например, . Оценка не является эффективной. В случае нормального распределения результатов наблюдений статистическая дисперсия является ассимптотической несмещенной, так как при увеличении числа измерений n отношение ее дисперсии к минимально возможной измеряемой величине стремится к единице.
Числовые характеристики случайных величин, полученных по результатам выборочных наблюдений (т. е. оценки истинных значений величин) подразделяются на три вида /20, 23/:
1) характеристики положения;
2) характеристики рассеяния;
3) характеристики формы распределения.
К характеристикам положения относятся:
а) среднее арифметическое значение ;
б) медиана ;
в) мода ;
г) среднее геометрическое значение ;
д) среднее гармоническое значение .
Все перечисленные числовые характеристики определяют координату центра распределения упорядоченной совокупности. Формулы для их определения приведены в следующем подразделе. Следует отметить, что только в случае нормально распределенных результатов наблюдений выборочное среднее арифметическое, медиана и мода совпадают между собой и могут быть приняты за центр распределения статистической совокупности физической величины, полученной при измерениях.
К характеристикам рассеяния значений переменной относятся:
а) минимальное и максимальное значение;
б) размах вариационного ряда ;
в) дисперсия ;
г) среднее квадратическое (стандартное) отклонение ;
д) 25 %-й и 75 % квантили и межквантильный размах ;
е) среднее квадратичное отклонение среднего значения ;
ж) 95 %-й доверительный интервал истинного среднего значения.