Пояснения к работе
Полученные результаты измерений, как правило, подвергаются статистической обработке, целью которой является получение достоверных данных. В основном статистическая обработка результатов измерений направлена на отсеивание грубых погрешностей измерения и определение закона распределения экспериментальных данных. Совокупность всех возможных наблюдений, которые могут быть сделаны при данном комплексе измерений, называется генеральной совокупностью. Выборкой называется ограниченное число случайно отобранных наблюдений из генеральной совокупности.
Пусть имеется выборка экспериментальных данных x1, x2, x3, … xi, …, xN случайной величины ξ. Среднее значение этого ряда можно определить из выражения
.
В данном случае значение является выборочным средним, так как оно вычислено по ограниченному числу измерений N. Используя можно найти отклонение каждого результата от среднего
.
Величину
называют оценкой дисперсии, она характеризует степень рассеивания случайной величины относительно своего выборочного среднего.
Оценка среднего квадратического отклонения может быть найдена по формуле
Важными числовыми характеристиками являются оценки моментов случайных величин. Оценка начального момента первого порядка:
Оценка начального момента второго порядка:
Оценка центрального момента k-го порядка находится с помощью выражения
Оценка первого центрального момента =0. Оценка второго центрального момента является оценкой дисперсии
= .
Оценка третьего центрального момента характеризует асимметрию распределения (случай, когда один спад крутой, а другой пологий). Для симметричных относительно центра распределений . Оценка четвертого центрального момента характеризует протяженность спадов распределения, а его относительное значение
называется оценкой эксцесса распределения.
Качество оценок характеризуется состоятельностью, несмещенностью, эффективностью. Оценка параметра называется состоятельной, если она по мере роста числа наблюдений стремится к оцениваемому теоретическому значению параметра. Оценка параметра называется несмещенной, если при любом числе наблюдений ее математическое ожидание точно равно значению оцениваемого параметра. Удовлетворение требования несмещенности устраняет систематическую погрешность, которая в случае состоятельности оценки стремится к нулю при числе наблюдений . Оценка параметра называется эффективной, если среди прочих оценок того же параметра она обладает наименьшей дисперсией.
Все сказанное выше относится к равноточным измерениям, т. е. к измерениям одного происхождения, выполненным одними инструментами и методами, которые содержат только случайную погрешность, подчиняющуюся закону нормального распределения.
Для исключения грубых погрешностей измерений (промахов) имеется большое количество методик. Наиболее простая методика предполагает выполнение следующих пунктов:
1. Из измеренных значений выбирают то, которое имеет наибольшее отклонение от среднего (обозначим его как );
2. По формуле
вычисляют значение статистики τ для выбранного значения;
3. По табл. 1.1 находят процентные точки распределения Стьюдента t(q, N–2), где, q – уровень значимости. Достаточно определить только два значения t(5 %, N–2) и t(0,1 %, N–2).
4. Для q=5 % и q=0,1 % вычисляют значения
Если значения , то результат измерения отсеивать нельзя. При результаты отсеивать можно, если в пользу этого имеются другие соображения. Для измерения отсеиваются всегда.
Таблица 1.1
N–2 | q | |||||||
10% | 5% | 2,5% | 1% | 0,5% | 0,25% | 0,1% | 0,05% | |
t(p, N–2) | ||||||||
1,3104 | 1,6373 | 2,0423 | 2,4573 | 2,7500 | 3,0296 | 3,3852 | 3,6460 | |
1,3031 | 1,6869 | 2,0211 | 2,4233 | 2,7045 | 3,9712 | 3,3069 | 3,5510 | |
1,2931 | 1,6759 | 2,0089 | 2,4033 | 2,6778 | 2,9370 | 3,2614 | 3,1960 |
Для построения полигона и гистограммы на основе экспериментальных данных необходимо разбить диапазон изменения значений случайной величины на равные интервалы. Количество интервалов можно вычислить по следующему правилу:
. (1.1)
В данном случае K – целое число, получаемое из выражения (1.1) путем округления. Разность между максимальным и минимальным значениями измеряемой величины делят на K и получают длину интервала. Диапазон изменения значений случайной величины (разбитый на интервалы) откладывается по оси абсцисс. После этого просматриваются все измеренные значения и при чтении каждого результата метку (точку или черточку) ставят над тем интервалом, к которому относится данное наблюдение. После чего осуществляют подсчет частостей.
Примеры кумулятивной линии, гистограммы и полигона случайной величины приведены на рис. 1, 2 (кривые 1, 2, 3 соответственно). Здесь в качестве измеряемой величины принимается сопротивление 56 резисторов. Точка с ординатой 0,089 кумулятивной линии определяется как отношение числа измерений, попавших в данный класс к общему числу измерений. Т.е. из числа резисторов, сопротивление которых соответствует первому классу (от 992 до 995 Ом) попали лишь 5 штук, тогда 5:56 = 0,089. Следующая точка (0,321) определяется аналогичным образом, только к текущему результату добавляется предыдущий, т. е. сопротивлением от 995 до 998 Ом обладает 13 резисторов; 13:56 = 0,232; 0,232+0,089=0,321. Аналогичным образом определяются остальные точки.
Рис. 1 Рис. 2
Кумулятивная линия оценивает функцию распределения F(x) случайной величины. Значение функции распределения для каждого x является вероятностью события, заключающегося в том, что случайная величина ξ принимает значения меньше x, т.е. F(x)=P(ξ<x).
Гистограмма и полигон являются оценками плотности вероятности случайной величины. Если плотность вероятности случайной величины может быть хотя бы приближенно описана кривой
то считается, что данная случайная величина подчиняется нормальному (Гауссову) закону распределения.
Обработка результатов измерения может быть существенно упрощена, если они подчиняются именно нормальному закону распределения. Поэтому для проверки нормальности распределения выработан ряд относительно простых критериев.
Для не очень больших выборок (N<120) можно применять следующие рекомендации по проверке нормальности распределения. Для этого необходимо вычислить среднее абсолютное отклонение (САО) по формуле
Для выборки, имеющей приближенно нормальный закон распределения, должно быть справедливо выражение
.
Существуют и другие более точные методики определения нормальности распределения, например, – критерий, критерий Колмогорова-Смирнова и др.