Интервал
Рассмотренные точечные оценки параметров распределения дают оценку в виде числа, наиболее близкого к значению неизвестного параметра. Такие оценки используют только при большом числе измерений. Чем меньше объем выборки, тем легче допустить ошибку при выборе параметра. Для практики важно не только получить точечную оценку, но и определить интервал, называемый доверительным, между границами которого с заданной дове рителъной вероятностью
где q — уровень значимости; хн, хв— нижняя и верхняя границы интервала, находится истинное значение оцениваемого параметра.
В общем случае доверительные интервалы можно строить на основе неравенства Чебышева. При любом законе распределения случайной величины, обладающей моментами первых двух порядков, верхняя граница вероятности попадания отклонения случайной величины х от центра распределения Хц в интервал tSx описывается неравенством Чебышева
где Sx — оценка СКО распределения; t — положительное число.
Для нахождения доверительного интервала не требуется знать закон распределения результатов наблюдений, но нужно знать оценку СКО. Полученные с помощью неравенства Чебышева интервалы оказываются слишком широкими для практики. Так, доверительной вероятности 0,9 для многих законов распределений соответствует доверительный интервал 1,6SX. Неравенство Чебышева дает в данном случае 3,16SX. В связи с этим оно не получило широкого распространения.
В метрологической практике используют главным образом кван-тильные оценки доверительного интервала. Под 100P-процентным квантилем хр понимают абсциссу такой вертикальной линии, слева от которой площадь под кривой плотности распределения равна Р%. Иначе говоря, квантиль — это значение случайной величины (погрешности) с заданной доверительной вероятностью Р. Например, медиана распределения является 50%-ным квантилем х0,5.
На практике 25- и 75%-ный квантили принято называть сгибами, или квантилями распределения. Между ними заключено 50% всех возможных значений случайной величины, а остальные 50% лежат вне их. Интервал значений случайной величины х между х0 05 и х0 95 охватывает 90% всех ее возможных значений и называется интерквантильным промежутком с 90%-ной вероятностью. Его протяженность равна d0,9= х0,95 - х0,05.
На основании такого подхода вводится понятие квантильных значений погрешности, т.е. значений погрешности с заданной доверительной вероятностью Р — границ интервала неопределенности ± DД = ± (хр - х1-р)/2 = ± dp/2. На его протяженности встречается Р% значений случайной величины (погрешности), a q = (1- Р)% общего их числа остаются за пределами этого интервала.
Для получения интервальной оценки нормально распределенной случайной величины необходимо:
• определить точечную оценку МО х̅ и СКО Sx случайной величины по формулам (6.8) и (6.11) соответственно;
• выбрать доверительную вероятность Р из рекомендуемого ряда значений 0,90; 0,95; 0,99;
• найти верхнюю хв и нижнюю хн границы в соответствии с уравнениями
полученными с учетом (6.1). Значения хн и хв определяются из таблиц значений интегральной функции распределения F(t) или функции Лапласа Ф(1).
Полученный доверительный интервал удовлетворяет условию
(6.13)
где n — число измеренных значений; zp — аргумент функции Лапласа Ф(1), отвечающей вероятности Р/2. В данном случае zp называется квантильным множителем. Половина длины доверительного интервала называется доверительной границей погрешности результата измерений.
Пример 6.1. Произведено 50 измерений постоянного сопротивления. Определить доверительный интервал для МО значения постоянного сопротивления, если закон распределения нормальный с параметрами mx = R = 590 Ом, Sx= 90 Ом при доверительной вероятности Р = 0,9.
Так как гипотеза о нормальности закона распределения не противоречит опытным данным, доверительный интервал определяется по формуле
Отсюда Ф(zр) = 0,45. Из таблицы, приведенной в приложении 1, находим, что zp= 1,65. Следовательно, доверительный интервал запишется в виде
или 590 - 21 < R < 590 + 21. Окончательно 509 Ом < R < 611 Ом.
При отличии закона распределения случайной величины от нормального необходимо построить его математическую модель и определять доверительный интервал с ее использованием.
Рассмотренный способ нахождения доверительных интервалов справедлив для достаточно большого числа наблюдений n, когда s = Sx. Следует помнить, что вычисляемая оценка СКО Sx является лишь некоторым приближением к истинному значению s. Определение доверительного интервала при заданной вероятности оказывается тем менее надежным, чем меньше число наблюдений. Нельзя пользоваться формулами нормального распределения при малом числе наблюдений, если нет возможности теоретически на основе предварительных опытов с достаточно большим числом наблюдений определить СКО.
Расчет доверительных интервалов для случая, когда распределение результатов наблюдений нормально, но их дисперсия неизвестна, т.е. при малом числе наблюдений п, возможно выполнить с использованием распределения Стьюдента S(t,k). Оно описывает плотность распределения отношения (дроби Стьюдента):
где Q — истинное значение измеряемой величины. Величины х̅, Sx. и Sx̅ вычисляются на основании опытных данных и представляют собой точечные оценки МО, СКО результатов измерений и СКО среднего арифметического значения.
Вероятность того, что дробь Стьюдента в результате выполненных наблюдений примет некоторое значение в интервале (- tp; + tp)
(6.14)
где k — число степеней свободы, равное (п - 1). Величины tp (называемые в данном случае коэффициентами Стьюдента), рассчитанные с помощью двух последних формул для различных значений доверительной вероятности и числа измерений, табулированы (см. таблицу в приложении 1). Следовательно, с помощью распределения Стьюдента можно найти вероятность того, что отклонение среднего арифметического от истинного значения измеряемой величины не превышает
В тех случаях, когда распределение случайных погрешностей не является нормальным, все же часто пользуются распределением Стьюдента с приближением, степень которого остается неизвестной. Распределение Стьюдента применяют при числе измерений n < 30, поскольку уже при n = 20, ...,30 оно переходит в нормальное и вместо уравнения (6.14) можно использовать уравнение (6.13). Результат измерения записывается в виде: ; P = Рд, где Рд — конкретное значение доверительной вероятности. Множитель t при большом числе измерений n равен квантильному множителю zp. При малом n он равен коэффициенту Стьюдента.
Полученный результат измерения не является одним конкретным числом, а представляет собой интервал, внутри которого с некоторой вероятностью Рд находится истинное значение измеряемой величины. Выделение середины интервала х вовсе не предполагает, что истинное значение ближе к нему, чем к остальным точкам интервала. Оно может быть в любом месте интервала, а с вероятностью 1 - Рд даже вне его.
Пример 6.2. Определение удельных магнитных потерь для различных образцов одной партии электротехнической стали марки 2212 дало следующие результаты: 1,21; 1,17; 1,18; 1,13; 1,19; 1,14; 1,20 и 1,18 Вт/кг. Считая, что систематическая погрешность отсутствует, а случайная распределена по нормальному закону, требуется определить доверительный интервал при значениях доверительной вероятности 0,9 и 0,95. Для решения задачи использовать формулу Лапласа и распределение Стьюдента.
По формулам (6.8) в (6.11) находим оценки среднего арифметического значения и СКО результатов измерений. Они соответственно равны 1,18 и 0,0278 Вт/кг. Считая, что оценка СКО равна самому отклонению, находим:
Отсюда, используя значения функции Лапласа, приведенные в таблице приложения 1, определяем, что zp = 1,65. Для Р = 0,95 коэффициент zp =1,96. Доверительные интервалы, соответствующие Р = 0,9 и 0,95, равны 1,18 ± 0,016 и 1,18±0,019 Вт/кг.
В том случае, когда нет оснований считать, что СКО и его оценка равны, доверительный интервал определяется на основе распределения Стьюдента:
По таблице приложения 1 находим, что t0,9 = 1,9 и t0,95 = 2,37. Отсюда доверительные интервалы соответственно равны 1,18±0,019 и 1,18±0,023 Вт/кг.
Контрольные вопросы.
1.При каких условиях погрешность измерения может рассматриваться как случайная величина?
2. Перечислите свойства интегральной и дифференциальной функций распределения случайной величины.
3. Назовите числовые параметры законов распределения.
4. Каким образом может задаваться центр распределения?
5. Что такое моменты распределения? Какие из них нашли применение в метрологии?
6. Назовите основные классы распределений, используемых в метрологии.
7. Дайте характеристику распределениям, входящим в класс трапецеидальных распределений.
8. Что такое экспоненциальные распределения? Каковы их свойства и характеристики?
9. Что такое нормальное распределение? Почему оно играет особую роль в метрологии?
10. Что такое функция Лапласа и для чего она используется?
11. Как описывается и где используется семейство распределений Стьюдента?
12. Какие точечные оценки законов распределения вы знаете? Какие требования предъявляются к ним?
13. Что такое доверительный интервал? Какие "способы его задания вам известны?