Оценивание с помощью доверительного интервала
В отличие от точечной оценки, интервальная оценка позволяет получить вероятностную характеристику точности оценивания неизвестного параметра.
Идея оценивания с помощью доверительного интервала заключается в том, чтобы в окрестности точечной оценки попытаться построить такой интер-
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
вал (доверительный интервал), который с некоторой, отличной от нуля, вероятностью (доверительной вероятностью) накрыл бы оцениваемый параметр распределения.
Доверительный интервал - интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения.
Доверительная вероятность - вероятность того, что доверительный интервал накроет действительное значение параметра, оцениваемого по выборочным данным.
Оценивание с помощью доверительного интервала - способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала.
Предположим, что для оценки параметра 0 удалось найти две функции 01*(х-|, х2, ..., хп) и 02*(xi, х2, ..., хп), такие, что при всех (x-i, х2, ..., хп) и при любых значениях 0 выполняется условие
01 < ©2 ;
/ *( \ *( \ (3.17)
PJ0l(x1 ,x2 ,...,xn)<0<02(x1 ,x2 ,...,xn)j=l-a.
Это означает, что действительное значение параметра 0 находится в интервале значений (01*;02*) с вероятностью Р.
Интервал (01*;02*) как раз и называют доверительным интервалом для неизвестного параметра 0, а соответствующую ему вероятность Р{01*<0<02*} -доверительной вероятностью (или надежностью) Р=1-а, где а - уровень значимости. Если, к примеру, a = 0,05, то строится доверительный интервал с доверительной вероятностью 0,95 (или 95-процентный доверительный интервал).
Часто доверительный интервал находится как интервал, симметричный относительно точечной оценки параметра. Для симметричного доверительного интервала его ширина 25 определяется условием
р|е-ё1*а}=.-«.(3,8,
где 0 * - точечная оценка параметра 0.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
При фиксированном значении а (вероятности того, что доверительный интервал не накроет действительного значения параметра) чем меньше б, тем точнее оценивается 0.
Вероятностное утверждение Р{01*<0<02*} не следует понимать таким образом, что параметр 0 есть случайная величина, которая с вероятностью Р попадет в интервал между 01* и 02*.
Любой параметр распределения 0 (в отличие от его оценок) - это детерминированная величина, неизвестная нам, но имеющая строго определенное, фиксированное значение (которое, по крайней мере, теоретически, может быть найдено при исследовании всей генеральной совокупности). Границы в:* и 02* (как некоторые функции от результатов наблюдений) есть случайные величины. Поэтому утверждение P{01*<0<02*} = Р означает, что для данного доверительного интервала (01*;02*) вероятность содержать значение 0 равна Р.
Рассмотрение способов получения интервальных оценок для основных параметров распределения начнем с построения доверительного интервала для математического ожидания, так как именно такие задачи наиболее часто встречаются в инженерной практике.
3.2.1. Построение доверительного интервала для математического ожидания
Как уже было отмечено, наилучшей (состоятельной, несмещенной и эффективной) точечной оценкой математического ожидания случайной величины X с нормальным законом распределения является ее выборочное среднее
арифметическое x . Поэтому за основу построения доверительного интервала для математического ожидания обычно выбирается именно эта точечная оценка данного параметра. Задача получения интервальной оценки в этом случае
заключается в поиске границ (x—S; x+S)такого интервала, который с заданной доверительной вероятностью Pмх накроет действительное значение математического ожидания Mх (рис.3.1).
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
8 б
-L_______ с^ -^
Мх x х
Рис.3.1. Построение доверительного интервала для математического ожидания
При построении любой интервальной оценки, в том числе и для математического ожидания, необходимо знать распределение той точечной оценки (случайной величины), которая берется за основу для построения доверительного интервала.
В математической статистике доказано, что выборочное среднее арифметическое x из п независимых результатов наблюдений случайной величины, распределенной нормально с параметрами Мх и сгх2, также подчиняется нормальному закону распределения с параметрами:
М(x) = Мх, (3.19)
az(x) = ax2 /n. (3.20)
Подтвердить справедливость равенства (3.19) можно хотя бы тем, что выборочное среднее арифметическое - это несмещенная оценка математического ожидания, следовательно, по определению (см. (3.2)), математическое ожидание этой оценки (выборочного среднего арифметического) равно значению оцениваемого параметра (математическому ожиданию).
Соотношение (3.20) не должно, интуитивно, вызывать ни каких серьезных возражений: ведь если подсчитать выборочное среднее арифметическое по нескольким выборкам одного и того же объема, а затем найти дисперсию полученных значений, то вероятнее всего предположить, что разброс (дисперсия) выборочных средних арифметических будет меньше, чем разброс (дисперсия) самих опытных данных.
Прокомментируем это положение следующим иллюстративным числовым материалом (в продолжение примера 3.1). На каждом двадцатом по ходу технологического процесса рельсе Р65 (по ГОСТ 18267-82) получены следующие значения твердости на поверхности катания головки:
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
первый рельс - 351, 370, 365 (хнв = 362 , Sm = 97);
двадцать первый рельс - 375, 369, 345 (хнв = 363 , S2HB = 252);
сорок первый рельс - 348, 363, 369 (хт = 360 ,s2HB = 117 ).
Если теперь по (3.8) оценить дисперсию такой случайной величины, как ИВ, то получим
2 1 S----------- нв 3 —1 |
2,33. |
(3622 +3632 +3602)—(362 +363 +3602
Как видно из этого числового примера, выборочная дисперсия средних арифметических - 2,33 по трем выборкам (объемом 3) почти на порядок меньше тех выборочных дисперсий (97, 252 и 117), которые имеют сами опытные данные.
Для более строгого обоснования соотношения (3.20) напомним, что если случайная величина У = Х-\ ± Х2 - является суммой или разностью двух независимых случайных величин Х^ и Х2, то справедливо равенство
2 _2 .2
у *1 x2 (3.21)
Кроме того, дисперсия произведения случайной переменной X и постоянной величины (константы) С равна
^ 'х. (3.22)
Закон сложения дисперсий справедлив при любом числе слагаемых.
Учитывая, что х = ^х; и а\ - дисперсия случайной величины X, а также со-отношения (3.21) и (3.22), получаем:
a(x)=a2 1±Xi)J1\a(±Xi)=2L=zL
п /=1 \П)
что и требовалось доказать, причем сг(x) = ах
У/п
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Если заранее известна дисперсия аx2, то доверительный интервал для математического ожидания Мx рассчитывается достаточно просто. Его границы можно найти, например, следующим образом.
Поскольку случайная величина X подчиняется нормальному закону рас-пределения с параметрами М(х) = Мx и (^(х) = ах2/п , то соответствующая ей приведенная случайная величина
Х-М(х) Х-М^
Z =--------- ^ =------- =>, (3.23)
а(х) |
ах Ып
имеет нормированный стандартный нормальный закон распределения [см.(2.27)].
Квантиль хР порядка Р такой случайной величины, как X, определяется аналогично (2.32а) и с учетом соотношений (3.19) и (3.20) равна:
хр = М(х) +z Ых) = Мх +z -р
Далее, в соответствии с (2.20)
Р (Хр\ <Х< Хр2) = Р
K+^pl-r<x<Mx+zP2-^
= Р -Р
I2 1V
Если в последнем соотношении неравенство, стоящее под знаком вероятности, разрешить относительно Мx, то получим
P
x-zP2^<Mx<x-zpl-r
Р -Р
(3.24)
Если ~*<Mx+znZk, то -мх<-х+2р2^ следовательно, ^х > *-*«-7=
•V" Л/И Л/"
ст* : ст. |
и, аналогично, если Х>М* +z"it, то "М* >-x+zn^
и, следовательно, М*<х"^7?.
Таким образом, вероятность того, что выполняется неравенство
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
x-Zp2^<Mx<x-zp1^
л/ YI л.1 Yl ' Iv/.tOJ
будет Р = Р2 - Р\ = 1 - а.
Если для примера принять Р-\= 0,025 и Р2 = 0,975 (Р=0,975-0,025 =0,95; а=0,05), то, поскольку (см. (2.32)) zo,o25 = z-i-0,975 = - zo,975 ,a zo,975 = 1,96 (по таблицам [11], табл. П.2 или используя НОРМСТОБР(0,975) =1,959961), получим
а _ а
Дх-1,96—=<М <х+1,96—:=) =0,95,
л/и л/и (3.26)
т.е. при многократном извлечении выборок (объемом п каждая) из нормально распределенной генеральной совокупности (с параметрами Мх и ах2) можно построить последовательность соответствующих данным выборкам интервалов (3.26), причем примерно 95% этих интервалов будут включать в себя (накрывать) истинное значение математического ожидания Мх.
При построении доверительного интервала для математического ожидания обычно принимают Р1=а/2иР2 = 1 - а/2, т.е. рассматривают симметричные границы относительно выборочного среднего арифметического. В инженерных приложениях для значений а обычно выбирают а = 0,1 или а = 0,05, реже а = 0,01, т.е. строят такие доверительные интервалы, которые в 90 или 95% (реже 99%) случаев накрывают математическое ожидание.
С учетом соотношения (2.32) z а/2= - zi.a/2, по (3.25) получаем, что вероятность выполнения неравенства
X~1-a/2Tn< x<X+1-a/2^ (3-27)
v
равна Р = 1 - а/2 - а/2 = 1 - а.
Следовательно, интервал (3.27) является доверительным интервалом для математического ожидания Мх случайной величины с нормальным законом распределения, построенным с доверительной вероятностью Р= 1- а. Границы
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
x-z -^- х+z -^-
этого интервала равны 1~a/2 J~^ и 1~a/2 J~^ , а половина его ширины
S = 1 -^ (см. рис.3.1) Z^a/24n-
Пример 3.2.При проектировании системы управления базой данных было проведено исследование характеристик файлов ряда действующих и разрабатываемых информационных систем. В процессе исследования рассмотрены п = 49 файлов и получены следующие данные: средняя величина файла
х"55 Кбайт, а(х) =11. Необходимо определить доверительный интервал Мх; объем выборки п, который необходимо выполнить, чтобы точность статистических выводов б < 2, и величину записи R на физическом уровне хранения данных, обеспечивающую размещение файлов с надежностью Р=0,95.
Воспользовавшись соотношением (3.26), рассчитаем доверительный интервал:
11 ,, 11
55-1,96-== <МХ < 55+1,96-==,
л/49 л/49
51,9< Мх< 58,1.
Длина записи R = 55 + 1,96 *11 « 77 кбайт. Необходимый объем выборки для б = 2 составит
f 11\2
п |
1,96
На практике, как правило, число измерений (например, отбора проб шихты, чугуна, стали и других материалов) конечно и не превышает 10...30. При таком малом числе наблюдений фактическая дисперсия ах2 неизвестна, поэтому при построении доверительного интервала для математического ожидания Mх используют выборочную дисперсию Sx2.
В этом случае приведенная случайная величина, аналогичная (3.23),
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
(х — М )
S 14п (3.27а)
где Sx - выборочное среднее квадратичное отклонение, определяемое по формуле (3.10), имеет распределение, отличное от нормального. Функция распределения случайной величины t (3.27) имеет вид
Г |
т + \
2 t |
m } \ m |
I-./ \ 2 J Г 1 '
г ( ) =------------ — I "|---
■4тип -Г
dt,
(3.28)
где Г(у) - гамма-функция, являющаяся обобщением понятия факториала и обладающая рекуррентным свойством: Г(у + 1) = уГ(у) (для целых чисел п справедливо Г(л + 1) = л! см. [1]); m - число степеней свободы, определяемое разностью между объемом выборки л и числом параметров, оцениваемых по выборке; в данном случае m = л-1 (поскольку при определении t по (3.27) необходимо оценить один параметр Sx).
Число степеней свободы m - это понятие, которое учитывает в статистических ситуациях связи, ограничивающие свободу изменения случайных величин. Поэтому число степеней свободы вычисляется как разность между числом экспериментальных точек л и числом связей f, ограничивающих свободу изменения случайной величины.Так, при вычислении выборочной дисперсии по
формуле (3.6) S2X =Y_l\xl:-х2 (п-Х) наблюдается одна связь, определяемая
уровнем выборочного среднего * = £*,, поэтому число степеней свободы выборочной дисперсии будет равно m = л - 1, а, например, для выборочной дисперсии, найденной из соотношения (3.7) 5*х2 =^(х, -Мх)2 п, число степе-
f'-l /
ней свободы равно числу испытаний m = л, так как Мх определено независимым способом.
Понятие о степени свободы поясним еще на примере решения системы линейных алгебраических уравнений. Допустим, что мы имеем систему из л линейных алгебраических уравнений с л неизвестными *,, х2, ..., хп. Очевидно,
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
решение такой системы (при линейной независимости уравнений) будет единственным, т.е. такая система не будет иметь ни одной степени свободы. Но если для л неизвестных переменных мы имеем только одно уравнение, то для однозначного определения х^, х2, ..., хп должно быть наложено еще т = л - 1 условий (уравнений), т.е. число степеней свободы такой системы уравнений будет равно л - 1.
Наконец, если по выборке объемом л будут сделаны оценки ровно для л (линейно независимых) параметров распределения, то расчет л + 1 оценки не будет нести никакой дополнительной информации о распределении случайной величины (все л выборочных значений х^, х2, ..., хп будут однозначно определены через л оценок параметров), поскольку после оценки л параметров число степеней свободы т = п - п уже окажется равным нулю.
Распределение (3.28), зависящее только от числа степеней свободы (од-нопараметрическое), называют распределением Стьюдента, или t-распределением.
Плотность распределения Стьюдента выражается формулой
Г f(t) = |
^т +1^
m+l
\ Z. J |
(3.29) |
т |
t2V~
1 +--
-Jnm -Г |
V ^ J |
M ,
причем множители при
f
1+---
V m7
m+l
в f(t) выбраны так, чтобы площадь под
любой кривой f(t) равнялась единице.
Стьюдент - псевдоним У.С. Госсета (1876-1937) - химика, работавшего в одной из пивоваренных фирм Великобритании. Он самостоятельно разработал статистику малых выборок. Поскольку в современной технике чаще всего исследуются небольшие по объему выборки (менее 30), то работа Стьюдента имеет большое практическое значение.
На рис. 3.2 приведено распределение Стьюдента для различных значений т. При п->оо (практически при п>30) распределение Стьюдента переходит в стандартное нормальное распределение с единичной дисперсией.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Для случайной величины t (3.27), в соответствии с (2.20), можно записать,
что
(х - Мх) 5*v Ып |
P(tpl <t<tp2) = P(tpl <-------------- т^-<tp2) = P2-Pl, (3.30)
где tci и tP2 - значения квантилей случайной величины t порядка pi и p2 соответственно.
Если в соотношении (3.30), аналогично (3.24), разрешить относительно Mх неравенство, стоящее под знаком вероятности, и при построении доверительного интервала для математического ожидания принять симметричные границы Pi= а/2 и P2 = 1 - а/2, то получим, что вероятность выполнения неравенства
ХЧ»А<Ц<Х+1-Л(3.31)
равна P = 1 - а , где ta,m - так называемый коэффициент Стьюдента (значение квантили статистики t (3.27) порядка P = 1 - a /2 для числа степеней свободы m = n -1).
Следовательно, интервал (3.31) является доверительным интервалом для математического ожидания Mх случайной величины с нормальным законом распределения, построенным с доверительной вероятностью P = 1- а, при неизвестном значении генеральной дисперсии ах2.
Значения ta,m табулированы (см., например, [11] или табл. П.6), их можно определить также, воспользовавшись статистической функцией СТЬЮДРАС-ПОБРиз электронных таблиц Microsoft Excel, причем при m > 30 ta,m ~ z-i. a/2. Так, при a = 0,05 и m = 31 СТЬЮДРАСПОБР(0,05;31) = 2,039515 , а НОРМ-СТОБР(1-0,05/2) = 1,959961.
Если в примере 3.1 по трем ( n = 3, m = n-1=3 -1=2) выборочным значениям 351, 370 и 365 (первый рельс -хт = 362 ; SHB = 9,85) было бы необходимо при a = 0,05 построить доверительный интервал для математического ожидания твердости на поверхности катания головки рельса, то, если предположить, что твердость не противоречит нормальному закону распределения, и поскольку to,05,2 ~ 4,3 (СТЬЮДРАСПОБР(0,05;2) = 4,302656), он оказался бы равным
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
9,85 лг 9,85 ,,
362-4,3—^< Мнв < 362 + 4,3—^, или Мнв = 362 ±24,45 .
л/3 л/3
Следовательно, интервал [337,55; 386,45] с вероятностью 1 - 0,05 = 0,95 накрывает математическое ожидание твердости на поверхности катания головки рельса.
2 3 t |
а
f(t) к | 0,4 | т=10 | |
т=4 , __-— т=1 | |||
■0,2 N | |||
^^ 1 1 | "0,1 | i i ^^^ | —► |
t -3 -2 -1
т=4 т=1 |
t
б
4 -3 -2 -1
О
t
Рис. 3.2. Плотность (а) и функция (б) t-распределения Стьюдента
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ