Построение доверительных интервалов

Доверительным интервалом для параметра θ называется интер­вал]Θ—ε;Θ+ε[, который с заданной доверительной вероятностью p=1-α накрывает этот параметр. Построим доверительные интерва­лы для параметров нормального распределения. Это распределение имеет два параметра: m- математическое ожидание и Построение доверительных интервалов - student2.ru - среднеквадратическое отклонение. В том случае, если точечные оценки парамет­ров m и Построение доверительных интервалов - student2.ru получены на основании выборки, доверительный интервал для математического ожидания строится с использованием квантилей распределения Стьюдента для уровня значимости α /2 и числа степе­ней свободы n-1 следующим образом:

Построение доверительных интервалов - student2.ru

Доверительный интервал для среднеквадратического отклоне­ния σ строится следующим образом:

Построение доверительных интервалов - student2.ru

где Построение доверительных интервалов - student2.ru Построение доверительных интервалов - student2.ru Построение доверительных интервалов - student2.ru и Построение доверительных интервалов - student2.ru — квантилираспределения Построение доверительных интервалов - student2.ru ,соответствующие числу степеней свободы γ = n—1 и уровням значимости α/2 и 1-α/2. Коэффициенты Построение доверительных интервалов - student2.ru и Построение доверительных интервалов - student2.ru приведены в прил.

Рассмотрим пример вычисления доверительных интервалов для параметров нормального распределения по материалам вариационных рядов диаметров и высот. Используя средние арифметические двухсот измеренных диаметров и высот, вычисленные ранее и , а также среднеквадратические отклонения и исходя из предполо­жения, что диаметры деревьев подчиняются закону нормального рас­пределения, найдем доверительные интервалы, накрывающие пара­метры m и Построение доверительных интервалов - student2.ru с доверительной вероятностью 0,95. В таблице квантилей распределения Стьюдента 3 в приложении находим Построение доверительных интервалов - student2.ru = 1,972. Тогда доверительный интервал для среднего арифметического значе­ния с учетом выражения будет

диаметры

Построение доверительных интервалов - student2.ru , или Построение доверительных интервалов - student2.ru ;

высоты

Построение доверительных интервалов - student2.ru , или Построение доверительных интервалов - student2.ru .

Для того чтобы вычислить границы доверительных интервалов для среднеквадратического отклонения, найдем по табл. 4 прил. ко­эффициенты Построение доверительных интервалов - student2.ru = 0,912 и Построение доверительных интервалов - student2.ru = 1,11 для уровня значимости α = 0,05. Используя точечные оценки среднеквадратических отклонений для данных по диаметрам и высотам и с учетом выражения, получаем доверительные интервал для среднего квадратического от­клонения:

Построение доверительных интервалов - student2.ru , или Построение доверительных интервалов - student2.ru - диаметры;

Построение доверительных интервалов - student2.ru , или Построение доверительных интервалов - student2.ru - высоты.

Анализ распределения случайных величин

Любая случайная величина подчинена какому-либо, как прави­ло, неизвестному закону распределения. Одной из задач биометрии и является определение закона распределения анализируемой случай­ной величины.

Нормальное распределение

Нормальное распределение имеет важное значение в биометрии. На практике очень часто исследуемые случайные величины следуют этому закону. Для того чтобы узнать, подчиняется случайная величи­на закону нормального распределения или нет, надо вычислить теоре­тические частоты вариационного ряда исходя из предположения о нормальном распределении анализируемого параметра и сравнить их с эмпирическими частотами.

Закон распределения случайной величины может быть описан с помощью функции, определяемой соотношением

Построение доверительных интервалов - student2.ru

и называемой функцией распределения величины X.

Разность F(b)-F(a) представляет собой вероятность того, что случайная величина X примет значение, принадлежащее интервалу а Построение доверительных интервалов - student2.ru X <b, т. е. если а и b являются нижней и верхней границами ин­тервала вариационного ряда, то вероятность попадания изучаемой случайной величины в данный интервал можно вычислить так:

Pa,b=P(a Построение доверительных интервалов - student2.ru X<b)=F(b)-F(a) (1)

Зная эту величину, нетрудно вычислить теоретическое число наблюдений для данного интервала fa,b=n-Pa,b.

Функция нормального распределения F(x) имеет вид

Построение доверительных интервалов - student2.ru (2)

С учетом функции нормального распределения (2) выражение (1) можно переписать следующим образом:

Построение доверительных интервалов - student2.ru (3)

Интегралы, входящие в это выражение, нельзя выразить через элементарные функции, но их можно вычислить через специальную функцию:

Построение доверительных интервалов - student2.ru ,

которая является интегральной функцией нормального распределения с параметрами т = 0 и σ = 1. Для этого следует перейти к нормиро­ванной случайной величине:

Построение доверительных интервалов - student2.ru .

Преобразовав неравенство а Построение доверительных интервалов - student2.ru Х<b соответствующим обра­зом, получим

Построение доверительных интервалов - student2.ru .

Эти два неравенства равносильны, следовательно, их вероятно­сти равны между собой:

Построение доверительных интервалов - student2.ru . (4)

Используя (3) и (4), получим

Построение доверительных интервалов - student2.ru (5)

С помощью (5) и данных табл. 2 прил. мы можем вычислить теоретические частоты вариационного ряда, предполагая, что исследуемая случайная величина распределена по нормальному закону.

Выполним эту работу для вариационных рядов по диаметру и высоте. С учетом того, что оценкой параметров нормального распределения методом моментов являются среднеквадратическое отклонение и среднее арифметическое, вычислим нормированные нижнюю и верхнюю границы интервалов следующим образом:

Построение доверительных интервалов - student2.ru Построение доверительных интервалов - student2.ru

Таблица 10 ─ Вычисление теоретических частот для функции нормального распределения (диаметры).

xi Построение доверительных интервалов - student2.ru tiн tiв Ф(tiн) Ф(tiв) Рi Построение доверительных интервалов - student2.ru Построение доверительных интервалов - student2.ru - Построение доверительных интервалов - student2.ru
12,7 -∞ -2,17 0,015 0,015 3, -3,0
15,6 -2,17 -1,79 0,015 0,037 0,022 4,4 -1,4
18,5 -1,79 -1,42 0,037 0,078 0,041 8,2 -1,2
21,4 -1,42 -1,04 0,078 0,149 0,071 14,2 3,8
24,3 -1,04 -0,66 0,149 0,255 0,106 21,2 5,8
27,2 -0,66 -0,29 0,255 0,386 0,131 26,2 5,8
30,1 -0,29 0,09 0,386 0,536 0,15 30,0 1,0
33,0 0,09 0,47 0,536 0,681 0,145 29,0 -10,0
35,9 0,47 0,84 0,681 0,8 0,119 23,8 0,2
38,8 0,84 1,22 0,8 0,889 0,089 17,8 0,2
41,7 1,22 1,6 0,889 0,945 0,056 11,2 -5,2
44,6 1,6 1,98 0,945 0,976 0,031 6,2 -2,2
47,5 1,98 2,35 0,976 0,991 0,015 3,0 4,0
50,4 2,35 2,73 0,991 0,997 0,006 1,2 2,8
53,3 2,73 +∞ 0,997 1,000 0,003 0,6 -0,6
Сумма          
                   

В отличие от анализируемого вариационного ряда, нормальное распределение определено на интервале от -∞ до +∞. Для того чтобы области определения эмпирического и нормального распределения сделать одинаковыми, добавим дополнительные интервалы перед первым интервалом с границами от -∞ до нижней границы первого интервала и после последнего интервала с границами от верхней гра­ницы последнего интервала до +∞.Эмпирические частоты этих до­полнительных интервалов будут равны нулю, так как в исходных данных нет ни одного наблюдения, которое было бы меньше нижней границы первого интервала или больше верхней границы последнего интервала. Значения функции нормированного нормального распре­деления для нижней Построение доверительных интервалов - student2.ru и верхней Построение доверительных интервалов - student2.ru границ интервалов можно найти с помощью табл. 2, используя в качестве аргументов значения Построение доверительных интервалов - student2.ru и Построение доверительных интервалов - student2.ru соответственно. В этой таблице значения функции распределе­ния даны только для положительных аргументов. Если надо найти функцию распределения для отрицательного аргумента, следует вос­пользоваться соотношением Ф(-х)=1-Ф(х), которое справедливо, так как нормальное распределение является симметричным.

Вероятности для интервалов вариационного ряда легко вычис­лить как разность значений функции распределения для верхней и нижней границ:

Построение доверительных интервалов - student2.ru

Теперь можно найти теоретические частоты ряда:

Построение доверительных интервалов - student2.ru

Аналогичным образом можно вычислить теоретические частоты для вариационного ряда высот (табл. 13.).

Последние колонки табл. 12 и 13, представляющие собой раз­ность между эмпирическими и теоретическими частотами, дают нам информацию о близости теоретического (в данном случае нормально­го) и эмпирического распределений. Однако по данным отклонениям достаточно трудно принять решение о согласованности эмпирического и теоретического распределений. Более наглядную картину можно увидеть, изобразив эти распределения графически (рис. 8 и 9). Однако такие сравнения распределений будут субъективными. Для того что­бы дать объективную оценку согласованности эмпирических и теоре­тических распределений, необходимо воспользоваться специальными методиками проверки статистических гипотез.

Наши рекомендации