Интервальная оценка генеральной средней при малой вы­борке

При достаточно большом объеме выборки можно сделать вполне надежные заключения о генеральной средней. Однако на практике часто имеют дело с выборками небольшого объема (п < 30). В этом случае в выражении доверительного интервала (3.16) точ­ность оценки определяется по следующей формуле:

Интервальная оценка генеральной средней при малой вы­борке - student2.ru (3.26)

где t — параметр, называемый коэффициентом Стьюдента (его на­ходят из распределения Стьюдента; оно здесь не рассматривает­ся), который зависит не только от доверительной вероятности р, но и от объема выборки п. Коэффициент Стьюдента можно найти из табл. 8.

Запишем неравенство (3.16), подставив в него выражение Интервальная оценка генеральной средней при малой вы­борке - student2.ru из формулы (3.26):

Интервальная оценка генеральной средней при малой вы­борке - student2.ru (3.27)

Таблица 8

Объем Доверительная вероятность, р
выборки, п 0,9 0,95 0,99 0,999
2 6,31 12,70 63,66 -
2,92 4,30 9,93 31,60
1,83 2,26 3,25 4,78
1,76 2,15 2,95 4,07

Таблица 9

Масса, кг 3,0 3,1 3,2 3,3 3,4 3,5 3,7 3,8 4,0 4,4
Частота

Отсюда можно вычислить Интервальная оценка генеральной средней при малой вы­борке - student2.ru Db = 0,19156 кг2 и sв = = 0,43767 кг. Задав доверительную вероятность р = 0,95, находим из табл. 8 для объема выборки п = 10 параметр t = 2,26. Подставляя эти данные в (3.26), получаем для доверительного интервала [см. (3.27)]:

или Интервальная оценка генеральной средней при малой вы­борке - student2.ru (3.28)

Полезно сопоставить соотношения, полученные для большой (3.25) и малой (3.28) выборок.

Интервальная оценка истинного значения измеряемой ве­личины.Интервальная оценка генеральной средней может быть ис­пользована для оценки истинного значения измеряемой величины.

Пусть несколько раз измеряют одну и ту же физическую вели­чину. При этом по разным случайным причинам, вообще говоря, получают разные значения: x1, x2, x3, ... . Будем считать, что нет преобладающего влияния какого-либо фактора на эти измерения.

Истинное значение измеряемой величины (хист) совершенно точ­но измерить невозможно хотя бы по причине несовершенства изме­рительных приборов. Однако можно дать интервальную оценку для этого значения.

Если значения х1, х2, х3, ... рассматривать как варианты выбор­ки, а истинное значение измеряемой величины хист как аналог ге­неральной средней, то можно по описанным выше правилам найти доверительный интервал, в который с доверительной вероятно­стью р попадает истинное значение измеряемой величины. Приме­нительно к малому числу измерений (п < 30) из (3.27) получим:

Интервальная оценка генеральной средней при малой вы­борке - student2.ru (3.29)

где Интервальная оценка генеральной средней при малой вы­борке - student2.ru — среднее арифметическое значение из полученных измере­ний, а s — оответствующее им среднее квадратическое отклоне­ние, t —коэффициент Стьюдента.

Более подробно и разносторонне оценка результатов измере­ний рассматривается в практикуме (см. [1]).

Проверка гипотез

В медико-биологических исследованиях актуальной является задача сравнения выборок, полученных в результате эксперимен­та, заключающегося в том или ином воздействии на объект. Фак­тически конечный результат исследования зависит от достовер­ности различий значений случайной величины в контроле (до воз­действия или без него) и опыте (после воздействия). Наиболее просто решается задача определения достоверности различий ста­тистических распределений, если предварительно для выборок рассчитаны доверительные интервалы. Положим, есть два статис­тических распределения некоторых случайных величин X и Y. Пусть генеральные средние этих распределений с доверительной вероятностью р = 0,95 находятся в доверительных интервалах Интервальная оценка генеральной средней при малой вы­борке - student2.ru и пусть при этом Интервальная оценка генеральной средней при малой вы­борке - student2.ru Если соблюдается неравенство Интервальная оценка генеральной средней при малой вы­борке - student2.ru , то не вызывает сомнения, что случайная величина Y существенно больше случайной величины X (см. рис. 3.3, а). Вероятность этого превышает 0,95.

На рис. 3.3, б представлен вариант, когда выборки частично пе­ресекаются, т. е. когда выполняется неравенство Интервальная оценка генеральной средней при малой вы­борке - student2.ru В этом случае целесообразно оценивать достоверность различий вы­борочных средних Интервальная оценка генеральной средней при малой вы­борке - student2.ru и Интервальная оценка генеральной средней при малой вы­борке - student2.ru с помощью дополнительных расчетов. Наиболее просто это сделать, предполагая, что случайные величи­ны X и Y распределены по нормальному закону. Условием сущест­венности различия двух опытных распределений, являющихся вы­борками из различных генеральных совокупностей, является вы­полнение следующего неравенства для опытного и теоретического значений критерия Стьюдента: Интервальная оценка генеральной средней при малой вы­борке - student2.ru Для нахождения значения toписпользуют следующую формулу:

Интервальная оценка генеральной средней при малой вы­борке - student2.ru

(3.30)

Интервальная оценка генеральной средней при малой вы­борке - student2.ru

Интервальная оценка генеральной средней при малой вы­борке - student2.ru

Здесь sх и sу — выборочные средние квадратические отклоне­ния, пх и пу — число вариант в выборках (объемы выборок), Интервальная оценка генеральной средней при малой вы­борке - student2.ru и у — выборочные средние значения.

а) б)

Рис. 3.3

Теоретическое значение tтeop находят по таблице 10, входными величинами которой являются доверительная вероятность р и па­раметр f, связанный с числом вариант в выборках. Этот параметр определяют следующим образом. Если sх » sу, то f = пх + п — 2. Если же sх и sу различаются на порядок и более, то величина f оп­ределяется по формуле:

Интервальная оценка генеральной средней при малой вы­борке - student2.ru (3.31)

Таблица 10. Значения критерия Стьюдента tтeop при различной доверительной вероятности и значениях параметра f

f Доверительная вероятность, р f Доверительная вероятность, р
    0,95 0,99 0,999     0,95 0,99 0,999
12,71 63,60   2,08 2,83 3,82
4,30 9,93 31,60 2,07 2,82 3,79
3,18 5,84 12,94 2,07 2,81 3,77
2,78 4,60 8,61 2,06 2,80 3,75
2,57 4,03 6,86 2,06 2,79 3,73
2,45 3,71 5,96 2,06 2,78 3,71
2,37 3,50 5,41 2,05 2,77 3,69
2,31 3,36 5,04 2,05 2,76 3,67
2,26 3,25 4,78 2,04 2,76 3,66
2,23 3,17 4,59 2,04 2,75 3,65
2,20 3,11 4,44 2,02 2,70 3,55
2,18 3,06 4,32 2,01 2,68 3,50
2,16 3,01 4,22 2,00 2,66 3,46
2,15 2,98 4,14 1,99 2,64 3,42
2,13 2,95 4,07 1,98 2,63 3,39
2,12 2,92 4,02 1,98 2,62 3,37
2,11 2,90 3,97 1,97 2,60 3,34
2,10 2,88 3,92 1,96 2,59 3,31
2,09 2,86 3,88   1,96 2,58 3,29
2,09 2,85 3,85        

Используя этот способ оценки достоверности различия выбо­рочных средних значений двух выборок, следует придерживаться такой последовательности действий. Во-первых, по эксперимен­тальным данным нужно найти значения выборочных средних и средних квадратических отклонений для каждой выборки. За­тем, сравнив величины sх и sу, найти величину f. После этого сле­дует задать определенное значение доверительной вероятности и по таблице 10 найти tтeoр . Затем по формуле (3.30) рассчитать toп.

Если при сравнении теоретического и опытного критериев Стью-дента окажется, что toп > tтeoр, то различие между выборочными средними значениями случайных величин X и У можно считать существенным с заданной доверительной вероятностью. В проти­воположном случае различия несущественны.

Представленный выше способ оценки достоверности различий выборок по выборочным средним является довольно простым. Су­ществует большое число тестов и критериев для сравнения выбо­рок и составления заключения о достоверности их различий. Как правило, при этом рассматривают вероятность двух взаимоисклю­чающих гипотез. Одна из них, условно называемая «нулевой» ги­потезой, заключается в том, что наблюдаемые различия между вы­борками случайны (т. е. фактически различий нет). Альтернатив­ная гипотеза означает, что наблюдаемые различия статистически достоверны. При этом для оценки обоснованности вывода о досто­верности различий используют три основных доверительных уров­ня, при которых принимается или отвергается нулевая гипотеза. Первый уровень соответствует уровню значимости b0 < 0,05; для второго уровня b0 < 0,01. Наконец, третий доверительный уровень имеет b0 < 0,001. При соблюдении соответствующего условия ну­левая гипотеза считается отвергнутой. Чем выше доверительный уровень, тем более обоснованным он считается. Фактически значи­мость вывода соответствует вероятности р = 1 - b0. В медицинских и биологических исследованиях считают достаточным уже первый уровень, хотя наиболее ответственные выводы предпочтительнее делать с большей точностью. Одной из методик, позволяющих су­дить о достоверности различий статистических распределений, яв­ляется ранговый тест Уилкоксона. Под рангом (Ri)понимают но­мер, под которым стоят исходные данные в ранжированном ряду. Если в двух сравниваемых выборках данному номеру соответству­ют одинаковые варианты, то рангом этих вариант является сред­нее арифметическое двух рангов — данного и следующего за ним (см. пример). Покажем, как используется этот тест на примере сравнения двух равных по объему выборок.

*Измеряли массу 13 недоношенных новорожденных (в граммах) в двух районах А и Б большого промышленного центра, один из которых (Б) отличался крайне неблагоприятной экологической обстановкой. По­лучены два статистических распределения (А) и (Б):

А: 970 990 1080 1090 1110 1120 ИЗО 1170 1180 1180 1210 1230 1270

Б: 780 870 900 900 990 1000 1000 1020 1030 1050 1070 1070 1100

Следует решить вопрос о том, достоверны ли различия между этими статистическими распределениями.

Составим общий ранжированный ряд с указанием номеров соответст­вующих вариант (RА.Б) — рангов (строки А и Б соответствуют выборкам):

А: 970990 1080 1090 1110..

RА: 5 6,5 15 16 18

Б: 780 870 900 90,0 990 1000 1000 1020 1030 1050 1070 1070 1100
RБ : 1 2 3 4 6,5 8 9 10 11 12 13 14 17

Как видно, варианта 990 встречается в первой и второй выборках, по­этому для нее рангом является среднее арифметическое значение 6 и 7.

Далее в ряду остаются лишь варианты первой выборки, поэтому ряд не закончен. Нулевая гипотеза состоит в том, что различий между выбор­ками нет (они случайны и потому несущественны). Ранговый тест учиты­вает общее размещение вариант и размеры выборок, но не требует знания типа распределения. Основной вывод о верности нулевой гипотезы дела­ется на основании анализа минимальной суммы рангов (из двух сумм для сравниваемых выборок), т. е. критерием является величина Интервальная оценка генеральной средней при малой вы­борке - student2.ru (учитывая, что Интервальная оценка генеральной средней при малой вы­борке - student2.ru )- При этом пользуются специальными табли­цами. В частности, если число вариант в выборках одинаково (п1 = п2), то используется таблица 11.

Таблица 11, Критические значения величины Г (теста Уилкоксона) при п1 = n2 = n для разных значений уровня значимости

п 0,05 0,01 п 0,05 0,01 п 0,05 0,01

Примечание. Нулевая гипотеза отбрасывается при Т < Т0,05 или Т < Т0,01 .

В этой таблице указаны две входные величины: число вариант в вы­борках (п) и значение третьего и второго уровней значимости (b0 = 0,05 и 0,01). В нашем случае Интервальная оценка генеральной средней при малой вы­борке - student2.ru , что меньше табличного значе­ния для п = 13 и b0 < 0,01. Следовательно, на втором уровне значимости (р > 0,99) можно отвергнуть нулевую гипотезу. Таким образом, различия выборок достоверны с вероятностью, превышающей 0,99.

Наши рекомендации