Методы оценки достоверности результатов выборочного исследования
Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность.
Оценка достоверности результатов исследования предусматривает определение:
1) ошибок репрезентативности (средних ошибок средних арифметических и относительных величин) – m;
2) доверительных границ средних или относительных величин;
3) достоверности разницы средних или относительных величин (по критерию Стьюдента t);
4) достоверности разницы сравниваемых групп по критерию c2.
1. Определение ошибки репрезентативности - m
При определении степени достоверности выборочного исследования оценивается величина ошибки, которая может произойти в процессе выборки. Такие ошибки носят название ошибок репрезентативности (m) и являются фактической разностью между статистическими величинами (средними или относительными), полученными при выборочном исследовании и аналогичными величинами, которые были бы получены при изучении всей совокупности. Эти ошибки неизбежны.По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном исследовании, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генеральной совокупности.
Средняя ошибка средней арифметической (mM) определяется по формуле:
т.е. она прямо пропорциональна степени разнообразия признака и обратно пропорциональна корню квадратному из числа наблюдений. Значит уменьшить ошибку возможно путем увеличения числа наблюдений.
Средняя ошибка относительной величины (mP) определяется по формуле:
где Р – относительная величина. Если показатель выражен в %, то q = 100 – Р, если Р – в промилле, то q = 1000 – Р и т.д., n – число наблюдений. Если n<30, в знаменатель следует взять n–1.
2. Определение доверительных границ средних и относительных величин
Доверительные границы– это границы средних или относительных величин, выход за пределы которых вследствие случайных колебаний имеет незначительную вероятность.
Доверительные границы средней арифметической величины в генеральной совокупности определяют по формуле: Мген.= Мвыб.± D
Доверительные границы относительной величины в генеральной совокупности по формуле: Рген. = Рвыб. ±D
где D – предельная ошибка выборки (D = tm).Она зависит от коэффициента t – доверительного критерия Стьюдента, который выбирает сам исследователь. Для большинства медико-биологических и социологических исследований достоверными считаются доверительные границы, установленные с вероятностью безошибочного прогноза Pt=95,5% и более.
Значения критерия Стьюдента (t) при числе наблюдений n>30:
При t=2, достоверность Pt=95,5% и риск ошибки p<0,05;
при t=2,6 Pt=99,0%, риск ошибки p<0,01;
при t=3 Pt=99,7%, риск ошибки p<0,003;
при t=3,3 Pt=99,9%, риск ошибки p<0,001.
Таблица значений критерия Стьюдента (t) для малых выборок (n≤30)
n (число наблюдений) | Р=95,5% | Р=99% | Р=99,9% |
12,70 | 63,65 | 636,61 | |
4,303 | 9,925 | 31,602 | |
3,182 | 5,841 | 12,923 | |
2,776 | 4,604 | 8,610 | |
2,571 | 4,032 | 6,869 | |
2,447 | 3,707 | 5,959 | |
2,365 | 3,499 | 5,408 | |
2,306 | 3,355 | 5,041 | |
2,262 | 3,250 | 4,781 | |
2,228 | 3,169 | 4,587 | |
2,201 | 3,106 | 4,437 | |
2,179 | 3,055 | 4,318 | |
2,160 | 3,012 | 4,221 | |
2,145 | 2,977 | 4,140 | |
2,131 | 2,947 | 4,073 | |
2,120 | 2,921 | 4,015 | |
2,110 | 2,898 | 3,965 | |
2,101 | 2,878 | 3,922 | |
2,093 | 2,861 | 3,883 | |
2,086 | 2,845 | 3,850 | |
2,080 | 2,831 | 3,819 | |
2,074 | 2,819 | 3,792 | |
2,069 | 2,807 | 3,768 | |
2,064 | 2,797 | 3,745 | |
2,060 | 2,787 | 3,725 | |
2,056 | 2,779 | 3,707 | |
2,052 | 2,771 | 3,690 | |
2,049 | 2,763 | 3,674 | |
2,045 | 2,756 | 3,659 | |
2,042 | 2,750 | 3,646 |
3. Достоверность разности средних или относительных величин
При сопоставлении двух сравниваемых величин возникает необходимость не только определить их разность, но и оценить ее достоверность, т.е. можно ли вывод о разности средних величин, полученный при выборочном исследовании, перенести на соответствующую генеральную совокупность.
Достоверность выборочной разницы измеряется доверительным коэффициентом (критерием точности, Стьюдентаt):
для средних величин:
для относительных величин:
где М1 и М2, Р1 и Р2 – показатели, полученные при выборочных исследованиях; m1 и m2 - их средние ошибки.
При t ³2 разность средних арифметических может быть признана существенной и не случайной, т.е. достоверной. Это значит, что и в генеральной совокупности средние величины отличаются, и при повторении подобных наблюдений будут получены аналогичные различия. Надежность такого вывода будет не меньше 95,5%. С увеличением t степень надежности также увеличивается, а риск ошибки (p) уменьшается. При t < 2 достоверность разности средних величин считается недоказанной.
СРЕДНИЕ ВЕЛИЧИНЫ
Вариационный ряд - это ряд, в котором упорядоченно сопоставлены (по степени возрастания или убывания) варианты и соответствующие им частоты. Отдельные числовые значения признака называются вариантами (V), а числа, показывающие, как часто эти варианты повторяются - частотами (Р), общее число наблюдений (n) равно сумме частот (n=SP, S - знак суммы).
Вариационный ряд может быть простым (при малом числе наблюдений –n£30) или сгруппированным (n>30); открытым и закрытым. По характеру распределения: альтернативным(имеет только 2 противоположных значения признака - да, нет), симметричным (наибольшее число наблюдений приходится на середину ряда) и ассиметричным(наибольшее число наблюдений сдвигается в сторону меньшего значения признака - правосторонняя ассиметрия, или в сторону большего значения признака - левосторонняя ассиметрия, или же скапливается по концам ряда - бимодальное распределение).
Построение вариационного ряда из отдельных вариант – это только первый шаг к осмыслению особенностей всей совокупности. Далее необходимо определить средний уровень изучаемого количественного признака.
Средняя величина – это число, выражающее общую меру исследуемого признака в совокупности.
Различают несколько видов средних величин: мода (Мо), медиана (Ме) и средняя арифметическая (М).
Мода (Мо)- наиболее часто повторяющаяся варианта, т.е. та, которой соответствует наибольшее количество частот (Р) вариационного ряда.
Медиана (Ме)- варианта, занимающая срединное положение в вариационном ряду. При нечетном числе наблюдений для определения медианы надо найти середину ряда – медианой будет центральная (срединная) варианта. При четном числе наблюдений за медиану принимают среднюю величину из двух центральных вариант.
Наиболее часто используется средняя арифметическая величина (М). Она имеет3 основных свойства:
1. Занимает срединное положение в вариационном ряду. В строго симметричном ряду М = Мо = Ме;
2. Имеет абстрактный характер и является обобщающей величиной, вскрывающей то типичное, что характерно для всей совокупности.
3. Алгебраическая сумма отклонений всех вариант от средней равна нулю. Если сумма отклонений вариант от средней равна нулю, то средняя вычислена правильно. На этом свойстве основан расчет средней по способу моментов.
Средняя арифметическая, которая рассчитана в вариационном ряду, где каждая варианта встречается только один раз (для всех вариант р=1), называется средней арифметической простой. Она определяется по формуле:
где V – значение вариационного признака,
n – общее число наблюдений
Если в исследуемом ряду отдельные варианты встречаются различное число раз (р³1), то вычисляют среднюю арифметическую взвешенную.Расчет ее производится по формуле:
где Р – частота, n – сумма частот (å P).