Ошибка репрезентативности, методика вычисления ошибки средней и относительной величины
В статистике выделяют два основных метода исследования - сплошной и выборочный. При проведении выборочного исследования обязательным является соблюдение следующих требований: репрезентативность выборочной совокупности и достаточное число единиц наблюдений. При выборе единиц наблюдения возможны ошибки смещения, т.е. такие события, появление которых не может быть точно предсказуемым. Эти ошибки являются объективными и закономерными. При определении степени точности выборочного исследования оценивается величина ошибки, которая может произойти в процессе выборки - случайная ошибка репрезентативности (m) -является фактической разностью между средними или относительными величинами, полученными при проведении выборочного исследования и аналогичными величинами, которые были бы получены при проведении исследования на генеральной совокупности.
Оценка достоверности результатов исследования предусматривает определение:
1. ошибки репрезентативности
2. доверительных границ средних (или относительных) величин в генеральной совокупности
3. достоверности разности средних (или относительных) величин (по критерию t)
Расчет ошибки репрезентативности (mм) средней арифметической величины (М):
, где σ - среднее квадратическое отклонение; n - численность выборки (>30).
Расчет ошибки репрезентативности (mР) относительной величины (Р):
, где Р - соответствующая относительная величина (рассчитанная, например, в %);
q =100 - Ρ% - величина, обратная Р; n - численность выборки (n>30)
В клинических и экспериментальных работах довольно часто приходится использовать малую выборку, когда число наблюдений меньше или равно 30. При малой выборке для расчета ошибок репрезентативности, как средних, так и относительных величин, число наблюдений уменьшается на единицу, т.е.
; .
Величина ошибки репрезентативности зависит от объема выборки: чем больше число наблюдений, тем меньше ошибка. Для оценки достоверности выборочного показателя принят следующий подход: показатель (или средняя величина) должен в 3 раза превышать свою ошибку, в этом случае он считается достоверным.
Знание величины ошибки недостаточно для того, чтобы быть уверенным в результатах выборочного исследования, так как конкретная ошибка выборочного исследования может быть значительно больше (или меньше) величины средней ошибки репрезентативности. Для определения точности, с которой исследователь желает получить результат, в статистике используется такое понятие, как вероятность безошибочного прогноза, которая является характеристикой надежности результатов выборочных медико-биологических статистических исследований. Обычно, при проведении медико-биологических статистических исследований используют вероятность безошибочного прогноза 95% или 99%. В наиболее ответственных случаях, когда необходимо сделать особенно важные выводы в теоретическом или практическом отношении, используют вероятность безошибочного прогноза 99,7%
Определенной степени вероятности безошибочного прогноза соответствует определенная величина предельной ошибки случайной выборки (Δ - дельта), которая определяется по формуле:
Δ=t * m , где t - доверительный коэффициент, который при большой выборке при вероятности безошибочного прогноза 95% равен 2,6; при вероятности безошибочного прогноза 99% - 3,0; при вероятности безошибочного прогноза 99,7% - 3,3, а при малой выборке определяется по специальной таблице значений t Стьюдента.
Используя предельную ошибку выборки (Δ), можно определить доверительные границы, в которых с определенной вероятностью безошибочного прогноза заключено действительное значение статистической величины, характеризующей всю генеральную совокупность (средней или относительной).
Для определения доверительных границ используются следующие формулы:
1) для средних величин:
,где Мген - доверительные границы средней величины в генеральной совокупности;
Мвыб- средняя величина, полученная при проведении исследования на выборочной совокупности; t - доверительный коэффициент, значение которого определяется степенью вероятности безошибочного прогноза, с которой исследователь желает получить результат; mM - ошибка репрезентативности средней величины.
2) для относительных величин:
, где Рген - доверительные границы относительной величины в генеральной совокупности; Рвыб- относительная величина, полученная при проведении исследования на выборочной совокупности; t - доверительный коэффициент; mP - ошибка репрезентативности относительной величины.
Доверительные границы показывают, в каких пределах может колебаться размер выборочного показателя в зависимости от причин случайного характера.
При малом числе наблюдений (n<30), для вычисления доверительных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, указывающей на имеющееся число степеней свободы (n), которое равно n-1.
117. Оценка достоверности различий относительных и средних величин. Критерии «t».
При проведении медико-биологических исследований на двух сравниваемых совокупностях возникает необходимость определить не только их различие, но и его достоверность. Метод оценки достоверности разности показателей или средних величин позволяет установить, существенны ли выявленные различия, или они являются результатом действия случайных причин.
В основе метода лежит определение критерия достоверности "t", который рассчитывается по специальным формулам для средних и относительных величин:
для средних: , а для относительных величин , где Μ1, Μ2, P1 и P2 - статистические величины, полученные при проведении выборочных исследований: m1 и m2 - их ошибки репрезентативности; t - коэффициент достоверности.
При большой выборке различие достоверно при t>2, что соответствует вероятности безошибочного прогноза равной или более 95%. При величине коэффициента достоверности t<2 степень вероятности безошибочного прогноза менее 95%. При такой степени вероятности мы не можем утверждать, что полученная разность показателей достоверна с достаточной степенью вероятности. В этом случае необходимо получить дополнительные данные, увеличив число наблюдений. Если после увеличения численности выборки, и, соответственно, уменьшения ошибки репрезентативности, различие продолжает оставаться недостоверным, можно считать доказанным, что между сравниваемыми совокупностями не обнаружено различий по изучаемому признаку.
Для определения достоверности различий между двумя показателями или средними величинами при малом числе наблюдений критерий достоверности оценивается по таблице значений критерия t Стьюдента по числу степеней свободы, которое при этом определяется как сумма чисел наблюдений в каждой группе без двух.