Репрезентативность при изучении качественных признаков

Качественные признаки обычно не могут иметь градаций проявления: они или имеются, или не имеются у каждой из особей, например пол, комолость, наличие или отсутствие каких-нибудь особенностей, уродств, выдающихся качеств, хромосомных перестроек, точечных мутаций, заболеваний, исходов болезней и т. д.

Принципиальной разницы между количественными и качественными признаками нет. Степень проявлений большинства качественных признаков при более тщательном исследовании может быть измерена, и тогда качественный признак становится количественным. И, наоборот, любой количественный признак может быть выражен в альтернативной форме (например, больше средней и меньше средней) и тогда он для исследователя превратится в качественный признак.

При изучении групповых свойств по качественным признакам характеристика группы заключается в указании числа плюсовых и минусовых объектов, т. е. объектов, имеющих и не имеющих признак.

Основные сводные показатели: средняя величина и стандартное отклонение качественных признаков имеют, конечно, свои специфические особенности и по технике их расчета и по способам использования в биологических работах.

Средняя величина качественного признака в группе – это доля плюсовых объектов, определяемая по формуле:

Репрезентативность при изучении качественных признаков - student2.ru ; (10.21)

где р – выборочная доля плюсовых объектов (имеющих изучаемый качественный признак);

а – количество плюсовых объектов в группе;

n – объем группы.

Если группа состоит из 200 особей, из которых 120 самок, то доля самок в группе:

Репрезентативность при изучении качественных признаков - student2.ru .

Если долю умножить на 100, то получится характеристика, выраженная в процентах.

В генеральной совокупности доля плюсовых объектов выражается такой формулой:

Репрезентативность при изучении качественных признаков - student2.ru , (10.22)

где Р – доля плюсовых объектов в генеральной совокупности;

А – количество плюсовых объектов;

N – объем генеральной совокупности.

Сумма квадратов центральных отклонений или дисперсия качественных признаков определяется по формулам:

В выборках – C = npq; (10.23)

В генеральных совокупностях – Репрезентативность при изучении качественных признаков - student2.ru ; (10.24)

где q = 1 – p; Q = 1 – P – доля минусовых объектов в выборке и в генеральной совокупности.

При n = 200, а = 120, p = 0,6, q = 0,4

С = 200 × 0,6 × 0,4 = 48.

Стандартное отклонение качественных признаков определяется по формулам:

Репрезентативность при изучении качественных признаков - student2.ru ; (10.25)

Репрезентативность при изучении качественных признаков - student2.ru . (10.26)

Стандартное отклонение качественных признаков имеет принципиальное отличие от сигмы количественных признаков. Произведение pq = p (1 – р) не может быть больше одной четверти:

max [pq] = 0,25 (10.27)

Эта максимальная величина произведения доли на свое дополнение до единицы получается при р = 0,5 и равна 0,5 × 0,5 = 0,25. Всякое другое произведение дает уже меньшую величину, например при р = 0,4; рq = 0,4×0,6 = 0,24.

Поэтому и стандартное отклонение качественных признаков не может быть больше определенного предела: в выборках:

Репрезентативность при изучении качественных признаков - student2.ru . (10.28)

В генеральных совокупностях:

Репрезентативность при изучении качественных признаков - student2.ru (10.29)

Наличие верхнего предела сигмы значительно упрощает планирование достаточной численности выборки при изучении качественных признаков.

Ошибка репрезентативности доли аналогична ошибке средней и определяется по формуле:

Репрезентативность при изучении качественных признаков - student2.ru , (10.30)

Например: при n = 200, а = 120, p = 0,6, q = 0,4

Репрезентативность при изучении качественных признаков - student2.ru .

Максимально возможное значение ошибки:

Репрезентативность при изучении качественных признаков - student2.ru .

Если в выборке получены крайние значения доли (или 0 или 1, т. е. когда в выборке нет ни одного плюсового объекта или, наоборот, вся выборка состоит из одних плюсовых объектов), то ошибка таких долей определяется по формуле:

Репрезентативность при изучении качественных признаков - student2.ru , (10.31)

Если в выборке из 9 объектов не оказалось ни одного плюсового, то р = 0, а s_р = 1/10 = 0,1.

В некоторых биологических исследованиях генеральные доли известны или предполагаются известными и все же требуется определить ошибку выборочной доли для выборок разного объема. В таких случаях ошибка доли определяется по точной формуле:

Репрезентативность при изучении качественных признаков - student2.ru , (10.32)

где в числителе подкоренного выражения стоит произведение генеральной доли на ее дополнение до единицы, а в знаменателе – полный объем выборки (а не число степеней свободы).

Оценка генеральной доли, или определение ее доверительных границ, производится так же, как и оценка генеральной средней:

Р = р ± D; D = t × s_p (10.33)

где Р, р – генеральная и выборочная доли;

D = t_st × s_p – возможная максимальная погрешность при прогнозе генерального параметра;

t_st – критерий надежности для трех порогов вероятности безошибочных прогнозов (b₁=0,95, b₂=0,99, b₃=0,999) устанавливается так же как и при оценке генеральной средней; или по таблице стандартных значений критерия Стьюдента или по приближенным формулам;

s_р – ошибка репрезентативности выборочной доли (показатель точности).

Пример

При исследовании 200 особей одного вида у 60 из них сказалась повышенная способность выдерживать сильное понижение температуры среды обитания. Как часто такие особи могут встретиться среди всей популяции?

Для решения этого вопроса достаточно определить доверительные границы генеральной доли; при сходных данных
n = 200, a = 60, Репрезентативность при изучении качественных признаков - student2.ru ; ;
b₁ = 0,95; n = 199; t_st = 2,0; D = t_st × s_p=2,0 × 0,033=0,066;