Ошибки репрезентативности
Возможные отклонения выборочных показателей от их параметров в генеральной совокупности называются ошибками репрезентативности.
Эти ошибки неизбежны и возникают потому, что исследованию подвергается не вся генеральная совокупность, а только ее малая доля (выборка).
Это ошибки не технические, а статистические, возникающие не в процессе измерений или учета единиц совокупности и не вследствие вычислительной работы, а исключительно в силу недостаточной точности, с какой выборка репрезентует генеральную совокупность. Но, как и ошибки, допускаемые при измерении, выборочные ошибки, или ошибки репрезентативности, могут быть и случайными, и систематическими. Первые возникают независимо от воли экспериментатора, вторые являются следствием несоблюдения условий репрезентативности при образовании выборочной совокупности.
Систематические ошибки снимаются с устранением вызывающих их причин, главным образом, при соблюдении принципа рандомизации, который предполагает, что доброкачественная выборка должна быть объективной, т.е. производиться без предвзятых побуждений, при исключении субъективных влияний на ее состав.
Случайные же ошибки репрезентативности остаются и должны учитываться при оценке генеральных параметров по данным выборочных наблюдений. При сплошном изучении генеральной совокупности ошибки репрезентативности не имеют места.
Размеры выборочных ошибок зависят главным образом от объема выборки и от размаха варьирования. В частности, чем больше объем выборки, тем меньше выборочная средняя характеристика отличается от генеральной средней. Следовательно, при увеличении числа испытаний ошибка выборочной средней будет уменьшаться, т.е. при ; . На величину средней ошибки влияет также размах варьирования признака: чем больше размах варьирования, тем больше будет и величина выборочной ошибки, при сравнительно слабом варьировании признака ошибка средней арифметической оказывается меньше.
Приведем некоторые формулы, на основании которых можно:
1) судить о точности результатов, полученных в ряде экспериментов;
2) сравнивать две выборки или решать, принадлежат ли они одной или разным генеральным совокупностям.
Предположим, что проводился статистический анализ антропометрических данных баскетболистов высокого класса. При этом у группы баскетболистов из 10 человек измерялся рост. Расчет основных статистических характеристик показал: среднее арифметическое значение роста баскетболистов высокого класса, входящих в исследуемую выборку, составило 195 см при колебаниях σ = 8,8 см. Какие вариации исследуемого признака могут быть в действительности у всех баскетболистов высокого класса, составляющих генеральную совокупность?
Правило трех сигм позволяет грубо определить, относится ли то или иное измерение к соответствующей генеральной совокупности или же к другой совокупности.
Чтобы предсказать процент, в котором будут встречаться в действительности те или иные величины роста, надо установить необходимый диапазон вариаций. Условимся считать границами нормы ; т.е.
(195 ± 8,8 * 3) см, или, иначе, диапазон от (195 - 26,4) см до (195 + 26,4) см.
Если выборка сделана правильно (т.е. различные величины роста баскетболистов находятся в ней примерно в тех же соотношениях, что и в генеральной совокупности), то согласно статистическим исследованиям в диапазон от 168,6 до 221,4 см должны войти 99,7% всех значений роста баскетболистов высокого класса.