Ошибки выборочного наблюдения
Выборочное наблюдение, как бы грамотно с методологической точки зрения оно ни было организовано, всегда связано с определенными ошибками получаемых характеристик (см. рис. 10.1).
Рис. 10.1. Классификация ошибок выборочного наблюдения
Ошибки регистрации являются следствием неправильного установления значения наблюдаемого признака или неправильной записи. Они свойственны не только выборочному, но и сплошному наблюдению
Ошибки репрезентативности (представительности) обусловлены тем, что выборочная совокупность не может по всем параметрам в точности воспроизвести генеральную совокупность. Получаемые расхождения называются ошибками репрезентативности, или представительности, так как они отражают, в какой степени попавшие в выборку единицы могут представлять всю генеральную совокупность. При этом следует различать систематические и случайные ошибки репрезентативности.
Систематические ошибки репрезентативности связаны с нарушением принципов формирования выборочной совокупности. В основу отбора единиц для обследования положен принцип равных возможностей попадания в выборку каждой единицы генеральной совокупности. Именно в результате соблюдения этого принципа исключается образование выборочной совокупности только за счет лучших или худших образцов. Это предупреждает появление систематических (тенденциозных) ошибок и делает возможным производить оценку ошибки представительности (репрезентативности).
Например, вследствие каких-либо причин, связанных с организацией отбора, в выборку попали единицы, характеризующиеся несколько большими или, наоборот, несколько меньшими по сравнению с другими единицами значениями наблюдаемых признаков. В этом случае и рассчитанные выборочные характеристики будут завышенными или заниженными.
Случайные ошибки репрезентативности обусловлены действием случайных факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. Но даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характеристики будут несколько различаться. Получаемые случайные ошибки могут быть статистически оценены и учтены при распространении результатов выборочного наблюдения на всю генеральную совокупность. Оценка ошибок выборочного наблюдения основана на теоремах теории вероятностей.
Способы определения ошибки выборки при различных приемах формирования выборочных совокупностей и распространение характеристик выборки на генеральную совокупность составляют основное содержание статистической методологии выборочного метода.
Поскольку изучаемая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборочной совокупности в той или иной мере отличается от состава генеральной совокупности. Это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки.
Ошибка выборки (случайная ошибка репрезентативности) – расхождение между статистическим характеристиками выборочной и генеральной совокупностей, т.е. отклонение средней величины, рассчитанной по выборочной совокупности ( ), от средней, рассчитанной по генеральной совокупности ( ). Она зависит от ряда факторов:
1) объема выборки;
2) степени вариации изучаемого признака;
3) метода отбора единиц в выборочную совокупность.
Средняя ошибка выборки определяется по следующим формулам:
а) при повторном отборе
,
где μ – средняя ошибка выборки;
– дисперсия выборочной совокупности;
n – объем (число единиц) выборочной совокупности;
б) при бесповторном отборе:
,
где N – число единиц в генеральной совокупности.
При определении возможных границ значений характеристик генеральной совокупности рассчитывается предельная ошибка выборки, которая зависит от величины ее средней ошибки и уровня вероятности, с которым гарантируется, что генеральная средняя не выйдет за указанные границы:
,
где – предельная ошибка выборки;
μ - средняя ошибка выборки;
t – коэффициент доверия.
Коэффициент доверия определяется в зависимости от того, с какой доверительной вероятностью надо гарантировать результаты выборочного исследования. Для определения t пользуются таблицами нормального распределения. Некоторые наиболее часто встречающиеся значения этого коэффициента приведены в табл. 10.1.
Таблица 10.1 – Уровни вероятности и соответствующие им значения коэффициента доверия
Доверительная вероятность (P) | 0,683 | 0,950 | 0,954 | 0,997 |
Коэффициент доверия (t) | 1,96 |
Таким образом, границы доверительного интервала могут быть представлены следующим образом:
а) для средней величины:
или ,
б) для доли (частости):
или ,
где р – генеральная доля, т.е. доля единиц в генеральной совокупности, обладающих определенным значением признака;
,
где М – численность единиц генеральной совокупности, обладающих определенным значением признака (например, количество бракованной продукции, численность городского населения);
w – выборочная доля, т.е. доля единиц в выборочной совокупности, обладающих определенным признаком;
,
где m – численность единиц выборочной совокупности, обладающих определенным значением признака.
Пример
При контрольной проверке качества хлебобулочных изделий проведено 5%-ое выборочное обследование партии нарезных батонов из муки высшего сорта. При этом из 100 отобранных в выборку батонов 90 шт. соответствовали требованиям стандарта. Средний вес одного батона в выборке составлял 500,5 г. при среднем квадратическом отклонении ±15,4 г. Определить с вероятностью 0,954:
1) удельный вес стандартных батонов во всей партии;
2) средний вес батона во всей партии.
Прежде всего определим численность генеральной совокупности:
шт.
Определим долю батонов, соответствующих требованиям стандарта:
w = 90/100 = 0,9.
Полученные показатели частости (0,9) и средней величины (500,5 г.) характеризуют долю стандартной продукции и средний вес одного изделия лишь в выборке. Для определения соответствующих показателей для всей партии товара надо установить возможные при этом значения ошибки выборки.
Определим значения средней ошибки выборки:
- для показателя доли стандартных изделий
;
- для показателя среднего веса изделия:
г.
Полученные значения средней ошибки выборочной доли (0,029) и средней ошибки выборочной средней (1,5 г.) необходимы для установления возможных значений генеральной доли (р) и генеральной средней ( ).
Определим предельную ошибку выборки (при Р = 0,954, t = 2):
- для доли стандартных изделий:
∆ = 2·0,029 = 0,058;
- для среднего веса изделия:
∆ = 2·1,5 = 3 г.
Тогда генеральная доля находится в следующих пределах:
;
;
генеральная средняя:
;
.
Следовательно, с вероятностью 0,954 можно утверждать, что
1) удельный вес стандартных изделий во всей партии находится в пределах от 84,2% до 95,8%;
2) средний вес изделия во всей партии находится в пределах от 497,5 г до 503,5 г.