Распространение выборочных результатов на генеральную совокупность
Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.
Выборочные средние и относительные величины распространяют на генеральную совокупность с учетом предела их возможной ошибки.
В каждой конкретной выборке расхождение между выборочной средней и генеральной, т.е. может быть меньше средней ошибки , равно ей или больше ее.
Причем каждое из этих расхождений имеет различную вероятность(объективную возможность появления события). Поэтому фактические расхождения между выборочной средней и генеральной можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностью ( ).
Предельную ошибку выборки для средней ( ) при повторном отборе можно рассчитать по формуле:
, (6.23)
где - нормированное отклонение - «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки;
- средняя ошибка выборки.
Аналогичным образом может быть записана формула предельной ошибки выборки для доли при повторном отборе:
(6.24)
При случайном бесповторном отборев формулах расчета предельных ошибок выборки (6.23) и (6.24) необходимо умножить подкоренное выражение на .
Формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированных в ряде теорем теории вероятностей, отражающих закон больших чисел.
На основании теоремы П.Л. Чебышева (с уточнениями А.М. Ляпунова) с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной генеральной дисперсии выборочные обобщающие показатели (средняя, доля) будут сколь угодно мало отличаться от соответствующих генеральных показателей.
Применительно к нахождению среднего значения признака эта теорема может быть записана так:
(6.25)
а для доли признака:
(6.26)
где . (6.27)
Таким образом, величина предельной ошибки выборки может быть установлена с определенной вероятностью.
Значения функции при различных значениях как коэффициента кратности средней ошибки выборки, определяется на основе специально составленных таблиц. Приведем некоторые значения, применяемые наиболее часто для выборок достаточно большого объема (см. табл.6.1), которыми воспользуемся в дальнейшем при решении задач.
Таблица 6.1 – Наиболее часто применяемые значения для выборок ( )
1,000 | 1,960 | 2,000 | 2,580 | 3,000 | |
0,683 | 0,950 | 0,954 | 0,990 | 0,997 |
Предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, значение которой определяется коэффициентом (в практических расчетах, как правило, заданная вероятность не должна быть менее 0,95).
Так, при предельная ошибка составит , следовательно, с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки выборки. Другими словами, в 68,3 % случаев ошибка репрезентативности не выйдет за пределы . При с вероятностью 0,954 она не выйдет за пределы , при c вероятностью 0,997 – за пределы и т.д.
Как видно из приведенных выше значений функции (см. последние значение), вероятность появления ошибки, равной или большей утроенной средней ошибки выборки, т.е. , крайне мала и равна 0,003, т.е. 1 – 0,997. такие маловероятные события считаются практически невозможными, а потому величину можно принять за предел возможной ошибки выборки.
Выборочное наблюдение проводится в целях распространения выводов, полученных по данным выборки, на генеральную совокупность. Одной из основных задач является оценка по данным выборки исследуемых характеристик (параметров) генеральной совокупности.
Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:
- для средней:
, (6.28)
- для доли:
(6.29)
Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от до .
Аналогичным образом может быть записан доверительный интервал генеральной доли:
Наряду с абсолютным значением предельной ошибки выборки рассчитывается и предельная относительная ошибка выборки, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:
- для средней, %:
, (6.30)
- для доли, %:
. (6.31)
Рассмотрим нахождение средних и предельных ошибок выборки, определение доверительных пределов средней и доли на конкретных примерах.
Задача 6.1.Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням ( ) со стандартным отклонением 6 дней ( ).
Необходимо с вероятностью определить предельную ошибку выборочной средней продолжительности расчетов предприятий данной корпорации.
Решение:
Предельную ошибку определяем по формуле повторного отбора (6.23), так как численность генеральной совокупности неизвестна. Из представленных значений (см. табл.6.1) для вероятности необходим .
Следовательно, предельная ошибка выборки, дней:
Предельная относительная ошибка выборки, %:
.
Генеральная средняя будет равна , а доверительные интервалы (пределы) генеральной средней исчисляем, исходя из двойного неравенства:
.
Таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпорации колеблется в пределах от 20,8 до 23,2 дней.
Задача 6.2.Среди выборочного обследованных 1000 семей региона по уровню душевого дохода (выборка 2% - ная, механическая) малообеспеченных оказалось 300 семей.
Требуется с вероятностью 0,997 определить долю малообеспеченных семей во всем регионе.
Решение:
Выборочная доля (доля малообеспеченных семей среди обследованных семей) равна:
По представленным ранее данным для вероятности 0,997 находим . Предельную ошибку доли определяется по формуле бесповторного отбора (механическая выборка всегда является бесповторной):
Предельная относительная ошибка выборки, %:
.
Генеральная доля , а доверительные пределы генеральной доли исчисляем, исходя из двойного неравенства:
В нашем примере:
Таким образом, почти достоверно, с вероятностью 0,997 можно утверждать, что доля малообеспеченных семей среди всех семей региона колеблется от 28,6 до 31,4%.
Задача 6.3. Для определения урожайности зерновых культур проведено выборочное обследование 100 хозяйств региона различных форм собственности, в результате которого получены сводные данные (таблица 6.2). Необходимо с вероятностью 0,954 определить предельную ошибку выборочной средней и доверительные пределы средней урожайности зерновых культур по всем хозяйствам региона.
Таблица 6.2 - Распределение урожайности по хозяйствам региона, имеющим различную форму собственности
Хозяйства (по формам собственности) | Количество обследованных хозяйств | Средняя урожайность, ц/га | Дисперсия урожайности в каждой группе |
Коллективные | |||
Акционерные общества | |||
Крестьянские (фермерские) | |||
Итого | - | - |
Решение:
Поскольку обследованные хозяйства региона сгруппированы по формам собственности, предельную ошибку средней урожайности определяем по формуле для типической выборки, осуществляемой методом повторного отбора (численность генеральной совокупности неизвестна):
.
В этой формуле неизвестна средняя из внутригрупповых дисперсий.
Она исчисляется по формуле:
По представленным ранее данным для вероятности находим .
Тогда предельная ошибка выборки, ц/га:
Генеральная средняя: Для нахождения ее границ вначале нужно исчислить среднюю урожайность по выборочной совокупности , ц/га:
Предельная относительная ошибка выборки, %:
Доверительные пределы генеральной средней исчисляем, исходя из двойного неравенства:
.
Таким образом, с вероятностью 0,954 можно гарантировать, что средняя урожайность зерновых культур по региону будет не менее чем 20 ц/га, но и не более чем 22 ц/га.
Определение необходимого объема выборки. При проектировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно определить численность (объем) выборочной совокупности, которая с определенной вероятностью обеспечит заданную точность результатов наблюдения. Формулы для определения необходимой численности выборки легко получить непосредственно из формул ошибок выборки.
Так, из формул предельной ошибки выборки для повторного отбора нетрудно (предварительно возведя в квадрат обе части равенства) выразить необходимую численность выборки:
- для средней количественного признака:
, (6.32)
- для доли (альтернативного признака):
(6.33)
Аналогично из формул предельной ошибки выборки для бесповторного отбора находим, что:
- для средней:
, (6.34)
- для доли:
. (6.35)
Эти формулы показывают, что с увеличением предполагаемой ошибки выборки значительно уменьшается необходимый объем выборки.
Для расчета объема заимствована из проводимых ранее обследований данной или аналогичной совокупности, а если таковых нет, тогда для определения дисперсии надо провести специальное выборочное обследование небольшого объема.
Задача 6.4.Для определения среднего возраста 1200 студентов факультета необходимо провести выборочное обследование методом случайного бесповторного отбора. Предварительно установлено, что среднее квадратическое отклонение возраста студентов равно 10 годам.
Сколько студентов нужно обследовать, чтобы с вероятностью 0,954 средняя ошибка выборки не превышала 3 года?
Решение:
Рассчитаем необходимую численность выборки, чел., по формуле бесповторного отбора (6.34), учитывая, что , при :
Таким образом, выборка численностью 47 чел. Обеспечивает заданную точность при бесповторном отборе.
Выборочный метод широко используется в статистической практике для получения экономической информации.
Большую актуальность приобретает выборочный метод в современных условиях перехода к рыночной экономике. Изменения в характере экономических отношений, аренда, собственность отдельных коллективов и лиц обусловливают изменения функций учета и статистики, сокращение и упрощение отчетности. Вместе с тем, возрастающие требования к менеджменту усиливают потребность в обеспечении надежной информацией, дальнейшего повышения ее оперативности. Все это обусловливает более широкое применение выборочного метода в экономике.
В отчетной статистике уже накоплен определенный опыт выборочных обследований. В последние годы все большее применение в социальной статистике находят специальные выборочные наблюдения. Так, важнейшим источником информации об уровне жизни народа являются данные регулярно проводимых выборочных обследований бюджетов семей. Широко применяется выборочный метод при переписи населения, изучении общественного мнения, контрольных обходах и проверках после проведения сплошных обследований.
Потребность в использовании выборочного метода, выработке вероятностных суждений в современной отечественной статистике непрерывно расширяется.