Способы распространения выборочных результатов на генеральную совокупность
Целесообразность выборки
При правильно организованном выборочном обследовании изучается не более 20-25% совокупности, обычно 10% и то много. На лицо огромная экономия времени и средств. При этом благодаря работе статистов – профессионалов значительно повышается точность наблюдений (нередко она выше, чем при сплошном наблюдении). Однако параметры выборки в силу объективных причин могут отличаться от соответствующих параметров генеральной совокупности, поэтому результаты выборочного исследования распространяются на генеральную совокупность с определенной вероятностью.
Главная задача выборки:
§ Вычисление ожидаемой ошибки выборки, то есть разницы между одноименными характеристиками выборочной и генеральной совокупности;
§ Определение доверительной вероятности того, что ошибка репрезультативности не превысит некоторого заранее заданного значения;
§ Расчет численности выборки, обеспечивающей
№ 23 Способы формирования выборочных совокупностей
В статистике применяются различные способы формирования выборочных совокупностей, что обусловливается задачами исследования и зависит от специфики объекта изучения.
Основным условием проведения выборочного обследования является предупреждение возникновения систематических ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы генеральной совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности.
Существуют следующие способы отбора единиц из генеральной совокупности:
1) индивидуальный отбор — в выборку отбираются отдельные единицы;
2) групповой отбор — в выборку попадают качественно однородные группы или серии изучаемых единиц;
3) комбинированный отбор — это комбинация индивидуального и группового отбора.
Способы отбора определяются правилами формирования выборочной совокупности.
Выборка может быть:
- собственно-случайная состоит в том, что выборочная совокупность образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки. Доля выборки есть отношение числа единиц выборочной совокупности n к численности единиц генеральной совокупности N, т.е.
- механическая состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки. Так, при 2%-ной выборке отбирается каждая 50-я единица (1:0,02), при 5%-ной выборке — каждая 20-я единица (1:0,05) и т.д. Таким образом, в соответствии с принятой долей отбора, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица.
- типическая –при которойгенеральная совокупность вначале расчленяется на однородные типические группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность. Важной особенностью типической выборки является то, что она дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность;
- серийная - при которой генеральную совокупность делят на одинаковые по объему группы - серии. В выборочную совокупность отбираются серии. Внутри серий производится сплошное наблюдение единиц, попавших в серию;
- комбинированная - выборка может быть двухступенчатой. При этом генеральная совокупность сначала разбивается на группы. Затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц.
В статистике различают следующие способы отбора единиц в выборочную совокупность:
- одноступенчатая выборка - каждая отобранная единица сразу же подвергается изучению по заданному признаку (собственно-случайная и серийная выборки);
- многоступенчатая выборка - производят подбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы (типическая выборка с механическим способом отбора единиц в выборочную совокупность).
Кроме того различают:
- повторный отбор – по схеме возвращенного шара. При этом каждая попавшая в выборку единица иди серия возвращается в генеральную совокупность и поэтому имеет шанс снова попасть в выборку;
- бесповторный отбор – по схеме невозвращенного шара. Он имеет более точные результаты при одном и том же объеме выборки.
№ 24 Виды случайных ошибок выборки
Ошибка выборки в статистике это некоторая средняя величина или обобщающая характеристика, ошибок полученных при многократном повторении испытаний.
Каждая единица при выборочном наблюдении должна иметь равную с другими возможность быть отобранной – это является основой собственнослучайной выборки.
Собственнослучайная выборка – это отбор единиц из всей генеральной совокупности посредством жеребьевки или другим подобным способом.
Принципом случайности является то, что на включение или исключение объекта из выборки не может повлиять любой фактор, кроме случая.
Доля выборки– это отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:
Собственнослучайный отбор в чистом виде является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного статистического наблюдения.
Два основных вида обобщающих показателей, которые используют в выборочном методе – это средняя величина количественного признака и относительная величина альтернативного признака.
Выборочная доля (w), или частность, определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности (n):
Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.
Ошибка выборки, ее еще называют ошибкой репрезентативности, представляет собой разность соответствующих выборочных и генеральных характеристик:
1) для средней количественного признака:
εх =|х – х|;
2) для доли (альтернативного признака):
εw =|х – p|.
Только выборочным наблюдениям присуща ошибка выборки
Выборочная средняя и выборочная доля – это случайные величины, принимающие различные значения в зависимости от единиц изучаемой статистической совокупности, которые попали в выборку. Соответственно ошибки выборки – тоже случайные величины и также могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки.
Средняя ошибка выборки определяется объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность.
Средняя ошибка выборки зависит от степени варьирования изучаемого признака, в свою очередь степень варьирования характеризуется дисперсией σ2 или w(l – w) – для альтернативного признака. Чем меньше вариация признака и дисперсия, тем меньше средняя ошибка выборки, и наоборот.
При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:
1) для средней количественного признака:
где σ2 – средняя величина дисперсии количественного признака.
2) для доли (альтернативного признака):
Так как дисперсия признака в генеральной совокупности σ2 точно неизвестна, на практике пользуются значением дисперсии S2 , рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.
Формулы средней ошибки выборки при случайном повторном отборе следующие. Для средней величины количественного признака: генеральная дисперсия выражается через выборную следующим соотношением:
где S2 – значение дисперсии.
Механическая выборка– это отбор единиц в выборочную совокупность из генеральной, которая разбита по нейтральному признаку на равные группы; производится так, что из каждой такой группы в выборку отбирается лишь одна единица.
При механическом отборе единицы изучаемой статистической совокупности предварительно располагают в определенном порядке, после чего отбирают заданное число единиц механически через определенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки.
При достаточно большой совокупности механический отбор по точности результатов близок к собственнослучайному Поэтому для определения средней ошибки механической выборки используют формулы собственнослучайной бесповторной выборки.
Для отбора единиц из неоднородной совокупности применяется так называемая типическая выборка, используется, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, от которых зависят изучаемые показатели.
Затем из каждой типической группы собственнослучайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.
Типическая выборка обычно применяется при изучении сложных статистических совокупностей.
Типическая выборка дает более точные результаты. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. Поэтому при определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.
Серийная выборка предполагает случайный отбор из генеральной совокупности равновеликих групп для того, чтобы в таких группах подвергать наблюдению все без исключения единицы.
Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.
№ 25 Ошибка выборочного наблюдения: Средняя, стандартная и максимально возможная (предельная)
. Различают среднюю (стандартную) и предельную ошибку выборки.
Под средней (стандартной) ошибкой выборки понимают такое расхождение между средней выборочной и генеральной совокупностями (~ —), которое не превышает ±.
Предельной ошибкой выборки принято считать максимально возможное расхождение (~ —), т. е. максимум ошибки при заданной вероятности ее появления.
Стандартная ошибка рассчитывается по формуле:
Предельная ошибка выборки рассчитывается по формуле:
№ 26 Способы оценки генеральной совокупности по данным выборки. Ряды динамики, их виды, сопоставимость в рядах динамики. Приемы анализа рядов динамики.
Генеральной совокупностью называют совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений случайной величины, или совокупность результатов всех мыслимых наблюдений, проводимых в неизменных условиях над одной из случайных величин, связанных с данным видом объектов.
Способы распространения выборочных результатов на генеральную совокупность
Характеристика генеральной совокупности на основе выборочных результатов – это конечная цель выборочного наблюдения.
Выборочный метод применяется для получения характеристик генеральной совокупности по определенным показателям выборки. В зависимости от целей исследования это осуществляется прямым пересчетом показателей выборки для генеральной совокупности или методом расчета поправочных коэффициентов.
Способ прямого пересчета в том, что при нем показатели выборочной доли w или средней х распространяются на генеральную совокупность с учетом ошибки выборки.
Способ поправочных коэффициентов применяется, когда целью выборочного метода является уточнение результатов сплошного учета. Данный способ используется при уточнении данных ежегодных переписей скота у населения.
Основные понятия о рядах динамики
Все процессы и явления, протекающие в общественной жизни человека, являются предметом изучения статистической науки они находятся в постоянном движении и изменении.
Динамическими рядами в статистической науке называют статистические данные, характеризующие изменения явлений во времени, они строятся для выявления и изучения возникающих закономерностей в развитии явлений в различных сферах (например, экономической, политической и культурной) жизни общества.
В рядах динамики имеются два главных элемента:
1) показатель времени (г);
2) уровни развития изучаемого явления (у). В рядах динамики в качестве показателей времени могут выступать определенные даты времени или отдельные периоды.
Уровни, образующие ряды динамики, определяют количественную оценку развития во времени исследуемого явления или процесса, они могут выражаться относительными, абсолютными либо средними величинами. Уровни рядов динамики в зависимости от характера исследуемого явления могут относиться к определенным датам времени или к отдельным периодам.
Динамический ряд состоит из сопоставимых статистических показателей. Для правильности построения динамических рядов необходимо, чтобы состав исследуемой статистической совокупности относился к одной и той же территории, к одному и тому же кругу объектов и был рассчитан по одной и той же методологии.
Данные динамического ряда должны выражаться в одних и тех же единицах измерения, а промежутки времени между значениями ряда должны быть по возможности одинаковыми.
Виды рядов динамики
Ряды динамики подразделяются на моментные, интервальные и ряды средних величин.
Моментные ряды динамики отображают состояние исследуемых процессов на определенные даты времени.
Интервальные ряды динамики отображают итоги развития или функционирования исследуемых процессов за отдельные периоды времени.
Вычисление среднего динамического ряда. Для характеристики процесса за определенный период рассчитывают средний уровень из всех членов динамического ряда.
Способы его расчета зависят от вида динамического ряда. Для интервальных рядов средняя рассчитывается по формуле средней арифметической, причем при равных интервалах применяется средняя арифметическая простая, а при неравных – средняя арифметическая взвешенная.
Для нахождения средних значений моментного ряда применяют среднюю хронологическую:
Средняя хронологическая моментного ряда равна сумме всех уровней ряда, поделенной на число членов ряда без одного, причем первый и последний члены ряда берутся в половинном размере.
Если интервалы между периодами не равны, то применяется средняя арифметическая взвешенная, а в качестве весов берутся отрезки времени между датами, к которым относятся парные средние смежных значений уровня.