Генеральная и выборочная совокупности

Генеральной совокупностью называется вся подлежащая изучению совокупность объектов (наблюдений). Один или несколько элементов, взятых из генеральной совокупности для получения информации о ней, называется выборочной совокупностью или выборкой. Объемом совокупности (выборочной или генеральной) называется число элементов этой совокупности.

Метод статистического исследования, состоящий в том, что на основе изучения выборки делается заключение обо всей генеральной совокупности, называется выборочным. Для того чтобы по отобранным значениям некоторого показателя можно было достаточно уверенно судить обо всей совокупности, полученная выборка должна быть репрезентативной (представительной), т.е. правильно отражать пропорции генеральной совокупности. Выборка будет представительной лишь тогда, когда все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку.

В дальнейшем под генеральной совокупностью будем подразумевать не само множество объектов, а множество значений случайной величины, принимающей числовое значение на каждом из объектов. В статистике обычно исследуемые случайные величины называют признаками и обозначают большими латинскими буквами Генеральная и выборочная совокупности - student2.ru , Генеральная и выборочная совокупности - student2.ru и т.д.

Выборку будем рассматривать как совокупность независимых случайных величин Генеральная и выборочная совокупности - student2.ru , распределенных так же, как и случайная величина (признак) Генеральная и выборочная совокупности - student2.ru , представляющая генеральную совокупность.Конкретные значения, которые приняли эти случайные величины в результате эксперимента, называют реализацией выборки или значениями признака и обозначают строчными буквами Генеральная и выборочная совокупности - student2.ru . Различные значения признака называют вариантами.

Вариационные ряды

Числа, показывающие, сколько раз встречаются варианты Генеральная и выборочная совокупности - student2.ru в выборке, называются частотами (обозначаются Генеральная и выборочная совокупности - student2.ru ).

Вариационным (статистическим) рядом называется расположенный в порядке возрастания или убывания ряд вариант с соответствующими им частотами. Вариационный ряд часто называют рядом распределения выборки.

Вариация (изменение) количественных признаков может быть дискретной, например, академическая система успеваемости: 5 – отлично, 4 – хорошо и т.д., или непрерывной, например, возраст, рост или вес человека. В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.

Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину. Он представляет собой таблицу, состоящую из двух строк: конкретных значений признака и их частот:

Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru
Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru

где Генеральная и выборочная совокупности - student2.ru .

Вариационный ряд называется интервальным, если варианты могут отличаться один от другого на сколь угодно малую величину[1]. Он представляет собой таблицу, состоящую из двух строк – интервалов значений признака и числа значений выборки, попадающих в этот интервал:

Интервал, Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru
Частота, Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru Генеральная и выборочная совокупности - student2.ru

Числовые характеристики

Вариационный ряд содержит достаточно полную информацию об изменчивости признака. Однако обилие числовых данных, с помощью которых он задается, усложняет их использование. В то же время на практике часто оказывается достаточным знание лишь сводных числовых характеристик выборочной совокупности. Рассмотрим наиболее часто используемые числовые характеристики вариационных рядов: среднюю арифметическую, дисперсию и среднее квадратическое отклонение.

Средняя арифметическая

Средние величины характеризуют значения признака, вокруг которого концентрируются наблюдения. Наиболее распространенной из средних величин является средняя арифметическая. Для ее расчета используют формулу:

Генеральная и выборочная совокупности - student2.ru , (14)

где Генеральная и выборочная совокупности - student2.ru – варианты, Генеральная и выборочная совокупности - student2.ru – соответствующие им частоты, Генеральная и выборочная совокупности - student2.ru – объем совокупности.

Если средняя арифметическая рассчитывается по всей генеральной совокупности в целом, то ее называют генеральной средней, а если по выборке – выборочной средней.

Если статистический материал представлен в виде интервального вариационного ряда, то при расчете выборочной средней сначала необходимо вычислить середины каждого интервала Генеральная и выборочная совокупности - student2.ru , которые рассчитываются по формуле: Генеральная и выборочная совокупности - student2.ru . Далее расчеты ведутся, как и для дискретного вариационного ряда, но в качестве вариантов используем Генеральная и выборочная совокупности - student2.ru .

Дисперсия и среднее квадратическое отклонение

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по формуле:

Генеральная и выборочная совокупности - student2.ru . (15)

Дисперсия, рассчитанная для генеральной совокупности, называется генеральной дисперсией, а для выборки – выборочной дисперсией.

При вычислении выборочной дисперсии для интервальных вариационных рядов в качестве Генеральная и выборочная совокупности - student2.ru , как и при вычислении выборочной средней, используются середины соответствующих интервалов.

Иногда, особенно если дисперсию приходится рассчитывать «вручную», удобнее использовать другую формулу, которая легко получается из формулы (15) с помощью несложных математических преобразований:

Генеральная и выборочная совокупности - student2.ru . (16)

Среднее квадратическое отклонение представляет собой квадратный корень из дисперсии:

Генеральная и выборочная совокупности - student2.ru .

Среднее квадратическое отклонение (СКО) выражается в тех же единицах измерения, что и признак.

Точечные оценки

Большинство случайных величин имеют распределения, зависящие от одного или нескольких параметров. Так, например, нормальное распределение зависит от параметров Генеральная и выборочная совокупности - student2.ru и Генеральная и выборочная совокупности - student2.ru .

Выборочная характеристика, используемая в качестве приближенного значения неизвестного параметра генеральной совокупности, называется статистической точечной оценкой этого параметра. Статистическая оценка неизвестных параметров теоретического распределения генеральной совокупности (или просто параметров генеральной совокупности) – одна из основных задач математической статистики.

Обозначим через Генеральная и выборочная совокупности - student2.ru некоторый неизвестный параметр генеральной совокупности, а через Генеральная и выборочная совокупности - student2.ru – точечную оценку этого параметра. Оценка Генеральная и выборочная совокупности - student2.ru есть функция Генеральная и выборочная совокупности - student2.ru от выборки объема Генеральная и выборочная совокупности - student2.ru из независимых случайных величин Генеральная и выборочная совокупности - student2.ru , каждая из которых имеет тот же закон распределения, что и генеральная совокупность. Поэтому оценка Генеральная и выборочная совокупности - student2.ru , как функция случайных величин, также является случайной величиной, в отличие от оцениваемого параметра Генеральная и выборочная совокупности - student2.ru , который является величиной неслучайной, детерминированной.

Оценка Генеральная и выборочная совокупности - student2.ru для параметра Генеральная и выборочная совокупности - student2.ru называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т.е. Генеральная и выборочная совокупности - student2.ru . В противном случае оценка называется смещенной.

Несмещенность – свойство оценок при фиксированном Генеральная и выборочная совокупности - student2.ru . Оно означает отсутствие ошибки "в среднем", т.е. при систематическом использовании данной оценки.

Рассмотрим некоторые наиболее часто встречающиеся точечные оценки параметров генеральной совокупности.

1. Выборочная средняя Генеральная и выборочная совокупности - student2.ru есть несмещенная оценка для генеральной средней Генеральная и выборочная совокупности - student2.ru , причем Генеральная и выборочная совокупности - student2.ru , где Генеральная и выборочная совокупности - student2.ru – объем выборки, Генеральная и выборочная совокупности - student2.ru – генеральная дисперсия признака.

2. Выборочная дисперсия Генеральная и выборочная совокупности - student2.ru является смещенной оценкой генеральной дисперсии Генеральная и выборочная совокупности - student2.ru .

3. Исправленная дисперсия Генеральная и выборочная совокупности - student2.ru , вычисляемая по формуле

Генеральная и выборочная совокупности - student2.ru (17)

или

Генеральная и выборочная совокупности - student2.ru , (18)

является несмещенной оценкой для генеральной дисперсии Генеральная и выборочная совокупности - student2.ru .

Разница между Генеральная и выборочная совокупности - student2.ru и Генеральная и выборочная совокупности - student2.ru заметна при небольшом числе наблюдений Генеральная и выборочная совокупности - student2.ru . При Генеральная и выборочная совокупности - student2.ru получим, что Генеральная и выборочная совокупности - student2.ru , т.е. в качестве оценки Генеральная и выборочная совокупности - student2.ru вполне можно использовать выборочную дисперсию Генеральная и выборочная совокупности - student2.ru .

Интервальные оценки

Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок большого объема точность обычно бывает достаточной, то для выборок небольшого объема вопрос точности оценок становится очень важным.

Чтобы получить представление о точности и надежности оценки Генеральная и выборочная совокупности - student2.ru параметра Генеральная и выборочная совокупности - student2.ru , используют интервальную оценку параметра.

Интервальной оценкой параметра Генеральная и выборочная совокупности - student2.ru называется числовой интервал Генеральная и выборочная совокупности - student2.ru , который с заданной вероятностью Генеральная и выборочная совокупности - student2.ru накрывает неизвестное значение параметра Генеральная и выборочная совокупности - student2.ru , т.е. Генеральная и выборочная совокупности - student2.ru . Такой интервал Генеральная и выборочная совокупности - student2.ru называется доверительным, а вероятность Генеральная и выборочная совокупности - student2.ru – доверительной вероятностью или надежностью оценки.

Обычно надежность оценки Генеральная и выборочная совокупности - student2.ru задается заранее величиной, близкой к единице, например: 0,9, 0,95, 0,99 или 0,999.

Границы доверительного интервала и его длина находятся по выборочным данным и поэтому являются случайными величинами. Длина доверительного интервала уменьшается с ростом объема выборки Генеральная и выборочная совокупности - student2.ru и увеличивается с ростом доверительной вероятности Генеральная и выборочная совокупности - student2.ru .

Очень часто (но не всегда) доверительный интервал выбирается симметричным относительно несмещенной точечной оценки Генеральная и выборочная совокупности - student2.ru , т.е. выбирается интервал вида Генеральная и выборочная совокупности - student2.ru . Число Генеральная и выборочная совокупности - student2.ru при этом называется точностью оценки.

Так, например, интервальная оценка (доверительный интервал) для генеральной средней Генеральная и выборочная совокупности - student2.ru исследуемого признака Генеральная и выборочная совокупности - student2.ru , имеющего нормальное распределение, может быть найдена по формуле:

Генеральная и выборочная совокупности - student2.ru . (19)

В случае, когда генеральная дисперсия Генеральная и выборочная совокупности - student2.ru известна (например, это заранее заданная ошибка измерительного прибора), то точность оценки Генеральная и выборочная совокупности - student2.ru находится по формуле:

Генеральная и выборочная совокупности - student2.ru , (20)

где Генеральная и выборочная совокупности - student2.ru – объем выборки, а число Генеральная и выборочная совокупности - student2.ru определяется из равенства Генеральная и выборочная совокупности - student2.ru , т.е. по таблице значений функции Лапласа Генеральная и выборочная совокупности - student2.ru находится значение аргумента Генеральная и выборочная совокупности - student2.ru , которому соответствует значение функции Генеральная и выборочная совокупности - student2.ru , равное Генеральная и выборочная совокупности - student2.ru .

В случае, когда генеральная дисперсия Генеральная и выборочная совокупности - student2.ru неизвестна, а известна лишь ее оценка – исправленная выборочная дисперсия Генеральная и выборочная совокупности - student2.ru , то точность оценки Генеральная и выборочная совокупности - student2.ru находится по формуле:

Генеральная и выборочная совокупности - student2.ru , (21)

где значение числа Генеральная и выборочная совокупности - student2.ru определяется по таблице критических точек распределения Стьюдента при доверительной вероятности Генеральная и выборочная совокупности - student2.ru и числе степеней свободы Генеральная и выборочная совокупности - student2.ru .

Замечание. Если выборка Генеральная и выборочная совокупности - student2.ru объема Генеральная и выборочная совокупности - student2.ru представляет собой набор независимых одинаково распределенных случайных величин, то, согласно центральной предельной теореме, распределение Генеральная и выборочная совокупности - student2.ru при больших Генеральная и выборочная совокупности - student2.ru близко к стандартному нормальному. Это позволяет строить доверительный интервал для генеральной средней Генеральная и выборочная совокупности - student2.ru по формулам (19) и (20) при любом распределении признака, если объем выборки является достаточно большим ( Генеральная и выборочная совокупности - student2.ru ), при этом в качестве Генеральная и выборочная совокупности - student2.ru используется ее любая оценка.

Наши рекомендации