Параметры генеральной и выборочной совокупностей
Статистическая оценка выборки
Статистические данные широко используются практически во всех сферах науки, производства и управления. Чтобы управлять грамотно и эффективно, необходимо исследовать объект наблюдения и выявить его основные свойства. Обычно статистические данные очень объемны, поэтому в процессе их использования требуются такие методы, при которых по достаточно ограниченной совокупности можно получить сведения обо всем объекте в целом. Таки методы и предлагает математическая статистика.
Математическая статистика является фундаментом для создания выборочного метода, при котором выводы, сделанные на основе изучения части совокупности (случайной выборки), распространяются на всю генеральную совокупность. В этом заключена сущность выборочного метода и его ведущая роль в статистике. Теорема Чебышева служит обоснованием выборочного метода, широко применяемого в статистике, когда по случайной выборке судят обо всей совокупности исследуемых объектов.
Пусть, например, нам необходимо провести анализ дневной выручки торговых киосков города, которых насчитывается более 1000. Все киоски города — это генеральная совокупность (определение 11.5). Числовые характеристики генеральной совокупности нам не известны: средняя дневная выручка, дисперсия и среднее квадратическое отклонение дневной выручки, доля киосков, в которых дневная выручка не превышает 1000 долларов и т.д.
Определение 13.1.Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается р.
Определение 13.2.Параметрами генеральной совокупности называют характеристики генеральной совокупности, такие как средняя арифметическая, дисперсия, генеральная доля ( ).
Обследовать все киоски и долго, и дорого, поэтому следует воспользоваться результатами выборочного обследования. Пусть из генеральной совокупности случайным образом извлекается выборка объемал n (например, п = 50 киосков, тогда выборка будет называться 5-процентной).
В предыдущей лекции приводится описание исследования выборочной совокупности по данным вариационного ряда, который является статистическим распределением выборки, а также определены методы расчета основных характеристик выборки. Эти характеристики называются выборочными статистиками.
Определение 13.3.Статистическим распределением выборки называют перечень возможных значений признака х. и соответствующих ему частот или относительных частот (частностей).
К выборочным статистикам относятся:
► еы6 — выборочная средняя;
► вы6 — выборочная дисперсия;
► выб. — выборочное среднее квадратическое отклонение;
► — выборочная доля — это доля в выборке элементов, которые обладают некоторым свойством ( = —, где п — объем выборки, a m — количество единиц выборочной совокупности, обладающих этим свойством). Статистики, получаемые по различным выборкам, как правило, отличаются друг от друга. Например, если использовать собственно-случайный отбор студентов из всего колледжа для определения среднего балла по математическим дисциплинам (из 600 студентов случайным образом отбирают 60 человек), то, проведя этот отбор несколько раз, можно
получить разные значения выборочных статистик. В первой выборке средний балл оказался равным 3,82, во второй — 3,89, в третьей — 3,78. Поэтому статистика, полученная из выборки, отличается от соответствующего параметра в генеральной совокупности, но является оценкой неизвестного параметра генеральной совокупности.
Определение 13.4. Оценкой параметра называется определенная числовая характеристика, полученная из выборки. Когда оценка определяется одним числом, ее называют точечной оценкой.
В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. Теоретическое обоснование возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чисел и центральная предельная теорема Ляпунова.
Выборочная средняя является точечной оценкой генеральной средней, т.е. Хвыб Хген Генеральная дисперсия имеет 2 точечные оценки: — выборочная дисперсия; S2 — исправленная выборочная дисперсия, первая исчисляется при п 30, a S2 — при <30.
Имеет место равенство:
(13.1)
ИЛИ
При больших объемах выборки и S2 практически совпадают.
Генеральное среднее квадратическое отклонение σген также имеет 2 точечные оценки: . — выборочное среднее квадратическое отклонение и S — исправленное выборочное среднее квадратическое отклонение. σвыб используется для оценивания σген при n 30, а 5—для оценивания σген ,
при п < 30; при этом σвыб
Для того чтобы статистики служили хорошими оценками параметров генеральной совокупности, они должны обладать рядом свойств: несмещённости, эффективности, состоятельности, достаточности. Всем указанным свойствам отвечает выборочная средняя. σ2еыб — смещённая оценка. Для устранения смещения при малых выборках вводится поправка