Точечные оценки. Выборочная средняя и выборочная дисперсия
Оценки параметров генеральной совокупности, полученные на основании выборки, называются статистическими. Если статистическая оценка характеризуется одним числом, она называется точечной. К числу таких оценок относятся выборочная средняя и выборочная дисперсия.
Выборочная средняя определяется как среднее арифметическое полученных по выборке значений:
,
где варианта выборки;
частота варианты;
объем выборки.
Выборочную среднюю можно записать и так:
,
где частость.
Выборочная средняя может обозначаться и без нижнего индекса: .
Отметим, что в случае интервального статистического ряда в качестве варианты берут середины интервалов ряда, а в качестве - частоты соответствующих интервалов.
Выборочной дисперсией называется среднее арифметическое квадратов отклонений значений выборки от выборочной средней :
,
или, что то же самое,
.
Для расчетов может быть использована также формула:
,
где - выборочная средняя квадратов вариант выборки.
Выборочное среднее квадратическое отклонение выборки определяется формулой:
.
Особенность выборочного среднего квадратического отклонения состоит в том, что оно измеряется в тех же единицах, что и изучаемый признак.
Статистическая оценка является случайной величиной и меняется в зависимости от выборки. Если математическое ожидание статистической оценки равно оцениваемому параметру генеральной совокупности, то такая оценка называется несмещенной, если не равно – то смещенной.
Выборочная средняя является оценкой математического ожидания случайной величины и представляет собой несмещенную оценку. Выборочная дисперсия оценивает дисперсию генеральной совокупности и является смещенной оценкой.
Для устранения смещенности выборочной дисперсии ее умножают на и получают величину:
,
которая называется несмещенной или исправленной выборочной дисперсией.
Величина
называется исправленным выборочным средним квадратическим отклонением.
Пример 8. Имеются данные о выручке в продовольственном магазине «Оазис» соответственно по месяцам (млн. руб.):
Месяц | ||||||||||||
Выручка | 2,2 | 2,5 | 2,3 | 2,2 | 2,3 | 2,5 | 2,2 | 2,2 | 2,4 | 2,3 | 2,4 | 2,2 |
Найти выборочную среднюю и выборочную дисперсию.
Решение.
Построим сначала статистический ряд распределения:
Выручка, | 2,2 | 2,3 | 2,4 | 2,5 | |
Частота, |
Находим выборочную среднюю:
.
Для вычисления выборочной дисперсии используем формулу . Чтобы воспользоваться данной формулой найдем сначала :
,
тогда 0,039.
В качестве описательных характеристик вариационного ряда , , …, (или полученного из него статистического распределения выборки) используется медиана, мода, размах вариации (выборки).
Размахом вариации называется число:
,
где - наибольшая, - наименьшая варианты ряда.
Модой вариационного ряда называется варианта, имеющая наибольшую частоту.
Медианой вариационного ряда называется значение признака (варианта), приходящееся на середину ряда.
Если (то есть ряд , , …, , , , …, имеет четное число членов), то . Если (то есть ряд имеет нечетное число членов), то .
Пример 9. В результате тестирования (см. пример 2) группа абитуриентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Найти характеристики выборки.
Решение.
Статистическое распределение выборки (так называемый дискретный статистический ряд) имеет вид:
Тогда:
,
, ,
, ,
= 5, так как 5 наиболее часто встречающаяся варианта,
.
Для непрерывно распределенного признака формулы для вычисления моды и медианы имеют вид:
,
где начало модального интервального интервала, то есть интервала, имеющего наибольшую частоту,
частота модального интервального,
частота интервала, предшествующего модальному,
частота интервала, следующего за модальным,
интервал группировки;
,
где начало медианного интервала, то есть интервала содержащего серединные значения вариационного ряда,
накопленная частота интервала, предшествующего модальному.
Метод моментов
При заданном виде закона распределения случайной величины Х неизвестные параметры этого распределения можно оценить, то есть выразить как функцию вариант выборки.
Одним из методов нахождения точечных оценок неизвестных параметров заданного распределения является так называемый метод моментов.
Этот метод состоит в том, что приравниваются соответствующие теоретические и эмпирические моменты и из полученных уравнений находятся оценки параметров. В случае одного параметра в теоретическом распределении для его оценки достаточно составить одно уравнение. Если имеются два параметра в теоретическом распределении, то нужно приравнять соответственно два теоретических и эмпирических момента и т.д.
Для оценки двух параметров закона распределения запишем следующие равенства:
, = ,
где - начальный момент первого порядка закона распределения случайной величины;
- эмпирический момент первого порядка;
- центральный момент второго порядка закона распределения случайной величины;
- центральный эмпирический момент второго порядка.
Так как - математическое ожидание случайной величины , - дисперсия случайной величины , , , то получаем два уравнения:
, .
Пример 10. Имеются данные за шесть месяцев об остатках вкладов населения на счетах некоторого коммерческого банка (млн. руб.):
Месяц | ||||||
Остатки вкладов |
Остатки вклада на первое число каждого месяца являются случайной величиной, для характеристики которой принят показательный закон распределения
( ).
Найти оценку параметра .
Решение.
Так как закон распределения содержит лишь один параметр , то для его оценки требуется составить одно уравнение.
Находим выборочную среднюю:
.
Определяем математическое ожидание:
.
Интегрируя по частям, получаем:
.
Тогда
,
Откуда
.
Последнее равенство является приближенным, так правая часть его является случайной величиной. Таким образом, из полученного уравнения получается не точное значение , а его оценка :
.