Выборочный метод. Статистические оценки параметров генеральной совокупности
Генеральной совокупностью называется весь набор однородных объектов, изучаемых относительно некоторого качественного или количественного признака. Число всех изучаемых объектов N называется объемом генеральной совокупности.
Выборка –это та часть генеральной совокупности, элементы которой подвергаются статистическому обследованию. Число n вошедших в выборку элементов называется объемом выборки.
Одна из задач математической статистики – оценка параметров генеральной совокупности по данным выборки.
Статистические оценки бывают точечные (определяемые одним числом) и интервальные (определяемые двумя числами - концами интервала). Точечные оценки дают представление о величине соответствующего параметра, а интервальные характеризуют точность и достоверность оценки.
Для достоверности результатов точечная оценка должна быть несмещенной, состоятельной и эффективной. Этим условиям удовлетворяют следующие оценки:
· для математического ожидания генеральной совокупности –
выборочное среднее ; (24)
· для дисперсии генеральной совокупности –
выборочная дисперсия ; (25)
· для среднего квадратичного отклонения генеральной совокупности –
стандартное отклонение . (26)
При выборке малого объема точечная оценка может сильно отличаться от оцениваемого параметра. Поэтому при небольшом объеме выборки (чаще всего встречающемся на практике) пользуются интервальными оценками. Интервальная оценка – это оценка, которая определяется двумя числами – концами интервала или доверительными границами.
Если q* – статистическая оценка параметра q, то говорят, что оценка вычислена с точностью d , если ú q - q* ú < d , (27)
то есть величина параметра q попадает в интервал (q* - d ; q* + d) .
Статистические методы позволяют говорить только о вероятности выполнения неравенства (27), поэтому надежностью (доверительной вероятностью) оценки называется вероятность g , с которой осуществляется это неравенство.
Интервал (q* - d ; q* + d) , который покрывает неизвестный параметр с заданной надежностью g, называется доверительным интервалом.
Доверительную вероятность (надежность) g берут обычно (в зависимости от важности оцениваемого признака) 0,95; 0,99; 0,999.
Чтобы оценить среднее значение некоторого количественного признака Х генеральной совокупности, строят доверительный интервал для математического ожидания с доверительной вероятностью (надежностью) g . Предположим, что признак Х распределен нормально. При этом возможны два случая.
· Если среднее квадратичное отклонение s известно, то по выборке объема n вычисляют среднее выборочное значение , а также определяют такое значение аргумента t , что . Тогда доверительный интервал для математического ожидания имеет вид (28)
· Если среднее квадратичное отклонение s неизвестно, то для построения доверительного интервала по выборке объема n вычисляют точечные оценки: - выборочное среднее; s – выборочное среднее квадратичное отклонение ( s = ). Затем по справочной таблице значений величины tg , связанной с распределением Стьюдента, находят tg = t(g, n). В этом случае доверительный интервал для математического ожидания имеет вид (29)
Замечание. Для выборок большого объема можно вместо формулы (29) использовать формулу (28).