Построение интервальных оценок
Итак, по выборке мы построили таблицу задаваемого ею статистического распределения и сосчитали его числовые характеристики. Далее мы считаем, что выборка является образом генеральной совокупности, а ее параметры – образами параметров всей генеральной совокупности. Вычисленные по выборке эмпирические числовые характеристики мы объявили оценками этих же характеристик всей генеральной совокупности. В силу того, что оценкой является случайное число, точка, эти оценки были названы точечными. Точечная оценка есть функция случайной выборки, является случайной величиной и имеет некоторое распределение вероятностей. Действительно, если мы еще раз сделаем выборку объема n и построим по ней ее таблицу и ее среднее и дисперсию, то таблица получится несколько иная, чем первая, хотя и похожая. Иными окажутся и значения эмпирического среднего и дисперсии. Это мы и имеем в виду, говоря, что эти величины являются функциями выборки и случайны.
Принимая, что истинное значение параметра равно случайному значению его оценки, мы допускаем какую-то ошибку. Для того чтобы описать эту ошибку, надо знать закон распределения разности оценки и истинного значения. Он позволит нам оценить вероятность заданного отклонения оценки от истинного значения.
Распределение выборочного среднего
Займемся распределением выборочного среднего.
Выборочное среднее является случайной величиной. Выясним, какому закону распределения вероятностей она подчиняется, если наблюдения проводятся над нормальной случайной величиной Х с параметрами m и s. Как сумма нормально распределенных случайных величин она подчиняется нормальному закону. Найдем ее математическое ожидание и дисперсию. Воспользуемся для этого известными свойствами математического ожидания и дисперсии (обозначение вместо подчеркивает, что выборочное среднее есть случайная величина, вычисляемая по выборке объема n):
;
.
Следовательно, у величины тоже, что у Х, математическое ожидание m, но дисперсия в n раз меньше: .
Кстати, эти соотношения выведены без учета требования нормальности. Если число наблюдений n велико, то каким бы ни было распределение у случайной величины, из которой делается выборка, в силу центральной предельной теоремы выборочное среднее подчиняется закону, близкому к нормальному, так что формула
(3.9)
приближенно верна всегда. Таким образом, среднее выборки ведет себя гораздо стабильнее, чем исходная величина. Попутно мы получили доказательство того, что выборочное среднее является несмещенной и, в силу теоремы Чебышева, состоятельнойоценкой.