Математической статистики

Г. И. Ивченко

Основные понятия и теоретические сведения

математической статистики

(методическое пособие по курсу «ТВ и МС»)

1. Статистические данные, являющиеся исходным «материалом» в задачах математической статистики, обычно являются результатом наблюдения некоторой совокупности случайных величин Математической статистики - student2.ru , характеризующей исход изучаемого эксперимента. В таких случаях говорят, что эксперимент состоит в проведении Математической статистики - student2.ru испытаний, в которых результат Математической статистики - student2.ru испытания описывается случайной величиной Математической статистики - student2.ru . В этом случае Математической статистики - student2.ru называется выборкой объема Математической статистики - student2.ru , а множество всех возможных её реализаций Математической статистики - student2.ru – выборочным пространством. Пусть элементы выборки Математической статистики - student2.ru являются независимыми копиями некоторой случайной величины Математической статистики - student2.ru . Если ее распределение обозначить символом Математической статистики - student2.ru , то в таком случае Математической статистики - student2.ru и говорят кратко, что Математической статистики - student2.ru есть выборка из распределения Математической статистики - student2.ru . Статистическая модель задается классом допустимых (возможных в рассматриваемой ситуации) распределений наблюдаемой случайной величины Математической статистики - student2.ru и обычно является параметрической, т. е. когда класс допустимых функций распределения Математической статистики - student2.ru имеет вид Математической статистики - student2.ru , где Математической статистики - student2.ru – неизвестный параметр распределения; множество Математической статистики - student2.ru всех возможных значений Математической статистики - student2.ru называется параметрическим множеством модели.

2. Всякая случайная величина Математической статистики - student2.ru , являющаяся функцией от выборки Математической статистики - student2.ru , называется статистикой, а любая теоретическая характеристика наблюдаемой случайной величины Математической статистики - student2.ru является некоторой функцией от параметра Математической статистики - student2.ru . В статистических задачах речь идет либо об оценивании по наблюдениям Математической статистики - student2.ru той или иной параметрической функции Математической статистики - student2.ru , либо о проверке тех или иных статистических гипотез о параметре Математической статистики - student2.ru (или функции от него).

Если для оценивания параметрической функции Математической статистики - student2.ru используется некоторая статистика Математической статистики - student2.ru , то Математической статистики - student2.ru называется оценкой (для Математической статистики - student2.ru ). Обычно в качестве меры точности оценки Математической статистики - student2.ru используют среднеквадратическую ошибку Математической статистики - student2.ru , и среди всех возможных оценок ищут такую, для которой среднеквадратическая ошибка минимальна. Часто ограничиваются лишь несмещенными оценками, т. е. такими, для которых выполняется условие несмещенности:

Математической статистики - student2.ru

функция Математической статистики - student2.ru , для которой это уравнение имеет решение, называется оцениваемой.

Для несмещенных оценок Математической статистики - student2.ru , т.е. мерой точности таких оценок является дисперсия, а оптимальной оценкой является оценка с минимальной дисперсией, для нее используется обозначение Математической статистики - student2.ru . Оптимальная оценка (в заданной модели Математической статистики - student2.ru . для заданной функции Математической статистики - student2.ru ) существует не всегда, но в тех случаях, когда она существует, она единственна.

Обязательным для любого правила оценивания является свойство состоятельности, означающее сходимость по вероятности оценки к оцениваемой характеристике при неограниченном возрастании объема выборки Математической статистики - student2.ru .

3. Пусть Математической статистики - student2.ru – плотность распределения наблюдаемой случайной величины Математической статистики - student2.ru (или вероятность события Математической статистики - student2.ru – в дискретном случае) и Математической статистики - student2.ru – функция правдоподобия данных (выборки Математической статистики - student2.ru ). Если Математической статистики - student2.ru при всех Математической статистики - student2.ru , функция Математической статистики - student2.ru дважды дифференцируема по Математической статистики - student2.ru , существует второй момент

Математической статистики - student2.ru

то модель называется регулярной, а величина Математической статистики - student2.ru называется функцией информации (или информацией Фишера).

Для регулярной модели любая несмещенная оценка Математической статистики - student2.ru дифференцируемой функции Математической статистики - student2.ru удовлетворяет неравенству Рао-Крамера:

Математической статистики - student2.ru .

Оценка Математической статистики - student2.ru , для которой эта нижняя граница достигается, называется эффективной (она и является оптимальной). В заданной модели Математической статистики - student2.ru эффективная оценка может существовать только для какой-то одной параметрической функции Математической статистики - student2.ru .

Если модель Математической статистики - student2.ru обладает полной достаточной статистикой, т. е. существует статистика Математической статистики - student2.ru такая, что функция правдоподобия Математической статистики - student2.ru может быть представлена в виде

Математической статистики - student2.ru

где функция Математической статистики - student2.ru не зависит от Математической статистики - student2.ru (это представление есть критерий факторизации), и при этом уравнение

Математической статистики - student2.ru

имеет лишь решение Математической статистики - student2.ru (на множестве значений статистики Математической статистики - student2.ru ), то оптимальная несмещенная оценка Математической статистики - student2.ru для функции Математической статистики - student2.ru удовлетворяет уравнению несмещенности

Математической статистики - student2.ru

Это уравнение либо имеет единственное решение, либо решений нет. В последнем случае функция Математической статистики - student2.ru не является оцениваемой. Таким образом, для полной достаточной статистики всякая функция от нее является оптимальной оценкой своего среднего.

4. Одним из наиболее универсальных методов оценивания неизвестных параметров распределений является метод максимального правдоподобия. По этому методу оценкой максимального правдоподобия (о.м.п.) Математической статистики - student2.ru по выборке Математической статистики - student2.ru , является такая точка параметрического множества Математической статистики - student2.ru , в которой функция правдоподобия Математической статистики - student2.ru достигает максимума, т. е.

Математической статистики - student2.ru .

Для произвольной параметрической функции Математической статистики - student2.ru ее о.м.п. находится по правилу Математической статистики - student2.ru .

Для регулярных моделей оценки максимального правдоподобия обладают свойствами состоятельности, асимптотической нормальности и асимптотической эффективности: если Математической статистики - student2.ru – непрерывно дифференцируемая функция, то при Математической статистики - student2.ru

Математической статистики - student2.ru .

5. При доверительном оценивании функции Математической статистики - student2.ru ищут две такие статистики Математической статистики - student2.ru , для которых при заданном доверительном уровне Математической статистики - student2.ru выполняется условие

Математической статистики - student2.ru

Такой случайный интервал Математической статистики - student2.ru называется Математической статистики - student2.ru доверительным интервалом для Математической статистики - student2.ru .

Для больших выборок (при Математической статистики - student2.ru ) в ряде случаев удается построить приближенные доверительные интервалы, основанные на оценках максимального правдоподобия. Так, если Математической статистики - student2.ru – непрерывно дифференцируемая функция, то в случае регулярной модели асимптотический Математической статистики - student2.ru доверительный интервал для Математической статистики - student2.ru имеет вид

Математической статистики - student2.ru

где Математической статистики - student2.ru и Математической статистики - student2.ru ( Математической статистики - student2.ru – стандартная нормальная функция распределения). В частности, для самого параметра Математической статистики - student2.ru такой интервал есть

Математической статистики - student2.ru .

6. Если задана параметрическая модель Математической статистики - student2.ru , то статистические гипотезы для нее имеют вид некоторых утверждений о возможных значениях параметра Математической статистики - student2.ru . В общем случае, основная гипотеза Математической статистики - student2.ru имеет вид утверждения Математической статистики - student2.ru при некотором заданном подмножестве Математической статистики - student2.ru , а альтернатива к ней есть утверждение вида Математической статистики - student2.ru . При заданном уровне значимости Математической статистики - student2.ru (вероятности отвергнуть гипотезу Математической статистики - student2.ru , когда она истинна) критерий проверки гипотезы Математической статистики - student2.ru задаётся выбором такого подмножества Математической статистики - student2.ru в выборочном пространстве, для которого выполняется условие

Математической статистики - student2.ru

В этом случае критерий (называемый критерием Математической статистики - student2.ru ) формулируется следующим образом:

если Математической статистики - student2.ru – наблюдавшаяся реализация выборки X, то при Математической статистики - student2.ru Математической статистики - student2.ru гипотезу H0 отвергают (принимают альтернативу H1), в противном же случае, т. е. если Математической статистики - student2.ru Математической статистики - student2.ru , гипотезу H0 принимают.

Множество Математической статистики - student2.ru называется критическим множеством,и егостремятся выбирать так, чтобы вероятность принять гипотезу Математической статистики - student2.ru , когда она ложна, была минимальной, – в этом случае критерий называется наиболее мощным. Обычно критическое множество строят на основе некоторой статистики Математической статистики - student2.ru , и оно имеет вид Математической статистики - student2.ru либо Математической статистики - student2.ru . В таких случаях Математической статистики - student2.ru называют тестовой статистикой.

В основе большинства способов построения оптимальных критериев лежит фундаментальный результат (Ю. Нейман и Э. Пирсон) о существовании наиболее мощного критерия в задаче проверки простой гипотезы при простой же альтернативе.

Именно, если параметрическое множество состоит лишь из двух точек: ϴ = {θ0, θ1}, то при любом уровне значимости α наиболее мощный критерий для гипотезы H0: θ = θ0 при альтернативе H1: θ = θ1 существует и задается критической областью

X Математической статистики - student2.ru = Математической статистики - student2.ru

Задание

Наши рекомендации