Постановка задачи проверки статистических гипотез.
Гипотеза – утверждение
Опред: Стат. гипотеза – утверждение о значении пар-ра θ.
Стат. гипотеза м.б. записана в виде
Опред: стат. гипотеза простая, если - одноточечное.
В прот. случае стат. гип. – сложная
Задача: Выдвигается основная гип. и альтернативная (несколько)
По результатам наблюдений надо выбрать Н0 или Н1
Правило выбора – критерий.
Опред: Критерий
Значение вероятность отвергнуть осн. гипотезу по результатам наблюдений
Согласно критерию область разбивается на 3 части:
Доверит. | Обл. сомнений | Критическая область |
Опред: Критерий j - нерандомизированный, если j(Х)={0,1}(или Рθ(j(Х) Î (0,1))=0 "θ)
В противном случае j - рандомизированный.
4. Выборочный метод. Эмпирическая функция распределения. Теорема Гливенко – Кантелли (план док-ва). Преобразование Смирнова. Теорема Колмогорова. Оценивание теоретической функции распределения эмпирической. Гистограмма и полигон частот.
Пусть (Х1 … Хn) выборка из распределения Рθ . Истинное значение Рθ - теоретическое распределение.
Эмпирическая функция распределения – функция следующего вида:
Fn(x) = 1/n* , где
Т.е. ее значение в точке х равно отношению числа наблюдений меньше х к общему числу наблюдений.
Теорема (Гливенко – Кантелли)
Пусть(Х1 … Хn) выборка из распределения с ф.р. F,тогда sup|Fn(x)-F(x)| почти наверное->0
План док-ва:
доказывается сходимость на ограниченном интервале (т.к. F неубывает и ограничена). Показывается, что изменение между двумя соседними точками мало. Доказывается, что сходимость на концах следует из :
-> sup|Fn(x)-F(x)|->0
Преобразование Смирнова
Пусть Х случайная величина с ф.р. F (непрерывна),тогда F(x)=Y-новая с.в. имеющая равномерное распределение U(0,1), т.е.:
Если F строго возрастает, то :
Теорема Колмогорова
Пусть (Х1 … Хn) выборка из распределения F(непрер.),тогда , где К – распр-е Колмогорова, т.е.:
, где
С ростом n, эмпирическая ф.р. приближается к теоретической. У э.ф.р. имеется -окрестность, по т. Гливенко – Кантелли вероятность того, что истинная ф.р. лежит в этой эмпирической -окрестности ->1 при .
По т. Колмогорова, вероятность того, что истинная ф.р. лежит в - окрестности эмпирической стремится к пределу K( ), где К(х) – ф.р. Колмогорова.
Пусть >0 – маленькое число, F – истинная ф.р., тогда если F0=F , где F0 предполагаемая ф.р., то с вероятностью
, т.е.
- доверительный интервал для теоретической ф.р.
Гистограмма и полигон частот:
Один из способов наглядного представления статистических данных – Гистограмма частот. Область значений с.в. разбивается на равные интервалы, подсчитывается число значений с.в. попавших в интервал и на каждом интервале строится прямоугольник, с основанием на этот интервал и высотой V/(nh), где V – число выборочных точек попавших в этот интервал, n – объем выборки, h – длина интервала. Площадь каждого такого прямоугольника по т Бернулли будет сходится при n-> к вероятности попадания с.в. в интервал.
Для оценки гладких плотностей используют методику, основанную на полигоне частот – ломаной кривой, строящейся следующим образом: если построена гистограмма частот, то ординаты ее средних точек на каждом из интервалов последовательно соединяются отрезками прямых. Гистограмма и полигон – статистические аналоги теоретической плотности.