Примеры параметрических семейств распределений.
Основные понятия математической статистики. Статистический эксперимент. Способы накопления статистической информации. Понятие выборки.
Математическая статистика занимается составлением выводов об имеющихся данных (о модели эксперимента).
Базовое вероятностное пространство (Ω,₣,Ρ)
Частный случай – распределение случайного вектора:
Ω=Х=Rn ; ₣=Дn – борелевская σ-алгебра ; Ρ – распределение вероятностей
Получили более мелкое пространство, которое удобно использовать при работе с моделями математической статистики (Х, Дn,Ρ).
Статистический эксперимент – тройка объектов (Х, Дn,Ρ), где Ρ={Рθ,θєΘ} - семейство вероятностей.
Стандартные предположения о семействе Ρ :
(1) Рθ =Рθ1 * Рθ2 …*Рθn , т.е. результат наблюдений (Х1 … Хn) є Rn – независимые случайные величины при V θєΘ
(2) Рθ1=Рθ2=…=Рθn , т.е. результат наблюдений (Х1 … Хn) є Rn – независимые одинаково распределенные случайные величины (НОРСВ).
Если (1) и (2) выполнены, то (Х1 … Хn) – выборка – набор независимых одинаково распределенных наблюдений.
В задачу математической статистики входит только анализ данных и их интерпретация.
Выбор модели определяется характером полученных данных и не входит в задачу математической статистики. Семейство вероятностей Ρ определяется целью статистических исследований (априорной информацией), поэтому Ρ может быть параметризованно по-разному.
Пусть имеется совокупность результатов эксперимента (генеральная совокупность), тогда выборка – набор элементов однородной генеральной совокупности.
Задача математической статистики – сделать выводы о характере распределения генеральной совокупности по выборке. Роль генеральной совокупности в нашей модели играет теоретическое распределение.
Рθ - теоретическое значение распределения, соответствует распределению генеральной совокупности.
Типы задач математической статистики:
Точное оценивание – по результатам наблюдений выбрать значение Рθє Ρ , которое оптимальным образом согласуется с данными.
Интервальное оценивание - по результатам наблюдений выбрать область
Θ0 (Х1 … Хn) С Θ т.ч. при V θєΘ Рθ(Θ0 (Х1 … Хn) э θ)≥1-α , где α - определенное маленькое число. Т.е. выбор такого множества, которое накрывает теоретическое значение параметра с вероятностью не меньше (1-α).
Проверка статистических гипотез – по результатам наблюдений выбрать из
Н1… Нn наиболее подходящую, где Нi – взаимоисключающие гипотезы (предположения о значении параметров Нi: θєΘi ; Θi∩Θi=0 ; UΘi=Θ).
Примеры параметрических семейств распределений.
1) Распределение Бернулли : Bi(1, p)- биномиальное распределение с параметрами 1 и p.
Дискретное распределение , сконцентрированное в точках {0;1} ; P(X1=1)=p. Параметр θ=p [0;1]
2)Биномиальное распределение
Дискретное распределение, сконцентрированное в точках {0,1…}
P(X1=k)=Cmk pk (1-p)m-k , k=0,1…m
Параметр θ=(m,p). m N, p [0,1]
3)Семейство распределений Пуассона Pas(λ).
Дискр. распр., неотрицательное, сконцентрированное в точках {0,1…}
P(X=k)= λk\(k!)*exp(-λ), k=0,1… θ = λ
4)Геометрическое распр Geom(p)
Дискретное, значения N
P(X1=k)=p (1-p)k , k=0,1,… θ =p
5)Нормальное , абсолютно непрерывное распределение N(a, σ2).
p θ (x)=
Параметр
6) Показательное Exp(α)
Абсолютно непрерывное
Параметр θ = α>0
7)распределение Лапласа L(a,b)
Абсолютно непрерывное
8)Гамма Г(α,p)
Абсолютно непрерывное