Доверительный интервал для нормального распределения
Доверительным называется интервал, который с заданной надежностью покрывает оцениваемый параметр.
Для оценки математического ожидания случайной величины , распределенной по нормальному закону, при известном среднем квадратическом отклонении служит доверительный интервал
где - точность оценки, - объем выборки, - выборочное среднее, - аргумент функции Лапласа, при котором
48.доверительный интервал при Распределе́ние Стью́дента
а в теории вероятностей — это однопараметрическое семейство абсолютно непрерывных распределений. Названо в честь Уильяма Сили Госсета, который первым опубликовал работы, посвящённые распределению, под псевдонимом «Стьюдент».
Определение
Пусть — независимые стандартные нормальные случайные величины, такие что . Тогда распределение случайной величины , где
называется распределением Стьюдента с степенями свободы. Пишут . Её распределение абсолютно непрерывно и имеет плотность
,
где — гамма-функция Эйлера.
Использование t-распределения
Можно использовать нормальное распределение, если знать значение дисперсии в популяции. Кроме того, когда объем выборки небольшой, выборочное среднее отвечает нормальному распределению, если данные, лежащие в основе популяции, распределены нормально.
Если данные, лежащие в основе популяции, распределены ненормально и/или неизвестна генеральная дисперсия (дисперсия в популяции), выборочное среднее подчиняется t-распределению Стьюдента.
Вычисляем 95% доверительный интервал для генерального среднего в популяции следующим образом:
где - процентная точка (процентиль) t-распределения Стьюдента с (n-1) степенями свободы, которая даёт двухстороннюю вероятность 0,05.
Вообще, она обеспечивает более широкий интервал, чем при использовании нормального распределения, поскольку учитывает дополнительную неопределенность, которую вводят, оценивая стандартное отклонение популяции и/или из-за небольшого объёма выборки.
Когда объём выборки большой (порядка 100 и более), разница между двумя распределениями (t-Стьюдента и нормальным) незначительна. Тем не менее всегда используют t-распределение при вычислении доверительных интервалов, даже если объем выборки большой.
Обычно указывают 95% ДИ. Можно вычислить другие доверительные интервалы, например 99% ДИ для среднего.
Вместо произведения стандартной ошибки и табличного значения t-распределения, которое соответствует двусторонней вероятности 0,05, умножают её (стандартную ошибку) на зна