Выборочная дисперсия. Выборочное среднее квадратическое отклонение. Свойства
Выборочная дисперсия в математической статистике — это оценка теоретической дисперсии распределения, рассчитанная на основе данных выборки. Виды выборочных дисперсий:
-смещённая;
-несмещённая или исправленная.
Пусть — выборка из распределения вероятности. Тогда
выборочная дисперсия — это случайная величина
,
где символ обозначает выборочное среднее;
несмещённая (исправленная) дисперсия — это случайная величина
.
Свойства выборочных дисперсий
Выборочная дисперсия является теоретической дисперсией выборочного распределения. Более точно, пусть — выборочная функция распределения данной выборки. Тогда для любого фиксированного функция является (неслучайной) функцией дискретного распределения. Дисперсия этого распределения равна .
Обе выборочные дисперсии являются состоятельными оценками теоретической дисперсии. Если , то
и
,
где символ « » обозначает сходимость по вероятности.
Выборочная дисперсия является смещённой оценкой теоретической дисперсии, а исправленная выборочная дисперсия — несмещённой:
,
и
.
Выборочная дисперсия нормального распределения имеет распределение хи-квадрат. Пусть . Тогда
Среднеквадратическое отклонение равно квадратному корню из дисперсии:
При определении среднего квадратического отклонения при достаточно большом объеме изучаемой совокупности (n > 30) применяются формулы:
– среднее квадратическое отклонение простое (или невзвешенное);
– среднее квадратическое отклонение взвешенное, где:
xi – значения изучаемого признака (варианты);
n – объем статистической совокупности;
– средняя арифметическая величина.
Исправленные» выборочная дисперсия и с.к.о. Свойства.
Несмещённая оце́нка(исправленная выб дисп) в математической статистике — это точечная оценка, математическое ожидание которой равно оцениваемому параметру.
Определение
Пусть — выборка из распределения, зависящего от параметра . Тогда оценка называется несмещённой, если
,
где
— математическое ожидание;
— квантор всеобщности.
В противном случае оценка называется смещённой, и случайная величина называется её смеще́нием.
исправленное среднее квадратичное отклонение .
Основные понятия интервального оценивания.
Задачей математической статистики является установление закономерностей, которым подчиняются массовые случайные явления. Для этого надо собрать статистические данные (получить репрезентативную выборку) и провести анализ полученных результатов в зависимости от целей исследования. Характеристики выборки позволяют, с определенной долей уверенности, получить представление об аналогичных характеристиках генеральной совокупности. Например, среднее выборочное позволяет оценить математическое ожидание генеральной совокупности, выборочная дисперсия, в определенной мере, характеризует генеральную дисперсию, показывающую разброс значений случайной величины относительно математического ожидания. То есть мы хотим по случайной выборке определить, какова генеральная совокупность. Понятно, что характеристики выборки зависят от ее состава, и каждая новая выборка дает разные значения для выборочного среднего и выборочной дисперсии. Можно предполагать, что выборочные характеристики не будут заметно отличаться от аналогичных характеристик генеральной совокупности, но, тем не менее, такие отличия существуют. Поэтому, получив значение выборочного параметра в виде отдельного числа (точечной оценки), мы вынуждены оценивать отклонение этой оценки от реального значения в генеральной совокупности. Следовательно, наряду с точечной оценкой, состоящей из одного числа, мы можем рассматривать интервальную оценку.
Интервальный метод оценивания параметров распределения случайных величин заключается в определении интервала (а не единичного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. Интервальная оценка характеризуется двумя числами – концами интервала, внутри которого, предположительно, находится истинное значение параметра. Иначе говоря, вместо отдельной точки для оцениваемого параметра можно установить интервал значений, одна из точек которого является своего рода "лучшей" оценкой. Интервальные оценки являются более полными и надежными по сравнению с точечными, они применяются как для больших, так и для малых выборок. Совокупность методов определения промежутка, в котором лежит значение искомого параметра, получила название методов интервального оценивания.
Пусть – какая-либо характеристика генеральной совокупности. Как мы знаем, точное определение по данной выборке невозможно. Но можно указать такой интервал , что в него, с заданной достаточно высокой вероятностью, будет попадать неизвестное значение . При этом, чем меньше этот интервал, тем более точную оценку мы сможем получить.
Постановка задачи нахождения интервальной оценки параметров заключается в следующем. Имеется: выборка наблюдений (x1, x2, …, xn) за случайной величиной Х. Объем выборки n фиксирован. Необходимо с доверительной вероятностью g = 1– a определить интервал , , который накрывает истинное значение неизвестного скалярного параметра . Полученный интервал называется интервальной оценкой или доверительным интервалом.
Предполагается, что выборка представительная, ее объем достаточен для оценки границ интервала.