Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал.

Дисперсия(variance), - мера рассеяния, полученная суммированием квадратов индивидуальных отклонений с последующим делением суммы на объем совокупности.

Дисперсия генеральной совокупности обозначается σ2 ( выборочной s2 ) и вычисляется по формуле:

σ2= Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru .

Стандартное отклонение (standard deviation,) отражает изменчивость (разброс, вариацию) значений переменной и оценивает степень их отличия от среднего Стандартное ( среднее квадратическое ) отклонение - мера рассеяния равная корню квадратному из дисперсии. Оно рассчитывается на основании вычисленного показателя рассеяния данных, называемого дисперсией (variance), путем извлечения из него квадратного корня, в связи с чем в отечественной литературе его также называют «среднеквадратичным отклонением». Стандартное отклонение генеральной совокупности обозначается символом σ (сигма), а SD выборочной совокупности( s ) и вычисляется по формуле:

Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru

Стандартное отклонение может меняться непредсказуемо, т.е. расти или уменьшаться с увеличением размера выборки, однако обычно не слишком сильно. В статистике есть понятие «правила трех сигма». Оно гласит, что практически все наблюдения укладываются в интервал «среднее ± 3σ». Действительно, в интервал «± 3σ» попадают 99,7% наблюдений, ± 2σ включает 95,4%, а ± 1σ – всего 68,3% всех наблюдений. Это правило подходит для расширенны рукописный вариант различных распределений, включая нормальное.

Стандартная ошибка (среднего) (англ. standard error, SE, иногда standard error mean, SEM) является оценкой возможного отличия между значением среднего в анализируемой выборке, и истинным средним для всей популяции (которое на самом деле не может быть определено без анализа бесконечно большого числа наблюдений). Стандартная ошибка рассчитывается путем деления стандартного отклонения на квадратный корень из числа наблюдений в выборке и, следовательно, ее значение уменьшается с ростом размера выборки. Формула; γ ═ Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru .Это уменьшение является естественным, поскольку чем больше имеется наблюдений, тем больше вероятность, что рассчитанное среднее приближается к истинному.

Доверительный интервал (англ. confidence interval, CI) – диапазон значений, область, в которой с определенным уровнем надежности (или доверия) содержится истинное значение параметра (например, среднего). 90%-ный доверительный интервал означает, что истинное значение величины попадет в рассчитанный интервал с вероятностью 90%. В биомедицинских исследованиях доверительный интервал среднего обычно устанавливается на уровне 95% и определяется как ±1,96 стандартной ошибки (коэффициент 1,96 вытекает из предположения о нормальности распределения значения переменной при условии, что выборка достаточно велика). Для примера, если значение среднего систолического давления в исследованной группе составляет 125 мм рт.ст., а стандартная ошибка 5 мм рт.ст., то при 95% доверительном интервале границы диапазона значений среднего будут 115,2 и 134,8 мм рт.ст. (что составляет ± 9,8 (5 х 1,96) мм рт.ст. в обе стороны от значения среднего).

ЗАДАЧА-ЭТАЛОН

Х1
m1

Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru = Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru ∑m= n=19

Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru Х = Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru = Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru = Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru ; Х=21,3

Чтобы определить рассеянность значений количественного признака (х) генеральной совокупности вокруг своего среднего значения вводят характеристику генеральная дисперсия.

1. Генеральная дисперсия Дr

Дr = Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru

2. Для характеристики количественного признака вокруг выборки, вокруг своего среднего значения выводят характеристику выборочная дисперсия Дb

Дb= Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru Хb=21,3

Дb= Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru = Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru Дb=0,55

Среднее квадратическое отклонение – которое характеризует разнообразие признака.

σ - среднее квадратическое отклонение

σr =√ Дr (генеральные среднее квадратическое)

σb =√ Дb (выборочние среднее квадратическое откланение.

Выборочные среднее квадратическое отклонение равно

σb = Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru

Доверительный интервал ошибки статистического наблюдения.

Доверительная вероятность – вероятность с которой эта оценка покроет неизвестный параметр.

Доверительная вероятность – γ

Часто (γ) равно 0,9; 0,95; 0,99; 0,999

Продолжение задачи

γ ═ Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru

t –по таблице = 2,10

Доверительный интервал:

21,3- 0,36= 21,60

21,3+ 0,36= 20,94

Тема 4. Интервальный статистический дискретный ряд распределения. Числовые характеристики интервального статистического ряда. Гистограмма.

Для признака,имеющего непрерывное изменение строится интервальный дискретный ряд Для проведения группировки сначала выбирается группировочный признак — признак, по которому проводится разбивка единиц совокупности на отдельные группы. Затем определяют количество групп, на которые надо разбить исследуемую совокупность. Для количественного признака можно использовать формулу Стерджесса: К = l + 3,322 ´lg N,

где К — число групп; N — число единиц совокупности.

После определения числа групп следует определить интервалы группировки. Интервал — это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину (h), верхнюю и нижнюю границы или хотя бы одну из них. Величина равного интервала определяется по следующей формуле: h = (Xmax – Xmin) / n

Полученную величину округляют. Она является шагом интервала.

Объём выборки, n Число интервалов, k  
25-40 40-60 60-100 100-200 Более 200 5-6 6-8 7-10 8-10 10-15  

Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru ; Ширина Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru

Интервальный статистический ряд можно изобразить графически. Для этого по оси абсцисс откладывают интервалы значений признака и на каждом из них, как на основании, строят прямоугольник с высотой, равной относительной частоте. Полученная столбцовая диаграмма называется гистограммой. Гистограмма – совокупность прилегающих друг к другу прямоугольников. .

Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. - student2.ru

График 1. Гистограмма

Наши рекомендации