Дисперсия и стандартное отклонение

Выборочная дисперсия и стандартное отклонение — наиболее часто используемые меры изменчивости (вариации) данных. Дисперсия вычисляется как сумма квадратов отклонений значений переменной от выборочного среднего, деленная на п-1 (но не на п). Стандартное отклонение вычисляется как корень квадратный из оценки дисперсии.

Размах

Размах переменной является показателем изменчивости, вычисляется как максимум минус минимум.

Квартильный размах

Квартальный размах, по определению, равен: верхняя квартиль минус нижняя квартиль (75% процентиль минус 25% процентиль). Так как 75% процентиль (верхняя квартиль) — это значение, слева от которого находятся 75% наблюдений, а 25% процентиль (нижняя квартиль) — это значение, слева от которого находится 25% наблюдении, то квартильный размах представляет собой интервал вокруг медианы, который содержит 50% наблюдений (значений переменной).

Интервал значений признака, содержащий центральные 50% наблюдений выборки, т.е. интервал между 25-м и 75-м процентилями.

Квартильный размах используется вместе с медианой (вместо Дисперсия и стандартное отклонение - student2.ru ) для описания данных, имеющих распределение, отличное от нормального.

Асимметрия

Асимметрия — это характеристика формы распределения. Распределение скошено влево, если значение асимметрии отрицательно. Распределение скошено вправо, если асимметрия положительна. Асимметрия стандартного нормального распределения равна 0. Асимметрия связана с третьим моментом и определяется как: асимметрия = n × М³/[(n-1) × (n-2) × s³], где М³равно: Дисперсия и стандартное отклонение - student2.ru <="" img=""> (х_i-xсреднее_x)³, s³— стандартное отклонение, возведенное в третью степень, n — число наблюдений (СКОС).

Эксцесс

Эксцесс — это характеристика формы распределения, а именно мера остроты его пика (относительно нормального распределения, эксцесс которого равен 0). Как правило, распределения с более острым пиком, чем у нормального, имеют положительный эксцесс; распределения, пик которых менее острый, чем пик нормального распределения, имеют отрицательный эксцесс. Эксцесс связан с четвертым моментом и определяется формулой:

эксцесс = [n × (n+1) × М⁴- 3 × М²× М²× (n-1)]/[(n-1) × (n-2) × (n-3) × s⁴], где M_jравно: Дисперсия и стандартное отклонение - student2.ru <="" img=""> (х-хсреднее_x, s⁴— стандартное отклонение в четвертой степени, n — число наблюдений (ЭКСЦЕСС).

Стандартная ошибка

Для вычисления стандартной ошибки среднего, используйте одну из следующих формул

= СТАНДАРТНОЕ ОТКЛОНЕНИЕ / КВАДРАТНЫЙ КОРЕНЬ РАЗМЕРА ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

–ИЛИ-

= STDEV (диапазон значений) и SQRT (Номер)

где:

диапазон значений — данные, используемые для вычисления среднеквадратичного отклонения.

- и -
Номер — это размер всех возможных случайных образцов.

Статистические функцииExcel

СРОТКЛ() - AVEDEV() - Вычисляет среднее абсолютных значений отклонений точек данных от среднего.
СРЗНАЧ() - AVERAGE() - Вычисляет среднее арифметическое аргументов.
СРЗНАЧА() - AVERAGEA() - Вычисляет среднее арифметическое аргументов, включая числа, текст и логические значения.
БЕТАРАСП() - BETADIST() - Определяет интегральную функцию плотности бета-вероятности.
БЕТАОБР() - BETAINV() - Определяет обратную функцию к интегральной функции плотности бета-вероятности.
БИНОМРАСП() - BINOMDIST() - Вычисляет отдельное значение биномиального распределения.
ХИ2РАСП() - CHIDIST() - Вычисляет одностороннюю вероятность распределения хи-квадрат.
ХИ2ОБР() - CHIINV() - Вычисляет обратное значение односторонней вероятности распределения хи-квадрат.
ХИ2ТЕСТ() - CHITEST() - Определяет тест на независимость.
ДОВЕРИТ() - CONFIDENCE() - Определяет доверительный интервал для среднего значения по генеральной совокупности.
КОРРЕЛ() - CORREL() - Находит коэффициент корреляции между двумя множествами данных.
СЧЁТ() - COUNT() - Подсчитывает количество чисел в списке аргументов.
СЧЁТЗ() - COUNTA() - Подсчитывает количество значений в списке аргументов.
СЧИТАТЬПУСТОТЫ() - COUNTBLANK()- Подсчитывает количество пустых ячеек в заданном диапазоне.
СЧЁТЕСЛИ() - COUNTIF() - Подсчитывает количество непустых ячеек, удовлетворяющих заданному условию внутри диапазона.
КОВАР() - COVAR() - Определяет ковариацию, то есть среднее произведений отклонений для каждой пары точек.
КРИТБИНОМ() - CRITBINOM() - Находит наименьшее значение, для которого биномиальная функция распределения меньше или равна заданному значению.
КВАДРОТКЛ() - DEVSQ() - Вычисляет сумму квадратов отклонений.
ЭКСПРАСП() - EXPONDIST() - Находит экспоненциальное распределение.
FРАСП() - FDIST() - Находит F-распределение вероятности.
FРАСПОБР() - FINV() - Определяет обратное значение для F-распределения вероятности.
ФИШЕР() - FISHER() - Находит преобразование Фишера.
ФИШЕРОБР() - FISHERINV() - Находит обратное преобразование Фишера.
ПРЕДСКАЗ() - FORECAST() - Вычисляет значение линейного тренда.
ЧАСТОТА() - FREQUENCY() - Находит распределение частот в виде вертикального массива.
ФТЕСТ() - FTEST()- Определяет результат F-теста.
ГАММАРАСП() - GAMMADIST() - Находит гамма-распределение.
ГАММАОБР() - GAMMAINV() - Находит обратное гамма-распределение.
ГАММАНЛОГ() - GAMMALN() - Вычисляет натуральный логарифм гамма функции.
СРГЕОМ() - GEOMEAN() - Вычисляет среднее геометрическое.
РОСТ() - GROWTH() - Вычисляет значения в соответствии с экспоненциальным трендом.
СРГАРМ() - HARMEAN()- Вычисляет среднее гармоническое.
ГИПЕРГЕОМЕТ() - HYRGEOMDIST() - Определяет гипергеометрическое распределение.
ОТРЕЗОК() - INTERCEPT() - Находит отрезок, отсекаемый на оси линией линейной регрессии.
ЭКСЦЕСС() - KURT() - Определяет эксцесс множества данных.
НАИБОЛЬШИЙ() - LARGE() - Находит k-ое наибольшее значение из множества данных.
ЛИНЕЙН() - LINEST() - Находит параметры линейного тренда.
ЛГРФПРИБЛ() - LOGEST() - Находит параметры экспоненциального тренда.
ЛОГНОРМОБР() - LOGINV() - Находит обратное логарифмическое нормальное распределение.
ЛОГНОРМРАСП() - LOGNORMDIST() - Находит интегральное логарифмическое нормальное распределение.
МАКС() - MAX() - Определяет максимальное значение из списка аргументов.
МАКСА() - MAXA() - Определяет максимальное значение из списка аргументов, включая числа, текст и логические значения.
МЕДИАНА() - MEDIAN() - Находит медиану заданных чисел.
МИН() - MIN()- Определяет минимальное значение из списка аргументов.
МИНА() - MINA() - Определяет минимальное значение из списка аргументов, включая числа, текст и логические значения.
МОДА() - MODE() - Определяет значение моды множества данных.
ОТРБИНОМРАСП() - NEGBINOMDIST() - Находит отрицательное биномиальное распределение.
НОРМРАСП() - NORMDIST() - Выдает нормальную функцию распределения.
НОРМОБР() - NORMINV() - Выдает обратное нормальное распределение.
НОРМСТРАСП() - NORMSDIST() - Выдает стандартное нормальное интегральное распределение.
НОРМСТОБР() - NORMSINV() - Выдает обратное значение стандартного нормального распределения.
ПИРСОН() - PEARSON() - Определяет коэффициент корреляции Пирсона.
ПЕРСЕНТИЛЬ() - PERCENTILE() - Определяет k-ую персентиль для значений из интервала.
ПРОЦЕНТРАНГ() - PERCENTRANK()- Определяет процентную норму значения в множестве данных.
ПЕРЕСТ() - PERMUT()- Находит количество перестановок для заданного числа объектов.
ПУАССОН() - POISSON() - Выдает распределение Пуассона.
ВЕРОЯТНОСТЬ() - PROB() - Определяет вероятность того, что значение из диапазона находится внутри заданных пределов.
КВАРТИЛЬ() - QUARTILE() - Определяет квартиль множества данных.
РАНГ() - RANK()- Определяет ранг числа в списке чисел.
КВПИРСОН() - RSQ() - Находит квадрат коэффициента корреляции Пирсона.
СКОС() - SKEW() - Определяет асимметрию распределения.
НАКЛОН() - SLOPE() - Находит наклон линии линейной регрессии.
НАИМЕНЬШИЙ() - SMALL() - Находит k-ое наименьшее значение в множестве данных.
НОРМАЛИЗАЦИЯ() - STANDARDIZE() - Вычисляет нормализованное значение.
СТАНДОТКЛОН() - STDEV() - Оценивает стандартное отклонение по выборке.
СТАНДОТКЛОНА() - STDEVA()- Оценивает стандартное отклонение по выборке, включая числа, текст и логические значения.
СТАНДОТКЛОНП() - STDEVP() - Определяет стандартное отклонение по генеральной совокупности.
СТАНДОТКЛОНПА() - STDEVPA()- Определяет стандартное отклонение по генеральной совокупности, включая числа, текст и логические значения.
СТОШYX() - STEYX()- Определяет стандартную ошибку предсказанных значений y для каждого значения x в регрессии.
СТЬЮДРАСП() - TDIST() - Выдает t-распределение Стьюдента.
СТЬЮДРАСПОБР() - TINV() - Выдает обратное t-распределение Стьюдента.
ТЕНДЕНЦИЯ() - TREND() - Находит значения в соответствии с линейным трендом.
УРЕЗСРЕДНЕЕ() - TRIMMEAN() - Находит среднее внутренности множества данных.
ТТЕСТ() - TTEST() - Находит вероятность, соответствующую критерию Стьюдента.
ДИСП() - VAR() - Оценивает дисперсию по выборке.
ДИСПА() - VARA() - Оценивает дисперсию по выборке, включая числа, текст и логические значения.
ДИСПР() - VARP() - Вычисляет дисперсию для генеральной совокупности.
ДИСПРА() - VARPA() - Вычисляет дисперсию для генеральной совокупности, включая числа, текст и логические значения.
ВЕЙБУЛЛ() - WEIBULL() - Выдает распределение Вейбулла.
ZТЕСТ() - ZTEST() - Выдает двустороннее P-значение z-теста.

Наши рекомендации

Стандартное (среднеквадратическое) отклонение

Нормальный закон распределения вероятностей. Плотность вероятности, математическое ожидание, дисперсия, стандартное отклонение.

И относительное стандартное отклонение

Стандартное отклонение

Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал.

Выборочное стандартное отклонение. Дисперсия

Среднеквадратичное (стандартное) отклонение

Дисперсия и стандартное отклонение случайной величины

Измерение разброса: размах варьирования, выборочная дисперсия, выборочное среднее квадратическое отклонение (стандартное отклонение), коэффициент вариации

Стандартное отклонение и дисперсия

← Предыдущая страница | Следующая страница →