Дисперсия и стандартное отклонение

Выборочная дисперсия и стандартное отклонение — наиболее часто используемые меры изменчивости (вариации) данных. Дисперсия вычисляется как сумма квадратов отклонений значений переменной от выборочного среднего, деленная на п-1 (но не на п). Стандартное отклонение вычисляется как корень квадратный из оценки дисперсии.

Размах

Размах переменной является показателем изменчивости, вычисляется как максимум минус минимум.

Квартильный размах

Квартальный размах, по определению, равен: верхняя квартиль минус нижняя квартиль (75% процентиль минус 25% процентиль). Так как 75% процентиль (верхняя квартиль) — это значение, слева от которого находятся 75% наблюдений, а 25% процентиль (нижняя квартиль) — это значение, слева от которого находится 25% наблюдении, то квартильный размах представляет собой интервал вокруг медианы, который содержит 50% наблюдений (значений переменной).

Интервал значений признака, содержащий центральные 50% наблюдений выборки, т.е. интервал между 25-м и 75-м процентилями.

Квартильный размах используется вместе с медианой (вместо Дисперсия и стандартное отклонение - student2.ru ) для описания данных, имеющих распределение, отличное от нормального.

Асимметрия

Асимметрия — это характеристика формы распределения. Распределение скошено влево, если значение асимметрии отрицательно. Распределение скошено вправо, если асимметрия положительна. Асимметрия стандартного нормального распределения равна 0. Асимметрия связана с третьим моментом и определяется как: асимметрия = n × М3/[(n-1) × (n-2) × s3], где М3 равно: Дисперсия и стандартное отклонение - student2.ru <="" img=""> (хi-xсреднееx)3, s3— стандартное отклонение, возведенное в третью степень, n — число наблюдений (СКОС).

Эксцесс

Эксцесс — это характеристика формы распределения, а именно мера остроты его пика (относительно нормального распределения, эксцесс которого равен 0). Как правило, распределения с более острым пиком, чем у нормального, имеют положительный эксцесс; распределения, пик которых менее острый, чем пик нормального распределения, имеют отрицательный эксцесс. Эксцесс связан с четвертым моментом и определяется формулой:

эксцесс = [n × (n+1) × М4- 3 × М2× М2× (n-1)]/[(n-1) × (n-2) × (n-3) × s4], где Mj равно: Дисперсия и стандартное отклонение - student2.ru <="" img=""> (х-хсреднееx, s4— стандартное отклонение в четвертой степени, n — число наблюдений (ЭКСЦЕСС).

Стандартная ошибка

Для вычисления стандартной ошибки среднего, используйте одну из следующих формул

= СТАНДАРТНОЕ ОТКЛОНЕНИЕ / КВАДРАТНЫЙ КОРЕНЬ РАЗМЕРА ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

–ИЛИ-

= STDEV (диапазон значений) и SQRT (Номер)

где:

  • диапазон значений — данные, используемые для вычисления среднеквадратичного отклонения.

    - и -
  • Номер — это размер всех возможных случайных образцов.

Статистические функцииExcel

  • СРОТКЛ() - AVEDEV() - Вычисляет среднее абсолютных значений отклонений точек данных от среднего.
  • СРЗНАЧ() - AVERAGE() - Вычисляет среднее арифметическое аргументов.
  • СРЗНАЧА() - AVERAGEA() - Вычисляет среднее арифметическое аргументов, включая числа, текст и логические значения.
  • БЕТАРАСП() - BETADIST() - Определяет интегральную функцию плотности бета-вероятности.
  • БЕТАОБР() - BETAINV() - Определяет обратную функцию к интегральной функции плотности бета-вероятности.
  • БИНОМРАСП() - BINOMDIST() - Вычисляет отдельное значение биномиального распределения.
  • ХИ2РАСП() - CHIDIST() - Вычисляет одностороннюю вероятность распределения хи-квадрат.
  • ХИ2ОБР() - CHIINV() - Вычисляет обратное значение односторонней вероятности распределения хи-квадрат.
  • ХИ2ТЕСТ() - CHITEST() - Определяет тест на независимость.
  • ДОВЕРИТ() - CONFIDENCE() - Определяет доверительный интервал для среднего значения по генеральной совокупности.
  • КОРРЕЛ() - CORREL() - Находит коэффициент корреляции между двумя множествами данных.
  • СЧЁТ() - COUNT() - Подсчитывает количество чисел в списке аргументов.
  • СЧЁТЗ() - COUNTA() - Подсчитывает количество значений в списке аргументов.
  • СЧИТАТЬПУСТОТЫ() - COUNTBLANK()- Подсчитывает количество пустых ячеек в заданном диапазоне.
  • СЧЁТЕСЛИ() - COUNTIF() - Подсчитывает количество непустых ячеек, удовлетворяющих заданному условию внутри диапазона.
  • КОВАР() - COVAR() - Определяет ковариацию, то есть среднее произведений отклонений для каждой пары точек.
  • КРИТБИНОМ() - CRITBINOM() - Находит наименьшее значение, для которого биномиальная функция распределения меньше или равна заданному значению.
  • КВАДРОТКЛ() - DEVSQ() - Вычисляет сумму квадратов отклонений.
  • ЭКСПРАСП() - EXPONDIST() - Находит экспоненциальное распределение.
  • FРАСП() - FDIST() - Находит F-распределение вероятности.
  • FРАСПОБР() - FINV() - Определяет обратное значение для F-распределения вероятности.
  • ФИШЕР() - FISHER() - Находит преобразование Фишера.
  • ФИШЕРОБР() - FISHERINV() - Находит обратное преобразование Фишера.
  • ПРЕДСКАЗ() - FORECAST() - Вычисляет значение линейного тренда.
  • ЧАСТОТА() - FREQUENCY() - Находит распределение частот в виде вертикального массива.
  • ФТЕСТ() - FTEST()- Определяет результат F-теста.
  • ГАММАРАСП() - GAMMADIST() - Находит гамма-распределение.
  • ГАММАОБР() - GAMMAINV() - Находит обратное гамма-распределение.
  • ГАММАНЛОГ() - GAMMALN() - Вычисляет натуральный логарифм гамма функции.
  • СРГЕОМ() - GEOMEAN() - Вычисляет среднее геометрическое.
  • РОСТ() - GROWTH() - Вычисляет значения в соответствии с экспоненциальным трендом.
  • СРГАРМ() - HARMEAN()- Вычисляет среднее гармоническое.
  • ГИПЕРГЕОМЕТ() - HYRGEOMDIST() - Определяет гипергеометрическое распределение.
  • ОТРЕЗОК() - INTERCEPT() - Находит отрезок, отсекаемый на оси линией линейной регрессии.
  • ЭКСЦЕСС() - KURT() - Определяет эксцесс множества данных.
  • НАИБОЛЬШИЙ() - LARGE() - Находит k-ое наибольшее значение из множества данных.
  • ЛИНЕЙН() - LINEST() - Находит параметры линейного тренда.
  • ЛГРФПРИБЛ() - LOGEST() - Находит параметры экспоненциального тренда.
  • ЛОГНОРМОБР() - LOGINV() - Находит обратное логарифмическое нормальное распределение.
  • ЛОГНОРМРАСП() - LOGNORMDIST() - Находит интегральное логарифмическое нормальное распределение.
  • МАКС() - MAX() - Определяет максимальное значение из списка аргументов.
  • МАКСА() - MAXA() - Определяет максимальное значение из списка аргументов, включая числа, текст и логические значения.
  • МЕДИАНА() - MEDIAN() - Находит медиану заданных чисел.
  • МИН() - MIN()- Определяет минимальное значение из списка аргументов.
  • МИНА() - MINA() - Определяет минимальное значение из списка аргументов, включая числа, текст и логические значения.
  • МОДА() - MODE() - Определяет значение моды множества данных.
  • ОТРБИНОМРАСП() - NEGBINOMDIST() - Находит отрицательное биномиальное распределение.
  • НОРМРАСП() - NORMDIST() - Выдает нормальную функцию распределения.
  • НОРМОБР() - NORMINV() - Выдает обратное нормальное распределение.
  • НОРМСТРАСП() - NORMSDIST() - Выдает стандартное нормальное интегральное распределение.
  • НОРМСТОБР() - NORMSINV() - Выдает обратное значение стандартного нормального распределения.
  • ПИРСОН() - PEARSON() - Определяет коэффициент корреляции Пирсона.
  • ПЕРСЕНТИЛЬ() - PERCENTILE() - Определяет k-ую персентиль для значений из интервала.
  • ПРОЦЕНТРАНГ() - PERCENTRANK()- Определяет процентную норму значения в множестве данных.
  • ПЕРЕСТ() - PERMUT()- Находит количество перестановок для заданного числа объектов.
  • ПУАССОН() - POISSON() - Выдает распределение Пуассона.
  • ВЕРОЯТНОСТЬ() - PROB() - Определяет вероятность того, что значение из диапазона находится внутри заданных пределов.
  • КВАРТИЛЬ() - QUARTILE() - Определяет квартиль множества данных.
  • РАНГ() - RANK()- Определяет ранг числа в списке чисел.
  • КВПИРСОН() - RSQ() - Находит квадрат коэффициента корреляции Пирсона.
  • СКОС() - SKEW() - Определяет асимметрию распределения.
  • НАКЛОН() - SLOPE() - Находит наклон линии линейной регрессии.
  • НАИМЕНЬШИЙ() - SMALL() - Находит k-ое наименьшее значение в множестве данных.
  • НОРМАЛИЗАЦИЯ() - STANDARDIZE() - Вычисляет нормализованное значение.
  • СТАНДОТКЛОН() - STDEV() - Оценивает стандартное отклонение по выборке.
  • СТАНДОТКЛОНА() - STDEVA()- Оценивает стандартное отклонение по выборке, включая числа, текст и логические значения.
  • СТАНДОТКЛОНП() - STDEVP() - Определяет стандартное отклонение по генеральной совокупности.
  • СТАНДОТКЛОНПА() - STDEVPA()- Определяет стандартное отклонение по генеральной совокупности, включая числа, текст и логические значения.
  • СТОШYX() - STEYX()- Определяет стандартную ошибку предсказанных значений y для каждого значения x в регрессии.
  • СТЬЮДРАСП() - TDIST() - Выдает t-распределение Стьюдента.
  • СТЬЮДРАСПОБР() - TINV() - Выдает обратное t-распределение Стьюдента.
  • ТЕНДЕНЦИЯ() - TREND() - Находит значения в соответствии с линейным трендом.
  • УРЕЗСРЕДНЕЕ() - TRIMMEAN() - Находит среднее внутренности множества данных.
  • ТТЕСТ() - TTEST() - Находит вероятность, соответствующую критерию Стьюдента.
  • ДИСП() - VAR() - Оценивает дисперсию по выборке.
  • ДИСПА() - VARA() - Оценивает дисперсию по выборке, включая числа, текст и логические значения.
  • ДИСПР() - VARP() - Вычисляет дисперсию для генеральной совокупности.
  • ДИСПРА() - VARPA() - Вычисляет дисперсию для генеральной совокупности, включая числа, текст и логические значения.
  • ВЕЙБУЛЛ() - WEIBULL() - Выдает распределение Вейбулла.
  • ZТЕСТ() - ZTEST() - Выдает двустороннее P-значение z-теста.


Наши рекомендации