Числовые характеристики вариационного ряда

Для того, чтобы количественно охарактеризовать самые существенные свойства распределения, а также для того, чтобы можно было сравнить разные распределения, вычисляют средние показатели - выборочные числовые характеристики.

В статистике используются различные величины в зависимости от того, какие цели при анализе материала ставит исследователь. Понятием средней величины пользуются в тех случаях, когда требуется определить средний надой по стаду, средний привес, средний прирост стада, средние клинические показатели деятельности сердца, лёгких, среднего состава крови и во многих других случаях.

Различают следующие виды средних величин: средняя арифметическая, средняя геометрическая, средняя квадратическая, средняя гармоническая, мода и медиана.

Наиболее распространенным видом средних величин является средняя арифметическая, которая бывает простой и взвешенной.

Возможны следующие случаи:

1. Результаты наблюдения не сведены в вариационный ряд или все частоты равны единице или одинаковы. Тогда вычисляют простую среднюю арифметическую

Числовые характеристики вариационного ряда - student2.ru ,

где хi – значение признака;

n– объём выборки.

2. Частоты fi отличны друг от друга, то есть значения признака хi повторяются. В этом случае вычисляют среднюю арифметическую взвешенную (выборочную среднею)

Числовые характеристики вариационного ряда - student2.ru ,

где k – число различных значений признака.

3. Распределение интервальное. В этом случае вместо хi берут середину интервалов

Числовые характеристики вариационного ряда - student2.ru

Математическим ожиданием М(Х) (или средним значением) дискретной случайной величины Х, имеющей закон распределения, называется число, равное сумме произведений всех её значений на соответствующие им вероятности.

Числовые характеристики вариационного ряда - student2.ru

Дисперсия Числовые характеристики вариационного ряда - student2.ru (или D(X)) характеризует рассеяние значений признака относительно выборочной средней Числовые характеристики вариационного ряда - student2.ru .

ВыборочнаядисперсияDв – это среднее арифметическое значение квадратов отклонения признака от выборочной средней.

Для её вычисления применяют формулу

Числовые характеристики вариационного ряда - student2.ru .

В случае, если общее число вариант мало (n<30), лучше применять формулу

Числовые характеристики вариационного ряда - student2.ru

Исправленная дисперсия находится по формуле

Числовые характеристики вариационного ряда - student2.ru

Выборочное среднее квадратичное отклонениеSx находят по формуле

Числовые характеристики вариационного ряда - student2.ru ,

а исправленное выборочное среднее квадратичное отклонение S по формуле

Числовые характеристики вариационного ряда - student2.ru .

Коэффициент вариацииСV – это выборочное процентное отношение выборочного среднего квадратичного отклонения к выборочной средней

Числовые характеристики вариационного ряда - student2.ru .

Коэффициент вариации показывает изменчивость признака.

Если Сv > 20% -изменчивость значительная; если 10% < Cv < 20%- средняя; если Cv < 10%- незначительная.

Коэффициент вариации позволяет сравнивать изменчивость признаков, имеющих разные единицы измерения.

В качестве описательных характеристик вариационного ряда используется медиана, мода, размах вариации (выборки) и т.д.

Размахом вариации называется число

R=Xmax - Xmin,

где Хmax – наибольший, Xmin – наименьший вариант ряда.

Медиана – это значение варианта, который делит ранжированный ряд на равные по числу вариант части.

Примеры.

1. Исходный ряд: 4 7 12 8 9

Ме = 12

2. Исходный ряд: 5 7 13 15

Ме = Числовые характеристики вариационного ряда - student2.ru

Если признак Х представлен интервально, то медиана находится по медианному интервалу, в котором первая накопленная частота больше или равна n/2.

Числовые характеристики вариационного ряда - student2.ru ,

где Числовые характеристики вариационного ряда - student2.ru – нижняя граница медианного интервала

Числовые характеристики вариационного ряда - student2.ru – шаг разбиения, ширина класса

Числовые характеристики вариационного ряда - student2.ru – накопленная частота интервала, предшествующего медианному интервалу

Числовые характеристики вариационного ряда - student2.ru – абсолютная частота медианного интервала.

Модой называется вариант, имеющий наибольшую частоту.

Класс с наибольшей частотой называется модальным.

Для определения моды интервальных рядов служит формула

Числовые характеристики вариационного ряда - student2.ru ,

где Числовые характеристики вариационного ряда - student2.ru - нижняя граница модального интервала

Числовые характеристики вариационного ряда - student2.ru – ширина класса

Числовые характеристики вариационного ряда - student2.ru – абсолютная частота модального интервала

Числовые характеристики вариационного ряда - student2.ru – абсолютная частота интервала предшествующего модальному

Числовые характеристики вариационного ряда - student2.ru – абсолютная частота интервала следующего за модальным.

При изучении распределений, отличных от нормального, возникает необходимость количественно оценить это различие. Вводят специальные характеристики: асимметрию и эксцесс.

Для нормального распределения эти характеристики равны нулю.

Асимметрией теоретического распределенияназывают отношение центрального момента третьего порядка к кубу среднего квадрата отклонения.

Центральным моментом порядка kслучайной величины X называется математическим ожиданием величины (X – M(X))k, обозначается через μk.

Таким образом, по определению

μk = M(X – M(X))k.

В частности, μ2 = D(X), то есть центральный момент 2-го порядка есть дисперсия

μ1 = M(X – M(X)) = 0

Для дискретной случайной величины

Числовые характеристики вариационного ряда - student2.ru

Среди моментов высших порядков особое значение имеют центральные моменты 3-го и 4-го порядков, называемых соответственно коэффициентами асимметрии и эксцесса.

Коэффициентом асимметрии ("скошенности")А случайной величины X называется величина

Числовые характеристики вариационного ряда - student2.ru

Выборочный коэффициент асимметрии служит для характеристики асимметрии полигона вариационного ряда. Если полигон асимметричен, то одна из ветвей его, начиная с вершины, имеет более пологий «спуск», чем другая.

Если А > 0, то кривая распределения более полога справа от М0(X) (Рис. 3),

если А < 0, то кривая распределения более полога слева от М0(X) (Рис. 4).

Геометрический смысл ассиметрии показывает на сколько не симметричен график распределения частот. Чем больше по модулю ассиметрия, тем больше не симметричен график.

Коэффициентом эксцесса ("островершинности") или коэффициентом крутостиЕ случайной величины X называется величина

Числовые характеристики вариационного ряда - student2.ru

Величина Е характеризует островершинность или плосковершинность. а также многовершмнность распределения.

Для нормального закона распределения А = 0 и Е = 0; остальные распределения сравниваются с нормальным.

Если Е>0 – более островершинные, а распределения "плосковершинные" или "многовершинные" имеют Е < 0 (Рис. 5).

Числовые характеристики вариационного ряда - student2.ru

Рис. 3

Числовые характеристики вариационного ряда - student2.ru

Рис. 4

Числовые характеристики вариационного ряда - student2.ru

Рис. 5

Статистические оценки

Одной из центральных задач математической статистики является задача оценивания теоретического распределения случайной величины на основе выборочных данных.

При этом часто предполагается, что вид закона распределения генеральной совокупности известен, но неизвестны параметры этого распределения, такие как математическое ожидание, дисперсия. Требуется найти приближенные значения этих параметров, то есть получить статистические оценки указанных параметров.

Определение. Статистической оценкой Числовые характеристики вариационного ряда - student2.ru параметра Числовые характеристики вариационного ряда - student2.ru теоретического распределения называют его приближенное значение, зависящее от данных выбора.

Рассматривая выборочные значения Числовые характеристики вариационного ряда - student2.ru как реализации случайных величин Числовые характеристики вариационного ряда - student2.ru , получивших конкретные значения в результате опытов, можно представить оценку Числовые характеристики вариационного ряда - student2.ru как функцию этих случайных величин: Числовые характеристики вариационного ряда - student2.ru . Это означает, что оценка тоже является случайной величиной.

Если для оценки Числовые характеристики вариационного ряда - student2.ru взять несколько (k) выборок, то получим столько же случайных оценок Числовые характеристики вариационного ряда - student2.ru .

Если число наблюдений невелико, то замена неизвестного параметра Числовые характеристики вариационного ряда - student2.ru оценкой Числовые характеристики вариационного ряда - student2.ru приводит к ошибке, которая тем больше, чем меньше число опытов.

Точечные оценки

Статистические оценки могут быть точечными и интервальными.

Точечные оценки представляют собой число или точку на числовой оси. Чтобы оценка Числовые характеристики вариационного ряда - student2.ru была близка к значению параметра Числовые характеристики вариационного ряда - student2.ru , она должна обладать свойствами состоятельности, несмещенности и эффективности.

Определение. Оценка Числовые характеристики вариационного ряда - student2.ru параметра Числовые характеристики вариационного ряда - student2.ru называется состоятельной, если она сходится по вероятности к оцениваемому параметру, то есть для любого Числовые характеристики вариационного ряда - student2.ru :

Числовые характеристики вариационного ряда - student2.ru .

Поясним смысл этого равенства.

Пусть Числовые характеристики вариационного ряда - student2.ru - очень малое положительное число. Тогда данное равенство означает, что чем больше объем выборки n, тем ближе оценка Числовые характеристики вариационного ряда - student2.ru приближается к оцениваемому параметру Числовые характеристики вариационного ряда - student2.ru .

Свойство состоятельности нужно проверять в первую очередь. Оно обязательно для любого правила оценивания. Несостоятельные оценки не используются.

Определение. Оценка Числовые характеристики вариационного ряда - student2.ru параметра Числовые характеристики вариационного ряда - student2.ru называется несмещенной, если Числовые характеристики вариационного ряда - student2.ru , то есть математическое ожидание оценки равно оцениваемому параметру. Если Числовые характеристики вариационного ряда - student2.ru , то оценка Числовые характеристики вариационного ряда - student2.ru называется смещенной.

Это свойство оценки желательно, но не обязательно. Часто полученная оценка бывает смещенной, но ее можно поправить так, чтобы она стала несмещенной.

Иногда, оценка бывает асимптотически несмещенной, то есть Числовые характеристики вариационного ряда - student2.ru .

Требования несмещенности особенно важно при малом числе опытов.

Определение. Несмещенная оценка Числовые характеристики вариационного ряда - student2.ru параметра Числовые характеристики вариационного ряда - student2.ru называется эффективной, если она среди всех несмещенных оценок, в определенном классе оценок данного параметра, обладает наименьшей дисперсией.

Можно показать, что:

Числовые характеристики вариационного ряда - student2.ru является состоятельной, несмещенной и эффективной оценкой Числовые характеристики вариационного ряда - student2.ru в классе линейных оценок;

Числовые характеристики вариационного ряда - student2.ru является состоятельной, смещенной оценкой Числовые характеристики вариационного ряда - student2.ru ;

Числовые характеристики вариационного ряда - student2.ru является состоятельной, несмещенной оценкой Числовые характеристики вариационного ряда - student2.ru ;

(при больших n разница между Числовые характеристики вариационного ряда - student2.ru и Числовые характеристики вариационного ряда - student2.ru мала);

Числовые характеристики вариационного ряда - student2.ru используется при малых выборках (обычно при n£30);

относительная частота Числовые характеристики вариационного ряда - student2.ru появления события Числовые характеристики вариационного ряда - student2.ru в Числовые характеристики вариационного ряда - student2.ru независимых испытаниях является состоятельной, несмещенной и эффективной оценкой, в классе линейных оценок, неизвестной вероятности Числовые характеристики вариационного ряда - student2.ru (p - вероятность появления события A в каждом испытании);

эмпирическая функция распределения выборки Числовые характеристики вариационного ряда - student2.ru является состоятельной, несмещенной оценкой функции распределения Числовые характеристики вариационного ряда - student2.ru случайной величины X.

Для нахождения оценок неизвестных параметров используют различные методы. Наиболее распространенными являются: метод моментов, метод максимального правдоподобия (ММП), метод наименьших квадратов (МНК).

Интервальные оценки

При выборке малого объема точечная оценка может существенно отличаться от оцениваемого параметра. В этом случае целесообразно использовать интервальные оценки.

Определение. Интервальнойназывают оценку, которая определяется двумя числами – концами интервала.

Пусть найденная по данным выборки величина Числовые характеристики вариационного ряда - student2.ru служит оценкой неизвестного параметра Числовые характеристики вариационного ряда - student2.ru . Оценка Числовые характеристики вариационного ряда - student2.ru определяет Числовые характеристики вариационного ряда - student2.ru тем точнее, чем меньше Числовые характеристики вариационного ряда - student2.ru , то есть чем меньше Числовые характеристики вариационного ряда - student2.ru в неравенстве Числовые характеристики вариационного ряда - student2.ru Числовые характеристики вариационного ряда - student2.ru .

Поскольку Числовые характеристики вариационного ряда - student2.ru - случайная величина, то и разность Числовые характеристики вариационного ряда - student2.ru - случайная величина. Поэтому неравенство Числовые характеристики вариационного ряда - student2.ru , при заданном Числовые характеристики вариационного ряда - student2.ru может выполняться только с некоторой вероятностью.

Определение. Доверительной вероятностью (надежностью) оценки Числовые характеристики вариационного ряда - student2.ru параметра Числовые характеристики вариационного ряда - student2.ru называется вероятность Числовые характеристики вариационного ряда - student2.ru , с которой выполняется неравенство Числовые характеристики вариационного ряда - student2.ru .

Обычно задается надежность Числовые характеристики вариационного ряда - student2.ru и определяется Числовые характеристики вариационного ряда - student2.ru . Чаще всего надежность задается значениями от 0,95 и выше, в зависимости от конкретно решаемой задачи.

Неравенство Числовые характеристики вариационного ряда - student2.ru можно записать Числовые характеристики вариационного ряда - student2.ru .

Определение. Доверительным интервалом называется интервал Числовые характеристики вариационного ряда - student2.ru , который покрывает неизвестный параметр с заданной надежностью Числовые характеристики вариационного ряда - student2.ru .

Наши рекомендации