Расчет выборочных характеристик статистического распределения

Для характеристики важнейших свойств статистического распределения используют средние показатели, называемые выборочными числовыми характеристиками. К числу данных показателей относятся:

- выборочная средняя;

- выборочная дисперсия;

- выборочное среднее квадратическое отклонение;

- выборочные структурные средние;

- выборочные начальные и центральные моменты;

- асимметрия, эксцесс.

Выборочной средней называют среднее арифметическое всех значений изучаемой выборки:

- если результаты наблюдений не сгруппированы:

(1.10)

- если результаты сгруппированы в дискретный вариационный ряд:

. (1.11)

Выборочную среднюю можно записать как:

, (1.12)

где – частость.

В случае интервального статистического ряда в качестве следует брать середины интервалов, а – соответствующие им частоты.

Выборочной дисперсией принято называть среднее арифметическое квадратов отклонений значений выборки от выборочной средней :

- если результаты наблюдений не сгруппированы:

(1.13)

- если результаты наблюдений сгруппированы в дискретный вариационный ряд:

(1.14)

или

. (1.15)

Выборочное среднее квадратическое отклонение выборки определяется на основании формулы:

. (1.16)

Особенность выборочного среднего квадратического отклонения заключается в том, что оно измеряется в тех же единицах, что и данные выборки.

В случае, когда объем выборки достаточно невелик ( ) пользуются исправленной выборочной дисперсией, которая определяется на основании формулы:

. (1.17)

Соответственно, величину называют исправленным средним квадратическим отклонением.

Для анализа вариационных рядов вычисляют такие статистики, как моду и медиану.

Модой называют варианту, которая имеет наибольшую частоту. Например, для вариационного ряда:

xi
ni

мода равна .

Медианой – значение случайной величины, приходящееся на середину ряда.

Если , где – объем выборки, то есть ряд имеет четное число членов, то медиана находится на основании формулы:

. (1.18)

Например, для следующего вариационного ряда:

xi
ni

медиана равна .

Если ряд имеет нечетное число членов, то есть , то медиана равна серединному члену вариационного ряда:

. (1.19)

Например, для вариационного ряда

xi
ni

медиана равна .

Показатели средней выборочной и выборочной дисперсии являются частным случаем более общего понятия - момента статистического ряда.

Начальный выборочный момент порядка l - это среднее арифметическое l- ых степеней всех значений исследуемой выборки:

(1.20)

или

. (1.21)

Из представленного определения следует, что начальным выборочным моментом первого порядка является:

. (1.22)

Центральным выборочным моментом порядка называют среднее арифметическое l-ыхстепеней отклонений наблюдаемых значений выборки от выборочной средней :

(1.23)

или

. (1.24)

Таким образом, центральным выборочным моментом второго порядка является:

. (1.25)

Выборочным коэффициентом асимметрииназывают число , которое определяется на основании формулы:

. (1.26)

Выборочный коэффициент асимметрии является характеристикой асимметрии полигона вариационного ряда – в случае если полигон асимметричен, то одна из ветвей его, начиная с вершины, имеет более пологий «спуск», чем вторая.

Если , то более пологий «спуск» полигона наблюдается слева от центра и асимметрию называют левосторонней; в противном случае - справа от цента и асимметрию называют правосторонней.

Выборочный коэффициент эксцесса (коэффициент крутости) позволяет сравнить на «крутость» выборочное распределение с нормальным распределением. Выборочным коэффициентом эксцесса или коэффициентом крутости называется число , которое определяется на основании формулы:

. (1.27)

Важно заметить, что коэффициент эксцесса для случайной величины, распределенной по нормальному закону, равен нулю. В связи с чем, за стандартное значение выборочного коэффициента эксцесса принимается . В случае, когда полигон имеет более «пологую» вершину в сравнении с нормальной кривой; когда - полигон более «крутой» в сравнении с нормальной кривой.

При больших количествах значений вариантов ( ) и соответствующих им частот, расчет выборочной средней, дисперсии и выборочных моментов по приведенным формулам приводит к громоздким вычислениям. Поэтому для их вычисления используются условные варианты , определяемые на основании формулы:

, (1.28)

где C = MoX, h — шаг (длина интервала).

Для вычисления числовых характеристик выборки составляется расчетная табл. 1.6.

Таблица 1.6

контрольный столбец
         
         
         
строка сумм: S = S = S = S = S = S = S =

Контроль вычислений осуществляется на основании выражения:

.

С помощью сумм, полученных в нижней строке таблицы 6.1, вычисляют условные моменты на основании формул:

, (1.29)

, (1.30)

, (1.31)

. (1.32)

Числовые характеристики выборки вычисляют на основании ниже представленных формул:

; (1.33)

; (1.34)

; (1.35)

; (1.36)

, (1.37)

где и находим по формулам:

- условного центрального момента третьего порядка:

, (1.38)

- условного центрального момента четвертого порядка:

. (1.39)

Для характеристики колеблемости признака Х используют относительный показатель - коэффициент вариации V, который вычисляют по формуле:

. (1.40)

Величина коэффициента вариации показывает степень сгруппированности значений около центра рассеяния – чем ближе значение показателя к нулевому значению, тем теснее сгруппированы значения признака около центра рассеяния.

Наши рекомендации