Расчет выборочных характеристик статистического распределения
Для характеристики важнейших свойств статистического распределения используют средние показатели, называемые выборочными числовыми характеристиками. К числу данных показателей относятся:
- выборочная средняя;
- выборочная дисперсия;
- выборочное среднее квадратическое отклонение;
- выборочные структурные средние;
- выборочные начальные и центральные моменты;
- асимметрия, эксцесс.
Выборочной средней называют среднее арифметическое всех значений изучаемой выборки:
- если результаты наблюдений не сгруппированы:
(1.10)
- если результаты сгруппированы в дискретный вариационный ряд:
. (1.11)
Выборочную среднюю можно записать как:
, (1.12)
где – частость.
В случае интервального статистического ряда в качестве следует брать середины интервалов, а – соответствующие им частоты.
Выборочной дисперсией принято называть среднее арифметическое квадратов отклонений значений выборки от выборочной средней :
- если результаты наблюдений не сгруппированы:
(1.13)
- если результаты наблюдений сгруппированы в дискретный вариационный ряд:
(1.14)
или
. (1.15)
Выборочное среднее квадратическое отклонение выборки определяется на основании формулы:
. (1.16)
Особенность выборочного среднего квадратического отклонения заключается в том, что оно измеряется в тех же единицах, что и данные выборки.
В случае, когда объем выборки достаточно невелик ( ) пользуются исправленной выборочной дисперсией, которая определяется на основании формулы:
. (1.17)
Соответственно, величину называют исправленным средним квадратическим отклонением.
Для анализа вариационных рядов вычисляют такие статистики, как моду и медиану.
Модой называют варианту, которая имеет наибольшую частоту. Например, для вариационного ряда:
xi | ||||
ni |
мода равна .
Медианой – значение случайной величины, приходящееся на середину ряда.
Если , где – объем выборки, то есть ряд имеет четное число членов, то медиана находится на основании формулы:
. (1.18)
Например, для следующего вариационного ряда:
xi | ||||||
ni |
медиана равна .
Если ряд имеет нечетное число членов, то есть , то медиана равна серединному члену вариационного ряда:
. (1.19)
Например, для вариационного ряда
xi | |||||
ni |
медиана равна .
Показатели средней выборочной и выборочной дисперсии являются частным случаем более общего понятия - момента статистического ряда.
Начальный выборочный момент порядка l - это среднее арифметическое l- ых степеней всех значений исследуемой выборки:
(1.20)
или
. (1.21)
Из представленного определения следует, что начальным выборочным моментом первого порядка является:
. (1.22)
Центральным выборочным моментом порядка называют среднее арифметическое l-ыхстепеней отклонений наблюдаемых значений выборки от выборочной средней :
(1.23)
или
. (1.24)
Таким образом, центральным выборочным моментом второго порядка является:
. (1.25)
Выборочным коэффициентом асимметрииназывают число , которое определяется на основании формулы:
. (1.26)
Выборочный коэффициент асимметрии является характеристикой асимметрии полигона вариационного ряда – в случае если полигон асимметричен, то одна из ветвей его, начиная с вершины, имеет более пологий «спуск», чем вторая.
Если , то более пологий «спуск» полигона наблюдается слева от центра и асимметрию называют левосторонней; в противном случае - справа от цента и асимметрию называют правосторонней.
Выборочный коэффициент эксцесса (коэффициент крутости) позволяет сравнить на «крутость» выборочное распределение с нормальным распределением. Выборочным коэффициентом эксцесса или коэффициентом крутости называется число , которое определяется на основании формулы:
. (1.27)
Важно заметить, что коэффициент эксцесса для случайной величины, распределенной по нормальному закону, равен нулю. В связи с чем, за стандартное значение выборочного коэффициента эксцесса принимается . В случае, когда полигон имеет более «пологую» вершину в сравнении с нормальной кривой; когда - полигон более «крутой» в сравнении с нормальной кривой.
При больших количествах значений вариантов ( ) и соответствующих им частот, расчет выборочной средней, дисперсии и выборочных моментов по приведенным формулам приводит к громоздким вычислениям. Поэтому для их вычисления используются условные варианты , определяемые на основании формулы:
, (1.28)
где C = MoX, h — шаг (длина интервала).
Для вычисления числовых характеристик выборки составляется расчетная табл. 1.6.
Таблица 1.6
контрольный столбец | |||||||
строка сумм: | S = | S = | S = | S = | S = | S = | S = |
Контроль вычислений осуществляется на основании выражения:
.
С помощью сумм, полученных в нижней строке таблицы 6.1, вычисляют условные моменты на основании формул:
, (1.29)
, (1.30)
, (1.31)
. (1.32)
Числовые характеристики выборки вычисляют на основании ниже представленных формул:
; (1.33)
; (1.34)
; (1.35)
; (1.36)
, (1.37)
где и находим по формулам:
- условного центрального момента третьего порядка:
, (1.38)
- условного центрального момента четвертого порядка:
. (1.39)
Для характеристики колеблемости признака Х используют относительный показатель - коэффициент вариации V, который вычисляют по формуле:
. (1.40)
Величина коэффициента вариации показывает степень сгруппированности значений около центра рассеяния – чем ближе значение показателя к нулевому значению, тем теснее сгруппированы значения признака около центра рассеяния.