Вычисление характеристик случайных величин по небольшому числу наблюдений

В ряде случаев достаточно знать не законы распределения, а основные числовые характеристики распределения.

Числовыми характеристикамислучайной величины называ­ются величины, с помощью которых в сжатой форме выража­ются наиболее существенные особенности распределения

Таковыми являются математическое ожидание, дис­персия и стандарт .

Mатематическое ожидание дискретной случайной величины вычисляется по формуле

n

М [Х] = mx = ∑ xi рi

i=1

Дисперсия случайной величины σ2 = Dx = М [(Х - mx)2].

При несгруппированных данных дисперсия вычисляется по формулe:

n _ n _

σ2 = ∑ (xi - х)2 / N или σ2 = ∑ (xi - х)2ni / ∑ ni .

i=1

Стандарт σ – это среднеквадратичное отклонение случайной величины определяется как корень квадратный из дисперсии

σ= ±√ σ2.

Кроме рассмотренных математического ожидания, дис­персии и стандарта, к числовым характеристикам случайной величины относятся: средняя арифметическая, мода, медиана, моменты, коэффициент вариации, показатели асимметрии и эксцесса.

Простое среднее арифметическое значение определяется по формуле

_

x = ∑ xi / N.

Здесь N-объём выборки.

Насколько существенно могут отличаться простое и взвешенное среднее, видно из следующего примера.

Скважиной вскрыто рудное тело мощностью 16,1 м, сложен­ное рудами различных геолого-промышленных типов. Мощность слоев и содержание полезного компонента вних приведены ниже:

Мощность, м 2,3 0,2 1,4 3,7 0,7 4,0 0,8

Содержание металла, % .. 17,05 25,23 0,82 5,27 10,38 4,20 21,58

Простое среднее арифметическое значение содержания ме­талла:

(17,05+25.23+0.82+5.27+10,38+4.20+21,58)/ 7 = 12,08 %.

Среднее взвешенное (по мощности) равно соответственно 6,59 %;

17.05 +2,3 + 25,23·0,2 + 0,82·1,4 + 5,27·3,7 + 10,38·0,7 + 4,20·4.0 + 21,58·0,8

2,3 + 0,2 + 1,4 + 3,7 + 0,7 + 4,0 + 0,8

Как видно, простое среднее в данном случае оказалось за­вышенным почти в 2 раза.

Модойслучайной дискретной величины называется ее наи­более вероятное, наиболее часто встречающееся значение. Для непрерывной величины модой является ее значение, в котором плотность вероятности максимальна. Мода и математическое ожидание случайной величины в общем случае не совпадают. Они совпадают лишь при симметричном распределении. Когда кривая имеет не один, а два или более максимумов распределение называется полимодальным.

Для дискретного не сгруппированного вариационного ряда модальным является тот вариант, который характеризуется наибольшей частотой.

Медианой случайной величины называется такое ее значе­ние, для которого одинаково вероятно, окажется ли случайная величина меньше или больше медианы. Иными словами, меди­ана это срединная величина упорядоченного вариационного ряда. Геометрически медиана - это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам.

При симметричноммодальном распределении медиана сов­падает с математическим ожиданием и модой. Поэтому мода и медиана имеют особо важное значение при анализе асиммет­ричных распределений.

Для вариационного ряда с объемом выборки N медиана оп­ределяется по формулам:

при четном числе вариантов, т. е. при N =2k,

Ме = (хк + хк+1 ) / 2 ;

так в упорядоченном ряду 2, 5, 6, 8, 11,12,13,16 , где N =8, медиана будет

Ме = (8+11)/2= 9,5.

При нечетном числе вариантов, т. е. при N =2k + 1, Мек+1

т.е.в ряду 2, 5, 6, 8, 11,12,13, k =3 и Ме = 8.

Статистические вычисления удобно проводить пользуясь понятием моментов

Эмпирическим моментом k - порядкаслучайной величины называется среднее значение k-тых степеней разностей ( xi- C )k . В зависимости от величины постоянной С различают начальные и центральные моменты. Если С совпадает с началом отсчёта ( С= 0 ),момент называют начальным. Если постоянной являет-

ся среднее значение признака ( С = х ), то момент называют центральным

При использовании моментовбудем иметь:

n _

Центральный момент первого порядка μ1 = ∑ (xi - х) ni / ∑ ni = 0

Центральный момент второго порядка представляет собой дисперсию признака

n _

μ2 = ∑ (xi - х)2 ni / ∑ ni = σ2

Центральный момент третьегопорядка называют асимметрией и применяют для

оценки степени скошенности кривой распределения относительно моды

_

μ3 = ∑ (xi - х)3 ni / ∑ ni

Величина и знак 3-го центрального момента зависят от преобладания положительных кубов отклонений над отрицательными кубами. При любом симметричном распределе-нии их сумма равна нулю.

Коэффициент асимметрииAs = μ3 3 = ∑ (xi - х)3 ni / N σ3

Центральный момент четвёртогопорядка

_

μ4 = ∑ (xi - х)4 ni / ∑ ni

используют для оценки эксцесса Е - степени островершинности кривой распределе-ния (отклонения вида кривой распределения от нормального распределения, для которого _

Е = ( ∑ (xi - х)4 ni / N σ4 ) - 3 = μ4 / σ4 - 3

_

Среднее арифметическое значение х = μ ;

При применении программы «Excel» вычисления удобно проводить в форме таблицы АА

При вычислениях вручную число классов n при построении гистограммы определите с помощью формулы Стердженса:

n = (1 + 3,2 lg N) , ( 9 )

тогда размер каждого класса Δкл = (xmах – х min ) / n ;

первый класс будет иметь диапазон границ: х min – (х min + Δ);

второй класс - от (х min + Δ) до (х min + 2Δ);

третий от (х min + 2Δ) до (х min + 3Δ) и т.д.

Для упрощения вычислений проводите их в Excel 'е по форме:

Таблица АА

¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯

__ __ __ __ __

n Xi X (Xi-X)1 (Xi-X)2 (Xi-X)3 (Xi-X)4

¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯

1 2,55 2,64 - 0,09 (-0,09)2 (-0,09)3 (-0,09)4

2 2,51 2,64 - 0,13 (-0,13) 2 (-0,13) 3 (-0,13)4

3 2,86 2,64 0,22 ( 0,22) 2 ( 0,22) 3 ( 0,22) 4

4 2,71 2,64 0,07 ( 0,07) 2 ( 0,07) 3 ( 0,07)4

5 . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

n 2,69 2,64 0,05 (0,05)2 (0,05)3 (0,05)4

¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯

__ __ __ __

∑ Xi (∑ Xi )/N ∑(X i-X)=0 (1/N) ∑(Xi-X)2= (1/N)∑(Xi-X)3 = (1/N)∑(Xi-X)4

μ1=0 = μ2 = σ2 =D = μ3 = σ3 = μ4 = σ4

Далее вычисляем характеристики

Асимметрию А= μ3 / σ3

Эксцесс Е = μ4 / σ4 – 3

Итак, для получения характеристики изучаемого свойства оценивают:

Дисперсию σ2 = μ2 ;

___

Среднеквадратическое отклонение σ = √ μ2;

_

Коэффициент вариации х / σ ;

n _

Вычисляют оценку дисперсии S2 = 1/(n-1) Σ (хi – х )2

n _

Асимметрию А = (1/ n σ3) Σ (хi - х )3 или Аs = μ3 / σ3

n _

Эксцесс E = (1/ n σ4) Σ (хi - х )4 - 3, или Е = μ4 / σ4 – 3

i=1

Предлагается вычислить числовые оценки следующих распределений:

Плотности окварцованных и минерализованных пород (вариант 1):

2.51, 2.55, 2.86 , 2.71, 2.75, 2.53, 2.56, 2.62, 2.67, 2.72 2.73,

2.77, 2.58, 2.64, 2.69, 2.74, 2.78, 2.82, 2.59, 2.62, 2.70, 2.66,

2.63,2.70, 2.71, 2.76, 2.61, 2.69, 2.71, 2.77, 2.83, 2.64, 2.68,

2.72, 2.65, 2.66, 2.67, 2.73, 2.61, 2.66, 2.48, 2.68, 2.63, 2.76

2.57, 2.69 , 2.79, 2.81, 2.88, 2.54, 2.72, 2.76, 2.57, 2.61.

Плотности окварцованных и минерализованных известняков (вариант 2):

2.72, 2.88, 2.96, 2.99 2.94 2.89 2.92 3.04. 3.14 2.94

2.86 3.03 2.99 2.88 3.07 3.13 2.93 2.79 3.10 3.04

2.77 2.84 3.12 3.06 2.91 3.09 2.92 3.01 3.04 2.98

2.86 3.05 2.94 3.06 2.91 2.95 2.97 3.01 3.02 2.97

3.19 2.81 2.97 3.06 2.98 2.87 3.06 3.03 2.96 2.96

3.02 3.04 3.02 3.03 3.08 2.82 3.07

Плотности минерализованных известняков (вариант 3)

2.89 2.75 2.67 2.59 2.56 2.65 2.75 2.87 2.86 2.79 3.04

2.93 2.98 2.88 2.76 2.67 2.75 2.47 2.50 2.61 2.51 3.18

2.69 2.72 2.73 2.81 2.90 2.82 2.77 2.64 2.56 2.74

2.84 3.08 2.41 2.65 2.54 2.57 2.64 3.09 2.93 2.96

2.66 2.57 2.69 2.77 2.63 2.63 2.70 2.67 2.83 2.96

Плотности окварцованных и минерализованных известняков (вариант 4)

2.66 2.71 2.75 2.81 2.85 2.93 2.97 2.88 2.81 2.73 2.71 2.86 2.94 3.05

2.83 2.77 2.74 2.77 2.83 2.84 2.78 2.76 2.84 2.84 2.93 2.97 2.92 2.96

2.76 2.72 2.68 2.72 2.77 2.82 2.87 2.79 2.79 2.84 2.83 2.81 2.86 3.02

2.66 2.57 2.69 2.77 2.63 2.63 2.70 2.67 2.83 2.96 2.81 2.85 2.89 2.63

Наши рекомендации