Вычисление характеристик случайных величин по небольшому числу наблюдений
В ряде случаев достаточно знать не законы распределения, а основные числовые характеристики распределения.
Числовыми характеристикамислучайной величины называются величины, с помощью которых в сжатой форме выражаются наиболее существенные особенности распределения
Таковыми являются математическое ожидание, дисперсия и стандарт .
Mатематическое ожидание дискретной случайной величины вычисляется по формуле
n
М [Х] = mx = ∑ xi рi
i=1
Дисперсия случайной величины σ2 = Dx = М [(Х - mx)2].
При несгруппированных данных дисперсия вычисляется по формулe:
n _ n _
σ2 = ∑ (xi - х)2 / N или σ2 = ∑ (xi - х)2ni / ∑ ni .
i=1
Стандарт σ – это среднеквадратичное отклонение случайной величины определяется как корень квадратный из дисперсии
σ= ±√ σ2.
Кроме рассмотренных математического ожидания, дисперсии и стандарта, к числовым характеристикам случайной величины относятся: средняя арифметическая, мода, медиана, моменты, коэффициент вариации, показатели асимметрии и эксцесса.
Простое среднее арифметическое значение определяется по формуле
_
x = ∑ xi / N.
Здесь N-объём выборки.
Насколько существенно могут отличаться простое и взвешенное среднее, видно из следующего примера.
Скважиной вскрыто рудное тело мощностью 16,1 м, сложенное рудами различных геолого-промышленных типов. Мощность слоев и содержание полезного компонента вних приведены ниже:
Мощность, м 2,3 0,2 1,4 3,7 0,7 4,0 0,8
Содержание металла, % .. 17,05 25,23 0,82 5,27 10,38 4,20 21,58
Простое среднее арифметическое значение содержания металла:
(17,05+25.23+0.82+5.27+10,38+4.20+21,58)/ 7 = 12,08 %.
Среднее взвешенное (по мощности) равно соответственно 6,59 %;
17.05 +2,3 + 25,23·0,2 + 0,82·1,4 + 5,27·3,7 + 10,38·0,7 + 4,20·4.0 + 21,58·0,8
2,3 + 0,2 + 1,4 + 3,7 + 0,7 + 4,0 + 0,8
Как видно, простое среднее в данном случае оказалось завышенным почти в 2 раза.
Модойслучайной дискретной величины называется ее наиболее вероятное, наиболее часто встречающееся значение. Для непрерывной величины модой является ее значение, в котором плотность вероятности максимальна. Мода и математическое ожидание случайной величины в общем случае не совпадают. Они совпадают лишь при симметричном распределении. Когда кривая имеет не один, а два или более максимумов распределение называется полимодальным.
Для дискретного не сгруппированного вариационного ряда модальным является тот вариант, который характеризуется наибольшей частотой.
Медианой случайной величины называется такое ее значение, для которого одинаково вероятно, окажется ли случайная величина меньше или больше медианы. Иными словами, медиана это срединная величина упорядоченного вариационного ряда. Геометрически медиана - это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам.
При симметричноммодальном распределении медиана совпадает с математическим ожиданием и модой. Поэтому мода и медиана имеют особо важное значение при анализе асимметричных распределений.
Для вариационного ряда с объемом выборки N медиана определяется по формулам:
при четном числе вариантов, т. е. при N =2k,
Ме = (хк + хк+1 ) / 2 ;
так в упорядоченном ряду 2, 5, 6, 8, 11,12,13,16 , где N =8, медиана будет
Ме = (8+11)/2= 9,5.
При нечетном числе вариантов, т. е. при N =2k + 1, Ме =хк+1
т.е.в ряду 2, 5, 6, 8, 11,12,13, k =3 и Ме = 8.
Статистические вычисления удобно проводить пользуясь понятием моментов
Эмпирическим моментом k - порядкаслучайной величины называется среднее значение k-тых степеней разностей ( xi- C )k . В зависимости от величины постоянной С различают начальные и центральные моменты. Если С совпадает с началом отсчёта ( С= 0 ),момент называют начальным. Если постоянной являет-
‾
ся среднее значение признака ( С = х ), то момент называют центральным
При использовании моментовбудем иметь:
n _
Центральный момент первого порядка μ1 = ∑ (xi - х) ni / ∑ ni = 0
Центральный момент второго порядка представляет собой дисперсию признака
n _
μ2 = ∑ (xi - х)2 ni / ∑ ni = σ2
Центральный момент третьегопорядка называют асимметрией и применяют для
оценки степени скошенности кривой распределения относительно моды
_
μ3 = ∑ (xi - х)3 ni / ∑ ni
Величина и знак 3-го центрального момента зависят от преобладания положительных кубов отклонений над отрицательными кубами. При любом симметричном распределе-нии их сумма равна нулю.
Коэффициент асимметрииAs = μ3 /σ3 = ∑ (xi - х)3 ni / N σ3
Центральный момент четвёртогопорядка
_
μ4 = ∑ (xi - х)4 ni / ∑ ni
используют для оценки эксцесса Е - степени островершинности кривой распределе-ния (отклонения вида кривой распределения от нормального распределения, для которого _
Е = ( ∑ (xi - х)4 ni / N σ4 ) - 3 = μ4 / σ4 - 3
_
Среднее арифметическое значение х = μ ;
При применении программы «Excel» вычисления удобно проводить в форме таблицы АА
При вычислениях вручную число классов n при построении гистограммы определите с помощью формулы Стердженса:
n = (1 + 3,2 lg N) , ( 9 )
тогда размер каждого класса Δкл = (xmах – х min ) / n ;
первый класс будет иметь диапазон границ: х min – (х min + Δ);
второй класс - от (х min + Δ) до (х min + 2Δ);
третий от (х min + 2Δ) до (х min + 3Δ) и т.д.
Для упрощения вычислений проводите их в Excel 'е по форме:
Таблица АА
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
__ __ __ __ __
n Xi X (Xi-X)1 (Xi-X)2 (Xi-X)3 (Xi-X)4
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
1 2,55 2,64 - 0,09 (-0,09)2 (-0,09)3 (-0,09)4
2 2,51 2,64 - 0,13 (-0,13) 2 (-0,13) 3 (-0,13)4
3 2,86 2,64 0,22 ( 0,22) 2 ( 0,22) 3 ( 0,22) 4
4 2,71 2,64 0,07 ( 0,07) 2 ( 0,07) 3 ( 0,07)4
5 . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
n 2,69 2,64 0,05 (0,05)2 (0,05)3 (0,05)4
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
__ __ __ __
∑ Xi (∑ Xi )/N ∑(X i-X)=0 (1/N) ∑(Xi-X)2= (1/N)∑(Xi-X)3 = (1/N)∑(Xi-X)4
μ1=0 = μ2 = σ2 =D = μ3 = σ3 = μ4 = σ4
Далее вычисляем характеристики
Асимметрию А= μ3 / σ3
Эксцесс Е = μ4 / σ4 – 3
Итак, для получения характеристики изучаемого свойства оценивают:
Дисперсию σ2 = μ2 ;
___
Среднеквадратическое отклонение σ = √ μ2;
_
Коэффициент вариации х / σ ;
n _
Вычисляют оценку дисперсии S2 = 1/(n-1) Σ (хi – х )2
n _
Асимметрию А = (1/ n σ3) Σ (хi - х )3 или Аs = μ3 / σ3
n _
Эксцесс E = (1/ n σ4) Σ (хi - х )4 - 3, или Е = μ4 / σ4 – 3
i=1
Предлагается вычислить числовые оценки следующих распределений:
Плотности окварцованных и минерализованных пород (вариант 1):
2.51, 2.55, 2.86 , 2.71, 2.75, 2.53, 2.56, 2.62, 2.67, 2.72 2.73,
2.77, 2.58, 2.64, 2.69, 2.74, 2.78, 2.82, 2.59, 2.62, 2.70, 2.66,
2.63,2.70, 2.71, 2.76, 2.61, 2.69, 2.71, 2.77, 2.83, 2.64, 2.68,
2.72, 2.65, 2.66, 2.67, 2.73, 2.61, 2.66, 2.48, 2.68, 2.63, 2.76
2.57, 2.69 , 2.79, 2.81, 2.88, 2.54, 2.72, 2.76, 2.57, 2.61.
Плотности окварцованных и минерализованных известняков (вариант 2):
2.72, 2.88, 2.96, 2.99 2.94 2.89 2.92 3.04. 3.14 2.94
2.86 3.03 2.99 2.88 3.07 3.13 2.93 2.79 3.10 3.04
2.77 2.84 3.12 3.06 2.91 3.09 2.92 3.01 3.04 2.98
2.86 3.05 2.94 3.06 2.91 2.95 2.97 3.01 3.02 2.97
3.19 2.81 2.97 3.06 2.98 2.87 3.06 3.03 2.96 2.96
3.02 3.04 3.02 3.03 3.08 2.82 3.07
Плотности минерализованных известняков (вариант 3)
2.89 2.75 2.67 2.59 2.56 2.65 2.75 2.87 2.86 2.79 3.04
2.93 2.98 2.88 2.76 2.67 2.75 2.47 2.50 2.61 2.51 3.18
2.69 2.72 2.73 2.81 2.90 2.82 2.77 2.64 2.56 2.74
2.84 3.08 2.41 2.65 2.54 2.57 2.64 3.09 2.93 2.96
2.66 2.57 2.69 2.77 2.63 2.63 2.70 2.67 2.83 2.96
Плотности окварцованных и минерализованных известняков (вариант 4)
2.66 2.71 2.75 2.81 2.85 2.93 2.97 2.88 2.81 2.73 2.71 2.86 2.94 3.05
2.83 2.77 2.74 2.77 2.83 2.84 2.78 2.76 2.84 2.84 2.93 2.97 2.92 2.96
2.76 2.72 2.68 2.72 2.77 2.82 2.87 2.79 2.79 2.84 2.83 2.81 2.86 3.02
2.66 2.57 2.69 2.77 2.63 2.63 2.70 2.67 2.83 2.96 2.81 2.85 2.89 2.63