Экспериментальный анализ одномерной случайной величины
Пусть имеется набор (выборка) экспериментальных данных x1, x2,…,xN. Обработку этих данных для получения эмпирических характеристик одномерной случайной величины производят в такой последовательности.
1) Построение вариационного ряда Вариационный ряд z1, z2,…,zN получают из исходных данных путем расположения xm (m = 1, 2,…,N) в порядке возрастания от xmin до xmax так, чтобы xmin = z1 £ z2 £…£ zN = xmax.
Пусть, например, имеется 5 наблюдений: x1 = 5; x2 = 2; x3 = 4; x4 =5; x5 =7. Тогда им соответствует вариационный ряд z1 =2 ; z2 = 4; z3 = 5; z4 =5; z5 = 7.
2) Построение диаграммы накопленных частот , являющейся эмпирическим аналогом интегрального закона распределения. Диаграмму строят в соответствии с формулой
= (1.16)
где – число элементов в выборке, для которых значение xj< x. На практике это делается следующим образом:
- на оси абсцисс указывают значения xm или zt;
- значение по оси ординат равно нулю левее точки xmin;
- в точке xmin и далее во всех других точках xm диаграмма имеет скачок, равный ;
- если существует несколько совпадающих значений xm, то в этом месте на диаграмме происходит скачок, равный , где l - число совпадающих точек;
- для величин x > xmax значение диаграммы накопленных частот равно 1. Если N ®¥, то ®F(x)/.
3) Построение гистограммы выборки Гистограмма является эмпирическим аналогом функции плотности распределения f(x). Обычно ее строят следующим образом:
- находят предварительное количество квантов (интервалов), на которое должна быть разбита ось Ох. Это количество К определяют с помощью правила Старджесса:
К = 1 + 3,2 , (1.17)
где найденное значение округляют до ближайшего целого числа.
- определяют длину интервала:
Dx = (xmax - xmin) / К. (1.18)
Величину Dx можно несколько округлить для удобства вычислений.
- Середину области изменения выборки (центр распределения) (xmax + xmin) / 2 принимают за центр некоторого интервала, после чего находят границы и окончательное количество указанных интервалов так, чтобы в совокупности они перекрывали всю область от xmin до xmax.
- отсчитывают количество наблюдений Nm попавшее в каждый квант: Nm равно числу членов вариационного ряда, для которых справедливо неравенство
xm £ zt < xm + Dx
Здесь xm и xm + Dx – границы m – го интервала. При использовании формулы (1.19) значения zt попавшие на границу между (m – 1)-м и m-м интервалами, относят к m-му интервалу;
- подсчитывают относительное количество (относительную частоту) наблюдений Nm/N, попавших в данный квант;
- строят гистограмму, представляющую собой ступенчатую кривую, значение которой на m-м интервале (xm, xm + Dx) (m = 1, 2,…,К) постоянно и равно Nm/N, или с учетом условия равно Nm/N) Dx.
4) Определение оценок математического ожидания , дисперсии и среднего квадратического отклонения производят по формулам
= , (1.20)
= , (1.21)
= + . (1.22)
вместо ф формуле (1.21) вводится для получения несмещенной оценки дисперсии.