Понятие центра распределения
Координата центра распределения показывает положение случайной величины на числовой оси и может быть найдена несколькими способами. Наиболее фундаментальным является центр симметрии, т.е. нахождение такой точки Хм на оси х, слева и справа от которой вероятности появления различных значений случайной величины одинаковы и равны 0,5:
Точку Хм называют медианой или 50% -ным квантилем. Для ее нахождения у распределения случайной величины должен существовать только нулевой начальный момент.
Можно определить центр распределения как центр тяжести распределения, т.е. такой точки X̅, относительно которой опрокидывающий момент геометрической фигуры, огибающей которой является кривая р(х), равен нулю:
Эта точка называется математическим ожиданием. Следует отметить, что у некоторых распределений, например распределения Коши, не существует МО, так как определяющий его интеграл расходится.
При симметричной кривой р(х) в качестве центра может использоваться абсцисса моды, т.е. максимума распределения Хм. Однако существуют распределения, у которых нет моды, например равномерное. Распределения с одним максимумом называются одномодальными, сдвумя — двухмодалъными и т.д. Те из них, у которых в средней части расположен не максимум, а минимум, называются антимодалъными.
Для двухмодальных распределений применяется оценка цен-'тра в виде центра сгибов:
где xcl, хс2 — сгибы, т.е. абсциссы точек, в которых распределение достигает своих максимумов.
Для ограниченных распределений (равномерного, трапецеидального, арксинусоидального и др.) применяется оценка в виде центра размаха:
где х1, х2 — первый и последний члены вариационного ряда, соответствующего распределению.
Разные оценки центра имеют различную эффективность. При статистической обработке экспериментальных данных важно использовать наиболее эффективную из них, т.е. оценку, имеющую минимальную дисперсию. Это связано с тем, что погрешность в определении Хц влечет за собой неправильную оценку СКО, границ доверительного интервала, эксцесса, контрэксцесса, вида распределения и др., т.е. всех последующих оценок, кроме энтропийных.
В [4] приведен детальный анализ эффективности различных оценок, сделанный с точки зрения затрат времени на проведение измерений. Они, как правило, пропорциональны числу проведенных измерений, поэтому целесообразно сравнивать различные оценки по числу отсчетов п, необходимому для достижения одинаковой дисперсии оценки Хц. Например соотношение дисперсии определения МО и медианы для распределения Лапласа: D[X̅]/D[XM] = 2. Следовательно, определение Хц как Хм в два раза эффективней, чем определение его как X̅, поскольку для достижения одной и той же погрешности измерения требуется в два раза меньший объем выборки исходных данных.
Для островершинных распределений с контрэксцессом к < 0,515 оценка координаты центра медианой Хм эффективнее, чем оценка МО X̅. (Отметим, что для нормального распределения к = 0,577.) Для плосковершинных и двухмодальных распределений эффективность оценки центра как медианы Хм падает до нуля. Оценка центра распределения в виде X̅ безусловно эффективна лишь для одно-модальных распределений, близких к нормальному с контрэксцессом кот 0,515 до 0,645. Для двухмодальных распределений наиболее эффективна оценка центра в виде координаты сгибов Хс, а для ограниченных распределений (равномерного, трапецеидальных, арксинусоидального, кроме треугольного) — в виде центра размаха экспериментальных данных Хр.
При выборе оценки центра распределения помимо ее эффективности необходимо принимать во внимание ее чувствительность к наличию промахов в обрабатываемой совокупности исходных данных. Оценка в виде математического ожидания центра размаха Хр исключительно чувствительна к наличию промахов, так как она определяется по наиболее удаленным от центра наблюдениям, каковыми и являются промахи. Оценка в виде X̅ также слабо защищена от влияния промахов. Оно ослабляется лишь в √n̅ раз, где n — число наблюдений, в то время как его возможный размер ничем не ограничен. Защищенными от влияния промахов являются лишь кван-тильные оценки, т.е. медиана Хм и центр сгибов Хс, поскольку они не зависят от координат промахов.
Моменты распределений
Все моменты представляют собой некоторые средние значения, причем если усредняются величины, отсчитываемые от начала координат, то моменты называют начальными, а если от центра распределения, то центральными. Начальные и центральные моменты г-го порядка определяются соответственно по формулам
Нулевой начальный момент равен единице. Он используется для задания условия нормирования плотности распределения:
Также с помощью начального момента нулевого порядка вводится понятие медианы распределения. Первый начальный момент - МО случайной величины:
Для результатов измерений оно представляет собой оценку истинного значения измеряемой величины. Начальные и центральные моменты случайной погрешности Д совпадают между собой и с центральными моментами результатов измерений: ar [D] = mr [D] = mг [х], поскольку МО случайной погрешности равно нулю. Следует также отметить, что первый центральный момент тождественно равен нулю. Важное значение имеет второй центральный момент
называемый дисперсией я являющийся характеристикой рассеивания случайной величины относительного МО. Значительно чаще в качестве меры рассеивания используется среднее квадратическое отклонение
имеющее такую же размерность, как и МО. Для примера на рис. 6.3 показан вид нормального распределения при различных значениях СКО. Математическое ожидание и дисперсия являются наиболее часто применяемыми моментами, поскольку они определяют важные черты распределения: положение центра и степень разбросанности результатов относительно него. Для более подробного описания распределения используются моменты более высоких порядков.
Рис. 6.3. Вид нормального распределения при Хц= 5 и СКО — 0,5; 1; 2 и 5
Третий центральный момент
служит характеристикой асимметрии, или скошенности распределения. С его использованием вводится коэффициент асимметрии v = m3[Х]/s3. Для нормального распределения коэффициент асимметрии равен нулю. Вид законов распределения при различных значениях коэффициента асимметрии приведен на рис. 6.4,а.
Рис. 6.4. Вид дифференциальной функции распределения
при различных значениях коэффициента асимметрии (a)
и эксцесса (б)
Четвертый центральный момент
служит для характеристики плоско- или островершинности распределения. Эти свойства описываются с помощью эксцесса
(6.2)
Значения коэффициента e' лежат в диапазоне от -2 до ¥. Для нормального распределения он равен 0. Чаще эксцесс задается формулой
(6.3)
Его значения лежат в диапазоне от 1 до ¥. Для нормального распределения он равен трем. Вид дифференциальной функции распределения при различных значениях эксцесса показан на рис. 6.4,6.
Для удобства часто используют контрэксцесс
Значения контрэксцесса лежат в пределах от 0 до 1. Для нормального закона он равен 0,577.