Генеральная совокупность и выборка
Генеральная совокупность –это все мыслимыенаблюдения, которые могли бы быть сделаны при данном реальном комплексе условий – все множество значений измерений или погрешностей измерений.
Генеральная совокупность может быть конечной и бесконечной. Понятие бесконечной генеральной совокупности - математическая абстракция, как и представление о том, что случайную величину можно измерить бесконечное число раз. Приближенно бесконечную генеральную совокупность можно истолковать как предельный случай конечной совокупности, когда число объектов неограниченно возрастает. Однако, это распространение понятия генеральной совокупности на бесконечный случай отнюдь не является необходимым с точки зрения построения строгой математической теории; оно лишь способствует выработке достаточно общей и удобной терминологии.
Математическое ожидание –это среднее ожидаемое значение, принимаемое случайной величиной в больших сериях испытаний.
Результаты ограниченного ряда наблюдений случайной величины можно рассматривать как выборкуиз данной генеральной совокупности.
Выборка –это результаты ограниченного ряда наблюдений Х1, Х2,…, Хn из генеральной совокупности. Итак, выборка - это обследованная нами часть генеральной совокупности. Очевидно, что чем больше объем выборки n, тем полнее наша информация об исследуемой случайной величине (генеральной совокупности).
Сущность статистических методов состоит в том, чтобы по некоторой части генеральной совокупности (т.е. по выборке) выносить обоснованные суждения об ее свойствах в целом.
Характеристики распределения вероятностей в генеральной совокупности называют параметрамии обозначают буквами греческого алфавита, а выборочные (эмпирические) значения характеристик – оценками или статистиками и обозначаются буквами латинского алфавита.
Например, средние значения случайной величины: генеральная совокупность – а, µ или МХ(математическое ожидание); выборка – ; среднее квадратическое отклонение или стандарт, соответственно – σ и S.
Вычисление характеристик эмпирических
Распределений (выборочных характеристик).
Точечные оценки. Моменты
Точечные оценки –это оценки, определяемые по одной выборке и выражаемые в виде одного числа: среднее арифметическое, мода, медиана, несмещенная оценка дисперсии.
К оценкам предъявляются требования состоятельности, несмещенности и эффективности.
Оценка называется состоятельной, если по мере роста числа наблюдений nона стремится к оцениваемому теоретическому значению параметра.
Оценка называется несмещенной, если при любом числе наблюдений nее математическое ожидание точно равно величине оцениваемого параметра. Это требование особенно важно при малом количестве наблюдений (малом объеме выборки).
Оценка параметра называется эффективной, если среди прочих оценок того же параметра она обладает наименьшей дисперсией.
Пусть имеется ограниченный ряд наблюдений случайной величины.
Среднее значение величин этих наблюдений можно определить по формуле
.
Где представляет собой эмпирическое или выборочное среднее. Выборочное среднее выступает как приближенная оценка теоретического среднего - математического ожидания МХили М(Х).
Абсолютное отклонениекаждого наблюдения от среднего
∆Х = di = Хi – ; .
Моментомпорядка k в случае одномерного эмпирического распределения называется сумма k-хстепеней отклонений результатов наблюдений от произвольного числа С, деленная на объем выборки n.
mk = (1/n) [∑(xi – c)];
где kможет принимать любые значения натурального ряда чисел.
Если C = 0, то момент называется начальным.
Начальным моментом первого порядка является выборочное среднее.
m1н = = (1/n) [∑(xi – 0)];
При C = , момент называетсяцентральным.
Первый центральный момент
.
Второй центральный момент представляет собой дисперсию эмпирического распределения.
=
= = (1/n) [∑xi 2– (1/n)(∑xi )2];
Эмпирическую дисперсию можно рассматривать как приближенное значение теоретической дисперсии:
Дисперсияслужит характеристикой рассеивания случайной величины около среднего значения.
Несмещеную оценку для ( - дисперсия теоретического распределения), которая так же называется несмещенная дисперсия, можно найти по формуле
=
[1/(n-1) ] [∑xi 2– (1/n)(∑xi )2];
S2 содержит систематическую относительную погрешность - S2/ n.
Выборочные среднеквадратические отклонения соответственно могут быть найдены по формулам:
.
Значение по-другому еще называют эмпирический стандарт или просто стандарт.
Среднеквадратическое отклонение используется наряду с дисперсией для характеристики степени рассеивания случайной величины и оказывается в ряде случаев более удобным и естественным, в первую очередь, с точки зрения своей однородности (в смысле единиц измерения) с различными характеристиками центра группирования.
Из других моментов чаще всего используют моменты третьего и четвертого порядкадля оценки асимметрии и для оценки эксцесса:
.
Выборочное значение коэффициента вариации V, являющееся мерой относительной изменчивости наблюдаемой случайной величины, вычисляют по формуле:
.