Числовые характеристики выборки

Числовые характеристики выборки – параметры выборки, выражающие наиболее существенные особенности статистического распределения выборки.

Выборочной средней Числовые характеристики выборки - student2.ru называют среднее арифмитическое значение признака выборочной совокупности.

Числовые характеристики выборки - student2.ru (5.4)

Если статистическое распределение выборки задано интервальным вариационным рядом, тогда при вычислении Числовые характеристики выборки - student2.ruнеобходимо перейти к дискретному вариационному ряду, вариантами которого выступают середины интервалов

Числовые характеристики выборки - student2.ru (5.5)

Модой Мо называют варианту, которая имеет наибольшую частоту.

Для интервального статистического распределения сначала определяют модальный интервал [xm; xm+1), для которого Числовые характеристики выборки - student2.ru ,

где hi – длина частичного интервала [xi; xi+1),

ni – число вариант этого интервала.

Далее

Числовые характеристики выборки - student2.ru (5.6)

Медианой Ме дискретного статистического распределения называют варианту, которая делит вариационный ряд на две части, равных по числу вариант.

Если число вариант нечётное, то Числовые характеристики выборки - student2.ru ,

если чётное, то

Числовые характеристики выборки - student2.ru (5.7)

Медианой Me интервального статистического распределенияназывается число, для которого выполняется равенство

Числовые характеристики выборки - student2.ru .

Формула для вычисления Me имеет вид

Числовые характеристики выборки - student2.ru ,

(5.8)

где [xm; xm+1) – медианный частичный интервал, для которого выполняется неравенство

Числовые характеристики выборки - student2.ru и Числовые характеристики выборки - student2.ru .

Дисперсия выборки (выборочная дисперссия) Dв – среднее арифмитическое квадратов отклонений наблюдаемых значений признака от их среднего значения Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru . (5.9)

Вычисление Dв можно упростить, используя следующую формулу

Числовые характеристики выборки - student2.ru . (5.10)

Dв характеризует рассеяние наблюдаемых значений количественного признака вокруг своего среднего значения Числовые характеристики выборки - student2.ru .

Выборочным средним квадратическим отклонением (стандартом) Числовые характеристики выборки - student2.ru называют квадратный корень из Dв.

Числовые характеристики выборки - student2.ru . (5.11)

Размахом варьирования R называют разность между наибольшей и наименьшей вариантами.

Числовые характеристики выборки - student2.ru . (5.12)

Размах варьирования является простейшей характеристикой рассеяния вариационного ряда.

Средним абсолютным отклонением Числовые характеристики выборки - student2.ru называют среднее арифметическое абсолютных отклонений

Числовые характеристики выборки - student2.ru . (5.13)

Среднее абсолютное значение используется для характеристики рассеяния вариационного ряда.

Коэффициентом вариации V называют выраженное в процентах отношение Числовые характеристики выборки - student2.ru к Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru (5.14)

где Числовые характеристики выборки - student2.ru .

Коэффициент вариации V служит для сравнения величин рассеяния по отношению к Числовые характеристики выборки - student2.ru двух вариационных рядов, даже если варианты имеют различную размерность.

Сводными характеристиками статистических распределений выступают статистические (эмпирические) моменты.

Обычным эмпирическим моментом порядка l называют среднее значение l-х степеней разностей Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru , (5.15)

где с – произвольная постоянное число, т. н. ложный нуль.

Начальным эмпирическим моментом порядка l называют обычный момент порядка l при с=0.

Числовые характеристики выборки - student2.ru . (5.16)

В частности

Числовые характеристики выборки - student2.ru ,

т. е. начальный эмпирический момент первого порядка равен выборочной средней.

Центральным эмпирическим моментом порядка l называют обычный момент порядка l при Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru . (5.17)

В частности

Числовые характеристики выборки - student2.ru ,

т. е. центральный эмпирический момент второго порядка равен выборочной дисперсии.

Центральные моменты можно выразить через обычные:

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru ; (5.18)

Числовые характеристики выборки - student2.ru .

Условным эмпирическим моментом порядка l называют начальный момент порядка l, вычисленный для условных вариант.

Числовые характеристики выборки - student2.ru , (5.19)

где ui – условная варианта.

Условными называют варианты, определяемые равенством

Числовые характеристики выборки - student2.ru , (5.20)

где с – любая варианта xi, которая располагается в середине вариационного ряда или является модой;

h – шаг, т. е.

Числовые характеристики выборки - student2.ru .

Таким образом, для вариационного ряда, состоящего из равноотстоящих вариант с шагом h, условные варианты есть целые числа.

В частности

Числовые характеристики выборки - student2.ru

Отсюда

Числовые характеристики выборки - student2.ru . (5.21)

Выразим обычные моменты через условные:

Числовые характеристики выборки - student2.ru .

Тогда

Числовые характеристики выборки - student2.ru . (5.22)

Подставив (5.22) в (5.18), можно получить удобные для вычислений формулы, выражающие центральные моменты через условные.

Например, для m2:

Числовые характеристики выборки - student2.ru . (5.23)

Пример. Для статистического распределения рассчитать числовые характеристики.

xi
ni

Решение.

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru Или

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru

Числовые характеристики выборки - student2.ru .

Перейдём к условным вариантам.

с=10.

ui -2 -1
ni

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru .

Теория оценок

Теория оценок определяет методы и способы статистической оценки неизвестных параметров теоретического распределения случайной величины по совокупности экспериментальных данных. При этом часто допускается, что закон распределения генеральной совокупности известен, но неизвестны параметры этого закона (математическое ожидание, дисперсия), которые необходимо оценить (приближённо найти) по выборочной совокупности.

Статистической оценкой неизвестного параметра теоретического распределения называется функция от выборочных значений (вариант), которая даёт приближённое значение оцениваемого параметра.

Все оценки делятся на точечные и интервальные.

Точечные оценки.

Точечнойназывается оценка, которая определяется одним числом.

К точечным оценкам предъявляются следующие требования:

- несмещённости;

- эффективности;

- состоятельности.

Пусть Числовые характеристики выборки - student2.ru – статистическая оценка неизвестного параметра Числовые характеристики выборки - student2.ru теоретического распределения. Допустим, что по выборке объёма n найдена оценка Числовые характеристики выборки - student2.ru . Извлечём из генеральной совокупности другую выборку объёма n и вычислим. Числовые характеристики выборки - student2.ru . Повторяя опыт многократно, получим числа Числовые характеристики выборки - student2.ru , Числовые характеристики выборки - student2.ru ,…, Числовые характеристики выборки - student2.ru , которые, вообще говоря, различны между собой. Таким образом, оценку Числовые характеристики выборки - student2.ru можно рассматривать как случайную величину, а числа Числовые характеристики выборки - student2.ru , Числовые характеристики выборки - student2.ru ,…, Числовые характеристики выборки - student2.ru – как её вложенные значения.

Несмещённой называют статистическую оценку Числовые характеристики выборки - student2.ru , математическое ожидание которой равно оцениваемому параметру Числовые характеристики выборки - student2.ru при любом объёме выборки, т. е.

Числовые характеристики выборки - student2.ru .

Смещённой называют оценку, математическое ожидание которой не равно оцениваемому параметру, т. е.

Числовые характеристики выборки - student2.ru .

Эффективной называют статистическую оценку, которая при заданном объёме выборки n имет наименьшую возможную дисперсию.

Состоятельной называют статистическую оценку, которая при Числовые характеристики выборки - student2.ru стремится по вероятности к оцениваемому параметру, т. е.

Числовые характеристики выборки - student2.ru ,

где Числовые характеристики выборки - student2.ru – бесконечно малая величина.

Оценка генеральной средней выборочной средней Числовые характеристики выборки - student2.ru выполняется по формуле (5.4) и является немещённой и состоятельной, если выборка повторная и несмещённой, если выборка бесповторная.

В качестве оценки генеральной дисперсии принимают исправленную выборочную дисперсию S2.

Числовые характеристики выборки - student2.ru (5.24)

или

Числовые характеристики выборки - student2.ru ,

которая удовлетворяет требованию несмещённости. Очевидно, при достаточно больших значениях n Dв и S2 различаются мало. На практике S2 вычисляется, если n < 30.

Для оценки среднего квадратического отклонения генеральной совокупности используется исправленное выборочное среднее квадратическое отклонение S или выборочное среднее квадратическое отклонение Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru . (5.25)

Все рассмотренные оценки (формулы (5.4), (5.11), (5.24), (5.25)) являются точечными.

Точечные оценки используются прежде всего тогда, когда с их помощью выполняются другие расчёты. При этом точечные оценки не несут информации о точности конкретной оценки. При малых объёмах выборки точечные оценки могут значительно отличаться от оцениваемого параметра.

Интервальные оценки

Интервальной называется оценка, которая определяется двумя числами – началом и концомм интервала, в котором находится оцениваемый параметр теоретического распределения с некоторой вероятностью.

Пусть найденная по данным выборки статистическая оценка Числовые характеристики выборки - student2.ru является оценкой неизвестного параметра Числовые характеристики выборки - student2.ru . Статистическая оценка Числовые характеристики выборки - student2.ru тем точнее определяет параметр Числовые характеристики выборки - student2.ru , чем меньше абсолютная величина разности Числовые характеристики выборки - student2.ru , т. е., если Числовые характеристики выборки - student2.ru и

Числовые характеристики выборки - student2.ru , (5.26)

то чем меньше Числовые характеристики выборки - student2.ru , тем оценка точнее. Таким образом, величина Числовые характеристики выборки - student2.ru характеризует точность оценки.

Т. к. Числовые характеристики выборки - student2.ru – случайная величина, то нельзя категорически утверждать, что Числовые характеристики выборки - student2.ru удовлетворяет неравенству (5.26). Вероятность Числовые характеристики выборки - student2.ru , с которой выполняется неравенство (5.26) называется надёжностью (доверительной вероятностью).

Числовые характеристики выборки - student2.ru . (5.27)

Обычно Числовые характеристики выборки - student2.ru задаётся наперёд в виде числа, близкого к единице, наиболее често – 0,95; 0,99; 0,999.

Заменим неравенство в формуле (5.27) равносильным двойным неравенством:

Числовые характеристики выборки - student2.ru .

Интервал Числовые характеристики выборки - student2.ru называют доверительным, его границы – доверительными границами.

Доверительный интервал покрывает неизвестный параметр Числовые характеристики выборки - student2.ru с надёжностью Числовые характеристики выборки - student2.ru .

Если случайная величина X распределено нормально с математическим ожиданием равным a и среднеквадратическим отклонением известным и равным Числовые характеристики выборки - student2.ru , то по выборке объёма n можно найти доверительные границы для математического ожидания a по уровнениям

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru , (5.28)

где aн и aв – нижняя и верхняя доверительные границы математического ожидания a;

t – коэффициент, определяемый по таблице функции Лапласа, которому соответствует значение функции Лапласа Числовые характеристики выборки - student2.ru . В этом случае

Числовые характеристики выборки - student2.ru . (5.29)

Анализ формулы (5.29) показывает, что

- при возрастании объёма выборки n число Числовые характеристики выборки - student2.ru убывает и, следовательно, точность оценки возрастает;

- при увеличении надёжности Числовые характеристики выборки - student2.ru возрастают значения t (функция Числовые характеристики выборки - student2.ru является возрастающей) и Числовые характеристики выборки - student2.ru , что приводит к уменьшению точности оценки;

- если требуется оценить математическое ожидание с наперёд заданной точностью Числовые характеристики выборки - student2.ru и надёжностью Числовые характеристики выборки - student2.ru , то минимальный объём выбоки, который обеспечит эту точность находят по формуле

Числовые характеристики выборки - student2.ru . (5.30)

Формула (5.30) используется для повторной выборки, для бесповторной выборки минимальный объём пересчитывают по формуле

Числовые характеристики выборки - student2.ru , (5.31)

где N – генеральной совокупности.

Пример 1. Случайная величина X имеет нормальное распределение с известным среднеквадратическим отклонением Числовые характеристики выборки - student2.ru . Найти доверительный интервал для оценки неизвестного математического ожидания a по Числовые характеристики выборки - student2.ru , если Числовые характеристики выборки - student2.ru и Числовые характеристики выборки - student2.ru .

Решение.

При условии

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru .

Вычисляем

Числовые характеристики выборки - student2.ru .

Получили искомый доверительный интервал:

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru .

Числовые характеристики выборки - student2.ru .

Пример 2. Найти минимальный объём повторной и бесповторной выборок для генеральной совокупности с объёмом N=1000 с Числовые характеристики выборки - student2.ru , при котором точность оценки математического ожидания нормально распределённого признака будет равна 0,2 при Числовые характеристики выборки - student2.ru .

Решение.

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru .

Принимаем объём повторной выборки n=385.

Для бесповторной выборки

Числовые характеристики выборки - student2.ru .

Принимаем объём бесповторной выборки Числовые характеристики выборки - student2.ru .

Если случайная величина X распределена нормально с математическим ожидание равным a и среднеквадратическим отклонением Числовые характеристики выборки - student2.ru неизвестным, то по выборке объёма n можно найти доверительные границы для математического ожидания a по формулам

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru , (5.32)

где S – исправленное среднеквадратическое отклонение;

Числовые характеристики выборки - student2.ru – коэффициент Стьюдента, который определяется по таблице в зависимости от надёжности Числовые характеристики выборки - student2.ru и числа степеней свободы, равное Числовые характеристики выборки - student2.ru .

При неограниченном возрастании объёма выборки n распределение Стъюдента стремится к нормальному, поэтому при n>30 в формулах (5.32) Числовые характеристики выборки - student2.ru можно заменить на Числовые характеристики выборки - student2.ru .

Если случайная величина X распределена нормально и среднеквадратическое отклонение Числовые характеристики выборки - student2.ru неизвестно, то оценить его помжно по исправленному среднеквадратическому отклонению S, рассчитанному для выборки объёма n, по формулам

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru , (5.33)

где Числовые характеристики выборки - student2.ru , Числовые характеристики выборки - student2.ru – нижняя и верхняя доверительные границы среднеквадратического отклонения Числовые характеристики выборки - student2.ru ;

q – коэффициент распределения Числовые характеристики выборки - student2.ru , определяемый по таблице в зависимости от Числовые характеристики выборки - student2.ru и объёма выборки n.

Если q<1, то учитывая, что Числовые характеристики выборки - student2.ru , Числовые характеристики выборки - student2.ru .

Пример. Случайная величина X имеет нормальное распределение. По выборке объёма n=10 найдено исправленное среднеквадратическое отклонение S=0,16. Найти доверительный интервал, покрывающий неизвестное среднеквадратическое отклонение Числовые характеристики выборки - student2.ru с надёжностью Числовые характеристики выборки - student2.ru .

Решение.

По таблице найдём q=1,8 (q>0) при Числовые характеристики выборки - student2.ru и n=10.

Искомые доверительные границы доверительного интервала:

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru .

Практическое применение формулы (5.28) и (5.32) получили для оценки истинного значения измеряемой величины, формулы (5.33) – для оценци точности измерений (точности прибора).

Если случайная величина X имеет биноминальное распределение, то оценить неизвестную вероятность p появления события A в каждом испытании можно, рассчитав доверительные границы по формулам

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru

где рн и рв – нижняя и верхняя доверительные границы неизвестного значения вероятности p;

w – относительная частота (точечная оценка для p).

Числовые характеристики выборки - student2.ru ,

где m – число появления события A;

n – число испытаний.

Пример. Производят независимые испытания с одинаковой, но неизвестной вероятностью p появления события A в каждом испытании. Найти доверительный интервал для оценки p с надёжностью 0,95, если в 80 испытаниях событие A появилось 16 раз.

Решение.

По условию m=16, n=80, Числовые характеристики выборки - student2.ru .

Найдём Числовые характеристики выборки - student2.ru .

Найдём t по таблице функции Лапласа из соотношения Числовые характеристики выборки - student2.ru .

Подставив n, w, t в формулу (5.34), получим

Числовые характеристики выборки - student2.ru , Числовые характеристики выборки - student2.ru .

При больших значениях n (порядка сотен) слагаемые Числовые характеристики выборки - student2.ru и Числовые характеристики выборки - student2.ru очень малы и множитель Числовые характеристики выборки - student2.ru , поэтому доверительные границы можно рассчитать по формулам

Числовые характеристики выборки - student2.ru ;

Числовые характеристики выборки - student2.ru . (5.35)

Наши рекомендации