Ошибка выборочных наблюдений

Определение 13.5.Разность между генеральными характеристиками и соответствующими выборочными стати •тиками называется ошибкой выборки, или ошибкой репрезентативности.

Статистические методы позволяют оценить эту разность, которая зависит как от характеристик выборки, так и от ее объема. В процессе выборочного исследования параметры генеральной совокупности определяются в виде интервала, построенного вокруг выборочной статистики. От величины этого интервала и зависит качество исследования.

Из теоремы Чебышева следует, что

Ошибка выборочных наблюдений - student2.ru (13.2)

Определение 13.6.Таким образом, мы получили интервальную оценку генеральной средней, которая представляет собой доверительный интервал, содержащий оцениваемый параметр генеральной совокупности:

Ошибка выборочных наблюдений - student2.ru (13.3)

где Δ— предельная ошибка выборки.

Определение 13.7. Интервальной оценкой называют оценку, которая определяется двумя числами — концами интервала, который с определенной вероятностью накрывает неизвестный параметр генеральной совокупности.

Для определения доверительного интервала необходимо вычислить предельную ошибку выборки А, позволяющую установить предельные границы, в которых с заданной вероятностью (надёжностью) должен находиться параметр генеральной совокупности.

Предельная ошибкавыборки равна г-кратному числу средних ошибок выборки. Коэффициент t позволяет установить, насколько надежно высказывание о том, что заданный интервал содержит параметр генеральной совокупности.

Если мы выберем коэффициент таким, что высказывание в 97% случаев окажется правильным и только в 3% — неправильным, то мы говорим — со статистической надежностью в 97% доверительный интервал выборочной статистики содержит параметр генеральной совокупности. Статистической надежности в 97% соответствует доверительная вероятность — γ = 0,97.

Если в 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, то 5% задает уровень значимости — или Ошибка выборочных наблюдений - student2.ru = 0,05 вероятность ошибки. Обычно в статистике уровень значимости выбирают таким, чтобы он не превысил 5% ( < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания. Имеет место соотношение:

Ошибка выборочных наблюдений - student2.ru (13.4)

Применительно к выборочному методу из теоремы Чебышева следует, что с вероятностью, сколь угодно близкой к единице можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала.

Ошибка выборочных наблюдений - student2.ru (13.5)

где X — средняя по совокупности выбранных единиц;

Ошибка выборочных наблюдений - student2.ru — средняя по генеральной совокупности;

σ_ген — среднее квадратическое отклонение в генеральной совокупности. Запись показывает, что о величине расхождения между параметром и статистикой Ошибка выборочных наблюдений - student2.ru . можно судить лишь с определенной вероятностью, от которой зависит величина t .

Согласно центральной предельной теореме Ляпунова выборочные распределения статистик (при п Ошибка выборочных наблюдений - student2.ru 30) будут иметь нормальное распределение независимо' от того, какое распределение имеет генеральная совокупность. Следовательно имеет место соотношение:

Ошибка выборочных наблюдений - student2.ru (13.6)

где Ф₀(t) — функция Лапласа (см. лекцию 7);

t — аргумент функции Лапласа, зависящий от надежности интервальной оценки;

Ошибка выборочных наблюдений - student2.ru — средняя по совокупности выбранных единиц;

Ошибка выборочных наблюдений - student2.ru — средняя по генеральной совокупности;

Ошибка выборочных наблюдений - student2.ru — ошибка выборки для собственно случайного отбора. Для оценки генеральной доли используется формула:

Ошибка выборочных наблюдений - student2.ru (13.7)

где со — выборочная доля;

р — генеральная доля;

Ошибка выборочных наблюдений - student2.ru — доверительная вероятность;

Ошибка выборочных наблюдений - student2.ru — ошибка выборки для собственно случайного отбора.

Таким образом, для того чтобы найти доверительный интервал для оценки генеральных параметров, достаточно определить величину ошибки. Значения вероятностей, соответствующие различным t, содержатся в специальных

таблицах: при п Ошибка выборочных наблюдений - student2.ru 30 — в таблице значений Ф₀(t) (приложение 2), а при п < 30 в таблице t-распределения Стьюдента (приложение 5). Неизвестное значение σ_ген при расчете ошибки выборки заменяется о_вы6_.

Средняя ошибка выборки для собственно случайного отбора Ошибка выборочных наблюдений - student2.ru определяется в зависимости от способа отбора выборки, ошибка выборки определяется по-разному.

Так, для оценки генеральной средней:

► при повторном отборе:

Ошибка выборочных наблюдений - student2.ru (13-8)

► при бесповторном отборе:

Ошибка выборочных наблюдений - student2.ru (13.9)

где σ² — выборочная дисперсия значений признака,

п — объем выборки;

N — объем генеральной совокупности;

Ошибка выборочных наблюдений - student2.ru — доля обследованной совокупности;

Ошибка выборочных наблюдений - student2.ru — поправка на конечность совокупности.

Для оценки генеральной долииспользуются формулы:

► при повторном отборе:

(13.10)

► при бесповторном отборе:

Ошибка выборочных наблюдений - student2.ru

(13.11)

где Ошибка выборочных наблюдений - student2.ru —выборочная дисперсия доли значений признака;

п — объем выборки;

N — объем генеральной совокупности;

Ошибка выборочных наблюдений - student2.ru — доля обследованной совокупности;

С помощью доверительного интервала можно оценить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности.

Для оценки математического ожидания (генеральной средней) нормально распределенного количественного признака Х_ген по выборочной средней Х_выб при неизвестном среднем квадратическом отклонении σ_ген генеральной совокупности (на практике — при малом объеме выборки, т.е. при п < 30) и собственно-случайном повторном отборе формула интервального оценивания примет вид:

Ошибка выборочных наблюдений - student2.ru (13.12)

где t определяется по таблицам Стьюдента:

—по уровню значимости α= 1 - γ;

—и числу степеней свободы k =n - 1;

S — исправленное среднее квадратическое отклонение;

п — объем выборки (число обследованных единиц).

Δ определяется по формуле:

Ошибка выборочных наблюдений - student2.ru (13.13)

Оптимальный объем представительной выборки

В процессе решения задач легко убедиться, что доверительный интервал оценки средней и оценки доли зависит от объема выборки. Чем больше выборка, тем уже будет интервал, тем точнее оценка генеральных статистик. В самом деле, во всех формулах расчета ошибки выборки объем выборки стоит в знаменателе, значит, между объемом выборки и ошибкой существует обратная связь. Самая большая выборка — это вся генеральная совокупность, и тогда оценка вообще будет точечной. При этом, конечно же, не будет соблюдаться экономичность исследования, которая и является целью выборочного метода. Поэтому следует найти такой оптимальный размер выборки, который будет удовлетворять всем требованиям.

Наши рекомендации

Ошибка! Ошибка связи. Ошибка! Ошибка связи. Таким образом, при достижении критического отношения давлении βкр = pкр / p1 наступает критический режим истечения

Ошибка! Ошибка связи. Ошибка! Ошибка связи. В паровом котле за счет тепла продуктов сгорания топлива питательная вода нагревается до температуры кипения (процесс 3 – 4 на рис

Ошибка! Ошибка связи. Ошибка! Ошибка связи. Средний логарифмический температурный напор между теплоносителями определяется по формуле:

Ошибка! Ошибка связи. Ошибка! Ошибка связи. Проинтегрируем уравнение первого закона термодинамики:

Ошибка! Ошибка связи. Ошибка! Ошибка связи. Цикл осуществляется между двумя бесконечно емкими источниками тепла: горячим, с температурой Т1 и холодным

Ошибка! Ошибка связи. Ошибка! Ошибка связи. Изобразить регенеративный цикл в Т, s-диаграмме можно лишь условно (рис

Ошибка! Ошибка связи. Ошибка! Ошибка связи. Если же известна температура мокрого термометра tм, равная температуре испарения влаги со смоченной поверхности

Ошибка! Ошибка связи. Ошибка! Ошибка связи. Если при одной и той же температуре воздуха tв увеличивать содержание в нем влаги, то давление pп будет расти и в точке 2 сравняется с pн

Средняя квадратическая ошибка измерения. Формула Гаусса. Абсолютная и относительная ошибка. Предельная ошибка

Средняя и предельная ошибка выборки. Методика их расчёта для средней и доли. Оценка существенности расхождения выборочных средних.

← Предыдущая страница | Следующая страница →