Ошибка выборочных наблюдений

Определение 13.5.Разность между генеральными характеристиками и соответствующими выборочными стати •тиками называется ошибкой выборки, или ошибкой репрезентативности.

Статистические методы позволяют оценить эту разность, которая зависит как от характеристик выборки, так и от ее объема. В процессе выборочного исследования параметры генеральной совокупности определяются в виде интервала, построенного вокруг выборочной статистики. От величи­ны этого интервала и зависит качество исследования.

Из теоремы Чебышева следует, что

Ошибка выборочных наблюдений - student2.ru (13.2)

Определение 13.6.Таким образом, мы получили интер­вальную оценку генеральной средней, которая представ­ляет собой доверительный интервал, содержащий оцени­ваемый параметр генеральной совокупности:

Ошибка выборочных наблюдений - student2.ru (13.3)

где Δ— предельная ошибка выборки.

Определение 13.7. Интервальной оценкой называют оцен­ку, которая определяется двумя числами — концами ин­тервала, который с определенной вероятностью накры­вает неизвестный параметр генеральной совокупности.

Для определения доверительного интервала необходи­мо вычислить предельную ошибку выборки А, позволяю­щую установить предельные границы, в которых с задан­ной вероятностью (надёжностью) должен находиться пара­метр генеральной совокупности.

Предельная ошибкавыборки равна г-кратному числу сред­них ошибок выборки. Коэффициент t позволяет установить, насколько надежно высказывание о том, что заданный интер­вал содержит параметр генеральной совокупности.

Если мы выберем коэффициент таким, что высказывание в 97% случаев окажется правильным и только в 3% — не­правильным, то мы говорим — со статистической надежно­стью в 97% доверительный интервал выборочной статисти­ки содержит параметр генеральной совокупности. Стати­стической надежности в 97% соответствует доверительная вероятность — γ = 0,97.

Если в 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, то 5% задает уро­вень значимости — или Ошибка выборочных наблюдений - student2.ru = 0,05 вероятность ошибки. Обыч­но в статистике уровень значимости выбирают таким, чтобы он не превысил 5% ( Ошибка выборочных наблюдений - student2.ru < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания. Имеет место соотношение:

Ошибка выборочных наблюдений - student2.ru (13.4)

Применительно к выборочному методу из теоремы Че­бышева следует, что с вероятностью, сколь угодно близкой к единице можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и гене­ральной средней будет сколь угодно мала.

Ошибка выборочных наблюдений - student2.ru (13.5)

где X — средняя по совокупности выбранных единиц;

Ошибка выборочных наблюдений - student2.ru — средняя по генеральной совокупности;

σген — среднее квадратическое отклонение в генераль­ной совокупности. Запись показывает, что о величине расхождения между параметром и статистикой Ошибка выборочных наблюдений - student2.ru . можно судить лишь с определенной вероятностью, от которой зависит ве­личина t .

Согласно центральной предельной теореме Ляпунова выборочные распределения статистик (при п Ошибка выборочных наблюдений - student2.ru 30) будут иметь нормальное распределение независимо' от того, ка­кое распределение имеет генеральная совокупность. Следо­вательно имеет место соотношение:

Ошибка выборочных наблюдений - student2.ru (13.6)

где Ф0(t) — функция Лапласа (см. лекцию 7);

t — аргумент функции Лапласа, зависящий от надежно­сти интервальной оценки;

Ошибка выборочных наблюдений - student2.ru — средняя по совокупности выбранных единиц;

Ошибка выборочных наблюдений - student2.ru — средняя по генеральной совокупности;

Ошибка выборочных наблюдений - student2.ru — ошибка выборки для собственно случайного отбора. Для оценки генеральной доли используется формула:

Ошибка выборочных наблюдений - student2.ru (13.7)

где со — выборочная доля;

р — генеральная доля;

Ошибка выборочных наблюдений - student2.ru — доверительная вероятность;

Ошибка выборочных наблюдений - student2.ru — ошибка выборки для собственно случайного отбора.

Таким образом, для того чтобы найти доверительный интервал для оценки генеральных параметров, достаточ­но определить величину ошибки. Значения вероятностей, соответствующие различным t, содержатся в специальных

таблицах: при п Ошибка выборочных наблюдений - student2.ru 30 — в таблице значений Ф0(t) (приложе­ние 2), а при п < 30 в таблице t-распределения Стьюдента (приложение 5). Неизвестное значение σген при расчете ошибки выборки заменяется овы6_.

Средняя ошибка выборки для собственно случайного отбора Ошибка выборочных наблюдений - student2.ru определяется в зависимости от способа отбора выборки, ошибка выборки определяется по-разному.

Так, для оценки генеральной средней:

► при повторном отборе:

Ошибка выборочных наблюдений - student2.ru (13-8)

► при бесповторном отборе:

Ошибка выборочных наблюдений - student2.ru (13.9)

где σ2 — выборочная дисперсия значений признака,

п — объем выборки;

N — объем генеральной совокупности;

Ошибка выборочных наблюдений - student2.ru — доля обследованной совокупности;

Ошибка выборочных наблюдений - student2.ru — поправка на конечность совокупности.

Для оценки генеральной долииспользуются формулы:

► при повторном отборе:

Ошибка выборочных наблюдений - student2.ru

(13.10)

► при бесповторном отборе:

Ошибка выборочных наблюдений - student2.ru

(13.11)

где Ошибка выборочных наблюдений - student2.ru —выборочная дисперсия доли значений при­знака;

п — объем выборки;

N — объем генеральной совокупности;

Ошибка выборочных наблюдений - student2.ru — доля обследованной совокупности;

С помощью доверительного интервала можно оценить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности.

Для оценки математического ожидания (генеральной средней) нормально распределенного количественного при­знака Хген по выборочной средней Хвыб при неизвестном среднем квадратическом отклонении σген генеральной со­вокупности (на практике — при малом объеме выборки, т.е. при п < 30) и собственно-случайном повторном отборе формула интервального оценивания примет вид:

Ошибка выборочных наблюдений - student2.ru (13.12)

где t определяется по таблицам Стьюдента:

—по уровню значимости α= 1 - γ;

—и числу степеней свободы k =n - 1;

S — исправленное среднее квадратическое отклонение;

п — объем выборки (число обследованных единиц).

Δ определяется по формуле:

Ошибка выборочных наблюдений - student2.ru (13.13)

Оптимальный объем представительной выборки

В процессе решения задач легко убедиться, что довери­тельный интервал оценки средней и оценки доли зависит от объема выборки. Чем больше выборка, тем уже будет ин­тервал, тем точнее оценка генеральных статистик. В самом деле, во всех формулах расчета ошибки выборки объем выборки стоит в знаменателе, значит, между объемом выбор­ки и ошибкой существует обратная связь. Самая большая выборка — это вся генеральная совокупность, и тогда оценка вообще будет точечной. При этом, конечно же, не будет соблюдаться экономичность исследования, которая и явля­ется целью выборочного метода. Поэтому следует найти такой оптимальный размер выборки, который будет удов­летворять всем требованиям.

Наши рекомендации