Вычисление ошибки репрезентативности для собственно случайной выборки

Пусть нам необходимо оценить средний возраст некоторой группы людей по ограниченному числу наблюдений n. Оценкой среднего значения непрерывной случайной величины является математическое ожидание:

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru .

Естественной оценкой математического ожидания является среднее арифметическое:

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru .

От оценки необходимо потребовать следующие свойства:

1. состоятельность – оценка называется состоятельное, если при увеличении числа опытов оценка сходится по вероятности с искомым параметром,

2. несмещенность – оценка называется несмещенной, если выполнялось условие

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru ,

3. эффективность – оценка называется эффективной, если ее дисперсия минимальна по сравнению с другими.

Среднее арифметическое обладает этими свойствами[3].

Оценка параметра является функцией от случайных величин Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru , Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru , … , Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru , поэтому сама является случайной величиной. Другими словами, мы можем сделать множество выборок, для каждой из которых значение оценки будет различно. По закону больший чисел распределение оценки является нормальным с математическим ожиданием

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru

и дисперсией

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru [4],

где Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru - генеральная дисперсия.

Тогда можно рассчитать вероятность того, что Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru попадет в интервал Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru . Поскольку нам неизвестна величина Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru , то мы будем говорить о вероятности, с которой интервал Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru накроет Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru . Эта которая равна площади под графиком функции распределения случайной величины Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru (см. рис. 2):

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru .

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru

Рисунок 2. Распределение выборочной оценки среднего.

Приведем это распределение к стандартному виду.

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru

Произведем замену переменной:

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru .

Справа получили функцию Лапласа, которая табулирована (см. Приложение):

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru .

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru

Нам не известно значение Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru , поэтому заменим его на Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru . Но в этом случае нужно использовать не нормальное распределение, а распределение Стьюдента.

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru ,

где Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru

При больших объемах выборки вид распределения Стьюдента приближается к виду нормального распределения, поэтому для больших выборок также можно использовать функцию Лапласа.

Для повторной выборки

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru (1).

Для бесповторной выборки необходимо внести поправку на конечность ГС

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru (2).

Для большой ГС (объем ВС составляет менее 5% от ГС) поправкой на конечность совокупности можно пренебречь.

Про коэффициент доверия Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru следует сказать отдельно. Этот коэффициент исследователь выбирает сам. Чем меньше Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru , тем меньше доверительный интервал, но тем меньше и вероятность того, что оценка не выйдет за пределы доверительного интервала.

Пример 1. Пусть была произведена выборка 1600 человек. Средний возраст по выборке – 30 лет, среднеквадратическое отклонение – 10 лет. Необходимо найти доверительный интервал.

Прежде всего, необходимо задать надежность оценки. Возьмем 95% надежность. Поскольку выборка большая, воспользуемся таблицей значений функции Лапласа и найдем коэффициент доверия Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru - 1,96.

Тогда

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru .

С вероятностью 95% истинное средний возраст по ГС находится в интервале от 29,51 лет до 30,49 лет.

Для биномиального распределения

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru ,

где Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru – доля признака, Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru .

Тогда для повторной выборки из (1)

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru (3),

для бесповторной выборки из (2)

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru (4).

Пример 2.Из 200 опрошенных 55% - женщины. Действуем аналогично примеру 1. Выборку также можно считать большой. Тогда Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru =1,96 для 95% надежности.

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru .

С вероятностью 95% доля женщин в ГС находится в интервале от 48% до 62%.

Таблица 1.

Формулы ошибки репрезентативности для собственно случайного отбора.[3, 16]

Предмет изучения. Повторный отбор. Бесповторный отбор.
Среднее значение признака. Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru
Доля признака. Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru

Где:

z – коэффициент доверия,

n – объем выборки,

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru - выборочная дисперсия,

N – объем генеральной совокупности,

Вычисление ошибки репрезентативности для собственно случайной выборки - student2.ru - доля признака в выборочной совокупности.

Наши рекомендации