Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки.

В каждой конкретной выборке расхождение между выборочной средней и генеральной может быть меньше средней ошибки выборки μ, равно ей или больше ее.

Причем каждое из этих расхождений имеет различную вероятность (объективную возможность появления события). Поэтому фактическое расхождение между генеральной и выборочной средней рассматривают как предельную ошибку, связанной со средней ошибкой и гарантируемую с определенной вероятностью Р.

Предельную ошибку выборки для средней Δ можно рассчитать по формуле

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

где t-параметр распределения Стьюдента, зависящий от вероятности с которой гарантируется предельная ошибка выборки; μ – средняя ошибка выборки.

Формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированных в ряде теорем теории вероятности, отражающих закон больших чисел.

(Сущность закона больших чисел состоит в том, что в числах, суммирующих результат массовых наблюдений, выступают определенные правильности, которые не могут быть обнаружены на небольшом числе факторов. Закон больших чисел порожден свойствами массовых явлений. Тенденции и закономерности, вскрытые с помощью закона больших чисел, имеют силу лишь как массовые тенденции, но не как законы для каждого отдельного, индивидуального случая.)

 
  Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

На основании теоремы Чебышева с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограни­ченной дисперсии генеральной совокупности раз­ность между выборочной средней и генеральной средней будет сколь угодно мала.

Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы.

Определение численности (объема) выборки

Одной из важных проблем выборочного метода является определение необходимого объема выбор­ки (табл.2). От объема выборки зависит размер средней ошибки (μ) и экономичность проводимого выборочного наблюдения, так как чем больше объем выборки, тем больше затраты на изучение элементов выборки, но тем меньше при этом ошибка выборки.

Из формулы предельной ошибки Δ и формул средних ошибок выборки определяются формулы необходимой численности выборки для различных способов отбора.

Таблица 2

Формулы расчета необходимой численности выборки

Для собственно-случайного отбора

n Собственно-случайный отбор  
повторный   бесповторный  
Для средней   Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru
Для доли   Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

Интервальное оценивание

Пусть Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

. Если Δ представляет собой предел, которым ограничена сверху абсолютная вели­чина |ε | < Δ, то \Х -X | < Δ.

Следовательно, Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

 
  Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

Мы получили интервальную оценку генеральной средней. Из теоремы Чебышева следует, что

Интервальной оценкой называют оценку, которая определяется 2 числами — концами интервала, который с определенной вероятностью накры­вает неизвестный параметр генеральной совокупности. Интервал, содержащий оцениваемый параметр генеральной совокупности, называют доверительным интервалом. Для его определения вычисляется предельная ошибка выборки Δ, позволяющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен находиться параметр генеральной совокупности.

Коэффициент t позволяет установить, насколько надежно выска­зывание о том, что заданный интервал содержит параметр генеральной совокупности. Если мы вы­берем коэффициент таким, что высказывание в 95% случаев окажется правильным и только в 5% - неправильным, то мы говорим: со статистической надежностью в 95% доверительный интервал выборочной статистики содержит параметр гене­ральной совокупности. Статистической надежности в 95% соответствует доверительная вероятность — 0,95. В 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, т. е. 5% задает уровень значимости (α) или 0,05 вероятность ошибки. Обычно в статистике уровень значимости выбирают таким, чтобы он не превысил 5% (α < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания.

С помощью доверительного интервала можно оценить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности.

Для оценки математического ожидания х (генеральной средней) нормально распределенного количественного признака Х по выборочной средней Х при известном среднем квадратическом отклонении α генеральной совокупности (на практике — при большом объеме выборки, т. е. при п 30) и собственно-случайном повторном отборе формула ( ) примет вид

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Фo(t) = γ; а— среднее квадратическое отклонение; п — объем выборки (число обследованных единиц).

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней Х при известном среднем квадратическом отклоне­нии а генеральной совокупности (при большом объеме выборки, т. е. при n >. 30) и собственно-случай­ном бесповторном отборе формула ( ) примет вид

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Фo(t) = γ; w — выборочная доля; п — объем выборки (число обследованных единиц);

       
  Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru   Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru
 

Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле w = т/п (при большом объеме выборки, т. е. при п >. 30) и собственно-случайном повторном отборе формула ( ) будет иметь вид

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

       
  Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru   Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru
 

Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле w = т/п (при большом объеме выборки, т. е. при п >. 30) и собственно-случайном ,бесповторном отборе формула ( ) будет иметь вид

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов с учетом предела их возможной ошибки. - student2.ru

где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Фo(t) = γ; w — выборочная доля; п — объем выборки (число обследованных единиц);

Пример 3. Владелец автостоянки опасается обмана со стороны своих служащих (охраны автостоянки). В течение года (365 дней) владельцем автостоянки проведено 40 проверок. По данным проверок среднее число автомобилей, оставляемых на ночь на охрану, составило 400 единиц, а среднее квадратическое (стандартное) отклонение их числа - 10 автомобилей. Считая отбор собственно-случайным, с вероятностью 0,99 оцените с помощью доверительного интервала истинное среднее число автомобилей, оставляемых на ночь на охрану. Обоснованы ли опасения владельца автостоянки, если по отчетности охранников среднее число автомобилей, оставляемых на ночь на охрану, составляет 395 автомобилей?

Решение. По условию задачи выборочное обследование проведено с помощью собственно-случайного отбора. Очевидно, что отбор - бесповторный, так как не имеет смысла производить проверку более 1 раза в сутки. Объем выборки n = 40, что больше 30 единиц, т. е. выборка большая. Объем генеральной совокупности N = 395.

Найдем границы доверительного интервала для оценки среднего числа автомобилей, оставляемых на ночь на охрану, т.е. границы доверительного интервала для генеральной средней.

По условию

Х= 400; σ = 10; п = 40; = 0,99; N=365. Используем формулу

Найдем t из соотношения 2Фo(t) = γ. 2Ф o(t) = 0,99;

Фo(t) = 0,99/2 = 0,495.

По таблице функции Лапласа (приложение 2) найдем, при каком t 2Фo(t) = 0,495. Фo (2,58) = 0,495.

Следовательно, t= 2,58.

Найдем предельную ошибку выборки:

396,1507 <Х< 403,8493.

Ответ. С уверенностью в 99% можно ожидать, что среднее число автомобилей, оставляемых на ночь на охрану, находится в интервале от 396 до 404. Таким образом, можно утверждать, что служащие автостоянки обманывают ее владельца.

Пример 4. В 24 из 40 проверок число автомобилей на автостоянке не превышало 400 единиц. С вероятностью 0,98 найдите доверительный интервал для оценки истинной доли дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц.

Решение. Определим границы доверительного интервала для доли дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц.

По условию т = 24; п = 40; у= 0,98.

Выборочная доля w = 24/40 = 0,60. Так как

Фo(t) = γ/2 = 0,98/2 = 0,49.

По таблице функции Лапласа (приложение 2) найдем, при каком t Фo(t) = γ 0,49. Фо (2,33) = 0,49.

Следовательно, t == 2,33.

Найдем предельную ошибку выборки:

0,6 - 0,1703 <p < 0,6 + 0,1703;

0,4297 <p< 0,7703.

Ответ. С вероятностью 0,98 можно ожидать, что доля дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц, находится в интервале от 0,4297 до 0,7703.

Пример 5. Изменим условие примера 3. С помощью собственно-случайного бесповторного отбора определяется среднее число автомобилей, оставляемых на ночь на охрану. Предполагается, что оно подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с вероятностью 0,95 можно было утверждать, что когда принимается полученное среднее число автомобилей по выборке за истинное, совершается погрешность, не превышающая 3 автомобилей, если среднее квадратическое отклонение а равно 10 автомобилям?

Решение. Дано: Д = 3; <т= 10; у= 0,95; .N=365. Воспользуемся формулой расчета необходимой численности выборки для средней при собственно-случайном бесповторном отборе:

Найдем t из соотношения 2Фд(() = у. 2Фу(1) = 0,95;

Фд(() = 0,95/2 = 0,475.

По таблице функции Лапласа (приложение2)найдем, при каком t Фу(1) == 0,475. Фд(1,96) = 0,475.

Следовательно, t = 1,96.

Рассчитаем объем выборки:

Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

Следовательно, необходимо провести не менее 39 проверок.

Ответ. Для определения среднего числа автомобилей, оставляемых на ночь на охрану с вероятностью 0,95 и Д = 3, необходимо провести не менее 39 проверок

Наши рекомендации