Расчет среднего объема продаж и дисперсии
Объем продаж, млн. руб. | Число фирм, | Середина интервала | ||
- 5 5 - 9 9 - 13 13 - | ||||
Итого | - |
С вероятностью 0,954 определить:
1) средний объем продаж ;
2) долю фирм, имеющих объем продаж 5 – 9 млн. руб. и ниже.
Решение.
Доверительный интервал для генеральной средней :
Выборочная средняя: (млн. руб.).
Предельная ошибка выборки:
По условию Р(t) = 0,954, t = 2,0 (по таблице значений интеграла Лапласа).
Выборочная дисперсия:
.
Средняя ошибка выборки для бесповторного отбора:
;
млн. руб.
Определим с вероятностью 0,954 предельную ошибку выборки:
млн. руб.
Границы генеральной средней:
;
.
Таким образом, с вероятностью 0,954 можно утверждать, что средний объем продаж фирм лежит в пределах от 7,56 до 8,44 млн. руб.
Долю фирм, имеющий объем продаж 5 – 9 млн. руб. и ниже, определим по формуле:
Выборочная доля:
Средняя ошибка выборки:
= 0,001.
Предельная ошибка выборки с заданной вероятностью составит:
Границы генеральной доли:
Следовательно, с вероятностью 0,954 можно утверждать, что доля фирм, с объемом продаж 5 – 9 млн. руб. и ниже, находится в пределах от 68, 8 % до 69,2 %.
Определение необходимой численности выборки
При организации выборочного наблюдения необходимо правильно определить объем выборки n, который обеспечит требуемую точность результатов с заданной вероятностью.
Расчет необходимого объема выборки проводится на основе предельной ошибки выборки в соответствии с видом и методом отбора единиц. Например, выведем формулу объема для средней при собственно-случайной повторной выборке. Имеем,
Аналогично можно получить остальные формулы расчета оптимального объема выборки в зависимости от вида и метода отбора (табл. 7.5).
Таблица 7.5
Формулы определения необходимого объема выборки n
(m – для серийной) при различных методах отбора
Метод отбора | Оцениваемый параметр | Вид отбора | |
повторный | бесповторный | ||
Собственно-случайный и механический | средняя | ||
доля | |||
Типический (пропорциональный) | средняя | ||
доля | |||
Серийный | средняя | ||
доля |
Следует помнить, что величина объема выборки не может быть дробной. Поэтому в случае дробного ответа объем выборки округляют только в сторону. Например, если получено 42, 25, то объем равен 43, если 54, 82, объем равен 55.
Таким образом, чем больше объем выборки n, тем меньше значения предельной ошибки выборочного наблюдения. И, следовательно, тем уже границы генеральной средней и генеральной доли . С другой стороны, увеличение численности выборки сопровождается ростом затрат на проведение наблюдения. Поэтому два этих процесса надо оптимизировать.
Если доля отбора не превышает 5 %, то формулу бесповторного отбора можно не использовать, так как это существенно не скажется на величине объема n.
При решении задачи определения необходимого объема выборки величина допустимой предельной ошибки и уровень вероятности, гарантирующей точность оценок выборки, задаются заранее. А величина генеральной дисперсии , как правило, неизвестна.
Для оценки генеральной дисперсии можно использовать:
1. выборочную дисперсию по данным предшествующих или пробных обследований;
2. дисперсию , найденную из соотношения для среднего квадратического отклонения:
3. дисперсию , вычисленную из соотношения для нормального распределения: где - размах вариации.
4. дисперсию , определенную из соотношения для асимметричного распределения: где - размах вариации.
В качестве оценки генеральной дисперсии доли используют результаты предыдущих исследований или максимально возможное значение дисперсии альтернативного признака
Малая выборка
В практике статистических исследований часто приходится сталкиваться с малыми выборками, которые имеют объем менее 30 единиц. К большим же обычно относят выборки объемом свыше 100 единиц.
Обычно малые выборки применяются в случаях, когда невозможно или нецелесообразно использовать большую выборку. Иметь дело с такими выборками приходится, например, при опросах туристов и посетителей гостиниц.
Величина ошибки малой выборки определяется по формулам, отличающимся от формул для сравнительно большого объема выборки ( ).
При малом объеме выборки n следует учитывать взаимосвязь между выборочной и генеральной дисперсией :
Так как при малой выборке дробь имеет существенное значение, то вычисление дисперсии производится с учетом, так называемого числа степеней свободы . Оно понимается как число вариантов , которые могут принимать произвольные значения, не меняя величины средней .
Средняя ошибка малой выборки определяется по формуле:
Предельная ошибка выборки для средней и доли находится аналогично случаю большой выборки:
где t – коэффициент доверия, зависящий от заданного уровня значимости и числа степеней свободы (Приложение 5).
Значения коэффициента зависят не только от заданной доверительной вероятности , но и от объема выборки n. Для отдельных значений t и n доверительная вероятность определяется по распределению Стьюдента, которое содержит распределения стандартизованных отклонений:
.
Замечание. По мере увеличения объема выборки распределение Стьюдента приближается к нормальному распределению: при n=20 оно уже мало отличается от нормального распределения. При проведении малых выборочных обследований следует учесть, что чем меньше объем выборки n, тем больше различие между распределением Стьюдента и нормальным распределением. Например, при пmin. = 4 это различие весьма существенно, что говорит об уменьшении точности результатов малой выборки.
Распределение Стьюдента применяется для решения следующих задач малой выборки:
1) оценка средней и доли по малой выборке;
2) интервальная оценка по малой выборке.