II. Показатели вариации и анализ частотных распределений
Показатели вариации
Задача 6.Рассчитайте показатели вариации по стажу работников двух бригад.
1 бригада | 2 бригада | |||||
№ п/п | Стаж. годы х | Отклонение от среднего стажа | Квадрат отклонения от среднего стажа | Стаж. годы х | Отклонение от среднего стажа | Квадрат отклонения от среднего стажа |
6,2 | 38,44 | 1,2 | 1,44 | |||
5,2 | 27,04 | 1,2 | 1,44 | |||
4,2 | 17,64 | 0,2 | 0,04 | |||
4,2 | 17,64 | 0,2 | 0,04 | |||
3,2 | 10,24 | 0,2 | 0,04 | |||
1,8 | 3,24 | 0,2 | 0,04 | |||
2,8 | 7,84 | 0,8 | 0,64 | |||
4,8 | 23,04 | 0,8 | 0,64 | |||
5,8 | 33,64 | 0,8 | 0,64 | |||
7,8 | 60,84 | 0,8 | 0,64 | |||
Сумма | 239,6 | 6,4 | 5,6 |
Последовательность расчёта:
1. Рассчитываем средний стаж работы работников в каждой бригаде в годах.
В первой бригаде:
Во второй бригаде:
2. Определяем размах вариации.
В первой бригаде: R1=Xmax-Xmin=15-1=14 лет.
Во второй бригаде: R2=Xmax-Xmin=8-6=2 года.
Таким образом, при численном равенстве работников бригад колеблемость стажа отдельных работников во второй бригаде значительно меньше, чем в первой.
3. Вычисляем среднее линейное отклонение.
В первой бригаде:
Во второй бригаде:
Во второй бригаде стаж работников более однороден, чем в первой бригаде.
4. Дисперсия составит:
для первой бригады: года
для второй бригады: года
5. Среднеквадратическое отклонение составит:
в первой бригаде:
во второй бригаде:
Чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает всю представляемую совокупность. Во второй бригаде дисперсия и среднее квадратическое отклонение значительно меньше, чем в первой бригаде, следовательно, средняя арифметическая второй бригады является обобщающей характеристикой всей совокупности.
6. Коэффициент осцилляции в первой бригаде составил:
, то есть разница между крайними значениями на 94% превышает среднее значение стажа работников.
Во второй бригаде этот показатель составляет 27,2% среднего значения:
7. Относительное линейное отклонение характеризует долю усреднённого значения абсолютных отклонений от средней величины, во второй бригаде оно составило 8,8% против 64% в первой бригаде:
8. Коэффициент вариации используется для оценки типичности средних величин и равен:
в первой бригаде:
во второй бригаде:
Чем меньше значения относительных показателей вариации, тем меньше колеблемость признаков, что подтверждает однородность совокупности. Если Kv=40%, то это говорит о большой колеблемости признака и нетипичности средней величины для всей совокупности. В данной задаче коэффициент вариации подтверждает большую колеблемость стажа работников в первой бригаде и, следовательно, средняя арифметическая не является обобщающей характеристикой всей совокупности.
Задачи для самостоятельного решения:
1. По данным о распределении количества обрабатываемых за неделю ГТД рассчитайте показатель ассиметрии и эксцесса:
Количество обрабатываемых в неделю ГТД, шт. | 19-20 | 20-21 | 21-22 | 22-23 | 23-24 | 24-25 | Итого |
Частота |
2. По следующим данным постройте интервальный ряд распределения.
Возраст студентов двух групп 5 курса, лет:
22 21 23 24 22 21 22 21 23 26 24 21
25 23 22 21 21 22 24 23 21 21 25 24
III. Выборочный метод в статистике
Ошибки выборки
- дисперсия признака х в выборочной совокупности;
w – доля единиц, обладающих исследуемым признаком;
n – объём выборочной совокупности;
N – объём генеральной совокупности;
- выборочная средняя;
- генеральная средняя;
t – коэффициент доверия, который определяется в зависимости от того, с какой вероятностью надо гарантировать результаты выборочного наблюдения.
Задача 7. В случае случайного повторного отбора было установлено, что средний вес товара в выборочной совокупности, состоящей из 100 изделий, оказался равным 10 кг, при среднем квадратическом отклонении 0,6 кг. С вероятностью, равной 0,954, определить в каких пределах заключён средний вес товара в генеральной совокупности.
По условию задачи имеем: Ф(t)=0,954,
следовательно t=2.
Последовательность расчёта
1. Определим среднюю и предельную ошибки выборки:
2. Средний вес изделия в генеральной совокупности колеблется в пределах:
Таким образом, с вероятностью 0,954 можно утверждать, что средний вес товара в генеральной совокупности колеблется в пределах от 9,88 до 10,12 кг.
Механическая выборка
Задача 8. Из 1000 таможенных работников в порядке механической выборки отобрано 100 работников в целях изучения их среднего стажа работы. Определить: 1) с вероятностью 0,954 средний стаж таможенных работников; 2) с вероятностью 0,997 долю таможенных работников со стажем свыше 20 лет и пределы генеральной совокупности.
Стаж, годы, Х | Число таможенных работников, f | Середина интервала, Хi | Xif | Xi2 | Xi2f |
0-5 | 2,5 | 6,25 | 37,5 | ||
5-10 | 7,5 | 56,25 | |||
10-15 | 12,5 | 156,25 | 2812,5 | ||
15-20 | 17,5 | 306,25 | 9187,5 | ||
20-25 | 22,5 | 506,25 | |||
Свыше 25 | 27,5 | 756,25 | 10587,5 | ||
∑f=100 | ∑=1690 | ∑=33425 |
Порядок расчёта
1. Рассчитываем среднюю арифметическую выборочной совокупности:
2. Рассчитываем дисперсию выборочной совокупности:
3. Определим среднюю ошибку механической выборки:
4. Предельная ошибка механической выборки:
Так как вероятность 0,954 t=2, следовательно,
5. Вычисляем пределы, в которых находится средняя арифметическая в генеральной совокупности:
, 16,9 – 1,2≤ х ≤16,9 + 1,2
15,7≤ х ≤18,1
С вероятностью 0,954 можно утверждать, что средний стаж работников в генеральной совокупности находятся в пределах от 15,7 до 18,1 года.
6. Доля таможенных работников, стаж которых свыше 20 лет, в выборочной совокупности составит:
w=m/n=34/100=0,34,
где m – число таможенных работников со стажем свыше 20 лет в выборочной совокупности;
n – число таможенных работников в выборке.
7. Определяем среднюю ошибку механической выборки для доли:
8. Предельная ошибка доли:
Так как при вероятности 0,997 t=3, следовательно,
9. Определяем пределы, в которых находится доля (число работников со стажем свыше 20 лет) в генеральной совокупности:
, 0,34 – 0,135≤ p≤ 0,34+0,135
0,205≤ p≤0,475
С вероятностью 0,997 можно утверждать, что доля таможенных работников со стажем свыше 20 лет в генеральной совокупности не менее 20,5% и не менее 47,5%.
Типическая выборка
Задача 9. Проведён 10%-ный бесповторный типический отбор таможенных работников, пропорциональный размерам численности занятых на таможне с целью оценки потерь рабочего времени по болезни. Определить с вероятностью 0,954 среднее число дней временной нетрудоспособности одного таможенного работника в целом по таможенному управлению, в состав которого входят три таможни.
Результат типического отбора
Таможня | Всего таможенных работников, N | Обследовано таможенных работников, n | Число дней временной нетрудоспособности за год | |
Среднее | Дисперсия | |||
Всего: |
Алгоритм расчёта
1. Определим среднюю из внутригрупповых дисперсий по формуле:
2. Средняя ошибка выборки:
3. Для вероятности 0,954 находим t=2. Тогда предельная ошибка выборки составит:
4. Рассчитаем выборочную среднюю:
5. Генеральная совокупность составит:
Таким образом, с вероятностью 0,954 можно сделать вывод, что среднее число дней временной нетрудоспособности одного таможенного работника в целом по таможенному управлению за год составляет не менее 14 дней, но не более 15 дней.
Серийная выборка
-межсерийная (межгрупповая) дисперсия, определяемая по формуле:
,
- средняя i-й серии;
- общая средняя по всей выборочной совокупности;
R – общее число серий в генеральной совокупности;
r – число отобранных серий в выборочную совокупность;
- межсерийная дисперсия выборочной доли, определяемая по формуле:
,
где wi – доля признака в i-й серии;
- общая доля признака во всей выборочной совокупности.
Задача 10.Из 100 ящиков, по 200 пакетов овощной приправы в каждом, поступивших на таможенный склад в течение месяца, в порядке серийной выборки отобрано 10 ящиков, в котором каждый пакет овощной приправы был проверен на вес. На основе серийной выборки определить средний вес пакета приправы в генеральной совокупности при вероятности 0,954.
№ ящика | Средний вес приправы в пакете, г | ||
-1 | |||
-4 | |||
-2 | |||
-1 | |||
-2 | |||
Итого: |
Алгоритм расчёта
1. Рассчитываем выборочную среднюю:
2. Определяем межсерийную дисперсию:
3. Средняя ошибка выборки составит:
4. Определяем предельную ошибку выборки. При Ф(t)=0,954 t=2
Тогда,
5. Генеральная средняя составит:
С вероятностью 0,954 можно утверждать, что средний вес пакета с овощной приправой в генеральной совокупности находится в пределах от 52,52 г до 55,48 г.
Задачи для самостоятельного решения:
1. Для определения скорости расчётов с кредиторами предприятий корпорации была проведена случайная выборка 50 платёжных документов, по которым срок перечисления и получения денег составил 20 дней (х=20) со стандартными отклонениями 4 дня ( =4). С вероятностью 0,954 определите предельную ошибку выборочной средней и доверительные пределы средней продолжительности расчётов предприятий данной корпорации.