Тема 5. Ряды распределения в таможенной статистике

Методические указания

Таможенная инспекция провела 1%-ю проверку после выпуска товаров. В результате получен следующий дискретный ряд распределения числа нарушений, выявленных в каждой проверке (табл. 22). Проведем анализ этого ряда распределения.

Таблица 22. Ряд распределения числа нарушений, выявленных таможенной инспекцией

Число нарушений
Число проверок

Этап 1. Данный в табл. 22 ряд распределения уже ранжирован в порядке возрастания числа нарушений, поэтому переходим сразу к расчету основного обобщающего показателя – среднего числа нарушений. Сначала рассчитаем среднее число нарушений в выборке, а также его дисперсию, для чего построим вспомогательную таблицу 23.

Таблица 23. Ряд распределения числа нарушений, выявленных таможенной инспекцией

Число нарушений X Число проверок f Xf (Х- Тема 5. Ряды распределения в таможенной статистике - student2.ru )2 f m Тема 5. Ряды распределения в таможенной статистике - student2.ru f’ m’ |f’– m’|
3,022 21,7 0,244 21,7 2,3
1,665 7,7 1,778 29,4 1,4
5,413 1,4 0,257 30,8 0,8
6,997 0,2 3,200
Итого 17,097 5,479      

Среднее число нарушений в выборке по формуле (11), приняв за X число нарушений, а за N – численность выборки n: Тема 5. Ряды распределения в таможенной статистике - student2.ru = Тема 5. Ряды распределения в таможенной статистике - student2.ru = 11/31 = 0,355 (нарушений).

Дисперсию определим по формуле (46):

Тема 5. Ряды распределения в таможенной статистике - student2.ru = Тема 5. Ряды распределения в таможенной статистике - student2.ru = 0,552 (нарушений2).

Затем определим среднюю ошибку выборки по формуле (33), так как число величин в генеральной совокупности N неизвестно: Тема 5. Ряды распределения в таможенной статистике - student2.ru = Тема 5. Ряды распределения в таможенной статистике - student2.ru .

Предельная ошибка выборки при вероятности 0,95 по формуле (32): Тема 5. Ряды распределения в таможенной статистике - student2.ru = 1,96*0,133 = 0,261.

Доверительный интервал среднего числа нарушений в генеральной совокупности по формуле (35): Тема 5. Ряды распределения в таможенной статистике - student2.ru = 0,355 ± 0,261 или 0,094 Тема 5. Ряды распределения в таможенной статистике - student2.ru Тема 5. Ряды распределения в таможенной статистике - student2.ru Тема 5. Ряды распределения в таможенной статистике - student2.ru 0,616 (нарушений), то есть среднее число нарушений по всей совокупности товаров, прошедших через таможенную границу, с вероятностью 0,95 лежит в пределах от 0,094 до 0,616 нарушений в 1 партии.

Найдем еще обобщающий показатель – долю выпущенных товаров без нарушений d (т.е. с числом нарушений X=0). Доля таких товаров в выборке по формуле (6) составила: Тема 5. Ряды распределения в таможенной статистике - student2.ru 24/31 = 0,774, или 77,4%.

Дисперсия этой доли по формуле (66) [2] составила:

Тема 5. Ряды распределения в таможенной статистике - student2.ru = 0,774*(1–0,774) = 0,175. (66)

Средняя ошибка выборки по формуле (33): Тема 5. Ряды распределения в таможенной статистике - student2.ru = Тема 5. Ряды распределения в таможенной статистике - student2.ru .

Предельная ошибка выборки при вероятности 0,95 по формуле (32): Тема 5. Ряды распределения в таможенной статистике - student2.ru = 1,96*0,075 = 0,147.

Доверительный интервал доли выпущенных товаров без нарушений в генеральной совокупности по формуле (36): d = 0,774 ± 0,147 или 0,627 Тема 5. Ряды распределения в таможенной статистике - student2.ru d Тема 5. Ряды распределения в таможенной статистике - student2.ru 0,921, то есть доля выпущенных товаров без нарушений по всей совокупности товаров, прошедших через таможенную границу, с вероятностью 0,95 лежит в пределах от 62,7% до 92,1%.

Этап 2. Данный ряд распределения не имеет смысла превращать в интервальный в виду очень малой вариации значений признака. Построив график этого распределения (полигон) – рис. 15, видно, что данное распределение не похоже на нормальное.

Тема 5. Ряды распределения в таможенной статистике - student2.ru

Рис. 15. Кривая распределения числа нарушений, выявленных таможенной инспекцией

Этап 3. Из структурных характеристик ряда распределения можно определить только моду: Мо = 0, так как по данным табл. 23 такое число нарушений чаще всего встречается (f=24).

Этап 4. По формуле (42) определим размах вариации: H = 3 – 0 = 3, что характеризует вариацию в 3 нарушения.

По формуле (44) найдем среднее линейное отклонение:

Тема 5. Ряды распределения в таможенной статистике - student2.ru.

Это означает, что в среднем число нарушений в выборке отклоняется от среднего числа нарушений на 0,55.

Среднее квадратическое отклонение рассчитаем не по формуле (46), а как корень из дисперсии, которая уже была рассчитана нами на 1-м этапе: Тема 5. Ряды распределения в таможенной статистике - student2.ru , тогда Тема 5. Ряды распределения в таможенной статистике - student2.ru , т.е. в изучаемом распределении наблюдается некоторое число выделяющихся нарушений (с большим числом нарушений, выявленных в одной проверке).

Поскольку квартили на предыдущем этапе не определялись, на данном этапе расчет среднего квартильного расстояния пропускаем.

Теперь рассчитаем относительные показатели вариации:

– относительный размах вариации по формуле (50): Тема 5. Ряды распределения в таможенной статистике - student2.ru = 3/0,355 = 8,45;

– линейный коэффициент вариации по формуле (51): Тема 5. Ряды распределения в таможенной статистике - student2.ru = 0,550/0,355 = 1,55;

– квадратический коэффициент вариации по формуле(52): Тема 5. Ряды распределения в таможенной статистике - student2.ru = 0,743/0,355 = 2,09.

Все расчеты на данном этапе свидетельствуют о значительных размере и интенсивности вариации нарушений, выявленных таможенной инспекцией.

Этап 5. Не имеет практического смысла расчет моментов распределения, так как видно из рис. 15, что в изучаемом распределении симметрия отсутствует вовсе, поэтому и расчет эксцесса также бесполезен.

Этап 6. Выдвинем гипотезу о соответствии изучаемого распределения распределению Пуассона[3], которое описывается формулой (67):

Тема 5. Ряды распределения в таможенной статистике - student2.ru , (67)

где P(X) – вероятность того, что признак примет то или иное значение X;

e = 2,7182 – основание натурального логарифма;

X! – факториал числа X (т.е. произведение всех целых чисел от 1 до X включительно);

a = Тема 5. Ряды распределения в таможенной статистике - student2.ru – средняя арифметическая ряда распределения.

Из формулы (67) видно, что единственным параметром распределения Пуассона является средняя арифметическая величина. Порядок определения теоретических частот этого распределения следующий:

1) рассчитать среднюю арифметическую ряда, т.е. = a;

2) рассчитать e–a;

3) для каждого значения X рассчитать теоретическую частоту по формуле (68):

Тема 5. Ряды распределения в таможенной статистике - student2.ru . (68)

Поскольку a = Тема 5. Ряды распределения в таможенной статистике - student2.ru = 0,355 найдем значение e – 0,355 =0,7012. Затем, подставив в формулу (68) значения X от 0 до 3, вычислим теоретические частоты:

m0 = Тема 5. Ряды распределения в таможенной статистике - student2.ru (т.к. 0! = 1); m1 = Тема 5. Ряды распределения в таможенной статистике - student2.ru ;

m2 = Тема 5. Ряды распределения в таможенной статистике - student2.ru ; m3 = Тема 5. Ряды распределения в таможенной статистике - student2.ru .

Полученные теоретические частоты занесем в 5-й столбец табл. 23 и построим график эмпирического и теоретического распределений (рис. 16), из которого видна близость эмпирического и теоретического распределений.

Тема 5. Ряды распределения в таможенной статистике - student2.ru

Рис. 16. Эмпирическая и теоретическая (распределение Пуассона) кривые распределения

Проверим выдвинутую гипотезу о соответствии изучаемого распределения закону Пуассона с помощью критериев согласия.

Рассчитаем значение критерия Пирсона χ2 по формуле (62) в 6-м столбце табл. 23: χ2 =5,479, что меньше табличного (Приложение 7) значения χ2табл=5,9915 при уровне значимости α = 0,05 и числе степеней свободы ν=4–1–1=2, значит с вероятностью 0,95 можно говорить, что в основе эмпирического распределения лежит закон распределения Пуассона, т.е. выдвинутая гипотеза не отвергается, а расхождения объясняются случайными факторами.

Определим значение критерия Романовского по формуле (64):

Тема 5. Ряды распределения в таможенной статистике - student2.ru = 1,74 < 3, что подтверждает несущественность расхождений между эмпирическими и теоретическими частотами.

Для расчета критерия Колмогорова в последних трех столбцах таблицы 23 приведены расчеты накопленных частот и разностей между ними, откуда видно, что в 1-ой группе наблюдается максимальное расхождение (разность) D = 2,3. Тогда по формуле (65): Тема 5. Ряды распределения в таможенной статистике - student2.ru . По таблице Приложения 6 находим значение вероятности при λ = 0,4: P = 0,9972 (наиболее близкое значение к 0,413), т.е. с вероятностью, близкой к единице, можно говорить, что в основе эмпирического распределения величины нарушений, выявленных таможенной инспекцией, лежит закон распределения Пуассона, а расхождения эмпирического и теоретического распределений носят случайный характер.

Контрольные задания

На основе условных ранжированных данных таблицы 24, которые получены с помощью случайного выборочного наблюдения на 50 таможенных постах за отчетный период, провести анализ вариации (6 этапов) величины таможенных сборов (тыс. руб.) с товаров, перемещенных через таможенную границу, собранных таможенными постами.

Таблица 24. Распределение вариантов для выполнения контрольного задания

№ п/п Вариант   № п/п Вариант
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Контрольные вопросы

1. Понятие вариации и ее причины, виды рядов распределения.

2. Выборочный ряд распределения и расчет его обобщающих характеристик.

3. Построение ранжированного ряда распределения.

4. Построение интервального ряда распределения и его графиков.

5. Структурные характеристики ряда распределения.

6. Показатели размера и интенсивности вариации.

7. Моменты распределения и показателей его формы.

8. Нормальное распределение и распределение Пуассона, расчет их частот.

9. Критерии согласия.


Наши рекомендации