Среднее значение альтернативного признака

Среднее значение альтернативного признака - student2.ru .

Дисперсия альтернативного признака

Среднее значение альтернативного признака - student2.ru .

Предельное значение вариации альтернативного признака равно 0,25; оно получается при р = q = 0,5.

Показатели формы распределения

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму). В практике статистических исследований приходится встречаться с самыми различными распределениями. Однородные совокупности характеризуются, как правило, одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности. В этом случае необходима перегруппировка данных с целью выделения более однородных групп.

Обобщающие характеристики (показатели) центра распределения и степени вариации на дают представления о форме распределения, так как не вскрывают характера изменения частот.

Для выражения особенностей формы распределения применяются ранговые характеристики, показатели дифференциации, асимметрии и эксцесса, кривые распределения.

Ранговые характеристики - варианты, занимающие в ранжированном вариационном ряду определенное место. К их числу относятся квартили (Q), децили (D), перцентили (Р).

Расчет квартилей и их практическое использование даны при рассмотрении показателей вариации.

Децили- значения признака, которые делят ранжированный ряд на десять равных по численности частей.

Перцентили- значения признака, делящие ранжированный ряд на 100 равных частей.

Расчет децилей и перцентилей выполняется аналогично исчислению квартилей.

Так, при расчете децилей сначала определяют место девяти децилей:

Среднее значение альтернативного признака - student2.ru ; Среднее значение альтернативного признака - student2.ru ; … Среднее значение альтернативного признака - student2.ru ,

где п - общее число единиц в совокупности.

В дискретном ряду по накопленным частотам определяют численные значения децилей.

В интервальном ряду сначала определяют интервал, в котором лежит дециль. Ее численное значение определяют по формуле:

Среднее значение альтернативного признака - student2.ru ,

где XD - нижняя граница интервала, в котором находится дециль;

i - величина интервала;

ND - место децили;

sd-1 - накопленная частота интервала, предшествующего тому, в котором находится дециль;

fD - частота интервала, в котором находится дециль.

Анализ вариационного ряда дополняется расчетом показателя дифференциации.

По ряду распределения определяется коэффициент децильной дифференциации по формуле:

Среднее значение альтернативного признака - student2.ru ,

где D9 - девятая дециль;

D1 — первая дециль.

Он показывает, во сколько раз наименьший уровень признака из 10% единиц, имеющих наибольший уровень признака, больше наибольшего уровня признака, из 10% единиц совокупности, имеющих наименьший уровень признака.

По первичным данным исчисляется коэффициент фондовой дифференциации по формуле:

Среднее значение альтернативного признака - student2.ru ,

где Среднее значение альтернативного признака - student2.ru — средний уровень признака из 10% наибольших значений

признака;

Среднее значение альтернативного признака - student2.ru - средний уровень признака из 10% наименьших значений признака.

Для сравнительного анализа степени асимметрии нескольких распределений рассчитывается относительный показатель асимметрии (AS):

Среднее значение альтернативного признака - student2.ru .

Величина показателя асимметрии АS может быть положительной и отрицательной. Положительная величина показателя асимметрии указывает на наличие правосторонней асимметрии. Отрицательный знак показателя асимметрии говорит о наличии левосторонней асимметрии. Чем больше абсолютная величина коэффициента, тем больше степень скошенности. Принято считать, что если коэффициент асимметрии меньше 0,25, то асимметрия незначительная, если свыше 0,5, то асимметрия значительная.

Другой показатель асимметрии, предложенный шведским математиком Линдбергом, исчисляется по формуле

Среднее значение альтернативного признака - student2.ru ,

где П — процент тех значений признака, которые превышают величину

средней арифметической;

50 — процент вариант, превосходящих среднюю арифметическую ряда нормального распределения.

Наиболее распространенным является показатель асимметрии, исчисляемый по формуле

Среднее значение альтернативного признака - student2.ru ,

где mъ - центральный момент третьего порядка;

Этот показатель асимметрии не только определяет степень асимметрии, но и указывает на наличие или отсутствие асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, рассчитываемой по формуле

Среднее значение альтернативного признака - student2.ru ,

где п - число наблюдений.

Если Среднее значение альтернативного признака - student2.ru , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным.

Если Среднее значение альтернативного признака - student2.ru , асимметрия несущественна, ее наличие объясняется влиянием случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности):

Среднее значение альтернативного признака - student2.ru ,

где m4 - центральный момент четвертого порядка.

Среднее значение альтернативного признака - student2.ru .

Эксцесс может быть положительным и отрицательным. У высоковершинных распределений показатель эксцесса имеет положительный знак (+), а у низковершинных — отрицательный знак (-). Предельным значением отрицательного эксцесса является значение Ех = - 2; величина положительного эксцесса является величиной бесконечной. В нормальном распределении Среднее значение альтернативного признака - student2.ru . Следовательно, для нормального закона Ех = 0.

Средняя квадратическая ошибка эксцесса исчисляется по формуле

Среднее значение альтернативного признака - student2.ru ,

где п - число наблюдений.

Для приближенного определения величины эксцесса может быть использована формула Линдберга:

Ех = П - 38,29,

где П - процент количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в ту и другую сторону от величины средней);

38,29 - процент количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения, в общем количестве вариант ряда нормального распределения.

Кривые распределения

Наиболее надежный путь выявления закономерностей распределения - увеличение количества наблюдений. По мере увеличения количества наблюдений (в пределах той же однородной совокупности) при одновременном уменьшении величины интервала закономерность, характерная для данного распределения, будет выступать все более и более ясно, а представляющая полигон частот ломаная линия будет приближаться к некоторой плавной линии и в пределе должна превратиться в кривую линию.

Кривая линия, которая отражает закономерность изменения частот в чистом, исключающем влияние случайных факторов виде, называется кривой распределения.

В настоящее время изучено значительное число различных форм распределений. В практике статистических исследований часто используется распределение Пуассона, Максвелла, особенно нормальное распределение. Распределения близкие к нормальному распределению, были обнаружены при изучении самых различных явлений в природе, так и в развитии общества.

В статистической практике большой интерес представляет решение вопроса о том, в какой мере можно считать полученное в результате статистического наблюдения распределение признака в исследуемой совокупности, соответствующее нормальному распределению.

Для решения этого вопроса следует рассчитать теоретические частоты нормального распределения, т.е. те частоты, которые были бы, если бы данное распределение в точности следовало закону нормального распределения. Для расчета теоретических частот применяется следующая формула:

Среднее значение альтернативного признака - student2.ru ,

Величина Среднее значение альтернативного признака - student2.ru определяется по специальной таблице (см. приложение 1).

Следовательно, в зависимости от величины t для каждого интервала эмпирического ряда определяются теоретические частоты.

Для проверки близости теоретического и эмпирического распределений используются специальные показатели, называемые критериями согласия. Наиболее распространенным является критерий согласия К. Пирсона Среднее значение альтернативного признака - student2.ru («хи-квадрат»), исчисляемый по формуле

Среднее значение альтернативного признака - student2.ru ,

где f- эмпирические частоты (частости) в интервале;

f¢ - теоретические частоты (частости) в интервале.

Полученное значение критерия ( Среднее значение альтернативного признака - student2.ru ) сравнивается с табличным значением ( Среднее значение альтернативного признака - student2.ru ). Последнее определяется по специальной таблице (см. приложение 2) в зависимости от принятой вероятности (Р) и числа степеней свободы k (для нормального распределения k равно числу групп в ряду распределения минус 3).

Если Среднее значение альтернативного признака - student2.ru , то гипотеза о близости эмпирического распределения к нормальному не отвергается.

При расчете критерия Пирсона необходимо соблюдать условия: число наблюдений должно быть достаточно велико ( Среднее значение альтернативного признака - student2.ru ); если теоретические частоты в некоторых интервалах меньше 5, то интервалы объединяют так, чтобы частоты были больше 5.

Используя величину Среднее значение альтернативного признака - student2.ru , В. И. Романовский предложил оценивать близость эмпирического распределения кривой нормального распределения по отношению

Среднее значение альтернативного признака - student2.ru ,

где m - число групп;

т - 3 - число степеней свободы при исчислении частот нормального распределения.

Если Среднее значение альтернативного признака - student2.ru , то можно принять гипотезу о нормальном характере эмпирического распределения.

Распространенным критерием согласия является критерий А. Н. Колмогорова:

Среднее значение альтернативного признака - student2.ru ,

где D – максимальное значение разности между накопленными эмпирическими и теоретическими частотами;

п – сумма эмпирических частот.

По таблице значений вероятностей l-критерия находят соответствующую вероятность (Р). Если найденной величине l соответствует значительная по величине вероятность (Р), то расхождения между эмпирическим и теоретическим распределениями несущественны.

Практическое и научное значение имеет распределение Пуассона.Оно характерно для редко встречающихся явлений, поэтому его называют «законом редких явлений» (или «законом малых чисел»).

Закон Пуассона применяется для совокупностей, достаточно больших по объему (п ³ 100) и имеющих достаточно малую долю единиц, обладающих данным признаком (р ≤ 0,1), например для распределения партий готовой продукции по числу забракованных изделий, печатных страниц по числу опечаток, станков по числу отказов, ткацких станков по числу обрывов нити и т. д.

Теоретические частоты распределения Пуассона определяются формулой

Среднее значение альтернативного признака - student2.ru ,

где п - общее число независимых испытаний;

λ - среднее число появления редкого события в п одинаковых независимых испытаниях;

т - частота данного события (т = 0, 1, 2 ...);

е - основание натуральных логарифмов, е = 2,71828.

Величина Среднее значение альтернативного признака - student2.ru определяется по специальной таблице (приложение 8); m! - произведение 1 • 2 • 3... • т; 0! - считается равным единице.

Степень расхождения теоретических и эмпирических частот оценивается с помощью критериев согласия.

Решение типовых задач

1. По приведенным ниже данным о квалификации рабочих цеха требуется:

1) построить дискретный ряд распределения;

2) дать графическое изображение ряда;

3) вычислить показатели центра распределения, показатели
вариации и формы распределения.

Тарифные разряды 24 рабочих цеха: 4; 3; 6; 4; 4; 2; 3; 5; 4; 4; 5; 2; 3; 4; 4; 5; 2; 3; 6; 5; 4; 2; 4; 3.

Решение

1. Дискретный ряд распределения имеет вид (табл. 3).

Таблица 3

Наши рекомендации