Тема 5. АНАЛИЗ РЯДОВ РАСПРЕДЕЛЕНИЯ.
СТАТиСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
К ним от-носятся медиана ( ),мода ( ), квартили ( ), децили ( ) и пер-центили ( ) распределения.
- в ранжированном ряду с нечетным числом уровней медиана соответствует признаку с порядковым номером: , где n - объем совокупности.
- в ранжированном ряду с четным числом значений варьирующего признака ( ; ) за медиану условно принимают значение:
- в дискретном ряду распределения медиана соответствует варианте, для которой первая накопленная частота больше половины общего числа наблюдений;
- в интервальном ряду распределения медианным интервалом будет интервал, для которого первая накопленная частота больше половины объема совокупности, а сама медиана определяется по формуле: ,
где - нижняя граница медианного интервала; - величина медианного интервала; - частота медианного интервала; - накопленная частота до медианного интервала.
Мода
- в дискретном ряду – по максимальной частоте;
- в интервальном ряду модальный интервал определяется по максимальной частоте, а сама мода - по формуле:
,
где - нижняя граница модального интервала; - величина модального интервала; - частота модального интервала; - час-тота интервала, предшествующего модальному; - частота интервала, следующего за модальным.
Значения признака, делящие совокупность на четыре равные части, называются квартелями Q, Q2 = = М е. (Q1) (Q3) квартили определяются по следующим формулам: ; ,
где хQ1,хQ3- нижняя граница, соответственно, первого и третьего квартильных интервалов; hQ1, hQ3- величина соответствующего первого и третьего квартильных интервалов; fQ1, fQ3 - частота соотвествующих квартильных интервалов; - накопленная частота до первого квартильного интервала; - накопленная частота до третьего квартильного интервала.
Децили – варианты, делящие ряд распределения на десять равных частей. ; и т.д
коэффициент децильной дифференциации: ,
где d9 – девятая дециль, или девятый дециль; d1 – первая дециль, или первый дециль.
Он показывает, во сколько раз наименьший уровень признака из 10% признаков, имеющих наибольший уровень, больше наибольшего уровня признака из 10% единиц совокупности, имеющих наименьший уровень признака.
Более точной мерой степени дифференциации (или концентрации) является коэффициент Джини ( ): .
где fотн - доля частот i-той группы; - доля признака i-той груп-пы; - кумулятивная доля признака.
Показатели меры вариации.
Абсолютные показатели вариации:
1. Размах вариации: ,
где , - соответственно, наибольшее и наименьшее значение варьирующего признака.
2. Среднее линейное отклонение:
- простое; - взвешенное.
3. Дисперсия:
- простая; - взвешенная.
4. Среднее квадратическое отклонение:
- простое; - взвешенное.
Среднее квадратическое отклонение и среднее линейное отклонение – это обобщающие характеристики размеров вариации признака в совокупности, они выражаются в тех же единицах измерения, что и сам признак.
При сравнительно простых значениях признака используется упрощенный способ расчета дисперсии и среднего квадратического отклонения – метод разности средних: ; .
- по несгруппированным данным: ; ,
- по сгруппированным данным:
Относительные показатели вариации:
- Относительный размах вариации или коэффициент осцилляции (КR): ;
- Относительное линейное отклонение или линейный коэффициент вариации (К ): ;
- Коэффициент вариации (V): .
Виды дисперсий и их взаимосвязь.При проведении группировки изучаемой совокупности по факторному признаку (х) вариацию результативного признака ( у) можно оценить с помощью 3-х видов дисперсии:
- общей дисперсии ( );
- межгрупповой дисперсии ( );
- средней из внутригрупповых дисперсий ( ).
Общая дисперсия характеризует вариацию результативного признака под влиянием всех факторов, вызывающих эту вариацию и вычисляется по формуле: или ,
где - средняя по всей совокупности; - частоты, если по у построен вариационный ряд.
Межгрупповая дисперсия отражает вариацию результативного признака под воздействием фактора, положенного в основу группировки: ,
где - средняя результативного признака по каждой i-ой группе; - частота появления признака в i-ой группе; ; k -число групп.
Средняя из внутригрупповых дисперсий показывает вариацию результативного признака под воздействием всех факторов, кроме группировочного: ; ,
где - внутригрупповая дисперсия или дисперсия i-ой группе; .
Между видами дисперсий существует взаимосвязь, называемая правилом сложения дисперсий: = + .
Это правило используется в статистике для определения степени тесноты связи между изучаемыми признаками.
Для количественной оценки тесноты связи между явлениями на основе рассмотренных дисперсий вычисляют ряд показателей, которые будут рассмотрены далее в теме: “Статистические приемы выявления взаимосвязи между социально-экономическими явлениями”.