Тема 10. Изучение связи статистических показателей
1. Методы корреляционно - регрессионного анализа связей показателей правовой деятельности.
Наиболее разработанной в теории статистики является методология парной корреляции, рассматривающая влияние вариации факторного признака х на результативный у.
В основу выявления и установления аналитической формы связи положено применение в анализе исходной информации математических функций. При изучении связей показателей применяются уравнения прямолинейной и криволинейной связи:
прямолинейная -
полулогарифмическая-
показательная -
степенная-
параболическая -
гиперболическая -
Решение математических уравнений связи предполагает вычисление по исходным данным их параметров. Это осуществляется способом выравнивания эмпирических данных методом наименьших квадратов. В основу этого метода положено требование минимальности сумм квадратов отклонений импирических данных у, от выровненных :
Применительно к совокупности у которых п< 30 для проверки типичности параметров уравнения регрессии используется t - критерий Стьюдента. При этом вычисляется фактические значения t - критерия:
для параметра :
для параметра :
где - среднеквадратическое отклонение результативного признака от выровненных значений .
- среднеквадратическое отклонение факторного признака от общей средней .
Полученные факторные значения и сравнивают с критерием t , которые получают по таблице Стьюдента с учетом принятого уровня значимости а и числа степеней свободы k . Полученные в анализе корреляционной связи параметры уравнения регрессии признаются типичными, если t фактическое больше t критического:
Проверка параметрической значимости синтезированных в корреляционно-регрессионном анализе математических моделей осуществляется по средствам показателей тесноты связей между признаками х и у . Для статистической оценки тесноты связи применяются следующие показатели вариации:
Общая дисперсия результативного признака , отображающая совокупность слияния всех факторов:
2. Факторная дисперсия результативного признака отображающая вариацию y только от воздействия изучаемого фактора х:
В формуле отклонения характеризуют колеблемость выравненных значений от их общей средней величины .
3.Остаточная дисперсия , отображающая вариацию результативного признакам от всех прочих, кроме х, факторов:
В формуле отклонения характеризуют колеблимость имперических (фактических) значений результативного признака у от всех выравненных значений
Соотношение между факторной и общий дисперсиями характеризует меру тесноты связи между признаками х и у:
R2 - называется индексом детерминации, который показывает какая часть общей вариации результативного признака y объясняется изучаемым фактором х
На основа «Правила сложения дисперсий» получим формулу индекса корреляции, которая имеет следующий вид:
При прямолинейной форме связи показатель тесноты связи определяется по формуле линейного коэффициента корреляции r:
Линейный коэффициент корреляции r равен индексу корреляции R только при прямолинейной связи.
Для оценки значимости коэффициента корреляции r применяется t - критерий Стьюдента. При этом определяется фактическое значение критерия :
Вычисленные по данной формуле значения сравнивается с критерием , который берется из таблицы значений t Стьюдента с учетом заданного уровня значимости а и числа степеней свободы к. Если > , то величина коэффициента корреляции признается существенной.
Для оценки значимости индекс корреляции R применяется F- критерий Фишера. Фактическое значение критерия определяется по формуле:
где m - число параметров уравнения регрессии.
Величина сравнивается с критерием значимости , которые определяются по таблице F-критерия с учетом принятого уровня значимости а и числа степеней свободы
и
Если > , то величина индекса корреляции признается существенной .
В статистический совокупности большого объема вместо таблицы распределения Стьюдента пользуются таблицей интеграла Лапласа. При уровне значимости а = 0,05 табличная величина t=2.
По значению показателя тесноты связи можно по средством t - критерия произвести оценку значимости коэффициента регрессии :
Сравнивая исчисленное по данной формуле значение с табличным , получают заключение о существенности основного параметра уравнения связи - коэффициента регрессии .
Потребности социальной практики требуют разработки методов количественного описания социальных процессов, позволяющих точно регистрировать не только количественные, но и качественные факторы.
Тенденция к использованию статистических методов в социальных исследований вызвала к жизни, ряд специфических проблем, в частности проблему измерение тесноты связи.
При исследовании степени тесноты связи между качественными признаками, каждый из которых представлен в виде альтернативных признаков, возможно использование «тетрахорических показателей». Тогда расчетная таблица состоит из четырех ячеек, обозначаемых буквами а, Ь, с, d Каждая из клеток соответствует известной альтернативе того или другого признака.
Таблица 8.
Да | Нет | |
Да | а | b |
Нет | с | d |
Для такого ряда таблиц построен ряд показателей: коэффициент ассоциации Д. Юла и коэффициент контингенции К. Пирсона.
Коэффициент ассоциации определяется по формуле
где a, b,c,d- коэффициенты четырехклеточной таблицы
В тех случаях, когда один из показателей четырехклеточной таблицы отсутствует, величина коэффициента ассоциации будет равна единице. Коэффициент контингенции, определяется по формуле :
где a, b,c,d- коэффициенты четырехклеточной таблицы.
Коэффициент контингенции изменяется от +1 до -1, но всегда меньше коэффициента ассоциации.
Для определения тесноты связи как между количественными, так и качественными признаками при условии, что значения этих признаков могут быть упорядочены или проранжированы по степени убывания или возрастания признака, может быть использован коэффициент Спирмена, который рассчитывается но следующей формуле:
где -квадраты разности рангов, связанных величинами х и у,
N- число наблюдений (число пар рангов). Когда каждый из качественных признаков состоит из более чем двух групп, то для определения тесноты связи можно применить коэффициент взаимной сопряженности К. Пирсона и А. А. Чупрова. Коэффициент К. Пирсона вычисляется по формуле:
где - показатель взаимной сопряженности.
Достаточно высокое значение С указывает на наличие связи между исследуемыми признаками.
Коэффициент взаимной сопряженности А. А. Чупрова вычисляется по формуле:
где - число групп по колонкам;
- число групп по строкам.
Он изменяется от 0 до 1.Для качественной оценки тесноты связи можно воспользоваться таблицей (по шкале Четдока:
Показатель тесноты св язи | 0,1-0,3 | 0,3-0,5 | 0,5-0,7 | 0,7-0,9 | 0,9-0,99 |
Характеристика силы связи | слабая | умеренная | заметная | высокая | весьма высокая |
Контрольные задания.
Задание №1 Исследуйте корреляционную зависимость между ростом человека и размером обуви по следующим сведениям:
Рост,см | ||||||||||
Размер обуви |
Задача №2. Определите тесноту связи между среднечасовой выработкой рабочего и количеством рабочих дней в месяце, исходя из следующий данных:
часовая выработка рабочего | ||||||||||||
количество рабочих дней |
Задача № З.Исследуйте корреляционную зависимость между ростом человека и длиной его шага по приведенным данным:
Рост, см | ||||||||||
Длина шага,см |
Задача № 4.0пределите тесноту связи между воспитанием в семье и детской преступностью по результатам обследования 400 семей.
Воспитание в семье | Преступность | ||
подвергались приводу | не подвергались приводу | всего | |
Занимаются | |||
Не занимаются | |||
Итого |
Задача № 5.Определите коэффициент корреляции, характеризующий тесноту связи между производственной мощностью и себестоимостью продукции, исходя из следующих данных:
Производительность в год, тыс.т | ||||||||
Себестоимость 1т, руб. |
Задача № 6. Имеется информация по данным статистической отчетности о работе пятнадцати судей (количество рассмотренных под их председательством уголовных дел и процент приговоров, не подвергнутых изменению или отмене). Необходимо оценить характер и тесноту связи между загруженностью суда и качеством судопроизводства (см.ниже).
Для оценки связи между показателями определите коэффициент корреляции рангов (Спирмена). Поясните значение исчисленного статистического показателя;
Кол-во рассмотренных дел | ||||||||||||||
% приговоров оставшихся не отмененными и неизмененными | ||||||||||||||
Задача № 7. При изучении характеристики лиц, совершивших присвоение вверенного имущества в России до 2004 г., получены следующее данные по социальной принадлежности и полу:
Социальная принадлежность | Мужчины | Женщины | Итого |
Рабочие | |||
Служащие | |||
Итого: |
Для оценки связи между показателями определите:
1. Коэффициент ассоциации.
2. Коэффициент контингенции. Поясните значение вычисленных статистических показателей.
Задача № 8.Имеется информация об осужденных по приговорам, вступившим в законную силу, по отдельным видам преступлений и социальной принадлежности:
Виды преступлений | Социальная принадлежность | ||||
Рабочие | Служащие | Колхозники | Учащиеся | Итого | |
Разбои | |||||
Грабежи | |||||
Вымогательства | |||||
Кражи | |||||
Итого: |
Для определения тесноты связи между видами преступлений и социальной принадлежностью преступников определите коэффициент взаимной сопряженности К.Пирсона и А.А.Чупрова.
Задача № 9 . При контрольной проверке качества поступившей в торговлю партии товара получены следующие данные об удельных весах стандартной продукции по категориям:
Категория продукции | Удельный вес, % | Итого | |
Стандартная продукция | Нестандартная продукция | ||
Высшая | |||
Первая | |||
Вторая | |||
Итого: |
Для определения тесноты связи между категорией продукции и ее качеством найдите коэффициент взаимосвязи К.Пирсона и А.А.Чупрова. Поясните значение исчисленных показателей.
Задача № 10. Получена следующая информация по магазинам торговой ассо-циации за отчетный период:__
Номер магазина | Товарооборот | Издержки обращения |
98,2 | 6,5 | |
57,6 | 4,6 | |
26,3 | 2,6 | |
64,5 | 5,2 | |
43,1 | 3,8 | |
11,9 | 1,9 | |
35,4 | 3,3 | |
8,6 | 1,2 | |
76,7 | 5,6 | |
82,4 | 5,3 |
Для оценки связи между показателями объема товарооборота и суммой издержек обращения определите коэффициент корреляции рангов (Спирмена).
Поясните значение исчисленного статистического показателя.
Задача № 11. Определите коэффициент корреляции, характеризующий тесноту связи между производственной мощностью и себестоимостью продукции, исходя из следующих данных:
Производительность | ||||||||
Себестоимость 1т.р.уб |
Задача №12. Имеются следующие данные о стаже работы (лет,х )рабочих одного из заводов и выработке одного рабочего за смену (штук,y)
X | |||||||||||
Y |
Считая, что связь линейная, исчислить уравнение корреляционной связи между стажем работы и выработкой, а также линейный коэффициент корреляции. Изобразить зависимость графически.
Задача №13. По отчетам десяти мясокомбинатов за один месяц получены следующие данные о живом весе забитого крупного рогатого скота и количестве полученного мяса-говядины:
Номер мясокомбината | ||||||||||
Живой вес забитого скота, т | ||||||||||
Валовая продукция говядины, т |
Вычислить:
1) уравнение корреляционной связи между живым весом забитого скота и валовой продукцией говядины, а также линейный коэффициент корреляции;
2) изобразить зависимость графически.
Задача №14. Для определения скорости износа резца на металлорежущем станке через некоторые интервалы были проведены измерения толщины резца. Результаты этих измерений помещены в следующей таблице:
Номер измерения | ||||||||||
Время работы резца, час | ||||||||||
Толщина резца, мм | 30,0 | 28,8 | 28.3 | 27.9 | 36.9 | 26,4 | 26,2 | 25,0 | 24.8 | 23,7 |
1) Найти корреляционное уравнение связи между временем работы и толщиной резца;
2) построить график этой корреляционной связи;
3) вычислить коэффициент корреляции.
Задача №16. По десяти животноводческим фермам имеются следующие данные о валовой продукции молока и об издержках, связанных-с его производством за год:
Номер фермы | ||||||||||
Валовая продукция, т | ||||||||||
Общие издержки на про изводство, млн.руб. |
1. Найти уравнение корреляционной связи между валовой продукцией и общими издержками на производство молока.
2. Вычислить линейный коэффициент корреляции.
3. Заданные и выровненные показатели изобразить графически.
Задача №17. На крахмально-паточном заводе проведены испытания масляного фильтр пресса с целью определения скорости фильтрации масла в зависимости
Номер испытания | И | ||||||||||
Температура масла | |||||||||||
Скорость фильтрация, мл на 1 м2/мин. |
1. Найти уравнение прямолинейной корреляционной связи для скорости фильтрации от температуры масла.
2. Вычислить коэффициент корреляции.
3. Построить график корреляционной связи.