Статистическое изучение связей социально-экономических явлений
Статистические показатели находятся между собой в определенных соотношениях. Знание характера и силы связей позволяет управлять социально-экономическими процессами и предсказывать их развитие.
Связь между количественными показателями признаков может быть функциональной и стохастической.
Связь между переменными является функциональной, когда определенному значению одной переменной строго соответствует одно или несколько значений другой переменной функциональные связи в статистике изучаются с помощью индексного метода.
Уравнение функциональной связи:
,
где – результативный признак; – известная функция связи результативного и факторного признаков; – факторный признак.
В области массовых социально-экономических явлений количественная закономерность чаще проявляется как зависимость распределения значений результативного признака от значений признаков-факторов и называются стохастическими.
Корреляционная связь является частным случаем стохастической связи.
При корреляционной связи, в отличие от функциональной, обычно не известен ни полный перечень всех признаков-факторов, влияющих на результативный признак, ни точный механизм их взаимосвязи.
На практике часто анализ начинают с расчета коэффициента корреляции (ч): при ; ; .
Коэффициент корреляции r может принимать значения от –1 до +1,
при r = 1 – функциональная прямая зависимость;
при r = 0 – отсутствует линейная зависимость;
при r = –1 – обратная связь функциональная.
Изменение r от 0 к 1 характеризует степень приближения корреляционной зависимости в изменении у и х к функциональной (линейной).
Между линейным коэффициентом корреляции и коэффициентом регрессии существует связь:
,
где – коэффициент регрессии в уравнении связи.
– уравнение связи.
Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (результата) обусловлено влиянием факторных величин (одной или множеством).
Уравнение регрессии: .
В случае зависимости между двумя признаками для измерения тесноты связи применяют эмпирическое и теоретическое корреляционное отношение.
Эмпирическое корреляционное отношение характеризует степень приближения связи к функциональной и определяется по формуле
,
где – межгрупповая дисперсия; σ2 – общая дисперсия.
Теоретическое корреляционное отношение (индекс корреляции) определяется по формуле
,
где – остаточная дисперсия, которая отражает вариацию у за счет всех факторов, кроме х.
РЕШЕНИЕ ТИПОВОЙ ЗАДАЧИ
Задача 1
Имеются данные по десяти однородным предприятиям:
Номер предприятия | ||||||||||
Электровооруженность труда на 1 работающего, тыс. дол. | ||||||||||
Выпуск готовой продукции на 1 работающего, тыс. дол. |
Определить параметры уравнения связи и линейный коэффициент корреляции.
Решение:
Из таблицы видно, что зависимость электровооруженности труда с выпуском продукции на одного работника – линейная и выражается уравнением прямой
,
где ух – выпуск готовой продукции на 1 работника; х – электровооруженность труда на 1 работника; а0 и а1 – параметры уравнения регрессии.
Параметры уравнения прямой а0, а1определяются путем решения системы нормальных уравнений, полученных по методу наименьших квадратов:
(1)
а также по следующим формулам: ; .
Для определения параметров уравнения регрессии строим расчетную таблицу:
№ завода | Электровооруженность труда на 1 работающего, КВт/ч, х | Выпуск готовой продукции на 1 работающего, тыс. дол. у | ||||
3,61 | ||||||
6,0 | ||||||
4,41 | ||||||
7,59 | ||||||
3,61 | ||||||
6,80 | ||||||
5,20 | ||||||
9,19 | ||||||
8,38 | ||||||
5,20 | ||||||
Итого | 60,0 | |||||
в среднем |
Подставим фактические данные из таблицы в систему (1) нормальных уравнений и получим:
10а0 + а150 = 60, (1)
50а0 + 304а1 = 343. (2)
Решаем систему нормальных уравнений и умножаем каждый член первого уравнения на 5 и получаем:
50а0 + 250а1 = 300
50а0 + 304а1 = 343.
Вычитаем из второго уравнения первое и получаем 43 = 54а1, отсюда .
Подставляем значение а1 в уравнение (1)
10а0 + 50а1 = 60
10а0 + 50 ∙ 0,7963 = 60
.
Уравнение корреляционной связи примет вид:
ух = 2,02 + 0,796х.
Параметры уравнения регрессии можно определить и по формулам:
,
.
После определения параметров уравнения регрессии рассчитаем теоретическую линию регрессии ух путем подстановки значений х в уравнения корреляционной связи:
у1 = 2,02 ∙ 0,796 ∙ 2 = 3,61
у2 = 2,02 ∙ 0,796 ∙ 5 = 6,0 и т. д.
Если параметры уравнения определены правильно, то .
И окончательно проверку правильности расчета параметров уравнения связи произведем подстановкой а0 и а1 в систему (1) нормальных уравнений:
10 ∙ 2,02 + 0,796 ∙ 50 = 60,
2,02 ∙ 50 + 0,796 ∙ 304 = 343.
Используя уравнение корреляционной связи ух = а0 + а1х1, можно определить теоретическое значение ух для любой промежуточной точки (теоретическое значение выпуска готовой продукции на 1 работника для любого значения электровооруженности труда на 1 работающего).
Коэффициент регрессии а1 уточняет связь между х и у. Он показывает, на сколько единиц увеличивается результативный признак при увеличении факторного признака на единицу. И в нашем примере а1 =0,796. Это значит, что при увеличении электровооруженности труда на 1 работающего на 1 кВт/ч выпуск продукции увеличится на 0,796 тыс. дол.
А сейчас из данных расчетной таблицы рассчитаем линейный коэффициент корреляции по формуле: и по формуле: .
Вывод: r приближается к 1 – связь линейная.
ЗАДАЧИ ДЛЯ РЕШЕНИЯ
Задача 1
По десяти однородным семьям имеются следующие данные о доходах и расходах на промышленные товары за месяц:
Номер семьи | ||||||||||
Доход на душу, дол. | ||||||||||
Расходы на промышленные товары, дол. |
Найти уравнение корреляционной связи между доходами и расходами на промышленные товары (связь линейная). Проанализировать параметры уравнения связи. Изобразить корреляционную связь на графике.
Задача 2
На основе выборочных данных о деловой активности однотипных коммерческих структур оценить тесноту связи между прибылью (у) и затратами на 1 рубль продукции (х).
№ коммерческих структур | Прибыль, млн р. (у) | Затраты на 1 р. продукции (х) |
Итого: | ||
Средние показатели | 744,33 | 83,67 |
Задача 3
По данным о стоимости оборудования х и производительностью труда у методом наименьших квадратов получено уравнение: .
Объясните, что это означает.
Задача 4
Имеются следующие данные по 10 участкам о глубине вспашки – х (см) и величине урожая – у (ц/га):
х | ||||||||||
у | 9,0 | 8,5 | 9,2 | 9,6 | 9,4 | 10,5 | 11,2 | 10,8 | 11,0 | 11,5 |
Определите уравнение связи и линейный коэффициент корреляции.
Объясните смысл коэффициента регрессии.
ТЕСТЫ
1. Корреляционная связь – это:
а) жестко детерминированная связь между явлениями;
б) факторная связь;
в) это связь между величинами, при которой одна величина реагирует на другую;
г) признак, характеризующий следствие.
2. Балансовый вид взаимосвязей выражается:
а) ;
б) ;
в) ;
г) .
3. Эмпирическое корреляционное отношение, выражаемое формулой:
а) ;
б) ;
в) ;
г) .
4. Линейный коэффициент корреляции выражается формулой:
а) ;
б) ;
в) ;
г) .
Тема 11