Методы стохастического факторного анализа
3.7.1. Корреляционно-регрессионный анализ
Выше указанные способы детерминированного факторного анализа используются для функциональных зависимостей, но не менее важную долю в экономических исследованиях занимают стохастические зависимости (корреляционные).
При проведении корреляционно-регрессионного анализа выявляется количественная оценка взаимосвязей между факторными и результативными признаками, выявляется наличие и характеристика взаимосвязи, а также направление и форма. Следует помнить, то применение корреляционной зависимости оправдано только в большой массе наблюдений, подчиняющихся закону нормального распределения. Для другого вида взаимозависимостей вероятностного характера оправдано применение непараметрических способов анализа.
Корреляционные связи не являются точными (жесткими) зависимостями, а эти зависимости носят соотносительный характер. Если знание функциональных зависимостей позволяет точно расcчитывать события, например, время восхода и захода солнца ежедневно, время наступления солнечных затмений с точностью до секунды, то при корреляционных связях при одном и том же значении учтенного факторного признака могут быть различные значения результата. Это объясняется наличием других, порой неучтенных факторов, которые действуют на изучаемые социально-экономические явления. Особенность корреляционных связей состоит в том, что их проявление можно заметить не в единичных случаях, а в массе случаев.
Для определения корреляционной связи показателей социально-экономической, финансовой и прочей деятельности необходимо решить две основные задачи:
1) проверить возможность существования взаимосвязи между изучаемыми показателями и придать выявленной взаимосвязи конкретную математическую форму зависимости;
2) установить количественные оценки тесноты взаимосвязи, т.е. силу влияния факторных признаков на результат.
Наиболее разработанными в статистике являются методы изучения парной корреляции, позволяющие определить влияние изменения факторного признака (х) на результативный (у). Чтобы отразить выявляемые взаимосвязи в аналитической форме прибегают к использованию математических функции в виде уравнения прямолинейной и криволинейной зависимости.
Для анализа прямолинейной зависимости применяется уравнение вида:
ух=а0+а1*х
Криволинейная зависимость анализируется с помощью математических функций параболы, гиперболы, показательной, степенной и др.
При анализе корреляционной зависимости между признаками “х” и “у” необходимо:
а) выявить вид функционального уравнения;
б) определить численное выражение их параметров;
в) осуществить проверку вычисленных параметров на их типичность;
г) произвести оценку практической ценности выявленной модели функционального уравнения;
д) определить в какой степени теснота корреляционной (соотносительной) связи между факторами и результатом отличается от функциональной (жесткой) зависимости, и.т.д.
Осуществить это можно путем применения метода группировок и корреляционно-регрессионного анализа влияния изменения (вариации) факторного признака “х” на результативный “у”.
Модель регрессии может быть построена как по индивидуальным значениям признака, так и по сгруппированным данным (таблица № 1). Для выявления связи между признаками по достаточно большому числу наблюдений используется корреляционная таблица на ее основе можно построить не только уравнение регрессии, но и определить показатели тесноты связи.
Искомые параметры уравнения связи находят с помощью способа наименьших квадратов, т.е. при условии что:
Ѕ= → min
Эти расчеты при даже очень большом объеме эмпирических данных с использованием компьютерных технологий, не представляет больших трудностей и времени.
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
;
где
n — объем исследуемой совокупности (число единиц наблюдения),
и – коэффициенты, и – свободные члены
В уравнениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр - коэффициент регрессии, который показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения. Для нахождения параметров системы нормальных уравнении используется метод определителей. Во-первых представим эту систему в матричном виде:
= =
Определители и получаются заменой свободными членами элементов соответственно первого ( ) и второго ( ) столбцов. Получаем таким образом:
= =
= =
=
=
Система нормальных уравнений для нахождения параметров полулогарифмической парной регрессии методом наименьших квадратов имеет следующий вид:
Аналогично находятся параметры системы уравнений:
При статистическом анализе не линейной корреляции связи возможно применение уравнения регрессии показательной функции:
.
Для решения уравнения производится его логарифмирование:
С учетом требований метода наименьших квадратов составляется система нормальных уравнений:
;
.
Применением к системе метода определителей устанавливаются алгоритмы расчета параметров уравнения:
;
.
Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. То есть необходимо сначала проверить параметры уравнения на типичность прежде, чем использовать полученную модель.
Если n (количество групп) меньше 30 то:
;
.
Параметры модели признаются типичными если:
где - это табличное значение, определяемое по распределению Стьюдента (t – распределение) обычно при вероятности α=0,05 и v=n-2.
Измерение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений.
Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции.
В практике применяются различные модификации формул расчета данного коэффициента:
,
Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:
Линейный коэффициент корреляции изменяется в пределах от –1 до +1. Знаки коэффициентов регрессии и корреляции совпадают.
Значимость линейного коэффициента корреляции проверяется на основе t – критерия Стьюдента:
Если расчетное значение (табличное), то гипотеза =0 отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а, следовательно, и свидетельствует о статистической существенности зависимости между факторами “х” и “у”.
Для характеристики степени тесноты связи по линейному коэффициенту корреляции используется шкала Чеддока:
Таблица 3.17
Характеристика силы связи по шкале Чеддока
Теснота связи | 0,1-0,3 | 0,3-0,5 | 0,5-0,7 | 0,7-0,9 | 0,9-0,99 |
Характеристика степени тесноты связи | слабая | заметная | умеренная | высокая | весьма высокая |
Частное от деления факторной (σ2ух) дисперсии на общую дисперсию (σ2у) представляет собой показатель (R), указывающий на меру тесноты связи между признаками “х” и “у”, при не линейных зависимостях.
R2= ; тогда R= =
Показатель R2 называется индексом детерминации, свидетельствующий насколько значение результативного признака обусловлено влиянием факторного. Чем ближе значение R2 к единице, тем сильнее зависимость.
Проверка адекватности всей модели осуществляется с помощью F – критерия Фишера и величины средней ошибки аппроксимации .
где m – число параметров уравнения (при и , т.е. m=2)
V1=n-m; V2=m-1.
Индекс корреляции считается типичным если
Значение средней ошибки аппроксимации, определяется по формуле, которая показывает степень влияния на изменение результативного признака неучтенных факторов. Если ошибка аппроксимации не превышает 12-15%, то с построенное уравнение регрессии можно использовать в экономических расчетах.
Расчет частных коэффициентов эластичности позволяет определить на сколько процентов изменяется результативный признак при изменении факторного признака на один процент.
Применение методов корреляционно-регрессионного анализа влияния вариации факторного показателя “x” на результативный “y” рассмотрим на конкретном примере.
Пример 32. Имеются данные о затратах на ремонт оборудования У (тыс.руб.) в подразделениях предприятия и сроке его эксплуатации Х.
Исследуем имеющиеся данные с помощью уравнения прямой и определим его параметры:
= = ≈-1,576
= = ≈0,611
Подставляя значения вычисленных параметров ( и ), в уравнение регрессии получаем:
Таблица 4.18
Расчет зависимости производительности труда работников от коэффициента сменности с помощью прямолинейной зависимости
Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Для этого сначала рассчитаем требующиеся параметры:
σ2у= = σу=1,48
σ2ху= = σху=1,31
σ2ε= = σε=0,69
2,19=1,72+0,47
σ2х= = σх=2,14.
На основании приведенных вычислений определяем фактические значения t – критерия.
= .
= .
Определим – табличное по распределению Стьюдента при уровне значимости α=0,05 t равно 2,306.
Наши расчеты показывают, что условие неравенства соблюдаются, следовательно параметры уравнения типичны.
Далее произведем оценку практической значимости синтезированной модели. Для прямолинейной связи это выполняется посредством расчета линейного коэффициента корреляции:
≈0,89.
Согласно шкалы Чеддока связь между факторным и результативным признаком высокая. Из значения =0,792 следует, что 79,2% общей вариации затрат на ремонт оборудования объясняется изменением факторного признака (сроком эксплуатации).
Значимость линейного коэффициента корреляции проверяется на основе t – критерия Стьюдента:
= ≈3,69
Þ
Так как расчетное значение , то связь между сроком эксплуатации оборудования и затратами на его ремонт, следует признать существенной. Поэтому синтезированная по уравнению математическая модель может быть использована для практических целей.
Использование полученной модели возможно при определении нормативной (плановой) суммы затрат на ремонт, при известном сроке эксплуатации оборудования.
Как правило, для выявления зависимости используется не одна, а несколько математических моделей, из которых выбирается наиболее адекватно описывающая исследуемую зависимость.
В таблице проведены расчеты для построения полулогарифмической функции: У=а0+а1 lg x
Подставляя значения вычисленных параметров ( и ), в уравнение регрессии получаем:
У=-4,903+9,217 lg x
Таблица 3.19
Расчет зависимости производительности труда работников от коэффициента сменности c помощью полулогарифмической зависимости
Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Для этого сначала рассчитаем требующиеся параметры:
σ2ε= = σε=0,83
На основании приведенных вычислений определяем фактические значения t – критерия.
= .
= .
Определим – табличное по распределению Стьюдента при уровне значимости α=0,05 t равно 2,306.
Наши расчеты показывают, что условие неравенства
16.7>2.306<67.2 соблюдаются, следовательно параметры уравнения типичны.
Далее произведем оценку практической значимости синтезированной модели. Для не линейной связи это выполняется посредством расчета индекса корреляции:
R2= ; тогда R= = =
Согласно шкалы Чеддока связь между факторным и результативным признаком высокая.
Проверим адекватность модели с помощью F – критерия Фишера и величины средней ошибки аппроксимации .
Индекс корреляции считается типичным если 17,3>5,32, так как условие выполняется, следовательно данную модель также возможно использовать в экономических расчетах.
Для того, чтобы выявить какая из рассчитанных моделей более точно описывает связь между затратами на ремонт оборудования и сроком его эксплуатации рассчитаем значение средней ошибки аппроксимации.
Для прямолинейной зависимости:
=0,1*2,16*100%=21,6%
Для полулогарифмической зависимости:
=0,1*2,52*100%=25,2%
Ошибка аппроксимации при прямолинейной зависимости ниже, чем при полулогарифмической зависимости, следовательно для расчетов лучше воспользоваться уравнением:
3.7.2. Непараметрические методы оценки связи
Для количественной характеристики многомерных связей социально-экономических явлений используется метод корреляционных плеяд, основанный на расчете непараметрических коэффициентов связи.
1. Коэффициент ассоциации и контингенции
Вспомогательная таблица для расчетов
а | в | а + в |
с | D | с + d |
а + с | в + d | а + в + с + d |
Если Ка > 0,5 или Кк > 0,3, то связь считается подтверждаемой.
Пример 33. С помощью данных об изготовлении качественной продукции рабочими предприятия определим коэффициенты ассоциации и контингенции
Таблица 3.20.
Данные об изготовлении качественной продукции рабочими предприятия
Качество изготовленной продукции | Прошли специальную подготовку | Не прошли специальную подготовку | Итого |
Высокое | |||
Низкое | |||
Всего |
Связь считается подтвержденной, если коэффициент ассоциации больше или равен 0,5, а коэффициент контингенции больше или равен 0,3.
2. Коэффициенты взаимной сопряженности Пирсона – Чупрова.
k1 и k2 - число значений (групп)
чем ближе значение коэффициентов к 1, тем сильнее связь.
Пример 34 Имеются данные о распределении рабочих предприятий по заработной плате и тарифному разряду.
Таблица 3.21
Сведения о распределении рабочих по размеру заработной платы
и тарифным разрядам
Тарифный Разряд | Заработная плата, руб. | ||||
3420-3460 | 3460-3490 | 3490-3510 | 3510-3530 | Итого | |
- - | |||||
Итого |
По данным таблицы вычислим коэффициенты взаимной сопряженности Пирсона и Чупрова.
Расчеты коэффициента Пирсона и Чупрова указывают на наличие умеренной связи между тарифным разрядом и размером заработной платы.
3. Ранговые коэффициенты связи.
- коэффициент Спирмена
n- число наблюдений
Rx, Ry - ранги значений фактов
- коэффициент Кендалла
S - сумма разностей между числом последовательностей и числом инверсий по второму признаку
Пример 35. При изучении зависимости производительности труда от коэффициента сменности рабочих по 10 предприятиям получены данные (табл.3.22.).
На основании данных таблицы 3.22. определим коэффициенты ранговой корреляции Спирмена и Кендалла. Составим таблицу рангов по показателям производительности труда и коэффициенту сменности.
Как показывают расчеты коэффициента Спирмена зависимость между коэффициентом сменности и производительностью труда работников слабая.
Рассчитаем на этом же примере коэффициент конкордации. Для этого необходимо выполнить следующие действия:
1) Составить ранжированный ряд фактора Х
2) Значения производительности труда (У) расставим соответственно значениям Х
3) Для расчета показателей рангов Р, следует определять количество значений у больше изучаемого значения
4) Для расчета показателей рангов Q, следует определять количество значений у меньших изучаемого явления.
Таблица 3.22.
Расчет ранговых коэффициентов связи
N | Производительность труда (у) | Коэффициент сменности (х) | Ранжирование | Сравнение рангов | di=Rx-Ry | di2 | ||
у | х | Rx | Ry | |||||
1. | 19,00 | 1,54 | 10,20 | 1,20 | ||||
2. | 18,00 | 1,42 | 10,50 | 1,26 | ||||
3. | 21,00 | 1,51 | 10,80 | 1,27 | ||||
4. | 21,50 | 1,50 | 11,00 | 1,28 | -1 | |||
5. | 22,00 | 1,37 | 18,00 | 1,30 | -4 | |||
6. | 19,10 | 1,28 | 19,00 | 1,37 | -3 | |||
7. | 10,50 | 1,27 | 19,10 | 1,42 | ||||
8. | 10,20 | 1,26 | 21,00 | 1,50 | ||||
9. | 11,00 | 1,30 | 21,50 | 1,51 | ||||
10. | 10,80 | 1,20 | 22,00 | 1,54 | -2 |
Таблица 3.23.
Расчет коэффициента корреляции Кендалла
Ранжированный коэффициент сменности (х) | Показатели производительности труда | Р | Q |
1,20 | 10,8 | ||
1,26 | 10,2 | ||
1,27 | 10,5 | ||
1,28 | 19,1 | ||
1,30 | 11,0 | ||
1,37 | 22,0 | ||
1,42 | 18,0 | ||
1,50 | 21,5 | ||
1,51 | 21,0 | ||
1,54 | 19,0 | ||
ИТОГО |
Коэффициент корреляции Кендалла указывает на умеренную зависимость между коэффициентом сменности и производительностью труда работников.
О наличии и направлении корреляционной связи между численными значениями факторного и результативного признаками можно судить по коэффициенту корреляции знаков предложенного немецким ученым Г.Фехнером.
Расчет этого коэффициента основан на степени согласованности направлений отклонений индивидуальных значений признаков Xi и Уi от их средних величин. Затем находят суммы совпадений и не совпадений знаков и определяют коэффициент Фехнера по формуле:
, где
nс – число совпадений знаков отклонений
nн – число несовпадений знаков отклонений
Коэффициент Фехнера принимает значения в пределах от –1 до +1. Отрицательное значение коэффициента свидетельствует об обратной зависимости, а положительное значение о прямой. Связь считается подтвержденной если значение данного коэффициента больше 0,5.
Пример 36.
На основе данных таблицы об энерговооруженности, фондовооруженности и производительности труда определим коэффициент корреляции знаков Фехнера.
Таблица 3.24.
Расчет коэффициента Фехнера
Номер предприятия | Энерговооруженность (х1) | Фондовооруженность (х2) | Производительность труда (у) | х1-х1ср | х2-х2ср | у-уср | х1у | х2у | х1х2 |
1. | 1,3 | 1,5 | -3,0 | -0,4 | -0,9 | С | С | С | |
2. | 1,5 | 2,0 | -2,0 | -0,2 | -0,4 | С | С | С | |
3. | 1,7 | 2,5 | 0,0 | 0,0 | 0,1 | С | С | С | |
4. | 1,7 | 2,6 | 0,0 | 0,0 | 0,2 | С | С | С | |
5. | 1,5 | 2,0 | -2,0 | -0,2 | -0,4 | С | С | С | |
6. | 1,2 | 1,2 | -3,0 | -0,5 | -1,2 | С | С | С | |
7. | 1,6 | 2,2 | 0,0 | -0,1 | -0,2 | Н | С | Н | |
8. | 2,0 | 3,0 | 3,0 | 0,3 | 0,6 | С | С | С | |
9. | 1,9 | 3,0 | 2,0 | 0,2 | 0,6 | С | С | С | |
10. | 2,6 | 4,0 | 5,0 | 0,9 | 1,6 | С | С | С | |
Итого | 17,0 | 24,0 | |||||||
в среднем | 1,7 | 2,4 |
Из расчета следует, что между энерговооруженностью и производительностью труда существует высокая прямо пропорциональная зависимость (0,8), весьма высокая зависимость сложилась между фондовооруженностью и производительностью труда (1,0). Исследование зависимости между факторными признаками также указывает на наличие высокой степени зависимости (энерговооруженность и фондовооруженность 0,8).
3.7.3. Дисперсионный анализ
В основу дисперсионного анализа положено выявление наличия и оценка существенности взаимосвязи между признаками путем сопоставления среднегрупповых величин. Этот вид анализа часто применяют совместно с аналитической группировкой. При дисперсионном анализе данные разделяются на группы по численным значениям признака-фактора. Затем вычисляются значения средних величин результативного признака в группах и считается, что различия в их значениях зависят от различий только факторного признака. Задача состоит в оценке существенности квадратов отклонений между средними значениями полученных результатов в группах, то есть по показателю эмпирического корреляционного отношения:
,где
d2х-межгрупповая дисперсия
s2 – общая дисперсия
Эмпирическое корреляционное отношение характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака, оно изменяется в пределах от 0 до 1. Если значение эмпирического корреляционного отношения равно 0, то группировочный признак не оказывает влияния на результативный, а если равен 1, то это означает, что результативный признак изменяется под воздействием только группировочного.
Выделяют дисперсию общую, межгрупповую и внутригрупповую.
Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:
Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки.
, где
- соответственно групповые средние и численности по отдельным группам
Внутригрупповая дисперсия отражает случайную вариацию, то есть ту вариацию, которая не зависит от изменения признака-фактора положенного в основу группировки.
Средняя из внутригрупповых дисперсий определяется по формуле:
Существует закон связывающий между собой эти виды дисперсий:
Пример 37
Проведем дисперсионный анализ производительности труда рабочих с использованием данных таблицы 4.25.
Таблица 3.25.
Расчет дисперсий на основании данных о производительности труда рабочих
Группы рабочих | Производительность труда (деталей за смену) х | Численность рабочих | |
Количество рабочих прошедших техническое обучение | |||
Итого | |||
Количество рабочих не прошедших техническое обучение | |||
Итого | |||
Всего |
Рассчитаем следующие показатели.
- среднюю из внутригрупповых дисперсий
- межгрупповую дисперсию
- общая дисперсия
s2=136,6+49,0=185,6
- эмпирическое корреляционное отношение
Таким образом, проведенные расчеты показывают, что фактор технического обучения объясняет в данном случае 26,4% вариации производительности труда рабочих, а не учтенные факторы 73,6%.
3.8. Вопросы к семинарскому занятию, тесты и практические задания
Вопросы для опроса студентов
1. Охарактеризуйте метод экономического анализа и назовите его характерные черты.
2. В чем заключается диалектическая природа методов дедукции и индукции?
3. Назовите характерные особенности системного подхода в экономическом анализе.
4. Какова должна быть последовательность, и из каких элементов состоит методика проведения экономического исследования.
5. Известны три стадии процесса познания: живое созерцание, научная абстракция и возврат к практике в обогащенном виде. Назовите три этапа аналитического исследования. Ответ представьте в виде следующей таблицы:
Стадии научного познания | Этапы аналитического исследования | Краткая характеристика этапа |
6. Следует установить, какое подразделение отрицательно влияет на общую сумму затрат по предприятию, какие понятия системного исследования необходимо использовать при этом.
7. Укажите сходства и различия понятий “метод” и “методика” экономического анализа.
8. Как классифицируются методы и приемы экономического анализа?
9. Какие методы относятся к неформализованным, определите сферу их применения.
10. Назовите признаки и классифицируйте факторы влияющие на показатели финансово-хозяйственной деятельности
11. Назовите и охарактеризуйте основные правила проведения факторного анализа.
12. Назовите основные типы моделей используемых в детерминированном факторном анализе.
13. В чем заключается сущность и сфера применения метода элиминирования.
14. Покажите на различных типах моделей расчет влияния факторов с помощью способа цепных подстановок.
15. Покажите расчет влияния факторов в различных индексных системах.
16. Приведите примеры расчетов влияния факторов с помощью методов абсолютных и относительных разниц.
17. Для аддитивных и смешанных моделей, покажите расчет влияния факторов с помощью способа пропорционального деления и долевого участия.
18. Каковы основные преимущества интегрального и логарифмического способов анализа, перед методом элиминирования, покажите расчет влияния факторов для различных типов моделей.
19. Назовите сферу применения и сущность способов стохастического факторного анализа.
20. Каковы критерии и способы оценки тесноты связи между факторными и результативными признаками.
21. Назовите способы определения направления и оценки адекватности полученных моделей взаимозависимости.
22. Укажите непараметрические способы оценки тесноты связи между признаками.
23. Укажите форму зависимости объема продукции от факторов, характеризующих наличие и степень использования трудовых ресурсов, средств и предметов труда. Составьте модели, отражающие характер этих зависимостей.
24. Преобразуйте исходную факторную модель фондоотдачи методом расширения и методом сокращения.
25. Постройте факторные системы и модели производительности труда, материалоемкости продукции, рентабельност