Методы стохастического факторного анализа
В стохастическом факторном анализе для измерения влияния факторов на результативный показатель используются приемы корреляционного.
Различают парную и множественную корреляцию. Парная корреляция – это связь между двумя показателями, один из которых является факторным, а другой – результативным. Множественная корреляция возникает от взаимодействия нескольких факторов с результативным показателем.
Необходимыми условиями для применения корреляционного анализа являются:
1. наличие достаточно большого количества наблюдений о величине исследуемых факторных и результативных показателей (в динамике или за текущий год по совокупности однородных объектов);
2. исследуемые факторы должны иметь количественное измерение и отражение в тех или иных источниках информации.
Применение корреляционного анализа позволяет решить следующие задачи:
1. определить изменение результативного показателя под воздействием одного или нескольких факторов (в абсолютном измерении), т.е. определить, на сколько единиц изменяется величина результативного показателя при изменении факторного на единицу;
2. установить относительную степень зависимости результативного показателя от каждого фактора.
Корреляционный анализ состоит из нескольких этапов.
На первом этапеопределяются факторы, которые оказывают воздействие на изучаемый показатель, и отбираются наиболее существенные для корреляционного анализа. Отбор факторов для корреляционного анализа является очень важным моментом в экономическом анализе. От того, насколько правильно сделан отбор факторов, зависит точность выводов по итогам анализа. При этом необходимо придерживаться следующих правил:
· факторы должны находиться в причинно-следственной связи с результативным показателем;
· необходимо отбирать самые значимые факторы, которые оказывают решительное воздействие на результативный показатель;
· факторы должны быть количественно измеримы, т.е. иметь единицу измерения, и информация о них должна содержаться в учете или отчетности;
· в корреляционную модель линейного типа не рекомендуется включать факторы, связь которых с результативным показателем имеет криволинейный характер;
· не рекомендуется включать в корреляционную модель взаимосвязанные факторы (если парный коэффициент корреляции между двумя факторами больше 0,85, то по правилам корреляционного анализа один из них необходимо исключить, иначе это приведет к искажению результатов анализа);
· нежелательно включать в корреляционную модель факторы, связь которых с результативным показателем носит функциональный характер.
Большую помощь при отборе факторов для корреляционной модели оказывают аналитические группировки, способ сравнения параллельных и динамических рядов, линейные графики. С их помощью можно определить наличие, направление и форму зависимости между изучаемыми показателями. Отбор факторов можно производить также в процессе решения задачи корреляционного анализа на основе оценки их значимости по критерию Стьюдента.
На втором этапесобирается исходная информация по каждому факторному и результативному показателю. Она должна быть проверена на точность, однородность и соответствие закону нормального распределения. В первую очередь необходимо убедиться в достоверности информации, насколько она соответствует объективной действительности. Использование недостоверной, неточной информации приведет к неправильным результатам анализа и к неправильным выводам.
Одно из условий корреляционного анализа – однородность исследуемой информации относительно распределения ее около среднего уровня. Если в совокупности имеются группы объектов, которые значительно отличаются от среднего уровня, то это говорит о неоднородности исходной информации.
Критериями однородности информации служат среднеквадратическое отклонение и коэффициент вариации, которые рассчитываются по каждому факторному и результативному показателю.
Среднеквадратическое отклонение показывает абсолютное отклонение индивидуальных значений от среднеарифметической. Оно определяется по формуле
,
где xi – i-е значение факторного показателя;
– среднее значение факторного показателя;
n – число наблюдений.
Коэффициент вариации показывает относительную меру отклонения отдельных значений от среднеарифметической. Он рассчитывается по формуле
Чем больше коэффициент вариации, тем относительно больший разброс и меньшая выравненность изучаемых объектов. Изменчивость вариационного ряда принято считать незначительной, если коэффициент вариация не превышает 10%, средней – если составляет 10-12%, значительной – когда она больше 20%, но не превышает 33%. Если же вариация выше 33%, то это говорит о неоднородности информации и необходимости исключения нетипичных явлений, которые обычно бывают в первых и последних ранжированных рядах выборки.
Следующее требование к исходной информации – подчинение ее закону нормального распределения. Для количественной оценки степени отклонения информации от нормального распределения служат отношения показателя ассиметрии к ее ошибке и отношение показателя эксцесса к его ошибке.
Показатель ассиметрии (А) и его ошибка (ma) рассчитываются по следующим формулам:
Показатель эксцесса (Е) и его ошибка (me) рассчитываются следующим образом:
В симметрическом распределении А=0. Отличие от нуля указывает на наличие ассиметрии в распределении данных около средней величины. Отрицательная асимметрия свидетельствует о том, что преобладают данные с большими значениями, а с меньшими значениями встречаются значительно реже. Положительная асимметрия показывает, что чаще встречаются данные с небольшими значениями.
В нормальном распределении показатель эксцесса Е=0. Если Е>0, то данные густо сгруппированы около средней, образуя островершинность. Если Е<0, то кривая распределения будет плосковершинной. Однако когда отношения А/та и Е/тe меньше 3, то асимметрия и эксцесс не имеют существенного значения, и исследуемая информация соответствует закону нормального распределения. Следовательно, ее можно использовать для корреляционного анализа.
На третьем этапе моделируется связь между факторами и результативным показателем, т.е. подбирается и обосновывается математическое уравнение, которое наиболее точно выражает сущность исследуемой зависимости. Для его обоснования используются те же приемы, что и для установления наличия связи: аналитические группировки, линейные графики и др.
Зависимость результативного показателя от определяющих его факторов можно выразить уравнением парной и множественной регрессии. При прямолинейной форме они имеют следующий вид:
- уравнение парной регрессии: Yx=a + bx,
- уравнение множественной регрессии: Yx= а + b1x1 + b2x2 + … +bnxn,
где а – свободный член уравнения при х = 0;
x1 , х2 ,…, хn – определяющие уровень изучаемого результативного показателя;
b1 , b2 …, bn – коэффициенты регрессии при факторных показателях, характеризующие уровень влияния каждого фактора на результативный показатель в абсолютном выражении.
Если связь между результативным и факторными показателями носит криволинейный характер, то может быть использована степенная, логарифмическая, параболическая, гиперболическая и другие функции.
В случаях, когда трудно обосновать форму зависимости, решение задачи можно провести по разным моделям и сравнить полученные результаты. Адекватность разных моделей фактическим зависимостям проверяется по критерию Фишера, показателю средней ошибки аппроксимации и величине множественного коэффициента детерминации, о которых речь пойдет несколько позже.
На четвертом этапепроводится расчет основных показателей связи корреляционного анализа: уравнение связи, коэффициенты корреляции, детерминации, эластичности и др.
В качестве примера для иллюстрации корреляционного анализа прямолинейной зависимости возьмем приведенные в таблице 2.4 данные об изменении уровня выработки рабочих (у) в зависимости от уровня фондовооруженности труда (х).
Расчет уравнения связи (Yx = а + bх) сводится к определению параметров а и b. Их находят из следующей системы уравнений:
где n – число наблюдений (в данном примере n=10 и представляет собой число анализируемых предприятий);
х – фондовооруженность труда, тыс. руб.;
у – среднегодовая выработка продукции одним работником, тыс. руб.
Значения рассчитывают на основании фактических исходных данных (табл. 2.4).
Таблица 2.4
Расчет производных данных для корреляционного анализа
n | x | y | xy | x2 | y2 | Yx |
3,1 | 4,5 | 13,95 | 9,61 | 20,25 | 4,28 | |
3,4 | 4,4 | 14,96 | 11,56 | 19,36 | 4,65 | |
3,6 | 4,8 | 17,28 | 12,96 | 23,04 | 4,90 | |
3,8 | 5,0 | 19,00 | 14,44 | 25,00 | 5,15 | |
3,9 | 5,5 | 21,45 | 15,21 | 30,25 | 5,28 | |
4,1 | 5,4 | 22,14 | 16,81 | 29,16 | 5,52 | |
4,2 | 5,8 | 24,36 | 17,64 | 33,64 | 5,65 | |
4,4 | 6,0 | 26,40 | 19,36 | 36,00 | 5,90 | |
4,6 | 6,1 | 28,06 | 21,16 | 37,21 | 6,15 | |
4,9 | 6,5 | 31,85 | 24,01 | 42,25 | 6,28 | |
Итого | 40,0 | 54,0 | 219,45 | 162,76 | 296,16 | 53,75 |
Подставим полученные значения в систему уравнений:
Умножив все члены первого уравнения на 4, получим
Вычитая из второго уравнения первое, получаем 2,76b=3,45, отсюда b=1,25.
Уравнение связи, описывающее зависимость производительности труда от фондовооруженности, получило следующее выражение:
Коэффициент а – постоянная величина результативного показателя, которая не связана с изменением данного фактора. Параметр b показывает среднее изменение результативного показателя с повышением или понижением величины факторного показателя на единицу его измерения. В данном примере с увеличением фондовооруженности труда на 1 тыс. руб. выработка рабочих повышается в среднем на 1,25 тыс.руб.
Подставив в уравнение регрессии соответствующие значения x, можно определить выровненные (теоретические) значения результативного показателя (Yx) для каждого предприятия. Например, чтобы рассчитать выработку рабочих на первом предприятии, где фондовооруженность труда равна 3,1 тыс. руб., необходимо это значение подставить в уравнение связи:
Полученная величина показывает, какой была бы выработка при фондовооруженности труда 3,1 тыс.руб., если бы данное предприятие использовало свои производственные мощности в такой степени, как в среднем все предприятия данной выборки. Фактическая выработка на данном предприятии выше расчетного значения. Следовательно, данное предприятие использует свои производственные мощности несколько лучше, чем в среднем по отрасли. Аналогичные расчеты сделаны для каждого предприятия. Данные приведены в последней графе таблице 2.4. Сравнение фактического уровня выработки рабочих с расчетным позволяет оценить результаты работы отдельных предприятий.
По такому же принципу решается уравнение связи при криволинейной зависимости между изучаемыми явлениями. Когда при увеличении одного показателя значения другого возрастают до определенного уровня, а потом начинают снижаться (например, зависимость производительности труда рабочих от их возраста), то для описания такой зависимости лучше всего подходит парабола второго порядка:
В соответствии с требованиями метода наименьших квадратов для определения параметров a,b и c необходимо решить следующую систему уравнений:
Кроме параболы, для описания криволинейной зависимости в корреляционном анализе очень часто используется гипербола:
.
Для определения ее параметров необходимо решить следующую систему уравнений:
Гипербола описывает такую зависимость между двумя показателями, когда при увеличении одной переменной значения другой увеличиваются до определённого уровня, а потом прирост снижается, например зависимость урожайности от количества внесенного удобрения, продуктивности животных от уровня их кормления, себестоимости единицы продукции от объема ее производства и т.д.
При более сложном характере зависимости между изучаемыми явлениями используются более сложные параболы (третьего, четвертого порядка и т.д.), а также квадратические, cтепенные, показательные и другие функции.
Таким образом, используя тот или иной тип математического уравнения, можно определить степень зависимости между изучаемыми явлениями, узнать, на сколько единиц в абсолютном измерении изменяется величина результативного показателя с изменением факторного на единицу. Однако регрессионный анализ не выявляет тесноту связи между показателями и не определяет решающее или второстепенное воздействие оказывает данный фактор на величину результативного показателя.
Для измерения тесноты связи между факторными и результативными показателями исчисляется коэффициент корреляции.В случае прямолинейной связи между изучаемыми показателями он рассчитывается по следующей формуле:
Подставив из таблицы 2.4 значения в формулу, получим значение коэффициента корреляции, равное 0,97.
Коэффициент корреляции может принимать значения от 0 до 1. Чем ближе его величина к 1, тем более тесная связь между изучаемыми явлениями, и наоборот. В данном случае величина коэффициента корреляции является существенной (r=0,97). Это позволяет сделать вывод о том, что фондовооруженность – один из основных факторов, от которых на анализируемых предприятиях зависит уровень производительности труда.
Если коэффициент корреляции возвести в квадрат, получим коэффициент детерминации, который показывает на сколько процентов величина результативного показателя зависит от факторного.
d=r2.
В рассматриваемом примере коэффициент детерминации равен 0,94. Это значит, что производительность труда на 94% зависит от фондовооруженности, а на долю других факторов приходится 6% изменения ее уровня.
При измерении тесноты связи при криволинейной форме зависимости используется не линейный коэффициент корреляции, а корреляционное отношение, формула которого имеет следующий вид:
где
Эта формула является универсальной. Ее можно применять для исчисления коэффициента корреляции при любой форме зависимости. Однако для его нахождения требуется предварительное решение уравнения регрессии и расчет по нему теоретических (выравненных) значений результативного показателя для каждого наблюдения исследуемой выборки (см. последнюю графу в табл. 2.4).
Решение задач многофакторного корреляционного анализа производится на ПЭВМ по типовым программам.Сначала формируется матрица исходных данных, в первой графе которой записывается порядковый номер наблюдения, во второй – величина результативного показателя (Y), а в следующих – данные по факторным показателям (xi). Эти сведения вводятся в ПЭВМ и рассчитывается уравнение множественной регрессии, которое в нашей задаче получило следующее выражение:
где x1 – материалоотдача, руб.;
х2 – фондоотдача, коп.;
х3 – производительность труда (среднегодовая выработка продукции на одного работника), тыс.руб.;
х4 – продолжительность оборота оборотных средств предприятия, дни;
х5 – удельный вес продукции высшей категории качества, % .
Коэффициенты уравнения показывают количественное воздействие каждого фактора на результативный показатель при неизменности других. В данном случае можно дать следующую интерпретацию полученному уравнению: рентабельность повышается на 3,65 % при увеличении материалоотдачи на 1 руб.; на 0,09 % – с ростом фондоотдачи на 1 коп.; на 1,02 % – с повышением среднегодовой выработки продукции на одного работника на 1 тыс.руб.; на 0,052 % – при увеличении удельного веса продукции высшей категории качества на 1 %. С увеличением продолжительности оборота средств на 1 день рентабельность снижается в среднем на 0,122 %.
Пятый этап –статистическая оценка и практическое использование результатов корреляционного анализа. Чтобы убедиться в надежности показателей связи и правомерности их использования для практической цели, необходимо дать им статистическую оценку. Для этого используются критерий Стьюдента, критерий Фишера (F-отношение), средняя ошибка аппроксимации , коэффициенты множественной корреляции (R) и детерминации (D).
Надежность коэффициентов корреляции, которая зависит от объема исследуемой выборки данных, проверяется по критерию Стьюдента:
где – среднеквадратическая ошибка коэффициента корреляции, которая определяется по формуле
Если расчетное значение t выше табличного, то можно сделать заключение о том, что величина коэффициента корреляции является значимой. Табличные значения t находят по таблице значений критериев Стьюдента. При этом учитываются количество степеней свободы (V=п-1) и уровень доверительной вероятности (в экономических расчетах обычно 0,05 или 0,01).
Надежность уравнения связи оценивается с помощью критерия Фишера, расчетная величина которого сравнивается с табличным значением. Если Fрасч > Fmaбл, то гипотеза об отсутствии связи между исследуемыми показателями отвергается.
Для оценки точности уравнения связи рассчитывается средняя ошибка аппроксимации. Чем меньше теоретическая линия регрессии (рассчитанная по уравнению) отклоняется от фактической (эмпирической), тем меньше ее величина. А это свидетельствует о правильности подбора формы уравнения связи. В нашем примере она составляет 0,0364, или 3,64%. Учитывая, что в экономических расчетах допускаемая погрешность находится в пределах 5–8 %, можно сделать вы вывод, что исследуемое уравнение связи довольно точно описывает изучаемые зависимости. С такой же небольшой погрешностью будет делаться и прогноз уровня рентабельности по данному уравнению.
О полноте уравнения связи можно судить по коэффициентам множественной детерминации. Если его значение близко к 1, значит, в корреляционную модель удалось включить наиболее существенные факторы, на долю которых приходится основная вариация результативного показателя. В нашем примере коэффициент множественной корреляции равен 0,92, коэффициент множественной детерминации – 0,85. Это означает, что изменение уровня рентабельности на 85% зависит от изменения исследуемых факторов, а на долю неучтенных факторов приходится 15% вариации результативного показателя.
Судя по всем критериям, данное уравнение можно использовать для практических целей, а именно:
а) для расчета влияния факторов на прирост результативного показателя;
б) подсчета резервов повышения уровня исследуемого показателя;
в) планирования и прогнозирования его величины.
Влияние каждого фактора на прирост (отклонение от плана) результативного показателя рассчитывается следующим образом:
Допустим, что уровень материалоотдачи на анализируемом предприятии по плану на отчетный год – 2,5 руб., фактически – 2,4 руб. Из-за этого уровень рентабельности продукции ниже планового на 0,365%:
Аналогичным образом подсчитывают резервы роста результативного показателя. Для этого планируемый прирост факторного показателя умножают на соответствующий ему коэффициент регрессии в уравнении связи:
Предположим, что в следующем году намечается рост материалоотдачи с 2,4 до 2,7 руб. За счет этого рентабельность повысится на
Подобные расчеты делаются по каждому фактору с последующим обобщением результатов анализа.
Результаты многофакторного регрессионного анализа могут быть также использованы для планирования и прогнозирования результативного показателя. С этой целью необходимо в полученное уравнение связи подставить плановый (прогнозный) уровень факторных показателей.
Таким образом, многофакторный корреляционный анализ имеет важную научную и практическую значимость. Это проявляется в том, что значительно углубляется факторный анализ, устанавливаются место и роль каждого фактора в формировании уровня исследуемых показателей и как результат – точнее обосновываются планы и управленческие решения, объективно оцениваются итоги деятельности предприятий и полнее определяются внутрихозяйственные резервы.