Стохастическое моделирование. Парная корреляция
Стохастика (от греч. Stochasis — догадка) — вероятность событий, обусловленных случайным сочетанием факторов. Стохастическая (возможная, вероятная) совокупность образуется в результате реализации стохастического процесса и представляет собой совокупность возможных комбинаций отбираемых единиц.
Стохастический анализ — это метод решения широкого класса задач статистического оценивания, предполагающий изучение массовых эмпирических данных путем построения моделей изменения показателей за счет факторов, не находящихся в прямых связях, в прямой взаимозависимости и взаимообусловленности. Стохастическая связь — это связь между случайными величинами, проявляющаяся в том, что при изменении одной из них меняется принцип распределения другой. Так, если случайная величина Х является функцией двух групп случайных величин Z и v, так что X = f(Z1, Z2, …, Zn; v1, v2, …, vn), а случайная величина Y является функцией двух групп случайных величин z и v, так что Y = Y(Z1, Z2, …, Zn; v1, v2, …, vn), то между Х и Y существует стохастическая связь.
В основе построения стохастических моделей лежит обобщение закономерностей варьирования значений изучаемых экономических показателей в совокупности хозяйственных объектов или периодов. Предпосылкой применения стохастического подхода моделирования связей являются качественная однородность совокупности (относительно изучаемых связей) и изменяемость по хозяйственным объектам и периодам. Определить закономерности моделируемых связей можно только при достаточной размерности совокупности наблюдений и использовании приемов, позволяющих рассчитать параметры связей экономических показателей исходя из эмпирических массовых данных варьирования их уровней.
Стохастическое моделирование осуществляется методами математической статистики, позволяющими исследовать опосредованные причинно-следственные связи показателей результатов производственно-хозяйственной деятельности с факторами и условиями производства. Детерминированное моделирование в данном случае не всегда возможно. Использование математико-статистических приемов позволяет обойтись без специальных экспериментов. В экономическом анализе выделяются следующие, наиболее типичные задачи стохастического анализа:
- изучение наличия и тесноты связи между функцией и факторами, между факторами;
- ранжировка и классификация факторов экономических явлений;
- выявление аналитической формы связи между изучаемыми явлениями;
- сглаживание (выявление тренда) динамики изменения уровня показателей;
- выявление параметров закономерных периодических колебаний уровня показателей;
- изучение размерности (сложности, многогранности) экономических явлений;
- определение и количественное измерение влияния факторов на изменение анализируемых показателей (экономическая интерпретация полученных уравнений).
Стохастическое моделирование и анализ связей между изучаемыми показателями начинаются с корреляционного анализа.
Корреляция (от англ. correlation — соотношение, соответствие, взаимосвязь, взаимозависимость) — вид связи, при котором средняя величина одного из признаков изменяется в зависимости от значения другого.
Корреляционные величины связаны друг с другом корреляционной связью и характеризуются факторным и результативным признаками. Признак, влияющий на другой признак, принято называть факторным (экзогенным), зависимый же признак — результативным, В каждом конкретном случае для установления факторного и результативного признаков необходим анализ природы связи.
Суть корреляционной зависимости состоит в том, что она в отличие от функциональной, при которой за изменением аргумента всегда следует строго определенное изменение функции, является неполной, проявляется лишь в среднем и только в массе наблюдений. При корреляционной связи изменение аргумента дает несколько значений функции.
Исследование связей — совокупность методов и приемов выявления, изучения и количественной оценки взаимосвязей и взаимозависимостей между признаками.
При изучении массовых общественно-экономических явлений между факторными признаками проявляется корреляционная связь, т.е. такая связь, при которой на величину результативного признака оказывают влияние помимо факторного множество других признаков, действующих в различных направлениях одновременно или последовательно. Часто корреляционную связь называют неполностатистической или частичной в отличие от функциональной, которая выражается в том, что при определенном значении одной переменной величины (независимая переменная — аргумент) другая (зависимая переменная — функция) принимает строго определенное значение.
Корреляционную связь можно выявить только в виде общей тенденции при массовом сопоставлении фактов. При этом каждому значению факторного признака будет соответствовать не одно определенное значение результативного признака, а их совокупность. В этом случае для выявления связи необходимо найти среднее значение результативного признака для каждого значения факторного. Проблема измерения связи имеет две стороны: определение ее формы и установление тесноты.
При определении формы связи устанавливается изменение средней величины результативного признака в зависимости от изменения факторного.
Если увеличение (уменьшение) факторного признака приводит к уменьшению (увеличению) результативного, то связь обратная, если же его изменение не приводит к изменению результативного, то связи нет. Выбор показателей тесноты корреляционной зависимости определяется ее формой. Кроме того, никакой прогноз относительно дальнейшего развития изучаемого явления в его связи с данным фактором невозможен без представления о форме этой связи. Под формой корреляционной связи понимают тип аналитической формулы, выражающей зависимость между изучаемыми признаками. Различают п р я м у ю корреляционную связь, т.е. такую, при которой увеличение (уменьшение) факторного признака у результативного влечет за собой увеличение (уменьшение), и о б р а т н у ю, т.е. такую, при которой с увеличением (уменьшением) факторного признака результативный обнаруживает тенденцию к снижению (увеличению).
При выборе формы корреляционной связи исходят из экономической природы изучаемых явлений, простоты аналитической функции, положенной в основу связи, и требований об ограничении числа параметров.
Под формой корреляционной зависимости понимают тенденцию, проявляющуюся в изменениях изучаемого признака в связи с изменениями признака-фактора. Если наблюдается тенденция равномерного возрастания или убывания значений признака, то зависимость называется прямолинейной. При тенденции же неравномерного изменения этих значений зависимость носит название криволинейной.
Уравнение корреляционной связи (уравнение регрессии) — аналитическое уравнение, с помощью которого выражается связь между признаками (иногда «форма связи»). Различают прямолинейное (прямая линия) и к р и в о л и н е й н о е (парабола, гипербола) уравнения связи.
При использовании корреляционно-регрессионного способа анализа модель изображается в виде уравнения регрессии типа
y = f(xi),
где у — зависимая переменная (результативный признак или функция от ряда факторов-аргументов); х — независимые переменные, факторы-аргументы (i = 1, 2, 3, ... , п).
В анализе используются парная и множественная корреляции. Парная корреляция — это корреляционная зависимость между двумя признаками.
Простейшим уравнением, которое характеризует прямолинейную зависимость между двумя признаками, является уравнение прямой линии
y(x) = a + bx,
где х, у(х) — соответственно независимый и зависимый признаки уравнения; а, b — параметры уравнения регрессии.
Количество наблюдений при прямолинейной зависимости должно быть не менее шести (годы, предприятия или цехи).
В качестве примера прямолинейной зависимости используются данные об изменении фондовооруженности и производительности труда работающих, приведенные в табл. 1.4.
Таблица 1.4. Исходные данные и вспомогательные расчеты для определения зависимости между фондовооруженностью и производительностью труда работающих
Годы, месяцы | Производительность труда работающих (у), тыс. р. | Фондовооруженность работающих (х), тыс. р. | xy | x2 | y2 |
6,2 | 1,6 | 9,9 | 2,6 | 38,4 | |
6,6 | 1,8 | 11,9 | 3,2 | 43,6 | |
6,9 | 2,0 | 13,8 | 4,0 | 47,6 | |
6,8 | 2,0 | 13,6 | 4,0 | 46,2 | |
7,3 | 2,3 | 16,8 | 5,3 | 53,3 | |
7,6 | 2,4 | 18,2 | 5,8 | 57,8 | |
8,6 | 2,5 | 21,5 | 6,3 | 74,0 | |
9,1 | 2,6 | 23,7 | 6,8 | 82,8 | |
10,6 | 2,6 | 27,6 | 6,8 | 112,4 | |
11,2 | 2,8 | 31,4 | 7,8 | 125,4 | |
И т о г о | 80,9 | 22,6 | 188,4 | 52,6 | 681,5 |
При планировании роста производительности труда важно определить ее повышение в зависимости от увеличения фондовооруженности.
Связь между производительностью и фондооворуженностью труда можно выразить в виде уравнения прямой линии
yn = a + bx,
где n – число наблюдений; a — постоянная величина, не связанная с изменением данного фактора.
Для выяснения связи рассчитаем коэффициент корреляции по формуле
Коэффициент корреляции 0,88 выражает связь между фондовооруженностью и производительностью труда и по абсолютной величине может принимать значения в пределах от нуля до единицы. Если никакой связи между двумя изучаемыми показателями нет, то он будет равен нулю. Если же между исследуемыми признаками существует тесная связь, то коэффициент корреляции близок к единице.
Если коэффициент корреляции равен единице, значит, результативный признак полностью зависит от признака-фактора, т.е., по существу, корреляционная зависимость совпадает с функциональной. Следовательно, чем ближе коэффициент корреляции к единице, тем теснее связь между изучаемыми явлениями и наоборот.
Для нахождения неизвестных параметров а и b решаем систему так называемых нормальных уравнений:
Величина Sxy определяется умножением значений х и у и последующим суммированием полученного произведения. Для исчисления величины Sх2 следует значения х возвести в квадрат и полученные результаты суммировать.
Числовые значения х, у, ху, х2 рассчитываются на основании фактических исходных данных, представленных в табл. 1.4.
В результате подстановки данных табл. 1.4 в систему уравнений получаем: 80,9 = 10a + 22,6b; 188,4 = 22,6a + 52,6b.
Из данной системы уравнений получаем: а = + 6,7; b = 0,912.
Уравнение, отражающее связь между фондовооруженностью и производительностью работающих, имеет следующий вид:
y(x) = 6,7 + 0,912x.
Следовательно, увеличение фондовооруженности труда работающих на 1000 р. приводит к росту производительности труда на 912 р. Эти данные учитываются при перспективном и текущем планировании повышения производительности труда.