Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ

Вопросы:

1. Причинно- следственные связи между явлениями

2. Виды связи (функциональная и стохастическая)

3. Прямые и обратные связи

4. Прямолинейные и криволинейные связи

5. Корреляционный и регрессионный анализ

5.1. Однофакторный корреляционный анализ

5.2. Однофакторный регрессионный анализ

6.Экономическая интерпретация параметров регрессии

7.Многофакторный корреляционный и регрессионный анализ

1. Исследуя состояние и развитие как природных, так и общественных явлений, необходимо изучать взаимосвязи наблюдаемых процессов и явлений. Современная наука об обществе объясняет суть явлений через изучение их взаимосвязи. При этом полнота описания, так или иначе, определяется количественными характеристиками причинно- следственных связей между ними. Например, объем валютных торгов зависит от спроса на валюту, который в свою очередь определяется состоянием экономики, активностью внешнеэкономической деятельности субъектов, политикой государства и др., объем продукции предприятия связан с численностью и квалификацией работников, стоимостью основных фондов, технологией производства и т.д.

Оценка наиболее существенных факторов, а также изучение взаимодействия одних факторов на другие является одной из основных задач статистики. Знание характера и силы связей позволяет управлять социально- экономическими процессами (явлениями) и предсказывать их развитие.

Социально- экономические явления представляют собой результат одновременного воздействия большого числа причин. При изучении этих явление необходимо выявлять главные, основные причины, абстрагируясь от второстепенных.

В основе первого этапа статистического изучения связей лежит качественный анализ явления, связанный с анализом его природы методами экономической теории, социологии, конкретной экономики.

Второй этап-построение модели связи. Он базируется на методах статистики: группировках, средних величин, таблицах и т.д.

Третий этап- интерпретация результатов, вновь связан с качественными особенностями изучаемого явления.

Статистика разработала множество методов изучения связей, выбор конкретного из которых зависит от цели исследования и от поставленной задачи. Связи между признаками и явлениями, ввиду их большого разнообразия, классифицируются по ряду оснований.

Признаки по их значению для изучения взаимосвязи делятся на два класса.

Признаки, обусловливающие изменение других, связанных с ними признаков, называют факторными, или простофакторами.

Признаки, изменяющиеся под воздействием факторных признаков, называют, результативными.

Связи между явлениями и их признаками классифицируются по степени тесноты, по направлению и по аналитическому выражению.

2. Формы проявления факторных связей весьма разнообразны. В качестве двух самых общих видов выделяют следующие связи:

· функциональную (жестко детерминированную) связь представляющую собой вид причинной зависимости, при которой определенному значению факторного признака строго соответствует одно или несколько значений результативного признака.

Функциональную связь можно представить уравнением:

Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru ,

где Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru -результативный признак ( i=1, …, n);

Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru -известная функция связи результативного и факторного признаков;

Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru - факторный признак.

Чаще всего функциональные связи наблюдаются в явлениях, описываемых математикой (например, зависимость между площадью круга и радиусом (S= Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru )), физикой и другими точными науками. Имеют место функциональные связи и в социально- экономических процессах, но довольно редко (они отражают взаимосвязь только отдельных сторон сложных явлений общественной жизни). В экономике примером функциональной связи может служить связь между оплатой труда (у) и количеством изготовленных деталей (х) при простой сдельной оплате труда. Так, если расценка за одну деталь составляет 3 тыс. руб., то связь между признаками однозначно выразится простым линейным уравнением у=3х. Для каждого допустимого значения (х) можно указать вполне определенное значение (у). Если, предположим, х=7, то соответственно у=21.

Характерной особенностью функциональной связи является то, что она проявляется с одинаковой силой у каждой единицы изучаемой совокупности. Поэтому значение функциональной зависимости позволяет абсолютно точно прогнозировать события.

В реальной общественной жизни, ввиду неполноты информации жестко детерминированной системы, может возникнуть неопределенность, из- за которой эта система по своей природе должна рассматриваться как вероятностная, при этом связь между признаками становится стохастической.

· стохастическую (стохастически детерминированную) связь (которую также называют неполной, или статистической) представляющую собой связь между величинами, при которой одна из них, случайная величина (у), реагирует на изменение другой величины (х) или других величин Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru (случайных или неслучайных) изменением закона распределения. Это обусловливается тем, что зависимая переменная (результативный признак), кроме рассматриваемых независимых, подтверждена влиянию ряда неучтенных или неконтролируемых (случайных) факторов, а также некоторых неизбежных ошибок измерения переменных. Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть предсказаны с достаточной точностью.

Термин « стохастический» происходит от греческого «stochos»- мишень или бычий глаз. Стреляя в мишень, даже хороший стрелок редко попадает в центр- «яблочко», выстрелы ложатся в некоторой, близкой к нему области. В этом смысле стохастическая связь означает приблизительный характер значений признака. Обычно стохастическая связь между двумя случайными величинами имеет место в случае наличия общих случайных факторов, воздействующих на каждую из них.

Например, зависимость цены товара от качества. В отдельных случаях соотношение спроса и предложения может привести к тому, что товар худшего качества будет продан по более высокой цене, а аналогичный товар лучшего качества может иметь более низкую цену при достаточно большом объеме продаж. Однако же в среднем между ценой и качеством товара существует прямая зависимость- чем выше качество товара, тем выше его цена и, соответственно, чем ниже качество товара, тем ниже будет и цена на него.

Характерной особенностью стохастических связей является то, что они проявляются во всей совокупности, а не в каждой ее единице (причем не известен ни полный перечень факторов, определяющих значение результативного признака, ни точный механизм их функционирования и взаимодействия с результативным признаком).

Модель стохастической связи может быть представлена уравнением:

Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru ,

где Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru - расчетное значение результативного признака;

Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru - часть результативного признака, сформировавшегося под воздействием учетных известных факторных признаков (одного или множества), находящихся в стохастической связи с признаком;

Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru - часть результативного признака, возникающая вследствие действия неконтролируемых или неучтенных факторов, а также изменения признаков неизбежно сопровождающегося некоторыми случайными ошибками.

В социально- экономической жизни приходится сталкиваться со многими явлениями, имеющими вероятностный характер. Например, уровень производительности труда рабочих стохастически связан с целым комплексом факторов: квалификацией, стажем работы, уровнем механизации и автоматизации производства, простоями, состоянием здоровья работника, его настроением и т.д. Полный перечень факторов неизвестен. Кроме того, неодинаково действие любого известного фактора на уровень производительности труда каждого рабочего. Изменение атмосферного давления, например, значительно снижает работоспособность рабочих, страдающих заболеваниями сердечно- сосудистой системы, и практически не сказывается на производительности труда здоровых рабочих. В результате - при одинаковых возможностях наблюдается распределение значений дневной выработки рабочих. Такое распределение носит условный характер, поскольку оно связано с фиксированными значениями факторных признаков. Различия условных распределений имеют выраженную направленность связи (например, выработка растет с повышение квалификации рабочего). Эту направленность связи можно раскрыть более наглядно, если ограничится рассмотрением только одного аспекта стохастической связи - изучением вместо условных распределений лишь одного их параметра - математического ожидания (частные случаи стохастической связи - корреляционная и регрессионная).

Корреляционная связь (от английского слова corre- lation –cсоотношение, соответствие)- частный случай стохастической связи, когда по заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Это обусловливается тем, что изменение результативного признака происходит под влиянием рассматриваемого факторного признака не всецело, а лишь частично, так как возможно влияние неучтенных или неконтролируемых (случайных) факторов. Объяснением тому является сложность взаимосвязей между анализируемыми факторами, поэтому связь между признаками проявляется лишь в среднем, в массе случаев, т.е. с изменением факторного признака (х) закономерным образом меняется среднее значение результативного признака (у), в то время как в каждом отдельном случае результативный признак может принимать множество различных значений.

Например, в сельском хозяйстве- связь между урожайностью и количеством внесенных удобрений. Очевидно, что последние участвуют в формировании урожая, но для каждого поля одно и тоже количество внесенных удобрений вызовет различный прирост урожайности, так как во взаимосвязи находится еще целый ряд факторов (погода, состояние почвы, количество осадков и т.д.), которые формируют конечный результат. Однако в среднем наблюдается, что увеличение массы внесенных удобрений ведет к росту урожайности.

3. В зависимости от направления действия функциональные и стохастические связи могут быть:

· прямыми, т.е. направление изменения результативного признака совпадает с направлением изменения признака- фактора, т.е. с увеличением факторного признака увеличивается и результативный, и наоборот, с уменьшением факторного признака уменьшается и результативный признак. Например, чем выше квалификация рабочего (разряд), тем выше уровень производительности труда.

· обратными. Например, чем выше производительность труда, тем ниже себестоимость единицы продукции.

4. По аналитическому выражению (форме) связи могут быть:

· прямолинейными (линейными) - с возрастанием значения факторного признака происходит непрерывное возрастание (или убывание) значений результативного признака. Математически такая связь представляется уравнением прямой, а графически- прямой линией.

· криволинейными- с возрастанием значения факторного признака возрастание (или убывание) результативного признака происходит неравномерно или же направление его изменения меняется на обратное. Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т.д.)

5. В общем виде задача статистики в области изучения взаимосвязей состоит не только в количественной оценке их наличия, направления и силы связи, но и в определении формы (аналитического выражения) влияния факторных признаков на результативный. Для ее решения применяют методы корреляционного и регрессионного анализа.

Корреляционный анализ ставит задачу измерить тесноту связи между варьирующими переменными и оценить влияние на результативный признак.

Регрессионный анализ предназначен для выбора формы связи, типа модели, для определения расчетных значений зависимой переменной (результативного признака).

Методы корреляционного и регрессионного анализа используются в комплексе. Наиболее разработанной в теории и широко применяемой на практике является парная корреляция, когда исследуются соотношения результативного признака и одного факторного признака. Это - однофакторный корреляционный и регрессионный анализ. Именно такой анализ является основой для изучения многофакторных стохастических связей.

5.1. Однофакторный корреляционный анализ

Для анализа близости соотношения двух переменных используется линейный коэффициент корреляции (r):

r= Тема: Методы изучения связи между явлениями, корреляционно- регрессионный анализ - student2.ru ,

где, n- число данных в выборке;

х –величина факторного показателя;

у- величина результативного показателя.

Коэффициент корреляции измеряет степень линейной зависимости между двумя переменными, одна из которых- результативный показатель (у), а другая – факторный (х).Величина коэффициента корреляции находится от -1 до 1. (-1≤ r ≤ 1). Интерпретация выходных значений коэффициента корреляции представлена в табл.1.

Таблица 1

Наши рекомендации