Проверка значимости коэффициентов парной корреляции

ОТЧЕТ

о лабораторной работе №1

на тему: «Определение параметров линейной модели множественной регрессии»

(Вариант №10)

Выполнил:

студент факультета менеджмента, социальной работы и туризма

2 курса 232 группы

Кривицкий С.С.

Проверил:

Пучков В.Ф.

Гатчина

Содержание:

Введение. 3

Раздел 1. АЛГОРИТМ ВЫЧИСЛЕНИЯ ПОКАЗАТЕЛЕЙ УРАВНЕНИЯ ЛИНЕЙНОЙ РЕГРЕССИИ.. 4

1.1. Постановка задачи. 4

1.2. Сравнительная оценка влияния различных факторов (X ij) на производительность труда (Yi) и взаимосвязь этих факторов между собой. 7

1.3. Проверка значимости коэффициентов парной корреляции. 8

1.4. Построение уравнения регрессии. 10

Раздел 2. Экономический анализ результатов.. 13

2.1. Четыре обязательных свойства «Остатков». 13

2.2. Получение модели для преобразованных исходных данных. 15

2.3. Анализ полученных результатов. 21

ЗАКЛЮЧЕНИЕ. 24

СПИСОК ЛИТЕРАТУРЫ.. 25

Введение

Для осуществления анализа экономической деятельности необходимо глубокое знание множества крайне разнообразных, взаимосвязанных и противоречивых факторов, определяющих уровень показателей эффективности экономической деятельности: производительности труда, рентабельности производства, эффективности инвестиций и др., а также умение выявить количественную меру воздействия этих факторов на данные показатели. Поэтому рассмотрение данной темы актуально в настоящее время.

Специфической особенностью деятельности экономиста является работа в условиях недостатка информации и неполноты исходных данных. Анализ такой информации требует специальных методов, которые составляют один из аспектов эконометрики. Центральной проблемой эконометрики является построение эконометрической модели и определение возможностей ее использования для описания, анализа и прогнозирования реальных экономических процессов.

Целью работы является обрести навыки по построению модели множественной регрессии экономического процесса и исследуемого процесса при различных исходных данных.

Данный отчет состоит из двух разделов. В первом разделе рассматривается алгоритм вычисления показателей уравнения линейной регрессии. Во втором разделе проводится анализ полученных данных, оценивается влияние различных факторов (Xij) на производительность труда (Yi) и взаимосвязь этих факторов между собой.

Раздел 1. АЛГОРИТМ ВЫЧИСЛЕНИЯ ПОКАЗАТЕЛЕЙ УРАВНЕНИЯ ЛИНЕЙНОЙ РЕГРЕССИИ

Постановка задачи

Задана совокупность предприятий с известными значениями:

Yi – производительность труда (тыс.руб./чел.);

X1i – энерговооруженность труда (кВт/ч);

X2i – фондовооруженность труда (тыс.руб./чел.);

X3i – процент прибыли, используемой для дополнительной оплаты труда (%),

где i – номер предприятия.

Производительность труда - эффективность конкретного труда, которая измеряется количеством изделий, операций, созданных или совершенных в единицу времени, или величиной времени, затрачиваемого на единицу продукта труда.

Энерговооруженность труда - показатель, характеризующий вооруженность труда всеми видами энергии. Используют потенциальный и фактический коэффициенты энерговооруженности труда. Потенциальный коэффициент определяют делением мощности всех двигателей машин и механизмов, а также электроаппаратов, обслуживающих производственный процесс, на общую численность рабочих. Фактический коэффициент показывает количество потребленной в производстве механической и электрической энергии в среднем на одного рабочего или на один отработанный человеко-час (человеко-день).

Фондовооруженность - показатель, характеризующий оснащенность работников предприятия или отрасли сферы материального производства основными производственными фондами. Определяется как отношение среднегодовой стоимости основных производственных фондов к среднегодовой списочной численности работников или рабочих, а иногда численности рабочих в наиболее заполненной смене.

% прибыли – это доля прибыли, которая идёт на дополнительную оплату труда.

Производительность труда принимается за функциональный, т. е. результативный признак и обозначается через Y. Фондовооруженность, энерговооруженность и процент прибыли - факториальные показатели, т. е. аргументы, находящиеся в корреляционной связи с выбранным функциональным показателем. Энерговооруженность, фондовооруженность и процент прибыли обозначаются соответственно через х1, х2 , х3.

Заданное уравнение регрессии имеет вид:

Y = a0 + b1х1 + b2х2 + b3х3 (1)

где y - производительность труда;

а - свободный член уравнения регрессии;

b1,b2, b3 - коэффициенты уравнения регрессии при показателях энерговооруженности труда, фондовооруженности труда и % прибыли соответственно.

Цель задачи для выбранного варианта совокупности предприятий – найти коэффициенты линейной регрессии в заданном уравнении (а, b1, b2, b3), т. е. доказать, что энерговооруженность, фондовооруженность и процент прибыли находятся в корреляционной связи с производительностью труда.

Значения Yi , X1i, X2i, X3i представлены в таблице №1:

Таблица №1

Исходные данные

№ набл. Производи- тельность (у) Энерговоору-женность(х1) Фондовоору- женность(х2) Процент прибыли (х3)
256,41 4,4
239,01 3,3
312,3 6,05
567,9 12,1
747,2 19,25
337,7 4,95
270,4 1,815
502,9 12,1
861,3 17,05
1194,2 24,2
707,98 13,75
1204,3 22,55
1053,2 36,3
808,8 39,05
1298,5 15,4
894,74 25,85
1163,1 31,35
756,8 19,8
1475,6 39,05
447,7 9,9
  755,002   344,35 17,91075

1.2. Сравнительная оценка влияния различных факторов (X ij) на производительность труда (Yi) и взаимосвязь этих факторов между собой.

Произведем сравнительную оценку влияния различных факторов (хji) на производительность труда (yi).Для оценки необходимо использовать значения парной корреляции (r).

Для нахождения матрицы коэффициентов парной корреляции используем табличный редактор Excel. Нахождение матрицы коэффициентов парной корреляции производится следующим образом: «Данные» / «Анализ данных» / «Корреляция». Затем в диалоговом окне «Корреляция» в поле «Входной интервал» вводим ссылку на ячейки, содержащие анализируемые данные, включая название реквизитов.

Устанавливаем метки в окне «Метки в первой строке», так как первая строка во входном диапазоне содержит название столбцов, и «По столбцам». Выбираем параметры вывода «Новый рабочий лист». В результате проделанных действий получаем результаты анализа в виде таблицы.

Матрица парной корреляции:

Таблица №2

Производи-тельность(y) Энерговоору- женность(x2) Фондовоору- женность(x3) Процент прибыли(x3)
Производи- тельность(y)      
Энерговоору- женность(x1) 0,9    
Фондовоору- женность(x2) 0,88 0,93  
процент прибыли(x3) 0,81 0,56 0,46

Коэффициент парной корреляции характеризует тесноту взаимосвязи функции с аргументом x при условии, что прочие, не включенные в уравнение регрессии аргументы этой функции, действуют корреляционно независимо от аргумента x.

Коэффициент r имеет максимальное значение, равное 1, которое получается при строго линейной положительной зависимости между факторами. Аналогичным образом r принимает минимальное значение -1, когда существует линейная отрицательная зависимость. Величина r = 0 показывает, что зависимость между факторами отсутствует.

Проверка значимости коэффициентов парной корреляции

Для проверки значимости коэффициентов парной корреляции используют t-критерий Стьюдента. Для этой цели требуется найти для каждого коэффициента парной корреляции значение t-критерия Стьюдента, который рассчитывается по формуле:

Проверка значимости коэффициентов парной корреляции - student2.ru

где r – значение коэффициента парной корреляции;

n – число наблюдений (n = 20).

Полученные значения коэффициентов парной корреляции представлены в таблице:

Проверка значимости коэффициентов парной корреляции,

используя t – критерий Стьюдента

Таблица №3

  Производительность (y) Энерговоору-женность (x1) Фондовоору-женность (x2) % прибыли (x3)
Производи-тельность (y)      
Энерговоору-женность (x1) 8,99    
Фондовоору-женность (x2) 7,88 10,53  
Фондоотдача (x3) 5,78 2,86 2,17

Затем сравним tф для каждого коэффициента парной корреляции с t-критическим (табличное значение 2,101).

Если tф > tкр, то найденный коэффициент парной корреляции признается значимым. В модель включаются только те факторы, которые имеют коэффициент парной корреляции ryixj > 0,5. В случае, если между самими факторами коэффициент парной корреляции ryixj >= 0,8, для избежания мультиколлинеарности, в модель включается только один фактор, тот у которого больше ryixj. Мультиколлинеарность свидетельствует о том, что некоторые факторы характеризуют одну и ту же сторону изучаемого явления. Поэтому их одновременное включение в модель нецелесообразно, так как они в определённой степени дублируют друг друга. Если нет особых предположений говорящих в пользу одного из этих факторов, следует отдавать предпочтение тому из них, который характеризуется большим коэффициентом парной (или частной) корреляции.

В данной задаче все факторы имеют коэффициент парной корреляции ryxj > 0,5, следовательно в модель необходимо включить все факторы, однако у факторов энерговооруженности и % прибыли ryixj >= 0,8, поэтому их одновременное включение в модель нецелесообразно, т.к. они в определенной степени дублируют друг друга. В модель включаем только один фактор – % прибыли.

Таблица №4

Сравнение tф и tкр

Коэффициенты парной корреляции Значение коэффициента парной корреляции Значение t – критерия Стьюдента t-критическое для 5% уровня значимости и числа степеней свободы v=n-2
ryx1 0,9 8,99 2,101
ryx2 0,88 7,88
ryx3 0,81 5,78
rx1x2 0,93 10,53
rx1x3 0,56 2,86
rx2x3 0,46 2,17

Проверим значимость найденных коэффициентов парной корреляции. Будем использовать t-критерий Стьюдента. Из таблицы видно, что все найденные t-критерии Стьюдента для соответствующих коэффициентов парной корреляции больше табличного критического значения для 5% уровня значимости и числа степеней свободы v = n-2, следовательно в нашей задаче все найденные коэффициенты парной корреляции значимы. В модели используем два фактора –фондовооруженность и процент прибыли.

Наши рекомендации