Пример выполнения задания. По предприятиям региона изучается зависимость выработки продукции на одного

По предприятиям региона изучается зависимость выработки продукции на одного работника (Д.Е.) от ввода в действие новых основных фондов ( от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих ( ).

Таблица 13 – Исходные данные

Номер предприятия Номер предприятия
7,0 3,9 10,0 9,0 6,0 21,0
7,0 3,9 14,0 11,0 6,4 22,0
7,0 3,7 15,0 9,0 6,8 22,0
7,0 4,0 16,0 11,0 7,2 25,0
7,0 3,8 17,0 12,0 8,0 28,0
7,0 4,8 19,0 12,0 8,2 29,0
8,0 5,4 19,0 12,0 8,1 30,0
8,0 4,4 20,0 12,0 8,5 31,0
8,0 5,3 20,0 14,0 9,6 32,0
10,0 6,8 20,0 14,0 9,0 36,0

Требуется:

1.Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.

2.Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.

3.Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.

4.С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .

5.С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .

6.Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.

7.Осуществить проверку результатов решения с помощью MS Excel.

Решение

Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу 14.

Таблица 14 – Вспомогательная таблица для расчета недостающих показателей

7,0 3,9 10,0 27,3 70,0 39,0 15,21 100,0 49,0
7,0 3,9 14,0 27,3 98,0 54,6 15,21 196,0 49,0
7,0 3,7 15,0 25,9 105,0 55,5 13,69 225,0 49,0
7,0 4,0 16,0 28,0 112,0 64,0 16,0 256,0 49,0
7,0 3,8 17,0 26,6 119,0 64,6 14,44 289,0 49,0
7,0 4,8 19,0 33,6 133,0 91,2 23,04 361,0 49,0
8,0 5,4 19,0 43,2 152,0 102,6 29,16 361,0 64,0
8,0 4,4 20,0 35,2 160,0 88,0 19,36 400,0 64,0
8,0 5,3 20,0 42,4 160,0 106,0 28,09 400,0 64,0
10,0 6,8 20,0 68,0 200,0 136,0 46,24 400,0 100,0
9,0 6,0 21,0 54,0 189,0 126,0 36,0 441,0 81,0
11,0 6,4 22,0 70,4 242,0 140,8 40,96 484,0 121,0
9,0 6,8 22,0 61,2 198,0 149,6 46,24 484,0 81,0
11,0 7,2 25,0 79,2 275,0 180,0 51,84 625,0 121,0
12,0 8,0 28,0 96,0 336,0 224,0 64,0 784,0 144,0
12,0 8,2 29,0 98,4 348,0 237,8 67,24 841,0 144,0
12,0 8,1 30,0 97,2 360,0 243,0 65,61 900,0 144,0
12,0 8,5 31,0 102,0 372,0 263,5 72,25 961,0 144,0
14,0 9,6 32,0 134,4 448,0 307,2 92,16 1024,0 196,0
14,0 9,0 36,0 126,0 504,0 324,0 81,0 1296,0 196,0
Сумма 123,8 1276,3 2997,4 837,74 10828,0 1958,0
Ср. знач. 9,6 6,19 22,3 63,815 229,05 149,87 41,887 541,4 97,9

Найдем средние квадратические отклонения признаков:

;

;

.

1.Вычисление параметров линейного уравнения множественной регрессии.

Для нахождения параметров линейного уравнения множественной регрессии

необходимо решить следующую систему линейных уравнений относительно неизвестных параметров , , :

либо воспользоваться готовыми формулами:

; ;

.

Рассчитаем сначала парные коэффициенты корреляции:

;

;

.

Находим

;

;

.

Таким образом, получили следующее уравнение множественной регрессии:

.

Коэффициенты и стандартизованного уравнения регрессии находятся по формулам:

;

.

Т.е. уравнение будет выглядеть следующим образом:

.

Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.

Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:

.

Вычисляем:

; .

Т.е. увеличение основных фондов (от своего среднего значения) и удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,61% или 0,20% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем
фактора .

2.Коэффициенты парной корреляции мы уже нашли:

; ; .

Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. ). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.

При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:

;

.

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.

Коэффициент множественной корреляции определяется через матрицу парных коэффициентов корреляции:

,

где

– определитель матрицы парных коэффициентов корреляции;

– определитель матрицы межфакторной корреляции.

;

.

Коэффициент множественной корреляции

.

Аналогичный результат получим при использовании других формул:

;

;

.

Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом.

3.Нескорректированный коэффициент множественной детерминации оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации

определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более ) детерминированность результата в модели факторами и .

4.Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера:

.

В нашем случае фактическое значение -критерия Фишера:

.

Получили, что (при ), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .

5.С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:

;

.

Найдем и .

;

.

Имеем

;

.

Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует.

Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .

6.Общий вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии:

Пример выполнения задания. По предприятиям региона изучается зависимость выработки продукции на одного - student2.ru , .

Решение задачи MS EXCEL

Записываем исходные данные в таблицу MS Excel:

Пример выполнения задания. По предприятиям региона изучается зависимость выработки продукции на одного - student2.ru

Рисунок 8 - Лист Excel Исходные данные

Найдем матрицу парных коэффициентов корреляции (Данные→Анализ данных→Корреляция)

Пример выполнения задания. По предприятиям региона изучается зависимость выработки продукции на одного - student2.ru

Рисунок 9 - Диалоговое окно функции Корреляция

Получаем следующий результат (рис. 10).

Пример выполнения задания. По предприятиям региона изучается зависимость выработки продукции на одного - student2.ru

Рисунок 10 - Лист Excel Матрица парных коэффициентов

Из матрицы парных коэффициентов видно, что ryx1= 0,9699; ryx2= 0,9408;rx1x2= 0,9428.

С помощью инструмента Регрессия (Данные→Анализ данных→Регрессия) получаем следующие результаты (рис.11)

Пример выполнения задания. По предприятиям региона изучается зависимость выработки продукции на одного - student2.ru

Рисунок 11 - Результаты решения задачи с использованием MS Excel.

Проанализировав результаты решения задачи с помощью MS Excel, делаем вывод, что все ранее проведенные расчеты показателей множественной регрессии совпадают с итогами полученными в данном решении.

Вопросы для самоконтроля:

1. Какие функции чаще всего используются при построении уравнения множественной регрессии?

2. Какие задачи решаются при построении регрессии?

3. Каким требованиям должны отвечать факторы модели множественной регрессии и почему?

4. Объясните практическое применение в экономике частных коэффициентов эластичности.

5. Как вычисляется индекс корреляции?

6. Как вычисляется и что показывает индекс детерминации?

7. В чем заключается смысл расчета скорректированного индекса корреляции?

8. Какова связь скорректированного индекса корреляции с индексом корреляции при различных количествах вводимых в модель факторах?

9. Какой вид имеет система нормальных уравнений метода наименьших квадратов в случае множественной линейной регрессии?

10. Что такое стандартизированные переменные?

3 Выбор варианта контрольной работы.

Выбор варианта задания осуществляется следующим образом (см. таблицу 25.

Пример выбора варианта задания:

Студент: Малахов Иван Петрович

Шифр зачетной книжки: 20119

Вариант задания контрольной работы 9,4 (I задача- вариант № 9; II задача – вариант № 4)

Работа включает в себя выполнение двух задач:

- парная регрессия и корреляция

- множественная регрессия и корреляция

Таблица 25 - Выбор варианта контрольной работы

Первая буква фамилии Последняя цифра номера зачетной книжки  
1,0 2,9 3,8 4,7 5,6
А, Ж, С 5,3 6,4 5,6 7,8 9,10
Б, З, Ю 7,2 2,5 7,6 8,9 9,5
В, И, Ц, Ч 5,4 2,3 2,7 3,8 4,6
Г, Т, Щ 1,5 1,10 2,8 3,7 10,8
Д, Л, Э 1,6 6,9 2,9 3,6 4,9
Ф, Х, К 5,7 1,8 7,4 8,5 4,10
Я, О, Ё, Н 1,1 6,2 3,1 3,3 10,3
Е, У, П 2,1 2,10 3,2 3,10 4,1
Р, Ш, М 4,2 9,4 8,1 9,2 10,3

Варианты задач по теме «Парная регрессия и корреляция»

Задание

1.Построить линейное уравнение парной регрессии от .

2.Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.

3.Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.

4.Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем:

- 115% от среднего уровня;

- 130% от среднего уровня.

5.Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

6.На одном графике построить исходные данные и теоретическую прямую.

7.Осуществить проверку результатов решения с помощью MS Excel.

Вариант 1

Таблица 3 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Вариант 2

Таблица 4 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Вариант 3

Таблица 5 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Вариант 4

Таблица 6 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Вариант 5

Таблица 7 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Вариант 6

Таблица 8 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Вариант 7

Таблица 9 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Вариант 8

Таблица 10 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Вариант 9

Таблица 11 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Вариант 10

Таблица 12 – Исходные данные

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) Среднедневная заработная плата, Д.Е., (y)

Варианты индивидуальных заданий по теме «Множественная регрессия и корреляция»

По предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%)

Требуется:

1.Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.

2.Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.

3.Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.

4.С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .

5.С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .

6.Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.

7.Осуществить проверку полученных результатов с помощью Excel.

Вариант 1

Таблица 15 – Исходные данные

Номер предприятия Номер предприятия
3,6 6,3
3,6 6,4
3,9
4,1 7,5
3,9 7,9
4,5 8,2
5,3
5,3 8,6

Вариант 2

Таблица 16 – Исходные данные

Номер предприятия Номер предприятия
3,5 6,3
3,6 6,4
3,9
4,1 7,5
4,2 7,9
4,5 8,2
5,3 8,4
5,3 8,6
5,6 9,5

Вариант 3

Таблица 17 – Исходные данные

Номер предприятия Номер предприятия
3,7 6,3
3,7 6,4
3,9 7,2
4,1 7,5
4,2 7,9
4,9 8,1
5,3 8,4

Вариант 4

Таблица 18 – Исходные данные

Номер предприятия Номер предприятия
3,5 6,3
3,6 6,5
3,9 7,2
4,1 7,5
4,2 7,9
4,5 8,2
5,3 8,4
5,5 8,6
5,6 9,5
6,1 9,6

Вариант 5

Таблица 19 – Исходные данные

Номер предприятия Номер предприятия
3,6 6,3
3,6 6,9
3,7 7,2
4,1 7,8
4,3 8,1
4,5 8,2
5,4 8,4
5,5 8,8

Вариант 6

Таблица 20 – Исходные данные

Номер предприятия Номер предприятия
3,5 6,3
3,6 6,8
3,8 7,2
4,2 7,9
4,3 8,1
4,7 8,3
5,4 8,4
5,6 8,8
5,9 9,6
6,1 9,7
6.0

Вариант 7

Таблица 21 – Исходные данные

Наши рекомендации