Пример выполнения задания. По предприятиям региона изучается зависимость выработки продукции на одного
По предприятиям региона изучается зависимость выработки продукции на одного работника (Д.Е.) от ввода в действие новых основных фондов ( от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих ( ).
Таблица 13 – Исходные данные
Номер предприятия | Номер предприятия | ||||||
7,0 | 3,9 | 10,0 | 9,0 | 6,0 | 21,0 | ||
7,0 | 3,9 | 14,0 | 11,0 | 6,4 | 22,0 | ||
7,0 | 3,7 | 15,0 | 9,0 | 6,8 | 22,0 | ||
7,0 | 4,0 | 16,0 | 11,0 | 7,2 | 25,0 | ||
7,0 | 3,8 | 17,0 | 12,0 | 8,0 | 28,0 | ||
7,0 | 4,8 | 19,0 | 12,0 | 8,2 | 29,0 | ||
8,0 | 5,4 | 19,0 | 12,0 | 8,1 | 30,0 | ||
8,0 | 4,4 | 20,0 | 12,0 | 8,5 | 31,0 | ||
8,0 | 5,3 | 20,0 | 14,0 | 9,6 | 32,0 | ||
10,0 | 6,8 | 20,0 | 14,0 | 9,0 | 36,0 |
Требуется:
1.Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
2.Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3.Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
4.С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .
5.С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .
6.Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
7.Осуществить проверку результатов решения с помощью MS Excel.
Решение
Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу 14.
Таблица 14 – Вспомогательная таблица для расчета недостающих показателей
№ | |||||||||
7,0 | 3,9 | 10,0 | 27,3 | 70,0 | 39,0 | 15,21 | 100,0 | 49,0 | |
7,0 | 3,9 | 14,0 | 27,3 | 98,0 | 54,6 | 15,21 | 196,0 | 49,0 | |
7,0 | 3,7 | 15,0 | 25,9 | 105,0 | 55,5 | 13,69 | 225,0 | 49,0 | |
7,0 | 4,0 | 16,0 | 28,0 | 112,0 | 64,0 | 16,0 | 256,0 | 49,0 | |
7,0 | 3,8 | 17,0 | 26,6 | 119,0 | 64,6 | 14,44 | 289,0 | 49,0 | |
7,0 | 4,8 | 19,0 | 33,6 | 133,0 | 91,2 | 23,04 | 361,0 | 49,0 | |
8,0 | 5,4 | 19,0 | 43,2 | 152,0 | 102,6 | 29,16 | 361,0 | 64,0 | |
8,0 | 4,4 | 20,0 | 35,2 | 160,0 | 88,0 | 19,36 | 400,0 | 64,0 | |
8,0 | 5,3 | 20,0 | 42,4 | 160,0 | 106,0 | 28,09 | 400,0 | 64,0 | |
10,0 | 6,8 | 20,0 | 68,0 | 200,0 | 136,0 | 46,24 | 400,0 | 100,0 | |
9,0 | 6,0 | 21,0 | 54,0 | 189,0 | 126,0 | 36,0 | 441,0 | 81,0 | |
11,0 | 6,4 | 22,0 | 70,4 | 242,0 | 140,8 | 40,96 | 484,0 | 121,0 | |
9,0 | 6,8 | 22,0 | 61,2 | 198,0 | 149,6 | 46,24 | 484,0 | 81,0 | |
11,0 | 7,2 | 25,0 | 79,2 | 275,0 | 180,0 | 51,84 | 625,0 | 121,0 | |
12,0 | 8,0 | 28,0 | 96,0 | 336,0 | 224,0 | 64,0 | 784,0 | 144,0 | |
12,0 | 8,2 | 29,0 | 98,4 | 348,0 | 237,8 | 67,24 | 841,0 | 144,0 | |
12,0 | 8,1 | 30,0 | 97,2 | 360,0 | 243,0 | 65,61 | 900,0 | 144,0 | |
12,0 | 8,5 | 31,0 | 102,0 | 372,0 | 263,5 | 72,25 | 961,0 | 144,0 | |
14,0 | 9,6 | 32,0 | 134,4 | 448,0 | 307,2 | 92,16 | 1024,0 | 196,0 | |
14,0 | 9,0 | 36,0 | 126,0 | 504,0 | 324,0 | 81,0 | 1296,0 | 196,0 | |
Сумма | 123,8 | 1276,3 | 2997,4 | 837,74 | 10828,0 | 1958,0 | |||
Ср. знач. | 9,6 | 6,19 | 22,3 | 63,815 | 229,05 | 149,87 | 41,887 | 541,4 | 97,9 |
Найдем средние квадратические отклонения признаков:
;
;
.
1.Вычисление параметров линейного уравнения множественной регрессии.
Для нахождения параметров линейного уравнения множественной регрессии
необходимо решить следующую систему линейных уравнений относительно неизвестных параметров , , :
либо воспользоваться готовыми формулами:
; ;
.
Рассчитаем сначала парные коэффициенты корреляции:
;
;
.
Находим
;
;
.
Таким образом, получили следующее уравнение множественной регрессии:
.
Коэффициенты и стандартизованного уравнения регрессии находятся по формулам:
;
.
Т.е. уравнение будет выглядеть следующим образом:
.
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
.
Вычисляем:
; .
Т.е. увеличение основных фондов (от своего среднего значения) и удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,61% или 0,20% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем
фактора .
2.Коэффициенты парной корреляции мы уже нашли:
; ; .
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. ). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
;
.
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициент множественной корреляции определяется через матрицу парных коэффициентов корреляции:
,
где
– определитель матрицы парных коэффициентов корреляции;
– определитель матрицы межфакторной корреляции.
;
.
Коэффициент множественной корреляции
.
Аналогичный результат получим при использовании других формул:
;
;
.
Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом.
3.Нескорректированный коэффициент множественной детерминации оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более ) детерминированность результата в модели факторами и .
4.Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера:
.
В нашем случае фактическое значение -критерия Фишера:
.
Получили, что (при ), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
5.С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:
;
.
Найдем и .
;
.
Имеем
;
.
Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .
6.Общий вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии:
, .
Решение задачи MS EXCEL
Записываем исходные данные в таблицу MS Excel:
Рисунок 8 - Лист Excel Исходные данные
Найдем матрицу парных коэффициентов корреляции (Данные→Анализ данных→Корреляция)
Рисунок 9 - Диалоговое окно функции Корреляция
Получаем следующий результат (рис. 10).
Рисунок 10 - Лист Excel Матрица парных коэффициентов
Из матрицы парных коэффициентов видно, что ryx1= 0,9699; ryx2= 0,9408;rx1x2= 0,9428.
С помощью инструмента Регрессия (Данные→Анализ данных→Регрессия) получаем следующие результаты (рис.11)
Рисунок 11 - Результаты решения задачи с использованием MS Excel.
Проанализировав результаты решения задачи с помощью MS Excel, делаем вывод, что все ранее проведенные расчеты показателей множественной регрессии совпадают с итогами полученными в данном решении.
Вопросы для самоконтроля:
1. Какие функции чаще всего используются при построении уравнения множественной регрессии?
2. Какие задачи решаются при построении регрессии?
3. Каким требованиям должны отвечать факторы модели множественной регрессии и почему?
4. Объясните практическое применение в экономике частных коэффициентов эластичности.
5. Как вычисляется индекс корреляции?
6. Как вычисляется и что показывает индекс детерминации?
7. В чем заключается смысл расчета скорректированного индекса корреляции?
8. Какова связь скорректированного индекса корреляции с индексом корреляции при различных количествах вводимых в модель факторах?
9. Какой вид имеет система нормальных уравнений метода наименьших квадратов в случае множественной линейной регрессии?
10. Что такое стандартизированные переменные?
3 Выбор варианта контрольной работы.
Выбор варианта задания осуществляется следующим образом (см. таблицу 25.
Пример выбора варианта задания:
Студент: Малахов Иван Петрович
Шифр зачетной книжки: 20119
Вариант задания контрольной работы 9,4 (I задача- вариант № 9; II задача – вариант № 4)
Работа включает в себя выполнение двух задач:
- парная регрессия и корреляция
- множественная регрессия и корреляция
Таблица 25 - Выбор варианта контрольной работы
Первая буква фамилии | Последняя цифра номера зачетной книжки | ||||
1,0 | 2,9 | 3,8 | 4,7 | 5,6 | |
А, Ж, С | 5,3 | 6,4 | 5,6 | 7,8 | 9,10 |
Б, З, Ю | 7,2 | 2,5 | 7,6 | 8,9 | 9,5 |
В, И, Ц, Ч | 5,4 | 2,3 | 2,7 | 3,8 | 4,6 |
Г, Т, Щ | 1,5 | 1,10 | 2,8 | 3,7 | 10,8 |
Д, Л, Э | 1,6 | 6,9 | 2,9 | 3,6 | 4,9 |
Ф, Х, К | 5,7 | 1,8 | 7,4 | 8,5 | 4,10 |
Я, О, Ё, Н | 1,1 | 6,2 | 3,1 | 3,3 | 10,3 |
Е, У, П | 2,1 | 2,10 | 3,2 | 3,10 | 4,1 |
Р, Ш, М | 4,2 | 9,4 | 8,1 | 9,2 | 10,3 |
Варианты задач по теме «Парная регрессия и корреляция»
Задание
1.Построить линейное уравнение парной регрессии от .
2.Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3.Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
4.Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем:
- 115% от среднего уровня;
- 130% от среднего уровня.
5.Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
6.На одном графике построить исходные данные и теоретическую прямую.
7.Осуществить проверку результатов решения с помощью MS Excel.
Вариант 1
Таблица 3 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Вариант 2
Таблица 4 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Вариант 3
Таблица 5 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Вариант 4
Таблица 6 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Вариант 5
Таблица 7 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Вариант 6
Таблица 8 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Вариант 7
Таблица 9 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Вариант 8
Таблица 10 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Вариант 9
Таблица 11 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Вариант 10
Таблица 12 – Исходные данные
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного,Д.Е,(x) | Среднедневная заработная плата, Д.Е., (y) |
Варианты индивидуальных заданий по теме «Множественная регрессия и корреляция»
По предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%)
Требуется:
1.Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
2.Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3.Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
4.С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .
5.С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .
6.Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
7.Осуществить проверку полученных результатов с помощью Excel.
Вариант 1
Таблица 15 – Исходные данные
Номер предприятия | Номер предприятия | ||||||
3,6 | 6,3 | ||||||
3,6 | 6,4 | ||||||
3,9 | |||||||
4,1 | 7,5 | ||||||
3,9 | 7,9 | ||||||
4,5 | 8,2 | ||||||
5,3 | |||||||
5,3 | 8,6 |
Вариант 2
Таблица 16 – Исходные данные
Номер предприятия | Номер предприятия | ||||||
3,5 | 6,3 | ||||||
3,6 | 6,4 | ||||||
3,9 | |||||||
4,1 | 7,5 | ||||||
4,2 | 7,9 | ||||||
4,5 | 8,2 | ||||||
5,3 | 8,4 | ||||||
5,3 | 8,6 | ||||||
5,6 | 9,5 |
Вариант 3
Таблица 17 – Исходные данные
Номер предприятия | Номер предприятия | ||||||
3,7 | 6,3 | ||||||
3,7 | 6,4 | ||||||
3,9 | 7,2 | ||||||
4,1 | 7,5 | ||||||
4,2 | 7,9 | ||||||
4,9 | 8,1 | ||||||
5,3 | 8,4 |
Вариант 4
Таблица 18 – Исходные данные
Номер предприятия | Номер предприятия | ||||||
3,5 | 6,3 | ||||||
3,6 | 6,5 | ||||||
3,9 | 7,2 | ||||||
4,1 | 7,5 | ||||||
4,2 | 7,9 | ||||||
4,5 | 8,2 | ||||||
5,3 | 8,4 | ||||||
5,5 | 8,6 | ||||||
5,6 | 9,5 | ||||||
6,1 | 9,6 |
Вариант 5
Таблица 19 – Исходные данные
Номер предприятия | Номер предприятия | ||||||
3,6 | 6,3 | ||||||
3,6 | 6,9 | ||||||
3,7 | 7,2 | ||||||
4,1 | 7,8 | ||||||
4,3 | 8,1 | ||||||
4,5 | 8,2 | ||||||
5,4 | 8,4 | ||||||
5,5 | 8,8 |
Вариант 6
Таблица 20 – Исходные данные
Номер предприятия | Номер предприятия | ||||||
3,5 | 6,3 | ||||||
3,6 | 6,8 | ||||||
3,8 | 7,2 | ||||||
4,2 | 7,9 | ||||||
4,3 | 8,1 | ||||||
4,7 | 8,3 | ||||||
5,4 | 8,4 | ||||||
5,6 | 8,8 | ||||||
5,9 | 9,6 | ||||||
6,1 | 9,7 | ||||||
6.0 |
Вариант 7
Таблица 21 – Исходные данные