Практический пример построения прогноза на основе регрессионного анализа.

Специалист планово-экономического отдела (ПЭО) машиностроительного завода изучает цены и объемы продажи изделия, выбрав произвольным образом десять недель. Собранные им данные представлены в табл. 4.2.

Таблица 4.2

Данные о продаже изделия

Номер недели Количество проданного изделия (тыс. шт) - Y Цена одного изделия (усл. ед) - Х
1,3
2,0
1,7
1,5
1,6
1,2
1,6
1,4
1,0
1,1

Решение.

Этап 1. Для наглядного изображения исходных данных и дальнейшего анализа и прогнозирования составляется диаграмма рассеивания для исходных данных, представленная на рис. 4.3.

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru Рис. 4.3. Диаграмма рассеивания

Диаграмма показывает, что имеет место обратная линейная зависимость между переменной Y (количеством проданных изделий) и переменной X (ценой одного изделия). Можно сделать вывод, что при возрастании цены объем продаж уменьшается.

Таким образом, далее целесообразно оценить количественную меру обнаруженной зависимости. Для этого вычисляется выборочный коэффициент корреляции на основе формулы 4.19.

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru . (4.19)

Вспомогательные расчеты представляются в таблице 4.3.

Таблица 4.3

Расчеты коэффициента корреляции

n=10 Y X XY Y2 Х2
    10,0 1,3 13,00 100,00 1,69
6,0 2,0 12,00 36,00 4,00
5,0 1,7 8,50 25,00 2,89
12,0 1,5 18,00 144,00 2,25
10,0 1,6 16,00 100,00 2,56
15,0 1,2 18,00 225,00 1,44
5,0 1,6 8,00 25,00 2,56
12,0 1,4 16,80 144,00 1,96
17,0 1,0 17,00 289,00 1,00
20,0 1,1 22,00 400,00 1,21
Сумма 112,0 14,4 149,30 1488,00 21,56

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Расчеты коэффициента корреляции достаточно просто можно провести в Excel: Сервис → Анализ данных → Корреляция.

По результатам расчетов значение выборочного коэффициента корреляции, равное -0,86, указывает на довольно тесную обратную зависимость между переменными Y и Х, т.е. при возрастании цены одного изделия количество продаваемых изделий падает.

При этом возникает следующий вопрос: на сколько уменьшается продажа изделий при увеличении его цены? В данном случае на диаграмме рассеивания можно провести прямую, проходящую достаточно близко от отмеченных точек. Тогда наклон прямой покажет, на сколько изделий в среднем будет уменьшаться величина Y при увеличении величины Х на одну усл. ед.

Этап 2.Провести требуемую прямую, визуально сориентировав ее так, чтобы она находилась как можно ближе к отмеченным на диаграмме точкам, можно по-разному. Необходим такой способ нахождения прямой наилучшего приближения, при использовании которого любой человек будет получать один и тот же результат для заданного набора данных. Для однозначного определения прямой наилучшего приближения чаще всего применяется критерий наименьших квадратов.

С помощью метода наименьших квадратов вычисляются оценки коэффициентов регрессии для данных специалиста ПЭО. Вычисления проводятся на основе уравнений 4. 3 и 4. 4, а также числовых значений из табл. 4.3. Определяется следующее:

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ,

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Тогда уравнение прямой регрессии, определенное по методу наименьших квадратов, будет иметь следующий вид:

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru . (4.21)

Смысл коэффициентов из этого уравнения: свободный член Практический пример построения прогноза на основе регрессионного анализа. - student2.ru — это значение Y при X, равном нулю. Формально интерпретируя уравнение, получаем, что при Х = 0 (т.е. при нулевой стоимости изделия) среднее количество продаваемых изделий будет равно 32 140. Это не соответствует здравому смыслу. Данная проблема связана с прогнозом значений Y для значений X,заметно отличающихся от тех, которые представлены в выборке данных. Так, в выборке нет величин X, близких к нулю. В этой ситуации, как и во многих других случаях применения регрессионного анализа, разумная интерпретация свободного члена уравнения регрессии не представляется возможной.

В общем случае неразумно прогнозировать значения Y для тех X, которые лежат вне множества значений переменной X, встречающихся в выборке. Функцию регрессии следует считать подходящей аппроксимацией реальной ситуации только в той области, из которой взяты анализируемые данные. Экстраполяция функции вне этой области возможна только при справедливости достаточно ограничивающего предположения о том, что характер зависимости Y от X при этом не изменяется.

Угловой коэффициент Практический пример построения прогноза на основе регрессионного анализа. - student2.ru можно интерпретировать как среднее изменение величины Y при возрастании Х на единицу. В данном примере Y в среднем уменьшается на 14 540 (т.е. будет продано на 14 540 тыс. шт. меньше) при возрастании X на единицу (т.е. при возрастании цены изделия на одну усл. ед.). Каждое увеличение цены на одну усл. ед. уменьшает объем продажи в среднем на 14 540 изделий, т.е. наша выборка показывает, что увеличение цены на одну усл. ед. уменьшает количество продаваемых изделий на 14,54.

Связь значений переменных X и Y может быть проиллюстрирована на диаграмме рассеивания путем проведения прямой, являющейся наилучшим приближением этой зависимости (рис. 4.4).

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Рис. 4.4. Данные прогноза

Обратите внимание на то, что вертикальные отрезки от точек данных до прямой проведены пунктиром. Сумма квадратов длин отрезков, проведенных к этой прямой, должна быть меньше аналогичной суммы квадратов длин, проведенных к любой другой прямой. (Для данных специалиста ПЭО сумма квадратов длин равна SSЕ = 59,14). Из мето­да наименьших квадратов следует, что данная прямая является наилучшим приближением для заданных 10 точек исходных данных.

Этап 3.Определение стандартной ошибки.

Для данных специалиста ПЭО стандартная ошибка оценки равна следующему:

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Для величины Y принимающей значения от 3 до 18 (рис. 4.4), значение Практический пример построения прогноза на основе регрессионного анализа. - student2.ru = 2,72 до­вольно велико и указывает, что существенная часть вариации величины Y (количества проданных изделий) не объясняется изменением величины X (цены). Это утверждение будет исследовано позже.

Этап 4. Прогнозирование величины Y.

Предположительно специалист хочет получить прогноз количества изделий, которое будет продано при цене 1,63 усл. ед. за штуку. Из уравнения (4.21) получается 8440 штук.

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Данный прогноз — это значение величины Y. Поэтому интересующий прогноз будет координатой Y точки с координатой X = 1,63 на регрессионной прямой.

Конечно, реальные значения величины Y, соответст­вующие рассматриваемым значениям величины X, к сожалению, не лежат в точности на регрессионной прямой. Фактически они разбросаны относительно прямой в соответствии с величиной Практический пример построения прогноза на основе регрессионного анализа. - student2.ru . Более того, выборочная (построенная графически) регрессионная прямая является оценкой регрессионной прямой генеральной совокупности, основанной на выборке всего лишь из 10 пар данных. Другая случайная выборка 10 пар данных даст иную выборочную прямую регрессии; это аналогично ситуации, когда различные выборки из одной и той же генеральной совокупности дают различные значения выборочного среднего.

Графически 95%-ный интервал прогноза значений Y для данных специалиста представлен на рис. 4.5.

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Y
Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Рис. 4.5. 95%-ный интервал прогноза значений Y

Используя результаты из табл. 4.3 и уравнения 4.11, где X =1,44 , определяется стандартная ошибка прогноза в точке X = 1,63.

Таблица 4.4

Расчет стандартной ошибки прогноза

X Практический пример построения прогноза на основе регрессионного анализа. - student2.ru
1,3 0,0196
2,0 0,3136
1,7 0,0676
1,5 0,0036
1,6 0,0256
1,2 0,0576
1,6 0,0256
1,4 0,0016
1,0 0,1936
1,1 0,1156
Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

При Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и X=1,63, используя уравнение 11, определяется 95%-ный интервал прогноза значений Y:

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru =8,44 Практический пример построения прогноза на основе регрессионного анализа. - student2.ru 2,306*2,91=8,44 Практический пример построения прогноза на основе регрессионного анализа. - student2.ru 6,71

или (1,73;15,15), т.е. от 1730 до 15150 штук.

Здесь 2,306= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru - это нижний 2,5%-ый квантиль; t – распределения с 8 степенями свободы.

Интервал прогноза настолько велик, что практически бесполезен для прогнозирования значений величины Y. Это связано с тем, что исходная выборка мала, а значение Практический пример построения прогноза на основе регрессионного анализа. - student2.ru сравнительно велико. Степень неопределенности, представленная большим интервалом прогноза, не видна по отдельным точечным прогнозам, полученным из функции регрессии. Значительным преимуществом интервальной оценки является явное отражение неопределенности, связанной с прогнозом.

Вообще говоря, опасно использовать регрессионную функцию для предсказания значений величины Y вне области имеющихся данных. Специалист вполне оправданно пытается получить прогноз для величины Y при Х= 1,63, поскольку некоторые из имеющихся в исходных данных значений X близки к 1,63. С другой стороны, нельзя прогнозировать значение Y при X=3,00. Среди исходных данных нет таких больших значений X и поэтому любой прогноз значения Y для подобного значения X очень сомнителен. При попытке оценить количество изделий, которое может быть продано по цене 3 усл. ед. за штуку, специалист должен исходить из предположения, что при подобных значениях цены линейная модель остается верной. У него могут быть определенные причины считать так, однако никаких явных свидетельств этого не существует.

Этап 5.Разложение дисперсии.

Специалист ПЭО начал свой анализ данных с информации об объемах продаж только за 10 недель (переменная Y). Если другой информации не поступит, он может использовать выборочное среднее Y=11,2 как прогноз количества продаваемых изделий для каждой недели. Ошибки или отклонения, связанные с этим прогнозом, равны Y - Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , и сумма квадратов ошибок даст Практический пример построения прогноза на основе регрессионного анализа. - student2.ru . Последнее значение, Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ,в точности равно SST, обшей сумме квадратов, введенной в уравнение 5.10. Таким образом, SSТ измеряет отклонение значе­ния Y от прогноза, использующего лишь значения Y в его вычислении. (Если анализ остановить на этом этапе, отклонения Y следует измерять выборочной дисперсией Практический пример построения прогноза на основе регрессионного анализа. - student2.ru вместо SST= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru . Выборочная дисперсия является обычной мерой из­менчивости наблюдений одной переменной.) Прогноз величины Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , значения отклонения Y - Практический пример построения прогноза на основе регрессионного анализа. - student2.ru суммы квадратов SST= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru приведены в табл. 4.5. (Сумма отклонений Y — Практический пример построения прогноза на основе регрессионного анализа. - student2.ru всегда равна нулю, поскольку среднее Практический пример построения прогноза на основе регрессионного анализа. - student2.ru является математическим центром значений Y).

Таблица 4.5

Отклонения для данных прогноза и значения прогноза Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Данные Y Прогноз Y ( Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ) Отклонения (Y- Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ) (Y- Практический пример построения прогноза на основе регрессионного анализа. - student2.ru )2
11,2 -1,2 1,44
11,2 -5,2 27,04
5,0 11,2 -6,2 38,44
12,0 11,2 0,8 0,64
10,0 11,2 -1,2 1,44
15,0 11,2 3,8 14,44
5,0 11,2 -6,2 38,44
12,0 11,2 0,8 0,64
17,0 11,2 5,8 33,64
20,0 11,2 8,8 77,44
Сумма: 0,0 233,6

Прогнозист также имеет информацию о значениях переменной X (о цене одного изделия), соответствующих величинам Y. (r = -0,86.) Можно ожидать, что с помощью этой дополнительной переменной мы сможем объяснить часть изменчивости (разностей) значений Y, не объясненной прогнозом Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

По расчетам линейный прогноз пар значений Х-Y задается уравнением Практический пример построения прогноза на основе регрессионного анализа. - student2.ru = 32,14 - 14,54X. Таблица, подобная табл. 5.5, может быть построена при Практический пример построения прогноза на основе регрессионного анализа. - student2.ru в качестве прогноза значений Y.Результат приводится в табл. 4.6. (Если свободный член включен в уравнение регрессии, сумма отклонений Практический пример построения прогноза на основе регрессионного анализа. - student2.ru всегда равна нулю).

Таблица 4.6

Отклонения для данных при значении прогноза Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

X Y Прогноз Y ( Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ), использующий уравнение Практический пример построения прогноза на основе регрессионного анализа. - student2.ru Отклонения (Y- Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ) (Y- Практический пример построения прогноза на основе регрессионного анализа. - student2.ru )2
1,3 10,0 13,238 -3,238 10,485
2,0 6,0 3,06 2,940 8,644
1,7 5,0 7,422 -2,422 5,866
1,5 12,0 10,33 1,670 2,789
1,6 10,0 8,876 1,124 1,263
1,2 15,0 14,692 0,308 0,095
1,6 5,0 8,876 -3,876 15,023
1,4 12,0 11,784 0,216 0,047
1,0 17,0 17,6 -0,600 0,360
1,1 20,0 16,146 3,854 14,853
Сумма: 0,0 59,41

Сравнение табл. 4.5 и 4.6показывает, что использование Практический пример построения прогноза на основе регрессионного анализа. - student2.ru в качестве прогноза значения Y приводит, вообще говоря, к меньшим отклонениям (по абсолютной величине) и существенно меньшим суммам квадратов остатков (ошибок), чем применение для прогноза значения Практический пример построения прогноза на основе регрессионного анализа. - student2.ru . Использование соответствующих значений X уменьшает ошибку прогноза (предсказания). Таким образом, знание значений X помогает лучше объяснить разности Y. Но в какой мере может помочь знание значений X? Ответ на этот вопрос можно получить посредством раз­биения изменчивости.

Используя данные из табл. 4.5, 4.6 и уравнение 4.14, имеется

SST= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru =233,6;

SSE= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru =59,41

и, следовательно,

SSR= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru = SST- SSE = 233,6 - 59,41 = 174,19.

Разбиение изменчивости является следующим:

SST = SSR + SSE
233,6 = 174,19 + 59,41
Общая вариация Объясненная вариация Необъясненная вариация

Для изменчивости, оставшейся после предсказания Y через значение Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , специалист по­лучил следующее значение:

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Это та часть, которая объясняется взаимосвязью значений Y и X. Доля вариации Y относительно Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , равная 1 – 0,75 = 0,25, осталась необъясненной. С этой точки зрения знание значений соответствующей переменной X приводит к лучшему прогнозу значений Y, чем прогноз, полученный из значения Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , не зависящего от Х.

Разбиение изменчивости для данных прогноза может быть представлено в таблице анализа дисперсии ANOVA, общий вид которой представлен в табл. 4.1., 4.7.

Таблица 4.7

Таблица ANOVA по данным прогноза

Источник Сумма квадратов Степени свободы Среднеквадратическое отклонение
Регрессия 174,19 174,19
Ошибки 59,41 7,43
Общая 233,6  

Разбиение изменчивости ясно показано в столбце с суммами квадратов. Необходимо обратить внимание на то, что с учетом погрешности округления MSE=7,43=(2,72)2 = Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Этап 6.Расчеткоэффициента детерминации r2 .

Для данных прогнозиста коэффициент был вычислен ранее. Значение коэффициента детерминации также можно легко получить из таблицы ANOVA, представленной табл. 5.7.

SST= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru =233,6; SSR= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru = 174,19; SSE= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru =59,41

и r2= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Кроме того, r2 можно вычислить следующим образом:

r2= Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Около 75% изменчивости количества проданных штук изделий (Y) можно объяснить разницей в цене изделия (X). Около 25% изменчивости количества проданного молока нельзя объяснить изменением цены. Эта часть изменчивости может быть объяснена влиянием фак­торов, не учтенных в проведенном регрессионном анализе (например, рекламой, возможно­стью замены изделий, качеством материалов и т.п.).

В случае прямолинейной регрессии коэффициент детерминации r2 равен квадрату коэффициента корреляции r:

коэффициент детерминации = (коэффициент корреляции)2,

r2 = (r)2.

Значит для данных специалиста, с учетом погрешности округления,

0,746 = (-0,843)2.

Почему в регрессионном анализе коэффициенты r и r2 необходимо рассматривать отдельно? Причина в том, что они несут различную информацию.

Коэффициент корреляции выявляет не только силу, но и направление линейной связи. В случае данных, собранных прогнозистом, имеет место отрицательная взаимосвязь (r = -0,86). В других случаях значение r может указывать на положительную взаимосвязь. Когда существует дело с большим набором переменных, иногда полезно учитывать характер взаимосвязи в некоторых парах переменных. Следует отметить, что когда коэффициент корреляции возводится в квадрат, полученное значение всегда будет положительным и информация о характере взаимосвязи теряется.

Коэффициент детерминации r2 измеряет силу взаимосвязи между Y и X иначе, чем коэффициент корреляции r. Значение r2 измеряет долю изменчивости Y, объясненную разницей значений X. Эту полезную интерпретацию можно обобщить на взаимосвязь между Y и более чем одной переменной X.

На рис. 4.6 иллюстрируется два крайних случая для значения коэффициента r2: r2 = 0 и r2=1. В случае (а) изменчивость Y никак не объясняется изменениями X: диаграмма рассеивания не показывает никакой линейной взаимосвязи между значениями величин X и Y. В случае (б), когда коэффициент r2 = 1, изменчивость Y полностьюобъясняется, если известны значения X: все точки данных в нашей выборке лежат на прямой регрессии.

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

X
Практический пример построения прогноза на основе регрессионного анализа. - student2.ru Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru Практический пример построения прогноза на основе регрессионного анализа. - student2.ru Практический пример построения прогноза на основе регрессионного анализа. - student2.ru Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru а) линейная корреляция отсутствует б) четко выраженная линейная корреляция

Рис. 4.6. Интерпретация крайних значений коэффициента детерминации r2

Примечание. Проведенные расчеты представленных и прогнозируемых данных по всем пунктам можно проверить с помощью компьютерных расчетов в Excel – функции регрессионного анализа.

Задание лабораторной работы.

Примечание. В большинстве из приведенных ниже упражнений представлены данные, предназначенные для обработки с помощью процедур регрессионного анализа. Хотя в одном или двух случаях возможно, и даже полезно, выполнение необходимых вычисле­ний вручную, для студента важно научиться использовать компьютер для решения подобных задач.

Общие задания для выбранных по вариантам задач.

1. Существует ли значимая взаимосвязь между рассматриваемыми показателями Х и Y, пояснить какая.

2. Построить диаграмму рассеивания для имеющихся данных.

3. Вычислить коэффициент корреляции и интерпретировать его значения.

4. Определить регрессионную прямую методом наименьших квадратов.

5. Проверить значимость углового коэффициента на 5%-ном уровне значимости. Является ли значимым коэффициент корреляции? Объяснить полученные результаты.

6. Определить уравнение регрессии.

7. Построить таблицу ANOVA, рассмотреть остатки.

8. Составьте отчет, содержащий объяснения по результатам выполненного анализа.

Вариант 1. Рассмотрите данные в табл. 4.8., где в столбце X приведены суммы еженедельных расходов на рекламу АЗС, а в столбце Практический пример построения прогноза на основе регрессионного анализа. - student2.ru — еженедельный объем продаж. Используя эти данные, ответьте на вопросы 1, 7, 8.

Таблица 4.8

Исходные данные

Y (усл. ед.) Х(усл. ед.) Y (усл. ед.) Х (усл. ед.)

Необходимо определить уравнение для расчета прогноза результирующего показателя. Какой процент вариаций показателя Х, Y объясняется уравнением прогноза? Составить прогноз показателя Y при составляющих (п+1) значения (выбор значения Х произвольное).

Определить величину необъясненной и общей вариации.

Вариант 2. Сведения о времени, затраченном на обслуживание станка, и соответствующих объемах произведенных изделий приведены в табл. 4.9. Используя эти данные, ответить на вопросы 1,2,3,5,7,8.

Таблица 4.9

Исходные данные

Время обслуживания (мин.) Объем изделий (усл. ед.) Время обслуживания (мин.) Объем изделий (усл. ед.)
3,6 30,6 1,8 6,2
4,1 30,5 4,3 40,1
0,8 2,4 0,2 2,0
5.7 42,2 2,6 15,5
3,4 21,8 1,3 6,5

Вычислить точечную и 99%-ную интервальную оценку величины Y при Х= 3,0.

Вариант 3. Служащему автобусного парка необходимо определить, существует ли положительная взаимосвязь между годовыми расходами на содержание автобуса и сроком его эксплуатации. Если подобная взаимосвязь будет обнаружена, он сможет лучше планировать размер годового бюджета автобусного парка. Им собраны данные, приведенные в табл. 4.10. Используя эти данные, ответьте на вопросы 2,3,4,5,7,8.

Спрогнозировать стоимость годового содержания автобуса, который находится в эксплуатации уже пять лет.

Таблица 4.10

Исходные данные

Автобус Расходы на содержание (долл.) Срок эксплуатации (годы) Автобус Расходы на содержание (долл.) Срок эксплуатации (годы)
     

Вариант 4. Необходимо составить прогноз объемов продаж книг в мягких обложках за неделю, основываясь на суммарной длине книжных полок в магазине (в ед. изм.). Выборочные данные за 11 недель представлены в табл. 4.11. Используя эти данные, необходимо ответить на вопросы 1 - 5,7,8.

Спрогнозировать количество книг, продаваемых за неделю при суммарной длине книжной полки в магазине, равной 4 ед. изм.

Таблица 4.11

Исходные данные

Неделя Количество проданных книг, Y Суммарная длина книжных полок (ед. изм.), X
6,8
3,3
4,1
4,2
4,8
3,9
4,9
7,7
3,1
5,9
5,0

Вариант 5. В табл.4.12 приведена информация по 12 различным городам, где продаются товары по почте. Используя данные, ответьте на вопросы 6,7,8. Вычислите стандартную ошибку оценки. Определите, имеется ли значимая линейная взаимосвязь между этими двумя переменными (при уровне значимости 0,05). Какой процент изменчивости переменной количества заказов объясняется переменной количества распространенных каталогов? Проверьте, будет ли угловой коэффициент существенно отличаться от нуля (используйте уровень значимости 0,01). Постройте 90%-ный интервал прогноза для количества полученных заказов, если считать, что было распространено 10 000 каталогов.

Таблица 4.12

Исходные данные

Город Количество заказов на товары (тыс. шт) Количество распространенных каталогов (тыс. шт)
A
B
C
D
E
F
G
H
I
J
K
L

Вариант 6. В табл. 4.13 приведены размеры банковских вкладов и начисляемых процентов за 10 лет. Используя эти данные, ответьте на вопросы 1,3,7,8.

Таблица 4.13

Исходные данные

Размеры вкладов (тыс. усл. ед.) Средний банковский процент
4,8
5,1
5,9
5,1
4,8
3,8
3,7
4,5
4.9
6,2

Может ли быть найдено эффективное уравнение прогноза? Спрогнозируйте объем вкладов, если банковская ставка будет равна 4%?

Вариант 7. Аналитиком компании выявлена положительная зависимость между общим количеством выданных разрешений на строительство и объемом работ, за которые могла бы взяться его компания. Теперь необходимо выяснить, можно ли использовать информацию о размере банковской учетной ставки для прогнозирования количества разрешений на строительство, выдаваемых за месяц. Соответствующие данные, собранные за девять месяцев, представлены в табл. 4.14. Используя эти данные, ответьте на вопросы 2,5,6,7,8.

Таблица 4.14

Исходные данные

Месяц Количество разрешений на строительство, Y Банковская учетная ставка, X
10,2
12,6
13,5
9,7
10,8
9.5
10,9
9,2
14,2

На сколько уменьшается в среднем количество разрешений на строительство при возрастании банковской ставки на 1%? Вычислите значение коэффициента детерминации, поясните его.

Вариант 8. На одном из этапов процесса производства электромоторов используется фрезерный станок для изготовления канавок на оси мотора. Каждая партия осей тестируется, и все изделия, размеры которых не соответствуют заданным параметрам, бракуются. Перед изготовлением каждой партии осей фрезерный станок необходимо настроить.

С целью определения оптимального размера партии необходимо выяснить, как размер партии будет влиять на количество бракованных осей. Для этой цели использовать данные о 13 партиях изделий среднего размера, приведенные в табл. 4.15. Используя эти данные, ответьте на вопросы 1,5,7,8. Спрогнозируйте количество бракованных осей для партии размером в 300 изделий.

Таблица 4.15

Исходные данные

Партия Количество бракованных изделий Размер партии Партия Количество бракованных изделий Размер партии
     

Вариант 9. В табл. 4.16 представлены данные, собранные при проведении исследований по оценке стоимости недвижимости. Приведенные в таблице величины — это оценка стоимости в городской книге инвентаризации, X, и рыночная цена продажи, Y,(в тыс. усл. ед.) для п = 30 домов, проданных в течение одного года в определенном районе. Используя эти данные, ответьте на вопросы 2,3,7,8.

Таблица 4.16

Исходные данные

Дом Оценка инвентаризации (тыс. усл. ед.) Рыночная стоимость (тыс. усл. ед.) Дом Оценка инвентаризации (тыс. усл. ед.) Рыночная стоимость (тыс. усл. ед.)
68,2 87,4 74,0 88,4
74,6 88,0 72,8 93,6
64,6 87,2 80,4 92,8
80,2 94,0 74,2 90,6
76,0 94,2 80,0 91,6
78,0 93,6 81,6 92,8
76,0 88,4 75,6 89,0
77,0 92,2 79,4 91,8
75,2 90,4 82,2 98,4
72,4 90,4 67,0 89,8

Продолжение табл. 4. 16

80,0 93,6 72,0 97,2
76,4 91,4 73,6 95,2
70,2 89,6 71,4 88,8
75,8 91,8 81,0 97,4
79,2 94,8 80,6 95,4

Используя модель линейной регрессии, определите прямую регрессионной зависимости рыночной стоимости от цены инвентаризации.

Является ли регрессионная зависимость значимой? Объясните свой ответ. Спрогнозируйте рыночную стоимость дома, цена инвентаризации которого равна 90,5 тыс. долл. Не опасно ли делать такой прогноз?

Тема: Многомерный регрессионный анализ

Лабораторная работа № 5

1. Цель и содержание лабораторной работы.

В простой линейной регрессии рассматривалась взаимосвязь между независимой и зависимой переменными. Связь между двумя переменными часто позволяет точно предсказать значение зависимой переменной, если известно значение независимой переменной. Однако для точного прогнозирования зависимой переменной обычно требуется знать значения более чем одной независимой переменной. Регрессионные модели с несколькими независимыми переменными называются моделями многомерной регрессии.

Выборуравнения многомерной регрессии с наиболее подходящими для прогноза переменными проводится следующим образом:

1. Определение набора возможных независимых переменных.

2. Исключение переменных, не имеющих существенного отно-шения к решению поставленной задачи (если переменная характеризуется значительными ошибками измерения, дублирует другие независимые переменные (мультиколлинеарность), точные данные по ней недоступны);

3. Выбор окончательного вида уравнения с «наилучшими» независимыми переменными, при этом решается задача обеспечения наилучшего прогноза с наименьшими затратами.

Области применения многомерного регрессионного анализа различны:

- отражение взаимосвязи уровня зарплаты работников с географическим расположением компаний, уровнем безработицы в регионе, темпами роста промышленности, членством в союзах, отраслью промышленности или уровнем зарплаты в конкурирующих фирмах;

- анализ изменения цены на акции исходя из получаемых дивидендов, доходов от каждой акции, дробления акций, ожидаемой процентной ставки, объемов сбережений и уровня инфляции;

- исследование влияния на изменение мнения покупателей размеров рекламного бюджета, выбора средств информации, повторения информации, частоты рекламных акций или выбора рекламирующей персоны;

- анализ зависимости объема продаж от расходов на рекламу, уровня цен, маркетинговых расходов конкурентов и разовых заработков покупателей, а также от большого числа других переменных.

Таким образом, целью лабораторной работы является приобретение практических навыков построения уравнения многомерной регрессии предлагаемой социально-экономической ситуации с помощью инструмента анализа данных Excel.

2. Методические положения построения модели многомерной регрессии на основе практического примера.

В табл. 5.1 представлены исходные данные для проведения расчетов, где, Y – выработка продукции, Практический пример построения прогноза на основе регрессионного анализа. - student2.ru - коэффициент обновления основных фондов, Практический пример построения прогноза на основе регрессионного анализа. - student2.ru 2 - доля рабочих высокой квалификации.

Необходимо ответить на следующие вопросы:

1. Оценить показатели вариации каждого признака и сделать вывод о возможностях применения МНК для их изучения.

2. Проанализировать линейные коэффициенты парной и частной корреляции.

3. Написать уравнение множественной регрессии, оценить значимость его параметров, пояснить их экономический смысл.

Таблица 5.1

Исходные данные для многомерной регрессии

№ предприятия y x1 x2 № предприятия y x1 x2
3,9
3,9 6,4
3,7 6,8
7,2
3,8
4,8 8,2
5,4 8,1
4,4 8,5
5,3 9,6
6,8

4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и Практический пример построения прогноза на основе регрессионного анализа. - student2.ru . Сравнить значения скорректированного и нескорректированного коэффициентов множественной детерминации.

5. С помощью частных F-критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора Практический пример построения прогноза на основе регрессионного анализа. - student2.ru после Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и фактора Практический пример построения прогноза на основе регрессионного анализа. - student2.ru после Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

6. Рассчитать средние частные коэффициенты эластичности и дать на их основе сравнительную оценку силы влияния факторов на результат.

Решение с помощью Excel .

1.Дляоценки показателя вариации каждого признака необходимо составить сводную таблицу основных статистических характеристик для одного или нескольких массивов данных, которую можно получить с помощью инструмента анализа данных, Описательная статистика. Для этого следует выполнить следующие шаги:

1) введите исходные данные или откройте существующий файл, содержащий анализируемые данные;

в главном меню выберите последовательно пункты Сервис/Анализ данных/Описательная статистика, после чего щелкните по кнопке OK;

2) заполните диалоговое окно ввода данных и параметров вывода (рис. 5.1).

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Рис. 5.1. Диалоговое окно ввода параметров инструмента

Описательная статистика

Входной интервал – диапазон, содержащий анализируемые данные, это может быть одна или несколько строк (столбцов).

Группирование – по столбцам или строкам – необходимо указать дополнительно.

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет.

Выходной интервал – достаточно указать верхнюю левую ячейку будущего диапазона.

Новый рабочий лист - можно задать произвольное имя нового листа.

Если необходимо получить дополнительную информацию по итоговой статистике, уровню надежности, k-го наибольшего и наименьшего значений, установите соответствующие флажки в диалоговом окне. Щелкните по кнопке OK.

Результаты вычисления соответствующих показателей для каждого признака представлены на рис. 5.2.

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Рис. 5.2. Результат применения инструмента Описательная статистика

Сравнивая значения средних квадратических σy, σx1, σx21 отклонений и средних величин Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , Практический пример построения прогноза на основе регрессионного анализа. - student2.ru Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и определяя коэффициенты вариации, приходим к выводу о повышенном уровне варьирования признаков, хотя и в допустимых пределах, не превышающих 35%.

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ;

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ;

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Следовательно, совокупность предприятий однородна, и для ее изучения могут использоваться метод наименьших квадратов и вероятностные методы оценки статистических гипотез.

2. Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии. Линейные коэффициенты частной корреляции оценивают тесноту связи значений двух переменных, исключая влияние всех других переменных, представленных в уравнении множественной регрессии.

К сожалению, в ППП Excel нет специального инструмента для расчета линейных коэффициентов частной корреляции. Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого:

1) в главном меню последовательно выберите пункты Сервис/ Анализ данных/ Корреляция. Щелкните по кнопке OK;

2) заполните диалоговое окно ввода данных и параметров вывода (см. рис. 1.1);

3) результаты вычислений – матрица коэффициентов парной корреляции – представлены на рис. 5.3.

Значения коэффициентов парной корреляции указывают на весьма тесную связь выработки y как с коэффициентом обновления основных фондов - Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , так и с долей рабочих высокой квалификации - Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ( Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ). Но в то же время, межфакторная связь Практический пример построения прогноза на основе регрессионного анализа. - student2.ru весьма тесная и превышает тесноту связи Практический пример построения прогноза на основе регрессионного анализа. - student2.ru с y. В связи с этим для улучшения данной модели можно исключить из нее фактор Практический пример построения прогноза на основе регрессионного анализа. - student2.ru как малоинформативный, недостаточно статистически надежный.

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Рис. 5.3. Матрица коэффициентов парной корреляции

Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух признаков, чем коэффициенты парной корреляции. Если сравнивать коэффициенты парной и частной корреляции, можно сказать, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи, именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.

3. Вычисление параметров линейного уравнения множественной регрессии.

Эта операция проводится с помощью инструмента анализа данных Регрессия. Она аналогична расчету параметров парной линейной регрессии, а отличие от парной регрессии состоит только в том, что в диалоговом окне при заполнении параметров входной интервал Х следует указывать не один столбец, а все столбцы, содержащие значения факторных признаков. Результаты анализа представлены на рис. 5. 4.

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

Рис. 5.4. Результат применения инструмента Регрессия

По результатам вычислений составим уравнение множественной регрессии вида

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ;

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Величина Практический пример построения прогноза на основе регрессионного анализа. - student2.ru оценивает агрегированное влияние прочих (кроме учтенных в модели факторов Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ) факторов на результат y. Величины Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и Практический пример построения прогноза на основе регрессионного анализа. - student2.ru указывают, что с увеличением Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и Практический пример построения прогноза на основе регрессионного анализа. - student2.ru на единицу результат увеличивается соответственно на 0,9459 и 0,0856 млн. руб. Сравнивать эти значения не следует, т.к. они зависят от единиц измерения каждого признака и потому несопоставимы между собой.

Значения случайных ошибок параметров Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и Практический пример построения прогноза на основе регрессионного анализа. - student2.ru с учетом округления составят: Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , Практический пример построения прогноза на основе регрессионного анализа. - student2.ru . Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ; Практический пример построения прогноза на основе регрессионного анализа. - student2.ru ; Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Если значения t - критерия больше 2 - 3, можно сделать вывод о существенности данного параметра, который формируется под воздействием неслучайных причин. Здесь статистически значимыми являются Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , а величина Практический пример построения прогноза на основе регрессионного анализа. - student2.ru сформировалась под воздействием случайных причин, поэтому фактор Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , силу влияния которого оценивает Практический пример построения прогноза на основе регрессионного анализа. - student2.ru , можно исключить как несущественно влияющий, неинформативный.

На это же указывает показатель вероятности случайных значений параметров регрессии: если Практический пример построения прогноза на основе регрессионного анализа. - student2.ru меньше принятого нами уровня (обычно 0,1; 0,05 или 0,01; это соответствует 10%, 5% или 1% вероятности), делают вывод о несущественной природе данного значения параметра, т.е. о том, что он статистически значим и надежен. В противном случае принимается гипотеза о случайной природе значения коэффициентов уровня. Здесь Практический пример построения прогноза на основе регрессионного анализа. - student2.ru > 5%, что позволяет рассматривать Практический пример построения прогноза на основе регрессионного анализа. - student2.ru как неинформативный фактор и удалить его для улучшения данного уравнения.

4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи Практический пример построения прогноза на основе регрессионного анализа. - student2.ru дает F-критерий Фишера:

Практический пример построения прогноза на основе регрессионного анализа. - student2.ru

По данным таблицы дисперсионного анализа, представленной на рис. 5.4, Практический пример построения прогноза на основе регрессионного анализа. - student2.ru =151,65. Вероятность случайно получить такое значение F-критерия составляет 0 (см. значимость F), что не превышает допустимый уровень значимости 5%; об этом свидетельствует величина Р - значение из этой же таблицы. Следовательно, полученное значение неслучайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Значения скорректированного и нескорректированного линейных коэффициентов множественной детерминации приведены на рис. 5. 4 в рамках регрессионной статистики. Нескорректированный коэффициент множественной детерминации Практический пример построения прогноза на основе регрессионного анализа. - student2.ru =0,9469 оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 94,7% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации Практический пример построения прогноза на основе регрессионного анализа. - student2.ru =0,9407 определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и потому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 90%) детерминированность результата y в модели факторами Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

5. Информация для оценки с помощью частных F- критериев Фишера целесообразности включения в модель фактора Практический пример построения прогноза на основе регрессионного анализа. - student2.ru после фактора Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и фактора Практический пример построения прогноза на основе регрессионного анализа. - student2.ru после фактора Практический пример построения прогноза на основе регрессионного анализа. - student2.ru может быть получена в ППП Statgraphics. Частный F- критерий показывает статистическую значимость включения фактора Практический пример построения прогноза на основе регрессионного анализа. - student2.ru после того, как в нее включен фактор Практический пример построения прогноза на основе регрессионного анализа. - student2.ru .

Но по данным, вычисленным с помощью ППП Excel, можно сделать общий вывод, который состоит в том, что множественная модель с факторами Практический пример построения прогноза на основе регрессионного анализа. - student2.ru и Практический пример построения прогноза на основе регрессионного анализа. - student2.ru с Практический пример построения прогноза на основе регрессионного анализа. - student2.ru =0,9469 содержит неинформативный фактор Практический пример построения прогноза на основе регрессионного анализа. - student2.ru . Если исключить фактор

Наши рекомендации