Ример. Реклама в журналах.

Название журнала Y, тариф (одна страница цветной рекламы), дол. X1, планируемая аудитория, тыс. человек Х2, процент мужчин Х3, медиана дохода семьи, дол  
Audubon 25 315 51,1 38 787  
Better Homes & Gardens 198 000 34 797 22,1  
Business Week 68,1 63 667  
Cosmopolitan 15 452 17,3 44 237  
Elle 55 540 12,5 47 211  
Entrepreneur 40 355 2 476 60,4 47 579  
Esquire 71,3 44 715  
Family Circle 147 500 24 539 13,0 38 759  
first For Women 28 059 3 856 3,6 43 850  
Forbes 59 340 68,8 66 606  
Fortune 3 891 68,8 58 402  
Glamour 85 080 7,8  
Goff Digest 6 250 78,9  
  Good Housekeeping 166 080 25 306 12,6 38 335
  Gourmet 49 640 29,6 57 060
  Harper's Bazaar 52 805 2 621 11,5 44 992
  Inc. 70 825 66,9
  Kiplinger's Personal Finance 65,1 63 876
  Ladies' Home Journal 127 000 6,8
  Life 63 750 14 220 46,9
  Mademoiselle 55 910 8,0
  Martha Stewart's Living 93 328 4 849 16,6
  McCalls 7,6 33 823
  Money 98 250 60,6
  Motor Trend 79 800 5 281 88,5 48 739
  National Geographic 53,0 44 326
  Natural History 45,0
  Newsweek 148 800 20 720 53,5 53 025
  Parents Magazine 72 820 18,2
  PC Computing 40 675 67,0 57 916
  People 125 000 33 668 34,0
  Popular Mechanics 86,9
  Reader's Digest 42,4 38 060
  Redbook 95 785 13 212 8,9 41 156
  Rolling Stone 78 920 8 638 59,8 43 212
  Runner's World 36 850 2 078 62,9 60 222
  Scientific American 37 500 2 704 70,0
  Seventeen 71 115 5 738 17,0 37 034
  Ski 32 480 2 249 64,5 58 629
  Smart Money 42 900 2 224 63,4
  Smithsonian 73 075 8 253 47,9
  Soap Opera Digest 35 070 7 227 10,3
  Sports Illustrated 162 000 78,8 45 897
  Sunset 56 000 5 276 38,7 52 524
  Teen 53 250 3 057 15,4
  The New Yorker 62 435 3 223 48,9
  Time 162 000 22 798 52,4
  True Story 12,2
  TV Guide 42,8 37 396
  U.S. News & World Report 98 644 9 825 57,5 52 018
  Vanity Fair 67 890 4 307 27,7
  Vogue 63 900 12,9 44 242
  Woman's Day 137 000 22 747 6,7
  Working Woman 87 500 6,3 44 674
  YM 73 270 14,4 43 696
  Среднее значение 83 534 39,7 47 710
  Среднеквадратичное отклонение 25,9 10 225
                     

Тарифы на размещение рекламных объявлений в журналах определяются каждым журналом самостоя­тельно. Чем объясняются различия в тарифах? Возможно, здесь каким-то образом учитывается ценность рекламного объявления для рекламодателя. Журналы, располагающие большей читательской аудитори­ей (при равных прочих условиях), наверное, вправе устанавливать большие тарифы. Кроме того, журна­лы, рассчитанные на более состоятельные круги читателей, также вправе устанавливать более высокие тарифы. Несмотря то что наверняка имеются и другие, не менее важные факторы, мы ограничимся лишь указанными двумя, добавив к ним еще один — предпочтения людей разного пола, и выясним, изменяют ли журналы свои тарифы в зависимости от соотношения мужчин и женщин в их читательской аудитории. Ответы на некоторые из этих вопросов можно получить с помощью множественного регрессионного ана­лиза. Такой анализ поможет нам объяснить влияние на тарифы таких факторов, как величина читатель­ской аудитории, структура читательской аудитории по полу и доходы читателей.

В табл. 3 представлена соответствующая многомерная совокупность данных, которую нам предстоит проанализировать. В качестве переменной У (объясняемой) мы будем рассматривать стоимость одной страницы одноразовой полноцветной рекламы. Объясняющими переменными будут Х1, читательская ау­дитория (планируемая в тысячах человек), Х2, процент мужчин среди планируемой аудитории, и Х3, ме­диана дохода семьи. Размер выборки n = 55.

В табл. 1 представлена компьютерная распечатка результатов анализа множественной регрессии. Например, с помощью Excel можно выполнить анализ множественной регрессии. Найдите пункт Data Analysis (Анализ данных) в меню Tools (Сервис) и выберите команду Regression (Регрессия). Если в меню Tools (Сервис) отсутствует пункт Data Analysis (Анализ данных), то сначала убеди­тесь, что вы выбрали ячейку электронной таблицы (а не график, например). Если вы все же не можете найти Data Analysis (Анализ данных), поищите пункт меню Add-Ins (Надстройки) и по­ставьте отметку возле Analysis ToolPak (Пакет анализа). Если это не поможет, то, видимо, необ­ходимо переустановить Excel.

Таблица 1. Результат множественной регрессионного анализа тарифов на размещение рекламы в журналах (вычисления сделаны в Excel)

ВЫВОД ИТОГОВ            
             
Регрессионная статистика          
Множествен. R 0,887          
R-квадрат 0,787          
Нормированный R-квадрат 0,775          
Стандартная ошибка 21577,870          
Наблюдения          
             
Дисперсионный анализ          
  df SS MS F Значимость F  
Регрессия 62,843 0,000000  
Остаток      
Итого        
             
  Коэффициенты Стандартная ошибка t-статистика P-значение Нижние 95% Верхние 95%
Y-пересечение 4042,799 16884,039 0,239 0,812 -29853,298 37938,895
Переменная X 1 3,788 0,281 13,484 0,000 3,224 4,352
Переменная X 2 -123,634 137,849 -0,897 0,374 -400,377 153,108
Переменная X 3 0,903 0,370 2,442 0,018 0,161 1,645
             

Коэффициенты регрессии и уравнение регрессии

Сдвиг, или постоянный член, а, и коэффициенты регрессии, b1, b2, и b3, вы­числяются компьютером с использованием метода наименьших квадратов.

Среди всех возможных вариантов уравнения регрессии с различными значениями этих коэффициентов именно уравнение, найденное таким методом, обеспечивает ми­нимальную сумму квадратов ошибок про­гнозирования для рассматриваемой нами выборки журналов. Уравнение регрессии (или уравнение прогнозирования) имеет следующий вид:

(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 =

= $4043 + 3,79(читательская аудито­рия) – 124(процент мужчин) + 0,903(медиана дохода).

Сдвиг, а = $4 043, интерпретируется сле­дующим образом: типичный тариф на раз­мещение одностраничного цветного реклам­ного объявления в журнале, у которого нет платных подписчиков, нет мужчин среди чи­тателей и читатели не имеют дохода, состав­ляет $4043. Однако в рассматриваемой нами совокупности данных нет подобных журналов, поэтому сдвиг, а, следует рас­сматривать лишь как вспомогательную величину, необходимую для получения оп­тимальных прогнозов, но не интерпретировать это значение так буквально.

Коэффициенты регрессии интерпретируются как влияние каждой из пере­менных на размер тарифа, если все другие независимые («объясняющие») пере­менные остаются неизменными. Часто это значение включает «поправку на» другие независимые переменные, или «контролирование» этих других независи­мых переменных. Поэтому коэффициент регрессии для конкретной X-переменной может изменяться (иногда значительно) в результате включения в анализ или исключения других Х- переменных. В частности, каждый коэффициент регрессии определяет среднее увеличение тарифа на размещение рекламы, приходящееся на единичное увеличение соответствующей ему Х- переменной (в данном случае термин «единичное» означает одну единицу измерения конкрет­ной Х- переменной).

Коэффициент регрессии для размера читательской аудитории, b1=3,79, указы­вает, что – при всех прочих равных условиях – журнал с дополнительной тыся­чью читателей (поскольку у нас X1измеряется в тысячах человек) берет (в сред­нем) на $3,79 больше за размещение одностраничного цветного рекламного объяв­ления. Можно также считать, что коэффициент регрессии для размера читательской аудитории означает, что каждый дополнительный читатель увеличи­вает для этого журнала тариф на размещение рекламных объявлений на $0,00379, т.е. увеличение составляет чуть меньше половины цента на одного человека. По­этому, если у какого-то другого журнала такой же процент читателей-мужчин и такой же показатель медианы дохода семьи читателей, но читательская аудитория на 3548 человек больше, то можно ожидать, что тариф на размещение рекламных объявлений в этом журнале будет (в среднем) на 3,79 × 3,548 = $13,45 больше благодаря такому отличию размера читательской аудитории.

Коэффициент регрессии для процента мужчин, b2 = -124, указывает, что (при всех прочих равных условиях) тариф на размещение цветных рекламных объяв­лений в журнале с дополнительным 1% читателей-мужчин окажется (в среднем) на $124 меньше. Это означает, что читательницы представляют для журнала большую ценность, чем читатели-мужчины. Статистический вывод должен подтвердить или опровергнуть эту гипотезу путем сравнения величины влияния процента мужчин (т.е. -$124) с тем, на что можно было бы рассчитывать, если бы при данных обстоятельствах все определялось лишь чистой случайностью.

Коэффициент регрессии для медианы дохода, b3 = 0,903, указывает, что (при всех прочих равных условиях) в журнале с дополнительным долларом медианы дохода его читателей тариф на размещение одностраничного цветного рекламно­го объявления будет (в среднем) на $0,903 больше. Положительный знак этого коэффициента совершенно оправдан, поскольку люди с более высоким уровнем доходов могут позволить себе тратить больше на покупку рекламируемой про­дукции. Если у какого-то другого журнала такой же процент читателей-мужчин и такая же величина читательской аудитории, но медиана дохода семей читате­лей на $4 000 выше, то можно ожидать, что тариф этого журнала на размеще­ние рекламных объявлений будет на 0,903 × 4000 = $3612 выше (в среднем) благодаря более высокому уровню доходов его читателей.

Помните, что коэффициенты регрессии отражают влияние на Y одной X- переменной при условии, что все другие Х- переменные остаются неизменными. Это следует понимать буквально.

Например, коэффициент регрессии b3 отражает влияние медианы дохода читателей на рекламные тарифы; он вычисляется при неизменных величинах читательской аудитории и процента читателей-мужчин. В таком случае более высокие уровни доходов читателей, как правило, ведут к установлению более высоких тарифов на размещение рекламных объявлений (поскольку b3является положительным числом) – при фиксированных размере читательской аудитории и проценте читателей-мужчин.

Какой была бы эта взаимосвязь, если бы остальные переменные (размер чита­тельской аудитории и процент читателей-мужчин) не фиксировались на посто­янном уровне? На этот вопрос можно ответить, проанализировав обычный коэф­фициент корреляции (или коэффициент регрессии, прогнозирующий Y на осно­вании только одной этой Х- переменной), вычисленный только для двух переменных: тарифа и медианы дохода. В нашем случае более высокое значение медианы дохода фактически ассоциируется с более низким тарифом (корреляция тарифа и медианы дохода является отрицательной: -0,167)! Чем это объяснить? Вполне приемлемое объяснение заключается в том, что журналы, ориентирую­щиеся на читателей с более высоким средним уровнем доходов, не в состоянии обеспечить себе массовую аудиторию из-за того, что богатых людей среди насе­ления страны в целом не так уж много. Если же эта читательская аудитория бо­гатых людей окажется очень небольшой, это может вообще исказить эффект влияния высокого уровня доходов в расчете на одного читателя.

Прогнозы

Уравнение прогнозирования, или уравнение регрессии, определяется в сле­дующем виде:

прогнозируемое значе­ние Y = а + b1X1 + b2X2 + ... + bkXk ,

В нашем примере с рекламными объявлениями в журналах, чтобы найти прогнозируемую величину тарифа на размещение рекламных объявлений исходя из величины читательской аудитории, процента читателей-мужчин и медианы дохода читателей для конкретного журнала, подобного тем, которые составляют рассматриваемую нами выборку данных, подставим в уравнение прогнозирова­ния соответствующие этому журналу значения Х- переменных:

(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 =

= $4043 + 3,79(читательская аудито­рия) – 124(процент мужчин) + 0,903(медиана дохода).

Допустим, например, что вы собираетесь основать новый журнал, «Популяр­ная статистика», который рассчитан на читательскую аудиторию порядка 900000 человек, 55% которых будут составлять женщины, а медиана дохода его читателей равна $50000. Данные в уравнение прогнозирования необходимо под­ставить в той же форме, что и в исходной совокупности данных (т.е. той, исходя из которой и строилось уравнение регрессии): X1 = 900 (читательская аудитория в тысячах человек), X2 = 45 (процент мужчин) и X3 = $50000 (медиана дохода). Прогнозируемое значение для этой ситуации определяется следующим образом:

прогнозируемый тариф на размещение рекламы в журнале «Популяр­ная статистика» =

= 4043 +3,79(читательская аудитория) –124(процент мужчин) +0,903(медиана дохода) =

= 4043 + 3,79 ´ 900 – 124 ´ 45 + 0,903 ´ 50000 = $47024.

Разумеется, рассчитывать на то, что тариф на размещение рекламы в журна­ле составит ровно $47024, не приходится. Во-первых, даже между журналами, данными о которых мы располагаем, наблюдаются случайные колебания, поэто­му прогнозы не являются идеальными даже для них. Во-вторых, прогнозы могут быть полезны лишь в той мере, в какой прогнозируемый журнал подобен жур­налам, принадлежащим к исходной совокупности данных. Если речь идет о но­вом журнале, то тариф на размещение рекламы в этом журнале может опреде­ляться не так, как для журналов с уже устоявшейся репутацией, которые мы использовали для построения уравнения регрессии.

С помощью этого уравнения можно также прогнозировать тарифы для жур­налов, принадлежащих к исходной совокупности данных. У первого журнала, «Audubon» X1 = 1645 (читательская аудитория равна примерно 1,6 миллиона че­ловек), X2 = 51,1 (т.е. 51,1% читателей этого журнала — мужчины) и X3 = 38787 (медиана годового дохода читателей этого журнала составляет $38787). Прогнозируемое значение для этого журнала можно найти по следую­щей формуле:

прогнозируемый тариф на размещение рекламы в журнале «Audubon» =

= 4043 +3,79(читательская аудитория) –124(процент мужчин) +0,903(медиана дохода) =

= 4043 + 3,79 ´ 1 645 – 124 ´ 51,1 + 0,903 ´ 38787 = $38966.

Остаток, или ошибка прогнозирования, определяется по формуле: Y–(прогнозируемое значение Y).

Для журнала, принадлежащего к исходной сово­купности данных, этот показатель равняется фактическому тарифу минус про­гнозируемый тариф. Для журнала «Audubon» фактический тариф составляет $25315, а прогнозируемый тариф – $38966. Таким образом, ошибка прогно­зирования равна 25315 – 38966 = –$13651. Отрицательный остаток указывает на то, что фактический тариф меньше прогнозируемого (в случае журнала Audu­bon примерно на $14000). Для многих из нас $14000 – огромные деньги; не­плохо бы взглянуть на другие ошибки прогнозирования, чтобы понять, в какой мере прогнозирование отражает реальную ситуацию. Почему рекламные тарифы в журнале Audubon оказались намного меньше их ожидаемой величины? Скорее всего, потому, что для прогнозирования использовалось лишь k = 3 из множест­ва возможных факторов, влияющих на величину рекламных тарифов (к тому же многие из этих факторов не очень понятны и их довольно сложно измерить).

Наши рекомендации