Семей, разделенных по группам и составам

Для исследования соотношения между потребительскими расходами и распределяемым доходом используются перекрестные данные о семейных бюджетах, относящиеся к некоторому фиксированному периоду времени. Прогноз строится с использованием обобщенного метода наименьших квадратов Гольдбергера[5]. Обозначим через Y величину потребительских расходов, а через X — объем распределяемого дохода. Соберем данные о бюджете 10000 семей и образуем пары соответствующих измерений для величин Х_i Y_i(i = 1, 2,..., 10000). Предположим, что мы уже разделили семьи на группы по их размеру и составу и рассматриваем интересующую нас связь между Y и Xвнутри конкретной группы. Мы не ожидаем, что у всех семей этой группы, имеющих один и тот же доход X', будут одинаковые потребительские расходы Y'. Одни потратят больше других, а некоторые, наоборот, меньше, однако мы надеемся, что величины расходов сгруппируются вокруг некоторого значения, соответствующего тому объему дохода, о котором идет речь. Эта идея находит свое формальное воплощение в новой гипотезе о характере линейной зависимости:

Семей, разделенных по группам и составам - student2.ru (1)

Здесь символом U обозначена переменная, принимающая то положительные, то отрицательные значения. Таким образом, если мы рассмотрим подгруппу семей, располагающих доходом X', то центральным значением их потребительских расходов окажется величина а + bХ', в то время как реальные объемы потребления для семей данной подгруппы будут равны а + bХ' +U₁, а + bХ'+ U₂ и т.д., где U₁, U₂, ... измеряют отклонения потребительских расходов каждой отдельной семьи от центрального значения а + bХ'.

Существует три способа рационального объяснения включения в уравнение (1) стохастического члена, причем любое из этих объяснений не исключает других.

Во-первых, мы можем предположить, что потребительские расходы для всех и каждой из рассматриваемых семей были бы полностью объяснены, если бы мы знали все факторы, влияющие на эти расходы, и располагали необходимыми данными. Одинаковые по размеру и составу семьи могут отличаться возрастом родителей и детей, сложившейся динамикой дохода (возрастает он или убывает), бережливостью членов семьи и т.д. Многие из этих факторов не измеряются количественно, не квантуются и даже если такое измерение достижимо, то получение всех необходимых данных на практике оказывается невозможным.

Поскольку среди многочисленных факторов, влияющих на потребительский спрос конкретной семьи, многие действуют в противоположных направлениях, можно рассчитывать, что малые значения U, будут встречаться чаще, чем большие. Мы подошли, таким образом, к пониманию U как случайной переменной, обладающей вероятностным распределением с нулевым средним и с конечной дисперсией. Это позволяет нам обращаться с переменной U как со стохастическим возмущением (ошибкой). Ввиду того, что U включает много факторов, которые, по-видимому, можно считать независимыми, обращение к центральной предельной теореме показывает нам выбор для U нормального распределения.

Вторым оправданием присутствия в экономических соотношениях возмущающего члена служит то обстоятельство, что только с его помощью можно отразить вечный и непредсказуемый элемент случайности человеческих реакций, сплошь и рядом оказывающий воздействие на суммарный эффект существенных факторов и поэтому непосредственно влияющий на наблюдаемые значения переменной Y.

Третьим источником ошибок являются ошибки наблюдения или измерения.

Итак, пусть существует линейное соотношение между переменной Y, k-1,объясняющими переменными Х₂, Х₃ ..... X_k ивозмущением U. Если мы имеем выборку из п наблюдений над переменными Y и X_j, j = 2, 3, ..., k, то можно записать

Семей, разделенных по группам и составам - student2.ru

Коэффициенты bи параметры распределения Uнеизвестны. Уравнения, соответствующие всем п наблюдениям, могут быть записаны компактно в матричной форме

Семей, разделенных по группам и составам - student2.ru (2)

где

Семей, разделенных по группам и составам - student2.ru

Соглашение, в силу которого через X_ki обозначается i-е наблюдение переменной X_k, означает, что индексы в матрице X расположены в порядке, обратном общепринятому, когда первый индекс — номер строки, второй — номер столбца.

Примем простую гипотезу о нулевом значении математического ожидания стохастического возмущения U: E[U]= 0 и введем матрицу V:

Семей, разделенных по группам и составам - student2.ru

где U^T — вектор-строка, полученная транспонированием вектора-столбца U.

По диагонали матрицы V расположены дисперсии элементов вектора U, остальные элементы — ковариации элементов вектора U:

Семей, разделенных по группам и составам - student2.ru

Задача прогноза состоит в предсказании изолированного значения зависимой переменной для заданного вектора-строки Х₀. Мы можем записать:

Семей, разделенных по группам и составам - student2.ru

где U₀ — истинное, но неизвестное значение возмущения в прогнозируемый момент. Пусть

Семей, разделенных по группам и составам - student2.ru

где W— вектор размерности (n´1) прогнозируемого возмущения вектором выборочных возмущений. Сформулируем линейный прогноз:

Р = C^TY, (7)

где С — вектор размерности (n´1), состоящий из п констант.

Чтобы значение Р было наилучшим прогнозом, необходимо выбрать вектор С, минимизирующий дисперсию прогноза:

Семей, разделенных по группам и составам - student2.ru

Для определения ошибки прогноза вычтем из уравнения (7) уравнение (3); подставим в результат значение Y из (2) и, выполнив соответствующие преобразования, получим:

Семей, разделенных по группам и составам - student2.ru

Из условия несмещенности прогноза следует, что вектор С должен удовлетворять равенству:

Семей, разделенных по группам и составам - student2.ru (9)

Тогда для ошибки прогноза имеем P – Y₀ = C^TU - U₀, и, поскольку (Р – Y₀) — скаляр, дисперсия прогноза равна

Семей, разделенных по группам и составам - student2.ru (10)

Чтобы минимизировать (10) при условии (9), образуем функцию

Семей, разделенных по группам и составам - student2.ru

где L — вектор размерности (k´l), образованный множителями Лаг-ранжа. Затем продифференцируем Ф по векторам С и L и приравняем вектор частных производных к нулевому вектору.

Семей, разделенных по группам и составам - student2.ru

Рассмотрим

Семей, разделенных по группам и составам - student2.ru

Учитывая, что V— симметричная матрица, то есть для I ¹ j:

Семей, разделенных по группам и составам - student2.ru

Возьмем частные производные по элементам вектора С:

Семей, разделенных по группам и составам - student2.ru

За исключением множителя 2, правые части этих уравнений содержат элементы матричного произведения VС, которые образуют n-мерный вектор-столбец. Следовательно,

Семей, разделенных по группам и составам - student2.ru

Аналогично получаем:

Семей, разделенных по группам и составам - student2.ru

В результате дифференцирования имеем:

Семей, разделенных по группам и составам - student2.ru (11) (12)

Примем вектор частных производных равным нулевому вектору и получим систему:

Семей, разделенных по группам и составам - student2.ru

которая может быть записана в виде

Семей, разделенных по группам и составам - student2.ru (13)

Из (13)получаем:

Семей, разделенных по группам и составам - student2.ru

Применив правило отыскания матрицы, обратной к матрице, подвергшейся разбиению, имеем:

Семей, разделенных по группам и составам - student2.ru (14)

где Н = (-Х^Т V^-1Х)^-1

Из (14)получаем:

Семей, разделенных по группам и составам - student2.ru (15)

где I - единичная матрица.

Следовательно, наилучшим нелинейным несмещенным прогнозом будет:

Семей, разделенных по группам и составам - student2.ru

Учитывая, что e=(Y - XB) — вектор остатков, соответствующий методу наименьших квадратов,

Р = Х⁰В+ W^TV^-1e. (16)

Это и есть основной результат, полученный Гольдбергером для предсказания с помощью обобщенной модели наименьших квадратов.

Задача.Исследовать уровень ежемесячного среднедушевого потребления товаров первой необходимости и сделать прогноз этого уровня на будущее для семей со средним уровнем достатка.

Имеются данные среднемесячных затрат на питание по основным группам продуктов (распределяемый доход) и общих затрат на товары первой необходимости в выбранной группе семей в сопоставимых денежных единицах за 5 лет. Общая сумма затрат на товары первой необходимости включает, кроме затрат на указанные группы продуктов, затраты на фрукты, кондитерские изделия, а также непродовольственные товары повседневного спроса (мыло, газеты и т.п.).

Оценить необходимые затраты на эти товары при сохранении установившегося рациона питания, если цены на преобладающие продукты питания (колонки 2, 3, 4, 5) увеличатся в 1,5 раза по сравнению с последним годом.

Период времени (годы)	Затраты на мясные продукты (в мес.)	Затраты на молочные продукты (в мес.)	Затраты на оно щи (в мес.)	Затраты на мучные и крупяные изделия (в мес.)	Общие затраты на товары первой необходимости (в мес.)
	9,5	3,7 4,5	6,5	5,5

Решение. В качестве математической модели зависимости общих затрат на товары первой необходимости от цен на основные продукты питания возьмем линейное соотношение (2). На основе данных задачи сформируем матрицы X, Y, Х₀:

Семей, разделенных по группам и составам - student2.ru (17)

Х₀ =(1 22,5 9 16,5 12).

Вычислим определитель квадратной матрицы X

detX= |X|= 2,9.

Так как detX ¹ 0, матрица X является невырожденной и, следовательно, для нее существует единственная обратная матрица Х^-1и уравнение (15) может быть упрощено раскрытием скобок:

Семей, разделенных по группам и составам - student2.ru

А это означает, что прогнозируемое значение среднемесячных затрат на основные продукты питания в следующем году может быть вычислено по формуле:

Семей, разделенных по группам и составам - student2.ru (18)

Для вычисления матрицы, обратной к X, воспользуемся известной теоремой. Совместное преобразование матриц Х и Е (единичной) будем осуществлять таким образом, чтобы врезультате каждого шага один из векторов матрицы X становился единичным.

Для преобразования k-говектора матрицы Х кединичному пересчет элементов матрицы X осуществляется по следующим формулам:

Семей, разделенных по группам и составам - student2.ru

где i— номер строки;. J — номер столбца; верхним индексом * отмечены пересчитанные изданном шаге значения.

Элементы x_kk каждого последующего шага выделены жирным шрифтом.


9,5	3,7	6,5
	4,5		5,5



0,5	0,7	0,5		-1
	1,5		3,5	-1
				- 1
				- 1
	-9,6	-3	-16		-18
	1,4			-2
	0,1		1,5		-2
	-2,2		-2		-6
	-5,4	-1	-6		-12
	-16,2		-22		-36
	3,6			-7		-1
	4,5		5,5	-9		-2
	-2,2		-2		-6
	-7,6		-8		-18
	4,7			-10	13,5	0,25	-2,75
	-0,2				-1	-0,5	0,5
	- 0,725				-2,375	-1,3125	0,6875
	-0,3				-1,5	0,75	-0,25
	0,95			-2	2,25	-0,125	-0,125

Во избежание накопления ошибок округления последний шаг выполним в простых дробях. Тогда левая матрица станет единичной, правая после вынесения за знак матрицы общего для всех элементов множителя элемента примет вид:

Семей, разделенных по группам и составам - student2.ru (19)