Анализ многомерный статистический


выборочной табл. сопряженности макс, правдоподобных оценок:

G2 = -2 ^ пщ Щтт ■ пш)

имеет асимптотическое χ2-распределе­ние. На этом основана стат. проверка гипотезы о взаимосвязях.

Опыт обработки данных с помощью А.л. показал его эффективность как спо­соба целенаправленного анализа много­мерной табл. сопряженности, содержа­щей (в случае содержательно разумного выбора переменных) огромный, по срав­нению с двухмерными табл., объем ин­тересующей социолога информации. Метод позволяет сжато описать эту табл. (в виде гипотезы о связях) и в то же вре­мя детально проанализировать конкр. взаимосвязь. Ал. обычно применяется многоэтапно, в форме диалога социо­лог—ЭВМ. Т.о., А.л. обладает значитель­ной гибкостью, представляет возмож­ность формулировать разнообразного вида предположения о взаимосвязях, включать опыт социолога в процедуру формального анализа данных.

Лит.: Аптоп Г. Анализ табл. сопря­женности. М., 1982; Типология и клас­сификация в социол. иссл-ях. М., 1982; Bishop Y.M.M. et ai. Discrete Multivariate Analysis. N.Y., 1975; Agresti A. An Introduction to Categorical Data Analysis. N.Y., 1966.

А.А. Мирзоев

АНАЛИЗ МНОГОМЕРНЫЙ СТАТИ­СТИЧЕСКИЙ— разд. статистики ма­тематической, посвященный матем. ме­тодам, направленным на выявление ха­рактера и структуры взаимосвязей между компонентами исследуемого признака многомерного и предназначенным для получения науч. и практических выво­дов. Исходным массивом многомерных данных для проведения А.м.с. обычно служат рез-ты измерения компонент многомерного признака для каждого из объектов исследуемой совокупности, т.е. последовательность многомерных на­блюдений (см. Наблюдение в статисти­ке). Многомерный признак чаще всего интерпретируется как многомерная вели-

чина случайная, а последовательность многомерных наблюдений — как выбор­ка из генеральной совокупности. В этом случае выбор метода обработки исход­ных стат. данных производится на осно­ве тех или иных допущений относитель­но природы закона распределения изучае­мого многомерного признака (см. Рас­пределение вероятностей).

По содержанию А.м.с. может быть условно разбит на три осн. подразд.

1. А.м.с. многомерных распределений и их осн. характеристик охватывает си­туации, когда обрабатываемые наблюде­ния имеют вероятностную природу, т.е. интерпретируются как выборка из соотв. генеральной совокупности. К осн. зада­чам этого подраздела относятся; оцени­вание статистическое исследуемых мно­гомерных распределений и их осн. пара­метров; иссл-е свойств используемых стат. оценок; иссл-е распределений веро­ятностей для ряда статистик, с помощью к-рых строятся стат. критерии проверки разл. гипотез о вероятностной природе анализируемых многомерных данных (см. Проверка статистических гипотез).

2. А.м.с. характера и структуры взаи­мосвязей компонент исследуемого мно­гомерного признака объединяет понятия и рез-ты, присущие таким методам и моделям, как анализ регрессионный, ана­лиз дисперсионный, анализ ковариацион­ный, анализ факторный, анализ латентно-структурный, анализ логяшейный, поиск взаимодействий. Методы, принадлежа­щие к этой гр., включают как алгорит­мы, осн. на предположении о вероятно­стной природе данных, так и методы, не укладывающиеся в рамки к.-л. вероят­ностной модели (последние чаще отно­сят к методам анализа данных).

3. А.м.с. геометрической структуры исследуемой совокупности многомерных наблюдений объединяет понятия и рез-ты, свойственные таким моделям и методам, как анализ дискриминантиый, анализ кластерный (см. Методы класси­фикации, Шкала). Узловым для этих мо­делей явл. понятие расстояния либо ме­ры близости между анализируемыми элементами как точками нек-рого про-



АНАЛИЗ ПРИЧИННЫЙ

странства. При этом анализироваться могут как объекты (как точки, задавае­мые в признаковом пространстве), так и признаки (как точки, задаваемые в «объ­ектном» пространстве).

Прикладное значение А.м.с. состоит в осн. в обслуживании след. трех про­блем: стат. иссл-я зависимостей между рассматриваемыми показателями; клас­сификации элементов (объектов) или признаков; снижения размерности рас­сматриваемого признакового простран­ства и отбора наиб, информативных признаков.

Лит.: Стат. методы анализа социол. информации. М., 1979; Типология и клас­сификация в социол. иссл-ях. М., 1982; Интерпретация и анализ данных в соци­ол, иссл-ях. М., 1987; Айвазян С.А., Мхи-тарян В. С. Прикладная статистика и ос­новы эконометрики: Учеб. М., 1998; Сош-никова Л.А. и др. Многомерный стат. ана­лиз в экономике. М., 1999; Дубров А.М., Мхитарян В. С, Трошин Л.И. Многомер­ные стат. методы для экономистов и ме­неджеров. М., 2000; Ростовцев B.C., Кова­лева Т.Д. Анализ социол. данных с приме­нением стат. пакета SPSS. Новосибирск, 2001; Тюрин Ю.Н., Макаров А. А. Анализ данных на компьютере. Ы., 2003; Крыш-тановский А. О. Анализ социол. данных с помощью пакета SPSS. Μ., 2006.

ЮН. Толстова

АНАЛИЗ ПРИЧИННЫЙ- методы мо­делирования причинных отношений меж­ду признаками с помощью систем стат. уравнений, чаще всего регрессионных (см. Анализ регрессионный). Существуют и др. названия этой довольно обширной и постоянно изменяющейся области ме­тодов: путевой анализ, как впервые на­звал его основоположник С. Райт; мето­ды структурных эконометрических урав­нений, как принято в эконометрике, и др. Осн. понятиями А.п. явл.: путевая (структурная, причинная) диаграмма, причинный (путевой) коэффициент, прямые, косвенные и мнимые компо­ненты связи между признаками. Ис­пользуемое в А.п. понятие «причинное отношение* не затрагивает сложных фи-

лос. проблем, связанных с понятием «причинность». Причинный коэффици­ент опред. вполне операционально. Ма-тем. аппарат дает возможность проверки наличия прямых и косвенных причин­ных связей между признаками, а также выявления тех компонент корреляцион­ных коэффициентов (см. Корреляция), к-рые связаны с прямыми, косвенными и мнимыми связями.

Путевая диаграмма отражает графи­чески гипотетически предполагаемые причинные, направленные связи между признаками. Система признаков с одно­направленными связями называется ре­курсивной. Нерекурсивные причинные системы учитывают также и обратные связи, напр., два признака системы мо­гут быть одновременно и причиной, и следствием по отношению друг к другу. Все признаки делятся на признаки-след­ствия (зависимые, эндогенные) и при­знаки-причины (независимые, экзоген­ные). Однако в системе уравнений эндо­генные признаки одного из уравнений могут быть экзогенными признаками др. уравнений. В случае четырех признаков рекурсивная диаграмма всех возможных связей между признаками имеет вид:

  х2  
/         N
*1     К
   
    г    
  к S

Построение диаграммы связей явл. необходимой предпосылкой матем. фор­мулирования системы стат. уравнений, отражающей влияния, представленные на диаграмме. Осн. принципы построе­ния системы регрессионных уравнений проиллюстрируем на примере тех же че­тырех признаков. Идя по ходу стрелок, начиная с Хи находим первый эндоген-



АНАЛИЗ ПРИЧИННЫЙ

ный признак и отмечаем те признаки, к-рые на него влияют как прямо (непо­средственно), так и косвенно (опосредо­ванно) и через др. признаки. Первое стан­дартизированное регрессионное уравне­ние соответствует первому эндогенному признаку Xj и выражает зависимость Χι от тех признаков, к-рые на него влияют, т.е. от Χγ. Т.о., первое уравнение имеет вид: Χι = bi\X\.

Затем выявляем второй эндогенный признак, к-рый имеет направленные на него связи. Это признак Aj, ему соответ­ствуют экзогенные переменные Х\ и Χι, поэтому второе регрессионное уравнение в стандартизированном виде формулиру­ется так: Aj = ЬцХ\ + ЬпХг и т.д. С учетом ошибок измерения U система стандарти­зованных регрессионных моделей для нашей конкретной причинной диа­граммы имеет вид: Х\ = Ui, А? =

— Ь->\Х\ + Ui, Хт, = 631ΑΊ + byiXi + Uy, Χα —

— baXi + binXi + Й43А3 + Щ. Чтобы оце­нить коэффициенты b,s, необходимо ее решить. Решение существует при усло­вии, что данные удовлетворяют нек-рым естеств. стат. требованиям. Ь$ называют­ся причинными коэффициентами и час­то обозначаются как Ру. Т.о., Р# показы­вает ту долю изменения вариации эндо­генного признака ;, к-рая происходит при изменении экзогенного признака j на единицу стандартного отклонения этого признака при условии, что влия­ние остальных признаков уравнения ис­ключается (см. Анализ регрессионный). Иначе говоря, Р,у есть прямой эффект признака j на признак г. Косвенный эф­фект признака j на ;) вычисляется на ос­нове учета всех путей влияния j на i за исключением прямого.

На диаграмме прямое влияние перво­го признака на четвертый схематически представление прямой стрелой, непо­средственно идущей от Χι к Xt, символи­чески изображаемое как 1->4; оно равно коэффициенту причинного влияния Р[4. Компоненты прямого, косвенного и мнимого влияний явл. слагаемыми кор­реляционного коэффициента гд между признаками Xj и AJ-, к-рые можно вычис-

лить на основе формулы разложения Райта:

Г9 ~ "f + 2^ "lkrjki I

где к пробегает номера переменных, имеющих прямое влияние на признак/ Компонента прямого влияния есть пер­вое слагаемое правой ч. формулы, под знаком суммы содержатся две компо­ненты косвенного и мнимого (ложного) влияний. Косвенное влияние всегда представимо в виде произведения пря­мых влияний. Напр., косвенное влияние Х\ на АЯ, схематически представленное тремя путями опосредственного влияния Χι на АЯ: 1-^2^4, 1-»3-И и 1-»•2->3->4, вычисляется как сумма трех косвенных влияний Ραί Рц, Раз Рзи До Рн Ри- Мни­мое влияние вычисляется как остаток от вычитания из величины корреляционно­го коэффициента суммы прямого и кос­венного влияний.

Величины прямых и косвенных эф­фектов дают возможность проверять на эмпирическом материале гипотезы о си­ле тех или иных влияний и правильно­сти содержательных гипотез о причин­ных связях между признаками. Обычно проверяется значимость отличия коэф­фициентов bij = Pij от нуля, равенство нулю регрессионных коэффициентов равносильно отсутствию соотв. коэффи­циентов прямого влияния.

Качество модели А.п. или ее адекват­ность эмпирическим данным оценивает­ся как степень совпадения коэффици­ентов корреляции, полученных по фор­муле Райта на основе рассчитанных па­раметров системы, с коэффициентами корреляции, вычисленными обычным путем по эмпирическим данным. А.п. не может служить окончательным средст­вом для построения теории о причин­ных связях. Скорее имеет смысл исполь­зовать его для проверок, подтверждения или опровержения соотв. гипотез.

Трудами Г. Волда, К. Ерескога и др. развита теория нерекурсивных систем. Применению метода в соц-и мешает за­ложенное в традиционных моделях предположение о том, что рассматривае­мые признаки измерены, по крайней



АНАЛИЗ РЕГРЕССИОННЫЙ

мере, по интервальной шкале. В соц-и модели причинного анализа развивались в работах X. Блейлока, X, Саймона, П. Лазарсфельда, Р. Будона, О. Дункана. Информационный подход к разработке причинных моделей для номинальных признаков разрабатывал И.Н. Таганов. Одно из направлений А.п. для номи­нальных признаков развивается в рамках анализа логлинейного Л. Гудмэном, И. Би­шопом и др. Оно основано на анализе разл. функций от перекрестных отноше­ний табл. сопряженности, предложен­ных впервые Г. Юлом. Др. развиваю­щееся направление опирается на кон­цепцию К. Пирсона, в соответствии с к-рой в основе перекрестной классифи­кации лежит двух- или многомерное нормальное распределение признаков. Но оценка параметров такой модели очень сложна.

Совр. развитие А.п. в соц-и идет по пути синтеза классических эконометри-ческих и факторно-аналитических под­ходов, определяемых спецификой социол. данных, наличием латентных признаков, прямых и обратных связей между пере­менными (Водд, Ереског, Гудмэн, Блей-лок).

Лит.: Маленво Э. Стат. методы эконо­метрии. М., 1975; Математика в соц-и: моделирование и обработка информа­ции. Μ., 1977; Матем. моделирование в соц-и. Новосибирск, 1977; Математи-ко-стат. методы в социол. иссл-ях. М., 1981; Елисеева И.И., Рукавишников В.О. Логика прикладного стат. анализа. М,, 1982; Mosbaek £., Wold Η. Interdependent Systems: Strukture and Estimation. L., 1969; Goldberger A.S. On Boudon's Method of Linear Cauzal Analysis // American Sociology. Rewiew. 1970. V. 35. No. I; Hauser R.M., Goiderger A.S. The Treatment of an Observebles in Path Analysis // Sociological Methodology. 1971; Good­man L.A. The Analysis of Maltidimentional Contingency Tables when Some Variables are Posterior to Others: A Modified Path Analysis Approach // Biometrica. 1973. V.60.

К.Д. Аргунова, Ю.Н. Телешова

АНАЛИЗ РЕГРЕССИОННЫЙ- стат. метод иссл-я зависимости (регрессии) между зависимым признаком Υ и неза­висимыми (регрессорами, предиктора­ми) X], Х2, ..., ХР. Строго регрессионную зависимость можно определить след. об­разом.

Пусть У, Х\, Хг, ..., Хр — случайные
величины с заданным совместным рас­
пределением вероятностей. Если для каж­
дого набора значений Χλ =х\, Х2 = хг, ...,
Хр = хр определено условное матем. ожи­
дание Υ(χ\, Х2, ..., Хр) — E(Y/(X] = xj,
Χι = Х2, ..., Хр = Хр)), то функция Υ(Χ],
Х2,..., Хр) называется регрессией величи­
ны У по величинам Х\, Хг, ..., Хр, а ее
график — линией регрессии У по Х\, Хг,
..., Хр, или уравнением регрессии. Зави­
симость У от ΛΊ, Хг....... Хр проявляется в

изменении средних значений Упри из­
менении Х\, Хг........ Хр. Хотя при каждом

фиксированном наборе значений X] - xj, Хг = хг, »•, Хр ~ Хр величина Τ остается случайной величиной с опред. рассеяни­ем. Для выяснения вопр., насколько точно регрессия оценивает изменение У при изменении ΑΊ, Хг, ..., Хр, использует­ся средняя величина дисперсии У при разных наборах значений Х\, Хг, ..., Хр (фактически речь идет о мере рассеяния зависимой переменной вокруг линии регрессии).

На практике линия регрессии чаще всего ищется в виде линейной функции У = Ьй + biXi + ЬгХг + - + ЬрХр (линейная регрессия), наилучшим образом прибли­жающей искомую кривую. Делается это с помощью метода наименьших квадра­тов, когда минимизируется сумма квад­ратов отклонений реально наблюдаемых У от их оценок У (имеются в виду оцен­ки с помощью прямой линии, претен­дующей на то, чтобы представлять ис­комую регрессионную зависимость): w

У (У -У) => min (Ν — объем выборки), ы

Этот подход основан на том известном факте, что фигурирующая в приведен­ном выражении сумма принимает ми-ним. значение именно для того случая, когда У= Υ(χ\, хг, •--, хР). Применение

Наши рекомендации