Вопрос 25. Модель факторного анализа, критерии качества структуры модели. Использование результатов факторного анализа в регрессионных моделях
Для изучения сложных соц-экон систем. Тк позволяет одновременно сократить размерность признакового пространства и вскрыть скрытые причинно-следственные связи.
Преимущества:
· Снижение признакового пространства, ;
· Лучшая интерпретация результатов исследования;
· Выявление и анализ структуры изучаемого процесса;
· Сжатие большого массива информации без потери содержательного наполнения признаков.
Общий вид модели:
где z – вектор стандартизированных элементарных признаков;
f – вектор общих факторов размерности k < m,
W – матрица факторных нагрузок размерности k*m;
u – характерность.
В отличие от МГК в общем случае при использовании ФА не утверждается, что наблюдаемые признаки могут быть однозначно вычислены (без потери информации) по значениям общих факторов f. Остаток, не объясненный общими факторами, называется характерностью (u) и интерпретируется как влияние специфичных для каждого признака факторов и случайных ошибок.
Для определения к-тов модели ФА вычисляем ковариационные матрицы левой и правой частей векторного уравнения (1):
Для упрощения данного выражения используются основные предположения факторного анализа:
1) Общие факторы стандарт и декоррел является единичной матрицей;
2) Характерные и общие факторы независимы ;
3) Характерные факторы декорр ковариационная матрица является диагональной
Тогда уравнение для ковариаций:
где R – корреляционная матрица элементарных признаков,
- редуцированная корреляционная матрица (т.к. матрица U – диагональная, то элементы матрицы вне диагонали равны соответствующим элементам матрицы R)
h - общности и . Качественно общность обозначает вклад общих факторов в полную дисперсию признака: . Остаток – характерность.
Основными подходами к определению общностей являются:
Метод наибольшей корреляции. Мощности присваивается наибольшее значение элемента столбца (строки) матрицы R кроме диагонального элемента матрицы R, равного единицы
Метод триад используется, когда матрица частных корреляций сильно отличается от матрицы парных корреляций (R). При данном методе в j-й строке (столбце) матрицы R отыскиваются 2 наибольших значения коэффициентов корреляции и и составляется триада
если вдруг , тогда ставим значение = 1
Метод малого центроида. На главной диагонали матрицы R ставятся наибольшие к-ты корреляции каждой строки (столбца). По новой матрице вычисляется отношение квадрата суммы элементов соответствующей строки (столбца) к сумме всех элементов матрицы:
Цель расчета – методы направлены на увеличение относительного веса в факторной структуре признаков с сильными корреляционными связями и уменьшение связи слабо коррелируемых признаков.
Следующим шагом факторного анализа является определение факторных нагрузок:
В отличие от метода главных компонент общая модель факторного анализа имеет неоднозначное решение. Это обусловлено двумя причинами:
1. Свобода выбора характерности при нахождении редуцированной корреляционной матрицы ;
2. Число общих факторов не определено.
Наиболее распространёнными методами решения являются:
· Метод главных факторов;
· Метод наименьших квадратов;
· Обобщенный метод наименьших квадратов;
· Метод максимального правдоподобия Лоули.
Общая схема факторного анализа:
1. Нормировка признакового пространства.
2. Вычисление корреляционной матрицы , состоящей из парных коэффициентов корреляции.
3. Вычисление редуцированной матрицы ;
4. Вычисление факторного отображения (W);
5. Вращение факторного пространства
В случае если в структуре факторного отображения нельзя выделить доминирующие факторы, затрудняется интерпретация факторного пространства. Сложная структура матрицы факторных нагрузок усложняет процесс управления явлением путем воздействия на отдельные факторы, так как фактор может равномерно влиять на все признаки. Однако эта проблема может быть устранена при вращении факторного пространства.