Особенности современного факторного анализа
Факторный анализ отличается от метода главных компонент тем, что в его основе лежит предположение о некотором небольшом количестве фундаментальных переменных, которые не могут быть измерены прямо. Основное отличие между факторным анализом и методом главных компонент заключается в том, что главные компоненты являются линейными функциями от наблюдаемых переменных, в то время как общие факторы не выражаются через комбинацию наблюдаемых переменных. Модель факторного анализа предполагает, что корреляции между наблюдаемыми переменными хь ха ..., хр получаются благодаря их связи с некоторыми фундаментальными переменными, известными как общие факторы, или латентные переменные fb fz ..., /fo где k<p (надеемся, что к, число латентных переменных, будет намного меньше, чем число явных переменных). Дисперсия исходных переменных здесь объясняется не в полном объеме: признается, что часть дисперсии остается нераспознанной как характерность. Факторы обычно выделяются последовательно: первый, объясняющий наибольшую долю вариации переменных, затем второй, объясняющий меньшую, вторую после первого латентного фактора часть дисперсии; третий и т.д.
В математической записи модель факторного анализа выглядит так:
Xi=Ai-|f| + Ai2f2+.+ A-|kfk+Ui,
х2+ A2ifi+ A22f2+...+ A2kfk+u2,
*р= A pifi+ Ap2f2+- • • + A pkfk+Up.
Случайная погрешность и, называется характерностью и представляет собой часть наблюдаемой переменной, которая не объясняется действием факторов. Таким образом, модель предполагает, что
дисперсия явной переменной может быть разделена на две части: первая часть называется общностью переменной X и является той дисперсией, которую переменная делит с другими явными переменными посредством их отношения с латентной переменной. Вторая часть, характерность, представляет собой часть единичной дисперсии переменной, которая не связана с общими факторами.
Если латентные факторы не коррелируют, то коэффициенты являются корреляциями между латентными переменными и явными переменными. Они также называются факторными нагрузкамии представляются в виде такой же таблицы, как и факторные нагрузки в методе главных компонент.
Соответствие факторной модели полученным данным проверяется путем сравнения исходной корреляционной матрицы с матрицей корреляций, полученной в результате применения модели. Такая оценка соответствия может быть проведена различными методами, которые носят название principal factor analysis (анализ главных факторов).
Методы факторного анализа
Существует достаточно много методов факторного анализа, среди которых:
• Факторный анализ образов. Если выбран этот метод, то перед факторизацией диагональные элементы корреляционной матрицы (общности) будут вычисляться как множественные коэффициенты корреляции данной переменной со всеми остальными переменными, а затем возводиться в квадрат. Это самый распространенный метод факторного анализа, обычно выбираемый по умолчанию.
• Метод максимального правдоподобия Д. Лоули. В отличие от остальных методов тут предполагается, что число факторов заранее известно (и должно быть установлено в окошке maximum number of factors). Программа затем вычисляет оценки факторных нагрузок и общностей, которые максимизируют вероятность получения исходной корреляционной матрицы.
• Центроидный метод Л. Тэрстоуна. В нем корреляции между переменными рассматриваются как пучок векторов, а латентный фактор геометрически представляется как уравновешивающий вектор, проходящий через центр этого пучка. Это наименее современный метод факторного анализа, требующий также наименьшего количества вычислений.
• Метод главных осей. В этом методе на каждом итерационном шаге собственные значения вычисляются с помощью общностей, затем общности пересчитываются на основании собственных значений. Новые общности помещаются на диагональ корреляционной матрицы, и начинается новый итерационный шаг. Итерации продолжаются либо пока их число не достигнет максимума (заранее определенного), либо пока минимальные изменения в общностях не станут меньше, чем наперед заданные значения.
Следует помнить, что факторные отображения одной и той же корреляционной матрицы эквивалентны друг другу, если они содержат одинаковое число факторов. Практически это значит, что вы получите одни и те же результаты при любом методе.
Так как результаты, полученные с помощью метода главных компонент, и результаты, полученные с помощью различных процедур собственно факторного анализа, практически никогда существенно не отличаются друг от друга, то обычно применение любого из этих методов называют применением факторного анализа. Поэтому далее будем называть все перечисленные методы факторным анализом.
Напомним, что факторный анализ является методом сокращения или редукции данных, то есть методом сокращения числа переменных. Возникает естественный вопрос: сколько факторов следует выделять? Конечно, не имеет смысла брать столько же факторов, сколько было переменных в исследовании. Отметим, что в процессе последовательного выделения факторов они включают в себя все меньше и меньше изменчивости (то есть объясняют все меньше и меньше дисперсии). Решение о том, когда следует остановить процедуру выделения факторов, главным образом зависит от точки зрения на то, что считать малой «случайной» изменчивостью. Это решение достаточно произвольно, однако имеются некоторые рекомендации, позволяющие рационально выбрать число факторов.
Для применения процедуры выбора следует посчитать некоторую статистику - собственные значения корреляционной матрицы и процент объясненной дисперсии для каждого фактора. Собственное значение - это характеристика матрицы корреляций, которая используется для декомпозиции матрицы и одновременно как критерий определения числа выделенных факторов, и как мера дисперсии, соответствующей данному фактору. Если разделить собственное значение на число переменных р, то получится доля дисперсии, соответствующая данному фактору. Процедура подсчета собственных значений достаточно трудоемка, поэтому рекомендуется пользоваться статистическим пакетом.
Выбор количества факторов можно сделать на основании следующих критериев:
1.Процент объясненной дисперсии.Если кумулятивный (накопленный) процент общей дисперсии достигает 60% или больше, то можно остановиться на данном количестве факторов. Достаточно взять даже один фактор.
2. Критерий Кайзера (Н. Keiser).Вы можете отобрать только факторы с собственными значениями, большими 1. По существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается. Этот критерий предложен Кайзером и является, вероятно, наиболее широко используемым. В приведенном выше примере на основе этого критерия вам следует сохранить только 2 фактора (две главные компоненты).
3. Критерий каменистой осыпи.Критерий каменистой осыпиявляется графическим методом. Вы можете изобразить собственные значения, представленные в таблице ранее, в виде простого графика.
Следует найти такое место на графике, где убывание собственных значений слева направо максимально замедляется. Предполагается, что справа от этой точки находится только «факториальная осыпь» - «осыпь» является геологическим термином, обозначающим обломки горных пород, скапливающиеся в нижней части скалистого склона. В соответствии с этим критерием можно оставить в этом примере 2 или 3 фактора.
Критерий Кайзера иногда сохраняет слишком много факторов, в то время как критерий каменистой осыпи иногда сохраняет слишком мало факторов; однако оба критерия вполне хороши при нормальных условиях, когда имеется относительно небольшое число факторов и много переменных.
На практике возникает важный дополнительный вопрос, а именно: когда полученное решение может быть содержательно интерпретировано. В нашем примере все очень легко. Факторная матрица показывает, какие переменные образуют каждый фактор. Это связано, прежде всего, с абсолютным значением факторной нагрузки. Иногда в качестве минимальной факторной нагрузки берут значение 0,4 или даже 0,3 (допускается умеренная связь между переменной и фактором).
К сожалению, в реальных исследованиях распределение переменных по факторам не всегда бывает ясным и простым. Поэтому обычно исследуется несколько решений с большим или меньшим числом факторов, и затем выбирается одно наиболее «осмысленное».