Сведения о матрицах, минимально необходимые для изучения ФА
Матрицей называется прямоугольная или квадратная таблица чисел, рассматриваемая безотносительно к тому, что именно представляют собой эти числа и существуют ли между ними какие-то заранее определенные зависимости. Вертикальный ряд чисел, расположенных в матрице одно над другим, называется столбцом, горизонтальный ряд чисел – строкой. Матрица, в которой число строк равно числу столбцов, называется квадратной. В тех случаях, когда нужно обозначить какие-либо элементы матрицы, им приписываются соответствующие индексы, первый из которых указывает номер строки, а второй – номер столбца, в котором находится данный элемент.
Схема 1. Квадратная матрица 4Х4
Транспонирование матрицы
Это важное понятие, часто встречающееся в факторном анализе. Представим себе, что строки матрицы А становятся столбцами, в результате чего возникает новая матрица, которая будет транспонированной по отношению к А. Обозначим новую матрицу А'. Приведем пример транспонирования матрицы
А
Схема 2. А/ - транспонированная матрица А
Умножение матриц
Матрицы можно умножить друг на друга. Операция умножения часто встречается в факторном анализе и поэтому мы обсудим ее подробнее. Не вдаваясь глубоко в теорию вопроса, ограничимся описанием практических правил умножения матриц.
Правила эти гораздо сложнее правил умножения в арифметике. Первое отличие между умножением в арифметике и в матричной алгебре состоит в том, что при умножении матриц не действует закон коммутативности, в соответствии с которым произведение не зависит от порядка, в котором стоят сомножители. Если умножаются матрицы, их произведение в общем случае зависит от этого порядка. Другими словами, А В ¹В А.
Для умножения матрицы А на матрицу В необходимо выполнение следующего условия: матрица А должна иметь столько столбцов, сколько строк в матрице В. Сам процесс умножения исходит из правила «строка на столбец». Это правило означает, что каждый элемент матрицы-произведения представляет собой сумму произведений от умножения элементов строки первой матрицы на соответствующие элементы столбца -второй матрицы.
Таким образом, элемент, стоящий на пересечении второй строки и третьего столбца матрицы С, образуется путем последовательного умножения элементов второй строки матрицы А на соответствующие элементы третьего столбца матрицы В и суммирования произведений. В приведенном примере каждый элемент матрицы-произведения представляет собой сумму двух произведений. Если бы матрица А имела 3 столбца, а матрица В – три строки, то каждый элемент матрицы-произведения являлся бы суммой трех произведений.
Матрица, представляющая собой произведение двух матриц, будет иметь всегда столько строк, сколько их было в первой матрице, и столько столбцов, сколько их было во второй матрице. Если матрица порядка (р х а) умножается на матрицу порядка (q х г), то их произведение будет иметь порядок (р х г).
ВАЖНЕЙШИЕ ПОНЯТИЯ И ТЕХНИКА ФАКТОРНОГО АНАЛИЗА
Два вводных примера
Пусть имеются четыре переменные, отдельные значения которых получены в результате наблюдения за рядом индивидуумов. Вычислим все парные коэффициенты корреляции, в итоге получим следующую корреляционную матрицу:
Визуальный анализ показывает, что корреляционная матрица является симметрической, т. е. наддиагональные элементы представляют собой зеркальное отражение поддиагональных относительно главной диагонали. При рассмотрении матрицы бросается в глаза тот факт, что все коэффициенты корреляции положительны. Кроме того, между первой и второй переменными имеется относительно тесная корреляционная связь, третья переменная с первыми двумя связана слабее, а четвертая практически не зависит от всех предыдущих. Следуя обычной процедуре корреляционного анализа можно было бы проверить значимость каждого коэффициента корреляции.
Целью факторного анализа является извлечение на поверхность величины, так называемого фактора, который бы по возможности точнее позволил воспроизвести наблюдаемые корреляции. Этот фактор и связанная с ним процедура вычислений вначале являются гипотетическими.
Обсудим подход к выявлению фактора и к процедуре вычислений.
Наблюдавшиеся коэффициенты корреляции можно в каждом случае воспроизвести с помощью следующего уравнения:
R+ F1 F/1
A A/
Вектор F1 = (0,90 0,80 0,50 0,05) представляет собойфактор. Матрица R+ является матрицей воспроизведенных коэффициентов корреляции. Используя правило умножения матриц, выполним действие F1 • F/1, в результате чего получим матрицуR+, отличающуюся от R диагональными элементами. Диагональные элементы матрицы R+ называются общностями. Например, элементы первого столбца корреляционной матрицы получаем следующим образом:
0,90 • 0,90=0,81; 0,80 • 0,90-0,720; 0,50 • 0,90-0,45; 0,05 • 0,90 = 0,045. И так далее.
Таким образом из чисел (0,90 0,80 0,50 0,05) получаем наблюдаемую корреляционную матрицу.
Как получаются численные значения элементов вектора F1, нас пока не интересует. Их называют факторными нагрузками. Они позволяют произвести численно-формальное объяснение наблюдаемых коэффициентов корреляции. Это дает основание предполагать, что за ними стоит фактор, который мог бы их причинно обусловливать.
Таким образом, мы на примере познакомились с основным уравнением факторного анализа: R+ = F1 • F/1:редуцированная корреляционная матрица равна произведению факторной матрицы на транспонированную.
За наблюдаемыми величинами всегда стоит фактор, но непосредственно для измерения он недоступен. Он гипотетичен. Факторный анализ устанавливает такие гипотетические факторы и из-за этого способ образования гипотез имеет всегда локальный характер.
При приведении корреляционной матрицы (1) к форме (2) возникают две проблемы.
Диагональные элементы матрицы R+ меньше единицы. Эти диагональные элементы называются общностями, а их определение составляет первую проблему ФА, проблему общности.
Второй проблемой является определение фактора F1. Это так называемая проблема факторов. Обе проблемы будут обсуждаться далее подробнее.
Обратимся еще раз к примеру, иллюстрирующему равенство (2). Десять (4+3+2+1 = 10) различных значений элементов (диагональных и поддиагональных) корреляционной матрицы приведены к четырем элементам вектора F1. Эти четыре значения содержат ту же самую информацию, что и вся корреляционная матрица. Таким образом достигается упрощение, причем объем информации сохраняется. Факторные нагрузки соответствуют коэффициентам корреляции, т. е. переменная 1 имеет много общего с фактором F1 (а1 = 0,90), переменная 2 – немного меньше (а2 = 0,80), переменная 3 – еще меньше (а3= 0,50). Переменная 4 почти не связана с фактором (а4 = 0,05).
Геометрически упрощение заключается в том, что единственная мера, а именно фактор F1, достаточна для отражения связей между переменными.
Фактор F1
1.0
0.9 перем.1
0.8 перем.2
0.5 перем.3
0,05 перем.4
0.0
Рис. 5. Геометрическая интерпретация матрицы A(2).
Второй пример. Пусть по результатам наблюдений за четырьмя переменными составлена корреляционная матицаRh, диагональные элементы которой заменяем общностями, которые предполагаются известными.
При просмотре корреляционной матрицы бросается в глаза, что первая и вторая переменные сильно коррелируют друг с другом. Можно говорить также о наличии корреляции между третьей и четвертой переменными. Между остальными переменными корреляция не проявилась. В таком случае, когда в корреляционной матрице существуют как бы обособленно два центра тяжести, не связанных друг с другом, для объяснения корреляции используют два фактора. Пусть первый фактор будет F1= (0,90 0,80 0,05 0,05), второй F2 =(0,05 0,05 0,80 0,70). В целом вся корреляционная матрица составляется с помощью двух факторов, и всю модель можно представить в виде равенства (3) F1 F2
A A/
В равенстве (3) легко убедиться путем соответствующих вычислений. Первый элемент корреляционной матрицы равен: 0,8125 = 0,90 • 0,90+0,05 • 0,05, по тому же самому правилу умножения матриц получаем другие элементы.
При геометрической интерпретации векторы, соответствующие переменным, расположатся на плоскости. Координатные оси соответствуют факторам, векторы – переменным. Например, конец вектора 1 на рис.6 имеет координаты 0,90 (нагрузка первого фактора) и 0,05 (нагрузка второго фактора), которые берутся из матрицы А. Координатные оси являются факторами, на которые натянуто пространство, содержащее переменные.
F1
1.0
0.9
0.8
0.5
0.1
F2
0.0 0.1 0.5 0.7 0.8 0.9 1.0
Рис. 6. Геометрическая интерпретация матрицы А (3).