Предсказанная групповая принадлежность
Исходный
Полученный с помощью перекрестной проверки3
Придерживаетесь ли торговой марки
Количество Нет
Да % Нет
Да Количество Нет
Да
% Нет
Да
Нет
58,3
7,4
55,0
7,4
Да
41,7
92,6
187 45,0 92,6
Итог
100,0
100,0
100,0
100,0
Примечание, а. Перекрестная проверка выполнена только для случаев анализируемой выборки. При перекрестной проверке каждый случай классифицировали с помощью функций, выведенных на основе всех случаев, а не этого одного случая. 84,7% от всех случаев в исходной группе классифицировано верно. 84,0% от всех случаев, для которых выполнена перекрестная проверка, классифицировано верно.
РЕЗЮМЕ
Дискриминантный анализ целесообразно использовать, когда зависимая переменная является категориальной, а предикторы (независимые переменные) — интервальными. Если зависимая переменная имеет две категории, то используемый метод известен как дискриминантный анализ для двух групп. Если анализируют три или больше групп, то метод называют множественным дискриминантным анализом.
Процедура дискриминантного анализа состоит из пяти шагов. Первый шаг — формули рование проблемы, требует определения целей, зависимой и независимых переменных. Вы борку делят на две части. Анализируемую выборку используют для вычисления дискрими нантной функции; проверочную — для проверки достоверности модели. Второй шаг — оп ределение функции, включает выведение такой линейной комбинации предикторе (дискриминантных функций), чтобы группы максимально возможно различались межд собой значениями предикторов.
Определение статистической значимости представляет собой третий шаг. Она включае проверку нулевой гипотезы о том, что в совокупности средние всех дискриминантных функ ций во всех группах равны между собой. Если нулевую гипотезу отклоняют, то имеет смыс интерпретировать результаты.
Четвертый шаг — интерпретация дискриминантных весов или коэффициентов аналогичь такой же стадии во множественном регрессионном анализе. При данной мул ьти колли неарности предсказанных переменных не существует однозначной меры относительной важности предиктс ров в дискриминации ими групп. Однако некоторое представление об относительной важност переменных можно получить, изучив абсолютные значения нормированных коэффициенте дискриминантной функции и структуру корреляций или дискриминантных нагрузок. Эти к< эффициенты линейной корреляции между каждым предиктором и дискриминантной функцие представляют дисперсию, которую предиктор делит вместе с функцией. Другим средством инте] претации результатов дискриминантного анализа является разработка характеристической струг туры для каждой группы, исходя из групповых средних для предикторов.
Пятый шаг — проверка достоверности. Она включает разработку классификационной ма-рицы. Дискриминантные веса, определенные с помощью анализируемой выборки, умножай на значения независимых переменных в проверочной выборке, чтобы получить дискримр нантные показатели для случаев в этой выборке. Затем случаи распределяют по группам, исх< дя из дискриминантных показателей и соответствующего правила принятия решения. Опред< ляют процент верно классифицированных случаев и сравнивают его с процентом случаев, к< торое можно ожидать на основе классификации методом случайного выбора.
Для оценки коэффициентов существует два известных подхода. Прямой метод включав оценку дискриминантной функции при одновременном введении всех предикторов. Альте] нативный ему пошаговый метод включает последовательное введение предсказанных пер менных, исходя из их способности дискриминировать группы.
Во множественном дискриминантном анализе, если имеется G групп и k предикторо можно оценить (G — 1) и меньше, чем (G — 1) или k дискриминантных функций. Перв; функция имеет самое высокое значение отношения межгрупповой суммы квадратов к внутр] группововой сумме квадратов. Вторая функция, некоррелирующая с первой, имеет второе i величине собственное значение и т.д.