ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА. В SPSS процедуру DISCRIMINANT используют для выполнения дискриминантного анализа
В SPSS процедуру DISCRIMINANT используют для выполнения дискриминантного анализа. Это общая программа для дискриминантного анализа для двух групп или множественного дискриминантного анализа. Кроме того, с ее помощью можно выполнить прямой или пошаговый метод.
В программе SAS для выполнения дискриминантного анализа для двух групп или множественного дискриминантного анализа можно использовать процедуру DISCRIM. Если допущение о многомерном нормальном распределении не выполняется, то можно использовать процедуру NEIGHBOR. В этой процедуре для классификации наблюдений используют нег раметрическое правило "ближайших соседей". Программа CANDISC выполняет каноническ; дискриминантный анализ и связана с анализом основных компонентов и канонической кс реляцией. Процедуру STEPDISC можно использовать для выполнения пошагового дискрим нантного анализа.
В программном пакете BMDP для выполнения пошагового дискриминантного анал* можно использовать программу Р7М. Но она не дает нормированные коэффициенты дискр минантной функции [19].
В Minitab дискриминантный анализ можно выполнить с помощью функц] Stats>Multivariate>Discriminate Analysis. Она позволяет вычислить как линейный, так и квг ратный дискриминантный анализ при разбиении (классификации) наблюдений на две и больше групп. Дискриминантный анализ недоступен в Excel (версия 7.0 для PC).
В центре внимания Burke
Как и во множественном регрессионном анализе, использование дискриминантно го анализа первоначально заключалось в предсказании и определении сравнительно] важности независимых переменных. Главное отличие этих двух методов в том, что рамках множественной регрессии используют зависимую переменную, выраженную интервальной или относительной шкале, а в дискриминантном — категориальную за висимую переменную. В то время как множественный регрессионный анализ можн< использовать для определения степени покупательского интереса к данному товару дискриминантный анализ только установит принадлежность человека к группе поку пателей или непокупателей.
Один из вопросов для исследователя заключается в том, использовать "естественны группы" или "искусственно созданные". Например, если вас интересует возраст респонден тов, то вы часто собираете данные по возрастным категориям, а не используете фактически] возраст респондентов. В этом случае используемые категории определят результат анализа, котором они должны выступать как зависимая переменная. Объединяя людей в усреднен ные возрастные группы, вы можете увидеть различия между ними. Взгляд на детальны данные позволит вам сделать определенные выводы о создании больших по размеру груш респондентов, исходя из любого частного показателя. В другой ситуации вы можете такж • собрать данные о том, проживает респондент один в квартире или с кем-то. Для описани условий проживания естественно использовать номинальные категории, поскольку трудн подобрать показатели, измеряемые по интервальной шкале. Если группы выбраны пра вильно, то это вселяет уверенность в качестве результатов.
В ходе проведенного Burke маркетингового исследования использования торговой марк] получена следующая классификационная матрица. Каждому респонденту задали вопрос старается ли он покупать товары определенной торговой марки? Далее попытались разли чить респондентов, исходя из их оценок выгод, которые приносит обладание данным това ром. Каждый респондент рассматривался с точки зрения того, придерживаются они покупо товара определенной торговой марки или нет. Из всей выборки 30% (60 человек) ответили что они не стремятся купить товар определенной торговой марки, а 70% (202 человека) -стремятся. Обычно при непропорциональном распределении групп среди населения ожи дают, что большая по размеру группа будет предсказана с большей точностью по сравненш с меньшей. Об этом свидетельствует тот факт, что если использовать для прогноза случай ный выбор, то к первой группе (приверженцев торговой марки) будет отнесено 49% (0,7 0,7), а ко второй 9% (0,3 * 0,3). Процент неверно классифицированных респондентов соста вит 42% от всего числа (0,3 * 0,7 + 0,7 * 0,3). Эта модель классифицирует меньшую групп (неприверженцев торговой марки) менее точно, чем группу приверженцев, но все равн> точнее, чем при отнесении респондентов к группе методом случайного выбора.
Кроме того, маркетологи выполнили перекрестную проверку с помощью программ! SPSS. В этой программе дискриминантную модель пересчитывают столько раз, сколько рее пондентов в выборке. Каждый пересчет исключает одного респондента, и модель используется для отнесения его к определенной группе. Если нет возможности использовать большую проверочную выборку, то целесообразно выполнять перекрестную проверку для надежности расчета, поскольку в перекрестной проверке изучают каждого респондента по очереди. В этой ситуации перекрестная проверка приводит почти к такому же уровню точности, как и полная модель. Обратите внимание, что перекрестная проверка дает больше ошибок при предсказании респондентов меньшей группы.
Результат, полученный стандартным методом, иногда не подходит к альтернативным способам, с помощью которых менеджмент может пожелать интерпретировать модель в свете подразумеваемого использования результатов. Например, руководство спрашивает: "Если бы вы должны были предсказать, что данный респондент относится к группе неприверженцев торговой марки, то какова ожидаемая вероятность того, что вы правы?" В этой ситуации (используя перекрестную проверку) специалисты фирмы Burke могли бы сказать: "Мы вправе ожидать, что предсказанное число респондентов, соответствующих группе "неприверженцы торговой марки", составило около 18% от всего числа опрошенных [(33 + 15)/262 = 0,18]." При этой проверке следует ожидать, что будет верно отнесено примерно 69% респондентов (33/48 = 0,69). Результат, полученный стандартным путем, сразу не показывают руководству. Возвращаясь к методу случайного выбора, фирма Burke могла бы сказать руководителям: "Метод случайного отбора оценил бы количество неприверженцев торговой марки в 30%, и эта цифра была бы верна только на 43%" (т.е. доля выборки случайно отнесенной к группе "неприверженцы торговой марки" равна 0,3 * 0,7 + 0,3 * 0,3 = 0,30; доля верно классифицированных респондентов составляет 0,3 * 0,3/0,3 *0,7 = 43%). Но, увидев только процент верно классифицированных респондентов, нельзя оценить всю картину целиком.
Результаты классификации