Рождение экспериментальной психологии
По способу построения различают аксиоматические и гипотетико-дедуктивные теории.
Первые строятся на системе аксиом, необходимых и достаточных, недоказуемых в рамках теории;
Вторые — на предположениях, имеющих эмпирическую, индуктивную основу.
Различают теории
Качественные, построенные без привлечения математического аппаратаю. К качественным теориям в психологии можно отнести концепцию мотивации А. Маслоу, теорию когнитивного диссонанса Л. Фестингера.
Формализованные теории, в структуре которых используется математический аппарат, — это теория когнитивного баланса Д. Хоманса, теория интеллекта Ж. Пиаже, теория мотивации К. Левина, теория личностных конструктов Дж. Келли.
Формальные теории (в психологии их немного) является, например, стохастическая теория теста Д. Раша (IRT — теория выбора пункта), широко применяемая при шкалировании результатов психолого-педагогического тестирования.
Различают эмпирическое основание и предсказательную мощность теории.
Теория создается не только для того, чтобы описать реальность, которая послужила основой для ее построения: ценность теории заключается в том, какие явления реальности она может предсказать и в какой мере этот прогноз будет точным. Наиболее слабыми считаются теории ad hoc (для данного случая), позволяющие понять лишь те явления и закономерности, для объяснения которых они были разработаны.
Последователи критического рационализма полагают, что экспериментальные результаты, противоречащие прогнозам теории, должны привести ученых к отказу от нее. Однако на практике эмпирические данные, не соответствующие теоретическим предсказаниям, могут побудить теоретиков к совершенствованию теории — созданию «пристроек». Как правило, в определенное время существует не одна, а две или более теорий, которые одинаково успешно объясняют экспериментальные результаты (в пределах погрешности опыта). Например, в психологии личности конкурируют и имеют эмпирические подтверждения несколько факторных моделей личности (модель Г. Айзенка, модель Р. Кеттела). В психологии памяти аналогичный статус имеют модель единой памяти и концепция, основанная на вычленении сенсорной, кратковременной и долговременной памяти, и т. д.
Известный методолог П. Фейерабенд сказал - единственный принцип, не препятствующий прогрессу, называется "допустимо все" (anything goes).
Тема 6: Экспериментальная выборка и способы ее создания.
Отбор и распределение испытуемых по группам проводится в соответствии с принятым экспериментальным планом. Множество людей принимающих участие в исследовании, называют выборкой.
Преимущества
Основное преимущество факторного эксперимента в том, что мы можем изучать взаимодействия. Взаимодействиеимеет место, когда связь между одной независимой переменной и поведением испытуемого зависит от уровня второй независимой переменной. Например, группа из трех человек может легко принимать решения с лидером или без него, но по мере того как численность группы возрастает, мы можем обнаружить, что группам без лидера требуется все больше времени для достижения консенсуса. Следовательно, связь между лидерством и временем принятия решения зависит от численности группы. На рис. 9.7 показан график подобного взаимодействия. Как вы можете видеть, на время, необходимое для решения задачи, не влияет наличие лидера в группе из трех человек. Однако когда численность группы увеличивается, наличие лидера становится важным для сокращения времени принятия решения. Два эксперимента с одной, переменной не дали бы нам информации о подобных взаимодействиях; они лишь позволили бы нам увидеть общее влияние либо лидерства, либо численности группы. Исследовать взаимодействия нам позволяет только факторный эксперимент.
Существует бесконечный ряд обстоятельств, которые могут определять поведение? Предположим, мы решили, что для проведения эксперимента нам необходимо выбрать одно из этих обстоятельств в качестве независимой переменной. Другие обстоятельства будут либо контролироваться, либо им будет позволено меняться случайным образом. Как только мы определили влияние этого обстоятельства на проведение, мы можем выбрать для изучения какое-то другое обстоятельство. Проблемой при этом подходе является наивное допущение, что стоит нам только узнать эффекты каждой независимой переменной, мы можем просто сложить их вместе и объяснить поведение. Это допущение полностью игнорирует эффекты взаимодействия обстоятельств. Игнорирование взаимодействий в том случае, когда мы ожидаем, что они существуют, может привести нас к ошибочным заключениям.
Эти гипотетические результаты показывают возможное взаимодействие лидерства с численностью группы. Заметьте, что для самой малочисленной группы время решения задачи не зависит от лидерства, но в случае более многочисленных групп лидерство уменьшает время поиска решения.
Планируя эксперимент с одной переменной, когда вы рассматриваете возможность превращения какого-либо обстоятельства в контролируемую переменную и полагаете, что на результаты может влиять ее уровень, который вы выбрали, вы должны подумать о возможном взаимодействии.
Уменьшает ли наличие лидера время решения задачи? Ответ на этот вопрос может зависеть от численности группы.
Влияет ли высота шрифта на время чтения? Ответ может зависеть от возраста читателя.
Влияет ли просмотр телепередач с насилием на агрессивность детей? Ответ может зависеть от того, сколько времени они проводят у телевизора.
Всякий раз, когда вы полагаете, что исход планируемого вами эксперимента может зависеть от какого-то иного обстоятельства, вы рискуете допустить ошибку, если превращаете это обстоятельство в контролируемую или случайную переменную. Беря за основу экспериментальные результаты, показанные на рис. 9.7, предположим, что вместо проведения факторного эксперимента мы решили, что будет вполне приемлем эксперимент с одной переменной. Если бы мы превратили численность группы в контролируемую переменную и решили использовать только группы из трех человек, то пришли бы к заключению, что время решения задачи не связано с лидерством. С другой стороны, если бы мы выбрали группы из 20 человек, то заключили бы, что лидерство оказывает большое влияние на время решения задачи.
4. Планы экспериментов для одного испытуемого
Эксперименты на выборках с контролем переменных стали использовать в психологии с 1910-1920-х гг. Особое распространение экспериментальные исследования на уравненных группах получили после создания выдающимся биологом и математиком Р. А. Фишером теории планирования экспериментов и обработки их результатов (дисперсионный и ковариационный анализы). Но психологи применяли эксперимент задолго до появления теории планирования исследования выборок.
Первые экспериментальные исследования проводились с участием одного испытуемого — им являлся сам экспериментатор либо его ассистент. Начиная с Г. Фехнера (1860), в психологию пришла техника экспериментирования для проверки теоретических количественных гипотез.
Классическим экспериментальным исследованием одного испытуемого стала работа Г. Эббингауза, которая была проведена в 1913 г. Эббингауз исследовал явление забывания с помощью заучивания бессмысленных слогов (изобретенных им же). Он заучивал серию слогов, а затем пытался их воспроизвести через определенное время. В итоге была получена классическая кривая забывания: зависимость объема сохраненного материала от времени, прошедшего с момента заучивания (рис. 5.5).
В эмпирической научной психологии взаимодействуют и борются три исследовательские парадигмы.
1) Представители одной из них, традиционно идущей от естественнонаучного эксперимента, считают единственно достоверным знанием только то, которое добывается в экспериментах на эквивалентных и репрезентативных выборках. Основной аргумент сторонников этой позиции — необходимость контроля внешних переменных и нивелирования индивидуальных различий для нахождения общих закономерностей.
2) Представители методологии «экспериментального анализа поведения» критикуют сторонников статистического анализа и планирования экспериментов на выборках. По их мнению, нужно проводить исследования с участием одного испытуемого и с применением определенных стратегий, которые позволят в ходе эксперимента редуцировать источники артефактов. Сторонниками этой методологии являются такие известные исследователи, как Б. Ф. Скиннер, Г. А. Мюррейидр.
3) Наконец, классическое идиографическое исследование противопоставляется как экспериментам с участием одного испытуемого, так и планам, изучающим поведение в репрезентативных выборках. Идиографическое исследование предусматривает изучение индивидуальных случаев: биографий или особенностей поведения отдельных людей. Примером являются замечательные работы Лурии «Потерянный и возвращенный мир» и «Маленькая книжка о большой памяти».
Во многих случаях исследования, проводимые с участием одного испытуемого, являются единственно возможным вариантом. Методология исследования одного испытуемого разрабатывалась в 1970—1980-е гг. многими авторами: А. Кезданом, Т. Кратохвиллом, Б. Ф. Скиннером, Ф.-Дж. МакГиганом и др.
В ходе эксперимента выявляются два источника артефактов: а) ошибки в стратегии планирования и в проведении исследования; б) индивидуальные различия.
Если создать «правильную» стратегию проведения эксперимента с одним испытуемым, то вся проблема сведется лишь к учету индивидуальных различий. Эксперимент с одним испытуемым возможен тогда, когда: а) индивидуальными различиями можно пренебречь в отношении переменных, изучаемых в эксперименте, все испытуемые признаются эквивалентными, поэтому возможен перенос данных на каждого члена популяции; б) испытуемый уникален, и проблема прямого переноса данных неактуальна.
Стратегия экспериментирования с одним испытуемым разработана Скиннером для исследования процесса обучения.
Исследование по схеме «один испытуемый» (single-subject research) называется также планированием временных серий. Основным показателем влияния независимой переменной на зависимую при реализации такого плана является изменение характера ответов испытуемого от воздействия на него изменения условий эксперимента во времени. Существует ряд основных схем применения этой парадигмы.
Существуют различные варианты планирования по методу временных серий. Различают
- схемы регулярного чередования серий (А-В-А-В),
- серии стохастических последовательностей и
- схемы позиционного уравнивания (пример: А-В-В-А).
Применение более «длинных» временных планов увеличивает гарантию обнаружения эффекта, но приводит к утомлению испытуемого и другим кумулятивным эффектам.
Простейшая стратегия — схема А—В. Испытуемый первоначально выполняет деятельность в условиях А, а затем — в условиях В (см. рис. 5.8).
При использовании этого плана возникает закономерный вопрос: а сохранила бы кривая ответов прежний вид, если бы не было воздействия? Проще говоря, эта схема не контролирует эффект плацебо. Кроме того, неясно, что привело к эффекту: может быть, воздействие оказала не переменная В, а какая-либо иная переменная, не учтенная в эксперименте.
Поэтому чаще применяется другая схема: А—В—А. Первоначально регистрируется поведение испытуемого в условиях А, затем условия изменяются (В), а на третьем этапе происходит возвращение прежних условий (А). Изучается изменение функциональной связи между независимой и зависимой переменными. Если при изменении условий на третьем этапе восстанавливается прежний вид функциональной зависимости между зависимой и зависимой переменными, то независимая переменная считается причиной, которая может модифицировать поведение испытуемого.
Однако и первый, и второй варианты планирования временных серий не позволяют учесть фактор кумуляции воздействий. Возможно, к эффекту приводит сочетание — последовательность условий (А и В). Неочевидно и то, что после возврата к ситуации В кривая примет тот же вид, каким он был при первом предъявлении условий В.
Схемы регулярного чередования серий. Примером плана, который дважды воспроизводит один и тот же экспериментальный эффект, является схема А—В—А—В. Рассмотрим простейший случай. В качестве зависимой переменной выберем общий объем знаний студента. В качестве независимой — занятия физкультурой по утрам (например, гимнастикой у-шу). Предположим, что комплекс у-шу благоприятно влияет на общее психическое состояние студента и способствует лучшему запоминанию.
Очевидно, что занятие гимнастикой благоприятно отразилось на обучаемости.
Кроме того, план А—В—А—В и его различные модификации не снимают три важнейшие проблемы:
1. Что было бы с испытуемым, если бы никакого воздействия не было (эффект плацебо)?
2. Не является ли последовательность воздействий А—В сама по себе еще одним воздействием (побочной переменной)?
3. Какая причина привела к эффекту: если на месте В не было бы воздействия, повторился бы эффект?
Для контроля эффекта плацебо в серию А—В—А—В включают условия, «имитирующие» либо воздействие А, либо воздействие В.
Проанализируем такой случай: допустим, студент постоянно занимается у-шу. Но периодически на стадионе или в спортивном зале появляется симпатичная девушка (просто зритель) — воздействие В. План А— В— А— В выявил повышение эффективности учебных занятий студента в периоды появления переменной В. Что является причиной: присутствие зрителя как такового или конкретной симпатичной девушки? Для проверки гипотезы о наличии конкретной причины эксперимент строится по следующей схеме: А—В—А—С—А. Например, в четвертый временной период на стадион приходит другая девушка или скучающий пенсионер. Если эффективность занятий значительно снизится (не та мотивация), то это будет свидетельствовать о конкретной причине ухудшения обучаемости.
Существует множество приемов проведения исследований с участием одного испытуемого. Примером развития плана А—В является «план альтернативных воздействий». Воздействия А и В распределяются во времени, например по дням недели, если речь идет о разных способах избавления от курения. Затем сравниваются обе кривые и выявляется, какое воздействие более эффективно.
Другой вариант — реверсивный план. Он применяется для исследования двух альтернативных форм поведения. Такой план используется, например, при исследовании поведения маленьких детей, когда измеряется речевая активность и плачь под воздействием различных условий. Первоначально регистрируется базовый уровень проявления обеих форм поведения. Первое поведение (речевая активность) может актуализироваться с помощью специфического воздействия например занятий с лагопедом), а второе, несовместимое с ним, провоцируется одновременно другим типом воздействия (например взятие ребенка на руки чужим человеком). Эффект двух воздействий оценивается. Через определенное время сочетание воздействий реверсируется так, что первая форма поведения получает воздействие, которое инициировало вторую форму поведения (при изучении речевой активности ребенка появляется чужой человек), а вторая — воздействие, релевантное первой форме поведения (занятия с лагопдом).
В психологии обучения применяют метод смены критериев, или «план возрастания критериев». Суть его состоит в том, что регистрируется изменение поведения испытуемого в ответ на прирост воздействия. Увеличение регистрируемого параметра поведения фиксируется, и следующее воздействие осуществляется лишь после выхода испытуемого на заданный уровень критерия. После стабилизации уровня исполнения испытуемому предъявляют следующую градацию воздействия.
Способом, позволяющим нивелировать «эффект последовательности», является инверсия последовательности воздействий или схемы позиционного уравнивания— план А—В—В—А. Эффекты последовательности связаны с влиянием предшествующего воздействия на последующее. Как отмечает Готтсданкер, воздействие переменных А и В обусловлено эффектами переноса. Воздействие А связано с поздним переносом, а В — с ранним. Кроме того, если присутствует кумулятивный эффект, то два идущих подряд воздействия В могут влиять на субъекта как единое суммарное воздействие. Эксперимент может быть удачным лишь в том случае, если эти эффекты незначительны. Рассмотренные выше варианты планов с регулярным чередованием или со случайными последовательностями чаще всего очень длинны, поэтому их трудно реализовать.
Главная же проблема — возможности переноса результатов исследования одного испытуемого на каждого из представителей популяции. Речь идет об учете значимых для исследования индивидуальных различий.
Рассмотрим пример. В начале 1960-х гг. в лаборатории Б. Н. Теплова возникла проблема: почему все графики, описывающие изменения времени реакции в зависимости от интенсивности раздражителя, у испытуемых различны В. Д. Небылицын [Небылицын В. Д., 1966] предложил предъявлять испытуемым сигнал, который изменяется не в единицах физической интенсивности, а в единицах предварительно измеренного индивидуального абсолютного порога («один порог», «два порога» и т.д.). Результаты эксперимента блестяще подтвердили гипотезу Небылицына: кривые зависимости времени реакции от уровня воздействия, измеренного в единицах индивидуального абсолютного порога, оказались идентичными у всех испытуемых.
Статистические гипотезы
Формулирование гипотез систематизирует предположения исследователя и представляет их в четком виде.
Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.
Статистические гипотезы
Направленные Ненаправленные
Нулевая Альтернативная Нулевая Альтернативная
Нулевая гипотеза- это гипотеза об отсутствии различий. Она обозначается как Но и называется нулевой потому, что содержит число 0: X1—Х2 = 0, где X1, X2 - сопоставляемые значения признаков. Нулевая гипотеза - это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий.
Альтернативная гипотеза- это гипотеза о значимости различий.
Она обозначается как H1. Альтернативная гипотеза - это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой.
Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания, или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Однако чаще нам все-таки требуется доказать значимость различий, т.к. они более информативны для нас в поиске нового.
Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.
Статистические критерии
Статистический критерий - это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью.
Статистические критерии обозначают также метод расчета определенного числа и само это число.
Когда мы говорим, что достоверность различий определялась по критерию X2 имеем в виду, что использовали метод X2 Для расчета определенного числа.
Когда мы говорим, далее, что X2 =12,676, то имеем в виду определенное число, рассчитанное по методу X2. Это число обозначается как эмпирическое значение критерия.
Критерии делятся на параметрические и непараметрические.
Параметрические критерии
Критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии (критерий Стьюдента, критерий F и др.)
Непараметрические критерии
Критерии, не включающие в формулу расчета параметров распределения и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Вилкоксона и др.)
И те, и другие критерии имеют свои преимущества и недостатки.
Уровень значимости
Уровень значимости является мерой статистической достоверности результата вычислений, в случае например корреляции, он служит основанием для интерпретации. Если исследование показало, что уровень значимости корреляции не превышает 0,05, то это означает, что с вероятностью 5 % и менее корреляция является случайной. Обычно это является основанием для вывода о статистической достоверности корреляции. В противном случае (р > 0,05) связь признается статистически недостоверной и не подлежит содержательной интерпретации.
Исторически сложилось так, что в психологии принято считать низшим уровнем статистической значимости 5%-ый уровень (р<0,05): достаточным - 1%-ый уровень (р<0,01) и высшим 0,1%-ый уровень (р<0,001).
До тех пор, однако, пока уровень статистической значимости не достигнет р=0,05, мы еще не имеем права отклонить нулевую гипотезу.
Ошибки I и II рода:
1) состоит в том, что мы отклонили нулевую гипотезу, в то время как она верна
2) состоит в том, что мы приняли нулевую гипотезу, в то время как она неверна.
Мощность критериев
Мощность критерия - это его способность выявлять различия, если они есть. Иными словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.
Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут быть решены с помощью разных критериев, при этом обнаруживается, что некоторые критерии позволяют выявить различия там, где другие оказываются неспособными это сделать, или выявляют более высокий уровень значимости различий.
Основанием для выбора критерия может быть:
а) простота;
б) более широкий диапазон использования (например, по отношению к данным, определенным по номинативной шкале, или по отношению к большим n);
в) применимость по отношению к неравным по объему выборкам;
г) большая информативность результатов.
Таблицы сопряженности
С помощью команды частотного анализа мы можем узнать, что среди школьников 39 юношей и 61 девушка, что 33 из них увлекаются спортом, 37 — компьютером и 30 — искусством. Однако команда Frequencies (Частоты) не позволяет ответить на вопросы, сколько девушек увлекаются спортом или сколько юношей — искусством. Для этого существуют таблицы сопряженности. Для ответа на этот вопрос необходимо «сопрячь», или «пересечь», подмножество учащихся определенного пола с подмножеством учащихся с определенным увлечением.
Такое сопряжение удобно представить в виде таблицы, строки которой соответствуют полу, столбцы — увлечению.
Тогда в ячейке, находящейся, например, на пересечении сторон «мужской» и столбца «искусство», мы увидим количество (частоту) юношей которые увлекаются искусством. Поскольку существуют 2 градации пола и 3 градации внешкольных увлечений (хобби), наша перекрестная таблица будет состоять из 2 х 3 - 6 ячеек. Можно составлять и сложные таблицы сопряженности включающие три и более переменные.
Если создать таблицу сопряженности пол – хобби – класс – вуз. Эта таблица будет содержать 2x3x3x4 = 72 ячейки.
При задании этих четырех номинативиых переменных программа SPSS вместо «четырехмерной» таблицы построит 12 двухмерных таблиц размерностью 2x3, «вложенных» в одну таблиц.Мы также можем сравнить подгруппы по средним значениям. Можно сравнить средние значения успеваемости юношей и девушек (пол) разных классов (класс) и т.д.
Дисперсионный анализ
Непараметрические методы
Непараметрические методы гораздо функциональнее чем параметрические, поскольку вообще не связывают анализ с каким-либо законом распределения.
Таким образом, непараметрические методы позволяют исследовать данные без каких-либо допущений о характере распределения переменных, в том числе при нарушении требования нормальности распределения. Так как эти методы предназначены для номинативных и ранговых переменных, в отношении которых недопустимо применение арифметических операций, они основаны на различных дополнительных вычислениях, среди которых можно отметить:
· ранжирование переменных;
· подсчет числа значений одного распределения, которые превышают значения другого распределения;
· применение весовых сравнений;
· определение степени отклонения распределения от случайного или биномиального;
· проверка нормальности выборочного распределения;
· сравпения частот;
· сравнение групп путем вычисления частот значений, лежащих выше или ниже главной медианы.
Помимо всего прочего непараметрические критерии позволяют вычислять статистические показатели для одной выборки и сравнивать две выборки между собой. Несмотря на кажущуюся сложность непараметрические методы в большинстве своем очень просты для понимания и применения.
Факторный анализ
В последние 30-40 лет факторный анализ приобрел значительную популярность в психологических и социальных исследованиях. Во многом этому способствовала разработка Раймондом Кеттеллем (Raymond В. Cattell) знаменитого 16-факторного личностного опросника (16PF). Именно при помощи факторного анализа ему удалось свести около 4500 наименований личностных особенностей к 187 вопросам, которые, в свою очередь, позволяют измерить 16 различных свойств личности. Факторный анализ дает возможность количественно определить нечто непосредственно не измеряемое, исходя из нескольких доступных измерению переменных. Например, характеристики «посещает развлекательные мероприятия», «много разговаривает», «охотно идет на контакт с любым незнакомым человеком» могут служить оценками качества «общительность», которое непосредственно не поддается количественному измерению. Факторный анализ позволяет установить для большого числа исходных признаков сравнительно узкий набор «свойств», характеризующих связь между группами этих признаков и называемых факторами. Процедура факторного анализа состоит из нескольких основных стадий:
1. Вычисление корреляционной матрицы для переменных, участвующих в анализе. Уже по наличию подобного начального действия можно сделать вывод о том, факторный анализ основан па взаимодействии переменных.
2. Извлечение факторов. Первым шагом в является выбор той независимой переменной, которая обусловливает наибольшую долю дисперсии зависимой переменной. Затем операция повторяется для оставшихся независимых переменных до тех пор, пока доля дисперсии не перестанет быть значимой. Первой задачей факторного анализа является выбор взаимодействующих переменных, у которых есть взаимная корреляция. Эти переменные образуют первый фактор. Затем первый фактор исключается, и из оставшегося множества переменных снова выбираются те, чье взаимодействие определяет наибольшую долю оставшейся общей дисперсии, эти переменные образуют второй фактор.
3. Выбор и вращение факторов. За очень редкими исключениями для исследователя не представляют интереса все извлеченные факторы. Если факторов окажется столько же, сколько исходных переменных, факторный анализ теряет смысл, поскольку его целью является сокращение исходного набора переменных. Итак, нужно принять решение, какие из факторов следует оставить для дальнейшего анализа. Здесь, в первую очередь, рекомендуется руководствоваться здравым смыслом и оставлять те факторы, которые имеют понятную теоретическую ил логическую интерпретацию.
Целью вращения является извлечение простой структуры, которой соответствует большое значение нагрузки каждой переменной только по одному фактору и малое по всем остальным. Нагрузка отражает связь между переменной и фактором, являясь подобием коэффициента корреляции. Значение нагрузки лежит в пределах от -1 до +1. Идеальная простая структура предполагает, что каждая переменная имеет нулевые значения нагрузок для всех факторов кроме одного, для которого нагрузка этой переменной близка к 1 (-1).
Например тестирование 46 школьников. Тест включал 11 субтестов (переменные 1,2,........11). Предпологалось, что эти 11 субтестов позволяют измерить 3 и более обобщенные характеристики: математические, вербальные и образные. ФА должен был установить соотношение субтестов и факторов.
Кластерный анализ
Зачастую описание нового статистического метода удобно проводить путем его сравнения с другим методом. При многочисленных общих чертах между указанными статистическими методами существует немало различий. Сравнение кластерного и факторного анализов
Сходство между кластерным и факторным анализами заключается в том, что тот и другой предназначены для перехода от исходной совокупности множества переменных (или объектов) к существенно меньшему числу факторов кластеров. Тем не менее реализация статистических процедур и интерпретация результатов для двух типов анализа различаются;
1. Целью факторного анализа является замена большого числа исходных переменных меньшим числом факторов. Кластерный анализ, как правило, применяется для того, чтобы уменьшить число объектов путем их группировки. Другими словами, в процедуре кластерного анализа обычно переменные не группируются, а выступают в качестве критериев для группировки объектов. В примере факторного анализа 11 субтестов интеллекта (переменных) были сведены к трем факторам, каждый из которых объединил несколько родственных исходных переменных. Кластерный анализ делается обычно для выделения групп объектов, исходя из их сходства по измеренным признакам. Применительно к примеру с 11 субтестами и типичной задачей кластерного анализа была бы классификация учащихся (обьектов) таким образом, чтобы по измеренным 11 показателям внутри каждой группы объекты были бы более похожи друг на друга, чем на объекты из других групп. Группы объектов выделенные в результате кластерного анализа на основе заданной меры сходства между объектами, называются кластерами
2. Заявленные в предыдущем пункте различия между кластерным и факторным, вариантами анализа со всей полнотой категоричности могут быть отнесены лишь к ранним версиям компьютерной обработки. Сегодня, программы позволяют с равным успехом проводить кластерный анализ не только объектов, по и переменных. В последнем случае кластерный анализ может выступать как более простой и нередко более эффективный аналог факторного анализа. Т.о. есть 2 варианта кластерного анализа.
3. Действия, выполняемые в ходе статистических операций в каждом из вариантов анализа, принципиально различаются. В факторном анализе на каждом этапе извлечения фактора для каждой переменной подсчитывается доля дисперсии, которая обусловлена влиянием данного фактора. При кластерном анализе вычисляется расстояние между текущим объектом и всеми остальными объектами, и кластер образует та пара, для которой расстояние оказалось наименьшим. Подобным образом каждый объект либо группируется с другим объектом, либо включается в состав существующего кластера. Процесс кластеризации конечен и продолжается до тех пор, пока все объекты не будут объединены в один кластер. Разумеется, подобный результат в общем случае не имеет смысла, и исследователь должен самостоятельно определить, в какой момент кластеризация должна быть прекращена.
4. В контексте кластерного анализа особое место занимает, один из его видов, называемый иерархическим кластерным анализом. Этот вид кластерного анализа чаще используется в экономике, социологии, политологии, нежели в психологии. Психологи обычно анализируют переменные с целью найти статистические связи между ними; эти связи, как правило указывают на сходство между теми или иными исследуемыми факторами. Деление выборки наа группы в психологических анализах редко представая интерес; в случаях когда это оказывается необходимым, психологи отдают предпочтение дискримипантному, а не кластерному анализу.
5. Поскольку кластеризация переменных оказывается весьма доступной операцией, было бы интересно сравнить ее результаты с результатами более сложного факторного анализа. Как и в случае факторного анализа, выполнение кластерного анализа и его результаты зависят от ряда параметров: способа вычисления расстояния между объектами, кластеризации индивидуальных объектов и т.д.
Для демонстрации кластерного анализа можно привести пример.
Это данные о 15 подержанных автомобилях разных марок, выставленных па продажу.
Этапы:
1. Выбор переменных-критериев для кластеризации. В нашем примере кластеризация будет осуществляться по следующим переменным: цена (стоимость), экспертная оценка технического состояния по 10-балльной шкале, возраст (количество лет эксплуатации), пробег (пройденный километраж с начала эксплуатации).
2. Выбор способа измерения расстояния между объектами, или кластерами (изначально считается, что каждый объект соответствует одному кластеру). По умолчанию используется квадрат Евклидова расстояния, согласно которому расстояние между объектами равно сумме квадратов разностей между значениями одноименных переменных объектов.
Предположим, что марка автомобиля А имеет показатели технического состояния и возраста 5 и 6, а марка В — соответственно 7 и 4. В этом случае расстояние между марками вычисляется следующим образом: (5 - 7)2 + (6 - 4)2 = 8. При выполнении анализа сумма квадратов разностей вычисляется для всех переменных. Получаемые расстояния используются программой при формировании кластеров.
3. Формирование кластеров. Существует два основных метода формирования кластеров: метод слияния и метод дробления. В первом случае исходные кластеры увеличиваются путем объединения до тех пор, пока не будет сформирован единственный кластер, содержащий все данные. Метод дробления основан на обратной операции: сначала все данные объединяются в один кластер, который затем делится на части до тех пор, пока не будет достигнут желаемый результат. Чаще используется метод слияния который еще, называется межгрупповым и сравнивает средние внутри групп. Программа вычисляет наименьшее средние значение расстояния между всеми парами групп и объединяет две группы оказавшиеся наиболее близкими.
Для рассматриваемого примера нам представляется наиболее предпочтительным число кластеров, равное 3. Как показывает анализ, все марки можно разделить на 3 группы: первая группа имеет высокую стоимость, небольшой срок эксплуатации и средний пробег. Вторая группа имеет среднюю стоимость, небольшой пробег, наибольший возраст, но хорошее техническое состояние. Третья группа содержит недорогие модели с большим пробегом и невысоким рейтингом технического состояния.
Рождение экспериментальной психологии
У истоков экспериментальной психологии стоял еще один выдающийся немецкий ученый — Вильгельм Вундт (1832-1920). Он тоже родился в семье пастора, получил медицинское образование, знал анатомию, физиологию, физику и химию. С 1857 по 1864 годы работал лаборантом у Гельмгольца (о нем уже упоминалось). У Вундта была своя домашняя лаборатория. Занимаясь в это время физиологией, он приходит к мысли о психологии как самостоятельной науке. Эту идею он обосновывает в своей книге "К теории чувственного восприят