А. С. Лучинин Психодиагностика. Конспект лекций
А. С. Лучинин Психодиагностика. Конспект лекций
ЛЕКЦИЯ № 1. Истоки психодиагностики
Дифференциальная психология. Возникновение тестирования как результат практических запросов медицины, педагогики и индустриализации производства
Дифференциальная психология стала еще одним источником развития психодиагностики. Вне представлений об индивидуально-психологических особенностях, которые являются предметом дифференциальной психологии, невозможно было бы возникновение психодиагностики как науки о методах их измерения.
Но дифференциально-психологическое изучение человека не было простым логическим развитием экспериментально-психологического. Оно складывалось под воздействием запросов практики, сначала медицинской и педагогической, а тем и индустриальной. Одной из основных причин, обусловивших зарождение психодиагностики, нужно считать выдвинутую врачебной практикой потребность в диагностике и лечении умственно отсталых и душевнобольных людей.
Одна из ранних публикаций, посвященных вопросам умственной отсталости, принадлежит французскому врачу Ж. Е. Д. Эскиролю, стремившемуся дифференцировать разные степени умственной отсталости. Другой французский врач Э. Сеген первым уделил внимание обучению умственно отсталых детей с помощью особых методик. Их работы внесли определенный вклад в разработку методов, помогавших определить умственную отсталость.
Между теоретическими положениями, развиваемыми в рамках общей психологии, и основами психодиагностики прослеживается тесная внутренняя взаимосвязь. Представления о закономерностях развития и функционирования психики являются отправным пунктом при выборе психодиагностической методологии, конструировании психодиагностических методик, их использовании в практике.
История психодиагностики – это и история появления основных психодиагностических методик, и развитие подходов к их созданию на основе эволюционирования взглядов о природе и функционировании психического.
В этой связи интересно проследить, как формировались некоторые важные психодиагностические методы в рамках основных школ психологии.
ЛЕКЦИЯ № 2. Метод тестов
Понятие об интеллектуальном коэффициенте (IQ). Работы В. Штерна
Коэффициент IQ был предложен В. Штерном, считавшим существенным недостатком показателя умственного возраста то, что одна и та же разность между умственным и хронологическим возрастом для различных возрастных ступеней имеет неодинаковое значение. Чтобы устранить этот недостаток, Штерн предложил определять частное, получаемое при делении умственного возраста на хронологический. Этот показатель, умноженный на 100, он и назвал коэффициентом интеллектуальности. Используя этот показатель, можно классифицировать нормальных детей по степени умственного развития.
Другим нововведением стэнфордских психологов явилось использование понятия статистической нормы. Норма стала тем критерием, с которым можно было сравнивать индивидуальные тестовые показатели и тем самым оценивать их, давать им психологическую интерпретацию.
Шкала Стэнфорд – Бине была рассчитана на детей в возрасте от 2,5 до 18 лет. Она состояла из заданий разной трудности, сгруппированных по возрастным критериям. Для каждого возраста наиболее типичный, средний показатель выполнения (х) был равен 100, а статистическая мера рассеяния, отклонения индивидуальных значений от этого среднего (а) равнялась 16. Все индивидуальные показатели по тесту, попадавшие в интервал х ± а, т. е. ограниченные числами 84 и 116, считались нормальными, соответствующими возрастной норме выполнения. Если тестовый показатель был выше тестовой нормы (более 116), ребенок считался одаренным, а если ниже 84 – умственно отсталым.
Шкала Стэнфорд – Бине получила популярность во всем мире. Она имела несколько редакций (1937, 1960, 1972, 1986). В последней редакции она применяется и в настоящее время. Показатель IQ, получаемый по шкале Стэнфорд – Бине, на долгие годы стал синонимом интеллекта. Вновь создаваемые интеллектуальные тесты стали проверяться на валидность путем сопоставления с результатами шкалы Стэнфорд – Бине.
ЛЕКЦИЯ № 3. Возникновение группового тестирования
Требования практики (массовое обследование больших групп испытуемых)
Следующий этап развития психологического тестирования характеризуется изменением формы проведения тестового испытания. Все тесты, созданные в первом десятилетии XX в., были индивидуальными и позволяли вести опыт только с одним испытуемым. Использовать их могли лишь специально подготовленные люди, имевшие достаточно высокую психологическую квалификацию.
Эти особенности первых тестов ограничивали их распространение. Практика же требовала тестировать большие массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Поэтому в США в период Первой мировой войны появилась новая форма тестовых испытаний – групповое тестирование.
Тесты достижений
Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях, – тесты достижений. В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияние специальных программ обучения на эффективность решения тестовых заданий. История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845). В Америке тесты достижений начали использоваться при отборе сотрудников на государственную службу уже с 1872 г., а с 1883 г. их применение стало регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений была выполнена в течение Первой мировой войны и сразу после нее. Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэндфордский тест достижений (SAT), впервые опубликованный в 1923 г. С его помощью оценивается уровень обученности в разных классах средних учебных заведений. Значительное число тестов специальных способностей и достижений было создано в рамках психотехники под воздействием практических запросов со стороны промышленности и экономики. Дальнейшее развитие тестов достижений привело к появлению в середине XX в. критериально-ориентированных тестов.
Достоинства метода тестов
Метод тестов является одним из основных в современной психодиагностике. По уровню популярности в образовательной и профессиональной психодиагностике он прочно удерживает первое место в мировой психодиагностической практике уже фактически в течение столетия.
В данном разделе под тестами следует понимать методики, которые состоят из серии заданий с выбором из готовых вариантов ответа. При подсчете баллов по тесту выбранные ответы получают однозначную количественную интерпретацию и суммируются. Суммарный балл сравнивается с количественными тестовыми нормами, и после этого сравнения формулируются стандартные диагностические заключения.
Популярность метода тестов объясняется следующими главными его достоинствами:
1) стандартизацией условий и результатов. Тестовые методики относительно независимы от квалификации пользователя (исполнителя), на роль которого можно подготовить даже лаборанта со средним образованием. Это, однако, не означает, что для подготовки комплексного заключения по батарее тестов не надо привлекать квалифицированного специалиста с полноценным высшим психологическим образованием;
2) оперативностью и экономичностью. Типичный тест состоит из серии кратких заданий, на выполнение каждого из которых требуется, как правило, не более полминуты, а весь тест занимает, как правило, не более часа. Тестированию одновременно подвергается сразу группа испытуемых, таким образом, происходит значительная экономия времени на сбор данных;
3) количественным дифференцированным характером оценки. Дробность шкалы и стандартизованность теста позволяют рассматривать его как «измерительный инструмент», дающий количественную оценку измеряемым свойствам. Количественный характер тестовых результатов дает возможность применить хорошо разработанный аппарат психометрики, позволяющий оценить, насколько хорошо работает данный тест на данной выборке испытуемых в данных условиях;
4) оптимальной трудностью. Профессионально сделанный тест состоит из заданий оптимальной трудности. При этом средний испытуемый набирает примерно 50 % из максимально возможного количества баллов. Это достигается за счет предварительных испытаний – психометрического эксперимента (или пилотажа). Если в ходе пилотажа становится известным, что с заданием справляется примерно половина из обследованного контингента, то такое задание признается удачным, и его оставляют в тесте;
5) надежностью.Это, наверное, самое главное достоинство тестов в образовательной психодиагностике. Лотерейный характер современных экзаменов с вытягиванием счастливых или несчастливых билетов давно уже стал притчей во языцах. Лотерейность для экзаменующегося здесь оборачивается низкой надежностью для экзаменатора – ответ на один фрагмент учебной программы, как правило, не показателен для уровня усвоения всего материала. В отличие от этого любой грамотно построенный тест охватывает основные разделы учебной программы (тестируемой области знаний или проявления какого-то умения или способности). В результате возможность для «хвостистов» выбиться в отличники, а для отличника вдруг провалиться резко сокращается;
6) справедливостью. Является важнейшим социальным следствием перечисленных выше достоинств. Ее следует понимать как защищенность от предвзятости экзаменатора. Хороший тест ставит всех в равные условия. Наиболее сильно субъективизм экзаменатора проявляется, как известно, не в трактовке уровня решенности задачи (не так просто назвать черное белым, решенную задачу – нерешенной), а в тенденциозном подборе заданий – своим полегче, чужим – труднее. Тесты обеспечивают важнейшую функцию школы как социального фильтра – функцию «социально-профессиональной селекции». То, насколько справедливой оказывается подобная селекция, имеет гигантское значение для развития общества. Поэтому так важно всем, кто имеет доступ к тестам и их результатам, учиться культуре грамотного и гуманного применения тестов, ибо только добросовестное и квалифицированное отношение пользователей к тестам превращает их в инструмент, повышающий, а не понижающий уровень справедливости в обществе;
7) возможностью компьютеризации. В данном случае это не просто дополнительное удобство, сокращающее живой труд квалифицированных исполнителей при массовом обследовании. В результате компьютеризации повышаются все параметры тестирования (например, при адаптированном компьютерном тестировании резко сокращается время тестирования). Компьютеризация – это мощный инструмент обеспечения информационной безопасности (достоверности диагностики). Компьютерная организация тестирования, предполагающая создание мощных информационных банков тестовых заданий, позволяет технически предотвратить злоупотребления со стороны недобросовестных экзаменаторов. Выбор заданий, предлагаемых конкретному испытуемому, может производить из такого банка сама компьютерная программа прямо в ходе тестирования, и предъявление данному испытуемому определенного задания в этом случае является таким же сюрпризом для экзаменатора, как и для испытуемого.
Во многих странах внедрение метода тестов (равно как и сопротивление этому внедрению) тесно связано с социально-политическими обстоятельствами. Внедрение хорошо технически оснащенных тестовых служб в образование – важнейший инструмент в борьбе с коррупцией, поражающей правящую элиту (номенклатуру) во многих странах. На Западе тестовые службы работают независимо от выпускающих (школы) и принимающих (вузы) организаций и снабжают абитуриента независимым сертификатом о результатах тестирования, с которым он может отправляться в любое учреждение. Эта независимость службы тестирования от выпускающих и принимающих организаций является дополнительным фактором демократизации процесса селекции профессиональных кадров в обществе, дающая талантливому и просто работоспособному человеку лишний шанс проявить себя.
Недостатки метода тестов
Метод тестов обладает некоторыми весьма серьезными недостатками, не позволяющими свести всю диагностику способностей и знаний исключительно к тестированию, такими как:
1) опасность «слепых» (автоматических) ошибок. Слепая вера низкоквалифицированных исполнителей в то, что тест должен сработать правильно автоматически, порождает иногда тяжелые ошибки и казусы: испытуемый не понял инструкции и стал отвечать совсем не так, как требует стандартная инструкция, испытуемый по каким-то причинам применил искажающую тактику, возник сдвиг в приложении трафарета-ключа к бланку ответов (при ручном, некомпьютерном подсчете баллов) и т. п. Пользователь не должен подходить к тесту с магической установкой, будто этот волшебный черный ящик должен всегда работать исправно без всякого контроля со стороны человека;
2) опасность профанации. Не секрет, что внешняя легкость проведения тестов прельщает людей, не пригодных ни к какому квалифицированному труду. Оснастившись тестами, им самим непонятного качества, но с громкими рекламными названиями, профаны от тестирования агрессивно предлагают свои услуги всем и вся. Все проблемы предполагается решать с помощью 2–3 тестов – на все случаи жизни. К количественному тестовому баллу приклеивается новый ярлык – заключение, создающее видимость соответствия диагностической задаче. Примером такой профанации может служить повальное использование клинического теста MMPI для отбора кадров в нашей стране. Недобросовестная профанация и элементарное невежество идут в области тестирования рука об руку;
3) потеря индивидуального подхода, стрессогенность. Тест – самый общий ранжир, под который подгоняют всех людей. Возможность упустить яркую индивидуальность нестандартного человека, к сожалению, довольно вероятна. Это чувствуют сами испытуемые, и это их нервирует, особенно в ситуации аттестационного тестирования. У людей с пониженной стрессоустойчивостью возникает даже определенное нарушение саморегуляции – они начинают волноваться и ошибаться в элементарных для себя вопросах. Вовремя заметить такую реакцию на тест – задача, которая под силу квалифицированному и добросовестному исполнителю;
4) потеря индивидуального подхода, репродуктивность. Тесты знаний апеллируют прежде всего к стандартному применению готовых знаний;
5) отсутствие возможности раскрыть индивидуальностьпри наличии стандартных, заданных ответов – ничем не восполнимый недостаток метода тестов. С точки зрения выявления творческого потенциала большинство тестов ограничено именно тем, что они не апеллируют к творческой, конструктивной деятельности. Во всяком случае отдельные стандартизированные творческие тесты имеют дело с весьма абстрактным материалом, а тесты достижений (знаний), адаптированные на жизненно важном материале (профессионально релевантном), как правило, выполнены в форме стандартного набора заданий с заданным ответом;
6) отсутствие доверительной обстановки. Бездушный и формализованный характер самой процедуры тестирования оборачивается тем, что испытуемый лишается ощущения того, что психолог заинтересован в нем лично, в том, чтобы помочь в его проблемах и трудностях. Диалогические методы (беседа, игра) в этом плане имеют несомненные преимущества: непосредственно общаясь с испытуемым, квалифицированный психолог может установить доверительный контакт, проявить персональное участие, создать атмосферу, снимающую напряжение и защиту;
7) потеря индивидуального подхода, неадекватная сложность. Иногда неквалифицированные тестологи обрушивают на ребенка тесты, слишком сложные для него по возрасту. У него еще не сложились необходимые понятия и понятийные навыки, чтобы адекватно осмыслить как общую инструкцию к тесту, так и смысл отдельных вопросов.
Таким образом, тесты нельзя делать единственным исчерпывающим методом любой диагностики (и образовательно-профессиональной, и личностной) – они требуют параллельного использования свободных письменных работ (в личностной диагностике место сочинений занимают проективные тесты со свободным ответом), а также устного собеседования (интервью). Таким образом, место тестов – дополнять указанные выше традиционные методы. В этом качестве тесты незаменимы, так как не имеют многих недостатков, свойственных традиционным методам.
Спокойное осознание достоинств и недостатков метода тестирования освобождает всех (исполнителей, заказчиков, испытуемых) как от чрезмерных упований на метод тестов, так и от пренебрежения ним.
Определения валидности
Валидность(от англ. valid – «действительный, пригодный, имеющий силу») – комплексная характеристика методики (теста), включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.
В наиболее простой и общей формулировке валидность теста – это «понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает» А. Анастази, 1982). В стандартных требованиях к психологическим и образовательным тестам валидность определяется как комплекс сведений о том, относительно каких групп психологических свойств личности могут быть сделаны выводы с помощью методики, а также о степени обоснованности выводов при использовании конкретных тестовых оценок или других форм оценивания. В психодиагностике валидность – обязательная и наиболее важная часть сведений о методике, включающая (наряду с указанными выше) данные о степени согласованности результатов теста с другими сведениями об исследуемой личности, полученными из различных источников (теоретических ожиданий, наблюдений, экспертных оценок, результатов других методик, достоверность которых установлена и т. д.), суждение об обоснованности прогноза развития исследуемого качества, связь изучаемой области поведения или особенности личности с определенными психологическими конструктами. Валидность описывает также конкретную направленность методики (контингент испытуемых по возрасту, уровню образования, социально-культурной принадлежности и т. д.) и степень обоснованности выводов в конкретных условиях использования теста. В совокупности сведений, характеризующих валидность теста, содержится информация об адекватности применяемой модели деятельности с точки зрения отражения в ней изучаемой психологической особенности, о степени однородности заданий (субтестов), включенных в тест, их сопоставимости при количественной оценке результатов теста в целом.
Факторная валидность
Факторная валидность. Прямое отношение к характеристике конструктной валидности имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными факторами, выявить общие и специфические для группы сопоставляемых тестов факторы, степень их представленности в результатах, т. е. определить факторный состав и факторные нагрузки результата теста. Исключительная важность такой процедуры является основанием для выделения ее в особый вид конструктной валидности – факторную валидность.
Важным аспектом конструктной валидности является внутренняя согласованность, отражающая то, насколько определенные пункты (задания, вопросы), составляющие материал теста, подчинены основному направлению теста как целого, ориентированы на изучение одних и тех же конструктов. Анализ внутренней согласованности осуществляется путем коррелирования ответов на каждое задание с общим результатом теста. Следует отметить, что критерий внутренней согласованности указывает лишь на меру связи всего содержания теста с измеряемым конструктом, давая лишь косвенную информацию о природе измеряемого свойства.
При определении конструктной валидности важное место принадлежит изучению динамики измеряемого конструкта. При этом мы можем опираться на гипотезы о его возрастном развитии, влиянии тренировок, обучения, освоения профессии и т. д. Одним из таких подходов является применение критерия возрастной дифференциации, что предусматривает согласование результатов теста с ожидаемыми изменениями, которые претерпевает изучаемое психическое свойство в возрастной динамике при переходе на новый этап развития. Этот метод конструктной валидности особенно важен для валидизации тестов интеллекта, достижений в обучении.
В комплекс сведений о конструктной валидности методики входят также данные, относящиеся к сфере критериальной и содержательной валидности. Так, критерии, используемые при валидизации, несут информацию, позволяющую раскрыть область поведения, качества, представленные в тесте в виде конструкта. Для характеристики конструктной валидности необходимы связь с практическими формами деятельности, достоверность прогноза реального поведения. Однако конструктная валидность является качественно более высоким и комплексным уровнем описания теста, характеризуя область измеряемого поведения в широких психологических понятиях. Благодаря данным конструктной валидности мы можем с психологических позиций закономерно объяснить результаты теста и их дисперсию, обосновать диагноз, введя измеряемое свойство в систему психологических категорий, прогнозировать поведение в более широких пределах, чем это задается областью деятельности, для которой определялась содержательная валидность.
В качестве примера, иллюстрирующего необходимость глубокого анализа теоретического конструкта, лежащего в основе конкретной методики, для правильного применения теста и интерпретации его результатов, можно привести сопоставление двух популярных личностных опросников – шкалы проявления тревожности (MAS) и варианта личностных опросников Айзенка (EPI). Корреляционные исследования показывают, что шкала тревожности MAS положительно коррелирует со шкалой нейротизма и отрицательно – со шкалой экстраверсии EPI. Согласно концепции Айзенка эти данные можно рассматривать как свидетельство низкой валидности шкалы MAS: тревожность коррелирует не только с релевантным фактором «нейротизм», но и с иррелевантным фактором «интроверсия». С этой точки зрения MAS оказывается просто нечувствительным к особой разновидности нейротизма – нейротизму (тревожности) экстравертов, из перечня пунктов MAS исключены высказывания, в которых могла бы проявиться тревожность экстраверта. Однако с теоретических позиций К. Спенса и Дж . Тейлора эта ситуация вполне закономерна, желательна и никак не является артефактом – следствием дефекта данного диагностического средства. Согласно К. Спенсу, пытавшемуся переносить на человеческое поведение теорию научения Халла, MAS измеряет общий уровень драйва – неспециализированного побуждения, которое как раз достигает максимума при сочетании нейротизма (специфической активации по Айзенку) и интроверсии (неспецифической активации) (Практикум по психодиагностике, 1984). Таким образом, названия тестов не всегда однозначно выражают понятия об измеряемом свойстве. В данном примере особенно подчеркивается роль психологической теории, лежащей в основе методики для раскрытия содержания показателей, получаемых с ее помощью.
Дифференциальная валидность
Дифференциальная валидность – вид конструктной валидности, рассматривающей внутренние взаимоотношения между психологическими факторами, диагностируемыми с помощью психодиагностической методики. Содержание дифференциальной валидности может быть проиллюстрировано на примере тестов интересов, которые в своем большинстве обычно умеренно коррелируют с показателями общей академической успеваемости, однако в различной степени связаны с успеваемостью по отдельным дисциплинам. Дифференциальная валидность особенно важна как показатель диагностической ценности методик, используемых в профотборе.
Очевидная валидность
Очевидная валидность – представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого или другого лица, не располагающего специальными сведениями о характере использования и целях методики. Очевидная валидность не является компонентом объективно устанавливаемой валидности. Вместе с тем высокая очевидная валидность в большинстве случаев является весьма желательной. Она выступает в качестве фактора, побуждающего испытуемых к обследованию, способствует более серьезному и ответственному отношению к работе по выполнению заданий теста и к заключениям, формулируемым психологом.
Достаточный уровень очевидной валидности особенно значим для методик обследования взрослых. Если содержание тестовых заданий будет представляться несерьезным, чрезмерно легким, не соответствующим сути изучаемой деятельности, это может привести к ироническому, негативному или враждебному отношению испытуемых к ситуации обследования. Напротив, гипертрофированное отношение к возможностям методики, не вполне адекватное представление о ее направленности и прогностической значимости может вызвать избыточную мотивацию, нежелательную эмоциональную напряженность при обследовании, выраженное установочное поведение. Очевидно, что в приведенных случаях за счет неадекватной очевидной валидности реальная валидность теста снизится.
Представления испытуемых и пользователей психодиагностической информацией об очевидной валидности в немалой степени определяются названием методики, поскольку эта часть сведений о тесте наиболее доступна неспециалистам. Для предупреждения неадекватных мнений о методике следует избегать помещения на бланках, опросных листах, тестовых тетрадях туманных, необоснованно общих названий, которые могут быть неправильно истолкованы (например, «Тест личности», «Тест умственных способностей», «Комплексная батарея оценки достижений» и т. д.). Адекватность очевидной валидности повышается путем введения в инструкцию краткой характеристики целей исследования.
Очевидная валидность существенно улучшает применение понятных формулировок и терминов, а также заданий, по содержанию являющихся наиболее естественными с учетом возрастной, половой, профессиональной специфики испытуемых. Очевидная валидность иногда носит название внешней (face validity) или доверительной (faith validity) валидности.
Типы критериев валидности
В научных исследованиях преобладают специальные лабораторные критерии. Например, конструируется компактный тест-опросник на тревожность. А в качестве критерия валидности для него используется специальный трудоемкий объективный лабораторный эксперимент, в котором воспроизводится реальная ситуация тревожности (испытуемым-добровольцам угрожают за ошибочные действия ударами тока и т. п.).
На практике очень часто в качестве критерия валидности используются прагматические критерии – показатели эффективности той деятельности, ради прогнозирования которой предпринимается тестирование.
Очень часто в качестве критерия валидности используется экспертная оценка. Например, мы хотим убедиться, что короткий тест на измерение уровня дисциплинированности валиден. Для этого проводится опрос учителей об уровне дисциплинированности хорошо известных им учеников. После этого сравниваются результаты теста и экспертный рейтинг учеников по дисциплинированности.
Остановимся подробнее на этом последнем примере. Здесь мы имеем один из самых простых и популярных методов эмпирического (статистического) измерения валидности. Это метод известных групп. К участию в психометрическом эксперименте по проверке валидности теста приглашаются испытуемые, про которых известно, к какой группе по критерию они относятся. В случае с тестом дисциплинированности подбираются ученики, заведомо дисциплинированные по данным экспертной оценки учителей (высокая группа по критерию) и заведомо недисциплинированные (низкая группа по критерию). Ученики со средними показателями по критерию в тестировании не участвуют.
После проведения теста производится расчет, например, простейшей корреляции между тестом и критерием (табл. 1).
Таблица 1
Тестовые нормы
Что, несомненно, должен знать и уметь делать каждый грамотный пользователь теста, так это понимать, что такое тестовые нормы и как ими пользоваться.
Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Его называют в тестологии «сырым» тестовым баллом. Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в стандартную. Эта процедура называется стандартизацией тестового балла.
Допустим, мы провели тест из 20 заданий, и испытуемый дал 12 правильных ответов. Можно ли при этом сказать, что способность у испытуемого выражена лучше или хуже, чем в среднем? Нет. Для такого вывода нужно сравнить балл 12 со средним баллом по представительной выборке испытуемых.
Выборка, на которой определяются статистические тестовые нормы, называется выборкой стандартизации. Ее численность, как правило, не меньше 200 человек. Столько должны принять участие в психометрическом эксперименте по определению тестовых норм – в эксперименте по стандартизации теста.
Ранговая корреляция
Ранговая корреляция – метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения. Наиболее часто ранговая корреляция применяется для анализа связи между признаками, измеряемыми в порядковых шкалах (см. шкалы измерительные), а также как один из методов определения корреляции качественных признаков. Достоинством коэффициентов ранговой корреляции является возможность их использования независимо от характера распределения коррелирующих признаков.
В практике наиболее часто применяются такие ранговые меры связи, как коэффициенты ранговой корреляции Спирмена и Кендалла. Первым этапом расчета коэффициентов ранговой корреляции является ранжирование рядов переменных (табл. 2). Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречается несколько равных по значению переменных, им присваивается усредненный ранг.
Таблица 2
Ранжирование распределения показателей теста (n = 18)
В таблице 2 приведены данные для расчета коэффициентов ранговой корреляции. Во второй графе представлены ранжированные показатели по первому из сравниваемых распределений (оценка IQ, в третьей графе – соответствующие им данные теста зрительной памяти).
Коэффициент корреляции рангов Спирмена (rs)определяется из уравнения:
где di – разности между рангами каждой переменной из пар значений X и Y;
n – число сопоставляемых пар.
Используя данные таблицы 2, получаем:
Коэффициент корреляции рангов Кендаллаτ определяется следующей формулой:
где Р и Q рассчитываются по таблице 12.
Так, в восьмой графе подсчитывается, начиная с первого объекта X, сколько раз его ранг по Y меньше, чем ранг объектов, расположенных ниже. Соответственно, в девятой графе (S2) фиксируется, сколько раз ранг Y больше, чем ранги, стоящие ниже его в столбце X. Подставляя эти данные в формулу, получаем:
При сопоставлении приведенных коэффициентов оказывается, что коэффициент τ более информативен, чем rs, и рассчитывается проще. Поэтому на практике при расчете рановой корреляции отдают предпочтение коэффициенту τ (табл. 3).
Таблица 3
Номинативные шкалы
Номинативные шкалы (шкалы наименований)устанавливают соответствие признака тому или иному классу. Объекты объединяют в классы на основании какого-либо общего свойства (классы эквивалентности) либо символа (обозначения). Необязательно, чтобы между выявленными классами существовала внутренняя взаимосвязь. Само название «шкала наименований» указывает на то, что значения по шкале играют роль лишь названий классов. Одним из распространенных видов номинативной шкалы является классификация объектов на две группы по принципу «А – не-А» (альтернативные признаки в дихотомической шкале наименований). Конкретными примерами применения такой шкалы являются оценивание ответа испытуемого на пункт опросника в виде утверждения или отрицания, соответствие или несоответствие полученного вида ответа ключу (коду) измеряемого свойства (см. личностные опросники).
Примером оценивания в номинативной шкале могут служить классификация решений тестовой задачи или пункт опросника с задачей закрытого типа.
Из названных городов северней расположен город…
1) Псков;
2) Нижний Новгород;
3) Волгоград;
4) Новосибирск;
5) Красноярск.
Противоположностью значения «великодушный» является…
1) расточительный;
2) упрямый;
3) малодушный;
4) скупой;
5) щедрый.
Другой простейшей разновидностью номинативной шкалы является перечень или набор каких-либо признаков, группируемых при сборе информации или ее обработке.
Вы предпочитаете проводить досуг…
1) с товарищами и приятелями;
2) на лоне природы;
3) в занятиях спортом;
4) в кругу семьи и т. д.
Распределение признаков в классах шкалы наименований можно охарактеризовать путем определения абсолютных и относительных частот встречаемости, возможно также определение модальных и центральных значений в классах. Оценка статистической связи между группами признаков возможна с помощью анализа корреляции (см. корреляция качественных признаков).
Если один из рядов переменных представлен в дихотомической шкале наименований, а другой – в любой иной (интернальной, отношений или порядковой), то применяются коэффициенты корреляции бисериальной. Переменные в дихотомической шкале могут распределяться по нормальному закону или иначе в зависимости от этого выбирают способ расчета коэффициентов корреляции.
В строгом смысле номинативная шкала не является шкалой измерения. Она допускает лишь операцию равенства и неравенства и более или менее дифференцированную классификацию признаков. Вместе с тем в психологических исследованиях и психологической диагностике этот вид измерительных шкал имеет достаточно большое значение, особенно при фиксации качественной информации (например, данных проективных методик при сборе психологического анамнеза и т. д.).
Порядковые шкалы
Порядковые шкалы (ординальные)предназначены для расчленения совокупности признаков на элементы, связанные отношением «больше – меньше», и допускают отнесение переменных к группам, упорядоченным (ран