Тесты интеллекта
Арифметические умения, осведомленность, мышление, манипуляция объектами, словарный запас и функции памяти представлены в наборе заданий, использующихся в тестах измеряемого интеллекта, независимо от того, наз. ли они тестами школьных достижений, тестами академических способностей (SATs)или тестами интеллекта. Цель каждого из этих типов тестов — оценить выполнение всей совокупности заданий, с тем чтобы получить оценку общего интеллектуального потенциала. Многочисленные тесты этих типов, в силу своей функциональной эквивалентности, могут комбинироваться для получения одной М. и. Чтобы определить IQ к.-л. чел. или его относительное положение в распределении совокупности, можно суммировать рез-ты, полученные по тестам кажущихся несопоставимыми способностей, поскольку известно, что оценки по таким тестам связаны (коррелируют), обеспечивая тем самым получение М. и. в целом.
Шкалы Стэнфорд-Бине и Векслера являются индивидуальными тестами интеллекта, широко используемыми сегодня пед., промышленными и клиническими психологами, чей повседневный труд включает тщательное клиническое, школьное или связанное с работой изучение интеллектуального функционирования субъекта. Групп. тесты интеллекта, такие как Тест академических способностей (SAT), обладают преимуществом одновременного проведения с большими группами людей. Однако такие тесты используются в основном в целях классиф. и скрининга в школах, в армии, при приеме на работу, в мед. учреждениях и клиниках, обслуживающих большое количество пациентов.
Необходимым предварительным условием правильной интерпретации показателя IQ-теста как одного из двух компонентов интеллекта конкретного чел. является знание осн. характеристик таких IQ показателей — в частности, знание их норм, надежности и валидности.
Нормы — это тестовые показатели, полученные на большом количестве испытуемых в процессе стандартизации теста. Эти показатели, выводимые на основе обследования широкого множества людей, служат стандартом для сравнения, относительно к-рого м. б. оценен к.-л. конкретный чел. Если такой индивидуум отличается по признаку пола, расы или социально экономическому статусу от группы, на к-рой были получены тестовые нормы, то данный тест не будет валидным для этого чел. Тестовые нормы, как правило, представлены в виде показателей умственного возраста (МА), стандартных оценок или процентилей. Умственный возраст ребенка — это возраст всех др. обследованных детей, выполнивших тест на том же уровне, что и тестируемый ребенок.
Измерение интеллекта, как оно отражается в показателях IQ тестов, показывает, как люди варьируют по степени «интеллекта» на непрерывной шкале. Процентиль — это показатель, к-рый делит генеральную совокупность выборки на 100 частей. Он указывает процент лиц, попадающих в область ниже его заданного значения. Стандартная оценка показывает отклонение индивидуального рез-та от среднего в единицах стандартного отклонения. IQ = 100 произвольно принимается за средний показатель. Это число — всего лишь условность. Стандартное отклонение (SD)является мерой изменчивости показателей IQ множества людей относительно такого среднего показателя. Обычно 50% всех людей получают показатели IQ между 90 и 110, 25% — ниже 90 и остальные 25% — выше 110. 25% совокупности с показателями IQ ниже 90 были классифицированы психологами в нисходящем порядке как тупые (dull normal), пограничные (borderline)и умственно отсталые (mentally retarded)соответственно. Для улучшения понимания специфики лечения и обучения лиц, относящихся к категории умственно отсталых, эту категорию подразделяют на подкатегории легкой, средней, тяжелой и глубокой умственной отсталости. Остальные 25% совокупности, имеющие показатели IQ выше 110, соответственно подразделяются на категории сообразительных (bright normal), обладателей превосходного (superior)и выдающегося (very superior)интеллекта в том виде, как он измеряется шкалами Векслера. Приблизительно 2% совокупности находятся в каждой из крайних категорий: выдающегося интеллекта и глубокой умственной отсталости.
Надежность указывает на согласованность (устойчивость) тестовых показателей индивидуума. Обычно ее определяют путем сравнения (вычисления корреляции) тестового показателя индивидуума с показателем, полученным в рез-те повторного проведения на нем того же самого теста или его эквивалентной формы. Валидность показывает, действительно ли используемый тест измеряет то, что он предположительно должен измерять, а именно: какие выводы можно сделать из тестового показателя в отношении того, что находится за пределами данного теста. Т. о., валидность обычно используется для характеристики того, в какой степени показатели IQ-теста коррелируют с прошлыми или будущими измерениями эффективности деятельности индивидуума, напр., академической успеваемостью или профессиональной успешностью.
Было разраб. неск. объективных мер уровня адаптивной успешности индивидуума (гл. обр. для уровней успешности детей в повседневной жизни). Коэффициенты корреляции между показателями, полученными на основе таких шкал адаптивного поведения, и показателями того же самого ребенка по тестам интеллекта варьируют от 0,58 до 0,95, указывая на то, что адаптивное поведение и измеряемый интеллект коррелируют, но не являются идентичными. Эксперты сходятся в том, что в области психич. задержки (mental retardation)использование опытным специалистом наряду с показателями IQ клиента показателей его социоадаптивного поведения и клинической истории повышало достоверность диагноза психической задержки в большей степени, чем валидность любого др. диагноза в области психопатологии.
Подобно большинству инструментов, методики психол. оценки могут использоваться в разнообразных целях, как деструктивных, так и конструктивных, и их использование невозможно отделить от опыта, компетентности и этических ценностей психолога. Большинство пользователей тестов интеллекта применяют их мудро и гуманно и в сопряжении с мерами адаптивной успешности стремятся проводить оценку т. о., чтобы максимально раскрыть потенциал каждого проходящего обследование индивидуума.
См. также Модель структуры интеллекта, Векслеровские тесты интеллекта
Дж. Д. Матараццо, Д. Р. Денвер
Меры креативности (creativity measures)
Креативность (творчество) — это область когнитивного функционирования, играющая важную роль в широком разнообразии решаемых человеком задач, причем не только в области иск-ва, но также в технике, науке и других видах деятельности.
Большинство М. к. основаны на модели «структуры интеллекта» (SI) Дж. П. Гилфорда. Согласно Гилфорду, можно провести различие между конвергентным и дивергентным продуцированием как интеллектуальными операциями.
При конвергентном мышлении происходит «сужение» области поиска — при этом рассматривается лишь несколько возможных альтернатив и выбирается единственное — наилучшее — решение задачи или проблемы. Такое мышление проявляется при ответах в тестах, предполагающих множественный выбор, а также в большинстве тестов общего интеллекта. В противоположность этому, дивергентное продуцирование предполагает способность мыслить во многих расходящихся направлениях и часто приводит к новым и оригинальным решениям проблем. Многие М. к. создавались именно для оценки дивергентного продуцирования.
См. также Тестирование способностей
Ф. Бенсон
Меры критерия (criterion measures)
М. к. или критериальная мера — это стандарт, эталон и т. п. В психологии под критерием чаще всего подразумевается стандарт (эталон) для оценивания валидности теста. Иногда термин «критерий» также используют для обозначения переменной, значения к-рой предсказываются по др. переменным, как в случае изучения множественной корреляции.
Когда дело касается оценки валидности теста, М. к. обычно выступает общепринятая мера изучаемого поведения. Чем в большей степени коррелирует тест с таким стандартом, тем выше критериальная валидность (criterion-related validity)данного теста. Критериальная валидность подразделяется на текущую (диагностическую) и прогностическую валидности. Текущая валидность (concurrent validity)определяется на основе корреляции показателей теста с замерами критерия, проводимыми примерно в одно время с тестированием. Прогностическая валидность (predictive validity)определяется на основе корреляции показателей теста с замерами критерия, полученными спустя какое-то время после тестирования.
Проблема мер критерия заключается в том, чтобы найти такие меры, которые можно было бы принять в качестве общепризнанных стандартов. Эта проблема легче решается в том случае, когда имеется возможность получить выборочные замеры деятельности (work samples),например, работы продавца. Хотя работа хорошего продавца может характеризоваться несколькими важными показателями — уровнем удовлетворенности покупателей, числом и объемом повторных продаж и числом покупателей — за М. к. чаще всего принимаются показатели общего объема продаж. Можно также сконструировать составную М. к., используя весовые коэффициенты, рассчитываемые путем усреднения оценок важности отдельных критериев, полученных на соответствующей выборке менеджеров по продажам.
Стандартизация вызывает большую проблему в ситуации, когда критерий представляет собой конструкт. Эта проблема начинается с принятия решения о том, что включать в «умение продавать». Чем более многозначен такой конструкт, тем больше возникает затруднений. Сначала необходимо определиться с тем, что должно входить в данный конструкт, затем найти способы оценки таких многозначных понятий как «социальная успешность», затем прийти к согласию в отношении того, как взвешивать эти аспекты при использовании их в сочетании — весьма непростая задача.
Чтобы использование М. к. в роли стандартов не вызывало сомнений, их следует тщательно проанализировать на предмет того, что они измеряют именно то, что должны, по предположению, измерять. К примеру, Рой Голдмен и Роберт Слотер указывают на то, что средний балл успеваемости является ненадежным критерием успешности обучения в колледже, потому что студенты с низкими способностями тяготеют к выбору легких курсов, в которых они могут добиться успеха, в то время как студенты с более высокими способностями выбирают для себя более трудные курсы, где они могут не получить высоких отметок.
Богден и Тейлор подробно рассматривают источники смещения критерия (criterion bias). Они выделяют четыре класса причин, приводящих к систематическим ошибкам: а) недостаточность критерия (criterion insufficiency), или упущение релевантных элементов; б) дефектность критерия (criterion deficiency), или включение в его состав посторонних элементов; в) смещение единиц критериальной шкалы (criterion scale unit bias), или неравномерность шкалы (напр., шкала дает слишком большое число благоприятных оценок, вместо их малого числа, к-рое бы получилось в случае их колоколообразного распределения); г) деформация критерия (criterion distortion), или неправильное взвешивание элементов в составном критерии.
К числу факторов, могущих приводить к систематическим ошибкам при измерении критерия, относят ошибку благоприятной возможности, эффект ореола и вмешательство опыта. Ошибка благоприятной возможности (opportunity bias)происходит, когда некоторые из работников, в отличие от других, имеют больше возможностей проявлять критериальное поведение, что приводит к их более высоким оценкам по критерию, хотя при равных возможностях эти другие могли бы реализовывать это поведение с неменьшим успехом. Эффект ореола (halo effect)обнаруживается при работе с оценочными шкалами, когда на оценки отдельных черт влияет общее впечатление оценивающего об оцениваемом им чел. Вмешательство жизненного опыта (experience contamination)имеет место в ситуации, когда критериальное поведение изменяется вместе с неконтролируемым фактором жизненного опыта.
См. также Тестирование способностей, Методы эмпирического исследования, Измерение
Д. Крэсвул
Меры речи и слуха (speech and hearing measures)
Измерение речи и слуха может осуществляться в клинических, промышленных и исследовательских целях. Характер используемых при этом тестов и методов зависит от целей тестирования.