Коэффициенты надежности показателей IQ в шкалах Векслера

Коэффициенты надежности показателей IQ в шкалах Векслера - student2.ru

Коэффициенты валидности текущей WAIS (по связи с критериями академической успеваемости и оценками профессиональной деятельности) составили 0,3 для невербальных субтестов и 0,4–0,5 для вербальных. Для WISC показатели валидности критериальной по связи с результатами тестов достижений и учебными критериями интеллекта находятся в пределах 0,5–0,6. При этом показатели вербальной шкалы более тесно коррелируют с критерием, чем показатели невербальной шкалы.

Шкалы измерения интеллекта Векслера отличаются высокой корреляцией с результатами других достаточно известных тестов интеллекта. Коэффициент корреляции с показателями шкалы умственного развития Стэнфорд – Бине для WAIS составляет около 0,8. Характерна более тесная связь с результатами вербальной шкалы, чем с невербальным IQ-показателем. Так, для шкалы WISC коэффициенты корреляции с данными теста Стэнфорд – Бине составляют 0,76 по вербальной шкале и 0,56 – по невербальной. Коэффициенты корреляции показателей IQ WPPSI и теста Стэнфорд – Бине равны 0,82, 0,81, и 0,67 для полной, вербальной и невербальной шкалы, соответственно.

Данные о валидности конструктной существенно дополняются факторным анализом результатов теста. Согласно его результатам шкалы измерения интеллекта Векслера насыщены фактором общего интеллекта (фактор G), определяющим около 50 % суммарной дисперсии батареи. Кроме того, выявлены три групповых фактора: фактор вербального понимания (субтесты «Словарный», «Осведомленности», «Понимание», «Нахождение сходства»); фактор перцептивной организации (субтесты «Кубики Коса», «Составление фигур»), выраженный сочетанием факторов скорости восприятия и пространственных представлений; фактор памяти («Арифметика», «повторение цифровых рядов»).

Для правильной интерпретации количественных показателей, особенно в случае сравнительных психодиагностических исследований, имеют значение сведения об ошибке измерения, отражающей точность индивидуального результата (табл. 12)

Таблица 12

Величины стандартной ошибки измерения (σm) IQ-показателей в шкале Векслера

Коэффициенты надежности показателей IQ в шкалах Векслера - student2.ru

В отечественных исследованиях шкалы измерения интеллекта Векслера нашли достаточно широкое распространение. WAIS, впервые адаптированная в Ленинградском психоневрологическом научно-исследовательском институте им. В. М. Бехтерева, успешно использовалась в комплексном лонгитюдном изучении развития интеллекта (Б. Г. Ананьев, 1969 и др.). Тест применялся в дифференциальной диагностике умственной отсталости и задержки психического развития детей (А. Ю. Панасюк, 1976), а также судебно-психологической экспертизе подростков (Л. А. Калинина, 1980). С помощью WAIS были получены данные, углубляющие представления об особенностях интеллекта при некоторых психических заболеваниях (И. Н. Гильяшева, 1983 и др.). WISC была адаптирована и стандартизирована на отечественной выборке (А. Ю. Панасюк, 1973).

Шкала памяти Векслера

Шкала памяти Векслера (WechslerMemoryScale, WMS) – методика психометрической оценки памяти. Тестовая батарея, включающая серии заданий для исследования отдельных мнестических функций, разработана Д. Векслером в 1946 г. Задания методики объединяются в семь субтестов.

I субтест – ориентировка и осведомленность. Выполнение заданий предусматривает ответы испытуемого на наиболее общие вопросы, касающиеся личных и общественных данных (6 вопросов, правильный ответ – 1 балл).

II субтест – ориентировка во времени и пространстве (5 вопросов, правильный ответ – 1 балл).

Первые два субтеста методики предъявляются в случае подозрения на наличие умственного недоразвития, глубоких дефектов памяти, нарушения ориентировки, а также в случае явной неудачи испытуемого при выполнении субтестов.

III субтест – психический контроль. Включает три задания: отсчитывание от 20 в обратном порядке, называние букв алфавита, отсчитывание от 1 до 40 через 3 единицы. Время выполнения лимитировано. За быстрое выполнение добавляются дополнительные баллы.

IV субтест – логическая память. Задание состоит в воспроизведении коротких рассказов, отпечатанных на карточках. Оценка выполнения производится по числу воспроизведенных смысловых единиц рассказа.

V субтест – воспроизведение рядов цифр в прямом и обратном порядке. Оценка соответствует наибольшему числу элементов цифрового ряда, воспроизведенных испытуемым в двух попытках (отдельно для воспроизведения в прямом и обратном порядке).

VI субтест – воспроизведение геометрических фигур. Испытуемому демонстрируются последовательно 4 карточки с простыми геометрическими изображениями. Экспозиция – 10 с. Оценка успешности выполнения дифференцирована в зависимости от числа воспроизведенных элементов фигур.

VII субтест – воспроизведение парных ассоциаций. Обследуемому зачитывают 10 пар слов, близких или отдаленных по степени ассоциативной связи. Первые 6 пар – легкие ассоциации, следующие 4 пары – трудные ассоциации. При первом прочтении они расположены вперемешку. Затем трижды, каждый раз в другом порядке, экспериментатор зачитывает первое слово каждой пары и проверяет запомнившиеся ассоциации. Пауза между сериями – 10 с. Ответ, данный в течение 5 с, засчитывается как правильный.

Результат теста получают при сложении половины суммы удавшихся легких ассоциаций с суммой трудных ассоциаций. Первичные результаты по всем субтестам суммируют и, используя специальную таблицу, к «сырым» баллам прибавляют возрастную поправку, рассчитанную для возрастных групп в диапазоне от 15 до 79 лет. Корригированный по возрасту первичный результат может быть переведен в оценки, соответствующие баллам стандартного IQ-показателя. Имеется возможность пересчета «сырых» оценок по отдельным субтестам в шкальные оценки. Таким образом, тест допускает профильную оценку данных с учетом состояния отдельных мнестических функций (Д. Векслер, 1945).

Достоинством шкалы памяти Векслера является возможность количественного измерения кратковременной и долговременной памяти, словесно-логической, визуальной и ассоциативной репродукции. Наряду с измерением многих показателей в этой компактной и удобной для проведения методике предусмотрен охват широкого возрастного диапазона испытуемых.

В нашей стране шкала памяти Векслера получила наибольшее распространение в клинической психодиагностике.

Кубики Коса

Кубики Коса (КК) – невербальный тест интеллекта. Предложен К. Косом в 1920 г.

Испытуемому предлагают составить фигуры из цветных кубиков по рисункам-образцам. Тестовый материал состоит из шестнадцати кубиков с ребром 2,5 см, стороны которых окрашены в красный, белый, желтый и синий цвета. Оставшиеся две противоположные грани разделены по диагонали, причем одна окрашена в белый и красный цвета, а вторая – в синий и желтый (см. шкалы измерения интеллекта Векслера). В набор включены восемнадцать образцов фигур, первый из которых является тренировочным и выполняется совместно с испытуемым. Цвета рисунков-образцов соответствуют цветам кубиков, но размеры образцов вдвое меньше. Образцы размещены посередине картонной карточки, имеющей размер 10 ґ 7,5 см.

Задания следуют в порядке возрастающей трудности, что обеспечивается последовательной комбинацией следующих условий:

1. фигуру можно построить только из одноцветных сторон кубиков;

2. для построения фигуры следует использовать несколько двухцветных граней;

3. фигуру можно сложить только из двухцветных сторон или из сочетания двухцветных и одноцветных, причем на образце не обозначена граница между соседними кубиками;

4. образец повернут на 45°, т. е. стоит на ребре;

5. для составления фигур требуется использовать все большее количество кубиков;

6. образцы постепенно становятся все менее симметричными;

7. увеличивается количество цветов на образце;

8. образец не ограничивается рамкой, так что на краях сливается с фоном. Образцы-рисунки испытуемому предъявляются последовательно, тестирование прекращается после пяти последовавших друг за другом неудачных решений. Успешность оценивается с нескольких позиций. Самым важным показателем является время решения отдельных заданий. В протоколе фиксируется и количество попыток при выполнении. Первичные оценки по результатам выполнения заданий переводятся в показатель умственного возраста. В более поздних модификациях оценки переводятся в стандартные IQ-показатели. Данные дополняются качественным анализом поведения испытуемого.

КК принадлежат к часто применяемым тестам и широко используются как в оригинальной, так и в сокращенных модификациях. Ценность теста определяется особенностями деятельности испытуемого, которая моделируется его заданиями. Испытуемый начинает выполнение задания с анализа образца путем сопоставления фрагментов образца с гранями кубиков. Затем осуществляется генерализация выделяемого признака. Вслед за этим осуществляется переход к синтезу – констатация соответствия между образцом и собранной из кубиков фигурой. По мнению К. Коса, в ходе решения заданий задействуются все мыслительные процессы.

Имеются сведения о конструктной валидностикубиков Коса. Получена значимая корреляция со шкалой умственного развития Бине – Симона (r = 0,82 – у нормальных детей и r = 0,67 – у слабоумных детей). Изучались связи показателей КК с основными тестами интеллекта, в частности шкалой умственного развития Стэнфорд – Бине (r = 0,77), прогрессивными матрицами Равена (r = 0,81). Обращается внимание на независимость друг от друга показателей КК и тестов арифметических способностей.

Наиболее широкое применение кубики Коса находят в клинической психодиагностике (В. М. Блейхер, И. В. Крук, 1986). По данным Л. Кошча (1976) тест весьма полезен при работе с такими разнообразными контингентами испытуемых, как творческие личности с высоким уровнем способностей и, с другой стороны, умственно отсталые лица; дети с минимальной мозговой дисфункцией, нарушением концентрации внимания, нарушением пространственной ориентировки; дети, страдающие неврозами; дети с задержкой психического развития, педагогически запущенные; больные юношеского и зрелого возраста, страдающие шизофренией. Тест может использоваться и при анализе интеллектуального потенциала здоровых лиц.

В отечественной психодиагностике кубики Коса используются чаще всего в том виде, как они представлены в соответствующем отдельно взятом субтесте шкалы измерения интеллекта Векслера.

Компьютерные тесты

1. Тесты, предъявление и обработка которых приспособлены к среде ЭВМ.

2. Тесты, специально разработанные для реализации условий и возможностей современной вычислительной техники.

На современном этапе развития компьютерной психодиагностики преобладающее большинство компьютерных тестов – компьютерные версии уже известных методик. Чаще всего это различные личностные опросники, реже – тесты интеллекта и др. Важнейшая проблема, возникающая в связи с появлением компьютерной формы той или иной методики, связана с доказательством ее эквивалентности основной версии теста. Сегодня многочисленными исследованиями доказано, что такие компьютерные тесты нуждаются в изучении их психометрических параметров. Применительно к характеристике компьютерных тестов введено понятие эквивалентности валидности, включающее эквивалентность психометрическую, эквивалентность, относящуюся к процессу обследования и популяционную эквивалентность. Большинство исследований за рубежом ограничивается установлением лишь психометрической эквивалентности компьютерной версии теста. Для многих компьютерных версий тестов, используемых в странах СНГ, отсутствуют данные об их валидности, надежности, величине стандартного отклонения и других психометрических показателях.

Собственно компьютерные тесты, т. е. те, которые изначально разработаны с учетом требований и возможностей современной вычислительной техники, весьма немногочисленны. Их создание осуществляется в рамках так называемого адаптивного тестирования, важнейшей особенностью которого является управление со стороны компьютера основными этапами психодиагностического процесса. Это означает, что должен поддерживаться постоянный и адекватный режим диалога между компьютером и обследуемым. Имеются определенные достижения в адаптивном тестировании специальных способностей, а также уровня достижений. Однако диагностика личностных особенностей в адаптивном тестировании остается проблематичной. На нынешнем уровне развития адаптивное тестирование, скорее, ставит проблемы, нежели их решает.

Несмотря на достаточно широкое распространение компьютерных тестов (свыше тысячи тестов ныне используются на Западе в психологических исследованиях, образовании, промышленности и управлении), не утихают споры об их месте в решении многих психодиагностических задач. Так, оспаривается значение компьютерных тестов в индивидуальной диагностике. При этом наибольшее неприятие исследователей вызывает компьютерная интерпретация результатов тестирования. Отмечается, что простейшие, так называемые дескриптивные компьютерные интерпретации (в основном имеющие хождение в СНГ) игнорируют паттерны множественных шкал, а поэтому содержат противоречивые и взаимозаменяемые утверждения, не обладают гибкостью.

Обобщенные утверждения, выдаваемые компьютером, содержат некоторую долю истины обо всех людях, но не решают задачи их дифференциации (эффект Барнума). Компьютерные интерпретации, моделирующие диагностическую деятельность специалиста, также далеки от совершенства, и зачастую их использование может привести к ошибкам. Поэтому и сегодня многие психологи предпочитают при использовании компьютеров статистический подход, при котором получаемая информация не идет дальше обработки результатов по некоторому алгоритму, а процесс их интерпретации остается делом специалиста. Такую позицию по отношению к интерпретациям компьютера в индивидуальной диагностике следует считать наиболее обоснованной.

Контрольные шкалы

Контрольные шкалы – вспомогательные диагностические средства, позволяющие оценить достоверность информации, получаемой с помощью тех или иных психодиагностических методик. Наиболее широко контрольные шкалы применяются в личностных опросниках.

Недостоверность диагностических данных, полученных в результате обследования, можно обнаружить, опираясь на анализ различного рода специальных показателей. В качестве примера можно привести комплекс контрольных шкал Миннесотского многоаспектного личностного опросника, включающий четыре специализированные шкалы.

1. Шкала «?» учитывает количество пунктов опросника, оставленных испытуемым без ответа. Превышение определенного критического числа таких незаполненных пунктов является основанием для суждения о недостаточной мотивированности испытуемого на обследование, возможном низком культурном уровне и недостаточном понимании содержания формулировок пунктов опросника. С учетом данных шкалы «?» оцениваются достоверность и диагностическая ценность результата обследования.

2. Шкала «L» – один из наиболее распространенных типов контрольных шкал. Направлена на оценку тенденции испытуемого к социально-положительным ответам. В содержание пунктов шкалы включены вопросы, предусматривающие однозначный ответ в ситуации, отражающей житейски реальное поведение, которое внешне может показаться осуждаемым строгой моралью. Испытуемый, желающий показать себя в максимально выгодном свете, может отвечать на вопросы не в соответствии с истинными поведенческими проявлениями или качествами, а отражать свое представление о нужных (с точки зрения моральных норм или образцов здоровой либо высокоценимой окружающими личности) реакциях, качествах характера, требованиях культуры поведения, установках и т. д.

В том случае, если значения оценок по шкале «L» превышают критические, считается, что испытуемый отличается установкой на ответы: «Не так, как есть», а «Как должно понравиться» или «Как будет правильно».

Шкалы, подобные «L», наряду с методикой MMPI используются в опросниках EPI, MAS (см. личностные опросники Айзенка, шкала «Проявления тревожности») и ряде других.

3. Шкала валидности («F») направлена на анализ тенденции к намеренному или неосознанному ухудшению результата обследования (симуляция, аггравация). В состав пунктов шкалы включены утверждения, касающиеся проявлений психической и физической сферы, которые весьма редко встречаются в клинической практике, однако внешне соответствуют житейским представлениям о явлениях, которые могут возникнуть при психических расстройствах, стрессе и т. д. В том случае, если испытуемый отмечает у себя большое количество таких симптомов, есть основания предполагать упомянутую выше тенденцию или наличие выраженной мнительности, внушаемости, ипохондричности, склонности к оценке своего состояния в мрачных тонах. Оценки по шкале «F» значительно выше критических могут возникнуть и при случайных (наугад) ответах, невнимательной или поверхностной работе испытуемого, тенденции давать эксцентричные ответы.

4. Шкала коррекции («К») направлена на изучение противоположной предыдущей установки испытуемого к намеренному или неосознанному улучшению результата обследования (диссимуляция). В шкалу включены утверждения, касающиеся часто встречающихся в жизни проявлений, которые могут восприниматься испытуемым как признаки болезни, какого-либо личностного недостатка. Субъект, желающий показаться максимально здоровым или благополучным в личностном или жизненном плане, может часто отрицать наличие у себя таких симптомов, привычек, реакций на окружающие обстоятельства. При повышенных К-показателях можно ожидать, что и на вопросы других шкал испытуемый будет стремиться ответить в более приглаженном, чем в реальности, виде. В зависимости от степени выраженности исследуемой тенденции делается поправка к результату ряда основных клинических шкал методики MMPI.

Высокий К-показатель может означать защитную реакцию на ситуацию тестирования или попытку казаться хорошим. Низкий К-показатель может указывать на чрезмерную честность или самокритичность либо на нарочитую попытку показаться плохим.

Различные варианты показателей контрольных шкал методики ММРI могут интерпретироваться комплексно, давая информацию о возможном характере конкретных данных.

Существующий комплекс контрольных шкал является ценным психодиагностическим инструментом. Контрольные шкалы могут использоваться отдельно от основной методики в сочетании с любым другим приемом диагностики личности в целях контроля достоверности сообщаемых испытуемым данных, анализа установок, искажающих информацию, полученную на основе самооценки.

Завершение предложения»

«Завершение предложения» – группа проективных методик исследования личности, представляющих собой развитие словесной ассоциации теста. В качестве инструмента для измерения лингвистических способностей имеют давнюю историю в психологических исследованиях. Впервые для изучения личности «Завершение предложения» были применены А. Пейном (1928), а затем А. Тендлером (1930). Обследуемому предлагается серия незаконченных предложений, состоящих из одного или нескольких слов, с тем чтобы он их завершил по своему усмотрению.

Пример.

1. Будущее кажется мне…

2. Думаю, что настоящий друг…

3. Женщины…

Предложения формулируются таким образом, чтобы стимулировать обследуемого на ответы, относящиеся к изучаемым свойствам личности. Обработка полученных данных может быть как качественной, так и количественной.

Существует значительное количество методик, основанных на принципе вербального завершения. Одни предназначены для выявления мотивов, потребностей; другие – чувств обследуемого, его отношения к семье, половой жизни, вышестоящим по работе и т. д. Наиболее известны «Завершение предложения», разработанные Дж . Роттером (1950), Д. Саксом (1950), Б. Форером (1950), А. Роде (1957). Принцип вербального завершения используется также в методиках «Завершение истории».

Достоинствами «Завершение предложения» являются их гибкость, возможность приспособления к разнообразным исследовательским задачам. По оценке зарубежных специалистов, валидность и надежность этих методик достаточно высоки Р. Ватсон, 1978). Допускается групповое обследование.

В нашей стране разные виды «Завершение предложения» используются преимущественно в клинико-диагностических исследованиях (Г. Г. Румянцев, 1969 и др.).

Наши рекомендации

Предельное сопротивление материала. Нормативные и расчетные напряжения. Коэффициенты надежности

Объединение показателей надежности

Эксплуатационные коэффициенты надежности

Коэффициенты корреляции показателей

Коэффициенты надежности и способы их измерения.

Коэффициенты условий работы и надежности

Коэффициенты наследуемости (Н2) показателей

Коэффициенты надежности по материалу

Нормирование показателей надежности

Расчет показателей надежности

← Предыдущая страница | Следующая страница →