Перевод тестовых оценок в стандартные показатели и оценки шкалы Т-баллов

* М =41,7; **σ=3,12.

Если в оценке по двум тестам х₁ и х₂распределены нормально, z — показатель нормальной кривой:

или

z_н = z₁ = z₂

Используя эти равенства, можно перевести любое нормальное распределение в другое нормальное распределение, в том числе и единичное. Как видно из табл. 24, оценки z-шкалы могут принимать как отрицательное (выполнение индивидом теста на уровне ниже среднего), так и положительное значение. К недостаткам шкалы следует отнести слишком крупный масштаб единиц измерения (σ = 1). Для удобства простую z-шкалу можно трансформировать, выбрать другие значения М₁ и σ. Новые z-показатели (z_i) будут определяться по формулам:

Пример подобной трансформации с выбранными значениями М = 50; σ = 1 (см. Оценки шкальные) приводится в табл. 24.

Благодаря возможности таких преобразований шкалы, традиционно принятые в психодиагностике и построенные на основе шкалы 2-показателей, становятся сопоставимыми, и возможен переход из одной шкалы в другую с иными показателями М и σ.

СТАНДАРТИЗИРОВАННОЕ ИНТЕРВЬЮ ПОВЕДЕНИЯ ТИПА А —новидность опросника личностного. Разработан сотрудниками Каунасского медицинского института в 1978 г. Направлен на диагностику поведения типа А.

Методика состоит из 21 вопроса оценочной шкалы, с помощью которой экспериментатор оценивает поведение испытуемого (учитываются следующие параметры: манера держать себя, походка, скорость движений, их амплитуда, поза, речь, общий стиль поведения и др.)

Примеры вопросов:

— Часто ли Вы думаете о работе по вечерам и в выходные дни?

— Старались ли Вы быть во всем первым и лучшим, когда были моложе?

— Если Вы испытываете нетерпение и раздражение, то трудно ли Вам это скрыть?

Возможны три варианта ответов: «Да», «Нечто среднее», «Нет».

Имеются данные о достаточной конструктной валидности опросника. При сопоставлении с данными Дженкинса поведения обозрения коэффициент корреляции — 0,64. Диагностические заключения и выводы совпадают в 71,8% случаев с подтвержденным клиническим диагнозом.

Методика стандартизирована на выборке из 1450 человек. Как психодиагностический инструмент требует дальнейшей проверки. В случае установления достаточно высокой валидности прогностической, валидности текущей и дискриминативности может быть рекомендована как вспомогательный инструмент для скрининга (см. Отсеивание), а также для исследований, направленных на изучение психологических особенностей психосоматических больных.

СТАНФОРД—БИНЕ УМСТВЕННОГО РАЗВИТИЯ ШКАЛА(Stanford— Binet Intelligence Scale) — тест интеллекта. Предназначен для измерения уровня интеллектуального развития. Первый вариант С.—Б. у. р. ш. был разработан Л. М. Терменом в 1916 г. и представлял собой модификацию Бине—Симона шкалы умственного развития. В ходе разработки в базовую методику было введено большое количество изменений. По сравнению со шкалой Бине было добавлено более трети новых заданий, ряд старых был либо переделан, либо отброшен или переадресован другим возрастным группам. Фактически уже первая редакция С.—Б. у. р. ш. представляла собой новый тест. В дальнейшем тест неоднократно радикально совершенствовался, и к настоящему времени используется уже третья его редакция (1972).

Тесты, включенные в батарею Станфорд—Бине, группируются по возрастным уровням (см. Бине—Симона умственного развития шкала), от уровня II (2 года) до уровня взрослого (22 года и 10 месяцев — XVI — 8 уровень). Для уровней II-V группы заданий по возрастным градациям составляются с разницей в полгода, что связано с быстрым психическим развитием в соответствующие периоды. Для возрастных уровней V-XIV тесты учитывают разницу в возрасте в 1 год. Остальные уровни обозначаются как подростковый и взрослый I, II и III уровни. Комплекс задач для каждого возрастного уровня, за исключением подросткового, состоит из 6 тестов (для подросткового уровня — 8 тестов).

Батарея тестов Станфорд—Бине включает задания, направленные на исследование широкого диапазона способностей — от простого манипулирования до абстрактного рассуждения. На ранних возрастных уровнях тесты требуют главным образом зрительно-моторной координации, перцептивного различия, способности понимать инструкцию (в заданиях типа складывания кубиков, нанизывания бус, подбора геометрических фигур), а также способности узнавать предметы, предъявляемые в виде игрушечных моделей или изображений на карточках. На высших возрастных уровнях в наибольшей степени представлены тесты, использующие вербальное содержание заданий. Среди них словарный тест (объяснение значения слов), аналогии, завершение предложений, определение абстрактных понятий, интерпретация пословиц. Некоторые тесты направлены на характеристику степени плавности и беглости речи (быстрое называние не связанных между собой слов, подбор рифм, построение предложений с заданными словами).

Среди заданий батареи широко представлены тесты общей осведомленности, знания норм общественной жизни, правил поведения (ответы на вопросы, интерпретация ситуаций, обнаружение несоответствий в сюжетных картинках или рассказах). В шкалу включен ряд тестов памяти, пространственной ориентации (визуальная репродукция фигур, лабиринты, складывание и разрезание бумажных объектов и т. д.). На более высоких возрастных уровнях анализируется степень усвоения некоторых навыков, приобретенных в школе (умение читать, знание арифметики).

Тесты внутри каждого возрастного уровня одинаковы по трудности и расположены без учета сложности заданий. Для каждого возрастного уровня предусмотрен запасной набор задач, применяемых по мере необходимости.

Четыре субтеста из каждого уровня отбираются для сокращенной шкалы, которую применяют в случае использования методики в качестве краткой пробы. Вместе с тем корреляция результатов укороченной и полной программы обследования является достаточно высокой.

Особенностью процедуры обследования, вытекающей из шкального принципа подбора заданий, предложенного А. Бине, является то, что испытуемому предлагается неполный набор заданий методики. Предъявляются лишь те тесты, которые соответствуют интеллектуальному уровню обследуемого. Стандартная процедура обследования начинается с применения заданий, относящихся к более низкому уровню, чем тот, который соответствует возрасту испытуемого. Затем в зависимости от успеха или неуспеха осуществляется переход на более высокий или низкий уровень. «Базовый уровень» определяется как максимальный возрастной уровень, все задания которого выполняются. Исследование продолжается с переходом на возрастающие по сравнению с базовым уровнем группы заданий до тех пор, пока нерешенными оказываются все тесты данной группы. Соответствующий уровень определяется как «потолочный».

Показатель «умственного возраста» в С.—Б. у. р. ш. равен «базовому возрасту» с прибавлением к нему добавочных месяцев за правильно решенные задания из уровней, находящихся выше. Для уровней II-V с полугодовыми интервалами каждый из шести решенных тестов засчитывается за 1 месяц. Для уровней VI-XIV за каждое решенное задание дополнительно даются 2 месяца. На каждый из взрослых уровней приходится более года «умственного возраста», поэтому число дополнительных месяцев здесь определяется пропорционально временному интервалу и числу тестов.

Процедура обследования с помощью С.—Б. у. р. ш. занимает примерно 30-40 мин для детей младшего возраста. Для более старших возрастных групп длительность обследования не более 1,5 ч. Материалы, необходимые для проведения теста, включают набор игрушек для обследования детей младшего возраста, тестовые тетради с заданиями, протоколы, руководство по проведению обследования и обработке результатов.

При обследовании с помощью ряда тестов методика допускает возможность получения широкой качественной информации о методах работы испытуемого, способах решения им задач. Большие возможности предоставляются и наблюдению за личностными качествами: уровнем активности и мотивированности, уверенности, настойчивости и т. д.

Сложная процедура проведения обследования и интерпретации полученных результатов, необходимость строгого соблюдения стандартов требуют высокой квалификации и предварительной тренировки экспериментатора.

Первый вариант С.—Б. у. р. ш. (1916) и вторая редакция шкалы (Л. М. Термен, М. А. Мерилл, 1937) отличались репрезентативным нормированием. Редакция 1937 г. включала две параллельные формы теста (L и М) и была предназначена для обследования испытуемых в возрасте от 1,5 до 18 лет.

В первых редакциях основным измеряемым показателем являлся относительный IQ-показатель (см. Интеллекта коэффициент). В третьей редакции (1960) вводятся оценки IQ-показателя стандартного. В этой же редакции параллельные формы преобразованы в единую (L-M).

Наиболее распространенная к настоящему времени редакция формы L—M шкалы Станфорд—Бине (1972) включает тестовые задания, аналогичные по содержанию включенным в вариант шкалы 1937 г., однако нормы теста здесь были подвергнуты рестандартизации. Выборка стандартизации включала примерно по 100 детей для каждой возрастной группы в интервале от 2 до 5,5 года (временной шаг выборок — 0,5 года) и в возрастных группах от 6 до 18 лет (через 1 год). Последняя редакция теста содержит таблицы стандартного IQ-показателя для умственного (МА) и фактического (СА) возраста, соответствующие годам и месяцам возраста испытуемого, включает нормативные таблицы показателя МА по данным варианта L—M (1937).

По применению шкал Станфорд— Бине накоплен огромный опыт, включающий фактические данные и их интерпретацию. По широте использования эта методика занимает в зарубежной психодиагностике одно из ведущих мест среди тестов интеллекта. Для большинства специалистов в области психологической диагностики и потребителей психодиагностической информации IQ-коэффициент, определяемый с помощью шкалы Станфорда—Бине, связывается с конкретным выражением понятия «интеллект». Длительность использования и широта распространения сделали систему отсчета оценок шкальных С.—Б. у. р. ш. стандартом для других психометрических тестов (см. IQ-показатель стандартный).

Распределение результатов IQ-показателей шкал Станфорд—Бине положено в основу классификации степеней умственной отсталости, широко распространенной в западной психодиагностике (Классификация Американской Ассоциации по изучению умственной неполноценности — AAMD).

В ходе многолетнего накопления данных получены разнообразные сведения о характеристиках С.—Б. у. р. ш. Ее надежность (по параллельным формам теста) с интервалом ретеста до недели составляет для возрастных групп от 2,5 до 5,5 года 0,83 для интервала IQ-показателей 140-149 и 0,91 —для IQ-показате-лей 60-69. В возрастных группах 6-13 лет для соответствующих величин IQ-noказателей коэффициенты надежности составляют соответственно 0,91 и 0,97, а для возраста 14-18 лет — 0,95 и 0,98. Таким образом, тест более надежен для лиц старшего возраста с относительно низкими IQ-показателями. Однако очевидно, что и в прочих случаях надежность шкалы достаточно высока.

Валидность критериальная шкалы Станфорд—Бине (текущая и прогностическая) характеризовалась на основе сопоставления с показателями школьной успеваемости (сравнение с экспертными оценками учителей и данными тестов достижений). Коэффициент валидности по связи с этими критериями составляет 0,40-0,75. Особенно значимой является связь IQ-оценок с показателями (констатирующего характера и прогностическими) успешности обучения предметам с преобладанием словесного материала. Результаты критериальной валидизации показывают, что тест Станфорд—Бине в основном направлен на измерение уровня школьных способностей.

Данные валидности конструктной С.—Б. у. р. ш. опираются на анализ этой группы характеристик методом дифференциации по возрастному критерию, подтверждающий прогрессивную вариабельность измеряемых показателей с возрастом.

Однородность заданий шкалы (см. Внутренняя согласованность) для батарейного теста является достаточно высокой (около 0,66). Факторный анализ указывает на связь результатов выполнения тестов шкалы с фактором G.

В целом анализ валидности содержательной и конструктного содержания теста указывает на доминирующую направленность С.—Б. у. р. ш. на тестирование комплекса вербальных способностей, некоторую перегруженность содержания тестов вербальным материалом. Эта особенность затрудняет адаптацию теста для других языковых и социокультурных групп.

Сведений об использовании в СНГ не имеется.

СТЕПЕНЬ СВОБОДЫ —характеристика распределения, используемая при проверке статистических гипотез. Обозначается символами df или п'. В вариационной статистике понятие С. с. отражает степень произвольности вариантов заполнения определенных групп, на которые квантифицируется распределение. Предположим, строится распределение IQ-оценок в определенной группе лиц (рис. 69).

Рис. 69. Вариант заполнения интервалов оценок в выборке из 100 обследованных

Известно, что IQ-оценки в данной группе варьируют от -2 до +2 . Тогда групп (интервалов шкалы) (k), если считать пределом интервала σ, будет четыре. Число испытуемых в группе составляет 100 человек. Если в первых трех интервалах шкалы число испытуемых, получивших соответствующие оценки, может быть произвольным, то в последнем интервале их число может составить лишь разницу между суммарным числом испытуемых в трех интервалах и общим числом обследованных. Другими словами, при заполнении четвертого интервала произвольность ограничена. С. с. данного распределения будет равна трем (df = k-1).

При представлении переменных в виде таблицы размером t x k, dk = (t – 1)(k - 1), где t — количество интервалов первого признака (количество строк таблицы), k — количество интервалов второго признака (столбцов таблицы).

В общем случае при малой выборке (п < 50) df = n-1 для распределения одного признака и df = п - 2 для распределения двух признаков (n — число наблюдений).

Показатель С. с. наиболее широко используется при расчете статистических гипотез с использованием критериев Стьюдента, Фишера, z-критерия, критерия χ². При применении каждого критерия и в каждом конкретном случае его использования существуют свои правила определения количества степеней свободы.

СТИМУЛЬНО-ИНСТРУКТИВНАЯ СИТУАЦИЯ ТЕСТА— комплексная характеристика теста, отражающая особенности инструкции, характер и тип теста стимульного материала и особенности оценки полученного результата.

Понятие С.-и. с. т. введено Р. Кэттеллом и Е. Варбуртоном (1967) и лежит в основе предложенной ими таксономии психодиагностических методик. Выделяют тринадцать параметров, характеризующих типы С.-и. с. т. и соответственно варианты конструкции тестов.

1. Ориентированность теста на фиксацию наличия или отсутствия реакции на стимул (напр., тесты чувствительности к боли, тесты на время реакции и т. д.).

2. Наличие ограничений или неограниченное разнообразие ответов,способов реагирования (напр., ср. опросники с дихотомическим выбором ответа и Роршаха тест).

3. Наличие вариантов выбора решения или свободно продуцируемый ответ (см. Задачи открытого типа; Задачи закрытого типа). Примером свободных ответов являются те, которые дает обследуемый в тематической апперцепции тесте.

4. Наличие в тесте единичных или повторяющихся ответов (см., напр., Тесты скорости).

5. Упорядоченная или неупорядоченная последовательность ответов (напр., от испытуемого может требоваться выполнение теста в строгой последовательности от первого до последнего задания, и, напротив, может допускаться свободный выбор последовательности решаемых задач).

6. Однородность или разнородность ответов (некоторые тесты состоят из заданий единого типа, в других, напр, в тестовых батареях, задания могут отличаться по своему характеру).

7. Свободное или ограниченное время решения.

8. Завершенность (окончательность) реакции или реагирование на реакцию. Испытуемый либо непосредственно реагирует на материал теста, либо на свою собственную реакцию, например, тот или иной стимул как-либо оценивается, вызывает ассоциации или воспоминания (см., напр., Пиктограмма).

9. Наличие явного или неявного смысла заданий. Некоторые тесты не имеют никакого вне их лежащего значения (напр., измерение времени реакции). В то же время там, где интересуются мнением о чем-либо, такое значение всегда присутствует.

10. Представление теста в виде отдельных заданий или целостное представление. Речь идет о различиях между тестами, состоящими из дискретных задач или же из единственного задания.

11. Психологическая сущность действия, необходимого для выполнения теста. Этот параметр учитывает, требуется ли для ответа: а) знание (напр., верное суждение); б) мнение; в) опознание или распознание.

12. Различия в субъективной приемлемости в ситуации тестирования.

13. Различия в свободе выхода из ситуации тестирования.

Приведенные таксономические параметры теоретически обусловливают существование 2¹³ типов С.-и. с. т. Дополнительно к параметрам, описывающим характеристики стимулов и инструкции, выделяют шесть характеристик оценивания результатов теста:

1. Объективность—субъективность оценивания.

2. Оценка целостного поведения или отдельных реакций.

3. Регистрация одного правильного (или возможного) ответа либо классификация разнообразных ответов (параметрическое или непараметрическое оценивание). Параметрически раскрывается время, количество ошибок, повторений и т. д. Непараметрически оценивается количество и разнообразие классов ответов. Непараметрическое оценивание свойственно многим тестам креативности.

4. Анализ всей совокупности ответов или их части, соответствующей некоторому критерию (напр., опросники личностные).

5. Наличие единого однородного показателя или различных относительных показателей. Единый показатель возможен при оценке теста в целом, как, напр., в случае личностных опросников. Разнотипные относительные показатели могут определяться в форме: различия во времени выполнения первой и второй частей теста (см. Корректурная проба): запоминания материала в обычных условиях и при действии отвлекающих факторов и т.д.

6. Нормативное оценивание или ипсативное оценивание.

С учетом общего количества прине денных параметров теоретическое число возможных вариантов С.-и. с. т. составляет (2¹³ х 2⁶) типов. Согласно Р. Кэттеллу и Е. Варбуртону, для использования в практике конструирования тестов особое значение имеют 64 варианта, полученные из трех наиболее важных ситуаций и параметров оценивания, генерирующих по восемь возможных вариантов.

-Т-

ТАУТОФОН(Tautophone) — проективная методика исследования личности. Предложена Д. Шаковым и С. Розенцвейгом в 1940 г. на основе т. н. «вербального сумматора», созданного Б. Скиннером (1936) для проверки его гипотезы о развитии звуков речи.

Обследуемому сообщают о том, что он должен прослушать запись мужского голоса, однако эта запись нечеткая, неразборчивая, а поэтому нужно быть очень внимательным. Требуется разобрать, о чем «говорит» записанный на пленку голос (в действительности запись смысла не имеет, а представляет собой повторение определенных групп гласных звуков). Разработана система оценки полученных результатов, учитывающая степень сложности структуры ответов, элементы подчиненности ответа стимульному звуку, его личностные элементы и некоторые другие особенности. На этом основании делаются выводы о внушаемости, контактности, субъективности, отношении к себе и другим людям. Данные о валидно-сти и надежности Т. отсутствуют. Существуют различные модификации Т. Наиболее известной является слуховой апперцепции тест.

Сведений об использовании в СНГ не имеется.

ТЕМАТИЧЕСКОЙ АППЕРЦЕПЦИИ ТЕСТ(Thematic Apperception Test, ТАТ) — проективная методика исследования личности. Наряду с Роршаха тестом одна из старейших и наиболее распространенных в мире. Создана X. Морган и Г. Мюрреем в 1935 г. Впоследствии методика становится более известной по имени Г. Мюррея, который внес весомый вклад в ее разработку. Стимульный материал Т. а. т. — стандартный набор из 31 таблицы: 30 черно-белых картин и одна пустая таблица, на которой обследуемый может вообразить любую картину. Таблицы, применяемые в настоящее время, — это третья редакция Т. а. т. (1943). В используемых изображениях представлены относительно неопределенные ситуации, допускающие их неоднозначную интерпретацию (рис. 70). В то же время каждый из рисунков обладает особой стимулирующей силой, провоцируя, напр., агрессивные реакции или способствуя проявлению установок обследуемого в сфере семейных отношений. В ходе эксперимента предъявляются в определенной последовательности 20 картин, отбираемых из стандартного набора в зависимости от пола и возраста (есть картины для всех, для женщин, мужчин, мальчиков и девочек до 14 лет). Возможно использование сокращенных наборов специально подобранных картин. Обычно обследование проводится в два этапа, по 10 картин за один сеанс с интервалом между сеансами не более чем один день. Испытуемому предлагают придумать небольшую историю о том, что привело к ситуации, изображенной на картине, что происходит в. настоящее время, о чем думают, что чувствуют действующие лица, чем эта ситуация закончится. Рассказы обследуемого записываются дословно, с фиксацией пауз, интонации, выразительных движений, других особенностей. Обычно прибегают к стенограмме или записи на скрытый магнитофон. При групповом обследовании допускается самостоятельная запись рассказа или выбор одного из множества предлагаемых вариантов. Отмечается время с момента предъявления картины до начала рассказа и общее время, затраченное на рассказ по каждой картине.

Рис. 70. Одна из картин Тематической апперцепции теста.

Цифрами обозначена последовательность зрительного восприятия отдельных элементов картины обследуемым мужчиной и характер реакций при рассматривании: № 1, 3, 5, 7, 9, 11, 12, 14, 17, 18 — нейтральная реакция; № 2, 4, 6, 8, 10 — сужение зрачков; № 13, 15, 16 — расширение зрачков

Завершает обследование опрос, основная задача которого — получение дополнительных данных об обследуемом, а также уточнение источников тех или иных сюжетов, разбор всех обнаруженных в рассказах логических неувязок, оговорок, ошибок восприятия и т. д. Анализ рассказов, записанных при использовании Т. а. т., строится следующим образом:

1) нахождение «героя», с которым обследуемый идентифицирует себя. Разработан ряд критериев, облегчающих поиск «героя» (напр., подробное описание мыслей и чувств какого-либо из персонажей; совпадение с ним по полу и возрасту, социальному статусу; употребление прямой речи и др.);

2) определение важнейших характеристик «героя» — его чувств, желаний, стремлений, или, по терминологии Г. Мюррея, «потребностей» (см. табл. 25). Также выявляются «давления» среды, т. е. силы, воздействующие на «героя» извне. Как «потребности», так и «давления» среды оцениваются по пятибалльной шкале в зависимости от интенсивности, длительности, частоты и значения их в сюжете рассказа. Сумма оценок по каждой переменной сравнивается со стандартной для определенной группы обследуемых;

3) сравнительная оценка сил, исходящих от «героя», и сил, исходящих из среды. Сочетание этих переменных образует «тему» (отсюда — Тематической апперцепции тест), или динамическую структуру взаимодействия личности и среды. По Г. Мюррею, содержание «тем» составляет: а) то, что обследуемый реально совершает; б) то, к чему он стремится; в) то, что им не осознается, проявляясь в фантазиях; г) то, что он испытывает в настоящий момент; и, наконец, д) то, каким ему представляется будущее. В итоге исследователь получает сведения об основных стремлениях, потребностях обследуемого, воздействиях, оказываемых на него, конфликтах, возникающих во взаимодействии с другими людьми, и способах их разрешения, другую информацию.

Таблица 25

Наши рекомендации

Система оценивания (нормы перевода тестовых баллов в традиционную шкалу оценок).

Перевод первичных оценок в стандартные

Перевод баллов в пятибалльную шкалу оценок представлен в таблице.

Перевод первичных «сырых» оценок в стандартные баллы (стены)

Перевод первичных оценок в стандартные

Кодирование тестовых оценок. Шкальные оценки

Система оценивания (нормы перевода тестовых баллов в традиционную шкалу оценок).

Перевод “сырых” баллов в стандартные оценки

Критерии перевода баллов в стандартные оценки

Перевод первичных оценок в стандартные

← Предыдущая страница | Следующая страница →