Перевод тестовых оценок в стандартные показатели и оценки шкалы Т-баллов

* М =41,7; **σ=3,12.

Если в оценке по двум тестам х1 и х2 распределены нормально, z — показатель нормальной кривой:

или

zн = z1 = z2

Используя эти равенства, можно пере­вести любое нормальное распределение в другое нормальное распределение, в том числе и единичное. Как видно из табл. 24, оценки z-шкалы могут принимать как от­рицательное (выполнение индивидом тес­та на уровне ниже среднего), так и по­ложительное значение. К недостаткам шкалы следует отнести слишком крупный масштаб единиц измерения (σ = 1). Для удобства простую z-шкалу можно транс­формировать, выбрать другие значения М1 и σ. Новые z-показатели (zi) будут оп­ределяться по формулам:

Пример подобной трансформации с выбранными значениями М = 50; σ = 1 (см. Оценки шкальные) приводится в табл. 24.

Благодаря возможности таких преоб­разований шкалы, традиционно принятые в психодиагностике и построенные на ос­нове шкалы 2-показателей, становятся со­поставимыми, и возможен переход из од­ной шкалы в другую с иными показателя­ми М и σ.

СТАНДАРТИЗИРОВАННОЕ ИНТЕР­ВЬЮ ПОВЕДЕНИЯ ТИПА А —новидность опросника личностного. Разработан сотрудниками Каунасского медицинского института в 1978 г. Направ­лен на диагностику поведения типа А.

Методика состоит из 21 вопроса оце­ночной шкалы, с помощью которой экс­периментатор оценивает поведение ис­пытуемого (учитываются следующие па­раметры: манера держать себя, походка, скорость движений, их амплитуда, поза, речь, общий стиль поведения и др.)

Примеры вопросов:

— Часто ли Вы думаете о работе по вече­рам и в выходные дни?

— Старались ли Вы быть во всем первым и лучшим, когда были моложе?

— Если Вы испытываете нетерпение и раздражение, то трудно ли Вам это скрыть?

Возможны три варианта ответов: «Да», «Нечто среднее», «Нет».

Имеются данные о достаточной конструктной валидности опросника. При сопоставлении с данными Дженкинса по­ведения обозрения коэффициент корре­ляции — 0,64. Диагностические заключения и выводы совпадают в 71,8% случаев с подтвержденным клиническим диаг­нозом.

Методика стандартизирована на вы­борке из 1450 человек. Как психодиагнос­тический инструмент требует дальней­шей проверки. В случае установления до­статочно высокой валидности прогностической, валидности текущей и дискриминативности может быть рекомендо­вана как вспомогательный инструмент для скрининга (см. Отсеивание), а также для исследований, направленных на изу­чение психологических особенностей психосоматических больных.

СТАНФОРД—БИНЕ УМСТВЕННО­ГО РАЗВИТИЯ ШКАЛА(Stanford— Binet Intelligence Scale) — тест интел­лекта. Предназначен для измерения уровня интеллектуального развития. Пер­вый вариант С.—Б. у. р. ш. был разрабо­тан Л. М. Терменом в 1916 г. и представ­лял собой модификацию Бине—Симона шкалы умственного развития. В ходе разработки в базовую методику было вве­дено большое количество изменений. По сравнению со шкалой Бине было добавле­но более трети новых заданий, ряд старых был либо переделан, либо отброшен или переадресован другим возрастным группам. Фактически уже первая редакция С.—Б. у. р. ш. представляла собой новый тест. В дальнейшем тест неоднократно ра­дикально совершенствовался, и к настоя­щему времени используется уже третья его редакция (1972).

Тесты, включенные в батарею Станфорд—Бине, группируются по возраст­ным уровням (см. Бине—Симона ум­ственного развития шкала), от уровня II (2 года) до уровня взрослого (22 года и 10 месяцев — XVI — 8 уровень). Для уровней II-V группы заданий по возраст­ным градациям составляются с разницей в полгода, что связано с быстрым психи­ческим развитием в соответствующие пе­риоды. Для возрастных уровней V-XIV тесты учитывают разницу в возрасте в 1 год. Остальные уровни обозначаются как подростковый и взрослый I, II и III уровни. Комплекс задач для каждого воз­растного уровня, за исключением подрос­ткового, состоит из 6 тестов (для подрос­ткового уровня — 8 тестов).

Батарея тестов Станфорд—Бине включает задания, направленные на ис­следование широкого диапазона способ­ностей — от простого манипулирования до абстрактного рассуждения. На ранних возрастных уровнях тесты требуют глав­ным образом зрительно-моторной коорди­нации, перцептивного различия, способ­ности понимать инструкцию (в заданиях типа складывания кубиков, нанизывания бус, подбора геометрических фигур), а также способности узнавать предметы, предъявляемые в виде игрушечных моде­лей или изображений на карточках. На высших возрастных уровнях в наиболь­шей степени представлены тесты, исполь­зующие вербальное содержание заданий. Среди них словарный тест (объяснение значения слов), аналогии, завершение предложений, определение абстрактных понятий, интерпретация пословиц. Неко­торые тесты направлены на характеристику степени плавности и беглости речи (быстрое называние не связанных между собой слов, подбор рифм, построение предложений с заданными словами).

Среди заданий батареи широко пред­ставлены тесты общей осведомленности, знания норм общественной жизни, пра­вил поведения (ответы на вопросы, интер­претация ситуаций, обнаружение несоот­ветствий в сюжетных картинках или рас­сказах). В шкалу включен ряд тестов па­мяти, пространственной ориентации (ви­зуальная репродукция фигур, лабиринты, складывание и разрезание бумажных объектов и т. д.). На более высоких возра­стных уровнях анализируется степень ус­воения некоторых навыков, приобретен­ных в школе (умение читать, знание ариф­метики).

Тесты внутри каждого возрастного уровня одинаковы по трудности и распо­ложены без учета сложности заданий. Для каждого возрастного уровня предус­мотрен запасной набор задач, применяе­мых по мере необходимости.

Четыре субтеста из каждого уровня отбираются для сокращенной шкалы, ко­торую применяют в случае использования методики в качестве краткой пробы. Вме­сте с тем корреляция результатов укороченной и полной программы обследова­ния является достаточно высокой.

Особенностью процедуры обследова­ния, вытекающей из шкального принципа подбора заданий, предложенного А. Бине, является то, что испытуемому предлага­ется неполный набор заданий методики. Предъявляются лишь те тесты, которые соответствуют интеллектуальному уров­ню обследуемого. Стандартная процедура обследования начинается с применения заданий, относящихся к более низкому уровню, чем тот, который соответствует возрасту испытуемого. Затем в зависимо­сти от успеха или неуспеха осуществляет­ся переход на более высокий или низкий уровень. «Базовый уровень» определяет­ся как максимальный возрастной уровень, все задания которого выполняются. Ис­следование продолжается с переходом на возрастающие по сравнению с базовым уровнем группы заданий до тех пор, пока нерешенными оказываются все тесты дан­ной группы. Соответствующий уровень определяется как «потолочный».

Показатель «умственного возраста» в С.—Б. у. р. ш. равен «базовому возрас­ту» с прибавлением к нему добавочных месяцев за правильно решенные задания из уровней, находящихся выше. Для уров­ней II-V с полугодовыми интервалами каждый из шести решенных тестов засчи­тывается за 1 месяц. Для уровней VI-XIV за каждое решенное задание дополни­тельно даются 2 месяца. На каждый из взрослых уровней приходится более года «умственного возраста», поэтому число дополнительных месяцев здесь определя­ется пропорционально временному интер­валу и числу тестов.

Процедура обследования с помощью С.—Б. у. р. ш. занимает примерно 30-40 мин для детей младшего возраста. Для более старших возрастных групп длитель­ность обследования не более 1,5 ч. Ма­териалы, необходимые для проведения теста, включают набор игрушек для об­следования детей младшего возраста, те­стовые тетради с заданиями, протоколы, руководство по проведению обследования и обработке результатов.

При обследовании с помощью ряда те­стов методика допускает возможность получения широкой качественной инфор­мации о методах работы испытуемого, способах решения им задач. Большие возможности предоставляются и наблюде­нию за личностными качествами: уровнем активности и мотивированности, уверен­ности, настойчивости и т. д.

Сложная процедура проведения обсле­дования и интерпретации полученных результатов, необходимость строгого со­блюдения стандартов требуют высокой квалификации и предварительной трени­ровки экспериментатора.

Первый вариант С.—Б. у. р. ш. (1916) и вторая редакция шкалы (Л. М. Термен, М. А. Мерилл, 1937) отличались репре­зентативным нормированием. Редакция 1937 г. включала две параллельные фор­мы теста (L и М) и была предназначена для обследования испытуемых в возрасте от 1,5 до 18 лет.

В первых редакциях основным измеря­емым показателем являлся относитель­ный IQ-показатель (см. Интеллекта ко­эффициент). В третьей редакции (1960) вводятся оценки IQ-показателя стан­дартного. В этой же редакции парал­лельные формы преобразованы в единую (L-M).

Наиболее распространенная к насто­ящему времени редакция формы L—M шкалы Станфорд—Бине (1972) включает тестовые задания, аналогичные по содер­жанию включенным в вариант шкалы 1937 г., однако нормы теста здесь были подвергнуты рестандартизации. Выборка стандартизации включала примерно по 100 детей для каждой возрастной группы в интервале от 2 до 5,5 года (временной шаг выборок — 0,5 года) и в возрастных группах от 6 до 18 лет (через 1 год). Пос­ледняя редакция теста содержит таблицы стандартного IQ-показателя для умствен­ного (МА) и фактического (СА) возраста, соответствующие годам и месяцам возра­ста испытуемого, включает нормативные таблицы показателя МА по данным вари­анта L—M (1937).

По применению шкал Станфорд— Бине накоплен огромный опыт, включаю­щий фактические данные и их интерпре­тацию. По широте использования эта ме­тодика занимает в зарубежной психоди­агностике одно из ведущих мест среди тестов интеллекта. Для большинства специалистов в области психологичес­кой диагностики и потребителей психо­диагностической информации IQ-коэффициент, определяемый с помощью шка­лы Станфорда—Бине, связывается с кон­кретным выражением понятия «интел­лект». Длительность использования и ши­рота распространения сделали систему отсчета оценок шкальных С.—Б. у. р. ш. стандартом для других психометричес­ких тестов (см. IQ-показатель стандартный).

Распределение результатов IQ-показателей шкал Станфорд—Бине положено в основу классификации степеней умствен­ной отсталости, широко распространен­ной в западной психодиагностике (Классификация Американской Ассоциации по изучению умственной неполноценнос­ти — AAMD).

В ходе многолетнего накопления дан­ных получены разнообразные сведения о характеристиках С.—Б. у. р. ш. Ее на­дежность (по параллельным формам те­ста) с интервалом ретеста до недели со­ставляет для возрастных групп от 2,5 до 5,5 года 0,83 для интервала IQ-показателей 140-149 и 0,91 —для IQ-показате-лей 60-69. В возрастных группах 6-13 лет для соответствующих величин IQ-noказателей коэффициенты надежности со­ставляют соответственно 0,91 и 0,97, а для возраста 14-18 лет — 0,95 и 0,98. Та­ким образом, тест более надежен для лиц старшего возраста с относительно низки­ми IQ-показателями. Однако очевидно, что и в прочих случаях надежность шка­лы достаточно высока.

Валидность критериальная шкалы Станфорд—Бине (текущая и прогности­ческая) характеризовалась на основе со­поставления с показателями школьной успеваемости (сравнение с экспертными оценками учителей и данными тестов достижений). Коэффициент валидности по связи с этими критериями составляет 0,40-0,75. Особенно значимой является связь IQ-оценок с показателями (конста­тирующего характера и прогностически­ми) успешности обучения предметам с преобладанием словесного материала. Ре­зультаты критериальной валидизации по­казывают, что тест Станфорд—Бине в ос­новном направлен на измерение уровня школьных способностей.

Данные валидности конструктной С.—Б. у. р. ш. опираются на анализ этой группы характеристик методом диффе­ренциации по возрастному критерию, под­тверждающий прогрессивную вариабель­ность измеряемых показателей с возрас­том.

Однородность заданий шкалы (см. Внутренняя согласованность) для ба­тарейного теста является достаточно вы­сокой (около 0,66). Факторный анализ указывает на связь результатов выполне­ния тестов шкалы с фактором G.

В целом анализ валидности содержа­тельной и конструктного содержания те­ста указывает на доминирующую направ­ленность С.—Б. у. р. ш. на тестирование комплекса вербальных способностей, не­которую перегруженность содержания тестов вербальным материалом. Эта осо­бенность затрудняет адаптацию теста для других языковых и социокультурных групп.

Сведений об использовании в СНГ не имеется.

СТЕПЕНЬ СВОБОДЫ —характерис­тика распределения, используемая при проверке статистических гипотез. Обо­значается символами df или п'. В вариа­ционной статистике понятие С. с. отра­жает степень произвольности вариантов заполнения определенных групп, на кото­рые квантифицируется распределение. Предположим, строится распределение IQ-оценок в определенной группе лиц (рис. 69).

Рис. 69. Вариант заполнения интервалов оценок в выборке из 100 обследованных

Известно, что IQ-оценки в данной группе варьируют от -2 до +2 . Тогда групп (интервалов шкалы) (k), если счи­тать пределом интервала σ, будет четы­ре. Число испытуемых в группе состав­ляет 100 человек. Если в первых трех ин­тервалах шкалы число испытуемых, по­лучивших соответствующие оценки, мо­жет быть произвольным, то в последнем интервале их число может составить лишь разницу между суммарным числом испытуемых в трех интервалах и общим числом обследованных. Другими слова­ми, при заполнении четвертого интерва­ла произвольность ограничена. С. с. дан­ного распределения будет равна трем (df = k-1).

При представлении переменных в виде таблицы размером t x k, dk = (t – 1)(k - 1), где t — количество интервалов пер­вого признака (количество строк табли­цы), k — количество интервалов второго признака (столбцов таблицы).

В общем случае при малой выборке (п < 50) df = n-1 для распределения од­ного признака и df = п - 2 для распреде­ления двух признаков (n — число наблю­дений).

Показатель С. с. наиболее широко ис­пользуется при расчете статистических гипотез с использованием критериев Стьюдента, Фишера, z-критерия, крите­рия χ2. При применении каждого критерия и в каждом конкретном случае его исполь­зования существуют свои правила опреде­ления количества степеней свободы.

СТИМУЛЬНО-ИНСТРУКТИВНАЯ СИТУАЦИЯ ТЕСТА— комплексная ха­рактеристика теста, отражающая особен­ности инструкции, характер и тип теста стимульного материала и особенности оценки полученного результата.

Понятие С.-и. с. т. введено Р. Кэттеллом и Е. Варбуртоном (1967) и лежит в основе предложенной ими таксономии психодиагностических методик. Выделя­ют тринадцать параметров, характеризу­ющих типы С.-и. с. т. и соответственно варианты конструкции тестов.

1. Ориентированность теста на фикса­цию наличия или отсутствия реакции на стимул (напр., тесты чувствительности к боли, тесты на время реакции и т. д.).

2. Наличие ограничений или неогра­ниченное разнообразие ответов,способов реагирования (напр., ср. опросники с ди­хотомическим выбором ответа и Роршаха тест).

3. Наличие вариантов выбора решения или свободно продуцируемый ответ (см. Задачи открытого типа; Задачи за­крытого типа). Примером свободных от­ветов являются те, которые дает обсле­дуемый в тематической апперцепции тесте.

4. Наличие в тесте единичных или по­вторяющихся ответов (см., напр., Тесты скорости).

5. Упорядоченная или неупорядочен­ная последовательность ответов (напр., от испытуемого может требоваться выполне­ние теста в строгой последовательности от первого до последнего задания, и, напро­тив, может допускаться свободный выбор последовательности решаемых задач).

6. Однородность или разнородность ответов (некоторые тесты состоят из за­даний единого типа, в других, напр, в те­стовых батареях, задания могут отли­чаться по своему характеру).

7. Свободное или ограниченное время решения.

8. Завершенность (окончательность) реакции или реагирование на реакцию. Испытуемый либо непосредственно реа­гирует на материал теста, либо на свою собственную реакцию, например, тот или иной стимул как-либо оценивается, вызы­вает ассоциации или воспоминания (см., напр., Пиктограмма).

9. Наличие явного или неявного смысла заданий. Некоторые тесты не име­ют никакого вне их лежащего значения (напр., измерение времени реакции). В то же время там, где интересуются мнением о чем-либо, такое значение всегда присут­ствует.

10. Представление теста в виде от­дельных заданий или целостное представ­ление. Речь идет о различиях между тес­тами, состоящими из дискретных задач или же из единственного задания.

11. Психологическая сущность дей­ствия, необходимого для выполнения тес­та. Этот параметр учитывает, требуется ли для ответа: а) знание (напр., верное суждение); б) мнение; в) опознание или распознание.

12. Различия в субъективной прием­лемости в ситуации тестирования.

13. Различия в свободе выхода из си­туации тестирования.

Приведенные таксономические пара­метры теоретически обусловливают су­ществование 213 типов С.-и. с. т. Допол­нительно к параметрам, описывающим характеристики стимулов и инструкции, выделяют шесть характеристик оценива­ния результатов теста:

1. Объективность—субъективность оценивания.

2. Оценка целостного поведения или отдельных реакций.

3. Регистрация одного правильного (или возможного) ответа либо классифи­кация разнообразных ответов (парамет­рическое или непараметрическое оцени­вание). Параметрически раскрывается время, количество ошибок, повторений и т. д. Непараметрически оценивается ко­личество и разнообразие классов отве­тов. Непараметрическое оценивание свойственно многим тестам креатив­ности.

4. Анализ всей совокупности ответов или их части, соответствующей некоторо­му критерию (напр., опросники личност­ные).

5. Наличие единого однородного пока­зателя или различных относительных по­казателей. Единый показатель возможен при оценке теста в целом, как, напр., в случае личностных опросников. Разнотипные относительные показатели могут определяться в форме: различия во времени выполнения первой и второй частей теста (см. Корректурная проба): запо­минания материала в обычных условиях и при действии отвлекающих факторов и т.д.

6. Нормативное оценивание или ипсативное оценивание.

С учетом общего количества прине денных параметров теоретическое число возможных вариантов С.-и. с. т. составля­ет (213 х 26) типов. Согласно Р. Кэттеллу и Е. Варбуртону, для использования в практике конструирования тестов особое значение имеют 64 варианта, полученные из трех наиболее важных ситуаций и па­раметров оценивания, генерирующих по восемь возможных вариантов.

-Т-

ТАУТОФОН(Tautophone) — проектив­ная методика исследования личности. Предложена Д. Шаковым и С. Розенцвейгом в 1940 г. на основе т. н. «вербального сумматора», созданного Б. Скиннером (1936) для проверки его гипотезы о разви­тии звуков речи.

Обследуемому сообщают о том, что он должен прослушать запись мужского го­лоса, однако эта запись нечеткая, нераз­борчивая, а поэтому нужно быть очень внимательным. Требуется разобрать, о чем «говорит» записанный на пленку го­лос (в действительности запись смысла не имеет, а представляет собой повторение определенных групп гласных звуков). Разработана система оценки полученных результатов, учитывающая степень слож­ности структуры ответов, элементы под­чиненности ответа стимульному звуку, его личностные элементы и некоторые другие особенности. На этом основании делаются выводы о внушаемости, контак­тности, субъективности, отношении к себе и другим людям. Данные о валидно-сти и надежности Т. отсутствуют. Су­ществуют различные модификации Т. Наиболее известной является слуховой апперцепции тест.

Сведений об использовании в СНГ не имеется.

ТЕМАТИЧЕСКОЙ АППЕРЦЕПЦИИ ТЕСТ(Thematic Apperception Test, ТАТ) — проективная методика иссле­дования личности. Наряду с Роршаха те­стом одна из старейших и наиболее распространенных в мире. Создана X. Мор­ган и Г. Мюрреем в 1935 г. Впоследствии методика становится более известной по имени Г. Мюррея, который внес весомый вклад в ее разработку. Стимульный материал Т. а. т. — стандартный набор из 31 таблицы: 30 черно-белых картин и одна пустая таблица, на которой обследуемый может вообразить любую картину. Табли­цы, применяемые в настоящее время, — это третья редакция Т. а. т. (1943). В ис­пользуемых изображениях представлены относительно неопределенные ситуации, допускающие их неоднозначную интер­претацию (рис. 70). В то же время каж­дый из рисунков обладает особой стиму­лирующей силой, провоцируя, напр., агрессивные реакции или способствуя про­явлению установок обследуемого в сфере семейных отношений. В ходе эксперимен­та предъявляются в определенной после­довательности 20 картин, отбираемых из стандартного набора в зависимости от пола и возраста (есть картины для всех, для женщин, мужчин, мальчиков и дево­чек до 14 лет). Возможно использование сокращенных наборов специально подо­бранных картин. Обычно обследование проводится в два этапа, по 10 картин за один сеанс с интервалом между сеансами не более чем один день. Испытуемому предлагают придумать небольшую исто­рию о том, что привело к ситуации, изоб­раженной на картине, что происходит в. настоящее время, о чем думают, что чув­ствуют действующие лица, чем эта ситуа­ция закончится. Рассказы обследуемого записываются дословно, с фиксацией пауз, интонации, выразительных движений, других особенностей. Обычно прибе­гают к стенограмме или записи на скры­тый магнитофон. При групповом обследо­вании допускается самостоятельная за­пись рассказа или выбор одного из множе­ства предлагаемых вариантов. Отмечает­ся время с момента предъявления карти­ны до начала рассказа и общее время, зат­раченное на рассказ по каждой картине.

Рис. 70. Одна из картин Тематической апперцепции теста.

Цифрами обозначена последовательность зрительного восприятия отдельных элементов картины обследуе­мым мужчиной и характер реакций при рассматривании: № 1, 3, 5, 7, 9, 11, 12, 14, 17, 18 — нейтральная реакция; № 2, 4, 6, 8, 10 — сужение зрачков; № 13, 15, 16 — расширение зрачков

Завершает обследование опрос, основная задача которого — получение дополни­тельных данных об обследуемом, а также уточнение источников тех или иных сю­жетов, разбор всех обнаруженных в рассказах логических неувязок, оговорок, ошибок восприятия и т. д. Анализ рас­сказов, записанных при использовании Т. а. т., строится следующим образом:

1) нахождение «героя», с которым об­следуемый идентифицирует себя. Разра­ботан ряд критериев, облегчающих поиск «героя» (напр., подробное описание мыс­лей и чувств какого-либо из персонажей; совпадение с ним по полу и возрасту, со­циальному статусу; употребление прямой речи и др.);

2) определение важнейших характе­ристик «героя» — его чувств, желаний, стремлений, или, по терминологии Г. Мюррея, «потребностей» (см. табл. 25). Также выявляются «давления» среды, т. е. силы, воздействующие на «героя» извне. Как «потребности», так и «давления» сре­ды оцениваются по пятибалльной шкале в зависимости от интенсивности, длитель­ности, частоты и значения их в сюжете рассказа. Сумма оценок по каждой пере­менной сравнивается со стандартной для определенной группы обследуемых;

3) сравнительная оценка сил, исходя­щих от «героя», и сил, исходящих из сре­ды. Сочетание этих переменных образует «тему» (отсюда — Тематической аппер­цепции тест), или динамическую структуру взаимодействия личности и среды. По Г. Мюррею, содержание «тем» составля­ет: а) то, что обследуемый реально совер­шает; б) то, к чему он стремится; в) то, что им не осознается, проявляясь в фантази­ях; г) то, что он испытывает в настоящий момент; и, наконец, д) то, каким ему пред­ставляется будущее. В итоге исследова­тель получает сведения об основных стремлениях, потребностях обследуемо­го, воздействиях, оказываемых на него, конфликтах, возникающих во взаимодей­ствии с другими людьми, и способах их разрешения, другую информацию.

Таблица 25

Наши рекомендации