Глава xiv спортивная психодиагностика
Спортивная психодиагностика — раздел психологии спорта, основной задачей которого являются измерение и контроль психических особенностей спортсменов, ориентированные на решение текущих прикладных задач. Практическое использование психодиагностики позволяет сократить время и затраты на спортивную подготовку, повысить ее эффективность, снизить бесконтрольный
отсев спортсменов, поднять уровень и стабильность спортивны! результатов.
Для правильного понимания задач, стоящих перед спортивной' психодиагностикой, следует рассмотреть три основных вопроса]! теорию психодиагностических измерений, методы психодиагностиа ческих измерений и принципы использования результатов психоЛ диагностических измерений для решения задач спортивного отбоД ра.
XIV.1. ТЕОРИЯ ПСИХОДИАГНОСТИЧЕСКИХ ИЗМЕРЕНИИ
В процессе решения задач спортивной психодиагностики цент-1 ральное место принадлежит тестированию — специфическому метоЛ ду измерения индивидуально-психологических различий.
Метод тестов с самого начала своего возникновения (в конце^ XIX столетия) мыслился как разновидность экспериментальной! подхода к характеристике психических процессов и особенностей! личности на языке объективных измерений. (Это, однако, не исключает возможности использовать его и для качественного опи! сания изучаемых психических явлений.) Эксперимент в этом слу] чае носит испытательный и измерительный характер, т. е. напра-1 влен на выяснение не только наличия, но и уровня того или ино! го психического свойства. Разработка и использование тесто^И практике обследования и освидетельствования спортсменов свя! заны с предварительным определением степени соответствия теся тов следующим требованиям психологической теории измерения (психометрии): 1) надежности, 2) валидности, 3) стандартиза! ции, 4) практичности, 5) прогностической ценности. Только в этом случае могут быть получены адекватные количественные оценки, отражающие психические особенности спортсменов.
XIV.1.1. Надежность
При изучении вопросов разработки и использования тестов] важную роль играет анализ ошибок измерения. Результаты псш ход и агностических измерений всегда содержат ошибки, которые! могут быть существенными или ничтожно малыми. Ни одна психо! логическая методика не может быть правильно использована бея тщательного изучения этого важного аспекта измерения. Если ошибки измерения игнорируются или оцениваются небрежно, та это может привести не только к бессмысленным затратам временш и труда, но (что особенно важно, когда измерения касаются отбо| ра) и к педагогическим или административным ошибкам.
В процессе психодиагностики, как при любом измерении, воз-] никают три основных класса ошибок: промахи, систематический ошибки и случайные ошибки.
Промахи — следствие грубых нарушений процедуры изме-1 рения. У опытных экспериментаторов промахи встречаются дои вольно редко. Они могут быть легко выявлены и устранены пу! тем отбрасывания резко отклоняющихся значений.
Систематические ошибки остаются постоянными или закономерно меняются от измерения к измерению. В силу этих своих особенностей они могут быть предсказаны заранее, а в некоторых случаях и устранены. К этой группе относятся ошибки, возникающие в связи с использованием различных методов сбора данных. Каждый метод сбора психологических данных о спортсмене обладает своими специфическими инструментальными искажениями.
Случайные ошибки имеют место, когда при последовательных измерениях постоянной характеристики получаются различные числовые оценки, т. е. когда измеряемая характеристика не изменяется во времени, а все отклонения обусловлены неточностью измерения.
Деление ошибок измерения на систематические и случайные является довольно содержательным для анализа процедуры психодиагностики. Оно позволяет представить результаты измерения в виде суммы двух компонентов: истинной оценки и ошибок измерения:
Л( = Лоо~|-|Д,
где Xi — результат психологического измерения; Хто — истинная оценка; Д — ошибка измерения.
Предполагается, что истинная оценка и ошибка измерения находятся на той же шкале, что и результат измерения. Существуют различные способы получения истинной оценки. В одном случае утверждается, что X» — оценка, полученная испытуемым в идеальных условиях или благодаря идеальным психодиагностическим методикам, в другом —что Х» есть оценка, полученная в результате усреднения большого числа независимых измерений. Ошибка — это приращение (положительное или отрицательное), являющееся функцией случая измерения отдельного спортсмена.
Из математической статистики известно, что дисперсия суммы вевзвешенных величин равна сумме дисперсий:
Величина R2 называется коэффициентом надежности (иногда просто надежностью). По своему аналитическому выражению коэффициент надежности является квадратом коэффициента корреляции (т. е. коэффициентом детерминации) результатов измерения с истинными результатами. Его квадратный корень, т. е. коэффициент корреляции R> называется индексом надежности.
Из последнего выражения видно, что под надежностью теста Понимается степень сходства истинной оценки с наблюдаемым при Измерении результатом.
В практике используются три основных метода оценки надея_ ности измерений: 1) повторное измерение, 2) параллельное измЛ рение и 3) расщепление.
Повторное измерение. Уже говорилось, что ошибка измерении может быть определена путем многократного тестирования. ПоЗ этому совершенно естественно, что повторное тестирование выбор! ки испытуемых одним и тем же методом через определенный ин! тервал времени и при одинаковых условиях стало одним из ос! повных способов измерения надежности. Повторное тестирования обычно называют ретестом, а надежность, измеренную такщЗ способом, ретестовой надежностью.
В этом случае за индекс надежности принимается коэффициент корреляции между результатами двух тестирований. МетоД повторного тестирования обладает как достоинством, так и недр! статками. К числу достоинств относится естественность и простота определения коэффициента надежности, к недостаткам — неопрД деленность в выборе интервала между двумя измерениями, кото! рая связана с тем, что повторное тестирование отличается от пер^-вичного. Испытуемые уже знакомы с содержанием тестов, помням свои первоначальные ответы и ориентируются на них при повтор! ном выполнении теста. Поэтому при повторном тестировании не! редко наблюдаются или «подгонка» результатов под первоначаль! ные, или как следствие негативизма демонстрация «новых» реи зультатов.
В итоге оказывается, что, проводя повторное измерение для оценки одних источников ошибок, вызывают к жизни другие. ЭИ специфическая психометрическая проблема—-человек, являясь не только объектом, но и субъектом измерения, активно влияет на результат тестирования.
При использовании метода повторного тестирования получают оценку степени устойчивости тестовых результатов во времени, в зависимости от условий тестирования и установок испытуемого! Поэтому ретестовый коэффициент надежности называют такжя коэффициентом устойчивости или стабиль но сЯ теста. Для хорошего теста он не должен быть ниже 0,7.
Параллельное измерение. В этом случае повторное измерение) с помощью параллельных, или эквивалентных, тестов. Параллель! рыми (эквивалентными) называются тесты, которые измеряю1! одно и то же свойство психики с одинаковой ошибкой, т. е. оценки зависят только от степени выраженности исследуемого свойств» психики у спортсмена, а не от формы параллельного теста.
Рассчитанный между двумя тестами коэффициент корреляции! называется эквивалентной надежностью.
Высокие значения коэффициента корреляции между параЛ-1 лельными тестами указывают не только на надежность этих двузл тестов, но и на эквивалентность их психологического содержания! Поэтому когда эквивалентная надежность низкая, то это можея быть связано либо с неэквивалентностью психологического содер-f жания тестов, либо с низкой надежностью, либо с тем и другим| вместе. Чтобы исключить некоторые альтернативы, следует полу-!
чцть оценки ретестовой надежности для параллельных тестов. При нцзкой ретестовой надежности низкую эквивалентную надежность логично считать следствием ненадежности тестов; когда ретесто-Еая надежность высокая, приходится признать, что параллельные формы не эквивалентны по психологическому содержанию. Сомне-ДЙЯ в эквивалентности психологического содержания тестов не снимаются никакими статистическими расчетами. Эквивалентность подтверждается психологическим анализом, экспертными суждениями специалистов и только в дополнение к этому — статистическими критериями. Создание параллельных форм тестов связано с преодолением ряда трудностей. В мировой практике известно довольно мало тестов, имеющих параллельные формы.
Расщепление. Этот метод является развитием метода параллельного тестирования. Он основан на допущении о параллельности не только отдельных форм теста, но и отдельных заданий внутри одного теста. Для вычисления коэффициента надежности методом расщепления тест разбивается на отдельные задания или группы заданий. Наиболее распространена процедура расщепления теста на две части: в одну собираются результаты четных заданий, в другую —' нечетных.
Разделить тест на две равные части можно разными способами, и каждый даст новую численную оценку надежности. Для преодоления этого недостатка разрабатываются методы вычисления коэффициентов надежности, которые исходят из предположения деления теста на большее число частей, равное в пределе числу заданий. Однако пока еще нет исчерпывающего теоретического обоснования этой проблемы. На практике большинство опираются на тот факт, что матрица корреляций надежного теста состоит из коэффициентов, величина которых близка к единице. Поэтому коэффициент надежности, полученный методом расщепления, называют коэффициентом внутренней согласованности, или гомогенности, теста. Гомогенность теста свидетельствует о том, что все задания его устойчиво измеряют одну и ту же психологическую характеристику. Это означает, что если испытуемые имеют одинаковые тестовые оценки, то и степень выраженности у них измеряемого качества одинакова. Таким образом, гомогенность теста —обязательное условие Для однозначной содержательной трактовки результатов измерения: в случае негомогенного теста одни и те же оценки у разных испытуемых допускают различное объяснение.
Каждый из рассмотренных эмпирических способов оценки надежности тестов (повторное тестирование параллельной формой теста и расщепление теста) дает самостоятельную оценку надеж-ности, и поэтому на практике одновременно вычисляются все три °Денки надежности. Совместно они формируют комплексную характеристику надежности теста.
XIV.1.2. Вапидность
Валидность теста показывает, в какой мере он измеряет то Псйхическое качество (свойство, способность, характеристику и
т. п.), для оценки которого предназначен. Инвалидные, т. е. не об! ладающие валидностью, тесты непригодны для практического ися пользования.
Валидность и надежность — связанные понятия. Их соотноше-' иие аналогично соотношению центральности и кучности в пулевой! стрельбе. При этом валидность соответствует центральности, а наЯ дежность — кучности. Из приведенной аналогии становится оче-1 видным, что валидкость теста не может быть выше его надежно-! сти, а надежность — ниже валидности. Надежность является верх-J ней границей валидности, т. е. необходимым условием валидности! измерения.
В современной психодиагностике выделяют три основных видал валидности: содержательную (логическую), эмпирическую и коня цептуальную.
Содержательная валидность. Ее часто называют логической ] валидностью или валидностью по определению. Она означает,! что тест является валидным по отношению к мнению специалистов.] Содержательную валидность следует отличать от очевидном валидности — валидности с точки зрения испытуемых, которая! означает то впечатление о предмете измерения, которое формирую ется у испытуемого при знакомстве с инструкцией и материалом] теста. Очевидная валидность играет важную роль в процес-1 се тестирования, поскольку именно она в первую очередь опреде-J ляет отношение испытуемого к обследованию. Например, спорт-1 смены нередко отказываются от выполнения общепсихологических! тестов, мотивируя это тем, что в них ничего не спрашивается о спорте. Специальные тесты в которых используется спортивная! терминология, кажутся «своими» и вызывают больше доверия! Именно поэтому очевидную валидность иногда называют довери-1 тельной.
Очевидная валидность может находиться в разных отношениях с содержательной валидностью. В одних случаях они совпада-1 ют, в других—очевидная валидность используется для маскиров-1 ки содержательной валидности. С этой целью содержанию зада-1 ний и инструкции придается специальная форма, маскирующая! истинную цель исследования, и тем самым предупреждается уста-1 неточное поведение при тестировании.
В отличие от очевидной содержательная валидность всегда связана с оценкой отношения содержания тестового материала к истинной, а не мнимой цели измерения. Для определения содержав тельной валидности используются экспертные методы. Как во! всякой экспертизе, при этом необходимо решить следующие во-1 просы: отобрать компетентных экспертов, сформировать эксперт-! ную группу, организовать процедуру экспертизы и т. п. Специфич^ ным является объект экспертизы — содержание теста. Эксперты] должны оценить содержание заданий теста по их соответствию! психическому свойству, объявленному в качестве содержания ва-лидизируемого теста. С этой целью экспертам предъявляется спей иификация к тесту и список заданий. Если конкретное задание] полностью соответствует спецификации, то эксперт обозначает!
его как соответствующее содержанию теста. В противном случае он бракует задание и письменно обосновывает свою оценку. Если несколько экспертов бракуют одни и те же задания, они признаются не соответствующими спецификации к тесту. Если эксперты расходятся в оценке заданий, их анонимно знакомят с письменными объяснениями экспертов, забраковавших задания, после чего экспертиза, повторяется. Конечно, следует предусмотреть возможность контроля компетентности и добросовестности экспертов. Одним из простых способов такого контроля является введение заданий, не соответствующих спецификации к тесту.
С целью получения итоговой количественной оценки содержательной валидности теста производится агрегация экспертных оценок, обобщающая суждения отдельных экспертов по всем заданиям. В простейшем случае это может быть процент заданий, признанных группой экспертов соответствующими спецификации к тесту.
Эмпирическая валидность. Эмпирическая валидность означает, что тест может служить индикатором или предсказателем строго определенной психической особенности или формы поведения человека. Для измерения эмпирической валидности теста вычисляется коэффициент корреляции тестового результата с внешним критерием. В качестве такого критерия может выступать любой показатель, независимо и бесспорно измеряющий ту же психологическую характеристику, что и валидизируемый тест. Вопрос о выборе критерия является основным, так как от него зависит качественная и количественная оценка валидности. Условно можно выделить три группы критериев: 1) экспертные, 2) экспериментальные и 3) «жизненные».
Экспертные критерии предполагают использование экспертных оценок для независимого измерения свойств психики спортсмена.
При валидизации тестов, предназначенных для спорта, роль экспертов обычно выполняют тренеры. Однако, как показали специальные исследования, экспертные оценки тренеров имеют низкую валидность и надежность. Немногие тренеры могут выступить в качестве надежных экспертов; это связано с тем, что их оценки в значительной степени подвержены субъективным искажениям (симпатиям и антипатиям, переносу отношений с родителей на ученика, с упешности деятельности на качества личности и т. п.). Другой причиной ошибок является недостаточное понимание содержания оцениваемого качества.
Предложить тренеру оценить такую-то особенность психики спортсмена — значит поставить перед неспециалистом задачи, затруднительные даже для большинства психологов. Вначале следует объяснить тренеру содержание психического свойства, для измерения которого предназначен валидизируемый тест, ознакомить со спецификацией и составом заданий и только после этого просить выставить экспертные оценки. В связи с низкой надежностью и трудностями организации экспертиз экспертные критерии валидности используются редко, преимущественно в тех случаях,
когда невозможно или чрезвычайно трудно использовать в качестве внешнего критерия валидности обычные количественные ме-; тоды измерения.
Экспериментальные критерии распространены зна-1 чительно больше. В качестве такого критерия валидности используются результаты одновременного и независимого тестирования-испытуемых другим тестом, предположительно измеряющим то ж! свойство личности, что и валидизируемый тест. Коэффициент кор-1 реляции между результатами двух измерений называется эмпириЛ ческой взаимной валидиостью. Его величина зависит как от сте-1 пени совпадения содержания измерения, так и от надежности теС стов. Поэтому максимальные коэффициенты эмпирической взаим-2 ной валидности имеются у параллельных тестов.
Это вытекает из определения параллельных тестов как тестов! измеряющих одно и то же свойство с одинаковой ошибкой. Если бы параллельные тесты были абсолютно надежны, их взаимная валидность была бы равна единице, так .как по психологическому содержанию они идентичны. Эмпирическая валидность теста —1 это всегда валидность по отношению к конкретному критерию.-! Именно поэтому процесс конструирования теста часто сопровождается поиском подходящего критерия. Если к моменту проверки еаушдности такого экспериментального критерия не оказывается,! используются жизненные критерии — характеристики ре-1 ального поведения, которые на основе существующих психологи-1 ческих теорий предполагаются связанными с измеряемым свойст-1 вом. Например, в качестве жизненных критериев для тестов интеллекта используются показатели успешности обучения, для пси-1 хомоторных способностей — успешность, спортивной деятельности,! для психической устойчивости — поведение на соревнованиях и! т. п. Однако успешность обучения, поведения и деятельности ред-1 ко зависит только от одного-единственного свойства психики. РеЯ альное поведение человека множественно детерминировано, т. еЯ зависит не от одного, а от целого комплекса психических свойств! Поэтому использование жизненных критериев для валидизации тестов имеет смысл только в отношении многомерных тестов, изЗ меряющих одновременно несколько свойств и представляющих, по существу, многопрофильные батареи тестов. Для оценки валидности батареи тестов или многомерного теста используются методы множественного регрессионного анализа.
Регрессионный анализ предназначен для изучения влияния не-1 зависимых переменных на одну или несколько зависимых переменных. В общем случае использование регрессионного анализа измерения валидности является, по существу, построением мате^ матической модели поведения, представляющей значение жизнен-1] ного критерия в виде специальной комбинации оценок по шка-1 лам валидизируемой батареи тестов. Поэтому валидность тестШ по отношению к жизненному критерию называется также пракгиА ческой валидностью. Наиболее распространенные в спортивной практике многомерные тесты и батареи тестов обладают высокой практической валидностью.
Концептуальная валидность. Она устанавливается путем доказательства правильности теоретических концепций, положенных в основу валидизируемого теста. Обращение к концептуальной валидности необходимо в тех случаях, когда результаты тестовых измерений используются не просто для предсказания поведения, а как основа для выводов о том, в какой степени испытуемые обладают некоторой определенной психологической характеристикой. Причем эта характеристика не может быть отождествлена с какой-либо наблюдаемой особенностью поведения, а представляет собой теоретическую концепцию (например, интеллект, черты личности, мотивы, психическая устойчивость и т. п.). Концептуальная валидность имеет значение также при разработке принципиально новых тестов, для которых не определены внешние критерии валидности.
По существу, проверка концептуальной валидности теста проходит три основных этапа:
1) определение некоторой теоретической концепции, которая
(предположительно) объясняет выполнение валидизируемого тес
та;
2) выведение из теоретической концепции одной или несколь
ких гипотез, связанных с валидизируемым тестом;
3) эмпирическая проверка выдвинутых гипотез.
Если эмпирические данные подтверждают гипотезу, то тем самым подтверждается психологическая концепция, положенная в основу теста, и способность теста служить инструментом измерения концепции. Чем убедительнее эмпирическое подтверждение, тем определеннее можно говорить о валидности теста по отношению к психологической концепции. Если эмпирические данные не подтверждают выдвинутых гипотез, то ошибка могла возникнуть из-за:
а) неправильности теоретической концепции, положенной в ос
нову теста;
б) отсутствия соответствия между тестом и теоретической кон
цепцией;
в) ошибок при выдвижении гипотез, относящихся к валидизи-
руемому тесту.
В отличие от эмпирической валидности, которая обычно имеет дело с единственным внешним критерием, при оценке концептуальной валидности проверке подвергаются по возможности все гипотезы, вытекающие из теоретической концепции, лежащей в основе валидизируемого теста. Концептуальная валидность считается удовлетворительной, если почти все гипотезы подтверждаются экспериментально.