Почему статистический прогноз вызывает сопротивление? 5 страница
Подведем итоги. Очевидно, что различные концепции валидности (в эпистемологическом понимании) являются значимыми для психодиагностики. В психодиагностике и в психологии не существует одного, превалирующего типа валидности. Хотя логический позитивизм оказал большое
* «herrschaftfreie» диалог (нем.) — диалог, «свободный от господства од
ной из сторон» (прим. перев.). • ^
влияние на используемые критерии, валидность — это не просто понятие, заимствованное из эпистемологии. Более того, можно выделить различные уровни психологической теории (Snow, 1973). Это означает, что «Protocollsatze», в качестве аксиомы предпочитаемое логическими позитивистами, не является единственным уровнем теории. Существуют также таксономические теории и, наконец, простые рабочие гипотезы.
3.2.3. Как возникает представление о валидности?
Приобретение валидных знаний можно изучать как феномен развития. Специалист в области педагогической психологии Перри (1970) изучал то, каким образом у студентов Гарвардского университета в процессе образования изменяются представления об истине, валидности и ценностях. С помощью повторных интервью он провел исследование на 140 студентах. В полученных материалах он выделяет 9 позиций, которые можно объединить в три категории.
1) Первая категория характеризуется пассивным приобретением знаний и восприятием преподавателя как несомненного авторитета с точки зрения знаний.
2) Вторая категория ответов показывает понимание студентами того, что любое знание зависит от контекста и является относительным. Соответственно, и точка зрения преподавателя рассматривается как одна, произвольно выбранная, из множества возможных.
3) Третья категория ответов студентов показывает, что они формируют свое собственное видение мира и ощушают необходимость действовать на основе собственных знаний и практически использовать их в конкретных ситуациях.
Перри (1970) показал, что представления об истине и валидности изменялись в процессе обучения в университете.
Китченер и Кинг (1981) заинтересовались тем, как мо-лодыелюдив возрасте 15 лет и старше представляют реальность, как они понимают источники знаний о реальности и что они думают о природе знаний. Полученные результаты авторы разбили на 7 уровней — «шагов», последовательность которых можно рассматривать как отражение этапов развития. Первый «шаг» выявил представление о том, что знания находятся где-то «вовне» («out there»), чтоонисиль-
!00
но зависимы от мнении экспертов или авторитетов и что мнение в общем не нуждается в доказательстве, хотя наше собственное мнение и должно быть сходно с мнением экспертов. Пятый шаг отражает понимание того, что реальность существует в определенной степени в уме наблюдателя, что знания в некоторой степени субъективны, что приобретение знаний требует со стороны человека усилий и что истинное знание требует соблюдения методологических правил. Заключительный, седьмой, этап содержит идею о том, что существует объективный, но с трудом поддающийся пониманию мир. Однако его познание возможно путем проверки идей и гипотез. Полученные знания субъективны и нуждаются в обсуждении с экспертами и исследователями. Знание на этом этапе представляется как постепенное приближение к реальности с помощью более или менее вероятных теорий, идей и гипотез. Может быть достигнуто достаточно близкое приближение к реальности. Любое полученное знание должно быть подтверждено на основе использования методологических правил и критериев валидности. Нет критериев на все случаи жизни. Существуют ситуации, когда возмох<но их изменение. Оцениваются объективность знаний и их интерсубъектный характер.
В ходе этого исследования было также показано, как у людей начиная с 15 лет и старше изменяются представления о валидности и валидном знании. Последний шаг содержит в большей или меньшей степени эпистемологическую концепцию социальных наук и более частную сферу — психологию как науку о человеческом поведении.
Кроме того, исследование представлений детей о правде и лжи показало, что дети от 5 лет и старше полагаются на «факты», то есть для них наиболее важной является связь между утверждениями и реальными событиями (Strichartz & Burton, 1990). В представлениях об истине детей от 5 до 8 лет важным является соответствие между утверждениями и реальными событиями, и на это представление не влияет замечание о том, что кто-то верит или не верит этой информации (Bussey, 1992). Начальная форма представлений об истине опирается на простую корреспонденцию, и лишь впоследствии появляются такие критерии, как консенсус,
полезность и когерентность (Van Houdt, 1994). Например, Адальбжарнадоттир (1992) изучал, каким образом и когда дети постигают принципы коммуникативного консенсуса, описанные Хабермасом (1984).
Подведем некоторые итоги. Представление о знании в ходе развития ребенка проходит путь от наивного реализма к постижению реальности с помощью теорий, идей и гипотез. В процессе развития постепенно приходит понимание необходимости проверки и подтверждения знаний, все возрастающее значение должны приобретать методологические правила. Этот процесс познания начинается с апелляции к авторитетам, но постепенно все большее значение приобретают общепринятые, хотя вовсе не незыблемые, методологические правила.
3.2.4. Концепция валидности в психодиагностике
Для получения информации о людях и группах в психодиагностике используются тесты и другие процедуры. В главе 1 утверждалось, что такого рода изучение идет дальше оценки собственно тестируемого поведения. В диагностике обычно различают три типа валидности: прогностическую, конструктную и содержательную.
Валидность — это достаточно сложное понятие. В качестве сходных с ним понятий могут быть названы правдивость, полезность, точность, возможность интерпретации (интерпретируемость), прогностическая способность и помощь в принятии решений. Как уже подчеркивалось, разные типы валидности имеют одну и ту же основу. Однако понятие валидности должно быть четко определено применительно к различным целям, аспектам и контекстам. Такая дифференциация дает информацию о том, в каком контексте концепция валидности может быть использована.
Первая дифференциация типов валидности: прогностическая, валидность по внешнему критерию, конструк-тная и содержательная валидность. В каждом руководстве по психодиагностике можно встретить описание этих трех типов. Гийон (1980) заметил, что они стали чем-то «...вроде святой троицы». Под прогностической ва-4 лидностью понимается способность к предсказанию поведения испытуемых на основе критериев. Другое название
этого типа валидности — валидность по критерию. Критерием в большинстве случаев выступает социально-значимое поведение, например, успеваемость в школе, профессиональная деятельность или социальная адаптация. Прогностическая валидность теста оценивается по тому, насколько данный прогноз получает подтверждение в будущем или в настоящее время (соответственно прогностическая и конкурентная валидность).!]Конструктная валидность имеет отношение к теоретическому конструкту самому по себе и включает в себя поиск факторов, объясняющих поведение при выполнении теста. Как особый тип конструктная валидность канонизирована в статье Кронба-ха и Миля (1955). Авторы оценивали с помощью этого типа валидности все тестовые исследования, которые не были прямо направлены на предсказание некоторых значимых критериев. Исследование содержало информацию о психологических конструктахлСодержательная валидность требует того, чтобы каждое задание, задача или вопрос, принадлежащие к определенной области, имели равные шансы стать заданиями теста. Валидность по содержанию оценивает соответствие содержания теста (заданий, вопросов) измеряемой области поведения. Некоторые авторы характеризуют этот тип валидности как аспект надежности. Другие авторы (как, например, Lumsden, 1975, стр. 270) называют его наиболее важным типом валидности. Поскольку Лумсден считает полную конструктную валидиза-цию невозможной, он предпочитает так называемый «смягченный подход в требованию ключевых ответов» («lower keyed approach»), расширяя тем самым границы понятия содержательной валидности. Среди других возможных методов он обращается к разработке тестовых заданий в соответствии с определенными правилами. Оценка содержательной валидности в определенной степени зависит от мнений экспертов. Нередко считается, что эмпирические исследования содержательной валидности отсутствуют. Однако предложенный Кронбахом (см. Crocker & Aldgina, 1986, стр. 222) эксперимент с удвоенными конструкциями показывает, что проведение исследований содержательной валидности возможно, и такие исследования весьма полезны. Для осуществления этой идеи требуются группы независимых разработчиков тес-
тов, имеющих в своем распоряжении определения содержания заданий, правила выборки заданий из области изучаемых феноменов, правила для проверки заданий и единые критерии для интерпретации. Тесты, составленные двумя командами разработчиков, проводятся на выборке испытуемых. Надежность тестов подсчитывается путем расщепления заданий на две части, в результате чего получают индекс содержательной валидности.
Описание этих трех типов валидности встречается во всех учебниках по психодиагностике. Кроме них выделяются также и другие специфические виды валидности. Мы заимствуем их описание у Дренса (1975), Некоторые авторы (например, Guilford, 1954) приводят описание еще большего числа типов валидности.
Вторая дифференциация валидности: специфические типы. Первый специфический тип — это «внутренняя валидность». Она относится к требованию, согласно которому корреляция не должна быть тривиальной или тавтологичной. Тестируемые отношения не должны входить в определяемые понятия. Исследования не должны идти «по кругу». Это резонные замечания. Однако не так легко избежать чисто семантического уровня разработки психологических конструктов. Например, социальные конструктивисты Смедслунд и Герден упрекают психологов за то, что они занимаются проверкой не реальных гипотез, а тавтологий.
«Факторная валидность» имеет отношение к процед\ рам многомерного анализа и теории, которая преимущественно используется при конструировании тестов. Считается, что тест обладает факторной валидностью, если он имеет высокую нагруженность по известным факторам. Одним их первых этот тип валидности определил Гилфорд. Предложенная им концепция структуры интеллекта обусловила разработку «тестов одного фактора», что на самом деле является разработкой простой структуры Терстоуна. Этот тип тестов направлен на измерение только одного конкретного фактора.
«Синтетическая валидность» содержит информацию о том, могут ли данные о валидности теста быть перенесены с одной ситуации на другую. Это имеет важное значение в тех случаях, когда критерий является комплексным. Представляется ценным иметь в своем распоряжении тест, кото-
рый предсказывает элементы, связанные с различными критериями.
«Конгруэнтная валидность» обозначает корреляцию данного теста с уже существующими тестами того же типа.
«Внешнюю (очевидную) валидность» по-другому можно определить как валидность «с первого взгляда», подобно тому как мы говорим о «любви с первого взгляда». Имеется в виду, что первое впечатление о том, что оценивает тест, соответствует связанному с ним критерию. Это выглядит приемлемым. Но что произойдет, если без проведения ка-ких-бы то ни было эмпирических исследований тест будет назван валидным только на том основании, что его критерий представляется вполне очевидным? Дрене (1975) выступает против такого подхода и приводит примеры того, как тесты, казалось бы, предсказывающие критерий, на самом деле это делать не могли. Так, при отборе водителей используется водительское кресло, но испытания на нем не имеют никакой прогностической валидности. То же самое произошло и с тестом Бурдона-Виерсма при диагностике эпилепсии и использовании на вступительных экзаменах в высшую школу. «Внешняя валидность» предполагает существование прогностической валидности, которая при этом не исследуется эмпирически, а иногда фактически просто отсутствует. Но есть и обратная проблема. Предположим, что имеется тест, обладающий прогностической валидно-стью, но оцениваемый экспертами как не имеющий отношения к работе или к школьным достижениям. Естественно, что этот тест не будет допущен к использованию в качестве методики для отбора.
Понятие «инкрементной валидности» относится к требованию, согласно которому тест должен дополнять уже известную прогностическую валидность, основанную на демографических и социально-экономических данных. Этот тип валидности имеет смысл, поскольку валидные методики должны конкурировать с имеющимся базальным уровнем знаний. При этом, однако, не отбрасывается тот факт, что корреляции тестовых показателей с демографическими переменными являются информативными показателями, так как тесты могут оказаться пристрастными в отношении определенных групп.
Третья дифференциация: валидность в (квази)экспе-риментах. Вне психодиагностики в квазиэксперименте различаются четыре типа валидности. Кук и Кэмпбелл
(1976) описывают концептуальные схемы исследований, проводимых в педагогической и инженерной психологии. Назначение эксперимента — выявить причинно-следственные связи. План такого исследования содержит указания относительно того, кто, где и когда может подвергаться наблюдению. С помощью идеи Фишера об «идентичных двойниках на все случаи жизни» и случайного выбора условий для субъекта проверяются возможные гипотезы о при-чинах поведения. В отличие от этого цель квазиэкспериментального исследования состоит в выявлении воздействия той или иной переменной (например, терапии) на зависимые переменные, в то время как случайное соответствие условиям исключено. Различаются следующие виды валидности.
1. Внутренняя валидность (internal validity). Это понятие относится к тому факту, что наблюдаемые изменения зависимой переменной могут быть приписаны другой переменной как «независимой». Источниками непреднамеренных изменений являются характеристики контрольной и экспериментальной групп, например различия в развитии, отборе, в избирательном участии и выпадении из ситуации эксперимента, а также взаимодействие между этими характеристиками. Факторами, влияющими на характеристики переменных, могут стать сами методики и ситуация эксперимента, например, феномен статистического сведения к среднему, повторное тестирование, тесты, оценивающие различное поведение и события, воздействующие на одни группы и не оказывающие никакого влияния на другие.
2. Валидность статистического вывода. Для того, чтобы выявить влияние независимых переменных при проведении экспериментов, внутриклеточная вариативность матрицы распределения (различия, между субьектами) должна быть ограничена. Валидность статистического вывода возрастает при увеличении внутриклеточных различий, например, при малой (нерепрезентативной) выборке испытуемых, при разнородности их состава, при неправильном предъявлении независимых переменных или при отсутствии должного контроля за условиями работы контрольной и экспериментальной групп.
3. Внешняя валидность (external validity). Целью любого исследования является обобщение результатов. Но при взаимодействии двух независимых переменных результа-
ты могут приобретать специфический характер, так что может быть неясен эффект каждой из них. Существуют и другие примеры взаимодействия на уровне статистики — между независимой переменной и специфическим расположением субъектов, особенностями времени и ситуации. 4. Конструктная валидность. Этот тип валидности имеет отношение как к зависимой, так и к независимой переменной. Эти переменные должны быть адекватно опера-ционализированы. Здесь не должно быть эффектов «не-до...» или «пере...», то есть должно существовать соответствие между сходными и несоответствие между несходными конструктами, причем на содержание конструктов не должны оказывать влияние методы сбора данных. Прямое отношение к конструктной валидности имеют также ожидания экспериментаторов и участников эксперимента, поскольку их гипотезы и предположения могут влиять на результаты.
Таковы различия типов валидности для тестов и квазиэкспериментов (см. также Cook & Shadisn, 1994). Понятие валидности конкретизировалось и применительно к разным контекстам. В то же время существует тенденция унифицировать понятие валидности.
Интегрированная концепция валидности. Мессик (1988, 1989, 1994) указывает на общие элементы при рассмотрении концепции валидности. Он определяет валидность следующим образом: «Валидность — это обобщенное оценочное суждение о том, насколько адекватными и приемлемыми (на эмпирическом и теоретическом уровнях) являются действия и выводы, основанные на информации о тестовых показателях или результатах других способов оценивания» (Messick, 1989, стр.13). Валидность не сводится к выводам, вытекающим только из тестовых показателей. Это понятие имеет отношение и к другим методам исследования и фиксации относительно устойчивого типа поведения. Причем относительно устойчивым может быть названо поведение не только личности, но и группы, такое понятие может быть использовано и при характеристике ситуаций, объектов и социальных институтов. Это определение охватывает столь же большую область, как и определение оценивания, данное Джадером и Петерманном (1992) и приведенное в главе 1. Мессик (1988, стр. 3) выделил в качестве наиболее важных проблем ва-
лидности следующие вопросы: возможность интерпретации, релевантность, возможность практического использования тестовых показателей. Они относятся к трем наиболее известным типам валидности. Он добавляет также четвертый тип: функциональную ценность показателей с точки зрения результатов их социального использования. Автор подчеркивает, что надежность, валидность и объективность тестов — это не только методические требования. Тесты имеют также и социальное значение, поскольку они используются при оценивании людей и условий, в которых те живут. На это также указывает и Кронбах (1988). Вопрос заключается не только в том,.является ли методика валидной, но также и в том, отвечает ли она нормам и ценностям общества.
Независимо от Хабермаса (1973) два других автора подчеркивают, что валидность только тогда адекватна, когда она соответствует социальным нормам. Хабермас назвал это «Richtigkiet»*. Конкретный пример того, что последствия использования теста не соответствуют социальным нормам и ценностям, описан Кронбахом (1988). Он указал на то обстоятельство, что, во-первых, результаты тестирования влияют на способ обучения в том отношении, что учителя акцентируют внимание на изучении фактов, и, во-вторых, тесты могут оказаться «пристрастными» в отношении некоторых групп.
Мессик считает наиболее важным понятие конструктной валидности и доказывает, что прогностическая и конструктная виды валидности могут быть рассмотрены как две категории этого типа валидности. Для объяснения связи между предиктором и критерием необходимо наличие теоретической возможности такой связи, например, посредством общего конструкта.
Содержательная валидность предполагает выбор заданий из соответствующей области, которую чаще всего образуют те или иные знания, умения, способности, навыки. Так, соблюдая требования валидности, можно косвенно оценивать знания, навыки, способности.
Валидность — это понятие открытого типа, предполагающее выведение содержательных заключений путем анализа полученных показателей. Нужно ответить на следующие вопросы:
* Richtigkiet (нем.) — правильность, верность, точность (прим. перев.)
• Корректны ли задаваемые вопросы?
• Все ли важные элементы рассматриваются?
• Существуют ли способы контроля и учета побочной вариативности тестовых показателей?
• Отражает ли процедура подсчета баллов процессы, происходящие в области заданий, и согласуется ли такая процедура с этой областью?
• Имеются ли данные, подтверждающие, что тестовые показатели отражают именно то, что они должны отражать на самом деле? Например, являются ли они показателями личностной черты, которую важно у читывать при профессиональном отборе, тренинге или в ходе терапевтического процесса?
• Существуют ли альтернативные способы интерпретации для тестовых показателей или альтернативные способы обработки?
• Являются ли полученные показатели надежными и могут ли быть они обобщены по содержанию, контексту и группам?
• Учитываются ли возможные последствия использования показателей теста?
• Можно ли применять тестовые показатели в конкретных ситуациях?
• Корректно ли используется информация о тестовых показателях?
• Соответствуют ли близкие и далекие по времени последствия, применения теста его исходным целям и нет ли нежелательных побочных результатов?
Исследование валидности предполагает приписывание тестовым показателям эмпирических значений, которые не противоречат принятым нормам и ценностям. Ясно, что интерпретация тестовых показателей имеет ценностный характер. При интерпретации результатов выполнения теста как показателей развития интеллекта, когнитивной сложности и некоторых других безоговорочно принимается то положение, что «интеллектуальный» и «сложный» — это «лучше», чем «неинтеллектуальный» и «простой».
3.2.5. Пятидесятые годы: новые акценты в исследовании валидности
Первоначально психодиагностика рассматривалась всего лишь как прикладная психология. Акцент делался на предсказании релевантных критериев. В 1955 г. в статье Кронбаха и Миля проблема тестовой валидности была впервые поставлена как теоретическая. Мессик использовал со-гласованные тестовые показатели как источник теоретически и эмпирически обоснованных утверждений, характеризующих личность, ситуации, институты и даже объекты. Кроме того, в этих утверждениях учитывались также социальные ценности и нормы. Таким образом, понятие валидности в психодиагностике развивалось.
В истории развития концепции валидности можно проследить, что становилось основным предметом рассмотрения в тот или иной период и каким образом аккумулировались требования. Первый акцент был сделан на предсказании поведения. Вначале доминировал прагматический, а не теоретический интерес (Angoff, 1988). Интересовали задачи, пригодные для тех или иных профессий. Это стало отправной точкой как при разработке тестов, так и при определении критериев. Критерий необходимо определить объективно, и тесты должны быть стандартизованы. Для применения в образовании были разработаны критериально-ориентированные тесты. Следующий акцент был сделан на развитии понятия конструктной валидности. Ан-гофф (1988) назвал это понятие изобретением «магического средства».
Развитие концепций валидности сопровождалось совершенствованием статистических методов, что в свою очередь оказывало влияние и на становление понятия валидности. Хорошо известный пример — это многометодная матрица свойств Кэмпбелла и Фиске (1959). Оценивалась валид-ность изучения ряда черт при помощи различных методов. Интерес был сконцентрирован на рассмотрении валидности черт. Предполагалось, что различные черты должны расходиться (дивергировать), а сходные — конвергировать, то есть речь шла о конвергентной и дискриминантной валидности. Предполагалось, что отдельные черты будут нечувствительны к используемым методам. Использование этой
I I i
матрицы оыло очень популярным и рассматривалось как метод конструктной валидизации. Магнуссон (1961, 1967) описал этот метод в своей книге по теории тестов и назвал его процедурой «полной конструктной валидизации».
В истории дифференциации и интеграции концепции валидности присутствует некоторая волнообразность. Это очень старая проблема, и она была предметом размышлений у греческих философов. Концепция допускает существование обоих подходов— и холистического, и атомистического.
В последнее десятилетие было добавлено еще одно новое значение понятия валидности. Так что можно говорить о дальнейшей дифференциации этого понятия. Представляется интересным, что само это понятие как бы привносит некое единство (или объяснение) в разнообразие коэффициентов прогностической валидности одного и того же теста. Это понятие представляет собой обобщение валидности. Исследование прогностической валидности одного и того же теста для различных, но связанных между собой критериев обнаруживает его разную ценность. Таким образом, по-видимому предпочтительнее подсчитывать новые коэффициенты валидности для каждого критерия. Шмидт и Хантер (1977) полагают, что существует один «истинный» коэффициент прогностической валидности и что расхождения коэффициентов валидности теста по различным, но сходным критериям представляют собой дисперсию ошибки. Они указали на 7 источников дисперсии ошибки:
• ненадежность в оценивании критерия;
• ненадежность теста;
• ограничение интервала;
• ошибки при составлении выборки;
• тип критерия и значимость;
• ошибки при подсчете и письме;
• небольшие различия в структуре факторов между задачами определенного типа.
Авторы попытались оценить источники этих систематических ошибок. Были проведены исследования, в которых подсчитывались коэффициенты валидности для сходных тестов и для сходных критериев. Подсчитывалась диспер-
сия в распределении коэффициентов валидности. Из этой дисперсии вычитались все показатели дисперсии, связанные с перечисленными источниками ошибок. Таким образом может быть подсчитан истинный коэффициент валидности прогностического критерия. Подобные расчеты действительно проводились авторами. Например, авторы оценивали некоторые из возможных источников ошибок в предсказании успешности работы механиков службы сервиса с помощью тестов на понимание принципов механики, а также при определении возможной эффективности труда работников службы быта с помощью интеллектуальных тестов. Этот тип исследования Может быть рассмотрен как мета-исследование. В психодиагностике разработаны также статистические методы для оценки источников ошибок (Schmidt, Law, Hunter, Rothstein, Pearlman & McDaniel, 1993). Но остается вопрос о том, как могут быть использованы знания о способах оценки истинного коэффициента корреляции и представления о возможных источниках ошибок. Используется ли реально эта информация практическими психологами или же они до сих пор обречены на то, чтобы подсчитывать коэффициенты валидности для каждой группы и для каждого критерия?
Подведем итоги. Итак, в истории развития представлений о валидности первым предметом рассмотрения была прогностическая валидность. Постепенно представления о валидности становились все более дифференцированными, и в качестве объединяющей их силы выступила концепция конструктной валидности. Сравнительно недавно была разработана обобщенная концепция валидности для объяснения различий между коэффициентами прогностической валидности сходных тестов по сходным критериям.
3.2.6. Статистическая оценка валидности Валидность представляет собой весьма широкое и сложное понятие. Этим и объясняется отсутствие специфических математических моделей или статистических методик для оценки валидности. Современная теория тестов вносит свой довольно скромный вклад в развитие понятия валидности (см. гл. 1) Для объяснения того, как даются ответы на отдельные задания теста или группу заданий, были разработаны одномерные модели изучаемых (латентных) харак-
пз
теристик. По мнению Гольдштейна и Уда (1987, р. 163— 164) в теории ответов на задания теста центральной проблемой является вероятностная природа ответов, а не то, почему люди дают правильные или неправильные ответы. По мнению авторов, часто недостатком нелинейных логистических моделей является их относительная математиче-ская сложность, поскольку она может заслонять исследуемое реальное содержание. Эта критика не умаляет вклада современной теории тестов в объяснение тестируемого поведения.
Поскольку существует множество различных значений валидности, при изучении валидности в психологии используется целая гамма способов анализа данных психологии. В связи с этим при обсуждении проблемы валидности в учебниках авторы делают это несколько по-разному. Дрене и Сийтсма (1990) ограничиваются такими методами анализа данных, как регрессионные анализ и прогноз, факторный анализ (без их дальнейшей разработки). Крокер и Альджина пошли на шаг дальше. Они описывают процедуры шкалирования, модели линейного прогноза (при рассмотрении прогностической валидности) и факторный анализ (для конструктной валидности). Наннелли и Берн-штейн (1994) пошли еще дальше в использовании статистических процедур. Кроме перечисленных методик они применяют дискриминантный анализ, многомерное шкалирование и др.
По мере разработки новых методов анализа данных они будут использоваться при исследовании валидности. Трудно найти специфические связи между исследованиями валидности и ограниченным набором специфических техник. Однако некоторое устойчивые связи все же сложились. Исследования прогностической валидности связаны главным образом с моделями линейного прогноза (корреляции и регрессия). В исследовании конструктной валидности общей линейной модели используются многометодная матрица свойств и факторный анализ. Кронбах и Миль еще в 1955 году составили перечень множества процедур конструктной валидизации.