Конструктная валидность
Г.9. Если автор интерпретирует тест как меру диагностируемого конструкта (способности, черты установки), то должна быть полностью изложена предполагаемая интерпретация. Этот конструкт должен быть полностью ограничен от интерпретаций, вытекающих из других теорий. (Существенно.)
Комментарий. Например, если тест предназначен для измерения конструкта «тревожность», автор теста должен отразить отличия самого определения данного конструкта от некоторого другого возможного значения термина, которое подразумевается, и должен соотнести свою концепцию с мерами тревожности, рассмотренными в литературе.
Описание конструкта может быть простым, например определение «креативности» как «совершения многих оригинальных действий». Все подобные характеристики или гипотезы являются частью авторской концепции.
Г.9.1. В руководстве должна быть отражена степень случайности предложенной интерпретации и обобщены исследования гипотез, вытекающих из данной теории. (Существенно.)
Г.9.1.1. Каждое исследование, содержащее теоретические выводы о тесте, должно быть отражено так, чтобы были раскрыты и операциональные процедуры исследования, и соотнесение результатов с теорией. (Очень желательно.)
Г.9.1.2. В руководстве должны быть сообщены корреляции между тестом и другими тестами, для которых интерпретация относительно ясна. (Очень желательно.)
Г.9.2. В руководстве необходимо привести доказательства степени, с которой другие конструкты, отличающиеся от предполагаемого автором, объясняют дисперсию баллов теста. (Очень желательно.)
Комментарий. Хотя неразумно требовать от автора теста предвосхищения или включения в руководство каждой противоположной интерпретации, он все же должен представить достаточные данные о противоположных гипотезах, наиболее вероятно объясняющих дисперсию тестовых баллов.
Г.9.2.1. В руководстве к любому специализированному тесту или вопроснику, используемому в образовательном отборе, профориентации, необходимо приводить корреляцию его баллов с общепринятыми мерами вербальной и вычислительной способности в соответствующей популяции. (Очень желательно.)
Г.9.2.2. В руководстве должна быть представлена информация о факторных исследованиях (если тест подвергался им), показывающих процент тестовой дисперсии, выявляемой хорошо известными факторами. (Желательно.)
Г.9.2.3. Для опросников, являющихся мерами личности, интересов или установок, должны быть представлены доказательства степени, с которой оценки чувствительны к попыткам испытуемых представить социально желаемую (конформную) картину своей личности или с которой баллы могут отражать другие искажающие особенности ответов. Такие виды ответов должны изучаться в первую очередь для определенных выборок, а не для более общей генеральной выборки. Могут быть представлены корреляционные или экспериментальные исследования. (Очень желательно.)
Г.9.2.4. Если тест, проводимый с ограничением во времени, интерпретируется в качестве измеряющего гипотетическое психологическое свойство, не связанное специально с быстротой выполнения теста, то должны быть представлены свидетельства о влиянии скорости на тестовые баллы и об их корреляции с другими переменными. (Существенно.)
Комментарий. Наиболее полным доказательством влияния скорости выполнения может быть сравнение баллов по двум формам с обычным ограничением при неограниченном времени. Корреляция баллов этих вариантов имеет ограниченный смысл, т. к. эти два балла не являются независимыми. Менее исчерпывающим доказательством является процент испытуемых, ответивших на последнее задание или некоторое задание, близкое к концу теста, за время, отведенное на выполнение теста. Если этот процент ниже 90, необходимо более глубокое исследование, чтобы показать, что индивидуальные различия по тесту существенно не отражают скорости.
Г.9.2.5. Если различия в стратегии выполнения теста влияют на интерпретацию баллов, связанных с определенными характеристиками подгрупп, об этом должна быть дана ясная информация или ясно указано на отсутствие ее. (Очень желательно.)
Г.9.2.6. Если свидетельство против противоположной интерпретации основано на низкой корреляции при малом различии между группами, в руководстве необходимо сообщить доверительность поправки или обсудить ошибки измерения, которые могли снизить соответствующую зависимость. (Желательно.)
Д. Сведения о процедуре применения теста.
Интерпретация тестов и средств измерения, так же как и результатов эксперимента, наиболее надежна, когда измерения ведутся в стандартизированных и контролируемых условиях. Конечно, в тестировании существуют ситуации, когда важно систематически менять обстоятельства для максимального понимания деятельности индивида. Например, исследователь может систематически менять процедуры в последовательных повторениях теста, чтобы выяснить пределы умения ребенка в определенной содержательной области. Тем не менее, составитель теста должен сам предусмотреть стандартные процедуры, в которых возможна подобная модификация. Вне стандартизации качество интерпретации может ухудшиться в степени, с которой различия в процедуре влияют на результаты тестирования.
Для большинства целей наибольший упор делается на строгую стандартизацию процедур проведения тестов и инструкций к нему. Если тест предназначен для разнообразных популяций, эти процедуры должны быть полностью доступны для всех испытуемых из каждой популяции.
Д.1. В руководстве к тесту должна быть указана квалификация и специализация, необходимая для проведения теста и его интерпретации. (Существенно.)
Комментарий. Однако из руководств в определении квалификации, необходимой для индивидуального тестирования детей данным тестом, различают психологов, которые работают с детьми, и тех, кто работает только со взрослыми. Другое руководство указывает на специфичность тестирования учащихся, родной язык которых отличается от языка теста. Квалификация пользователя может быть описана путем указания на профиль специального обучения, которое в общем считается необходимым для достижения компетентности. В некоторых руководствах к тестам могут выделяться наиболее частые источники ошибок применения теста и указываться виды обучения пользователей, дающие возможность устранить эти ошибки.
Д.1.1. Если тест рекомендован для нескольких целей и типов заключений, в руководстве следует указать степень обученности пользователей, необходимую для каждого применения. (Существенно.)
Д.1.2. Если авторы предполагают, что тест может использоваться неспециалистами, то руководство должно быть написано в форме, доступной их пониманию. (Существенно.)
Комментарий. С тестом могут иметь дело не только лица, специально обученные этому. Испытуемые, члены педагогических и общественных комиссий, родители имеют также основание для суждений по тесту. Это их право не вступит в противоречие с необходимостью сохранять тайну, если им доступны описательные и объясняющие материалы.
Д.1.3. Руководство не должно допустить, чтобы тест понимался как «самоинтерпретирующийся». В нем должно быть указано, какую информацию о результатах тестирования возможно представить лицам, не имеющим необходимой для интерпретации подготовки. (Существенно.)
Комментарий. Обычно желательно получать интерпретацию оценок подготовленным лицам. Конечно, существуют тесты, результаты которых могут быть оценены испытуемыми; часто полезно сообщать тестовые баллы учащимся и родителям. Если это практикуется, смысл данного требования в том, что должны даваться необходимые сведения по интерпретации этих баллов.
В руководстве должно быть указано, что может выполняться необученным лицом и что не может выполняться. Например, в одном руководстве к широко известному тесту интересов указывается, что испытуемые могут усвоить способы оценивания результатов собственных ответов, но подчеркивается, что они нуждаются в помощи квалифицированного учителя или консультанта при интерпретации результатов и построении планов на будущее.
Д.2. В руководстве к тесту следует указать степень необходимого для теста сохранения тайны его содержания в ходе предварительной тренировки. (Очень желательно.)
Комментарий. Тест числового ряда предполагает тренировочную практику, для того чтобы испытуемые лучше поняли инструкцию. Данная тренировочная практика не дублирует заданий теста и, следовательно, сохраняет содержание самого теста в тайне.
Д.2.1. В руководстве должны быть описаны примеры неприемлемой практики. (Очень желательно.)
Д.3. В руководстве к тесту необходимо отразить основные этапы процедуры его проведения. (Существенно.)
Комментарий. Обычно последовательность проведения теста такова:
1) объяснить испытуемым цель проведения теста;
2) гарантировать сохранение тайны индивидуальных ответов;
3) в соответствии с требованиями руководства прочитать инструкцию и провести тренировку;
4) попросить испытуемого или самому заполнить (если требуется) паспортные и биографические данные в регистрационных бланках;
5) ответить на имеющиеся вопросы;
6) обработать результаты теста в соответствии с требованиями руководства.
Д.4. Инструкции по проведению должны быть отражены в руководстве к тесту максимально подробно, с подчеркиванием, что пользователь теста может и должен воспроизвести те условия тестирования, при которых разработаны нормы и получены данные о надежности и валидности. (Существенно.)
Комментарий. Так как лица, проводящие тесты в школах и на производстве, иногда могут не поступать строго по инструкциям и не понимать необходимости их соблюдения, важно, чтобы руководство в этом отношении было очень убедительным. Для обеспечения стандартности процедуры некоторые тесты проводятся полностью механизированным способом.
Д.4.1. Инструкции, опубликованные в руководстве к тесту, должны быть достаточно полными, чтобы тестируемые понимали необходимость действовать так, как подразумевал автор теста. (Существенно.)
Комментарий. Например, при заполнении опросника личности субъект иногда может давать первый встретившийся ему ответ. Следовательно, подобная возможность должна быть указана в инструкции, которую субъект читает или которая ему зачитывается. Инструкция для вопросников интересов должна определить, следует ли испытуемому отмечать то, что ему нравится в идеале, или также следует предусмотреть возможность того, что ему необходимо иметь благоприятные условия и способности этого достигнуть. Подобным образом в инструкции необходимо определить, следует ли испытуемому отмечать то, что ему нравится, но встречается иногда, или только то, что ему нравится и встречается постоянно.
Д.4.1.1. Инструкция должна четко подчеркнуть такие критические моменты, как указания об угадывании, лимиты времени и способ ответов. (Существенно.)
Д.4.1.2. Инструкция для тестирующего должна содержать указания по поводу вопросов со стороны испытуемых. (Очень желательно.)
Д.4.2. Если предусматривается возможность изменения и совершенствования инструкций, описанных в руководстве к тесту, то должны быть ясно указаны условия, при которых позволительно это делать; эти условия приводятся или в форме общих правил, или на основе значительного числа примеров, или тем и другим способом. (Существенно.)
Д.5. Инструктаж должен подготовить испытуемого к обследованию: необходимо предусмотреть подборки необходимых видов стимульного материала, листы ответов, карандаши, ручки и т. п. (Желательно.)
Д.6. Процедуры выставления баллов по тестовым заданиям должны быть изложены в руководстве с максимальной детализацией и ясностью, чтобы уменьшить вероятность ошибки при оценивании. (Существенно.)
Д.6.1. В руководстве к тесту должны быть представлены инструкции по оцениванию результатов выполнения задания и указаны процедуры предотвращения ошибок подсчета и вычисления. (Очень желательно.)
Д.6.2. Если оценивание результатов теста содержит субъективные процедуры, в руководстве должны быть представлены данные степени согласованности независимых оценщиков в операциональных условиях. Если таких свидетельств не имеется, в руководстве должно быть обращено внимание на вариации оценивания как возможный значимый источник ошибок измерения. (Очень желательно.)
Д.6.3. Если в тесте используется более чем один метод выражения ответов испытуемыми, руководство к тесту должно сообщить данные о степени, с которой результаты, полученные при использовании различных методов, взаимозаменяемы. (Существенно.)
Комментарий. Разное количество времени, необходимого для ответа на задания в формах, приспособленных к разным методам выставления баллов, может влиять на надежность или валидность теста, на применимость тестовых норм.
Д.6.4. Если использована необычная или сложная система выставления балов, в руководстве к тесту необходимо указать приблизительное количество времени, необходимое для выставления баллов по заданиям теста. (Желательно.)
Д.6.5. «Формулы поправки на угадывание» должны использоваться при заданиях с множественным выбором или при ответах вида «истинно – ложно» теста на скорость выполнения заданий. (Желательно.)
Е.Сведения о процедуре обработки и интерпретации тестовых результатов.
По традиции интерпретация тестовых баллов является нормированно-референ-тной, т. е. индивидуальная оценка интерпретируется в сравнении с оценками других индивидов. Однако возможны и другие интерпретации. Содержательно-референтная интерпретация имеет место, если балл интерпретируется непосредственно, соответственно деятельности на каждой точке измеренного континуума достижений. Критериально-референтная интерпретация отражает непосредственно интерпретацию баллов в соответствии с деятельностью в любой данной точке континуума внешней переменной. Переменной внешнего критерия могут быть средние оценки или уровни трудовой деятельности. Стандартные требования параграфа в принципе относятся больше к нормированно-референтным интерпретациям тестов и в меньшей степени к содержательно-референтным.
Е.1. Нормы должны публиковаться в руководстве к тесту одновременно с публикацией теста (для операционального использования). (Существенно.)
Е.1.1. Нормы должны быть определены также к тесту, разработанному только для локального применения или только для целей предсказания. (Желательно.) Комментарий. Иногда забывают, что таблицы норм дают информацию, полезную не только для сравнения индивида с групповыми данными. Например, пользователь теста из таблицы норм может извлечь информацию относительно уровня баллов, на котором различительная сила измерения хороша или плоха.
Е.1.2. Даже если предполагается, что тест в первую очередь будет использоваться с локальными нормами, в руководстве к тесту следует предусмотреть нормировочные данные, чтобы помочь интерпретатору, не имеющему локальных норм. (Очень желательно.)
Е.2. Нормы, представленные в руководстве к тесту, должны относиться к определенным и ясно описанным популяциям. Этими популяциями должны быть группы, с которыми пользователи теста обычно желают сравнивать тестируемых лиц. (Существенно.)
Комментарий. Почти во всех случаях, когда тесты разработаны не только для локальных целей, пользователь хочет знать, насколько они применимы для различных групп. Для тестов, разработанных с целью широкого использования в школах или в промышленности, необходима информация о различиях и сходствах нормативных данных для таких групп, как группы по полу, национальности, образованию или возрасту. В руководстве должны быть описаны случаи, когда нормы для одних групп также подходят и для других групп.
Например, руководство к вопроснику профессиональных интересов или к тестам способностей, важных для некоторых профессий, должно подчеркивать, что лицо, получающее высокую оценку интересов или способностей к учебному предмету или профессии при сравнении со «средним» человеком, получает более низкую оценку интересов при сравнении с лицами, фактически занимающимися в этой области. Так, высокий процентильный балл по шкале музыкальных интересов, в которой испытуемый сравнивается со «средним» человеком, может быть эквивалентен низкому процентильному баллу при сравнении испытуемого с профессиональным музыкантом.
Е.2.1. Необходимо предотвращение ошибочного впечатления о генерализованности нормативных данных. (Существенно.)
Комментарий. Нормативные данные, полученные для выборки людей или школ со специфическими чертами, часто используются так, как будто они получены по репрезентативным общегосударственным группам. Так, имеются пользователи тестов, которые могут сказать, что испытуемый читает на уровне десятиклассника, вне учета того, что нормы фактически получены на основе лучших школ, добровольно принявших участие в исследовании по разработке теста. Ошибкой интерпретации является предположение, что нормы добровольных групп учащихся приложимы к школам вообще. Сфера действия таких ошибок может быть сокращена, если в руководстве к тесту четко определены характеристики нормативной популяции.
Е.2.1.1. В руководстве к тесту необходимо сообщить метод отбора выборки из популяции испытуемых и обсудить вероятное смещение в выборочной процедуре. (Существенно.)
Е.2.1.2. Нормы, сообщенные в руководстве к тесту, должны быть основаны на хорошо спланированной выборке, а не на данных, собранных в основном из-за их относительной доступности. Любое отклонение от намеченного плана должно быть отражено одновременно с описанием действий, предпринятых или не предпринятых в связи с этим. (Существенно.)
Комментарий. Нормы профессиональных и педагогических тестов иногда основаны на разрозненных выборках тестируемых, так как авторы иногда просят пользователей тестов прислать результаты тестирования для использования их в последующих сообщениях о тестовых нормах. Полученные таким образом распределения подвержены смещениям неизвестного типа и степени. Следовательно, методы получения выборок должны быть ясно описаны.
Е.2.1.3. Наряду с сообщением числа индивидов, результаты тестирования которых были использованы при разработке нормативных данных, руководство должно также сообщить число выборочных единиц (например, классов), из которых были взяты эти индивиды, а также число индивидов в каждой единице. (Существенно.)
Е.2.2. В руководстве к тесту описание нормативной группы должно быть достаточно полным, чтобы пользователь мог судить о пригодности для собственного применения. В описании должно быть указано число случаев, классифицированных по одной или более таких переменных, как возраст, пол, социоэкономический статус, образовательный уровень. Если взята обобщенная выборка, в описании нормативной группы должно быть указано число отдельных тестированных групп. (Существенно.)
Комментарий. Для описания нормативных данных в руководствах часто используются классификационные системы в целом. Например, в руководстве к одной методике даны сведения для многих профессиональных и образовательных групп. Однако отсутствие информации о таких признаках, как пол, возраст, образование и уровень опыта, внутри этих групп существенно уменьшает полезность норм.
Е.2.2.1. В руководстве должны быть ясно и рельефно описаны популяции, на основе которых определены психометрические свойства теста и для которых применимы нормативные данные. В любом сообщении о доработке теста должны отразиться характеристики нормативных групп, использованных в интерпретации результатов. (Существенно.)
Комментарий. Назначение этого стандартного требования — предупредить пользователей и испытуемых относительно необоснованных интерпретаций. Если сообщение о стандартизации представляет результаты в интерпретации процен-тильных рангов или стандартных баллов при последовательном использовании той же нормативной популяции, будет достаточным определение этой популяции с указанием времени сбора данных.
Е.2.3. Если выборка, на основе которой установлены нормы, мала или, по другим причинам, ненадежна, в руководстве к тесту необходимо ясно предупредить пользователя относительно возможности величины ошибок при интерпретации баллов. (Существенно.)
Е.2.4. В руководстве к тесту нормы по субтестам или группам заданий сообщаются только в том случае, если указана валидность и надежность таких субтестов или групп заданий. (Существенно.)
Комментарий. Пользователь теста уверен, что, когда даны нормы для части теста, автор считает их пригодными для интерпретации. Должна сообщаться также надежность и валидность таких баллов.
Е.2.5. В руководстве к тесту должны быть описаны условия, при которых получены нормативные данные. (Существенно.)
Комментарий. В случае, когда некоторые аспекты стандартизированы на группах кандидатов на работу, другие — на группах, обратившихся за профконсультацией, а третьи — на группах, осознающих себя как испытуемые, то между такими группами и внутри них индивиды часто различаются по мотивации выполнения теста, установке к его выполнению, способностям и личностным характеристикам, хотя точное описание этих различий не всегда возможно.
Е.3. При сообщении норм в руководстве к тесту следует пользоваться процен-тилями для одной или нескольких подходящих референтных групп или стандартными баллами, для которых ясно определено основание. В руководстве к тесту должны быть даны меры центральной тенденции и рассеивания. (Существенно.)
Е.3.1. Если тест используется для предсказания, должны быть приведены, насколько это возможно, таблицы ожиданий или эмпирические таблицы перевода баллов в уровни вероятности успеха или умения. (Желательно.)
Е.4.Для многих применений теста локальные нормы более важны, чем опубликованные. В таких случаях руководство к тесту должно давать возможность использования локальных норм. (Очень желательно.)
Е.5. В руководстве к тесту должны быть полностью описаны производные шкал, использованные для стандартизированных баллов, чтобы увеличить вероятность точной интерпретации и понимания баллов интерпретатором теста и испытуемым. (Существенно.)
Комментарий. Целесообразно сократить число производных шкал до нескольких, с которыми пользователи были бы знакомы. Существующее разнообразие ведет к необходимости описания таких шкал в каждом руководстве. Проблема, в частности, в том, что теперь используются многие различные системы, не имеющие логических преимуществ по сравнению друг с другом. Для преодоления недостатков старых методов шкалирования могут быть предложены новые. Разнообразие шкал для окончательных тестовых оценок может привести к недоразумениям и ошибочным интерпретациям, если шкалы, рекомендованные для данного теста, не описаны в руководстве ясно и полно.
Е.5.1. Построение шкалы на основе нормативных данных должно быть ясно и недвусмысленно описано в терминах, предотвращающих нарушения и интерпретации или неправильные обобщения. (Существенно.)
Комментарий. Производные оценки могут быть очень полезны для выводов. Однако очень часто они рассматриваются как имеющие абсолютный смысл независимо от отдельного теста и нормативной популяции. Примером является коэффициент интеллекта, который зачастую понимается как просто стандартный балл, который часто видоизменяется и интерпретируется так, словно он отражает неизменную и независимую характеристику испытуемого. Оценки эквивалентности классу обучения или даже процентильные ранги также могут интерпретироваться неправильно, как некие абсолютные величины, если в руководстве к тесту не приведены характеристики групп, на которых эти оценки построены.
Е.5.2. В руководстве необходимо указать, являются ли стандартные баллы результатом линейной или нелинейной трансформации суммарных баллов. (Существенно.)
Е.5.2.1. Интерпретационных баллов, которые сами по себе включают существенную ошибочность интерпретации (оценки умственного возраста, эквивалентности классу обучения и др.) надо избегать. (Очень желательно.)
Комментарий. Если, несмотря на эту рекомендацию, в руководство включены подобные оценки, необходимо предусматривать в табличной форме также их связь со стандартными баллами или процентильными рангами внутри каждой категории и внутри соответствующей нормировочной группы. Например, таблица может отразить вдобавок к баллу эквивалентности классу обучения соответствующий процентильный ранг внутри собственного возраста или класса испытуемых для каждого суммарного балла. Для старших классов больше подходят нормы внутри предметов, чем внутри классов.
Е.5.3. Если в руководстве к тесту предполагается, что процентильные ранги будут выражаться графически профильной звездочкой, график должен основываться на нормальной вероятностной шкале или на некоторой другой приемлемой нелинейной трансформации. (Очень желательно.)
Е.6. Если шкалы пересмотрены, добавлены новые формы или сделаны другие изменения, в пересмотренном руководстве к тесту должны быть помещены таблицы эквивалентности старой и новой форм. (Желательно.)
Комментарий. Новые формы теста должны быть приравнены к недавно определенным шкалам стандартных баллов других форм, чтобы пользователь мог быть уверен, что баллы, предложенные по новым формам, сравнимы с баллами предыдущих форм.
Е.6.1. Если новая форма теста приравнена к старой, в пересмотренном руководстве должно быть описано содержание и старой и новой форм, а также характер нормативных групп для них. (Существенно.)
Комментарий. Изменения в знаниях, технологии или учебном материале могут потребовать, чтобы новое издание тестов существенно отличалось от прежних, а потребность преемственности требует приравнивания окончательных шкал друг к другу. Пользователь должен иметь возможность оценить эквивалентность в соответствии с изменениями содержания, поскольку у него возникают сомнения, возможно ли значимое сравнение баллов при изменении содержания.
Е.6.2. В руководстве должен быть описан метод установления эквивалентности или сравнимости оценок и должна быть дана оценка точности процедуры приравнивания. (Очень желательно.)
Е.7. Если предполагается, что тест будет использоваться не столько для оценки индивидов, сколько групп (например, для школ или программ), должны быть представлены нормативные данные, основанные на суммарных групповых статистиках. (Существенно.)
Комментарий. Например, нецелесообразно оценивать школы применением норм, разработанных для оценки индивидов. Также нельзя вычислять групповые средние по нелинейным шкалам, например по процентильным рангам, выведенным для индивидуальных норм.
Е.8. Тест, руководство, формы записи ответов и другие сопровождающие материалы должны помогать пользователю правильно интерпретировать результаты теста и предупреждать неправильное его употребление. (Существенно.)
Комментарий. Многие руководства к тестам подчеркивают переменные, которые следует учитывать при интерпретации тестовых оценок. Это может быть информация об учебных достижениях, рекомендации или соответствующие анамнестические данные.
Е.8.1. Руководство к средству оценивания личности может включать данные, показывающие, что психолог должен учитывать такие факторы, как пол и возраст субъекта, женаты или разведены его родители, возраст и пол его детей, его профессиональный и супружеский статус и т. д.
Е.8.2. Руководство к тесту должно подчеркнуть те существенные влияния на тестовую оценку, которые связаны с регионом, социоэкономическим статусом, национальностью или полом. (Существенно.)
Е.9. Руководство должно обратить внимание пользователя на публикации, с которыми он должен ознакомиться до тестирования для более точной интерпретации результатов теста. (Очень желательно.)
Комментарий. Публикациями могут быть книги или статьи, относящиеся к смежным психологическим теориям или к самому тесту, о котором идет речь.
Е.10. Изложение описываемых в руководстве зависимостей по смыслу является количественным и должно быть приведено с точностью, которую позволяют данные. Если данные в поддержку таких утверждений не были собраны, этот факт должен быть ясно указан. (Существенно.)
Комментарий. Авторы, например, иногда пишут: «Для инженера-архитектора требуется способность пространственного мышления» или «Необычные ответы могут указывать на наличие шизофрении». Такие утверждения сами по себе количественно неадекватны. Какая частота эксцентрических ответов указывает на уже развившуюся шизофрению? Насколько успех в архитектуре зависит от пространственной способности? Количественные данные, связывающие тестовые оценки с определенными критериями, должны помочь получить ответы.
Е.10.1. Для сообщения количественной информации предпочитаются хорошо известные и легко интерпретируемые статистические процедуры. Любая необщепринятая статистическая техника должна быть объяснена, и должны быть приведены ссылки на источники. (Существенно.)
Комментарий. Издатели не обязательно должны однообразно придерживаться процедур, широко используемых для сообщения данных, но технологии и процедуры должны быть довольно известными на практике, чтобы компетентные пользователи могли адекватно судить о результатах.
Это стандартное требование является конкретизацией принципа, что представленные в руководстве данные не должны вводить в заблуждение. Например, ошибочно показывать ценность объединенных в батарею тестов в уравнении регрессии путем использования данных с интеркорреляцией более низкой, чем о ней сообщалось в другом месте руководства.
Е.10.2. Когда сообщается статистическая значимость, сообщение должно быть в форме, которая делает ясным чувствительность или мощность критерия значимости. (Существенно.)
Комментарий. Статистическая значимость, не имеющая практической полезности, часто может быть получена использованием очень большого числа случаев. Наоборот, тот, кто использует нечувствительный статистический критерий, может сделать ошибочный вывод об отсутствии важного в практическом смысле различия. В общем, при сообщении тестовых данных более приемлемо определить доверительный интервал или функцию правдоподобия интересующего параметра, а не просто сообщить, что нулевая гипотеза может или не может быть отклонена.
Е.10.3. В руководстве должны ясно различаться интерпретация, которая приложима только к средней тенденции группы, и интерпретация, приложимая к любому индивиду внутри группы. (Существенно.)
Комментарий. Некоторые тесты достаточно надежны для обеспечения относительно стабильного среднего балла группы, но недостаточно надежны, чтобы обеспечить использование индивидуальных баллов или позволить сравнение индивидов.
Е.10.4. В руководстве должно быть ясно указано, какая интерпретация относится к каждому баллу субтеста в той же степени, как и для всего теста. (Существенно.)
Комментарий. В руководстве должно быть четко указано, когда баллы субтестов получены только для простоты вычисления балла всего теста и не предлагают самостоятельного использования, когда они могут иметь исследовательское применение, и предусматривается ли при этом их интерпретация.
Е.11. Составители тестов или другие лица, использующие ЭВМ для интерпретации тестов, должны предусмотреть руководство, отражающее алгоритм и свидетельства в поддержку интерпретации баллов на основе ЭВМ. (Существенно.)
Комментарий. Вычислительная машина позволяет накопить и воспроизвести большое количество данных. Интерпретация теста может быть очень облегчена использованием банка данных, накопленных в ЭВМ на основе совокупности индивидуальных оценок по батарее тестов или вопроснику личности.
Пользователь таких массивов должен знать обоснование и свидетельства в пользу предполагаемой интерпретации, так как она подвержена ошибкам в той же степени, как и другие субъективные интерпретации.
Данный пункт относится только к хранению и обработке информации, введенной в ЭВМ.
Проведение тестов неавтоматизировано и осуществляется обычным способом. В том случае, когда пользователь хочет автоматизировать и проведение теста, тест должен пройти полную психометрическую проверку.