Критериальные системы оценивания
Как правило, критериальные системы оценивания используются в случаях, когда целью теста является выявление того, что умеет делать кандидат. Общими характеристиками большинства критериальных способов намерения являются следующие:
• тест, как правило, состоит из элементов, для выполнения которых требуются совершенно определенные формы поведения или уровень профессиональной деятельности;
• тесты обычно направлены на оценку базы знаний, являющихся фундаментом для необходимого поведения;
• успешность прохождения теста обычно определяется по принципу «приемлемо или неудовлетворительно», хотя в некоторых случаях для обозначения успешности могут использоваться различные ступени или уровни достижений.
• кандидаты имеют возможность предпринимать несколько попыток до тех пор, пока им не удастся сдать тест, при этом между попытками часто требуется дополнительное обучение (как, например, для того, чтобы сдать экзамен по вождению).
Тесты на выполнение образца работы (см. главу 7) представляют собой основной пример критериального подхода к оценке профессиональной деятельности. Например, в число различных компонентов умений (т. е. критериев), необходимых рабочему высокой квалификации, специализирующемуся на возведении строительных лесов, входят умение работать на большой высоте, перенося при этом груз, вес которого превышает вес тела работника; умение ставить трубы длиной 21 фут1 вертикально и вставлять их одна в другую; конструировать и сооружать различные типы подмостей, используя, например, консольные балки и горизонтальные распорки; создавать инженерные чертежи и т. п. Кроме того, требуется знать правила техники безопасности и уметь рассчитывать напряжение под нагрузкой. Тесты Управления по профессионально-техническому образованию для строительной промышленности (Construction Industiy Training Board, CITB) оценивают компетентность специалиста по возведению лесов во всех этих сферах. Несостоятельность специалиста в любом из аспектов приводит к признанию общего результата теста неудовлетворительным.
1 6,3 метра. — Примну, персе.
76 ■ Глава 4. Оценочные стандарты для методов отбора персонала
Оценивается только собственно профессиональный уровень специалиста по возведению лесов, при этом не происходит сравнения с другими специалистами. Таким образом, в нрпнципелюбой кандидат может пройти или не пройти этот тест.
Нормативные системы оценивания
Поскольку отбор кадров часто осуществляется па конкурентной основе, сотрудники отдела персонала почти всегда хотят сравнить кандидатов друг с другом. Интерпретацию результатов одного кандидата по отношению к результатам других наиболее целесообразно проводить с помощью нормативных систем оценивания. 1 {анрнмер, па основе выполнения упражнения по выбору профессиональных задач (Stahl, 1983) 1417 респондентами было выявлено, что нормой для вы-сокомотивировапных управленческих кадров является балл более 3,14 по шкале потребности власти (NPozc) и балл более 4,64 по шкале потребности и достижениях (NAch). Обнаружилось, что у тех кандидатов, чьи результаты оказались ниже этих показателей, управленческая мотивация была низкой.
Первым типом нормативных систем оценивания, подходящих для отбора кадров, является позиционная система оценки, прикоторой кандидат оценивается по отношению к остальным. Определение отметок кандидатов производится обычно на основе нормативной таблицы,показывающем'!, какие результаты показали ранее другие люди при прохождении лого же самого испытания. Например, организация, принимающая на работу менеджеров-стажеров, может сравнивать результаты претендентов, проходивших испытания валом году, с результатами предыдущих лет. Однако разработка нормативной таблицы должна производиться весьма тщательно (см. Bethel-Fox, 1989), при этом должна быть использована достаточно большая выборка испытуемых — как правило, не менее 400 человек.
Существует множество различных видов позиционной системы оценки, одни из которых более полезны, а другие — менее. В самых простых из этих систем результаты, полученные кандидатом, определяются только как «выше среднего» пли «ниже среднего» либо ранжируются в порядке убывания, от самого лучшего до наихудшего. Преимуществом этих методов являются легкость и быстрота их применения. Недостаток состоит в том, что полумаются очень грубые результаты, причем имеющаяся информация используется чрезвычайно неэффективно. Следовательно, к этим методам имеет смысл прибегать только тогда, когда нет других возможностей. К примеру,
Интерпретируемость ■ 77
отнесение к определенной категории не показывает уровня компетентности или других положительных качеств. Может оказаться, что кандидат, отнесенный к самой высокой категории, оказался лучшим из числа группы слабых кандидатов. С другой стороны, то, что кандидат отнесен к низшей категории, может говорить только о том, что его показатели немного хуже, чем у группы кандидатов высочайшего уровня. Кроме того, ранжирование может приводить к искажению и преувеличению отличий между кандидатами, сводя к минимуму принципиальную разницу и усиливая незначительную, и по этой причине очень трудно проанализировать систему ранжирования и получить сколько-нибудь достоверные результаты.
Более сложная разновидность позиционной системы оценки основана на применении ранжирования по процептилю; кандидат при этом помещается в репрезентативную последовательность, где данные о нем соотнесен ы сданными о других 99 кандидатах. Например, положение, обозначаемое 80-м процептилем, говорит о том, что результаты, полученные кандидатом при прохождении теста, равны результатам 80% остальных кандидатов или выше, чем они. Процентиль имеет два преимущества:
• имеется возможность сравнить отдельного кандидата со всеми остальными, проходившими определенный тест;
• результаты, полученные кандидатом при прохождении различных тестов, можно оцепить путем сравнения их друг с другом.
Например, процентиль 75, полученный при выполнении теста на потенциальные способности {aptitude test), является лучшим результатом, чем процентиль 65 при тестировании умений. Основным недостатком нроцентиля является то, что этот метод позволяет только ранжировать относительные показатели достижений кандидатов в рамках конкретного теста, не являясь при этом единицей измерения отличий результатов, полученных разными кандидатами.
В отличие от позиционных систем оценки стандартизованные системы оценки учитывают как положение кандидатов на классификационной шкале, так и степень их отличия друг от друга. Благодаря этому стандартизованные системы позволяют более точно и рационально оценить относительные результаты достижений. Для этого используются результаты сравнения со стандартным показателем, не только показывающие положение результатов, полученных кандидатом, относительно среднего результата, полученного всеми тестируемыми (т. е. выше или ниже среднего), но и дающие возможность
78 ■ Глава 4. Оценочные стандарты для методов отбора персонала
увидеть, насколько данный результат отличается от среднего. Использование результата по сравнению со стандартным показателем для дифференциации кандидатов имеет три основных преимущества, а именно метод позволяет:
• выявить положение результатов, полученных отдельным кандидатом, по отношению к результатам всех остальных;
• определить масштаб отличия результатов теста;
• избежать искажения или преувеличения различий между кандидатами.
Таким образом, и какой-то степени легче осуществляется анализ и интерпретация результатов теста. (Читатели, которые хотят лучше попять сущность нормативных систем оценивания, могут обратиться к приложению А.)
Практичность
Для того чтобы любой метод отбора был полезен на практике, целесообразно обеспечить, чтобы он измерял и прогнозировал именно те показатели, для которых предназначен. Однако практическая ценность метода определяется не только с точки зрения его точности и прогностического потенциала, но и еще по двум аспектам, а именно его субъективно воспринимаемой эффективностью и справедливостью, а также тем, насколько больших затрат он потребует от организации. Обе эти характеристики являются оценочными стандартами и, как правило, учитываются при дальнейшем принятии решений. Если полезность выбранного метода весьма ограниченна, или он кажется несправедливым по отношению к определенной группе кандидатов (например, по признаку пола, этнической принадлежности или образовательного уровня), или же затраты по его применению не будут оправданы возможностью получения выгоды, применение такого метода следует прекратить.
Еще на этапе разработки процедуры отбора необходимо принять решение о приемлемости конкретных методов отбора (см. главу 5). Как правило, в первую очередь такая оценка будет проводиться специалистами отдела персонала, которые будут осуществлять отбор кандидатов, поскольку их компетентность и знания в данной области обеспечивают достаточные возможности для определения ценности метода. Однако следует также привлечь к разработке процедур отбо-
Создание тестов ■ 79
pa и других сотрудников, потенциально имеющих к ней отношение. Совершенно необходимо участие представителей высшего уровня администрации компании, отчасти потому, что они принимают решение о выделении финансирования, и отчасти для того, чтобы заинтересовать п убедить этих людей в необходимости применения эффективных методов кадрового отбора. Также важно перед применением определенного метода кадрового отбора на практике провести испытания метода на обратившихся в компанию кандидатах. Если метод вызывает у кандидатов чувство неловкости, они могут давать такие ответы, па основе которых будет создано искаженное представление, и, таким образом, полезность теста снизится. Например, при выполнении упражнения на анализ документов в тихом помещении, где кандидат находится один, или в шумной комнате, где на пего могут смотреть другие кандидаты, будут получены совершенно разные результаты. Подобным образом может отразиться и позиция в отношении проблем, рассматриваемых политическими организациями и другими влиятельными группами, в тех случаях, когда метод считают несправедливым по отношению к каким-либо этническим группам пли другим социальным меньшинствам. Например, в работе Келлета и др. (Kellet el al., 1994) сообщается, что сеть национализированных железных дорог Великобритании «Бритиш Heii./i» изменила применявшиеся методы оценки персонала после того, как зта организация была привлечена к суду. Восемь начальников поездов с лондонской станции Паддингтон, которых поддерживала Комиссия по вопросам расового равенства (Commission for Racial fa/italiti/), подали в суд на «Бритиш Рейл» но причине неблагоприятного воздействия методов оценки в отношении .этнических меньшинств. Выло выявлено, что подобные проблемы имеются и у лопдопского метро. В результате судебного процесса обе компании достигли обоюдного согласия работников и руководства и изменили применявшиеся методы. Этот пример хорошо показывает, насколько важно оценить практичность способов кадрового отбора перед применением их в действии с. точки зрения полезности и необходимых затрат.
Создание тестов
Существует множество тестов различных типов, предназначенных для отбора персонала; наиболее распространенными из них являются тестирование когнитивных способностей, личностные опросники
80 ■ Глава 4. Оценочные стандарты для методов отбора персонала
и задания на выполнение образца работы. Хотя имеется возможность приобретения таких тестов у профессиональных разработчиков, иногда может потребоваться создать тест для конкретной фирмы. Для разработки теста любого типа наиболее важно провести систематическую подготовку и соблюдать логически оправданную последовательность этапов. Ниже приводятся основные принципы создания теста, но при этом мы не ставили перед собой задачу дать исчерпывающую информацию, поскольку применяемые методики достаточно сложны и многоаспектны. Все же описываемые.здесь основы помогают в определенной степени понять суть процесса создания тестов, благодаря чему те, кому предстоит сделать выбор между приобретением серийного теста и разработкой теста для своей фирмы, могут принять во внимание различные аспекты и иметь в своем распоряжении большую информацию поэтому вопросу. Заинтересовавшиеся читатели могут найти более подробные описания в работе Кронбаха н Глессера (Cronbach and Glesser, 1965).
Очень тщательно должны быть написаны и отобраны вопросы для любого теста, при этом существует полезное эмпирическое правило: необходимо, чтобы вопросы были как можно более простыми и понятными. Необходимо, чтобы использовались соответствующие целевой аудитории выражения; кроме того, важно исключить лишние элементы или те пункты, которые содержат два вопроса и более, поскольку они могут запугать респондентов и затруднить интерпретацию результатов. Существует хороший способ обеспечить выполнение вышеприведенных требований: проанализировать все вопросы теста один за другим, постоянно задавая себе вопрос, почему необходим каждый имеющийся пункт. Например, если тест создастся для оценивания аналитических способностей бухгалтеров-стажеров, то имеет смысл определить, что имеется в виду под «аналитическими способностями». Возможно, под этим подразумевается только то, что в работе стажеру потребуется извлекать информацию из таблиц, графиков или секторных диаграмм. Следовательно, для обеспечения содержательной вадидности тест должен быть построен так, чтобы измерить способность кандидата извлекать сведения из таких таблиц и графиков, где определенная информация дастся приблизительно или даже отсутствует. Однако необходимо добиться того, чтобы каждый пункт теста отражал только те конструкты, которые необходимо измерить. Следует также попытаться отчетливо представить себе, как может оцениваться ответ на каждый вопрос, поскольку это будет
Создание тестов ■ 81
иметь определенное значение при выборе формата для подсчета баллов того или иного типа.
Существует большое число форматов для подсчета баллов, и выбор одного из них не менее важен, чем выбор самих контрольных элементов, поскольку выбранный формат определяет принцип, по которому кандидаты будут приняты или отсеяны. Существуют различные форматы, начиная от простых альтернативных ответов «да/нет» и заканчивая биполярными шкалами, и у каждого из них имеются свои преимущества и недостатки. Альтернативные вопросы проще, чем вопросы с множественным выбором, но они имеют меньший селективный потенциал, хотя есть возможность компенсировать это за счет увеличения длины геста. Вопросы с множественным выбором дают возможность высокой дифференциации кандидатов и часто применяются в когнитивных тестах, например тестах знаний или тестах на потенциальные способности. Вопросы с множественным выбором также обеспечивают точность начисления баллов, поскольку любой ответ может быть только правильным или неправильным. Основной их недостаток заключается в сложности подбора отвлекающих вариантов (т. е. неверных ответов), похожих на правду и при этом достаточно сложно различаемых по сравнению с правильным ответом. Если правильный ответ будет слишком очевиден, то селективные возможности теста будут значительно снижены. Достаточно часто используются биполярные шкалы; в этом случае от кандидата требуется указать степень своего согласия или несогласия с утверждениями или характерист! i кам и.
После выбора вопросов теста и формата для подсчета баллов необходимо составить из них тест в удобной для испытуемого форме, понятно сформулировать инструкции и привести пример ответа на вопрос, чтобы кандидаты полностью понимали, что от них требуется при выполнении этого теста. Очень часто на этой стадии разработки вопросов в тесте бывает больше, чем необходимо. Считается, что в окончательном варианте теста число вопросов сократится втрое. Затем проводится предварительное испытание пробного варианта теста на достаточно большой выборке уже работающих в компании сотрудников для того, чтобы обеспечить простоту понимания вопросов.
Селективная ценность элементов теста выявляется с помощью корреляции балла по каждому отдельному пункту с общим баллом за весь тест или его раздел. Обычно сохраняются пункты, для которых выявлена высокая корреляция, и исключаются те, у которых она
82 ■ Глава 4. Оценочные стандарты для методов отбора персонала
оказалась низкой (более подробно вопрос анализа пунктов теста рассмотрен в работе Guilford and Frnchter, 1978). После того как пункты теста признаны пригодными, составляется окончательная его версия. В тестах знаний обычно сначала следуют легкие вопросы, а затем все более сложные. В тестах, выявляющих свойства личности или позицию по отношению к чему-либо, может оказаться полезным чередовать пункты, сформулированные с помощью положительных и отрицательных выражений, чтобы исключить бездумные ответы.
На последнем этапе проводится тестирование большой репрезентативной выборки, позволяющее установить нормы выполнения теста, его надежность и валидность перед тем, как он будет применяться в качестве инструмента отбора. Кроме того, необходимо выявить справедливость теста и исключить дискриминацию каких-либо групп населения, например по половому или расовому признаку.