Исследование - инструмент выработки отношения к гипотезам 8 страница
Проблемы, с которыми сталкивается исследователь при использовании измерительных процедур, рассмотрены в [Корнилова, 1997; Гусев, Измайлов, Михалевская, 1997].
Развитие измерительных шкал. Изменение мощности шкал соответствует развитию представлений о предмете изучения. В XII-XIV вв. температура объектов характеризовалась в терминах размытой номинальной шкалы “холодное” — “теплое” — “горячее”. Тепло и холод рассматривали как особые самостоятельные сущности или атрибуты “первоэлементов”. В этот период (позднее Средневековье) вырабатывалась сама идея количества, начался переход от качественных оценок объектов (в терминах усиления и ослабления качеств) к количественным [Кирсанов, 1987].
В 1592 г. Г.Галилей сконструировал стеклянный “термоскоп” с жидкостным наполнением, с помощью которого он измерял тепло в “градусах” (лат. gradus – шаг, степень), однако неизвестно, какой тип шкалы он предложил. В XVII ст. были сформированы разнообразные шкалы порядкового типа с одной фиксированной точкой, а, скорее областью, в силу ее неопределенности. Проблему установления такой точки решали различными способами. Так, Гюйгенс предложил две точки - “замерзание воды” и “летнюю жару”(!). О.Рёмер (1644—1710) построил шкалу с двумя фиксированными точками, ограничив ими относительно воспроизводимый интервал температур. Нижней фиксированной точкой шкалы Рёмера была температура таяния льда, смешанного с поваренной солью или хлористым аммонием, которая принималась за 0°. Эта точка также была неопределенной, т.к. температура таяния льда зависит от концентрации соли в растворе, эта зависимость была открыта лишь в конце XVIII в., когда была разработана шкала температур и надежный термометр. Температура кипения воды была принята Рёмером за 60°. Эта шкала была прообразом интервальной шкалы температур.
Делались попытки выработать более воспроизводимые варианты фиксированных точек шкалы. Д.Г.Фаренгейт (1686—1736, сконструировал термометр, заполненный ртутью) для определения фиксированной промежуточной точки требовал, чтобы термометр был “помещен в рот или подмышку здорового человека на время, достаточное для получения тепла от тела”; он предлагал также использовать в этом качестве температуру человеческой крови. Анализ текстов Фаренгейта позволяет предполагать, что в качестве стандарта он использовал температуру мужского тела. Стандартная шкала Фаренгейта приписывала значение 32° точке плавления льда, 96° нормальной температуре тела, единицу шкалы – градус, составляющий 1/180 диапазона между точками замерзания (32°) и кипения воды (212°), возможно, по аналогии с угловыми градусами.
В 1742 г. А. Цельсий ввел стоградусную шкалу, в которой за 100° принималась температура плавления чистого льда, а за 0° — точка кипения воды (подробно см. [Ромер, 1984]). К.Линней предложил стоградусную шкалу независимо от Цельсия, причем в его варианте значения шкалы были ревертированы: температуру плавления льда он обозначил 0°, а точку кипения воды — 100° (примерно в это же время это изменение ввел физик из Лиона Христин). Именно по проекту Линнея в Швеции было организовано производство термометров с этой шкалой [Воронцов, 1999; с. 185]. Данная шкала, как и другие, принявшие стандартизованные фиксированные точки, являлась развитой интервальной шкалой. Значения развитых интервальных шкал легко сопоставимы (см. подразд. IV.2.5.3).
Принцип построения температурной шкалы отношений, основанный на втором начале термодинамики, был предложен У.Томсоном (лорд Кельвин) в 1848 г. Введенная в этой шкале точка отсчета (0 K° = -273.16 С°) является экстраполяцией, т.е. обобщением установленной экспериментальным путем закономерности, описывающей “цикл Карно”, и не требует реализации абсолютного нуля [Астров, Шаревская, 1996]. Все значения температурной шкалы Кельвина положительны. Заметим, что установление термодинамических закономерностей обеспечивалось термометрами с интервальными шкалами, а к 1848 году была достигнута температура только - 78 С° (~195 K°), а попытки получить жидкий кислород, азот, водород и др. не достигали успеха.
Значения температуры, оцененные в каждой из шкал, могут быть переведены в значения любой другой шкалы, например, для перевода шкалы Цельсия в шкалу Кельвина используют соотношение K° = C° + 273.16 С°, шкалы Цельсия в шкалу Фаренгейта: F° = (9/5 C°) + 32.
Развитие температурной шкалы продолжается более трехсот лет, из которых около двухсот потребовалось для формирования наиболее мощной шкалы — шкалы отношений, причем практика применения термодинамической теории требует ее постоянного совершенствования.
Развитие знаний об исследуемых объектах может приводить не только к повышению, но и к снижению мощности шкал. Так, считалось несомненным, что длина описывается шкалой отношений, обладающей абсолютным нулем. Однако в квантовой теории поля введено представление о фундаментальной минимальной длине как одной из универсальных физических постоянных. Введение этого предположения вызвано абсурдными результатами применения операции деления для величин, приближающихся к минимальным [Ефимов, 1995]. Фактически это означает, что мощность шкалы длины снижена; она является комбинированной шкалой — шкалой отношений в макродиапазоне, но лишь интервальной шкалой в диапазоне планковских, квантовых величин, и это является результатом разработки представлений о структуре пространства-времени.
Приведенные примеры показывают, что построение шкал - длительный, многоэтапный процесс исследований, в котором формируются и трансформируются теоретические конструкты, разрабатывается аппаратура, развиваются представления о природе измеряемого явления. Типы шкал сменяются в достаточно строгом порядке: от номинальных - к шкалам отношений. Особые трудности представляют проблемы “фиксированных точек” и, особенно, “нуля”, из-за тесной зависимости надежной разрешимости этих проблем от степени развития измерительных процедур, инструментов и теоретических конструктов.
IV.2.6. Генеральная совокупность, выборка
Генеральная совокупность - множество однородных по какому-либо свойству объектов. Для психологии как единой дисциплины наиболее обобщенной генеральной совокупностью является множество объектов, к которым могут быть применены объяснительные принципы (гл. II). Эти объекты обладают специализированными структурами, фиксирующими модели совершенных взаимодействий с миром. Совокупность моделей обладает свойствами субъектности, целостности, активности и пр. (см. разд. II.8). Заметим, что генеральная совокупность, потенциально соответствующая предмету психологического исследования, объединяет (обобщает) субъекты индивидуальные и групповые, социально-психологические. Различные области психологии, парадигмы и конкретные исследования рассматривают как актуальные генеральные совокупности более ограниченные множества объектов, например, включающие людей конкретной возрастной группы (детей дошкольного возраста, подростков, взрослых и т.д.), животных определенного вида, малые группы и т.п.
Объем генеральной совокупности и многообразие включенных в нее объектов таковы, что реальное исследование в силу ограниченности методов и исследовательских ресурсов способно рассмотреть лишь подмножество, выделенное из этого множества по определенному правилу, которое называется выборкой. Иногда термином “выборка” обозначают не множество объектов, а совокупность результатов наблюдений, оценок и т.п. При небольших объемах генеральной совокупности, т.е. в случае возможности полного совпадения выборки и генеральной совокупности само понятие выборки становится излишним. Природа объектов, содержащихся в конечных совокупностях, может рассматриваться как неслучайная, задача исследования в этом случае состоит в точной оценке некоторой константной величины. Суть использования выборок состоит именно в замене потенциально бесконечной генеральной совокупности объектов конечным их набором для того, чтобы дать наиболее правдоподобную оценку свойств генеральной совокупности на основе изучения характеристик объектов включенных в выборку.
Заметим, что проведение комплексных исследований требует формирования нескольких выборок из генеральной совокупности, включающих объекты разных типов, которые характеризуют различные аспекты предмета психологического исследования.
Характеристики выборки для исследования в конкретной области психологии определяется спецификой парадигмы, целями, задачами, гипотезами исследования, а также правилами, которые обеспечивают репрезентативность выборки,представленность в выборке свойств генеральной совокупности, важных для исследования. Репрезентативность выборки оценивает представленность в отобранном для исследования множестве объектов характеристик объектов генеральной совокупности. Установление соответствия выборки и генеральной совокупности представляет сложную проблему, поскольку свойства генеральной совокупности по характеристикам, представляющим предмет исследования, как правило, неизвестны. Строго говоря, для валидного решения задач исследования необходима не бесконечная генеральная совокупность, а точность применения правила включения объектов в выборку и характеристики распределения признака, по которому отбираются объекты. Поэтому для оценки репрезентативности выборки либо эмпирически определяют закон распределения соответствующих характеристик в генеральной совокупности, либо используют априорные, теоретические представления об этом, например, исходя из предположения о нормальности распределения какой-либо индивидуальной характеристики в популяции. Полагают, что если в выборке этот показатель распределен нормально, то выборка репрезентативна. Нерепрезентативные выборки называют смещенными [Кимбл, 1982, с. 146].
Выборки формируются отбором не определенных значений показателей, а объектов. Неадекватное представление о составе генеральной совокупности может привести к включению в выборку объектов, которые к ней не относятся, или не включению в нее объектов, которые входят в ее состав. И та и другая ошибка приводит к смещению состава выборки. Поскольку объекты целостны, то многие их характеристики связаны между собой. Отбирая объект по какому либо показателю, исследователь ограничивает диапазон значений других показателей, и тем самым нарушает репрезентативность выборки.
Репрезентативность выборок обеспечивается способом их формирования. Наиболее точно отражают свойства генеральной совокупности выборки, построенные случайным выбором (рандомизацией), так, что любая из возможных выборок объема n из совокупности N имеет одинаковую вероятность p быть выбранной:
p = 1/(N!/n! (N — n)!).
Такой отбор может быть основан на жеребьевке или использовании таблиц случайных чисел.
Рандомизация - случайный отбор, следует отличать его от беспорядочного отбора. Случайный отбор осуществляется по строгим правилам, а беспорядочный - по неопределенным признакам. Так, случайный отбор учеников в классе предполагает их нумерацию, а затем, используя таблицу случайных чисел по заранее определенному правилу, разделяют класс на две группы, одна из которых включается в выборку. Беспорядочный отбор - произвольное указывание необходимого количества учеников с высокой вероятностью приведет к смещению характеристик выборки - будут отобраны наиболее “заметные”, успевающие или активные ученики. В этом случае возможно приписывание выборке априорных представлений исследователя о ее свойствах. Важно заметить, что репрезентативность выборки определяют по соответствию эмпирического распределения какой-либо характеристики и теоретического представления о ее распределении в генеральной совокупности, но ни в коем случае не подгоняют эмпирическое распределение под теоретическое, произвольно включая объекты в выборку или исключая их.
Важное значение при формировании выборки имеет мотивация испытуемых. Например, если к участию в исследовании привлекаются не случайно отобранные испытуемые, а специально мотивированные — “добровольцы” или “заложники” (т.е. принужденные к участию по каким-либо причинам), группы не будут ни репрезентативными, ни эквивалентными, а произведенные оценки окажутся неизбежно смещенными. Отбор испытуемых по их готовности принять участие в исследовании или по их “доступности” для исследователя - один из наиболее распространенных источников смещения свойств выборки относительно генеральной совокупности. Надо иметь ввиду, что смещения существенно более опасны для исследований, построенных по планам истинных экспериментов, чем по квазиэкспериментальным планам [Кэмпбелл, 1980, с. 147].
Адекватность определения генеральной совокупности цели и задачам исследования, точность следования правилам отбора объектов в выборку (рандомизации) обеспечивает однородность выборки. Если выборка неоднородна, к объектам ее составляющим нельзя применить одни и те же приемы и инструменты измерения, их свойства не могут быть описаны единой закономерностью, получить единую интерпретацию [Толстова, 2000].
Применение рандомизации
(1) позволяет построить однородную выборку, избежать смещений в составе выборки;
(2) снижает влияние побочных переменных;
(3) обеспечивает возможность правильного применения статистики, поскольку статистические критерии требуют именно случайной, однородной выборки, распределения побочных влияний и ошибок по случайному закону;
(4) снижает влияние предубеждений исследователя.
Кроме собственно случайного выбора применяют упрощенные квазислучайные способы отбора - “механический”, “районированный”, “стратифицированный”, “серийный” и др. при которых объекты отбираются не из всей совокупности в целом, а из выделенных по определенным правилам частей совокупности. Для проведения механического отбора всё доступное для отбора множество объектов, разделяется на n равных частей и из каждой части в выборку вводится одна единица, таким образом в выборку входит n объектов. При районированном или стратифицированном отборе группы выделяют в соответствии с “естественными” структурами генеральной совокупности. Это могут быть какие-либо предприятия, социальные группы, популяции и т.д. Эти группы выделяют на основе предположения, что исследуемые показатели более однородны в группах, чем в генеральной совокупности в целом. Эмпирическое подтверждение этого предположения может служить обоснованием применения таких способов отбора. Из каждой группы в выборку включают определенную долю объектов. Например, если предполагается обследовать 10% объектов из всей совокупности, то и из каждой группы отбирают 10% объектов. Важно, что при применении упрощенных способов отбора должен соблюдаться принцип равной вероятности для каждого объекта попасть в выборку.
Наиболее уязвимый способ формирования выборки - использование “естественных”, реальных групп, например, учеников определенного класса [Готтсданкер, 1982, с. 170]. Эти группы, как правило, не случайны по подбору, смещены по многим характеристикам. Исследования, проведенные на таких выборках, обладают низкой внешней и внутренней валидностью (см. подразд. Валидн.), создают угрозу артефактных выводов [Готтсданкер, 1982, с 178].
Репрезентативность и объем выборки. Репрезентативность выборки характеризует не только ее состав, но и объем. Для решения некоторых задач минимальные объемы выборки установлены опытным путем. Так, для оценки ретестовой надежности (см. подразд. Надежн), такой минимум принят за 200 испытуемых [Клайн, 1994]. Очевидно, что необходимый объем выборки зависит от ее однородности: чем выше дисперсия, или какая либо иная оценка разнообразия характеристик объектов, тем больше должен быть объем выборки (см. например, [Пэнто, Гравитц, 1972, с. 405; Ядов, 1999, с. 116]).
Для определения объема выборки, достаточного для получения определенного уровня достоверности статистических оценок характеристик распределений переменных, связей между ними и т.п., можно пользовать статистические таблицы. Например, для проверки гипотезы H0 при p £ 0.05 о равенстве коэффициентов корреляции, рассчитанных для двух выборок, составляющих величины порядка 0.5 и 0.6, с применением z-преобразования Фишера и t-критерия, объем каждой выборки должен превышать 50 объектов [Мюллер и др, 1982, с. 170-175]. Исходя из планируемых объемов выборок, можно определить достижимую точность статистических оценок, см. например, таблицу зависимости существенности различий подвыборок от их объема [Ядов, 1999, с. 117].
Существует эмпирически установленное правило, что количество объектов (объем выборки) должен превосходить количество переменных, описывающих эти объекты, как минимум на порядок: если измерения даны в 10 переменных, минимальный объем выборки составит 100 объектов [Дрейпер, Смит, 1987, с. 144] (см. подразд. Данные). Для линейной зависимости между двумя переменными вида
y = b + kx (полная запись: y = bx0 + kx1)
минимальный объем выборки составит 30 объектов, поскольку уравнение включает три переменные (у, x0, x1). Заметим, что для квадратической и кубической зависимостей минимальное количество объектов составит соответственно 40 (у, x0, x1, x2) и 50 (у, x0, x1, x2, x3).
Следует учитывать, что увеличение объема смещенной выборки не предотвращает получение артефактных результатов, напротив, чем больше объем такой выборки, тем больше вероятность того, внешняя валидность исследования пострадает, а выводы быдут ошибочными [Кимбл, 1982, с. 146].
Репрезентативность и состав выборки. Для районированных и стратифицированных выборок репрезентативность обеспечивается пропорциональным представительством районов и страт только в случае однородности генеральной совокупности. Пропорциональность нарушается, если свойства районов существенно различны. Так, общенациональная выборка ФРГ, используемая для социологических опросов, включала 2000 респондентов, а после присоединения пяти земель Восточной Германии (22% населения), весьма отличающихся от 10 западных земель, выборка была увеличена до 3500 респондентов (т.е. не на 22%, а на 75%). Важно, что для выборок, построенных этими способами, репрезентативность всей выборки достигается адекватностью объема каждой группы. Занижение или завышение представительства какой-либо одной группы может нарушить репрезентативность всей выборки и привести к артефактным результатам иследования. Если предполагается, что тест, должен быть применим к испытуемых трех различающихся групп, то репрезентативная выборка должна включать по 100 представителей от каждой из этих групп, а 300 представителей одной из них не будет репрезентативной выборкой [Клайн, 1994, с. 170].
В длительных исследованиях с многократными оценками (тестированием) групп может происходить изменение состава выборки за счет выбывания испытуемых (“experimental mortality” [Кэмбелл, 1980, с. 46]). В зависимости от причин выбывания, оно может приводить к серьезным артефактам. Например, при исследовании развития мотивационной сферы у студентов результаты могут существенно переоценивать темп такого развития, поскольку все слабо мотивированные студенты либо оставят учебу, либо будут отчислены (ср. [Кэмпбелл, 1980, с. 62]). Сокращение объема может приводить к существенному смещению выборки, которое не всегда можно компенсировать просто удалением выбывших испытуемых из обработки на всех этапах исследования, включая самые ранние, так как в результате такой компенсации выборка уже в исходном состоянии будет смещенной. Неравномерность выбывания испытуемых в контрольных и экспериментальной группах может приводить к их существенной неэквивалентности.
Подбор контрольных групп. Планирование эксперимента или квазиэксперимента с высокой степенью контроля требует формирования нескольких групп исследуемых субъектов. Такие группы должны быть однородными и уравненными по всем переменным, кроме одной - составляющей предмет сопоставления. Так, для изучения соотношения генетических и средовых факторов при формировании индивидуальности могут быть отобраны однородные группы испытуемых, различающихся по одной переменной, оценивающей степень генетической общности: (1) монозиготных, (2) дизиготных близнецов, (3) сиблингов*, (4) полусиблингов, (5) испытуемых, находящихся в двоюродном родстве (кузенов), (6) их родителей, (7) лиц, гарантированно не являющихся родственниками между собой и с испытуемыми, включенными в перечисленные группы. Это деление должно быть дополнено разделением на группы по общности средовых характеристик (близнецовой, сиблинговой, родительско-детской, расширенной семейной — см. подробно в работе [Григоренко, 1998]). Заметим, что объектами изучения, включенными в состав этих выборок не обязательно должны быть люди. У животных значительно легче контролировать степень родства и формировать из них эквивалентные группы. Использование “чистых линий” животных может уравнять группы по генетическим и поведенческим характеристикам, хотя в этом случае невозможно применение стандартных психологических тестов.
Все сопоставляемые выборки должны быть репрезентативны (по отношению к генеральной совокупности) и уравнены, эквивалентны по всем характеристикам, кроме воздействия независимой переменной. Эквивалентность групп может быть достигнута различными способами:
(1) рандомизацией, т.е. случайным подбором; строго говоря, только группы, отобранные способом рандомизации могут быть эквивалентными;
(2) подбором пар, члены которых контрастны по значениям переменной, определяющим сравниваемые группы; полагают, что этот способ достижения эквивалентных групп “применяется лишь в силу устойчивой и дезориентирующей традиции”, он пригоден лишь как дополнение к рандомизации, но замена им рандомизации недопустима даже в квазиэкспериментальных планах [Кэмпбелл,1980, с. 68, 135];
(3) различными комбинациями рандомизации и подбора пар; Кэмпбелл считает эффективным прием “образование блоков”: испытуемых подбирают по парам, “тщательно уравненные по показателям предварительного тестирования или по связанным переменным”, а затем в случайном порядке одного из них включают в экспериментальную, а другого - в контрольную группу [Кэмпбелл, 1980, с. 68, 135]. Готтсданкер предлагает использовать случайный отбор групп с выделением слоев. (выделение слоев - вариант стратифицированного, серийного отбора, см. выше): всю популяцию разделяют на “слои” по какой-либо характеристике, и из каждого слоя случайно отбирают равное число представителей. По оценке Готтсданкера этот прием обеспечивает очень хорошую внешнюю и внутреннюю валидность [Готтсданкер, 1982, с. 176, 178].
Формирование групп по какому-либо контрастному признаку, например, групп, различающихся по полу, неизбежно приводит к систематическому смешению независимой переменной (пол) с сопряженными индивидуальными характеристиками [Готтсданкер, 1982, с. 164]. К артефактным результатам (нарушению внутренней валидности) приводит формирование групп по признаку предельно больших и малых значений какой-либо характеристики, так, что в одну группу входят испытуемые с низкой, а в другую - с большой выраженностью признака. В этом случае весьма вероятно, что влияние независимой переменной (условий) будет неэквивалентным в экспериментальной и контрольной группе, что называют “эффектом статистической регрессии” [Кэмпбелл, 1980, с. 134]. Заметим, что такой отбор испытуемых в группы является формальным препятствием применения регрессионого анализа, поскольку нарушено требование нормального распределения признака в выборке.
В квазиэкспериментальных исследованиях, когда уравнять группы случайным отбором или манипулируя составом невозможно, прибегают к “сбалансированным” планам исследования. Это в некоторой степени компенсирует неэквивалентность групп [Кэмпбелл, 1980, с. 139-140].
Важно, чтобы свойства сформированной выборки и групп находились в соответствии с типом выполняемого исследования, и не были ниже необходимого уровня требований. Для исследований, проводимых по плану истинного эксперимента необходимо построение полностью рандомизированной, репрезентаттивной выборки, несмещенных эквивалентных групп. Это весьма трудоемкая система процедур, но любое отклонение от правил формирования выборки может привести к нарушению валидности эксперимента и к ошибочным выводам. Точное выделение оснований эквивалентности и контраста групп и подгрупп — необходимое условие выявления закономерной связи независимой и зависимых переменных. В то же время любой отбор может быть источником нарушения репрезентативности выборки, т.е. ее соответствия генеральной совокупности. Если обеспечить рандомизацию выборки и эквивалентность групп не удается, то, независимо от строгости выполнения всех остальных процедур планирования, исследование может быть лишь квазиэкспериментальным или доэкспериментальным. Если исследование может быть проведено только на естественных группах, или невозможно формирование контрольной группы, оно не может выйти за рамки доэксперимента. Важно заметить, что построение выборки в соответствии со всеми основными требованиями повышает валидность исследования, снижает вероятность артефактных выводов, независимо от того, проводится это исследование по плану истинного эксперимента, квазиэксперимента или доэксперимента (см. подразд. Типы исслед).
IV.3. Соответствие исследования научным стандартам
В качестве эталона для оценки планирования и проведения исследования используют понятие “безупречный эксперимент”. Термин “эксперимент” применен в данном случае, поскольку это наиболее развитый тип исследования, позволяющий контролировать наиболее строгим образом наибольшее число факторов, влияющих на достоверность вывода.
Различные стороны планирования исследования, характерные для “безупречного эксперимента”, раскрываются в понятиях: (1) идеального эксперимента, в котором устранены все источники систематических смешений*; (2) бесконечного эксперимента, в котором бесконечное число проб применяется к бесконечно большому числу испытуемых, что позволяет учесть влияние бесконечного количества побочных переменных — источников несистематической изменчивости; (3) эксперимента полного соответствия, обладающего абсолютной внешней валидностью и являющегося исчерпывающей копией реальности. По определению Р. Готтсданкера, “все три вида безупречного эксперимента нереальны. Идеальный эксперимент является невозможным, эксперимент полного соответствия — бессмысленным, а бесконечный — тем и другим вместе” [1982, с. 54]. Добавим, что эксперимент полного соответствия не может быть точной моделью реальности, “абсолютной” теоретической конструкцией, поскольку не может выйти за пределы знания об изучаемом объекте, предвосхищаемого гипотезами (см. разд. II.8, IV.2.3, IV.2.2.3). Однако эти идеализированные модели указывают на наиболее “уязвимые”, подлежащие строгому контролю аспекты планирования реального исследования, которые содержат угрозы систематического смешения переменных, влияния несистематических факторов, использования неадекватных моделей изучаемой реальности.
Оценка соответствия исследования стандартам и нормативам дается в терминах репрезентативности, надежности и валидности. Репрезентативность - наиболее общая, фундаментальная характеристика исследования; эта характеристика может рассматриваться как основание надежности и валидности исследования; надежность, в свою очередь, является предпосылкой валидности. Нарушения требований репрезентативности, надежности и валидности приводят к неверным, артефактным выводам.
Репрезентативность, надежность и валидность применимы для оценки исследования любого типа — доэкспериментального, квазиэксперимента и истинного эксперимента.
IV.3.2. Репрезентативность
Репрезентативность (от англ. representativeness, to represent - представленность, представлять) - характеристика соответствия теоретических, инструментальных, эмпирических составляющих исследования свойствам изучаемой реальности. Оценка репрезентативности показывает, насколько точно представлены свойства предмета изучения в данном исследовании, насколько точно и полно могут представить его свойства используемые конструкты и методики и т.д.
Репрезентативностью должны обладать все используемые в исследовании теоретические конструкты, приемы выделения и описания переменных, методические приемы, алфавит описания объекта изучения, выборка испытуемых и т.д. Репрезентативность - наиболее обобщенная характеристика всех составляющих исследования, низкий уровень репрезентативности исключает высокую надежность и валидность исследования и в этом смысле является их основанием и предпосылкой.
Р.Готтсданкер определяет репрезентативность как степень приближения оцениваемого исследования (эксперимента) к безупречному эксперименту (см. разд. СООТВЕТСТ). Поскольку безупречный эксперимент - лишь идеализированная модель исследования и в полной мере принципиально нереализуем, то реперзентативность исследования определяют, сравнивая его план (и другие составляющие) с образцовыми (см. [Готтсданкер, 1982, с. 55-56; 441-442]).
Репрезентативность выборки - весьма развитое понятие; его особенности, приемы достижения и контроля высокой репрезентативности выборки подробно рассмотрены в подразд. ВЫБОРКА.
Репрезентативность методики — соответствие приемов исследования свойствам изучаемого объекта (см. также [Корнилова, 1997]). Репрезентативность методики может позволить приблизиться к описанию объекта исследования в полноте его предполагаемых свойств. Чем выше репрезентативность методики, тем больше ее возможности в реконструировании изучаемой реальности (см. раздел МЕТОД). Эта характеристика методики нарушена, если ее применение навязывает объекту артефактные свойства (см. подразд. АРТЕФАКТ) или она не пригодна для фиксации важных показателей. Эту характеристику методик психологического исследования можно оценить косвенно, по соответствию основным объяснительным принципам (см. гл. II). В понятие репрезентативности методических средств входит также сооответствие применяемых способов обработки реальной структуре данных - шкалам, в которых они измерены, особенностям распределения, объему выборки и т. д. (см. подразд. СТАТИСТИКА).
Репрезентативность переменных - соответствие независимой, зависимых, дополнительных переменных харктеристикам исследуемого объекта и условиям, создаваемыми (воспроизводимыми) в данном исследовании, а также в других, как проведенных, так и возможных. Репрезентативность переменных - важный фактор в формировании внешней валидности исследования (см. подразд. ВН ВАЛ).
Репрезентативность результатов— соответствие свойств изучаемого объекта, выявленных в конкретном исследовании его теоретически предполагаемым или представленным в популяции свойствам, а также множеству результатов, полученных в других исследованиях. Очевидна связь данного понятия с понятиями внешней валидности и надежности (см. подразд. ВАЛ. НАДЕЖН). Этот вид репрезентативности доказывается сопоставлением интерпретаций, развиваемых в данном исследовании, с альтернативными интерпретациями (см. разд ПУБЛ.ОБСУЖД). Репрезентативность результатов обеспечивается точным соответствием цели, задач, плана исследования, методических приемов сбора и обработки данных.
IV.3.3. Надежность
Надежность - одна из наиболее важных характеристик результатов исследования и исследовательских инструментов, оценка их независимости от случайных, несистематических факторов (см. смешение*; подразд. IV.3.2.3). Чем шире пределы вариативности несистематических факторов, в которых сохраняется устойчивость результатов, тем выше их надежность.
Понятие “надежность” употребляется в двух значениях.