Тотальный контроль качества: узкая и широкая трактовка валидности
Когда сталкивается множество противоречивых версий по одному вопрос; и все они имеют право на существование, поскольку отражают научную прак тику, способы бытования научного термина, различия в подходах, существу ющие между разными школами, направлениями и даже национальными тра дициями, ожидать появления общего мнения нельзя. Оно в принципе невоз можно. И не только потому, что научная практика постоянно расширяете икстарым дефинициям прибавляются новые. Приведение мнений к едином; знаменателю, как правило, означает сужение и обеднение содержания исход ного понятия. Ничего страшного нет в том, что валидность, как и многи иные социологические категории, трактуют по-разному. Применяя это слов! к разным ситуациям, социологи и психологи неявно говорят: без него на? обойтись нельзя, оно очень важно для науки, оно помогает прояснить мно гие запутанные явления. Как только будет наведен порядок в социологичес ком хозяйстве, а за термином валидность закрепят раз и навсегда данную фор
Trochim W. The Research Methods. Knowledge Base: Introduction to Validity //http://trochim.human.comell.edL
kb/introval.htm
An Online Textbook/ By G. David Garson. — North Carolina State University// http://www2.chass.ncsu.edi
garson/pa765/validity.htm
Bernard H.R. Research methods in anthropology. Qualitative and Quantitative Approaches. L.: Altamii
Press, 1994. P. 37-39.
мулировку, он как методологическая проблема умрет. Сужение в данном случае означает смерть. Придется придумывать новые понятия к разнообразным случаям жизни.
Но если невозможно добиться порядка, то как-то обобщить беспорядок все же можно. Первое, что приходится констатировать, — это наличие двух смыслов — понимание валидности в широком и узком смыслах. В узком смысле валидность ограничивают двумя конкретными процедурами — операционали-зацией и измерением. Большинство авторов связывают валидность именно с ними. Правда, до сих пор не ясно, как соотносятся между собой операциона-лизация и измерение. Одни специалисты видят в них два взаимосвязанных, но автономных процесса, другие включают операционализацию в измерение как часть в целое, третьи поступают прямо наоборот, считая, что измерение — более широкое понятие. За каждым подходом скрывается известная аргументация, поэтому отказаться от него не так просто. С нашей точки зрения, измерение как количественная процедура приписывания числовых мер (показателей) качественным явлениям, отображенных в социологических переменных, — всего лишь часть более общего процесса операционализации. Последняя включает помимо измерения (числовой процедуры) еще ряд шагов, методов, процедур, которые не сводятся к измерению, например переход от абстрактного к конкретному. Таким образом, валидность — это характеристика одновременно и операционализации, и измерения, но эти понятия связаны между собой как часть и целое.
Это очень важный тезис. Зафиксируем его — измерение выступает поздним этапом операционализации, так сказать, ее завершающей стадией. А на ранних фазах идет углубленная работа в самом теоретическом теле программы исследования: активно трудятся все ее винтики и механизмы. Перед тем как явиться в своем анкетном обличий, программа должна пройти длительную черновую работу — выявить все ошибки и нелепости. В противном случае ошибки, не упрежденные на теоретической стадии, не только проникнут в методический инструментарий, но и повлекут за собой новые. Возникнет эффект снежного кома: ошибки одна за другой будут порождать все новые отклонения, в результате научный отчет, который социолог представляет заказчику, будет напоминать комедию ошибок.
В широком смысле валидность возникает на стадии обоснования теоретической модели предмета исследования, когда не заходит речь ни об операционализации, ни об измерении. В широком понимании валидность описывает правильность логического построения теории, продуманность ее понятийного каркаса, отсутствие логических ошибок.
Иными словами, в узком смысле валидность касается измерения, шкал, анкетных вопросов, а в широком — построения самой теории.
Если валидность настолько вездесуща, то ее впору сравнить с отделом технического контроля, который на предприятии проверяет качество выпускаемой продукции. Ныне контроль качества не ограничивается отделом или цехом, его осуществляют на всех стадиях производства и в нем участвует весь персонал — от рабочего до директора. Всеобщий контроль качества продукции на производстве, а также контроль послепродажного бытия товара, вплоть до потребителя и гарантийных мастерских, получил название тотального контроля качества. Думается, что валидность в чем-то напоминает такую систему контроля. Современные менеджеры знают, что затра-
ты на нее очень высоки, но зато и конечный эффект велик. Главное — качественным товаром доволен потребитель, от него идет все меньше рекламаций, а имидж фирмы повышается. Современные социологические фирмы, проводящие опросы, в том числе политические и маркетинговые, озабочены не столько скоростью проведения исследования и суммой гонорара, сколько его качеством и своей репутацией. Острая конкуренция на опросном рынке заставляет социологов заботиться о качестве продукции и вводить тотальный контроль, стало быть, значение валидности не уменьшается, а возрастает.
Рис. 65. Операционализация и измерение
Проблема валидности процедуры операционализации, т.е. правильное™ (адекватности) перевода абстрактных категорий в измеряемые при помоиц количественных величин «понятия» и «признаки», относится к числу наиважнейших в социологической науке (рис. 65).
Измерение — это процесс наблюдения и фиксации данных, которые со браны в ходе исследования. В связи с этим возникают два вопроса: 1) как мь понимаем те фундаментальные идеи, на которых построено наше измерение' 2) как мы понимаем различные виды измерения, на котором построено со циальное исследование?
Ответ на первый вопрос предполагает анализ уровней измерения, а имение номинальную, ординальную, интервальную и ранговую шкалы. В связи < этим встает проблема надежности измерения (reliability).
Ответ на второй вопрос требует рассмотрения четырех проблем измере ния: 1) конструирование и применение вопросника, используемого в выбо рочном обследовании, в частности в анкетировании и интервью; 2) рассмот рение методов построения тех шкал, которые будут использоваться в изме рении социальных явлений; 3) качественное исследование, предполагают^ обзор широкого круга нецифровых способов получения данных; 4) ненавяз чивое (unobtrusive) измерение, представляющее большой спектр методов из мерения, которые прямо не связаны с контекстом исследования.
D ВНЕШНЯЯ ВАЛИДНОСТЬ
Валидность принято подразделять на внешнюю и внутреннюю. Однозначных критериев того, что относить к внешней, а что к внутренней ва-лидности, в литературе нет. В одном случае внешнюю валидность выносят за сферу программы исследования, полагая, что она больше совпадает с проблемой репрезентативности данных — на какой круг людей распространяются ваши данные. В другом случае внешняя валидность помещается в область подготовки программы и располагается на стыке между теорией и инструментом. Внутренняя валидность всегда относилась только к программе исследования.
На наш взгляд, и в этом мы солидарны с Д. Грейсоном и У. Трочимом", понятие внешней валидности {external validity) указывает степень правомерности, с которой полученные в социологическом исследовании выводы можно распространять на других людей, не попавших в выборочную совокупность. Опросив 50 или 100 студентов-юристов третьего курса одного из столичных вузов, социологи спешат обобщить полученные закономерности не только на всех столичных юристов, но часто — на всех студентов-гуманитариев либо на всех студентов вообще. Обычно никакого злого умысла в том нет: ученому кажется, что так ведут себя все студенты, например, интересуются не столько учебным процессом, сколько дополнительным заработком и перспективой дальнейшего трудоустройства. Возможность обобщить полученные на небольшой выборке результаты на весь массив (всю популяцию студентов) ему подсказывает здравый смысл, личные наблюдения и жизненный опыт. Может быть, так оно и есть. С обыденной точки зрения здесь никаких нарушений нет, обобщение вполне правомерное. Но является ли оно законным с позиций строгой методологии?
Ответ на этот вопрос может дать только понятие внешней валидности вашего исследования. Она показывает границы, за которыми теряет научную значимость ваша попытка распространить результаты своего исследования, полученные на небольшой выборке, на других людей, другие объекты, другие явления, внешне похожие на изученные вами. Внешняя валидность отвечает на вопрос: на какой массив людей (популяцию) можно распространить полученные в вашем исследовании закономерности, является ли ваша выборка типичной? Проблема распространения выводов на генеральную совокупность, сделанных на малой выборке людей, касается не только людей или мест их проживания, но и времени. Распространяются ли ваши закономерности на рабочую молодежь крупных городов, живущую в 60—90-е гг., или они ограничиваются узкими рамками 70-х гг.? Если выборочная совокупность построена по всем правилам статистики, если респонденты подбирались в соответствии с требованиями теории вероятности, то беспокоиться за внешнюю валидность вам не следует. Но если они нарушены, то ошибки лучше устранить на ранних стадиях исследования. В противном случае вы получите инвалида, а не доброкачественную программу исследования.
An Online Textbook/ By G. David Garson. — North Carolina State University//http://www2.chass.ncsu.edu/ garson/pa765/validity.htm; Trochim W. The Research Methods. Knowledge Base: Introduction to Validity // http://trochim.human.cornell.edu/kb/introval.htm
Синонимами внешней валидности {external validity) в западной литературе выступают понятия applicability, generalisability, relevance, transferability. Все они определяют степень, в которой результаты исследования применимы для ситуаций, отличных от тех, в которых оно выполнялось.
ВНУТРЕННЯЯ ВАЛИДНОСТЬ
Кроме внешней валидности существует еще внутренняя валидность. В ее понимании также не достигнуто единого взгляда: одни ученые отождествляют ее с конструктной или конструктивной валидностью (construct validity), другие полагают, что это самостоятельный крупный вид валидности, в рамках которого конструктивная валидность выступает всего лишь разновидностью.
Если обратиться к существу вопроса и постараться разобраться в природе внутренней валидности, то вот что выясняется. Еще раз проведем параллель между инвалидностью и нетрудоспособностью. Если человек не может полноценно трудиться потому, что у него не хватает широких знаний для овладения другими профессиями, а своя специальность прикрыта, то речь идет о внешней нетрудоспособности и внешней инвалидности. Иное дело, когда у человека органический порок, например он глухонемой или вместо руки у него протез. Он не может полноценно трудиться в силу своих конструктивных (конструкционных, конструктных — словом, как хотите) недостатков. В социологии такую инвалидность называют внутренней.
Валидность понятий.Представителям социальных наук (политологам, социологам, психологам) затрудняет жизнь то обстоятельство, что им приходится пользоваться понятиями, которые трудно увидеть, еще труднее опе-рационализировать и измерить. Физический объект видим, осязаем и даже передвигаем на другое место, он обладает длиной и шириной, весом и т.д. Но такие понятия, как власть, демократия или солидарность, непросто представить количественно, выразить на языке точных измерений. Социальным ученым приходится пользоваться показателями, лишь косвенно соответствующими понятиям, которые они представляют. В таком случае «всегда существует опасность, что выбранные показатели будут неадекватно отражать понятия, которые мы хотим с их помощью измерять. Для обозначения степени соответствия измерений понятиям, которые эти измерения должны отражать, используется термин "валидность"»12. Понятие считается валидным в том случае, когда оно: а) включает весь набор реальных фактов, явлений и объектов, которые охватываются им (список эмпирических референтов по возможности должен быть исчерпывающим); б) включает только тс факты и явления, которые относятся к этому понятию (не должно быть лишнего, не относящегося к сути дела). Предположим, вы включили в анкету вопрос о роде деятельности респондента и в список альтернатив а) не вклю чили сферу управления, хотя упомянули производство и сервис; б) не забыли производство, сервис и управление, но включили также домашнее хозяй ство и огородничество. Вот так все запутав, вы получили инвалида.
Другой пример. Вы решили оценить эффективность работы местной по ликлиники. Кого надо опрашивать — работников поликлиники, ее пацин
Мангейм Дж.Б., Рич Р.К. Политология. Методы исследования. М., 1997. С. 100.
тов, жителей микрорайона, местные органы власти или пользоваться документальной статистикой? От правильного выбора зависит конечный успех. В одном случае вы получите инвалида, в другом —дееспособный инструмент исследования.
Рис. 66. Оценка эффективности работы поликлиники зависит от выбора опрашиваемых
Таким образом, первый шаг в валидизации теоретической части программы касается отдельных понятий, проверки каждого из них по критериям: а) полноты охвата объектов, признаков, явлений; б) уместности этих признаков и явлений, их соответствия существу дела. Назовем это первой фазой установления внутренней валидности. Она требует корректного проведения процедуры операционализации.
Валидность выводов.Внутренняя валидность затрагивает не только отдельные понятия, но и их цепочки. Теоретическое предположение о том, что на рост производительности труда влияет освещение или шум в цехе, может не подтвре-диться лишь потому, что вы не учли действия скрытого фактора, например, присутствия в испытательной комнате наблюдателя или социально-психологического климата в бригаде. Такая ситуация возникла в знаменитых хоторнских исследованиях, проведенных Э. Мэйо в 1927—1932 гг. в американской корпорации «Вестерн электрик компани», и с тех пор известна под названием «хоторн-ского эффекта». Д. Грейсон, автор учебника по математической статистике, приводит этот пример для иллюстрации внутренней валидности. Беда исследователей заключалась в том, что они не учли действия скрытой переменной. Они полагали, что освещение — независимая переменная, а производительность труда — зависимая. Если изменить первую, скажем улучшить освещение, то измениться и вторая — возрастет продуктивность. На самом деле последняя то возрастала, то падала, хотя освещение все время улучшали. Много позже критики хоторнских экспериментов доказали, что на изменение производительности влияло присутствие в комнате ученого-наблюдателя, с которым испытуемые девушки все время переговаривались, переглядывались, который создавал
более комфортную психологическую обстановку. Поскольку ошибку разглядели не авторы эксперимента, а его критики, то под сомнение был поставлен успех в целом. В 1960—80-е гг. в США раздавались обоснованные сомнения в том, что хоторнские эксперименты произвели подлинную революцию в менеджменте, выдвинув на первый план человеческий фактор. Так вот одна ошибка может повлиять на все исследование.
Такова вторая стадия внутренней валидизации. Она касается не отдельных атомов, а целых молекул, не понятий и переменных, а пропозиций, т.е. некоторых предложений-формул, в которые вместо неизвестных можно подставить конкретные переменные (например, освещение и производительность) и благодаря заложенной в пропозиции логической связке получить утверждение о причинно-следственной связи между двумя явлениями. В рассмотренном примере таковым выступает утверждение о том, что освещение ведет к повышению производительности труда. Каждое по отдельности понятие-переменная, а именно освещение и производительность труда, в хо-торнских экспериментах были операционализированы (сведены к более конкретным понятиям), а затем измерены (этим конкретным понятиям-признакам были приписаны точные единицы измерения и шкалы, например, производительность труда следовало измерять в количестве соединений двух электродов в минуту, ранжированных, условно говоря, от 2 до 10) очень корректно. Некорректным оказалось их соединение, т.е. социологическое суждение о причинно-следственном влиянии освещения на производительность. Где-то в недрах ситуации притаился невидимый фактор, присутствие в комнате экспериментатора, который испортил все дело.
Если бы Э. Мэйо и его команда учли влияние невещественных факторов на рост производительности труда (достижение современной индустриальной психологии), они, естественно, не допустили бы нелепой ошибки. Скрытые факторы, роль психологических переменных известны сегодня каждому студенту. Но дело в том, что именно гарвардские ученые и лично Э. Мэйо открыли ту самую индустриальную психологию и создали доктрину человеческих отношений, которые изучают сегодня студенты. Открытие произошло во второй половине знаменитых экспериментов, когда Э. Мэйо учел свои ошибки, внес необходимые коррективы в программу исследования, переделал весь инструментарий. Улучшение программы или, если хотите, ее вали-дизация привели гарвардских социологов и психологов к мировому открытию. Такова цена валидности в современной науке.
♦ ♦ ♦
Итак, внутренняя валидность, в отличие от внешней, касается не генеральной совокупности, не количества людей, на которых распространяются полученные выводы, а построения самой теории, процедуры разработки этих выводов. Она отвечает на вопрос о том, насколько точны и аккуратны используемые вами понятия, измеряют или описывают ли они те явления, для которых вы их предназначили. Может так случиться, что понятие хорошее само по себе, но к этому случаю оно не подходит. Оно может охватывать совсем иной круг реальных событий либо только отчасти охватывать (а значит, грамотно предсказывать и объяснять) те события, которые социолог намеревается изучить. Тогда возникает вопрос: а то ли вы измеряете, что собирались измерить?