Источники систематических ошибок
Труднодоступные единицы присущи любому социологическому исследованию. Однако причины их появления и основные характеристики до сих пор не были предметом специального изучения. В статье они рассматриваются как возможный источник появления систематических ошибок в ходе реализации исследовательского проекта.
Ошибки, возникающие на этапах сбора и обработки социологической информации.Организаторы любого исследования предпринимают ряд мер, нацеленных на устранение ошибок репрезентативности и регистрации ответов респондентов. В литературе достаточно полно рассмотрены природа, характер и взаимосвязь подобных ошибок, намечены общие пути их устранения. Выделив два основных класса ошибок — систематические и случайные, — мы не будем задерживать внимание читателя на изложении их сути. Остановимся на источниках и причинах возникновения систематических ошибок. Они наиболее опасны, поскольку приводят к довольно значительным смещениям результатов исследования.
Источники таких ошибок — нарушение правил процедуры исследования, неадекватные способы формирования выборочной совокупности, методы сбора и расчета данных. И хотя систематические ошибки можно предсказать, их трудно устранить. Перечислим основные причины возникновения систематических ошибок репрезентативности.
Преднамеренное (или непреднамеренное) отступление от принципов случайного отбора при формировании выборочной совокупности. Часто эти смещения (отступления) вызваны трудностями учета, иногда слабой информированностью социолога об объекте исследования.
Ошибки, обусловленные предшествующим опытом исследователя. С такого рода ошибками мы сталкиваемся при проектировании выборки и формировании ее моделей.
Замена единиц выборки другими единицами, которые не попали в выборочную совокупность. Это случается: а) если интервьюер не застает нужного ему человека дома и опрашивает кого-нибудь из членов семьи или соседа; б) если респондент не желает сообщить необходимую информацию, в результате чего интервьюер беседует с лицами, которые не попали в число респондентов, но выразили согласие ответить на все вопросы.
Неполный охват опросом единиц выборочной совокупности в случаях, когда по тем или иным причинам исследователь не застает респондента на месте и не предпринимает повторных попыток получить информацию у данного лица. Неполный охват часто происходит и потому, что у интервьюеров не хватает времени для опроса.
Практическая невозможность точно реализовать первоначальный план выборки (отказ респондентов участвовать в опросе, неверно указанные адреса респондентов, естественная смертность и подвижность населения и пр.).
Личность интервьюера, его социально-демографические характеристики, профессиональная подготовка также могут быть источниками возникновения систематических ошибок.
Ошибки регистрации подразделяются на систематические и случайные. Случайные возникают при заполнении социологической документации, измерении отдельных показателей, подсчете и т.д. Они описываются большим количеством факторов, эффективность действия которых столь незначительна, что их нельзя полностью выделить и учесть в отдельности. Поэтому случайную ошибку можно рассматривать как суммарный результат воздействия таких факторов. Случайные ошибки нельзя полностью исключить из результатов измерения, однако при описании массовых явлений они не представляют серьезной опасности, так как в обобщающих показателях взаимопогашаются.
Систематические ошибки регистрации вызываются вполне определенными причинами: неправильным выбором видов отбора или обработки первичных данных, неточностью инструментария, воздействием некоторых внешних факторов и т.д. Но поскольку причины, вызывающие систематические ошибки, в большинстве случаев определены, их, в принципе, можно частично или полностью исключить.
Между систематическими ошибками регистрации и случайными ошибками репрезентативности существует определенная связь, которая весьма значима. С увеличением объема выборочной совокупности случайные ошибки репрезентативности, как правило, уменьшаются, а систематические ошибки регистрации растут. Поэтому важно, чтобы при определении объема выборки величина ошибок была минимальной.
Одной из причин появления в исследовании систематических ошибок является наличие в генеральной совокупности труднодоступных единиц наблюдения. Под ними подразумевают респондентов, которые не могут (длительные командировки, болезни и т.д.) или не хотят принять участие в опросе. Влияние указанного фактора на репрезентативность заключается в том, что труднодоступные единицы некоторыми своими характеристиками могут отличаться от остальной исследуемой совокупности. Поэтому проблема повышения надежности результатов опросных методов заключается в описании характеристик труднодоступных единиц. Зная их, легче организовать корректировку собранных данных (см. таблицу).
Уменьшить влияние указанного фактора с помощью увеличения объема выборки нельзя, так как при этом возрастает число труднодоступных единиц, а вместе с тем и степень смещения результатов.
Максимальная величина возможной систематической ошибки зависит и от доли признака в генеральной совокупности. Предположим, что 154 человека (69% опрошенных) регулярно выполняют плановые задания на 110% и более. И предположим также, что 38 (15,2%) неопрошенных и отказавшихся от опроса или не выполняют плановые задания, или незначительно их перевыполняют. Тогда доля перевыполняющих план на 110% и более составит уже не 69%, а 61,6% (объем выборки увеличился на 38 человек, а количество перевыполняющих план осталось прежним). Следовательно, систе-
матическая ошибка составит 7,6%. Если же, например, 38 респондентов будут перевыполнять план на 110% и более, то их доля в выборке составит 76,8% (154+38= 192). Систематическая ошибка уменьшится и будет равняться 7,4%. Если же распределение неопрошенных и отказавшихся от опроса респондентов станет более равномерным, то систематическая ошибка выборки существенно уменьшится.