Примеры паспортички выборки

Лекция 5. Контроль и ремонт выборки.

Вопросы:

1. Контроль и способы ремонта выборки

2. «Паспортичка» выборки

Литература:

Добреньков В.И., КравченкоА.И. Методы социологического исследования. – М. : ИНФРА-М, 2004. С. 81-92.

Горшков М.К., Шереги Ф.Э. Прикладная социология: учеб. пособие для вузов/ М.К. Горшков и др. – М. : Центр социального прогнозирования, 2003. – С. 157-163.

Рабочая книга социолога/ Под ред. Г.В.Осипова и др. – 3-е изд. - М. : 2003. – С.200-218.

Социологическая энциклопедия : В 2 т. / Национальный нацинально-общественный фонд / Руководитель научного проекта Г.Ю Семигин; Главный редактор В. Н Иванов. – М. : Мысль, 2003. – Т.1 – 694 с.; Т.2 – 863 с.

Понятия:контроль выборки, коррекция выборки, «паспортичка» выборки, ремонт выборки, репрезентативность выборки

Контроль и способы ремонта выборки

Качество социологической информации может снизить множество фак­торов: неправильно сформулированные анкетные вопросы, не так выбран­ный метод исследования, пропущенные ответы в анкетах, нечетко сплани­рованная выборка и др. Практика эмпирических исследований — зарубежных и отечественных, фундаментальных и прикладных — свидетельствует, что ошибки, в том чис­ле при составлении выборки, встречаются почти в каждом исследовании. Такого рода смещения могут быть значимыми или незначимыми.

Контролем выборки будем называть процесс научного сравнения генераль­ной и выборочной совокупностей, выявление степени их расхождения, обна­ружение причин отклонения и разработку возможных способов устранения погрешностей. В узком смысле — это уравнивание выборочных и генеральных распределений социально-демографических характеристик респондентов.

Под ремонтом выборки надо понимать сам процесс устранения погреш­ностей, т.е. расхождения двух совокупностей, теми способами, методами и инструментами, которые предлагает методическая наука.

Таким образом, второй прием выступает практической реализацией пер­вого, аналитического, а оба они составляют два обязательных этапа прове­дения социологического исследования. Часто контроль выборки употребляют в расширенном значении, включая в него также ремонт выборки. В этом случае говорят о широком понимании ре­монта выборки как первичной статистической обработки данных, включаю­щей коррекцию:

а) выборочной совокупности;

б) распределений социально-демографических характеристик респондентов;

в) резко выделяющихся и про­пущенных ответов, а также взвешивание исходных данных.

Указанные виды коррекции призваны отремонтировать самое главное — выборку исследования, повысить степень ее репрезентативности. Почему это главное? Анкета может быть исключительно интересной, глубокой и содержательной, но запустили ее на плохом массиве, т.е. нерепрезентативной выборке. Усилия всего коллек­тива пошли насмарку, так как цена такой информации почти нулевая. Вот почему в рассматриваемых ниже видах коррекции, даже если они касаются заполнения анкеты и к выборке имеют вроде бы косвенное отношение, фокус внимания один-единственный — выборка.

Основная цель ремонта выборки — повышение качества уже собранной информации. Процедура ремонта выборки включает несколько операций.

Коррекция выборочной совокупности.Далеко не всегда отобранные респонден­ты, по самым разным обстоятельствам, могут или желают отвечать на вопросы. Кто-то заболел или уехал в срочную командировку, другой отказывается по идей­ным соображениям или не способен отвечать в силу умственной недостаточно­сти. Кого-то трудно застать дома, хотя анкетер приходил к нему не единожды.

Возникает проблема замены респондентов, которая может быть решена с по­мощью нескольких методов-, выбор следующего по списку респондента (напри -мер, следующего номера в телефонном справочнике), использование первона­чальной выборки больших размеров и формирование повторной выборки. В пос­леднем случае, если процент ответов оказался намного ниже, чем ожидалось, основа выборки расширяется за счет дополнительных имен, найденных, напри­мер, случайным образом. Самым эффективным способом считается поиск эк­вивалентной замены. Если, к примеру, в вашу выборку попал работающий пен­сионер такой-то национальности и овдовевший, то желательно подыскать ему в качестве замены другого пенсионера сходного возраста, национальности, ов­довевшего и работающего. Нередко подобный способ превращается в трудо- и времязатратное мероприятие. Если список генеральной совокупности невелик и найти замену не удается, следует отказаться от эквивалентного метода и пе­рейти к другому.

Коррекция распределений демографических характеристик респондентов.Если по окончании исследования в паспортичке вашего исследования полу­чилось, что у вас, к примеру, перебор женщин, людей с высшим образова­нием или пожилых людей в сравнении с теми процентными долями, кото­рые они имеют в генеральной совокупности, то можно применить три спо­соба: 1) удалить те группы респондентов, которые оказались представлены в избыточном количестве; 2) доопросить те группы, которые оказались пред­ставленными в недостаточном количестве; 3) математически повысить зна­чение ответов, представленных недостаточно, или снизить — представлен­ных избыточно. Но сначала желательно выяснить, а влияет ли то и другое на содержание ответов. Может быть, все можно оставить и так.

Взвешивание исходных данных— математический способ повышения или понижения значения ответов конкретной группы респондентов (например, незамужних сельских женщин в возрасте от 30 до 45 лет). Взвешивание означа­ет присваивание каждому респонденту определенного веса (коэффициента, на который нужно умножить все мнения-ответы одного или группы респонден­тов ради восстановления репрезентативности). По мнению А. Балабанова, взве­шивание — единственный способ восстановления репрезентативности в панель­ных исследованиях без потери точности. Поскольку способов взвешивания су­ществует очень много, то перед социологом возникают достаточно непростые методологические проблемы, которые без соответствующей подготовки и зна­ний решить невозможно. Весовые коэффициенты можно определять по-разно­му, а сам процесс присвоения коэффициентов почти невозможно контролиро­вать со стороны, другим исследователям. Самый простой способ — численность конкретной социально-демографической группы, например подростков от 13до 17 лет, из генеральной совокупности (N) делят на количество респонден­тов, представляющих данную возрастную группу (n), полагая, что один респон­дент представляет мнение ^человек генеральной совокупности.

Сотрудники Института социологии АН СССР А.А. Давыдов и А.О. Крыштановский в свое время установили любопытные факты. Оказывается, де­мографические признаки респондентов почти никак не связаны с ответами об удовлетворенности работой и жизнью, оценкой темпов перестройки, одоб­рением деятельности политических лидеров, оценкой внешнеполитических событий и т.д. Другими словами, мужчины и женщины одинаково отвечают на вопросы об удовлетворенности жизнью или о политических событиях. Для этих индикаторов перевзвешивание проводить не нужно. Если же одна ха­рактеристика, например пол, тесно связана со всеми содержательными воп­росами или разные вопросы связаны с различными характеристиками, то коррекцию придется делать по схеме, описанной в пособии.

Коррекция резко выделяющихся ответов респондентов. При опросе иног­да попадаются такие ответы респондентов, которые резко выделяются на об­щем фоне. Причины могут быть самые разные: респондент неправильно понял вопрос анкеты, у него оригинальные взгляды на мир или попросту решил подшутить над учеными. Могут быть и другие причины. Но вернуть­ся к нему и переспросить уже нельзя. В таком случае, особенно если анкет много, бракованный экземпляр лучше удалить из общего массива.

Коррекция пропущенных ответов. Пропуски чаще всего возникают в откры­тых и табличных вопросах. Самый простой способ коррекции — исключить их или всю анкету из научного анализа. При пропуске не содержательного вопроса, а того, что имеется в паспортичке, поступают так. Если социально-демографические характеристики не связаны с содержательными ответами, то анкете с пропущен­ными значениями следует присвоить наиболее часто встречающиеся в выборке социально-демографические характеристики либо определить их случайным образом или пропорционально (если таких анкет много). Если же связь есть, то следует определить, к ответам какой группы (например, мужчин или женщин) ближе ответы в анкете, где графа «пол» не указана, и внести этот признак.

Сокращение выборочной совокупности. Таким образом, ремонт выборки осу­ществляется в случаях, когда данных получено много. По мнению А.А. Давыдова и А.О. Крыштановского, это наиболее рациональный подход к ремон­ту выборки, поскольку данная стратегия не опирается ни на какие дополни­тельные допущения. Если же объем выборки незначителен, то для ее ремонта нужно принимать ряд дополнительных допущений, которые не следуют из собранного материала и истинность которых трудно проверить.

Переформирование выборкиосуществляется тогда, когда проверка показа­ла, что выборка не представляет совокупность в целом. В этом случае выбира­ются новые респонденты, и они добавляются к ранее использованной выбор­ке, пока не достигается удовлетворительный уровень репрезентативности.

Далеко не все социологи, организующие эмпирическое исследование, включают данные о контроле и ремонте выборки в его паспортичку. Так, среди 300 исследований, содержавшихся в Банке данных ИС АН СССР на 1988 г., лишь в десяти осуществлялся ремонт выборки38. Для сравнения от­метим: за рубежом ремонт выборки уже давно стал распространенным ме­тодом повышения качества социологической информации.

Эффективным контролем выборки и вообще качества данных в исследовании служит публикация ключевых характеристик исследования, прежде всего мето­дического инструментария. Если автор исследования скрывает информацию, указывая на коммерческую тайну, то обязательно должно возникнуть подозрение в его нечистоплотности. Как справедливо замечает А. Балабанов, все методики измерений, даже в сфере маркетинговых исследований и масс-медиа, давно из­вестны, они абсолютно открыты и не могут являться объектом коммерческой тайны. Более того, отсутствие данных о методике измерений является наруше­нием всех имеющихся в мире соглашений, в частности о медиаизмерениях39.

Паспортичка выборки

При написании научного отчета и публикации статьи в академическом жур­нале от авторов исследования всегда требуют четких разъяснений относительно самого исследования и выборочной совокупности: кто и когда проводил иссле­дование, какие методы исследования использовались, каковы тип, объем и харак­тер выборки, ошибка репрезентативности, состав выборочной совокупности по главным параметрам (например, пол, возраст, национальность, образование), контроль данных и др. Если эти сведения отсутствуют, то статью в журнал обыч­но не принимают, а если они присутствуют лишь частично, то им не доверяют серьезные исследователи. Таким образом, паспортичка исследования и паспортичка выборки необходимы авторам не меньше, чем редакторам и читателям.

· Паспортичка выборки появляется у социолога дважды. Первый раз харак­теристику типа выборки с кратким обоснованием целесообразности ее ис­пользования в соответствии с целями исследования, требованиями репрезен­тативности и организационными возможностями исследования социологу приходится давать в Методическом разделе программы своего исследования. Раздел о выборке содержит ответы на следующие вопросы:

· Каков эмпирический объект исследования?

· Является ли исследование сплошным или выборочным?

· Если оно является выборочным, то претендует ли оно на репрезента­тивность?

· Если оно претендует на репрезентативность, то какова генеральная со­вокупность?

· Сколько ступеней отбора применяется в выборке?

· Какова единица отбора на каждой ступени?

· Какая стратегия отбора применяется на каждой ступени (случайная, квотная)?

· Какая конкретно разновидность случайного отбора применяется?

· Какие параметры используются при квотной выборке?

· Что является основой выборки (список, картотека, карта)?

· Какова единица наблюдения на последней ступени отбора?

 

Принципы выборки описываются не только для метода опроса, но и для каждо­го метода, используемого в исследовании: анализ документов, наблюдение и т.д.

Условный пример описания выборки.В исследовании эффективности бригадных форм организации труда возможна такая стратегия.

1. В качестве эмпирического объекта принимаются рабочие, объеди­ненные в бригадную форму организации труда.

2. Исследование выборочное.

3. Генеральной совокупностью выступают все рабочие, объединенные в бригадную форму.

4. Применяются три ступени отбора.

5. На первой ступени выделяются бригады, занятые в основном и вспо­могательном производстве. Для последних применяется сплошной опрос (в связи с их малочисленностью), а для первых — выборочный.

6. Вторая ступень — отбор бригад, занятых в основном производстве. По показателям, характеризу­ющим конечные результаты, бригады разделяются на три группы: а) передовые; б) средние; в) отстающие. В зависимости от числа бригад на каждую группу со­ставляют список, и по нему делается случайный непропорциональный отбор (на­пример, по три бригады в каждой) с помощью определенного «шага выборки».

7. Третья ступень — в отобранных бригадах проводится сплошной опрос. Еди­ницей наблюдения выступает отдельный работник.

Второй раз с описанием выборки социолог встречается уже после проведе­ния исследования — когда пишет научный отчет или научную статью в журнал. Неполное описание паспортных данных исследования, к сожалению, самая распространенная болезнь российских ученых. Некоторые не знают, как имен­но их составлять, другие считают такие сведения необязательными или неваж­ными. А есть и такая категория исследователей, которым сообщить просто не­чего, поскольку, описав все сведения о выборке, они разоблачат свою неграмот­ность. Распространенный случай — социолог как-то провел исследование, каким-то образом построил выборку и что-то там получил. Но сформулировать паспортичку, выразить на научном языке свои действия он не может.

Примеры из социологических исследований. В одних паспортичка описана полностью, в других — частично. Намеренно оставляем примеры без ком­ментариев, поскольку комментарий — это всегда оценка. В исследованиях ука­заны реальные фамилии, поэтому как-то оценивать, судить или сравнивать примеры между собой мы считаем неэтичным. Главное — актуализировать саму проблему и убедить нынешних студентов, а завтрашних специалистов в необходимости объективно и полно сообщать сведения о проведенном иссле­довании, не забывать о таком понятии, как паспортичка выборки.

Примеры паспортички выборки

1.Основной целью социологического исследования, проведенного B.C. Жу­равлевым в 1999 г. в школах и училищах Екатеринбурга, было выявление пре­обладающих форм и субъектов насилия по отношению к подросткам, а также определение катализирующих его факторов. В качестве объекта анализа рас­сматривалась группа подростков от 14 до 16 лет. Сбор информации осуществ­лялся методами анкетирования и нарративного интервью. Среди опрошенных подростков юноши составляют 46,8, девушки — 53,2%. По возрастным харак­теристикам респонденты распределились следующим образом: 14 лет — 23%, 15 лет — 54,4%, 16 лет — 22,6%. Преобладание в выборке пятнадцатилетних объясняется тем, что в этой группе представлены наиболее типичные черты образа жизни подростков. 80% респондентов обучаются в общеобразователь­ных школах, 20% — в училищах. 74,2% опрошенных подростков живут в пол­ных семьях, без отца воспитываются 21,0%, без матери — 4,8%. Большинство учатся на «4» и «3» — 48,3%, на «4» и «5» учатся 27,7%, на «4» — 14,5%, на «3» -7,3%, на «5» - 2,2%.

2.Заказчик — неправительственная организация: Международная ассоциа­ция по борьбе с наркоманией и наркобизнесом. Общероссийское исследование проведено научным коллективом «ГАЛСИ» летом—осенью 1992 г. среди город­ского населения семи экономических зон. Выборка многоступенчатая, райони­рованная по методу квот, ее объем — 1290 респондентов, из которых 125 — эк­сперты. Экспертный опрос осуществлен по квотной выборке. Опрос проведен в 12 городах, среди которых крупные (столичные), средние и малые, выполня­ющие функции как городов-транзитов, так и «потребителей» наркотиков42.

3.Аннотация социологического исследования «Предвыборная ситуация в России в 1995 г.», проведенного Центром социологических исследований МГУ. Дата опроса: 6 — 15 декабря 1995 г. Цель — изучение предвыборной си­туации в России на последнем этапе избирательной кампании, анализ элек­торального поведения населения страны, динамики ее изменения. Метод: интервью продолжительностью 50 минут — 1 час. Сбор полевой информации осуществлялся региональными социологическими службами по стандарти­зированному вопроснику. Полевому этапу предшествовал инструктаж руко­водителей опросной сети. Объект — взрослое (18 лет и старше) население России. Выборка: 1) объем выборки — 3710 респондентов; б) тип выборки — стратифицированная, многоступенчатая, случайная на этапе отбора респон­дентов, репрезентативная для избирателей РФ. Опрос проведен в 66 субъектах Российской Федерации, пропорционально представляющих все регио­ны страны. В опросе участвовали жители 182 населенных пунктов, в том числе 30 областных, краевых и республиканских центров. Опрошено 1378 респондентов в 36 малых и средних городах, в поселках городского типа — 1229, в 116 сельских населенных пунктах — 1103 респондента. Половозраст­ная структура респондентов в целом репрезентирует население РФ. Среди опрошенных 43% мужчин и 57% женщин. По возрастной структуре имеют место два отклонения, до 3 % каждое, в следующих группах населения: от 18 до 24 лет — в сторону уменьшения, от 45 до 49 лет — в сторону увеличения. Контроль — поэтапный: а) выездной за работой опросной сети; б) компью­терный контроль за полнотой заполнения анкет и логической непротиворе­чивостью данных, в) выборочный (10%) контроль правильности ввода дан­ных на ЭВМ. Обработка данных: январь 1996 г. на ЭВМ IBM PC AT 486 с использованием пакетов SPSS и СУБД Paradox43.

4. В 1966 г. Комитетом по печати при Совете Министров РСФСР было про­ведено исследование спроса городского населения страны на книги с целью получения данных об объеме и структуре спроса, о покупательских интересах и предпочтениях. Исследование проводилось в шести регионах: Воронежской, Восточно-Казахстанской, Гомельской, Кемеровской, Запорожской областях и в Башкирской АССР. Оно было организовано по методу многоступенчатой рай­онированной выборки в книжных магазинах и по месту жительства различных групп населения. Методом анкетного опроса было обследовано около 38 тыс. человек. В 1978 г. в тех же регионах было проведено повторное исследование (опрошено свыше 20 тыс. человек), которое позволило выявить тенденции раз­вития спроса на книжную продукцию.

В качестве объекта его выбраны работники машинострои­тельных, главным образом станкостроительных, предприятий, где женщи­ны составляют 42% всех занятых. Социологическое обследование проводи­лось в 1975—1977 гг. среди рабочих-станочников 1 ГПЗ (Москва). Московского станкостроительного завода им. Серго Орджоникидзе, Таллин­ского производственного объединения «Таллэкс», Ульяновского завода тя­желых и уникальных станков, Люберецкого завода сельскохозяйственногс машиностроения им. Ухтомского, Ленинградского машиностроительногс объединения им. Карла Маркса. Применялся метод случайной выборки. Пс нашим данным, выполнение норм выработки.

5. Одна из основных целей исследования, проведенного в Краснодаре отделом семьи И.СИ АН СССР (1981 г.), заключалась в уяснении характер; отношений, условно обозначенных «работа—дом», выявлении основных мо ментов, за счет которых эти две важнейшие сферы человеческой жизнедея тельности нередко входят в противоречие. Исследование осуществлялось п< международной программе, цель которой — выявить характерные измененю семьи в европейских странах. Проинтервьюировано 150 человек — 75 муж чин и 75 женщин. Среди опрошенных 53,3% рабочих, 14,7% служащих, 323 специалистов, имеющих высшее образование.

6. Исследование «Россияне о судьбах России в XX в. и своих надеждах на XXI в.» по репрезентативной всероссийской выборке. Опрошено 2050 человек из Мос­квы (6,3% от общего числа опрошенных), Санкт-Петербурга (4,6%), Северо-Западного района (5,7%), Волго-Вятского района (5,6%), Центрального райо­на (12,1%), Центрально-Черноземного района (5,7%), Поволжского района (10,9%), Северо-Кавказского района (12,0%), Уральского района (12,7%), За­падно-Сибирского района (8,9%), Восточно-Сибирского района (6,4%), Даль­невосточного района (5,2%) в 58 населенных пунктах, из которых 10,9% от об­щего числа представляют мегаполисы, 43,6% — областные (краевые, республи­канские) центры, 21,2% — районные центры, 24,3% — сельские населенные пункты. Респонденты относятся к различным социальным группам: 29,7% от общего числа опрошенных — рабочие; 5,6% — инженеры и инженерно-техни­ческие работники; 3,7% — гуманитарная интеллигенция; 4,4% — работники государственной торговли, сферы услуг, транспорта, связи и жилищно-комму­нальных хозяйств; 4,2% — служащие, 3,3% — предприниматели; 24% —жите­ли села; 3,5% — военнослужащие и сотрудники Министерства внутренних дел; 15,9% — городские пенсионеры; 2,6% — студенты; 3,4% — безработные. Сред­ний возраст респондентов — 44 года (22% — 30 лет и моложе; 45,6% — от 31 до 50 лет; 32,4% — 51 год и старше). Среди опрошенных 49,3% мужчин и 50,7% жен­щин. По национальной принадлежности: 82,8% —русских; 5,8% —украинцев и белорусов; 5,0% — татар; 2,6% — представителей народов Кавказа и Закавка­зья; 3,8% —представителей других народов.

7. Исследование «2001: Интернет-аудитория г. Москвы: использование Ин­тернет и образ жизни» проведено компанией «RI-VITA. Marketing Research & Consulting» (опубликовано в: «Практический маркетинг». 2001. № 52. С. 22—24). Цель исследования — сформировать представление об Интернет-аудитории г. Москвы. Задачи исследования — выявить:

1) характеристики Интернет-аудитории — долю Интернет-пользователей среди населения Москвы и их социально-демографический профиль;

2) основные направления использования Интернет: время и место рабо­ты, частоту выхода и продолжительность нахождения в Интернет, мотивы работы с Интернет, предпочтения к Интернет-провайдерам;

3) особенности покупательского пове­дения — использование Интернет-мага­зинов: частота посещений, заказываемые товары, стоимость разовой покупки, при­чины неудовлетворенности процедурой покупки в Интернет-магазинах;

4) отношение к Интернет — основ­ные мотивы использования Интернет различными социально-демографиче­скими группами;

5)особенности образа жизни;а) использование традиционных

СМИ: телевидения и радио;

6) предпочтения к провайдерам пейджинговой и мобильной связи;

7) выбор места для проведения отпуска и предпочитаемый досуг.

Метод сбора информации— опрос по телефону на основе структурирован­ного вопросника с полузакрытыми вопросами. Проведено 1319интервью, из них 310 отобрано для анализа.

Выборка — двухступенчатая: на первой ступе­ни случайным образом отбирались номера телефонов домохозяйств, на вто­рой ступени респонденты выбирались по половозрастным характеристикам. В каждом домохозяйстве опрашивался один человек.

Размер выборкирепре­зентирует население Москвы в возрасте от 15 до 60 лет, использующее Ин­тернет не реже одного раза в месяц. Единица опроса — мужчина/женщина от 15 до 60 лет, использующий/ая Интернет не реже одного раза в месяц.

Рек­рутирование — по телефону на основе Инструкции по рекрутированию рес­пондентов.

Метод анализа данных — для определения различий в распреде­лениях была использована формула предельной ошибки выборки. Довери­тельный интервал для предельной ошибки выборки — 95%. При анализе данных также использовались методы дескриптивной и многомерной стати­стики (анализ средних, корреляция, кластерный анализ).

Генеральная сово­купность — полученные результаты могут быть репрезентированы на всю ге­неральную совокупность со средней ошибкой выборки +5,6%. Сроки прове­дения:февраль — апрель 2001 год.

Согласно данным исследования В.В. Солодникова, который провел вто­ричный анализ публикаций в трех академических журналах, а именно «Со­циологические исследования», «Вопросы психологии» и «Психологический журнал» за 1986—1992 гг., ни социологи, ни психологи не утомляют себя вы­движением, обоснованием и проверкой гипотез. Большинство ученых (от 61% психологов до 92% социологов) обходится без такого познавательного инструмента, нарушая все каноны научного метода. Только в 8% социоло­гических публикаций гипотезы формулируются в явном виде. Плохо обсто­ит дело у социологов и психологов с описанием объекта исследования: мало кто указывает количество опрошенных, пол и возраст респондентов, редко сообщается уровень образования опрошенных, место проживания, продол­жительность семейной жизни (для состоящих в браке), доход и профессио­нальный статус. Проблема репрезентативности, т.е. сравнение выборочной и генеральной совокупностей по указанным признакам, почти совсем не об­суждается. Кроме того, единичны упоминания социологов о пилотаже ин­струментария, об использовании ранее апробированных методик. Хотя са­мым распространенным методом сбора эмпирической информации высту­пает опрос, редко кто описывает, какой именно его вид применялся в зависимости от места, времени или способа заполнения анкеты.

Наши рекомендации