Выборочное наблюдение как важнейший источник статистической информации
Как отмечалось в гл. IV, наиболее распространенный способ несплошного наблюдения — выборочный, который в условиях развития рыночных отношений в России находит все более широкое применение, в том числе и в области изучения правонарушений и грсударственных мер социального контроля над ними.
Выборочное наблюдение, проведенное при соблюдении выработанных наукой правил, позволяет путем изучения части фактов выявить статистические закономерности, характерные для всей наблюдаемой (генеральной) совокупности.
Под выборочным наблюдением (сокращенно выборка) понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются не все, а отдельные единицы, отобранные с соблюдением определенных условий.'
С давних пор представлялось заманчивым изучать не все единицы совокупности, а лишь некоторую ее часть, по которой можно судить о свойствах совокупности в целом. Так, в XVII в. в рус-* ских феодальных вотчинах проводились выборочные обмолоты зерновых культур. Выборка нужна была дл.я определения сборов зер-:на. В XVIII в. выборочное наблюдение применялось в моральной статистике. Однако попытки использовать выборочное наблюдение были достаточно примитивными и никак не гарантировали точности результата. Потребовалось более двух веков для разработки научного метода выборочного наблюдения. Его теоретические основы были заложены работами выдающихся математиков: Я. Бернулли (1654—1705), П.С.Лапласа (1749—1827), К.Ф.Гаусса (1777-1855), С.Д. Пуассона (1781-1840).
Глава XI. Выборочное наблюдение и его применение в правовой статистике
Немалый вклад в развитие теории и практики применения выборочного метода внесен трудами выдающихся российских математиков: П.Л. Чебышева (1821 — 1894), А.М.Ляпунова (1857— 1918), А.А. Маркова (1856-1922).
Так, уже во второй половине XIX в. выборочные обследования проводились земскими статистиками, которые отличались определенной новизной в решении вопросов организации отбора единиц. Пользуясь данными земской статистики, А.А. Чупров произвел, например, изучение грамотности населения 5200 селений Московской губернии. По подсчетам, на основе сплошного наблюдения, процент грамотности составил 47,6%. А.А. Чупров из указанных 5200 селений отобрал 500 селений и определил в них процент грамотности, который оказался равным 47,5%. Таким образом, данные сплошного и выборочного наблюдений почти совпали — разность выражалась всего лишь в 0,1 %•.
Сегодня именно поэтому выборочное наблюдение находит самое широкое применение как в научных исследованиях, так и в практической работе в самых различных сферах деятельности. Так, в условиях развития внешнеэкономических связей России при широком ассортименте, в частности, импортируемых продуктов и непродовольственных товаров контроль их качества обеспечивается путем выборочного обследования. Или еще один пример. Распоряжением Правительства РФ от 9 февраля 1995 г. во исполнение Федерального закона «О государственной поддержке малого предпринимательства в Российской Федерации» Госкомстат России осуществляет начиная с 1996 г. текущее статистическое наблюдение за деятельностью малых предприятий в режиме выборочных квартальных обследований.
И это правильно, так как считается, что бессмысленно подвергать статотчетности все такие предприятия. Во-первых, объективные сводные данные все равно не получишь — треть таких предприятий, как правило, не находится, так как их юридические адреса не совпадают с реальными. В результате даже налоговая инспекция не имеет данных о месте их квартирования. Во-вторых, сведения, которые удается собрать, порой далеки от истины. В-третьих, даже трудно представить, какой аппарат нужно создавать при режиме сплошного наблюдения, если учесть, что прогнозируемый в ближайшем будущем рост предприятий малого бизнеса достигает
1 Цит. по: Остроумов С. С. Советская судебная статистика. С. 211.
____§ 1. Выборочное наблюдение как важнейший источник статистической информации 421
5 млн. И в-четвертых, сложные формы отчетности мешают работе малых предприятий, отнимают у них много времени.
Теперь статистическая отчетность будет состоять из 7—8 показателей: численность работников, экономические и финансовые показатели, стоимость основных фондов плюс услуги, оказываемые населению. Кроме того, режим выборочного наблюдения позволяет брать каждое десятое — двадцатое малое предприятие, характерное для данной области, и путем математических методов анализа выводить контрольные данные, которые дают объективную картину в целом1.
Особое место выборочное наблюдение занимает в исследованиях преступности и связанных с ней проблем2, поэтому юристам — будущим специалистам в научно-практических вопросах контроля над преступностью надо хорошо усвоить его сущность3.
Выше указывалось, что регистрируемую преступность можно рассматривать в качестве стихийной выборки из всей фактической преступности. Эта выборка, хотя и не известно, какую часть генеральной совокупности (всей преступности) она составляет, сама по себе достаточно велика и тоже представляет собой статистическую совокупность, которая вполне репрезентативна4.
К выборочному наблюдению прибегают по различным причинам. Во-первых, как отмечалось, использование выборочного обследования позволяет значительно сэкономить силы и средства, что в современных условиях имеет немаловажное значение. Во-вторых, наряду с экономией ресурсов одной из причин превращения выборочного наблюдения в важнейший источник статистической информации в процессе изучения социально-правовых явлений обнаруживается возможность значительно ускорить получение необходимых данных. Ведь при обследовании, скажем, 10—15% единиц совокупности будет затрачено гораздо меньше средств и времени, а результаты могут быть представлены быстрее и будут более актуальными. Фактор времени важен для статистического исследования в области криминальных явлений, особенно в условиях постоянно изменяющейся социально-экономической
1 См.: Российская газета. 1995. 2 нояб.
2 См., например, работы Г.А. Аванесова, Ю.Д. Блувштейна, С.Е.Вицина, Н.Н. Горяинова, Н.Н. Кондрашкова, Д.О. Хан-Магомедова и др.
3 См.: Герцеизон А.А., Остроумов С.С. К вопросу о показательности выборочных криминологических исследований // Вопросы криминалистики. 1964. № 11.
4 См.: Вицин СЕ. Системный подход и преступность. С. 82.
422 Глава XI. Выборочное наблюдение и его применение в правовой статистике______
ситуации. В-третьих, и это, пожалуй, самое главное, преимущество выборки, ее значение возрастают в силу возможности (когда это необходимо) расширения программы наблюдения. Так как исследованию подвергается сравнительно небольшая часть всей совокупности, можно более широко и детально изучить отдельные единицы и их группы по интересующим исследователей признакам.
И последний фактор превращения выборочного наблюдения в важнейший источник социально-правовой информации о правонарушениях и государственных мерах социального контроля над Ними — возможность его использования в целях уточнения и для разработки данных сплошного обследования. Выборочная разработка данных сплошного наблюдения связана с потребностью представления оперативных предварительных итогов обследования. Кроме того, при обобщении данных сплошного учета (например, карточек единого учета преступлений) невозможно вести сплошную разработку по всем сочетаниям рассматриваемых признаков. Она сложна и дорогостояща. В этих условиях выборочный метод позволил бы получить необходимые сведения приемлемой точности, когда факторы времени и стоимости делают сплошную разработку нецелесообразной.
Профессор С.С. Остроумов справедливо подчеркивал, что господствующее в статистике правоохранительных органов сплошное наблюдение в форме периодической отчетности при всех своих огромных преимуществах и достоинствах обладает некоторыми недостатками: она ограничена в своем объеме, достаточном только для повседневной оперативной работы. Но ее материалов недостаточно для целей научного исследования правонарушений и связанных с ними проблем, поскольку она содержит только те сведения, которые в равной мере относятся к любому из фиксируемых в отчетности преступлений. Хотя очевидно, что научное изучение отдельных видов преступлений предполагает разработку программы наблюдения, адекватно отражающую специфику конкретных преступлений, например убийство или хищение, преступления экономической направленности или должностные и т.д. В этих и аналогичных случаях необходимо прибегать к дополнительному наблюдению интересующих нас признаков, отсутствующих в текущей статистической отчетности'.
См.: Остроумов С.С. Советская судебная статистика. С. 213—214.
§ 1. Выборочное наблюдение как важнейший источник статистической информации 423
Наряду с этим выборка может быть произведена и самостоятельно (скажем, 10%-ное обследование осужденных).
Источниками первичной информации при организации и проведении выборочного наблюдения по научно-практическим вопросам контроля над преступностью могут служить: статистические отчеты, информационные бюллетени, обзоры, аналитические справки и доклады1, документы единого учета (статистические карточки) преступлений, материалы уголовных и гражданских дел, письма, сообщения, заявления граждан и должностных лиц, материалы прессы, радио, телевидения и другие документы, содержащие сведения о преступлении и преступнике; лицо, совершившее преступление; потерпевший; члены семьи преступника, другие родственники, друзья, окружение по месту жительства и месту работы и т.д.
В ряде случаев выборочные наблюдения применяются в сочетании со сплошными переписями и учетами. Например, программа Всероссийской переписи населения 1999 г., как и последняя Всесоюзная перепись 1989 г., содержит вопросы сплошного наблюдения, относящиеся ко всему населению, и вопросы выборочного наблюдения 25% населения для характеристики основного занятия, положения в занятии, места работы, а также вопросы 5%-ного выборочного обследования с целью изучения брач-ности и рождаемости.
Применение выборочного обследования взамен сплошного, используемого государственной статистикой, дает возможность глубже организовать наблюдение, обеспечивает быстроту его проведения, приводит к экономии средств и труда на получение и обработку информации.
Выборочный метод — это наиболее совершенная, с научной точки зрения, разновидность несплощного статистического наблюдения на основе статистической индукции, при котором характеристики всей статистической (генеральной) совокупности (N) получаются в результате изучения некоторой ее части (п), отобранной с соблюдением определенных правил (на основе случайного отбора) и поэтому являющейся репрезентативной, т.е. представительной и достоверной2.
1 См., напр.: Состояние законности в Российской Федерации (1993—1995 гг.). Аналитический доклад, подготовленный НИИ проблем укрепления законности и правопорядка при Генеральной прокуратуре Российской Федерации. М., 1996.
2 См., напр.: Дружинин Н.К. Выборочный метод и его применение в социально-экономических исследованиях. М, 1970. С. 72.
Глава XI. Выборочное наблюдение и его применение в правовой статистике
Самый важный признак выборочного наблюдения как вида несплошного наблюдения — случайный характер выборки, а главная его особенность заключается в том, что при отборе единиц совокупности для обследования обеспечивается равная возможность попадания в отобранную часть любой из единиц.
Теперь рассмотрим основные понятия выборочного наблюдения. Одно из них — генеральная совокупность (N) — совокупность единиц, из которой производится отбор некоторой их части для статистического исследования. Следующее — выборочная совокупность (п) — совокупность единиц, которая отобрана из генеральной совокупности и подвергнута наблюдению (регистрации интересующих нас признаков).
Генеральная совокупность (а следом за ней и выборочная совокупность) может быть количественной или качественной, что зависит от того, являются ли признаки, свойства единиц наблюдения количественными (возраст) или качественными (пол). Это различие предполагает, что статистическое описание совокупности принимает либо форму средних арифметических, либо форму удельного веса (доли).
Совершенно естественно, что между этими показателями (средними или долями) генеральной и выборочной совокупностями имеется какое-то различие, иначе говоря, существует ошибка в определении показателей (средних или долей) выборочной совокупности именно потому, что последняя является частью генеральной совокупности.
Эти так называемые ошибки репрезентативности представляют собой расхождение между показателями выборочной и генеральной совокупности, подчиняются определенным статистическим закономерностям, что и позволяет рассчитывать объем выборочной совокупности1.
Они могут быть систематическими и случайными. Если первые возникают в связи с особенностями принятой системы отбора и обработки данных наблюдений или в связи с нарушением установленных правил отбора, то вторые — следствие недостаточно равномерного представления в выборке отдельных видов единиц генеральной совокупности.
1 См.: Статистический словарь. М., 1965. С. 386. Общая величина возможной ошибки выборочной характеристики слагается из ошибок двоякого рода: ошибки регистрации и ошибки репрезентативности. О первом виде ошибок речь шла в § 2 гл. VII.
§ 1. Выборочное наблюдение как важнейший источник статистической информации 425
Главной проблемой выборочного метода является то, насколько уверенно можно по свойствам отобранных объектов судить о действительных свойствах генеральной совокупности. Поэтому всякое суждение, сделанное на основе выборки, неизбежно имеет вероятностный характер, и задача сводится к тому, чтобы степень вероятности правильного суждения (точности статистических оценок) была возможно большей.
Определение возможной и фактически допущенной ошибки выборки играет существенную роль в решении вопроса о возможности применения выборочного метода. Величина ошибки характеризует степень надежности результатов выборки; знание этой величины необходимо при оценке параметров генеральной совокупности. Оценки возможной величины и состава ошибок репрезентативности ложатся в основу планирования проектируемого выборочного наблюдения.
Обстоятельства, обусловливающие величину случайной ошибки репрезентативности троякого рода:
1) способ формирования выборочной совокупности; 2) степень колеблемости изучаемого признака в генеральной совокупности; 3) объем выборки.
Для каждого конкретного выборочного наблюдения величина ошибки репрезентативности может быть определена по соответствующим формулам.
Разумеется, увеличение размера выборки при прочих равных условиях дает ббльшую уверенность (чем больше единиц попадает в выборку, тем меньшей будет возможная ошибка), но поскольку нужна возможно меньшая выборка, в математической статистике вырабатываются способы, которые либо обеспечивают повышение точности оценок при фиксированном размере выборки, либо позволяют уменьшить размер выборки, требуемой для получения заданной точности.
Технология выборочного наблюдения включает следующие основные этапы:
1) постановку цели наблюдения;
2) составление программы наблюдения (анкет, опросных листов и т.д.) и разработку ее материалов;
3) решение организационных вопросов наблюдения;
4) определение объема выборки и способа отбора;
5) проведение отбора;
Глава XI. Выборочное наблюдение и его применение в правовой^татистике
6) регистрацию соответствующих признаков (по программе) у отобранных единиц;
7) обобщение данных наблюдения и расчет выборочных характеристик;
8) расчет ошибок выборки;
9) пересчет выборочных характеристик на всю совокупность.
Этапы 1~3, 6 выполняются так же, как и при сплошном наблюдении. Особенности некоторых остальных этапов будут рассмотрены ниже.
Основные вопросы теории выборочного наблюдения
Определение колеблемости признаков совокупности
Основная задача выборочного метода — определение ошибки выборки, ибо если не известен размер ошибки, данные выборки не могут иметь практического значения. Результаты выборочного наблюдения тем точнее, чем меньше колеблемость (пестрота) изучаемого признака.
Как же определяется эта мера колеблемости (пестроты) при исследовании количественных и качественных признаков?
Поскольку при выборочном наблюдении по количественному признаку, как уже говорилось, ставится задача определить средний размер этого признака в данной совокупности, например средний срок расследования уголовных дел или средний срок лишения свободы, постольку возникает вопрос, насколько эта средняя (средний размер) типична или показательна, т.е. насколько правильно и точно характеризует средняя данную совокупность по изучаемому признаку? Для ответа на этот вопрос, как упоминалось в § 3 гл. X, необходимо вычислить особый показатель — среднее квадратическое отклонение (5).
Правовая статистика, в частности уголовно-правовая, чаще имеет дело с качественными признаками. При выборочном наблюдении интересующих исследователя явлений по этому признаку, как упоминалось, ставится задача установить долю явлений, обладающих этим признаком, например долю осужденных женщин в общем итоге осужденных. Если долю явлений, обладающих данным признаком, мы изобразим буквой Р, то доля остальных явлений, не обладающих этим признаком, будет равна (1 - Р). Действитель-
§ 2. Основные вопросы теории выборочного наблюдения
но, если допустить, что доля осужденных, совершивших хулиганство в состоянии опьянения, составляет 90% (или 0,9), то, очевидно, доля хулиганов «трезвенников» будет равна разности: 100% -90% (или 1 -0,9), т.е. 10% (или 0,1).
Разработанная математической статистикой формула колеблемости отдельных вариантов ряда для совокупности явлений, исчисляемых по качественным признакам, выглядит следующим образом:
52 = />х (]-/>)■.'
Приведем условный пример. Допустим, доля осужденных, совершивших преступление в состоянии опьянения (Р), в общем числе осужденных составляет:
при /> = 0,l 82 = Р{\ - Р) = 0,1 х 0,9 = 0,09
при Р = 0,2 52 = Р{\ -Р) = 0,2 У 0,8 = 0,16
при Р = 0,3 82 = Р{\ -Р) = 0,3 х 0,7 = 0,21
при Р = 0,4 S2 = Р(1 - Р) = 0,4 х 0,6 = 0,24
при Р = 0,5 S2 ш Р(\ -Р) = 0,5 х 0,5 = 0,25
при Р = 0,6 S2 = Р{\ - Р) = 0,6 х 0,4 = 0,24
при Р = 0,7 S2 = Р(\ -Р) = 0,7 х 0,3 = 0,21
при Р = 0,8 б2 = Р(\ - Р) = 0,8 х 0,2 = 0,16
при Р = 0,9 82 = Р{\ - Р) = 0,9 х 0,1 = 0,09
Из приведенных расчетов явствует, что при относительно однородной совокупности осужденных («трезвенников» — 10%) показатель пестроты имел небольшое значение — 0,09. По мере возрастания доли осужденных, совершивших преступление в состоянии опьянения, этот показатель увеличивается, поскольку совокупность действительно становится все более пестрой. Так происходит до •/»= 0,5, когда совокупность осужденных достигает наибольшей пестроты и его показатель имеет максимальное значение — 0,25 (25%). С повышением доли осужденных, совершивших преступление в состоянии опьянения, идет обратный процесс.
Данный показатель колеблемости, как и связанные с ним расчеты, имеет первостепенное значение при проведении выборочного наблюдения.
Глава XI. Выборочное наблюдение и его применение в правовой статистике
Определение ошибки выборки
Как упоминалось, основной вопрос выборки заключается в том, насколько выборочная средняя отличается от так называемой генеральной средней, т.е. как велика ошибка репрезентативности.
Ответ на вопрос, каким образом определить размер ошибки выборки, дает математическая теория выборочного метода. Привлечение теории вероятности и математической статистики к решению вопроса об ошибке выборки стало возможным потому, что в основе процесса образования выборочной совокупности из генеральной лежит принцип случайного, непреднамеренного отбора, что позволяет рассматривать этот процесс как случайный.
При достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице (т.е. почти с достоверностью), утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым (теорема П.Л. Чебышева}. На размерах ошибки выборки будет сказываться, с одной стороны, действие закона больших чисел: чем больше единиц попадает в выборку, тем меньше будет возможная ошибка. Но, с другой стороны, размер ошибки, как отмечалось, зависит от колеблемости, пестроты обследуемых по определенному признаку единиц совокупности.
Существуют различные по степени точности и степени сложности формулы для расчета предельно допустимой ошибки1.
Для определения средней ошибки репрезентативности, обозначаемой в статистике W, рекомендуется пользоваться следующими двумя формулами2:
1) при определении среднего размера изучаемого количественного признака:
0)
2) при определении доли качественного признака:
1 Когда требуется повышенная точность результатов исследования, допускается ошибка выборки до 3%, обычная точность допускает 3—10%, приближенная — от 10 до 20%, ориентировочная — от 20 до 40%, прикидочная — более 40%.
2 См.: Остроумов С.С. Советская судебная статистика. С. 220.
Основные вопросы теории выборочного наблюдения
w =
Р{\-Р)
(2)
где W— средняя ошибка репрезентативности; 5 — показатель колеблемости количественного признака, т.е. среднее квадратичес-кое отклонение; п — число единиц, попавших в выборку; Р — доля данного качественного признака в выборке; (1 - Р) — доля противоположного признака.
Технология их исчисления весьма доступна и не требует каких-либо сложных расчетов. Приведем условный пример, позаимствованный нами из указанной работы С.С. Остроумова. Допустим, имеется совокупность в 6500 заключенных. В порядке случайной выборки обследовали 900 заключенных и установили следующие показатели: 1) средний возраст заключенных — 30 лет (Зс); 2) показатель пестроты возраста — 5 = 9 лет; 3) доля заключенных, совершивших преступление в состоянии опьянения, — Р = 0,8, или 80%. Требуется определить среднюю ошибку репрезентативности: а) при установлении среднего возраста заключенных; б) при определении доли заключенных, совершивших преступление в состоянии опьянения. Первый показатель будет определяться по формуле (1):
Здесь необходимо среднее квадратическое отклонение разделить на корень квадратный из числа единиц, попавших в выборку. Подставляем приведенные данные и обнаруживаем, что
W =
/900 30
= 0,3 года.
Из этого следует, что при определении среднего возраста заключенных мы могли допустить ошибку в ту или другую сторону, т.е. этот средний возраст во всей генеральной совокупности (6500 человек) находится в пределах Зс = Зс ± И^или 30 ± 0,3, т.е. от 29,7 до 30,3 года.
Аналогичный расчет по формуле (2) определения доли качественного признака (заключенных, совершивших преступление в состоянии опьянения) покажет, что она равна-± 1,3%, т.е. находится в пределах от 78,7 до 81,3%.