Закон больших чисел и теория вероятностей - научная основа анализа статистических данных
В решении важнейшей задачи — установления и количественного выражения закономерностей и взаимозависимости социальных явлений статистическая наука опирается на закон больших чисел (ЗБЧ), смысл которого состоит в том, что правильности и закономерности социальных явлений могут быть обнаружены только при их массовом наблюдении.
Конечно, всякая наука, каждая в своей области, имеет дело с массовыми явлениями, ибо в законе отражается массовидное, существенное, необходимое. И хотя любая закономерность носит общий, а потому массовый характер, но в статистике, как мы уже убедились (гл. I), понятие массовости специфично. Оно становится очевидным, если вспомнить деление закономерностей на динамические и статистические (гл. XIV). Статистика оперирует не родовыми, а групповыми понятиями, в которых речь идет о средних результатах, в то время как в родовых — о каждой входящей в него единице. Поэтому в правовой статистике знание о правонарушаемости как статистической совокупности не есть одновременно знание о конкретных преступлениях, входящих в нее. Хотя в данном случае статистик имеет дело не с чисто случайными явлениями, а с индивидуальными, которым присущи случайные отклонения.
В этом и заключается специфика статистического количественного анализа социальных процессов, в котором проявляется смысл закона больших чисел: сделанные на его основе выводы, обнаруженная тенденция, закономерность относятся к совокупности («большому числу») как таковой. То есть ЗБЧ лежит в основе самой логики статистического умозаключения; на основе ЗБЧ выявляется массовая закономерность.
Для статистических закономерностей весьма характерно сложное переплетение внутренних и внешних причин, необходимого и случайного.
И эти закономерности образуются отнюдь не в ходе «игры случая», а прежде всего в результате действия внутренних необходимых причин. Множество вариаций и случайных отклонений, как отмечалось (гл. X), сглаживаются (элиминируют) именно в массе, что приводит к образованию статистических закономерностей. Проявление такой закономерности и есть результат действия закона больших чисел, которое состоит в том, что совокупность большого числа случайных явлений имеет определенные, не зависящие от случая характеристики, выражаемые количественными показателями. То есть представление о ЗБЧ и его действии нельзя отрывать от представления о статистической закономерности как формы, в которую облекается закономерность массового явления, изучаемая статистикой с количественной стороны. Причем ЗБЧ проявляется тем отчетливее, чем крупнее статистическая совокупность.
Массовые закономерности, а вместе с ними и ЗБЧ проявляются в самых различных областях действительности. Особенно наглядны они в демографии, в криминальной статистике. Так, в странах с рыночной экономикой в рабочей среде рождаемость и смертность обратно пропорциональны уровню заработной платы; во всех странах с высокой продолжительностью жизни женщины долговечнее мужчин; смертность мужчин во всех возрастных когортах, начиная с детской и кончая самой пожилой, в 2— 3 раза превышает смертность женщин (что для многих явилось неожиданным выводом); рождаемость девочек и мальчиков постоянно соответствует пропорции 51:49; постоянную величину составляют число браков, половое распределение преступников, мотивов, орудий убийств и т.д. при данных условиях и т.д.; обнаруживается значительная устойчивость несчастных случаев в отдельные периоды года и часы суток; по данным русской почтово-телеграфной статистики, констатировалась значительная устойчивость вынутых на каждый миллион из почтовых ящиков писем (1906—1910 гг.) без указания адресата (25—27) или без указания места назначения (21-29) и др.
В малом числе наблюдений (например, отдельные преступления) случайные факторы не дают возможности обнаружить закономерность. Напротив, при суммировании большого числа единичных явлений случайности парализуют друг друга, что позволяет установить законы, которые при малых масштабах маскируются индивидуальными отклонениями.
Статистическая закономерность — это не особая форма движения материи, а лишь внешнее проявление этого движения в статистических распределениях и обобщающих статистических характеристиках. Статистически установленные правильности в изменениях количественных показателей, повторяемость и устойчивость фактов свидетельствуют лишь о том, что в исследуемом массовом явлении заложена известная закономерность, вскрытие которой составляет задачу соответствующей науки (например, криминологии).
Закономерность массового явления, объективные связи, заложенные в этом явлении, находят свое выражение не в отдельных показателях, а в средней величине, в характере распределения. Средняя арифметическая большого числа случайных величин — практически величина не случайная, а необходимая, закономерная (см. гл. X). В этом-то и состоит действие ЗБЧ, если подходить к его трактовке с философско-методологических позиций. Поэтому иногда ЗБЧ называют еще законом средних величин.
Рассмотрение ЗБЧ как одного из законов объективной действительности вместе с тем исключает его отношение к уровню констатированных им обобщающих статистических характеристик. Этот уровень определяется условиями, вытекающими из самой природы массового явления. Правильно отмечается, что ЗБЧ не создает уровней, а лишь регулирует случайные отклонения от заданных природой данного явления уровней.
Из сказанного ясно, что ЗБЧ основывается на понятии случайности и вероятности — уменьшение степени случайности и возрастание степени вероятности наличия определенного признака происходит по мере увеличения статистической совокупности. Это может быть проиллюстрировано таким примером: если известно, что население города представлено соотношением 48% мужчин и 52% женщин, то небольшая совокупность людей (например, посетителей театра, футбольного матча и т.д.) может значительно отклониться от этих характеристик; если же увеличивать исследуемую совокупность, то последует приближение к указанным характеристикам.
Естественнонаучное обоснование, точная формулировка и условия применимости ЗБЧ даются в теории вероятностей. Другими словами, теория вероятностей является математическим обоснованием ЗБЧ. Объект теории вероятностей — измерение объективной возможности результатов, возникающих в массе однородных случайных событий, и выведение на этом основании количественных закономерностей, которым они подчиняются. Сразу оговоримся, что детальное рассмотрение теории вероятностей выходит за пределы изучаемого курса.
С ее помощью вычисляются шансы возможного наступления случайного события. Случайный характер варьирующих от единицы к единице совокупности признаков позволяет оценивать, насколько велика вероятность появления того или иного признака в ней. Отношение количества фактически появившихся интересующих нас фактов к общему количеству всех возможных фактов, выраженное в виде процента или десятичной дроби, называется частостью, или опытной (эмпирической) вероятностью. Например, если при 50-кратном бросании монеты 30 раз выпал орел, а 20 решка, то частость орла будет равна 0,6 (30:50), а частость решки — 0,4(20:50).
Вероятность — «математическая, числовая характеристика степени возможности появления какого-либо определенного события в тех или иных определенных, могущих повторяться неограниченное число раз условиях»2.
Вероятность обычно обозначается буквой Р. Например, выражение Р(А) = 0,5 означает, что вероятность наступления события А равна 0,5.
Вероятность принято классифицировать по следующей шкале:
0,00 — полностью исключено
0,10 — в высшей степени неопределенно
0,20 – весьма неправдоподобно
0,30-0,40 - неправдоподобно
0,60 - вероятно
0,70 - весьма вероятно
0,80 - 0,90 - в высшей степени вероятно
1,0 - полностью достоверно.
Таким образом, вероятность получает определенное количественное выражение, несмотря на то, что наличие того или иного признака или его колебания является случайным.
Если в урну поместить черный и белый шары, то при выемке одинаково можно обнаружить любой из них. При этом проявляется альтернативная изменчивость, которая заключается в возможности лишь двух исходов: из урны можно вынуть только белый шар либо только черный шар. То же происходит и при подбрасывании монеты. Это обстоятельство одинаковой возможности выпадения любой стороны монеты называется равновозможностью. Событие называется равновозможным, если нет причин, делающих одно из этих событий более возможным, чем другое. Событие называется несовместимым в том случае, когда появление одного делает появление другого невозможным.
При многократном подбрасывании монеты или при многократной выемке шаров из урны образуется совокупность единичных опытов, которая обладает свойствами статистической совокупности. В отдельном опыте результат может быть различным — орел или решка, черный или белый шар, а в совокупности опытов проявляется определенная закономерность в соотношении между числом выпавших гербов и решек или числом вынутых черных и белых шаров.
Результат каждого единичного опыта с монетой или шарами также зависит от двух групп факторов: основных, связанных со свойствами явления, и случайных, не связанных с этими свойствами. Однако удобством монетной или урновой модели является, во-первых, то, что в ней легко отделить основные причины и свойства явления от побочных; во-вторых, на этой модели легко проследить, как действует каждая группа причин и что является результатом действия каждой из них.
В рассматриваемых примерах главное свойство монеты — ее симметричность, в силу чего при подбрасывании шансы на выпадение герба или решки совершенно равны; главное свойство урны с шарами — соотношение между числом черных и белых шаров. Если, например, в урне 100 черных и 100 белых шаров, то при выемке одного шара шансы на появление черного или белого шара совершенно одинаковы, а если в урне в два раза больше черных, чем белых, то соответственно больше и шансов выемки черного шара.
Чтобы априори, т.е. до опыта, определить вероятность наступления какого-либо случайного явления, нужно знать число шансов, благоприятствующих его наступлению, а также число всех возможных шансов (как благоприятствующих, так и неблагоприятствующих). Отношение первой величины ко второй называется математической вероятностью. Она выражается в виде дроби, где в числителе указывается число благоприятствующих шансов, а в знаменателе – число всех возможных шансов. Например, при подбрасывании монеты возможны два исхода. Если считать выпадение орла благоприятным исходом, то вероятность его равна ½. Если считать благоприятным исходом появление черного шара из урны, в которой находится 70 черных шаров и 30 белых шаров, то вероятность благоприятного исхода при выемке одного шара равна 70/100, а вероятность неблагоприятного исхода равна 30/100.
Если вероятность благоприятного исхода обозначить р, а вероятность неблагоприятного исхода q, то во всех случаях альтернативной изменчивости, т.е. когда возможны лишь два исхода, р + q = 1, в опыте с монетой 1/2 +1/2=1.
Вероятность – основное понятие теории вероятностей, которая, по образному выражению П.С. Лапласса (1749-1827), есть здравый смысл, переложенный на вычисление. Если придать ей математическое выражение, то в общем виде она может быть определена так: если число шансов, благоприятствующих данному событию А, обозначить буквой М, а число всех равновозможных и несовместимых шансов – N, то pA= M/N. Число же шансов, не благоприятствующих событию А, обозначаемому А*, равно N – M, и, следовательно, вероятность противоположного исхода qA = (N – M) /N, откуда pA + qA* = 1.
В числовом выражении вероятность равна доле признака во всей совокупности, как, например, доле черных или белых шаров в урне. Но доля характеризует состав совокупности, а вероятность является оценкой степени объективной возможности того или иного результата при отборе наудачу одной единицы из всей совокупности.
Это определение вероятности, данное П.С. Лаплассом, является определением простейшей, так называемой классической вероятности, приложимой к весьма узкому кругу явлений. Для массовых (например, правонарушений) более подходит статистическое или частотное понятие вероятности, определяемое как постоянное число, вокруг которого колеблются частости.
Сопоставляя эмпирическую (опытную) частость с априорной (математической) вероятностью, легко убедиться, насколько правильны наши теоретические рассуждения. Оказывается, при малом числе наблюдений частость может значительно отклониться от математической вероятности, что наглядно видно из приведенного примера, где частость орла при 50-кратном бросании монеты равна 0,6 при вероятности 0,5, а частость решки — 0,4 при той же вероятности. Но, как свидетельствует теорема П.Л. Чебы-шева (1821 — 1894), с вероятностью, сколь угодно близкой к единице (достоверности), можно утверждать, что если х, у,..., w суть независимые случайные величины, имеющие определенные математические ожидания и равномерно ограниченные дисперсии, то при достаточно большом числе этих случайных величин их средняя арифметическая будет как угодно мало отличаться от средней арифметической их математических ожиданий.
Но мы уже знаем, что чем больше число наблюдений (опытов с монетой или шарами), тем меньше случайности маскируют действие основной причины. Так, французский натуралист Ж.Л. Бюффон (1707—1788) проделал эксперимент с бросанием 4040 раз монеты; соотношение выпавших сторон оказалось равно 2028 и 2012, что соответствовало частости герба — 0,5069. Английский ученый К. Пирсон при бросании монеты 12 000 раз получил частость в 0,5016, а при 24 000 — 0,5005.
В малом числе бросаний случайные причины (потоки воздуха, разная сила бросания и пр.) парализовали действие постоянных причин (симметричность монеты). Только в большом числе опытов эти постоянные причины проявлялись, что и подтверждалось почти совпадением частности и вероятности. Все это, кстати говоря, является прекрасной математической иллюстрацией тезиса Ф. Энгельса о том, что «необходимость прокладывает себе дорогу сквозь бесконечное множество случайностей», и вполне достаточным основанием для эмпирического доказательства закона больших чисел.
Вероятность органически связана с категориями причины и следствия. В самом деле, наблюдаемые на поверхности процессов частости — не что иное, как следствие тех или иных внутренних причин, определяющих вероятность явления. Таким образом, вероятность выражает объективную меру связи причины со следствием, становится мощным средством исследования причинности в массовых явлениях. Теория вероятностей показывает, что при достаточно большом (но не исчерпывающем) числе наблюдений могут быть выявлены и измерены правильности и закономерности, которые присущи изучаемой совокупности. На этом основано выборочное, или, как его иногда называют, репрезентативное обследование (см. гл. IX).
На основе применения теоретико-вероятностных схем изучаются многие явления общественной жизни: покупательный спрос, индивидуальные вкусы и желания, покупательная способность семьи, грузовые перевозки и поток пассажиров и т.д., где случайности и вариации (независимые события) сглаживаются именно в массе, что приводит к образованию статистических закономерностей.
Применение теории вероятностей к социальным явлениям, в частности к преступности, обусловлено наряду с независимостью отдельных событий (иррегулярностью преступлений) еще и их известной устойчивостью.
Преступность представляет типичную статистическую совокупность, обладающую относительно устойчивыми характеристиками, позволяющими конкретно изучать ее и даже прогнозировать ее изменения. Поэтому «невозможно говорить об определенной вероятности преступления как о «незыблемой закономерности». Она меняется вместе с изменением условий. Но пока действуют данные определенные условия, действует и та или иная определенная вероятность. Это и дает возможность изучения этих явлений на основе методов математической статистики». Если условия в силу определенных причин остаются неизменными, то в среднем устойчиво и число преступлений, что позволяет установить вероятность, с которой они совершаются. На этом, как отмечалось, основано криминологическое прогнозирование. Обнаруживается закономерность: преступность уменьшается тогда, когда общество, государство активизируют свою борьбу с ней.