Стохастическая теория статистики а. а.чупрова
Крупнейшим теоретиком статистики начала XX в. был Александр Александрович Чупров (1874–1926), сын. А. И. Чупрова, профессор Петербургского политехнического института, заведующий кафедрой статистики (с 1902), член-корреспондент Российской Академии наук (1917). Глубокий и оригинальный мыслитель, А. А. Чупров оказал большое влияние на развитие статистики не только у себя на родине, где его статистические идеи получили признание и высокую оценку широких кругов статистиков, но и за рубежом. В 1924 г. А. А. Чупров был избран почетным членом Лондонского Королевского статистического Общества. Его труды способствовали преодолению эмпиризма англо-американской школы, особенно типичного для первых этапов ее существования, интеграции островной (английской) и континентальной (немецкой) научных школ.
Работы А. А. Чупрова предвосхитили и стимулировали поворот в сторону вероятностного обоснования статистического познания, способствовали развитию математической статистики, ее логико-фнлософскому обоснованию. А. А. Чупров не был исследователем-практиком, но его теоретические и методологические разработки оказали существенное воздействие и на практику статистического анализа, в частности на распространение выборочного метода. Этому способствовали его связи с земскими статистиками, выступления на всероссийских съездах земских статистиков, а также создание научной школы «чупровцев» из студентов Петербургского политехнического института. Основные идеи изложены им в монографиях «Очерки по теории статистики» (Спб., 1909), «Основные проблемы теории корреляции» (М., 1926), статье «Основные задачи стохастической теории статистики» (Вестник статистики. 1925. № 10–12).
Свою теорию А.А. Чупров строил на базе неокантианства (баденская школа) в противовес позитивистской философии английских статистиков. Он исходил из идей немецкого философа Генриха Риккерта (1863–1936) о делении всех наук на номографические, изучающие общие закономерности – вечные и неизменные, и идеографические, объясняющие закономерности конкретных явлений в определенных условиях места и времени. Чупров придерживался дуалистического взгляда на статистику как особую предметную науку, с одной стороны, и как универсальный метод познания – с другой. Вследствие этого, он относил статистику как предметную науку к идеографическим наукам, а как методологическую науку – к номографическим.
Много внимания уделял А. А. Чупров определению предмета статистического познания. Он не ограничивал сферу применения статистического метода какой-то определенной областью (например, общественными явлениями, как Кетле и многие другие) и выделял четыре основные особенности предмета статистики – статистической совокупности: безграничность в пространстве; беспредельность во времени; вечность и неизменность управляющих ею законов, действие которых всегда и везде остается одним и тем же; сложность и многообразие составляющих явлений. Эти положения содержат лишь часть истины: в них гипертрофирована устойчивость явлений, но опущено их развитие, изменчивость, что составляет немаловажную особенность предмета статистики. Варьирование явлений Чупров объяснял не их развитием, а различиями в сочетании воздействующих или, как он говорил, «элементарных причин».
Раскрывая особенности номографического и идеографического знания, он писал: «Вечные законы сами по себе не в силах объяснить мельчайшаего явления в окружающей нас действительности: высказывая положения, которые вечно и везде имеют силу, они ни слова не говорят о том, что происходит перед нашими глазами. Закон причинной связи между А и а гласит, что везде и всегда, где А будет иметь место, за ним последует а, но он не добавляет, где и когда осуществится А» (Чупров А. А. Очерки по теории статистики. 2-е изд. Спб., 1910. С. 62). Химик раскрыл формулу, выявляющую состав воды – Н2О, но знание той формулы не дает ответа на вопрос о наличии и качестве воды в определенной точке земного пространства в определенное время. Номографическая наука об этом ничего сказать не может – для этого нужны идеографические науки, к числу которых А. А. Чупров и относил статистику, призванную характеризовать в определенных рамках пространства и времени наличие распространенность и характер исследуемых явлений. С другой стороны, приуроченные к конкретному времени и месту идеографические науки не в состоянии познать общие и вечные законы. Этим могут заниматься, по мнению А.А. Чупрова, только номографические науки, использующие особые методы изучения, и в том числе статистический.
А. А. Чупров подчеркивал, что на первый взгляд номографическое познание кажется вообще невозможным в силу противоречия между безграничностью мира и ограниченностью познавательных способностей человека. Тем не менее он считал, что это противоречие разрешимо, если исходить из двух постулатов вечности и неизменности законов и признания теории вероятностей принципиальной основой познания вообще и статистического познания в частности.
Вот как определял смысл и значение первого постулата сам А. А. Чупров: «Если в своей жажде знания мы стремимся к большему нежели к одной систематизации тех случайных обрывков, которые доходят до нас в форме личных восприятий, то необходима такая точка опоры, располагая которою мы были бы в состоянии по тому, что случайно воспринимается нами, делать заключения общаго характера, распространяющияся и на то, что лежит вне сферы нашего непосредственного опыта. Логический механизм анализа и обобщения, сам по себе, не в силах вывести теорию науки из того заколдованного круга, в котором ее держит антиномия ограниченности сил познающего разума и безграничности вселенной, как объекта познания. Точку опоры, которая для этого потребна, дает закон причинности» (Указ. соч. С. 49). И далее: «Опираясь на него как на факт, данный извне и не подлежащий с ее стороны ни проверке, ни обсуждению, теория номографической науки разрубает тот узел, который, казалось, нет возможности распутать. Между явлениями, совершающимися в мире, существует такого рода связь, что в случае, если явление А представляет из себя причину а, то всюду и всегда, где только наблюдается А, за ним неизменно следует а и никогда и нигде не наблюдается а без того, чтобы ему не предшествовало А. Как только мы принимаем это допущение, задача познания мироздания а его необъятности утрачивает свою безнадежность. Для науки открывается возможность движения вперед» (Указ. соч. С. 50).
Однако подобное толкование законов привело к противоречию между переменностью (варьированием) явлений и устойчивостью законов. Среди одного и того же вида нет тех, всегда и везде одинаковых величин, пропорций, соотношений, какие должны были бы соответствовать вечным законам. Противоречие это А. А. Чупров решал с помощью теории множественности причин и следствий, занимающей особое место в системе его статистических взглядов.
Суть этой теории состоит в том, что варьирование явлений и их связей друг с другом объясняется различием в сложности этих явлений, в том круге вечных законов («элементарных причин»), которые определяют собойих существование. Положим, имеются законы, согласно которым за А всегда и везде следует а, за В – b, за С – с и т.д. Положим далее, что существуют три явления: y1=a, y2=a+b, y3=а+b+с. Очевидно, что все три значения у находятся под влиянием одной и той же причины А. Однако у варьирует, а не остается постоянным, что вызвано влиянием дополнительных причин В и С. Аналогично обстоит дело со связью явлений y1, y2, y3 друг с другом. Рассмотрим связь y1=a, y2=a+b. Связьих несомненна – в обоих случаях действует один и тот же фактор А. Но она не является устойчивой и однозначной, поскольку на у2 действует дополнительная причина В. Связь может варьировать, может быть более или менее сильной и за счет этой и других дополнительных причин. Очевидно, например, что связь у1 с у3 слабее, чем с у2, поскольку она нарушается двумя причинам –В и С, а не одной лишь причиной В.
Основываясь на теории множественности причин и следствий, А. А. Чупров делал важные дополнительные выводы о предмете статистического познания: о наличии, наравне с однозначными, функциональными связями, так называемых свободных, многозначных (варьирующих) связей, которые выступают в виде сложного переплетения многих элементарных связей и отношений; о вероятностном (стохастическом) характере вариации, которая вызвана многообразием сочетаний многих устойчивых, не зависимых друг от друга элементарных причин; о вероятности как принципиальной основе измерения свободных связей, обеспечивающей объективное значение полученных при этом статистических характеристик связи.
Соответственно А. А. Чупров определял и принципы номографического познания: «...идеал номографического знания заключается в том, чтобы добраться путем постепеннаго расчленения тех сложных комплексов взаимнообусловленных явлений, которые улавливаются нашим непосредственным опытом, до установления «законов природы» –причинных соотношений между возможно простыми явлениями, между Элементарными причинами и следствиями» (Указ. соч. С. 51).
Он считал, что метод индукции неприменим к варьирующим явлениям, к свободным многозначным связям, которые, по его мнению, могут изучаться только с помощью статистического метода, который он считал особым методом. Только статистика с помощью теории вероятностей может достаточно полно раскрыть вариацию и связи, погасить действие дополнительных причин, расчленить и выявить устойчивые законы, познание которых является конечной целью исследований.
Стохастическая (вероятностная) теория статистики А. А. Чупрова полностью основана на теории вероятностей. Следуя традициям кантианства, он придерживался позиции «объективной вероятности». С этой точки зрения вероятность есть некая характеристика системы объективно существующих возможностей, а не характеристика субъективного знания о предмете вследствие «неполноты знания»), каковой она представлялась, начиная с Лапласа. А. А. Чупров связывал понятие вероятности с понятием свободной причинной связи.
С позиции стохастической статистики, считал Чупров, всякого рода статистические числа, поставляемые наблюдением, следует рассматривать как отображения, лежащие в их основе априорных величин, искаженных более или менее случаем. Каждая статистическая совокупность должна рассматриваться как выборка из некоей генеральной совокупности. Генеральная совокупность описывается априорными величинами, объективно существующими «вне опыта». Статистик же основывается на данных наблюдения, на апостериорных (послеопытных) величинах. Основной из априорных величин является вероятность, лежащая в основе эмпирической (апостериорной) частности; в основе эмпирической средней лежит априорное математическое ожидание данной переменной, которое есть не что иное, как средняя из возможных значений переменной, взвешенная на вероятности этих значений. Точно так же разные эмпирические характеристики изменчивости явлений и зависимости между ними рассматриваются как искаженные случаем отображения лежащих в их основе априорных, вероятностных характеристик. Стоящий на стохастических позициях статистик стремится ясно поставить вопрос о соотношении априорных и апостериорных величин и реализовать приемы выявления первых. Все, что утверждает статистика, должно приниматься во внимание с учетом вероятной ошибки – делал вывод А. А. Чупров.
Общая схема статистического познания, которая дана А. А. Чупровым в последней значительной теоретической работе «Основные задачи стохастической теории статистики» (1925), такова. Сначала, на основе категорий и понятий теории вероятностей (случайные величины, законы распределения и т. п.), намечаются модель предмета статистического познания и соответствующая ей теоретическая система показателей (априорных). Затем строится аналогичная система эмпирических характеристик, вычисляемая по конкретным данным (апостериорным). На заключительном этапе исследования осуществляется оценка, в какой мере эмпирическая система характеристик приближается к теоретической и может быть использована при определении устойчивых законов. На всех трех этапах А. А. Чупров отводит теории вероятностей ведущую роль: на первом – когда конструирование теоретической системы показателей целиком основывается на категориях теории вероятностей; на втором – когда система эмпирических характеристик выступает как простой слепок с теоретических характеристик; на третьем – где единственной объективной основой оценок их соответствия является закон больших чисел.
При условии независимости испытаний эмпирическая частость с ростом числа испытаний стремится к вероятности, эмпирическая средняя– к математическому ожиданию. Увеличением числа испытаний можно повысить вероятность того, что средняя из эмпирических значений переменной и ее математическое ожидание будут сколь угодно близки друг к другу.
Опираясь на работы А. А. Маркова, А. А. Чупрову удалось показать, что могут быть стохастические предпосылки, при которых закон больших чисел теряет свою силу и умножение числа наблюдений уже не повышает степень надежности. Например, при связанности испытаний может быть так, что случайные колебания средней не сводятся к нулю при сколь угодно большом числе испытаний: рассеяние может стремиться с ростом числа испытаний к отличному от нуля пределу. Работы А. А. Чупрова над теорией связанных испытаний имеют практическое значение с точки зрения развития выборочного метода.
Оперируя методом математического ожидания, А. А. Чупров заново переработал всю систему характеристик корреляционной зависимости, созданную английской школой. Ему удалось завершить теорию корреляции между двумя переменными. Если представители английской школы исходили из эмпирических характеристик связи, то А. А. Чупров разбирал прежде всего всевозможные априорные характеристики связи между переменными. Только после построения всех априорных показателейон переходил к разбору эмпирических характеристик зависимости, а затем — к способам перехода от эмпирических характеристик к априорным.
Разработанная А. А. Чупровым теория стохастической статистики отличается логической стройностью, непротиворечивостыо. Однако подчиненность строго определенной концепции обусловила ее ограниченность. В ней нет места проблемам статистического наблюдения, выделения типов явлений, построения систем статистических показателей, т. е. вопросам, традиционным для политико-экономического направления русской статистики. Зато он ясно показал сложность предмета статистического познания и разработал приемы статистического измерения, пригодные и ценные в тех случаях, когда предмету исследования реально присуща устойчивость, когда в нем протекают вероятностные процессы.
Обобщив достижения разных наук, он показал победное шествие статистики как самостоятельного метода научного познания. «Будущий историк человеческой мысли, – писал А. А. Чупров, – окидывая взором современную нам эпоху конца XIX и начала XX веков, отметит, как ее характерную черту, стремление научного знания облекаться в статистические формы. С года в год ширится та область, где мысль человеческая, отказываясь следить за единичными явлениями, сосредоточивается на их совокупном результате, на массовых или средних итогах. Без преувеличения можно сказать: рост современной науки идет под знаком интереса к массовым явлениям, и скоро не будет той ветви знания, куда с большим или меньшим успехом не простирали бы своего влияния статистические формы знания».
А. А. Чупров раскрыл специфику статистического метода, логику статистического дознания. Ему удалось привести «к общему знаменателю» работы английской статистической школы Гальтона–Пирсона (см. гл. 6), связанной преимущественно с биологическими проблемами, имевшей большие достижения в выработке общих приемов изучения вариации и связей, но примитивной с точки зрения методологических основ измерительных приемов, и научной школой статистиков-обществоведов в Германии, возглавляемой Лексисом и связанной прежде всего с исследованием устойчивости статистических чисел., А. А. Чупров синтезировал эти два научных течения на основе целостной концепции – вероятностной точки зрения на теорию статистики, т. е. на основе стохастической статистики. Естественно, что этот синтез не мог произойти без использования достижений русской математической школы. Созданный прежде всего Чебышевым метод математических ожиданий был использован Чупровым как основной инструмент анализа, упорядочения математических основ статистической теории.
Место стохастической теории А. А. Чупрова в истории статистики весьма значительно. Можно соглашаться или не соглашаться с вероятностной статистикой, но во всех случаях труды А. А. Чупрова, раскрывшие теоретические предпосылки данного направления, его философские основы, характер предмета познания, на который оно ориентируется, имеют огромную ценность для любого статистика, желающего понять это направление, определить сферу и возможности применения его методологических рекомендаций. А.А. Чупров оказал большое влияние на распространение вероятностных взглядов как за рубежом, так и в нашей стране. Популяризации стохастической теории статистики во многом способствовали его ученики – О. Н. Андерсон, Н. С. Четвериков, сестры М. М. и Н. М. Виноградовы, Б. И. Карпенко, В. И. Хотимский, Г. С. Полляк и др.
А. А. Чупров разрабатывал и теорию группировок – излюбленный метод земских статистиков. В своей работе «О приемах группировок статистических наблюдений» (Известия С.-Петербургского Политехнического Института. Т. 1. Вып. 1–2. Спб., 1904) он показал, что если непосредственно проводить группировку крестьянских дворов без группировки по общинам, то возможны разнообразные ошибки из-за объединения разнородных элементов и указал приемы правильной группировки.
Положения этой статьи нашли практическое применение в работах земского статистика Григория Ивановича Баскина (1866–1937), выдвинувшего принципы районирования, проведения комбинационных группировок, вторичных группировок при изучении крестьянства.
Кроме трудов в области теории статистики, серьезным вкладом в науку были прикладные работы А.А. Чупрова в области демографии (о соотношении полов среди рождающихся, о влиянии войн на движение населения) экономику (о земельной общине и другие исследования по аграрным вопросам). Но в его творчестве они занимали второстепенное место. Он был и останется в истории науки прежде всего теоретиком статистики.