Развитие и новая интерпретация статистических методов
Раздел статистического наблюдения был традиционным для русской статистики. Создание теории сбора статистических данных, обеспечения их достоверности и сопоставимости обусловлено сложностью социально-экономических явлений, множеством их свойств, среди которых нужно выбрать основные, подлежащие регистрации, наличием человеческого фактора, влияющего на достоверность данных. Включение этого раздела в курс общей теории статистики свидетельствовало о признании советской статистикой необходимости адаптации статистического метода к специфике изучаемого объекта.
Советскими статистиками разработана теория типологический группировки, основанная прежде всего на трудах В.И. Ленина, на его указании, что группировки необходимы для изучения «всех наметившихся – или намечающихся (это не менее важно) – в жизни типов..»(Полн. собр. соч. Т.2. С. 277). Исходя из ленинского положения о том, что «вопрос о группировке материала вовсе не является ... узкотехническим, узкоспециальным вопросом...» (Полн. собр. соч. Т.27. С. 182), в теории группировки подчеркивалась роль качественного анализа, неформальный характер всей процедуру группировки (выбора группировочных признаков, границ интервалов). Именно поэтому априорный анализ изучаемой совокупности и составление перечня всех тех типов явлений, которые могли бы возникнуть в рамках изучаемого процесса, составляет первый этап типологической группировки. Таким образом, группировке в зарубежной статистике как чисто техническому приему (способу представления данных в компактной форме), в советской статистике противостоит содержательная группировка – группировка по типам.
Из-за внедрения в науку социально-классового подхода задача выделения типов заслонила другие более формальные, но тем не менее необходимые задачи группировок – выявление структуры данных, взаимосвязи между признаками. Позднее, в 50-х годах в учебниках по общей теории статистики появилось положение о трех задачах, решаемых группировками и соответственно о трех видах группировок: типологической, аналитической, структурной.
Следуя указаниям В.И. Ленина, советские статистики (Хрящева, Немчинов, Смит, Некраш и др.) ввели в теорию группировок специализацию интервалов и группированных признаков как способ разного описания типов (или разной длины их описания).
Группировка по типам тесно связана со сводкой, однако в 30–40-е годы эта связь еще не была вполне раскрыта. В сводке пока что только продолжались традиции русской статистики (Янсона, Кауфмана и др.) по определению видов таблиц, видов показателей, организации и техники сводки.
Советским статистикам удалось внести новое в способы определения средних величин (связь средних с группировкой, обусловленность формы средней структурой связи между признаками). Уже в первое издание учебника А.Я. Боярского, В.Н. Старовского, В.И. Хотимского, Б.С. Ястремского «Теория математической статистики» (М., 1930) вошел важный для теории средних величин раздел А.Я. Боярского об «определяющем свойстве» средних. Суть его сводится к следующим требованиям определения средних:
1) погашение варьирования признака, по которому отыскивается средняя, не должно нарушать размеров признака по совокупности в целом, т. е. должно быть соблюдено равенство:
Количественное выражение этого признака по совокупности выступает как «определяющее свойство», обусловливающее способ расчета средней величины;
2) при установлении «определяющего свойства» следует учитывать связи осредняемого признака с другими признаками. Различие этих связей определяет возможность применения разных форм средних. Например, если в качестве определяющего свойства выступает сумма значений самого осредняемого признака у, то уравнение средней, обеспечивающее сохранение этого свойства с переходом от конкретных значений данного признака yi к средней имеет вид:
.
Отсюда .
Если же «определяющим свойством» выступает равенство
,
или
.
Положение об «определяющем свойстве» средней учитывает реальные связи признаков, в которые включен осредняемый признак. Из этого Боярский в учебнике «Статистика» сделал логическое заключение: «Дело определения того, каким образом количественное выражение выбранного свойства складывается под влиянием величин – это дело теории той области, к которой относится изучаемый коллектив. Иной подход может вытекать только из формалистической теории статистической совокупности, для которой есть лишь «общий признак», лишенный всякого качества, а практически в вычислении средней ведет к произволу и субъективизму» (Там же. С. 310).
Положение об «определяющем свойстве» оказало влияние на последующее развитие теории средних в трудах советских статистиков (Пасхавер и др.), на изучение связей (Некраш и др.).
Между задачей измерения связей и теорией средних была установлена связь: при функциональных (жестко детерминированных) связях «определяющее свойство» средних использовалось при вычислении коэффициента связи. Характерно, что в учебнике «Статистика» (1932) построение уравнения регрессии (или, как его называли авторы, «уравнения прогрессии»), рассматривалось на примере функциональной связи. Соответственно метод наименьших квадратов выступал как средство определения средних величин признаков, непосредственно не измеренных. Качественный анализ выдвигался как единственная основа определения формы уравнения регрессии. Такой подход отличался от формализма математической статистики; но при изучении стохастических связей без «формализма» не обойтись: качественный анализ должен дополняться количественным (из класса функций, удовлетворяющих теоретическим предпосылкам, предпочтение должно быть отдано той функции, которая обеспечивает минимум остаточной дисперсии результативного признака, если нет каких-либо дополнительных ограничений).
Уравнения связи, основанные на жесткой детерминации связей, рассматривал и Некраш (так называемые «системные уравнения»). Как особый прием статистического анализа жестко детерминированных связей рассматривался балансовый метод (см., например, В.В. Дьяконов, А.А. Троицкий. Балансовый метод в статистике.–В кн.: А.А. Кауфман. Теория и методы статистики, 1928. С. 591).
Логическим следствием анализа системы признаков и функциональных связей между ними был следующий вывод, сделанный в учебнике «Статистика»: индексный метод – один из способов изучения связей. Но авторы этого учебника в большей мере придерживались синтетической концепции индексов, т. е. они определяли индексы как относительные величины, характеризующие количественную динамику явлений, состоящих из ряда разнородных элементов, т. е. явлений, абсолютный уровень которых не может быть измерен путем сложения абсолютных уровней их элементов (Указ. соч. С. 359). Тем самым на первый план выдвигалась синтетическая функция индекса, которая не исключала понимания индекса как средней из относительных величин. «Определяющее свойство» средней помогало правильно решить вопрос о форме средней индекса из индивидуальных. Говоря об «индексах в системе показателей», авторы учебника «Статистика» приблизились к аналитической концепции индексов, которая впоследствии стала ведущей в советской статистике. Последовательная трактовка индексов как аналитических показателей впервые в советской статистике была дана Л. В. Некрашем: «...термин «индекс цен», мы не должны воспринимать как показатель изменения «уровня» цен, а как показатель относительной динамики оборота под влиянием изменения цен и при постоянстве товарной массы...» (Некраш Л.В. Курс общей теории статистики. 1939. С. 286). Трактовка индекса только как синтетического или только как аналитического показателя далеко не всегда уместна. Индекс оценивает влияния изменения фактора на результативный признак и при этом измеряет и изменение самого фактора.
Авторы учебника «Статистика» подчеркивали, что выравненные уровни («абстрактная динамика») выражают «количественную закономерность присущего данному явлению движения... как менялся бы данный ряд под влиянием одних только существенных связей, не затушеванных целым рядом несущественных связей» (Указ. соч. С. 558). Из этого следовала невозможность формального определения «абстрактной динамики». Это был очень важный вывод, которым подчеркивалось значение содержательного анализа для решения вопроса о форме уравнения тренда. Кроме того, указывалось, что выравнивание динамического ряда возможно только после проведения периодизации динамики.