Статистический инструментарий
В обыденном сознании статистика ассоциируется с «наукой о цифрах», призванной отвечать только на один вопрос: сколько. В самых общих чертах задачи статистики — организация сбора, обработки и анализа информации, а также разработка методов этой работы. Анализ — это прежде всего сравнение, сопоставление статистических данных.
Статистика, которую можно квалифицировать как количественную социальную науку, имеет на вооружении мощные инструменты сбора, измерения и анализа эмпирических данных (статистической информации). Научное определение термина «статистическая информация» — совокупность количественных характеристик социально-экономических явлений и процессов, полученных в результате статистического наблюдения и их обработки соответствующими методами. Чтобы статистической информацией можно было эффективно пользоваться, она должна соответствовать определенным требованиям — быть достоверной, полной, обоснованной, сопоставимой и своевременной.
Объекты статистического наблюдения — общественные явления и процессы — никогда не используются в сыром, необработанном виде. Их переводят на категориальный язык статистики и лишь потом с ними совершают расчетные манипуляции.
Основными категориями, при помощи которых в статистике описываются эмпирические данные, выступают: статистическая совокупность, признак, показатель, вариация, система показателей. Статистическая совокупность — это множество объектов (единиц, фактов, случаев и т.д.) одного и того же вида, подвергаемых статистическому изучению. Объекты, которые образуют совокупность, называются элементами совокупности. Элементы, множество которых образует изучаемую статистикой совокупность, называют ее единицами. Примерами совокупности являются: количество студентов конкретного вуза, множество предприятий одной отрасли производства, представители одной национальности, множество натуральных чисел и т.д. Множество (совокупность) обозначается прописной буквой, а их элементы строчными. Если «а» есть элемент совокупности (множества) А, то в математике используется запись «а»е А. Если «в» не является элементом совокупности А, то пишут «в»е А.
Принадлежность к одному и тому же виду свидетельствует о том, что элементы статистической совокупности однородны. Таково обязательное требование статистики. Без него невозможно провести ни одного измерения, ни одного расчета или группировки. Заработная плата должна измеряться только в рублях или долларах, но не в том и другом одновременно, и уж никак не в чайниках или отпечатанных книгах, которыми в 1990-е расплачивались убыточные предприятия в России. Общее число единиц совокупности называют ее объемом.
Признаки, принимающие различные значения или видоизменения у отдельных единиц совокупности, называются варьирующими, а отдельные их значения или видоизменения — вариантами. Варьирующие признаки подразделяются на атрибутивные (качественные) и количественные.
Признак называется атрибутивным, если отдельные его значения (варианты) выражаются в виде состояния или свойств, присущих явлению. К таким признакам относятся: профессия (врач, токарь, сварщик, швея и т.п.), отраслевая принадлежность предприятий (тяжелое машиностроение, легкая промышленность, сельское хозяйство) и др.
Признак называется количественным, если отдельные его значения (варианты) выражаются в виде чисел. По характеру варьирования количественные признаки подразделяются на дискретные и непрерывные. Дискретными называются количественные признаки, могущие принимать только вполне определенные значения, между которыми не могут появиться промежуточные значения. Варианты дискретных признаков обычно выражаются в виде целых чисел (например, число членов семьи). Количественные признаки, которые могут в определенных пределах принимать любые значения, как целые, так и дробные, называются непрерывными. Такими признаками являются, например, возраст, стаж работы, вес поезда, скорость движения и т.п.
Средством получения статистической информации выступает статистическое наблюдение, которое проводится на основе программы и плана, включающих программно-методологические и организационные вопросы. Статистическим наблюдением называется процесс сбора, группировки, обработки и анализа статистической информации.
Можно выделить еще несколько основных источников получения статистической информации: отчетность, таблицы (сводные, групповые и комбинационные), представляющие результаты статистических группировок, а также обобщающие показатели.
Отчетность — предусмотренная действующим законодательством форма организации статистического наблюдения за деятельностью предприятий и организаций, при которой органы государственной статистики получают информацию в виде установленных отчетных документов (форм отчетности), утвержденных Министерством финансов РФ и Госкомстатом РФ, подписанных лицами, ответственными за достоверность сведений.
К числу главных методов получения данных относятся непосредственное наблюдение, документальное наблюдение и опрос. В основе статистических исследований всегда лежит массовое наблюдение фактов. Чем больше объем наблюдаемых единиц, тем ближе полученные данные к реально действующей закономерности, определяющей поведение изучаемой совокупности. Когда нет возможности обследовать всю совокупность, организуют так называемое выборочное наблюдение.
Большинство социально-экономических явлений носит вероятностный характер. В статистике вероятность — это отношение количества благоприятных исходов к общему количеству возможных исходов. Царством вероятностей и случайных величин заведует закон больших чисел и, как производное от него, нормальное распределение.
Для более точного и полного описания массовых явлений используются такие статистические показатели, как средние величины и показатели вариации. Средняя величина — это обобщающая характеристика изучаемого признака совокупности, она отражает то общее, что присуще всем единицам данной совокупности. Выбор вида средней величины и способов расчета зависит от целей анализа и характеристик совокупности. Средние используются как для сравнения различных совокупностей между собой, так и для ана-
лиза изменений одной и той же совокупности во времени. Показатели вариации описывают разброс значений совокупности. Основные показатели вариации — это размах вариации, дисперсия и коэффициент вариации. Полезную информацию для социолога дает анализ и сравнение средних величин и показателей вариации. Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%.
Над статистическими данными осуществляют две процедуры, которые называют предварительной обработкой, — сводку и группировку. Они проводятся
для упорядочения данных и подготовки их к последующему анализу. Статистическая сводка — это научно организованная обработка материалов наблюдения, включающая систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов и других показателей.
Распределение элементов по соответствующим группам представляет собой процесс классификации, т.е. отнесение того или иного элемента к определенному классу на основе соответствующих критериев или параметров. Так группируют отрасли промышленного производства исходя из их особенностей (металлургия черная, цветная).
Группировку понимают как упорядочение данных по какому-либо статистическому признаку. Выбор признака для классификации и группировки осуществляется в соответствии с целями и гипотезами исследования. Группировка может проводиться на основе выделения номинальных групп (по полу, уровню квалификации, национальности и т.д.) или по какому-либо возрастающему или убывающему количественному признаку (например, по уровню заработной платы: от 1 до 10 минимальных размеров оплаты труда, от 11 до 20, от 21 до 30 и т.д.).
Важнейшим приемом приведения исходных материалов к удобному для сравнения виду является расчленение разнородных величин на однородные. Выделив в разнородной совокупности признак, характеризующий тот или иной социальный объект, однородные типы и группы в ряде структурных частей этого объекта, можно сравнивать типы или группы друг с другом. Признак (свойство объекта), по которому проводится группировка, называется группировочным признаком, или основанием группировки.
В качестве основных принципов процедуры группировки выступают: расчленение разнородных явлений на однородные; нахождение общих и однотипных явлений; определение признаков, по которым следует разграничивать типы; определение интервалов перехода от одного типа к другому.
В социологических исследованиях применяются самые разные виды группировки: 1) группировка при помощи простого суммирования однородных признаков, благодаря чему определяются абсолютные числа и проявления в изучаемой совокупности; 2) ранжирование, т.е. группировка изучаемых единиц совокупности в зависимости от возрастания или убывания изучаемого признака; 3) группировка на основе логически выделенных признаков при помощи заранее разработанной порядковой или интервальной шкалы, каждый
интервал которой выражает уровень или степень проявления изучаемого признака; 4) табулирование, т.е. построение статистических таблиц, графиков (в социологических исследованиях оно является наиболее распространенным).
Самым простым способом группировки является группировка путем простого суммирования однородных признаков. В то же время этот вид группировки служит основным звеном для перехода от абсолютных чисел к относительным (процентам, средним величинам и т.д.), являющимся основными характеристиками группировки. Достаточно проста группировка при помощи ранжирования, которое позволяет выявить динамику изучаемого признака в различных совокупностях. Группировка на основе логически выделенного одного или нескольких признаков отличается от предыдущих группировок тем, что предполагает глубокий теоретический, т.е. содержательный, анализ особенностей изучаемых социальных явлений. Поэтому главное значение здесь приобретает правильный выбор группировочных признаков4.
Чаще всего применяются такие признаки, как пол, возраст, образование, классовая принадлежность и т.п. Результат группировки единиц наблюдения по одному какому-либо признаку называется статистическим рядом. Распределение частот признака в совокупности называется вариационным рядом.
Группировка, или расчленение совокупности данных на однородные группы, выступает стартовой площадкой для последующею использования множества самых разнообразных и интересных статистических методов, в том числе корреляционного и дискриминантного.
Группировку можно рассматривать как первый шаг к дискриминантному анализу, который исследует различия между группами. С его помощью можно установить, в частности, различия между тремя группами людей, выбравших определенную профессию (например, юрист, физик, инженер), основываясь на их успехах в школе по определенным дисциплинам. Такой метод объясняет выбор профессии успехами по определенным предметам.
Изучая социально-экономические явления, статистика использует абсолютные и относительные величины. Абсолютные величины — это именованные числа. Каждая из них обязательно имеет единицу измерения: штуки, тонны, метры, рубли, киловатты, годы и пр. Единицы измерения подразделяются на натуральные, стоимостные и др. По способу выражения размеров изучаемых явлений абсолютные величины подразделяются на индивидуальные и суммарные, которые представляют собой один из видов обобщающих величин. Иногда одна натуральная единица измерения недостаточна для характеристики изучаемого явления, в подобных случаях используют вторую единицу в сочетании с первой. Поэтому в практике натуральные единицы измерения могут быть составными. Так, трудовые затраты в торговле измеряются числом работников и количеством человеко-часов (чел./ч), человеко-дней (чел./дней), работа транспорта выражается в тонно-километрах (т/км).
Относительные величины показывают отношения между абсолютными величинами, они представляют собой частное от деления двух статистических величин и характеризуют количественное соотношение между ними. Наиболее распространенный тип относительных величин — проценты. Относительные величины значительно облегчают сравнение и анализ статистических данных.
Словарь прикладной социологии / [Сост. К.В. Шульга; Редкол.: Г.П. Давидкж (отв. ред.) и др.]-Минск: Изд-во «Университетское», 1984. С. 28.
При расчете относительных величин следует иметь в виду, что в числителе всегда находится показатель, отражающий то явление, которое изучается, т.е. сравниваемый показатель, а в знаменателе — показатель, с которым производится сравнение, принимаемый за основание, или базу сравнения. База сравнения выступает в качестве своеобразного измерителя. В зависимости от того, какое числовое значение имеет база сравнения (основание), результат отношения может быть выражен либо в форме числа (коэффициента) или процента, либо в форме промилле или децимилле.
Если значение основания или базы сравнения принимается за единицу (приравнивается к единице), то относительная величина (результат сравнения) является коэффициентом и показывает, во сколько раз изучаемая величина больше основания. Расчет относительных величин в виде коэффициента применяется в том случае, если сравниваемая величина существенно больше той, с которой она сравнивается.
Если значение основания или базу сравнения принять за 100%, результат вычисления относительной величины будет выражаться также в процентах. В тех случаях, когда базу сравнения принимают за 1000% (например, при исчислении демографических коэффициентов), результат сравнения выражается в промилле (%о). Относительные величины могут быть выражены и в децимилле (%оо), если основание отношения равно 10 000.
Форма выражения относительных величин зависит от количественного соотношения сравниваемых величин, а также от смыслового содержания полученного результата сравнения. В тех случаях, когда сравниваемый показатель больше основания, относительная величина может быть выражена или коэффициентом, или в процентах. Когда сравниваемый показатель меньше основания, относительную величину лучше выразить в процентах; если же сравнительно малые по числовому значению величины сопоставляются с большими, относительные величины выражаются в промилле. Так, в промилле рассчитываются коэффициенты рождаемости, смертности, естественного и механического прироста населения.
Расчет относительных величин считается правильным, если для сравнения используются сопоставимые показате ли. К несопоставимости показателей чаще всего приводят различия в методологии сбора, обработки статистической информации, в длительности периодов времени, за которые исчислены сравниваемые показатели, и др.
Для характеристики структурысовокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода и медиана.
Модой называется чаще всего встречающийся вариант, или то значение признака, которое соответствует максимальной точке теоретической кривой распределений. Она представляет собой наиболее часто встречающееся или типичное значение. В дискретном ряду мода — это вариант с наибольшей частотой. В интервальном вариационном ряду модой приближенно считают центральный вариант так называемого модального интервала, т.е. того интервала, который имеет наибольшую частоту (частость). Мода — это именно то число, которое в действительности встречается чаще всего (является величиной определенной), а в практике имеет самое широкое применение (например, наиболее часто встречающийся тип покупателя).
Медиана — величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая — большие. Понятие медианы легко уяснить из следующего примера. Для ранжированного ряда (т.е. построенного в порядке возрастания или убывания индивидуальных величин) с нечетным числом членов медианой является вариант, расположенный в центре ряда. В интервальном вариационном ряду порядок нахождения медианы следующий: располагаем индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находим медианный интервал5.
Относительные величины структуры характеризуют состав изучаемых совокупностей. Исчисляются они как отношение абсолютной величины каждого из элементов совокупности к абсолютной величине всей совокупности, т.е. как отношение части к целому, и представляют собой удельный вес части в целом. Как правило, относительные величины структуры выражаются в процентах (база сравнения принимается за 100). Показатели структуры могут быть выражены также в долях (база сравнения принимается за единицу).
Для изучения изменений объекта во времени строят ряды динамики. Ряд динамики — это ряд расположенных в хронологической последовательности числовых значений статистического показателя, характеризующих изменение общественных явлений во времени.
В каждом ряду динамики имеются два основных элемента:
1) показатель времени /;
2) соответствующие ему уровни развития изучаемого явления у.
В качестве отчета времени в рядах динамики выступают либо определенные даты (моменты) времени, либо отдельные периоды (годы, кварталы, сутки).
Уровни рядов динамики отображают количественную оценку (меру) развития во времени изучаемого явления. Их можно выражать абсолютными, относительными или средними величинами. В зависимости от характера изучаемого явления уровни рядов динамики могут относиться или к определенным датам (моментам) времени, или к отдельным периодам. В соответствии с этим ряды динамики подразделяются на моментные и интервальные: моментныеряды динамики отображают состояние изучаемых явлений на определенные даты (моменты) времени; интервальные ряды динамики отображают итоги развития (функционирования) изучаемых явлений за отдельные периоды (интервалы) времени. Особенностью интервального ряда динамики является то, что каждый его уровень складывается из данных за более короткие интервалы (субпериоды) времени. Свойство суммирования уровней за последовательные интервалы времени позволяет получать ряды динамики более крупных периодов.
Статистическое отображение развития изучаемого явления во времени может быть представлено рядами динамики с нарастающими итогами. Их применение обусловлено потребностями отображения результатов развития изучаемых показателей не только заданный отчетный период, но и с учетом предшествующих периодов. При составлении таких рядов производится последовательное суммирование смежных уровней. Этим достигается суммарное обобщение результата развития изучаемого показателя с начала отчетного периода (месяца, квартала, года и т.д.).
Подробнее см.: http://lib.wsu.ru/books/Bakalavrf)2/page0142.asp
При использовании рядов динамики применяется специальная система показателей динамики, куда включаются: абсолютный прирост (сокращение), темп и коэффициент роста, темп и коэффициент прироста, абсолютное значение одного процента прироста. Важнейшим статистическим показателем анализа динамики является абсолютное изменение — абсолютный прирост (сокращение). Абсолютное изменение характеризует увеличение или уменьшение уровня ряда за определенный промежуток времени. Абсолютный прирост с переменной базой называют скоростью роста.
Для характеристики интенсивности, т.е. относительного изменения уровня динамического ряда за какой-либо период времени, исчисляют темпы роста (снижения). Интенсивность изменения уровня оценивается отношением отчетного уровня к базисному. Показатель интенсивности изменения уровня ряда, выраженный в долях единицы, называется коэффициентом роста, а в процентах — темпом роста. Эти показатели интенсивности изменения отличаются только единицами измерения. Коэффициент роста (снижения) показывает, во сколько раз сравниваемый уровень больше уровня, с которым производится сравнение (если этот коэффициент больше единицы), или какую часть уровня, с которым производится сравнение, составляет сравниваемый уровень (если он меньше единицы).
Темп прироста (сокращения) показывает то, на сколько процентов сравниваемый уровень больше или меньше уровня, принятого за базу сравнения, и вычисляется как отношение абсолютного прироста к абсолютному уровню, принятому за базу сравнения. Темп прироста может быть положительным, отрицательным или равным нулю, выражается он в процентах, коэффициент прироста выражается в долях единицы. Темп прироста (сокращения) можно получить и из темпа роста, выраженного в процентах, если из него вычесть 100%. Коэффициент прироста получается вычитанием единицы из коэффициента роста6.
Из вышеизложенного можно сделать несколько обобщающих выводов. В основе расчета показателей рядов динамики лежит сравнение его уровней. В зависимости от применяемого способа сопоставления показатели динамики могут вычисляться на постоянной (базисный способ) и переменной (цепной способ) базе сравнения. Ряды динамики формируются в результате сводки и обработки материалов периодического наблюдения. Повторяющиеся во времени (по отчетным периодам) значения одноименных показателей в ходе статистической сводки систематизируются в хронологической последовательности. Для получения научно обоснованных выводов о динамике явления статистические данные должны быть сопоставимыми.
Статистика не ограничивается простым описанием явлений, даже если они сгруппированы и переведены в средние величины. У нее есть куда более важная задача — выявить статистические закономерности, т.е. устойчивые связи между явлениями. Наличие и тесноту (силу) связи можно установить, пользуясь регрессионным и корреляционным анализом. Цель корреляционного анализа — измерение тесноты связи между признаками и явлениями. Наличие связи между явлениями совсем не означает, что одно явление служит причиной другого.
Коэффициент корреляции позволяет выявить и количественно оценить взаимосвязь между двумя переменными. Он может показывать степень идентично-
6 Подробнее см.: Гусаров В.М. Теория статистики. М: Юнити, 1998; Ряузов Н.Н. Общая теория статистики. М.: Статистика, 1980; Экономическая статистика: Учебник/ Под ред. Ю.Н. Иванова. М.: ИНФРА, 1998.
ста характеристик, сравниваемых групп (например, ценностей или доходов), i также степень взаимосвязи между двумя признаками социального объекта (например, зависимость конкретных политических ориентации от величины совокупного дохода). При одновременном возрастании переменных корреляцш называется положительной. Тогда же, когда возрастание одной переменно! связано с уменьшением другой, корреляция считается отрицательной. Крайни* значения коэффициента корреляции обозначаются (+) и (-). В том случае, earn величина коэффициента корреляции составляет (+), можно говорить о тожде стве, если — (-), то о полной обратной зависимости (когда величина одного при знака максимальна, то другого — минимальна). Иногда с помощью коэффици ента корреляции можно установить причинно-следственные связи7.
Более глубоко раскрыть характер взаимосвязи между переменными позволя етрегрессионный анализ, используя который можно установить характер и фор му зависимости результативного признака от объясняющих. Задачи регрессион ного анализа — выбор формы связи (например, прямая или обратная, функцио нальная или стохастическая) и определение расчетных значений зависимо! переменной (функции регрессии). Факторный анализ способствует определен™ степени взаимосвязи между непосредственно не наблюдаемыми переменным! (факторами) и эмпирически наблюдаемыми признаками.
Для анализа сложных социально-экономических явлений и процессов ис пользуется такой вид статистических показателей, как индексы. Индекс — этс относительный показатель, характеризующий изменение величины какого либо объекта во времени, пространстве или по сравнению с эталоном. Ohi позволяют привести разнородные явления к соизмеримым величинам. Ин дексы разделяют на индивидуальные, характеризующие изменение одноп элемента совокупности, и общие (сводные), при помощи которых можж описать всю совокупность, процесс или явление. По способу построения ин дексы классифицируются на агрегатные и средние. Основное отличие агре гатного индекса состоит в том, что при его расчете только одна величина из меняется, а другая остается неизменной. Индексный метод широко используется как для оценки различных социально-экономических явлений и процессов, так и в аналитических целях.
Основные способы представления результатов статистических наблюдений —таблицы и графики. Статистический график — это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются спомощью условных геометрических образов ИЛИ знаков. График позволяет сделать рис 2 статистический графин...
представление данных гораздо более на- описывается с помощью условныхГЛЯДНЫМ И ДОСТУПНЫМ8. геометрических образов или знаков
Казаринова Н.В., Филатова О.Г., Хренов А.Е. Социология. Учебник для вузов/ Под ред. ГС. Бать гина. М.: NOTA BENE, 1999.
При подготовке данного материала использовалась информация с веб-сайтов: http:/ www.buhgal.narod.ru/BOOKS/book4_sum.html; http://www.statsoft.ru/home/textbook/modules stbasic.html; http://www.saslib.ru/ref/arh/25/STATIST/Index.txt
РОЛЬ И СОДЕРЖАНИЕ СТАТИСТИЧЕСКОГО ВЫВОДА
Кроме логического и теоретико-гипотетического выводов, рассмотренных выше, существует еще третий — статистический вывод, о котором здесь пойдет речь.
Приводным ремнем эмпирического исследования выступают специальные математические процедуры, в основе которых лежит теория вероятностей, определяющая технологию составления выборочной совокупности и электронной обработки данных. К ней тесно примыкает процедура эмпирического обобщения, называемая еще статистическим выводом. В его основе лежит индукция (от лат. inductio — наведение) —умозаключение, идущее от фактов к выводу.
Статистический вывод — это индуктивное обобщение, построенное на основе математической обработки и обобщения некоторого множества единиц исследования. Например, вы опросили 1500 избирателей и выяснили, что более 60% пожилых людей (старше 60 лет) на последних выборах голосовали за коммунистов. В данном случае изучалась статистическая связь двух переменных: возраст и электоральное поведение. В результате можно сделать статистический вывод: чем старше возраст респондента, тем выше вероятность того, что он проголосует за коммунистов. И наоборот.
В основе статистического вывода лежит индуктивное рассуждение, приводящее к утверждениям, верным лишь с определенной степенью достоверности. Строгий смысл степени достоверности обеспечивается математическими методами и вероятностным подходом, образующими основы современной статистической теории9.
Статистический вывод социолог получает после обработки анкет и анализа первичных данных. Это количественный вывод. В отличие от него два других рассмотренных ранее типа вывода — логический и теоретико-гипотетический — являются качественными. Связь между ними следующая. При составлении программы исследования ученый теоретически постулирует (строит теоретическую гипотезу) возможность связи между двумя переменными — возрастом и электоральным поведением. После составления анкеты и проведения исследования при математической обработке данных строится статистический вывод. Это две стороны одной медали: первая служит пробным проектом, теоретическим макетом возможной связи двух переменных, а вторая — его эмпирическим подтверждением.
Статистический вывод невозможно делать на малых совокупностях, например в 35 респондентов. Если в вашей анкете есть вопросы, к которым предусмотрено, скажем, по 5—7 вариантов ответов, то, разделив 35 на 7, получим 5. А каждая ячейка должна содержать не менее 7 единиц. «Статистический вывод начинает работать тогда, когда единиц исследования достаточно много. Достаточно много означает, что при условии равновероятного попадания в каждую клетку пространства признаков наполнение каждой из них составит не менее семи единиц»10. Одна статистическая ячейка — это один признак. Допустим, вы
9 Рао СР. Линейные статистические методы и их применение. М., 1968.
10 Батыгин Г.С. Лекции по методологии социологических исследований: Учеб. для высших учебныхзаведений. М., 1995. С. 67.
спрашиваете респондента о том, за какую партию он будет голосовать, и пред лагаете на выбор 7 наиболее крупных российских партий. В этом списке одн партия — это один признак или одна ячейка. Ее должны наполнить не мене> 7 респондентов. Конечно, чем их больше, тем меньше вероятность ошибки, по этому статистический вывод хорошо работает на больших выборках.
Изюминка эмпирического исследования выражается именно в этом тре тьем виде вывода — в статистическом. Дело в том, что теоретическое иссле дование, не прибегающее к полевому наблюдению или массовому опросу вполне может содержать и логический, и теоретико-гипотетический выво ды. Очень многие исследования именно этим и ограничиваются. В эмпири ческом же исследовании социолог может сделать вывод: «во-первых, сколь ко людей подпадает под значение переменной, т.е. наполнение класса, во вторых, каково распределение частот по всему континууму переменной в-третьих, как меняется распределение при введении в группировку второ го, третьего и энного признаков, и, в-четвертых, имеется ли связь между при знаками и насколько она меняется в различных контекстах»''.
Статистические связи выполняют ту же функцию цементирования эмпи рических фактов, которую в теоретическом знании выполняет логика. Ста тистические закономерности, статистические правила — это логика эмпири ческого знания, механизм его построения.
Статистический вывод — область вероятностного знания.Вероятность -числовая характеристика степени возможности появления какого-либо сл> чайного события при тех или иных определенных, могущих повторяться не ограниченное число раз условиях. Она изучается в теории вероятностей— ра: деле математики, в котором по данным вероятностям одних случайных ее бытии находят вероятности других событий, связанных каким-либо образо с первыми. Математическая статистика,наука о математических методах cv стематизации и использования статистических данных, опираясь на теори] вероятностей, позволяет оценить, в частности, необходимый объем выбор ки для получения результатов требуемой точности при выборочном обагк довании. Одна из основных задач теории вероятностей состоит в выяснени закономерностей, возникающих при взаимодействии большого числа случаг ных факторов. Математическая статистика понимается также как наука методах умозаключения о свойствах соответствующей генеральной совокуг ности на основе наблюдений над репрезентативной выборочной совокупне стью, причем данные наблюдений отбираются из генеральной совокупное ти в случайном порядке. Математическая статистика занимается как статр стическим описанием результатов опытов или наблюдений, так построением и проверкой подходящих математических моделей, содержащг понятие вероятности.
Когда мы находим количественную меру, то автоматически переходим мир вероятностных утверждений. Мы можем сказать, что с достоверность* равной 60-70%, женщины склонны выбирать в качестве брачного партнер мужчину с высшим образованием. Здесь процентная доля, которая заменж размытые формулировки типа «некоторые», «большинство» или «часть», ш казывает степень вероятности наступления данного события. Но наука м( жет ошибаться в своих прогнозах. Человек непредсказуем в своих действ!
Ьатыгин Г.С.Лекции по методологии социологических исследований. М., 1995. С. 68.
ях, еще менее предсказуемы массы людей, которые, объединяясь, часто ведут себя не так, как повела бы сумма разрозненных индивидов.
Весь математический аппарат социологии построен на вероятностях, описываемых в процентных распределениях. Мы говорим: 72% избирателей данного округа проголосуют за кандидата М. Это значит, что с вероятностью в 72% избиратели на предстоящих выборах отдадут предпочтение именно ему. Добавим сюда ошибку выборки, скажем, в 5% и можем утверждать, что избиратели проголосуют за М с вероятностью 72±5%.
Степень вероятности свидетельствует, во-первых, об ограниченных возможностях самой науки, во-вторых, о непредсказуемости, вариативности или изменчивости поведения объекта исследования, в-третьих, о высокой культуре научного исследования, которая выражает себя требованием осторожно судить о реальности.
Статистический вывод основан на статистическом анализе результатов выборочных исследований и направлен на оценку параметров совокупности в целом. В таком случае результаты выборочных исследований выступают всего лишь отправной точкой для получения общих выводов. Например, автомобилестроительная компания провела два независимых исследования с целью определения степени удовлетворенности потребителей своими автомобилями. Первая выборка включала 100 потребителей, купивших данную модель в течение последних шести месяцев, вторая выборка включала 1000 потребителей. В ходе телефонного интервьюирования респонденты отвечали на вопрос: «Удовлетворены или не удовлетворены вы купленной вами моделью автомобиля?» Первый опрос выявил 30% неудовлетворенных, второй — 35%.
Поскольку существуют ошибки выборки и в первом, и во втором случаях, то здесь можно рассуждать следующим образом. В первом случае около 30% опрошенных выразили неудовлетворенность купленной моделью автомобиля, во втором случае — около 35% опрошенных. Какой же общий вывод можно сделать в данной ситуации? Как избавиться от слова «около»? Для этого введем показатель ошибки: 30%±х% и 35%±.у% и сравним хну. Используя логический анализ, можно прийти к заключению, что большая выборка содержит меньшую ошибку и что на ее основе можно сделать более правильные выводы о мнении всей совокупности потребителей, т.е. решающим фактором правильности выводов является размер выборки. Показатель ошибки присутствует во всех формулах, определяющих содержание различных методов статистического вывода12.