Статистический инструментарий

В обыденном сознании статистика ассоциируется с «наукой о цифрах», призванной отвечать только на один вопрос: сколько. В самых общих чертах задачи статистики — организация сбора, обработки и анализа информации, а также разработка методов этой работы. Анализ — это прежде всего сравне­ние, сопоставление статистических данных.

статистический инструментарий - student2.ru

Статистика, которую можно квалифи­цировать как количественную соци­альную науку, имеет на вооружении мощные инструменты сбора, измерения и анализа эмпирических данных (стати­стической информации). Научное опреде­ление термина «статистическая информа­ция» — совокупность количественных характеристик социально-экономичес­ких явлений и процессов, полученных в результате статистического наблюдения и их обработки соответствующими метода­ми. Чтобы статистической информацией можно было эффективно пользоваться, она должна соответствовать определен­ным требованиям — быть достоверной, полной, обоснованной, сопоставимой и своевременной.

Объекты статистического наблюде­ния — общественные явления и процессы — никогда не используются в сы­ром, необработанном виде. Их переводят на категориальный язык статистики и лишь потом с ними совершают расчетные манипуляции.

Основными категориями, при помощи которых в статистике описываются эмпирические данные, выступают: статистическая совокупность, признак, по­казатель, вариация, система показателей. Статистическая совокупность — это множество объектов (единиц, фактов, случаев и т.д.) одного и того же вида, подвергаемых статистическому изучению. Объекты, которые образуют сово­купность, называются элементами совокупности. Элементы, множество ко­торых образует изучаемую статистикой совокупность, называют ее единицами. Примерами совокупности являются: ко­личество студентов конкретного вуза, множество предприятий одной отрасли статистический инструментарий - student2.ru производства, представители одной на­циональности, множество натуральных чисел и т.д. Множество (совокупность) обозначается прописной буквой, а их элементы строчными. Если «а» есть эле­мент совокупности (множества) А, то в математике используется запись «а»е А. Если «в» не является элементом совокупности А, то пишут «в»е А.

Принадлежность к одному и тому же виду свидетельствует о том, что эле­менты статистической совокупности однородны. Таково обязательное требова­ние статистики. Без него невозможно провести ни одного измерения, ни одно­го расчета или группировки. Заработная плата должна измеряться только в руб­лях или долларах, но не в том и другом одновременно, и уж никак не в чайниках или отпечатанных книгах, которыми в 1990-е расплачивались убыточные пред­приятия в России. Общее число единиц совокупности называют ее объемом.

Признаки, принимающие различные значения или видоизменения у от­дельных единиц совокупности, называются варьирующими, а отдельные их значения или видоизменения — вариантами. Варьирующие признаки под­разделяются на атрибутивные (качественные) и количественные.

Признак называется атрибутивным, если отдельные его значения (вари­анты) выражаются в виде состояния или свойств, присущих явлению. К та­ким признакам относятся: профессия (врач, токарь, сварщик, швея и т.п.), отраслевая принадлежность предприятий (тяжелое машиностроение, легкая промышленность, сельское хозяйство) и др.

Признак называется количественным, если отдельные его значения (ва­рианты) выражаются в виде чисел. По характеру варьирования количествен­ные признаки подразделяются на дискретные и непрерывные. Дискретны­ми называются количественные признаки, могущие принимать только вполне определенные значения, между которыми не могут появиться промежуточ­ные значения. Варианты дискретных признаков обычно выражаются в виде целых чисел (например, число членов семьи). Количественные признаки, которые могут в определенных пределах принимать любые значения, как целые, так и дробные, называются непрерывными. Такими признаками явля­ются, например, возраст, стаж работы, вес поезда, скорость движения и т.п.

Средством получения статистической информации выступает статисти­ческое наблюдение, которое проводится на основе программы и плана, вклю­чающих программно-методологические и организационные вопросы. Ста­тистическим наблюдением называется процесс сбора, группировки, обработ­ки и анализа статистической информации.

Можно выделить еще несколько основных источников получения стати­стической информации: отчетность, таблицы (сводные, групповые и комби­национные), представляющие результаты статистических группировок, а также обобщающие показатели.

Отчетность — предусмотренная действующим законодательством фор­ма организации статистического наблюдения за деятельностью предприятий и организаций, при которой органы государственной статистики получают информацию в виде установленных отчетных документов (форм отчетности), утвержденных Министерством финансов РФ и Госкомстатом РФ, подписан­ных лицами, ответственными за достоверность сведений.

К числу главных методов получения данных относятся непосредственное наблюдение, документальное наблюдение и опрос. В основе статистических исследований всегда лежит массовое наблюдение фактов. Чем больше объем наблюдаемых единиц, тем ближе полученные данные к реально действую­щей закономерности, определяющей поведение изучаемой совокупности. Когда нет возможности обследовать всю совокупность, организуют так на­зываемое выборочное наблюдение.

Большинство социально-экономических явлений носит вероятностный характер. В статистике вероятность — это отношение количества благопри­ятных исходов к общему количеству возможных исходов. Царством вероят­ностей и случайных величин заведует закон больших чисел и, как производ­ное от него, нормальное распределение.

Для более точного и полного описания массовых явлений используются такие статистические показатели, как средние величины и показатели вари­ации. Средняя величина — это обобщающая характеристика изучаемого при­знака совокупности, она отражает то общее, что присуще всем единицам данной совокупности. Выбор вида средней величины и способов расчета за­висит от целей анализа и характеристик совокупности. Средние использу­ются как для сравнения различных совокупностей между собой, так и для ана-

лиза изменений одной и той же совокупности во времени. Показатели вари­ации описывают разброс значений совокупности. Основные показатели ва­риации — это размах вариации, дисперсия и коэффициент вариации. Полез­ную информацию для социолога дает анализ и сравнение средних величин и показателей вариации. Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характери­стику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%.

Над статистическими данными осуществляют две процедуры, которые на­зывают предварительной обработкой, — сводку и группировку. Они проводятся

статистический инструментарий - student2.ru

для упорядочения данных и подготовки их к последующему анализу. Статисти­ческая сводка — это научно организован­ная обработка материалов наблюдения, включающая систематизацию, группи­ровку данных, составление таблиц, под­счет групповых и общих итогов и других показателей.

Распределение элементов по соответствующим группам представляет со­бой процесс классификации, т.е. отнесение того или иного элемента к опре­деленному классу на основе соответствующих критериев или параметров. Так группируют отрасли промышленного производства исходя из их особенно­стей (металлургия черная, цветная).

Группировку понимают как упорядочение данных по какому-либо стати­стическому признаку. Выбор признака для классификации и группировки осуществляется в соответствии с целями и гипотезами исследования. Груп­пировка может проводиться на основе выделения номинальных групп (по полу, уровню квалификации, национальности и т.д.) или по какому-либо воз­растающему или убывающему количественному признаку (например, по уровню заработной платы: от 1 до 10 минимальных размеров оплаты труда, от 11 до 20, от 21 до 30 и т.д.).

Важнейшим приемом приведения исходных материалов к удобному для сравнения виду является расчленение разнородных величин на однородные. Выделив в разнородной совокупности признак, характеризующий тот или иной социальный объект, однородные типы и группы в ряде структурных частей этого объекта, можно сравнивать типы или группы друг с другом. Признак (свойство объекта), по которому проводится группировка, называ­ется группировочным признаком, или основанием группировки.

В качестве основных принципов процедуры группировки выступают: рас­членение разнородных явлений на однородные; нахождение общих и одно­типных явлений; определение признаков, по которым следует разграничи­вать типы; определение интервалов перехода от одного типа к другому.

В социологических исследованиях применяются самые разные виды груп­пировки: 1) группировка при помощи простого суммирования однородных признаков, благодаря чему определяются абсолютные числа и проявления в изучаемой совокупности; 2) ранжирование, т.е. группировка изучаемых еди­ниц совокупности в зависимости от возрастания или убывания изучаемого признака; 3) группировка на основе логически выделенных признаков при помощи заранее разработанной порядковой или интервальной шкалы, каждый

интервал которой выражает уровень или степень проявления изучаемого при­знака; 4) табулирование, т.е. построение статистических таблиц, графиков (в социологических исследованиях оно является наиболее распространенным).

Самым простым способом группировки является группировка путем про­стого суммирования однородных признаков. В то же время этот вид группи­ровки служит основным звеном для перехода от абсолютных чисел к относи­тельным (процентам, средним величинам и т.д.), являющимся основными характеристиками группировки. Достаточно проста группировка при помощи ранжирования, которое позволяет выявить динамику изучаемого признака в различных совокупностях. Группировка на основе логически выделенного одного или нескольких признаков отличается от предыдущих группировок тем, что предполагает глубокий теоретический, т.е. содержательный, анализ осо­бенностей изучаемых социальных явлений. Поэтому главное значение здесь приобретает правильный выбор группировочных признаков4.

Чаще всего применяются такие признаки, как пол, возраст, образование, классовая принадлежность и т.п. Результат группировки единиц наблюдения по одному какому-либо признаку называется статистическим рядом. Распре­деление частот признака в совокупности называется вариационным рядом.

Группировка, или расчленение совокупности данных на однородные группы, выступает стартовой площадкой для последующею использования множества самых разнообразных и интересных статистических методов, в том числе корреляционного и дискриминантного.

Группировку можно рассматривать как первый шаг к дискриминантному анализу, который исследует различия между группами. С его помощью можно установить, в частности, различия между тремя группами людей, выбравших определенную профессию (например, юрист, физик, инженер), основыва­ясь на их успехах в школе по определенным дисциплинам. Такой метод объясняет выбор профессии успехами по определенным предметам.

Изучая социально-экономические явления, статистика использует абсо­лютные и относительные величины. Абсолютные величины — это именованные числа. Каждая из них обязательно имеет единицу измерения: штуки, тонны, метры, рубли, киловатты, годы и пр. Единицы измерения подразделяются на натуральные, стоимостные и др. По способу выражения размеров изучаемых явлений абсолютные величины подразделяются на индивидуальные и суммар­ные, которые представляют собой один из видов обобщающих величин. Иногда одна натуральная единица измерения недостаточна для характеристики изу­чаемого явления, в подобных случаях используют вторую единицу в сочета­нии с первой. Поэтому в практике натуральные единицы измерения могут быть составными. Так, трудовые затраты в торговле измеряются числом работни­ков и количеством человеко-часов (чел./ч), человеко-дней (чел./дней), рабо­та транспорта выражается в тонно-километрах (т/км).

Относительные величины показывают отношения между абсолютными вели­чинами, они представляют собой частное от деления двух статистических ве­личин и характеризуют количественное соотношение между ними. Наиболее распространенный тип относительных величин — проценты. Относительные величины значительно облегчают сравнение и анализ статистических данных.

Словарь прикладной социологии / [Сост. К.В. Шульга; Редкол.: Г.П. Давидкж (отв. ред.) и др.]-Минск: Изд-во «Университетское», 1984. С. 28.

При расчете относительных величин следует иметь в виду, что в числи­теле всегда находится показатель, отражающий то явление, которое изуча­ется, т.е. сравниваемый показатель, а в знаменателе — показатель, с которым производится сравнение, принимаемый за основание, или базу сравнения. База сравнения выступает в качестве своеобразного измерителя. В зависи­мости от того, какое числовое значение имеет база сравнения (основание), результат отношения может быть выражен либо в форме числа (коэффици­ента) или процента, либо в форме промилле или децимилле.

Если значение основания или базы сравнения принимается за единицу (приравнивается к единице), то относительная величина (результат сравне­ния) является коэффициентом и показывает, во сколько раз изучаемая вели­чина больше основания. Расчет относительных величин в виде коэффици­ента применяется в том случае, если сравниваемая величина существенно больше той, с которой она сравнивается.

Если значение основания или базу сравнения принять за 100%, результат вычисления относительной величины будет выражаться также в процентах. В тех случаях, когда базу сравнения принимают за 1000% (например, при ис­числении демографических коэффициентов), результат сравнения выража­ется в промилле (%о). Относительные величины могут быть выражены и в децимилле (%оо), если основание отношения равно 10 000.

Форма выражения относительных величин зависит от количественного соот­ношения сравниваемых величин, а также от смыслового содержания полученного результата сравнения. В тех случаях, когда сравниваемый показатель больше ос­нования, относительная величина может быть выражена или коэффициентом, или в процентах. Когда сравниваемый показатель меньше основания, относительную величину лучше выразить в процентах; если же сравнительно малые по числово­му значению величины сопоставляются с большими, относительные величины выражаются в промилле. Так, в промилле рассчитываются коэффициенты рож­даемости, смертности, естественного и механического прироста населения.

Расчет относительных величин счи­тается правильным, если для сравнения используются сопоставимые показате­ статистический инструментарий - student2.ru ли. К несопоставимости показателей чаще всего приводят различия в методо­логии сбора, обработки статистической информации, в длительности пери­одов времени, за которые исчислены сравниваемые показатели, и др.

Для характеристики структурысовокупности применяются особые пока­затели, которые можно назвать структурными средними. К таким показате­лям относятся мода и медиана.

Модой называется чаще всего встречающийся вариант, или то значение при­знака, которое соответствует максимальной точке теоретической кривой распре­делений. Она представляет собой наиболее часто встречающееся или типичное значение. В дискретном ряду мода — это вариант с наибольшей частотой. В ин­тервальном вариационном ряду модой приближенно считают центральный ва­риант так называемого модального интервала, т.е. того интервала, который имеет наибольшую частоту (частость). Мода — это именно то число, которое в действи­тельности встречается чаще всего (является величиной определенной), а в прак­тике имеет самое широкое применение (например, наиболее часто встречаю­щийся тип покупателя).

Медиана — величина, которая делит численность упорядоченного вариа­ционного ряда на две равные части: одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая — большие. Понятие ме­дианы легко уяснить из следующего примера. Для ранжированного ряда (т.е. построенного в порядке возрастания или убывания индивидуальных величин) с нечетным числом членов медианой является вариант, располо­женный в центре ряда. В интервальном вариационном ряду порядок нахож­дения медианы следующий: располагаем индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находим медианный интервал5.

Относительные величины структуры характеризуют состав изучаемых со­вокупностей. Исчисляются они как отношение абсолютной величины каждого из элементов совокупности к абсолютной величине всей совокупности, т.е. как отношение части к целому, и представляют собой удельный вес части в целом. Как правило, относительные величины структуры выражаются в процентах (база сравнения принимается за 100). Показатели структуры могут быть вы­ражены также в долях (база сравнения принимается за единицу).

Для изучения изменений объекта во времени строят ряды динамики. Ряд динамики — это ряд расположенных в хронологической последовательности числовых значений статистического показателя, характеризующих измене­ние общественных явлений во времени.

В каждом ряду динамики имеются два основных элемента:

1) показатель времени /;

2) соответствующие ему уровни развития изучаемого явления у.

В качестве отчета времени в рядах динамики выступают либо определенные даты (моменты) времени, либо отдельные периоды (годы, кварталы, сутки).

Уровни рядов динамики отображают количественную оценку (меру) разви­тия во времени изучаемого явления. Их можно выражать абсолютными, отно­сительными или средними величинами. В зависимости от характера изучаемо­го явления уровни рядов динамики могут относиться или к определенным да­там (моментам) времени, или к отдельным периодам. В соответствии с этим ряды динамики подразделяются на моментные и интервальные: моментныеряды динамики отображают состояние изучаемых явлений на определенные даты (моменты) времени; интервальные ряды динамики отображают итоги развития (функционирования) изучаемых явлений за отдельные периоды (интервалы) времени. Особенностью интервального ряда динамики является то, что каждый его уровень складывается из данных за более короткие интервалы (субпериоды) времени. Свойство суммирования уровней за последовательные интервалы вре­мени позволяет получать ряды динамики более крупных периодов.

Статистическое отображение развития изучаемого явления во времени может быть представлено рядами динамики с нарастающими итогами. Их применение обусловлено потребностями отображения результатов развития изучаемых показателей не только заданный отчетный период, но и с учетом предшествующих периодов. При составлении таких рядов производится последовательное суммирование смежных уровней. Этим достигается сум­марное обобщение результата развития изучаемого показателя с начала от­четного периода (месяца, квартала, года и т.д.).

Подробнее см.: http://lib.wsu.ru/books/Bakalavrf)2/page0142.asp

При использовании рядов динамики применяется специальная система показателей динамики, куда включаются: абсолютный прирост (сокраще­ние), темп и коэффициент роста, темп и коэффициент прироста, абсолют­ное значение одного процента прироста. Важнейшим статистическим пока­зателем анализа динамики является абсолютное изменение — абсолютный прирост (сокращение). Абсолютное изменение характеризует увеличение или уменьшение уровня ряда за определенный промежуток времени. Абсолют­ный прирост с переменной базой называют скоростью роста.

Для характеристики интенсивности, т.е. относительного изменения уровня динамического ряда за какой-либо период времени, исчисляют темпы роста (сни­жения). Интенсивность изменения уровня оценивается отношением отчетного уровня к базисному. Показатель интенсивности изменения уровня ряда, выра­женный в долях единицы, называется коэффициентом роста, а в процентах — темпом роста. Эти показатели интенсивности изменения отличаются только еди­ницами измерения. Коэффициент роста (снижения) показывает, во сколько раз сравниваемый уровень больше уровня, с которым производится сравнение (если этот коэффициент больше единицы), или какую часть уровня, с которым произ­водится сравнение, составляет сравниваемый уровень (если он меньше единицы).

Темп прироста (сокращения) показывает то, на сколько процентов сравнива­емый уровень больше или меньше уровня, принятого за базу сравнения, и вычис­ляется как отношение абсолютного прироста к абсолютному уровню, принятому за базу сравнения. Темп прироста может быть положительным, отрицательным или равным нулю, выражается он в процентах, коэффициент прироста выража­ется в долях единицы. Темп прироста (сокращения) можно получить и из темпа роста, выраженного в процентах, если из него вычесть 100%. Коэффициент при­роста получается вычитанием единицы из коэффициента роста6.

Из вышеизложенного можно сделать несколько обобщающих выводов. В основе расчета показателей рядов динамики лежит сравнение его уровней. В зависимости от применяемого способа сопоставления показатели динами­ки могут вычисляться на постоянной (базисный способ) и переменной (цеп­ной способ) базе сравнения. Ряды динамики формируются в результате свод­ки и обработки материалов периодического наблюдения. Повторяющиеся во времени (по отчетным периодам) значения одноименных показателей в ходе статистической сводки систематизируются в хронологической последова­тельности. Для получения научно обоснованных выводов о динамике явле­ния статистические данные должны быть сопоставимыми.

Статистика не ограничивается простым описанием явлений, даже если они сгруппированы и переведены в средние величины. У нее есть куда более важная задача — выявить статистические закономерности, т.е. устойчивые связи между явлениями. Наличие и тесноту (силу) связи можно установить, пользуясь регрес­сионным и корреляционным анализом. Цель корреляционного анализа — измере­ние тесноты связи между признаками и явлениями. Наличие связи между явле­ниями совсем не означает, что одно явление служит причиной другого.

Коэффициент корреляции позволяет выявить и количественно оценить взаи­мосвязь между двумя переменными. Он может показывать степень идентично-

6 Подробнее см.: Гусаров В.М. Теория статистики. М: Юнити, 1998; Ряузов Н.Н. Общая теория статистики. М.: Статистика, 1980; Экономическая статистика: Учебник/ Под ред. Ю.Н. Иванова. М.: ИНФРА, 1998.

ста характеристик, сравниваемых групп (например, ценностей или доходов), i также степень взаимосвязи между двумя признаками социального объекта (на­пример, зависимость конкретных политических ориентации от величины со­вокупного дохода). При одновременном возрастании переменных корреляцш называется положительной. Тогда же, когда возрастание одной переменно! связано с уменьшением другой, корреляция считается отрицательной. Крайни* значения коэффициента корреляции обозначаются (+) и (-). В том случае, earn величина коэффициента корреляции составляет (+), можно говорить о тожде стве, если — (-), то о полной обратной зависимости (когда величина одного при знака максимальна, то другого — минимальна). Иногда с помощью коэффици ента корреляции можно установить причинно-следственные связи7.

Более глубоко раскрыть характер взаимосвязи между переменными позволя етрегрессионный анализ, используя который можно установить характер и фор му зависимости результативного признака от объясняющих. Задачи регрессион ного анализа — выбор формы связи (например, прямая или обратная, функцио нальная или стохастическая) и определение расчетных значений зависимо! переменной (функции регрессии). Факторный анализ способствует определен™ степени взаимосвязи между непосредственно не наблюдаемыми переменным! (факторами) и эмпирически наблюдаемыми признаками.

статистический инструментарий - student2.ru

Для анализа сложных социально-экономических явлений и процессов ис пользуется такой вид статистических показателей, как индексы. Индекс — этс относительный показатель, характеризующий изменение величины какого либо объекта во времени, пространстве или по сравнению с эталоном. Ohi позволяют привести разнородные явления к соизмеримым величинам. Ин дексы разделяют на индивидуальные, характеризующие изменение одноп элемента совокупности, и общие (сводные), при помощи которых можж описать всю совокупность, процесс или явление. По способу построения ин дексы классифицируются на агрегатные и средние. Основное отличие агре гатного индекса состоит в том, что при его расчете только одна величина из меняется, а другая остается неизменной. Индексный метод широко используется как для оценки различных социально-экономических явлений и процессов, так и в аналитических целях.

Основные способы представления ре­зультатов статистических наблюдений —таблицы и графики. Статистический гра­фик — это чертеж, на котором статистичес­кие совокупности, характеризуемые опре­деленными показателями, описываются спомощью условных геометрических обра­зов ИЛИ знаков. График позволяет сделать рис 2 статистический графин...

представление данных гораздо более на- описывается с помощью условныхГЛЯДНЫМ И ДОСТУПНЫМ8. геометрических образов или знаков

Казаринова Н.В., Филатова О.Г., Хренов А.Е. Социология. Учебник для вузов/ Под ред. ГС. Бать гина. М.: NOTA BENE, 1999.

При подготовке данного материала использовалась информация с веб-сайтов: http:/ www.buhgal.narod.ru/BOOKS/book4_sum.html; http://www.statsoft.ru/home/textbook/modules stbasic.html; http://www.saslib.ru/ref/arh/25/STATIST/Index.txt

РОЛЬ И СОДЕРЖАНИЕ СТАТИСТИЧЕСКОГО ВЫВОДА

Кроме логического и теоретико-гипотетического выводов, рассмотренных выше, существует еще третий — статистический вывод, о котором здесь пой­дет речь.

Приводным ремнем эмпирического исследования выступают специальные математические процедуры, в основе которых лежит теория вероятностей, оп­ределяющая технологию составления выборочной совокупности и электронной обработки данных. К ней тесно примыкает процедура эмпирического обобще­ния, называемая еще статистическим выводом. В его основе лежит индукция (от лат. inductio — наведение) —умозаключение, идущее от фактов к выводу.

Статистический вывод — это индуктивное обобщение, построенное на основе математической обработки и обобщения некоторого множества еди­ниц исследования. Например, вы опросили 1500 избирателей и выяснили, что более 60% пожилых людей (старше 60 лет) на последних выборах голо­совали за коммунистов. В данном случае изучалась статистическая связь двух переменных: возраст и электоральное поведение. В результате можно сделать статистический вывод: чем старше возраст респондента, тем выше вероят­ность того, что он проголосует за коммунистов. И наоборот.

В основе статистического вывода лежит индуктивное рассуждение, при­водящее к утверждениям, верным лишь с определенной степенью достовер­ности. Строгий смысл степени достоверности обеспечивается математиче­скими методами и вероятностным подходом, образующими основы совре­менной статистической теории9.

Статистический вывод социолог получает после обработки анкет и ана­лиза первичных данных. Это количественный вывод. В отличие от него два других рассмотренных ранее типа вывода — логический и теоретико-гипо­тетический — являются качественными. Связь между ними следующая. При составлении программы исследования ученый теоретически постулирует (строит теоретическую гипотезу) возможность связи между двумя перемен­ными — возрастом и электоральным поведением. После составления анке­ты и проведения исследования при математической обработке данных стро­ится статистический вывод. Это две стороны одной медали: первая служит пробным проектом, теоретическим макетом возможной связи двух перемен­ных, а вторая — его эмпирическим подтверждением.

Статистический вывод невозможно делать на малых совокупностях, напри­мер в 35 респондентов. Если в вашей анкете есть вопросы, к которым преду­смотрено, скажем, по 5—7 вариантов ответов, то, разделив 35 на 7, получим 5. А каждая ячейка должна содержать не менее 7 единиц. «Статистический вывод начинает работать тогда, когда единиц исследования достаточно много. Доста­точно много означает, что при условии равновероятного попадания в каждую клетку пространства признаков наполнение каждой из них составит не менее семи единиц»10. Одна статистическая ячейка — это один признак. Допустим, вы

9 Рао СР. Линейные статистические методы и их применение. М., 1968.

10 Батыгин Г.С. Лекции по методологии социологических исследований: Учеб. для высших учебныхзаведений. М., 1995. С. 67.

спрашиваете респондента о том, за какую партию он будет голосовать, и пред лагаете на выбор 7 наиболее крупных российских партий. В этом списке одн партия — это один признак или одна ячейка. Ее должны наполнить не мене> 7 респондентов. Конечно, чем их больше, тем меньше вероятность ошибки, по этому статистический вывод хорошо работает на больших выборках.

Изюминка эмпирического исследования выражается именно в этом тре тьем виде вывода — в статистическом. Дело в том, что теоретическое иссле дование, не прибегающее к полевому наблюдению или массовому опросу вполне может содержать и логический, и теоретико-гипотетический выво ды. Очень многие исследования именно этим и ограничиваются. В эмпири ческом же исследовании социолог может сделать вывод: «во-первых, сколь ко людей подпадает под значение переменной, т.е. наполнение класса, во вторых, каково распределение частот по всему континууму переменной в-третьих, как меняется распределение при введении в группировку второ го, третьего и энного признаков, и, в-четвертых, имеется ли связь между при знаками и насколько она меняется в различных контекстах»''.

Статистические связи выполняют ту же функцию цементирования эмпи рических фактов, которую в теоретическом знании выполняет логика. Ста тистические закономерности, статистические правила — это логика эмпири ческого знания, механизм его построения.

Статистический вывод — область вероятностного знания.Вероятность -числовая характеристика степени возможности появления какого-либо сл> чайного события при тех или иных определенных, могущих повторяться не ограниченное число раз условиях. Она изучается в теории вероятностей— ра: деле математики, в котором по данным вероятностям одних случайных ее бытии находят вероятности других событий, связанных каким-либо образо с первыми. Математическая статистика,наука о математических методах cv стематизации и использования статистических данных, опираясь на теори] вероятностей, позволяет оценить, в частности, необходимый объем выбор ки для получения результатов требуемой точности при выборочном обагк довании. Одна из основных задач теории вероятностей состоит в выяснени закономерностей, возникающих при взаимодействии большого числа случаг ных факторов. Математическая статистика понимается также как наука методах умозаключения о свойствах соответствующей генеральной совокуг ности на основе наблюдений над репрезентативной выборочной совокупне стью, причем данные наблюдений отбираются из генеральной совокупное ти в случайном порядке. Математическая статистика занимается как статр стическим описанием результатов опытов или наблюдений, так построением и проверкой подходящих математических моделей, содержащг понятие вероятности.

Когда мы находим количественную меру, то автоматически переходим мир вероятностных утверждений. Мы можем сказать, что с достоверность* равной 60-70%, женщины склонны выбирать в качестве брачного партнер мужчину с высшим образованием. Здесь процентная доля, которая заменж размытые формулировки типа «некоторые», «большинство» или «часть», ш казывает степень вероятности наступления данного события. Но наука м( жет ошибаться в своих прогнозах. Человек непредсказуем в своих действ!

Ьатыгин Г.С.Лекции по методологии социологических исследований. М., 1995. С. 68.

ях, еще менее предсказуемы массы людей, которые, объединяясь, часто ве­дут себя не так, как повела бы сумма разрозненных индивидов.

Весь математический аппарат социологии построен на вероятностях, опи­сываемых в процентных распределениях. Мы говорим: 72% избирателей дан­ного округа проголосуют за кандидата М. Это значит, что с вероятностью в 72% избиратели на предстоящих выборах отдадут предпочтение именно ему. До­бавим сюда ошибку выборки, скажем, в 5% и можем утверждать, что избира­тели проголосуют за М с вероятностью 72±5%.

Степень вероятности свидетельствует, во-первых, об ограниченных воз­можностях самой науки, во-вторых, о непредсказуемости, вариативности или изменчивости поведения объекта исследования, в-третьих, о высокой куль­туре научного исследования, которая выражает себя требованием осторожно судить о реальности.

Статистический вывод основан на статистическом анализе результатов выборочных исследований и направлен на оценку параметров совокупности в целом. В таком случае результаты выборочных исследований выступают всего лишь отправной точкой для получения общих выводов. Например, автомоби­лестроительная компания провела два независимых исследования с целью оп­ределения степени удовлетворенности потребителей своими автомобилями. Первая выборка включала 100 потребителей, купивших данную модель в те­чение последних шести месяцев, вторая выборка включала 1000 потребителей. В ходе телефонного интервьюирования респонденты отвечали на вопрос: «Удовлетворены или не удовлетворены вы купленной вами моделью автомо­биля?» Первый опрос выявил 30% неудовлетворенных, второй — 35%.

Поскольку существуют ошибки выборки и в первом, и во втором случаях, то здесь можно рассуждать следующим образом. В первом случае около 30% оп­рошенных выразили неудовлетворенность купленной моделью автомобиля, во втором случае — около 35% опрошенных. Какой же общий вывод можно сде­лать в данной ситуации? Как избавиться от слова «около»? Для этого введем по­казатель ошибки: 30%±х% и 35%±.у% и сравним хну. Используя логический анализ, можно прийти к заключению, что большая выборка содержит меньшую ошибку и что на ее основе можно сделать более правильные выводы о мнении всей совокупности потребителей, т.е. решающим фактором правильности вы­водов является размер выборки. Показатель ошибки присутствует во всех фор­мулах, определяющих содержание различных методов статистического вывода12.

Наши рекомендации