Статистика как наука о массовых явлениях и процессах
XIX в. Кеттле (учение о средних величинах) формирование и развитие статистики как науки.
Прикладная статистика [в социологии] – наука, занимающаяся сбором, хранением, анализом и интерпретацией данных о массовых [социальных] явлениях и процессах.
Отсюда следуют основные задачи:
1) сбор данных;
2) хранение данных;
3) анализ и интерпретация данных.
Статистическому анализу подвергается не индивид, а статистическая совокупность индивидов (избиратели, учащаяся молодёжь, потребители). Совокупность индивидов часто не может быть обследована полностью. Тогда выводы о всей совокупности делают на основании выводов об отдельной её части. В статистике (социологии) вводятся 2 основополагающих понятия, лежащих в основе всех количественных методик: 1) Генеральная Совокупность (ГС) - полная совокупность объектов, имеющих отношение к изучаемой проблеме; 2) Выборочная Совокупность (Выборка; ВС) – та часть ГС, которую мы непосредственно изучаем. Таким образом, в количественном исследовании сначала определяются границы ГС (описываются характеристики объектов исследования: территориальная, деятельностная, социально-демографическая). Затем из ГС отбирается выборка, которая непосредственно изучается и описывается. По итогам выборочного исследования, базируясь на теории вероятности, делаются выводы относительно всей ГС. В связи с этим вся статистика делится на три основных направления:
1) дескриптивная (описательная). Занимается описанием наблюдаемой выборочной совокупности;
2) теория статистического вывода. Отбор элементов ГС в выборку, а также обобщение результатов ВИ на ГС.
3) аналитическая. Анализ взаимосвязи двух и болеё признаков.
Признак – некоторое общее для всех объектов свойство или качество, конкретное проявление которого может меняться от объекта к объекту. Все возможные проявления признака называются значениями данного признака. Примеры: пол – признак, М или Ж – значение. Место жительства: столица, крупный город, малый город, сельская местность.
Если учесть, что, при проведении социс число объектов (объём выборки) может превышать тысячу человек, а число признаков исчисляется десятками, перед социологами встает вопрос, как должны быть представлены данные, чтобы могла быть осуществлена их статистическая обработка. Статистические методы могут быть применены к данным только после перевода всех значений признака с вербального представления на язык чисел. Процедура перевода вербальных значений на язык чисел называется измерением.
Измерение – процедура приписывания символов значения признакам. Принципиально могут быть любыми. Мы в качестве символов будем использовать только числовые значения. Цель измерения: получить числовую модель, исследование которой могло бы заменить исследования самого объекта. Это возможно лишь тогда, когда свойства модели соответствуют свойствам объекта. То есть, отношения между числами, образующими числовую модель, соответствуют отношениям между изучаемыми свойствами объекта.
Исходной числовой моделью данных социологических исследований является матрица, имеющая название "объект-признак", каждая строка которой соответствует одному объекту, а каждый столбец одному признаку или переменной.
В матрице "объект-признак" на пересечении i-той строки j-того столбца располагается результат измерения j-того признака для i-того объекта.
Пример матрицы "объект-признак".
№ | Пол: 1) мужской 2) женский | Возраст | Удовлетворённость своим авто: 1) нет, не уд. 2) скореё не уд. 3) и да, и нет 4) скореё уд. 5) да, уд. полностью |
Измерительные шкалы
Признаки и свойства объекта делятся на качественные и количественные. Качественные описывают свойства объекта, которые выражаются с помощью понятий и определений (вербально).
Количественные признаки описывают свойства объекта, которые выражаются с помощью чисел. Процедура измерения качественных признаков отличается от процедуры измерения количественных тем, что числа, приписываемые значениями качественного признака, только обозначают определенную категорию, и к ним не применимы никакие арифметические правила для чисел. При измерении количественных признаков для чисел, соответствующие значениям признака могут выполняться арифметические правила (во сколько раз >/<). Для измерения качественного признака используется две основные шкалы: 1) номинальная; 2) порядковая.
Для измерения количественных признаков используется две основные измерительные шкалы: 1) интервальная; 2) шкала отношений.
Номинальная шкала (самая "слабая", с точки зрения измерения, шкала). Это также измерительная шкала, по которой в процессе измерения устанавливается отношение равенства-неравенства объекта к значению признака. Номинальная шкала предназначена для разбиения изучаемой совокупности на непересекающиеся классы (нельзя выстроить иерархию).
Пример:
- пол:
1) мужской;
2) женский;
- социальный статус:
1) рабочий;
2) учащийся;
3) служащий;
4) пенсионер.
Порядковая шкала. Для построения порядковой шкалы необходимо установить не только отношения равенства-неравенства, но и отношения последовательности или порядка. Отношения порядка – это отношения типа: "больше, чем…", "лучше, чем…", и в обратную сторону. С помощью порядковых шкал в социологических исследованиях чаще всего измеряются показатели удовлетворённости чем-либо.
Пример: "Насколько вы удовлетворёны своим здоровьем?"
1) нет, не удовлетворён;
2) скорее не удовлетворён;
3) и да, и нет;
4) скореё удовлетворён;
5) да, полностью удовлетворён.
Интервальная шкала. В основе построения лежит эмпирическая процедура, позволяющая определить равенство дистанций между парами объектов. Отличительное свойство: произвольный выбор точки отсчета 0, а также произвольный масштаб.
В социологических исследованиях интервалы шкалы как таковые практически не используются. Классические примеры интервальных шкал:
1) температура шкалы;
2) шкалы летоисчисления.
Наряду со свойствами равенства-неравенства и упорядоченности, интервальной шкале соответствует свойство "на сколько больше/меньше".
Шкала отношений. Самая сильная измерительная шкала, используемая для измерения количественных признаков, для которых можно точно установить абсолютную исходную точку 0. Для шкалы отношений, наряду со свойствами "равенство-неравенство", упорядоченности и "на сколько больше/меньше", справедливо свойство "во сколько раз больше/меньше".
В социологических исследованиях шкалы отношений используются для измерения так называемых "физических величин": времени, возраста, стажа, дохода и так далее.
Количественные признаки, измеренные с помощью шкалы отношений, подразделяются на дискретные и непрерывные. Дискретные величины – это такие признаки, у которых значения изменяются скачкообразно (число детей в семье, стаж работы). Непрерывные величины – такие признаки, значения которых могут принимать промежуточное положение (доход).
Произвольные шкалы. Так как в социологических исследованиях доминируют качественные признаки, все время предпринимаются попытки преобразования качественных признаков в псевдо-количественные:
- дихотомическая шкала (только 2 значения признака (1 и 0)). Может существовать как самостоятельная и как производная от любой номинальной шкалы (1 – присутствие некоторого свойства, 0 – его отсутствие)
- псевдоинтервальная шкала строится на основе порядковой шкалы. Для того, чтобы преобразовать порядковую шкалу в псевдоинтервал, её нужно представить в графическом виде (возьмем вопрос: "Удовлетворены ли вы своим здоровьем?")
_____|____|___|___|___|____
1 2 3 4 5
"нет, не уд." "нейтр." "да, уд."
Основное преимущество – она может расширяться.
Псевдоинтервальная шкала может выражаться через проценты, в этом случае вопрос формулируется так: "На сколько процентов...?"