Распределение, отклонение и среднее распределение доходов среди жильцов подъезда № 2
Номер квартиры | 2-й подъезд | х-х | \х-х\ |
-1050 | |||
-1050 | |||
-850 | |||
-150 | |||
-50 | |||
Среднее | Е(х-х)=0 |
Таким образом, уравнение для среднего отклонения выглядит следующим образом:
(3)
где | ] — символ абсолютной величины (модуля).
Если мы берем каждую отметку и вычитаем из нее среднее мы вычисляем ту величину, на которую каждая из отметок (вторая колонка) отличается от среднего (нижняя ячейка второй колонки). Сумма этих отклонений всегда равна нулю — важное математическое свойство среднего (проверьте это сами, сложив числа в третьей колонке). Поскольку мы интересуемся только
величиной отклонения, а не направлением или знаком его, то находим абсолютные значения отклонения (четвертая колонка). Затем мы берем их сумму и делим на число отметок, чтобы найти среднее отклонение отметок от среднего; получаем MD = 630 Чем больше среднее отклонение, тем сильнее разброс отметок вокруг среднего
Хотя среднее отклонение и выявляет разброс, чаще для его измерения используются дисперсия и среднеквадратическое отклонение.
Дисперсия (о2) представляет собой сумму квадратов отклонений от среднего, разделенную на число отметок:
Среднеквадратическое отклонение представляет собою корень квадратный издисперсии:
Чем больше разброс данных вокруг среднего, тем выше значения с2 и S. Это означает, что если все данные одинаковы, то а2 и Нравны нулю.
Пример расчета дисперсии и среднеквадратического отклонения. В опросе, проведенном в конце декабря 1998 г., нижегородцев просили оценить некоторые личностные качества недавно избранного мэра, используя для этого так называемый семантический дифференциал17. Этот метод заключается в следующем: респонденту предлагается выразить свое отношение к интересующему исследователя качеству по совокупности биполярных шкал (в нашем случае девятибалльных). Одно из предложенных для оценки качеств мэра — доступность — было выражено с помощью такой шкалы:
Результаты в исследовании распределились следующим образом:
О технике использования этого метода см., например: Родионова Н.В. Семантический дифференциал (обзор литературы)//Социология 4М: методология, методы, математические модели. 1996. № 7. С. 175-200.
Таблица 14 Распределение оценок качества «доступность»
Оценочный балл | Частота |
Нет ответа | |
Всего |
Отбросив нули (табл. 14), т.е. варианты «нет ответа» (после чего Остановится равным 368), мы подсчитываем, что среднее значение оценки (по формуле средневзвешенного) составляет:
= 5,42.
Обратим внимание: если бы мы не отбросили значение «нет ответа», т.е. приняли бы эту позицию за нуль как математическую величину, то получили бы среднее значение:
= 4,67,
т.е. заметно меньшее, нежели рассчитанное нами. Оно более точно в математическом смысле, но искажает социологический смысл, поскольку ведь те, кто не дали ответа, вовсе не выставляли оценку «0», они просто не выставили никакой оценки.
Рассчитаем отклонение от среднего и квадрат отклонения от среднего по каждому баллу (см. табл. 2.11).
Таблица 15 Образец расчета
X/ (оценочный балл) | ||
-4,4 | 135,52 | |
-3,4 | 127,16 | |
-2,4 | 230,4 | |
-1,4 | 90,16 | |
-0,4 | 17,28 | |
0,6 | 18,36 | |
1,6 | 140,8 | |
2,6 | 162,24 | |
3,6 | 336,96 |
Сложив числа крайней правой колонки, мы получим:
= 1258,88; 126
дисперсия: среднеквадратическое отклонение:
Что дает для анализа данных знание дисперсии? Напомним, что «дисперсия» {dispersion) по-английски означает «разбрасывание, рассеивание»; в данном случае это рассеяние реально полученных эмпирических данных вокруг среднего значения. В зависимости от того, насколько велика (точнее, мала) дисперсия или среднеквадратичное отклонение, мы можем судить, насколько единодушны были в своих оценках респонденты (при меньшем значении дисперсии), или наоборот — насколько сильно они расходятся в своих мнениях (при большем значении дисперсии)18. Сравним, к примеру, разброс оценок (по пятибалльной шкале: от 5 — очень важное, до 1 — затрудняюсь ответить), которую, в ходе исследования особенностей сексуального поведения, дали респонденты степени влияния на их «сексуальное образование» различных источников информации (табл. 16):
Таблица 16 Оценка степени влияния различных источников на информированность о сфере интимных отношений (в средних знамениях по 5-балльной шкале)
Источник | Среднее | S |
Сексуальный партнер | 3,55 | 1,36 |
Супруг(а) | 3,12 | 1,58 |
Друзья | 3,07 | 1,14 |
Эротические фильмы | 3,02 | 1,09 |
Популярные издания | 2,93 | 1,20 |
Научная литература | 2,81 | 1,15 |
Эротическая литература | 2,81 | 1,14 |
Родители | 2,36 | 0,92 |
Педагоги | 2,13 | 0,82 |
Другие источники | 2,38 | 1,25 |
Источник: Данные пилотажного опроса, декабрь 1998 г.
Из этой таблицы помимо сведений о том, что максимальное влияние \м информированность о наиболее интимных сторонах жизни оказывает сексуальный партнер, а наименьшее — педагоги, мы узнаем также, что с наибольшим единодушием респонденты оценили низкую степень влияния такого источника, как педагоги, о чем говорит минимальное значение средне-
18 Поэтому индексы, основанные на дисперсии, полезно иногда применять при изучении групповси сплоченности.
квадратического отклонения, а наибольшее расхождение в оценках вызвал такой источник, как супруг/супруга, — максимальное значение S (что, возможно, связано с большими различиями в индивидуальном опыте).