Контрольная группа Мода (Mo) Медиана (Me) Средняя (М)

Фон: ………….. ………………. ……………...

После воздействия:………….. ……………… ………………

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

Сразу бросается в глаза, что если средняя в обоих случаях почти одинакова, то во втором распределении результаты больше разбросаны, чем в первом. В таких случаях говорят, что у второго распределения больше диапазон, или размах вариаций, т. е. разница между максимальным и минимальным значениями.

Так, если взять контрольную группу, то диапазон распределения для фона составит 22 — 10 = 12, а после воздействия 25 — 8 = 17. Это позволяет предположить, что повторное выполнение задачи на глазодвигательную координацию оказало на испытуемых из контрольной группы определенное влияние: у одних показатели улучшились, у других ухудшились*. Однако для количественной оценки разброса результатов относительно средней в том или ином распределении существуют более точные методы, чем измерение диапазона.

* Здесь мог проявиться эффект плацебо, связанный с тем, что запах дыма травы вызвал у испытуемых уверенность в том, что они находятся под воздействием наркотика. Для проверки этого предположения следовало бы повторить эксперимент со второй контрольной группой, в которой испытуемым будут давать только обычную сигарету.

Чаше всего для оценки разброса определяют отклонение каждого из полученных значений от средней (М-), обозначаемое буквой d, a затем вычисляют среднюю арифметическую всех этих отклонений. Чем она больше, тем больше разброс данных и тем более разнородна выборка. Напротив, если эта средняя невелика, то данные больше сконцентрированы относительно их среднего значения и выборка более однородна.

Итак, первый показатель, используемый для оценки разброса, - это среднее отклонение. Его вычисляют следующим образом (пример, который мы здесь приведем, не имеет ничего общего с нашим гипотетическим экспериментом). Собрав все данные и расположив их в ряд

3 5 6 9 11 14,

находят среднюю арифметическую для выборки:

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

Затем вычисляют отклонения каждого значения от средней и суммируют их:

-5 -3 - 2 +1 +3 +6

(3 - 8) + (5 - 8) + (6 - 8) + (9 - 8) + (11 - 8) + (14 - 8).

Однако при таком сложении отрицательные и положительные отклонения будут уничтожать друг друга, иногда даже полностью, так что результат (как в данном примере) может оказаться равным нулю. Из этого ясно, что нужно находить сумму абсолютных значений индивидуальных отклонений и уже эту сумму делить на их общее число. При этом получится следующий результат:

среднее отклонение равно

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

Общая формула:

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

где å (сигма) означает сумму; |d|-абсолютное значение каждого индивидуального отклонения от средней; n-число данных.

Однако абсолютными значениями довольно трудно оперировать в алгебраических формулах, используемых в более сложном статистическом анализе. Поэтому статистики решили пойти по «обходному пути», позволяющему отказаться от значений с отрицательным знаком, а именно возводить все значения в квадрат, а затем делить сумму квадратов на число данных. В нашем примере это выглядит следующим образом:

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

В результате такого расчета получают так называемую вариансу*. Формула для вычисления вариансы, таким образом, следующая:

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

* Варианса представляет собой один из показателей разброса, используемых в некоторых статистических методиках (например, при вычислении критерия F; см. следующий раздел). Следует отметить, что в отечественной литературе вариансу часто называют дисперсией. - Прим. перев.

Наконец, чтобы получить показатель, сопоставимый по величине со средним отклонением, статистики решили извлекать из вариансы квадратный корень. При этом получается так называемое стандартное отклонение:

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

В нашем примере стандартное отклонение равно Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru = 3,74.

Следует еще добавить, что для того, чтобы более точно оценить стандартное отклонение для малых выборок (с числом элементов менее 30) в знаменателе выражения под корнем надо использовать не п,

а п — 1;

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

* Стандартное отклонение для популяции обозначается маленькой греческой буквой сигма (s), а для выборки - буквой s. Это касается и вариансы, т.е. квадрата стандартного отклонения: для популяции она обозначается s2 , a для выборки -s2.

Вернемся теперь к нашему эксперименту и посмотрим, насколько полезен оказывается этот показатель для описания выборок.

На первом этапе, разумеется, необходимо вычислить стандартное отклонение для всех четырех распределений. Сделаем это сначала для фона опытной группы:

Расчет стандартного отклонения* для фона контрольной группы

* Формула для расчетов и сами расчеты приведены здесь лишь в качестве иллюстрации. В наше время гораздо проще приобрести такой карманный микрокалькулятор, в котором подобные расчеты уже заранее запрограммированы, и для расчета стандартного отклонения достаточно лишь ввести данные, а затем нажать клавишу s.

Испытуемые Число пораженных мишеней в серии Средняя Отклонение от средней (d) Квадрат от отклонения от средней (d2)
. . . . . . 15,8 15,8 15,8 . . . 15,8 -3,2 +5,8 +3,8 . . . -6,2 10,24 33,64 14,44 . . . 38,44

Сумма (å) d2 = 131,94

Варианса (s2) = Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

О чем же свидетельствует стандартное отклонение, равное 3,07? Оказывается, оно позволяет сказать, что большая часть результатов (выраженных здесь числом пораженных мишеней) располагается в пределах 3,07 от средней, т.е. между 12,73 (15,8 - 3,07) и 18,87 (15,8 + 3,07).

Для того чтобы лучше понять, что подразумевается под «большей частью результатов», нужно сначала рассмотреть те свойства стандартного отклонения, которые проявляются при изучении популяции с нормальным распределением.

Статистики показали, что при нормальном распределении «большая часть» результатов, располагающаяся в пределах одного стандартного отклонения по обе стороны от средней, в процентном отношении всегда одна и та же и не зависит от величины стандартного отклонения: она соответствует 68% популяции (т.е. 34% ее элементов располагается слева и 34%-справа от средней):

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

Точно так же рассчитали, что 94,45% элементов популяции при нормальном распределении не выходит за пределы двух стандартных отклонений от средней:

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

и что в пределах трех стандартных отклонений умещается почти вся популяция - 99,73%.

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

Учитывая, что распределение частот фона контрольной группы довольно близко к нормальному, можно полагать, что 68% членов всей популяции, из которой взята выборка, тоже будет получать сходные результаты, т.е. попадать примерно в 13-19 мишеней из 25. Распределение результатов остальных членов популяции должно выглядеть следующим образом:

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

Что касается результатов той же группы после воздействия изучаемого фактора, то стандартное отклонение для них оказалось равным 4,25 (пораженных мишеней). Значит, можно предположить, что 68% результатов будут располагаться именно в этом диапазоне отклонений от средней, составляющей 16 мишеней, т.е. в пределах от 11,75 (16 — 4,25) до 20,25 (16 + 4,25), или, округляя, 12 - 20 мишеней из 25. Видно, что здесь разброс результатов больше, чем в фоне. Эту разницу в разбросе между двумя выборками для контрольной группы можно графически представить следующим образом:

Контрольная группа Мода (Mo) Медиана (Me) Средняя (М) - student2.ru

Поскольку стандартное отклонение всегда соответствует одному и тому же проценту результатов, укладывающихся в его пределах вокруг средней, можно утверждать, что при любой форме кривой нормального распределения та доля ее площади, которая ограничена (с обеих сторон) стандартным отклонением, всегда одинакова и соответствует одной и той же доле всей популяции. Это можно проверить на тех наших выборках, для которых распределение близко к нормальному, - на данных о фоне для контрольной и опытной групп.

Итак, ознакомившись с описательной статистикой, мы узнали, как можно представит графически и оценить количественно степень разброса данных в том или ином распределении. Тем самым мы смогли понять. Чем различаются в нашем опыте распределения для контрольной группы до и после воздействия. Однако можно ли о чем-то судить по этой разнице – отражает ли она действительность или же это просто артефакт, связанный со слишком малым объемом выборки? Тот же вопрос (только еще острее) встает и в отношении экспериментальной группы, подвергнутой воздействию независимой переменной. В этой группе стандартное отклонение для фона и после воздействия тоже различается примерно на 1 (3,14 и 4,04 соответственно). Однако здесь особенно велика разница между средними – 15,2 и 11,3. На основании чего можно было бы утверждать, что эта разность средних действительно достоверна, т.е. достаточно велика, чтобы можно было с уверенностью объяснить ее влиянием независимости переменной, а не простой случайностью? В какой степени можно опираться на эти результаты и распространять их на всю популяцию, из которой взята выборка, т. е. утверждать, что потребление марихуаны и в самом деле обычно ведет к нарушению глазодвигательной координации?

На все эти вопросы и пытается дать ответ индуктивная статистика.

Наши рекомендации