Оценка центральной тенденции

Если распределения для контрольной группы и для фоновых значе­ний в опытной группе более или менее симметричны, то значения, получаемые в опытной группе после воздействия, группируются, как уже говорилось, больше в левой части кривой. Это говорит о том, что после употребления марихуаны выявляется тенденция к ухудшению показате­лей у большого числа испытуемых.

Для того чтобы выразить подобные тенденции количественно, ис­пользуют три вида показателей моду, медиану и среднюю.

1. Мода (Мо)-это самый простой из всех трех показателей. Она соответствует либо наиболее частому значению, либо среднему значе­нию класса с наибольшей частотой. Так, в нашем примере для экспери­ментальной группы мода для фона будет равна 15 (этот результат встречается четыре раза и находится в середине класса 14-15-16). а после воздействия - 9 (середина класса 8-9-10).

Мода используется редко и главным образом для того, чтобы дать общее представление о распределении В некоторых случаях у распреде­ления могут быть две моды; тогда говорят о бимодальном распределе­нии. Такая картина указывает на то, что в данном совокупности имеются две относительно самостоятельные группы (см., например, данные Триона, приведенные в документе 3.5).

Оценка центральной тенденции - student2.ru

Бимодальное распределение

2. Медиана (Me) соответствует центральному значению в последова­тельном ряду всех полученных значений. Так, для фона в эксперимен­тальной группе, где мы имеем ряд

10 11 12 13 14 14 15 15 15 15 17 17 19 20 21,

медиана соответствует 8-му значению, т.е. 15. Для результатов воздей­ствия в экспериментальной группе она равна 10.

В случае если число данных и, четное, медиана равна средней арифметической между значениями, находящимися в ряду на и/2-м и п/2 + 1-м местах. Так, для результатов воздействия для восьми юношей опытной группы медиана располагается между значениями. находящимися на 4-м (8/2 = 4) и 5-м местах в ряду. Если выписать весь

Статистика и обработка дачных 287

ряд для эгих данных, а именно

7 8 9 11 12 13 14 16,

то окажется, что медиана соответствует (11 + 12)/2 = 11,5 (видно.^что медиана не соответствует здесь ни одному из полученных значении).

3 Средняя арифметическая (М) (далее просто «средняя») - это наибо­лее часто используемый показатель центральной тенденции. Ее приме­няют, в частности, в расчетах, необходимых для описания распределения и для его дальнейшего анализа. Ее вычисляют, разделив сумму всех значений данных на число этих данных. Так, для нашей опытной группы она составит 15,2(228/15) для фона и 11,3(169/15) для результатов

воздействия.

Если теперь отметить все эти три параметра на каждой из кривых для экспериментальной группы, то будет видно, что при нормальном расп­ределении они более или менее совпадают, а при асимметричном

распределении - нет.

Прежде чем идти дальше, полезно будет вычислить все эти показате­ли для обеих распределений контрольной группы-они пригодятся нам в дальнейшем:

Оценка центральной тенденции - student2.ru

9 10 11 12131415161718192021222324Фон

Mo=15 Me =15 М=15,2

Оценка центральной тенденции - student2.ru

После воздействия

Мо=9 Ме=10 М=11.3

288 Приложение Б

Оценка разброса

Как мы уже отмечали, характер распределения результатов после воздействия изучаемого фактора в опытной группе дает существенную информацию о том, как испытуемые выполняли задание. Сказанное относится и к обоим распределениям в контрольной группе:

Контрольная группа Мода (Мо) Медиана (Me) Средняя М\)

Ф°": ............ ............ ............

После воздействия: ............ ............ ............

Оценка центральной тенденции - student2.ru

Оценка центральной тенденции - student2.ru

8 9 10 11 12 1314 1516 171819 2021 22232425 После воздействия

Сразу бросается в глаза, что если средняя в обоих случаях почти одинакова, то во втором распределении результаты больше разбросаны, чем в первом. В таких случаях говорят, что у второго распределения больше диапазон, или размах вариаций, т. е. разница между максималь­ным и минимальным значениями.

Так, если взять контрольную группу, то диапазон распределения для фона составит 22 — 10 = 12, а после воздействия 25 — 8 = 17. Это позво­ляет предположить, что повторное выполнение задачи на глазодвига-тельную координацию оказало на испытуемых из контрольной группы определенное влияние: у одних показатели улучшились, у других ухуд­шились1. Однако для количественной оценки разброса результатов

' Здесь мог проявиться зффект п.шцебо, связанный с тем. что запах дыма травы вызвал у испытуемых уверенность в том, что они находятся под воз­действием наркотика. Для проверки этого предположения следовало бы повто­рить эксперимент со второй контрольной группой, в которой испытуемым будуг 1;|вать только обычную сигарету.

относительно средней в том или ином распределении существуют более точные методы, чем измерение диапазона.

Чаще всего для оценки разброса определяют отклонение каждого из полученных значений от средней (М-М), обозначаемое буквой d, а затем вычисляют среднюю арифметическую всех этих отклонений. Чем она больше, тем больше разброс данных и тем более разнородна выборка. Напротив, если эта средняя невелика, то данные больше сконцентриро­ваны относительно их среднего значения и выборка более однородна.

Итак, первый показатель, используемый для оценки разброса,-это среднее отклонение. Его вычисляют следующим образом (пример, кото­рый мы здесь приведем, не имеет ничего общего с нашим гипотетиче­ским экспериментом). Собрав все данные и расположив их в ряд

356911 14, находят среднюю арифметическую для выборки:

3+5+6+9+11+14 48

__————^———————=^=8.

Затем вычисляют отклонения каждого значения от средней и сумми­руют их:

-5 -3 -2 +1 +3 +6 (3 - 8) + (5 - 8) + (6 - 8) + (9 - 8) + (11 - 8) + (14 - 8).

Однако при таком сложении отрицательные и положительные отклоне­ния будут уничтожать друг друга, иногда даже полностью, так что результат (как в данном примере) может оказаться равным нулю. Из этого ясно, что нужно находить сумму абсолютных значений индиви­дуальных отклонений и уже эту сумму делить на их общее число. При этом получится следующий результат:

среднее отклонение равно 53213 |3-8|+|5-8[+|6-8|+|9-8|+|11 -8|+ 14^8! 20 ззз
б 33'3-

Общая формула:

2^| п

Среднее отклонение =

где Т. (сигма) означает сумму; | d\ - абсолютное значение каждого инди­видуального отклонения от средней; и-число данных.

Однако абсолютными значениями довольно трудно оперировать в алгебраических формулах, используемых в более сложном статистиче­ском анализе. Поэтому статистики решили пойти по «обходному пути», позволяющему отказаться от значений с отрицательным знаком, а имен­но возводить все значения в квадрат, а затем делить сумму квадратов на

Приложение Б

число данных. В нашем примере это выглядит следующим образом:

(_5)2 + (-З)2 + (-2)2 + (+1)2 + (+3)2 + (+6)2 _

6 _25+9+4+1+9+36_84_

6 - 6 ~ '

В результате такого расчета получают так называемую вариансу1 Формула для вычисления вариансы, таким образом, следующая:

Варианса -=•

Наконец, чтобы получить показатель, сопоставимый по величине со средним отклонением, статистики решили извлекать из вариансы квад­ратный корень. При этом получается так называемое стандартное отклонение:

Стандартное отклонение =

В нашем примере стандартное отклонение равно ^14 = 3,74.

Следует еще добавить, что для того, чтобы более точно оценить стандартное отклонение для малых выборок (с числом элементов менее 30), в знаменателе выражения под корнем надо использовать не п, an—I:

Оценка центральной тенденции - student2.ru

Вернемся теперь к нашему эксперименту и посмотрим, насколько полезен оказывается этот показатель для описания выборок.

На первом этапе, разумеется, необходимо вычислить стандартное

* Варианса представляет собой один из показателей разброса, используемых в гекоторых статистических методиках (например, при вычислении критерияF,<.м. следующий раздел). Следует отметить, что в отечественной литературе вариансу часто называют дисперсией. -Прим. перед.

* Стандартное отклонение для популяции обозначается маленькой греческой буквой сигм! (ст), а для выборки - буквой s. Это касается и вариансы, т.е кзадрага стандартного отклонения, для популяции она обозначается ет2, а для выборки s2.

Статистика и обработка данных

отклонение для всех четырех распределений. Сделаем это сначала для фона опытной группы:

Расчет стандартного отклонения ^ для фона контрольной группы

Испытуемые Число пора- Средняя Отклоне- Квадрат от-женных мише- ние от клонения от ней в серии средней (d) средней (d2)

19 10

15,8 15,8 15,8

-3,2 +5.8 +3,8

10.24 33,64 14,44

15 22 15,8 -6,2 38,44

Сумма (^)d2 = 131,94

131,94

Варианса (s2} = • = 9,42.

Н-1 14 Стандартное отклонение (?) = ^'варианса = л/9,42 == 3,07.

' Формула для расчетов и сами расчеты приведены здесь лишь в качестве иллюстрации В наше время гораздо проще приоб­рести гакой карманный микрокалькулятор, в котором подобные расчеты уже заранее запрограммированы, и для расчета стан­дартного отклонения достаточно лишь ввести данные, а затем нажать клавишу s.

О чем же свидетельствует стандартное отклонение, равное 3,07? Оказывается, оно позволяет сказать, что большая часть результатов (выраженных здесь числом пораженных мишеней) располагается в пре­делах 3,07 от средней, т.е. между 12,73 (15,8 - 3,07) и 18,87 (15,8 + 3,07).

Для того чтобы лучше понять, что подразумевается под «большей частью результатов», нужно сначала рассмотреть те свойсгва стандарт­ного отклонения, которые проявляются при изучении популяции с нор­мальным распределением.

Статистики показали, что при нормальном распределении «большая часть» результатов, располагающаяся в пределах одного стандартного отклонения по обе стороны от средней, в процентном отношении всегда одна и та же и не зависит от величины стандартного отклонения: она соответствует 68% популяции (т.е. 34% ее элементов располагается слева и 34%-справа от средней):

Приложение Б Оценка центральной тенденции - student2.ru

Точно так же рассчитали, что 94,45% элементов популяции при нормальном распределении не выходит за пределы двух стандартных отклонений от средней:

Оценка центральной тенденции - student2.ru

и что в пределах трех стандартных отклонений умещается почти вся популяция - 99,73 %.

99.73%

Оценка центральной тенденции - student2.ru

Учитывая, что распределение частот фона контрольной группы довольно близко к нормальному, можно полагать, что 68% членов всей популяции, из которой взята выборка, тоже будет получать сходные результаты, т.е. попадать примерно в 13-19 мишеней из 25. Распределе­ние результатов остальных членов популяции должно выглядеть следу­ющим образом:

Статистика и обработка данных

99,7%

95,4%

68,3%

34,1 % 34,1 % 2,2%

0,13%

13,6%

13,6%

0,13%

6,59 9,66 12,73 15,8 18,87 21,94 25,01

-Id +1(7

-2а +2о

-За +3а

Гипотетическая популяция,

из которой взята контрольная группа (фон)

Что касается результатов той же группы после воздействия изучаемо­го фактора, то стандартное отклонение для них оказалось равным 4,25 (пораженных мишеней). Значит, можно предположить, что 68% резуль­татов будут располагаться именно в этом диапазоне отклонений от средней, составляющей 16 мишеней, т.е. в пределах от 11,75 (16 — 4,25) до 20,25 (16 + 4,25), или, округляя, 12 — 20 мишеней из 25. Видно, что здесь разброс результатов больше, чем в фоне. Эту разницу в разбросе между двумя выборками для контрольной группы можно графически представить следующим образом:

Оценка центральной тенденции - student2.ru

12,73 15,8 18,87

-la +lo Фон

294 Приложение Б

Оценка центральной тенденции - student2.ru

-1о +1о После воздействия

Поскольку стандартное отклонение всегда соответствует одному и тому же проценту результатов, укладывающихся в его пределах вокруг средней, можно утверждать, что при любой форме кривой нормального распределения та доля ее площади, которая ограничена (с обеих сторон) стандартным отклонением, всегда одинакова и соответствует одной и той же доле всей популяции. Это можно проверить на тех наших выборках, для которых распределение близко к нормальному,-на дан­ных о фоне для контрольной и опытной групп.

Итак, ознакомившись с описательной статистикой, мы узнали, как можно представить графически и оценить количественно степень разбро­са данных в том или ином распределении. Тем самым мы смогли понять, чем различаются в нашем опыте распределения для контрольной группы до и после воздействия. Однако можно ли о чем-то судить по этой разнице - отражает ли она действительность или же это просто артефакт, связанный со слишком малым объемом выборки? Тот же вопрос (только еще острее) встает и в отношении экспериментальной группы, подверг­нутой воздействию независимой переменной. В этой группе стандартное отклонение для фона и после воздействия тоже различается примерно на 1 (3,14 и 4,04 соответственно). Однако здесь особенно велика разница между средними-15,2 и 11,3. На основании чего можно было бы утверждать, что эта разность средних действительно достоверна, т.е.-достаточно велика, чтобы можно было с уверенностью объяснить ее влиянием независимой переменной, а не простой случайностью? В какой степени можно опираться на эти результаты и распространять их на всю популяцию, из которой взята выборка, i. е. утверждать, что потребление марихуаны и в самом деле обычно ведет к нарушению глазодвигатель-ной координации?

На все эти вопросы и пытается дать ответ индуктивная статистика.

Статистика и обработка данных 295

Индуктивная статистика

Задачи индуктивной статистики заключаются в том, чтобы опреде­лять, насколько вероятно, что две выборки принадлежат к одной

популяции.

Давайте наложим друг на друга, с одной стороны, две кривые-до и после воздействия-для контрольной группы и, с другой стороны, две аналогичные кривые для опытной группы. При этом масштаб кривых должен быть одинаковым.

Оценка центральной тенденции - student2.ru

Оценка центральной тенденции - student2.ru

Видно, что в контрольной i руппе разница между средними обоих распределений невелика, и поэтому можно думать, что обе выборки прик длежат к одной и той же популяции. Напротив, в опытной группе большая разность между средними позволяет предположить, что рас­пределения для фона и воздействия относятся к двум различным популяциям, разница между которыми обусловлена тем, что на одну из них повлияла независимая переменная.

Проверка гипотез

Как уже говорилось, задача индуктивной статистики- определять. достаточно ли велика разность между средними двух распределений для того, чтобы можно было объяснить ее действием независимой перемен­ной, а не случайностью, связанной с малым объемом выборки (как,

296 Приложение Б

по-видимому, обстоит дело в случае с опытной группой нашего экспе­римента).

При этом возможны две гипотезы:

1) нулевая гипотеза (Нд), согласно которой разница между распреде­лениями недостоверна; предполагается, что различие недостаточно зна­чительно, и поэтому распределения относятся к одной и той же популя­ции, а независимая переменная не оказывает никакого влияния;

2) альтернативная гипотеза (Н^), какой является рабочая гипотеза нашего исследования. В соответствии с этой гипотезой различия между обоими распределениями достаточно значимы и обусловлены влиянием независимой переменной.

Основной принцип метода проверки гипотез состоит в том, что выдвигается нулевая гипотеза Нд, с тем чтобы попытаться опровергнуть ее и тем самым подтвердить альтернативную гипотезу Hi. Действитель­но, если результаты сгатистического теста, используемого для анализа разницы между средними, окажутся таковы, что позволят отбросить Нд, это будет означать, что верна Нц т.е. выдвинутая рабочая гипотеза подтверждается.

В гуманитарных науках принято считать, что нулевую гипотезу можно отвергнуть в пользу альтернативной гипотезы, если по результа­там статистического теста вероятность случайного возникновения най­денного различия не превышает 5 из 1001. Если же этот уровень достоверности не достигается, считают, что разница вполне может быть случайной и поэтому нельзя отбросить нулевую гипотезу.

Для того чтобы судить о том, какова вероятность ошибиться, принимая или отвергая нулевую гипотезу, применяют статистические методы, соответствующие особенностям выборки.

Так, для количественных данных (см. дополнение Б.1) при распреде­лениях, близких к нормальным, используют параметрические методы, основанные на таких показателях, как средняя и стандартное отклоне­ние. В частности, для определения достоверности разницы средних для двух выборок применяют метод Стьюдента, а для того чтобы судить о различиях между тремя или большим числом выборок,-тестF, или дисперсионный анализ.

Если же мы имеем дело с неколичественными данными или выборки слишком малы для уверенности в том, что популяции, из которых они взяты, подчиняются нормальному распределению, тогда используют непараметрические методы-критерии у2 (.та-квадрат) для качественных данных и критерии знаков, рангов, Манна-Уитни, Вилкоксона и др. для порядковых данных.

Кроме того, выбор статистического метода зависит от того, явля­ются ли те выборки, средние которых сравниваются, независимыми (т. е., например, взятыми из двух разных групп испытуемых) или зависимыми

__'_Разумеется, риск ошибиться будет еще меньше, если окажется, что эта вероятное гь составляет 1 на 100 или, еще лучше, 1 на 1000

Оценка центральной тенденции - student2.ru

Статистика и обработка данных



(т. е. отражающими результаты одной и той же группы испытуемых до и после воздействия или после двух различных воздействий).

Наши рекомендации