Часть 4. я, другие и «иные» 23 страница

Таблица Ь.2Л. Результативность испытуемых контрольной и

опытной групп (среднее чнсло пораженных мише­ней из 25 в 10 сериях испытаний)

Контрольная группа   Опытная группа
Испы- Фон После воз- Испы- Фон После воз-
туемые (до воз- действия туемые (до воз- действия
  дейст- (табак с   дейст- (табак с ма-
  вия) нейтраль-   вия) рихуаной)
    ной добав-      
    кой)   -  
Д 1 Д 8
б
Ю 1 Ю9 . 9
б
Итого Итого

Приложение В

      Продолжение табл, Б.2.2
Ю L Ю 9
. 10
И
И И
!2
П
Средняя 13,4 12,7 Средняя 14,06 17,9
Стандарт-     Стандарт-    
ное от-     нос от-    
клонение 2,29 2,09 клонение 2,28 2,97
Девушки: Д1-Д14 т Юноши: Ю1\Ю16
           

Описательная статистика

Описательная статистика позволяет обобщать первичные результа­ты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распреде­ления их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.

Группировка данных

Для группировки необходимо прежде всего расположить данные каждой выборки в возрастающем порядке. Так, в нашем эксперименте для переменной «число пораженных мишеней» данные будут распола­гаться следующим образом:

Опытная группа (дополнить цифрами}
Фон:................... *...............•. - •......
Пост воздействия; .....,.,,,,*...,.;,,,........м........ *.........
Контрольная группа                                  
Фон:  
После voatintCTBMif:  

Статистика и обработка Данных 283

Распределение частот (числа пораженных мишеней)

Уже при первом взгляде не получение ряды можно заметить, что многие данные принимают одни и те же значения, причем одни значения встречаются чаще, а другие-реже. Поэтому было бы интересно вначале графически представить распределение различных значений с учетом их частот. При этом получают следующие столбиковые диаграммы:

Контрольная группа

После воздействий (дополнить столбиками!

Опытная группа

  £0
              Фон              

После воздействии {дополнить столбиками)

Такое распределение данных по их значениям дает нам уже гораздо больше, чем представление в виде радов. Однако подобную группировку используют в основном лишь для качественных данных, четко разде­ляющихся на обособленные категории (см. дополнение Б. I),

Что касается количественных данных, то они всегда располагаются на непрерывной шкале и, как правило, весьма многочисленны. Поэтому такие данные предпочитают группировать по классам, чтобы яснее видна была основная тенденция распределениям

Такая группировка состоит в основном в том, что объединяют данные с одинаковыми или близкими значениями в классы и определяют частоту для каждого класса. Способ разбиения на классы зависит от того, что именно экспериментатор хочет выявить при разделении изме­рительной шкалы на равные интервалы. Например, в нашем случае можно сгруппировать данные по классам с интервалами в две или три единицы шкалы:

          X X              
        X X   X   X          
X   X X X X   х X X     X    
£2  
            Фом                
                                л.          
   
                                                                                                         
          Приложение Б          
Контрольная групп*              
              X  
    X         X  
    X       X ж  
    X X X   X X X
  X X х X   X X X
  X X X X   * х X X X X
Клксы 10-11 12-13 14 15 ieir 13-19 20-21 гг-га   9-1 12-14 15-17 16-го 21-23  
Частоты е э г   А    
      Фон       Фан  
      (с интервалами в 2 ъд.\       (с интервалами в, 3 вд,}  

(заполнить таким же образом)

_

Выбор того или иного типа группировки зависит от различных соображений. Так, в нашем случае группировка с интервалами между классами в две единицы хорошо выявляет распределение результатов вокруг центрального «пика». В то же время группировка с интервалами в три единицы обладает тем преимуществом, что дает более обобщен­ную и упрощенную картину распределения* особенно если учесть, что число элементов в каждом классе невелико1. Именно поэтому в дальней* шем мы будем оперировать классами в три единицы.

Опытная групп*

Классы в-10          
Частоты            
  Фон
Классы 5-7          
Частоты            

После воздействий (с интервалами в 3 ед.)

Данные, разбитые на классы по непрерывной шкале, нельзя предста­вить графически так, как это сделано выше. Поэтому предпочитают

1 При большом количестве данных число классов по возможности должно быть где-то в пределах от 10 ло 20, с интервалами до 10 и более.

                             
Классы а-э                          
Частоты                            
    После воздействия {с интервалами в 2 ед.)       После воздействия (с интервалами в 3 ед-1  

"_____________Статистика и обработка данных____________285

использовать так называемые гистограммы-способ графического

представления в виде примыкающих друг к другу прямоугольников:

часть 4. я, другие и «иные» 23 страница - student2.ru

Фон Поел* воздействия Фон После воздействия

Опытная группа Контрольная групп*

Наконец, для еще более наглядного представления общей конфигу­рации распределения можно строит полигоны распределения частот. Для этого отрезками прямых соединяют центры верхних сторон всех прямоугольников гистограммы, а затем с обеих сторон «замыкают» площадь под кривой, доводя концы полигонов до горизонтальной оси (частота = 0) в точках, соответствующих самым крайним значениям распределения. При этом получают следующую картину:

Частоты

часть 4. я, другие и «иные» 23 страница - student2.ru

Контрольная группа Опытная группа

Если сравнить полигоны, например, для фоновых (исходных) значе­ний контрольной группы и значений после воздействия для опытной группы, то можно будет увидеть, что в первом случае полигон почти симметричен (т. е, если сложить полигон вдвое по вертикали, проходя­щей через его середину, то обе половины наложатся друг на друга)* тогда как для экспериментальной группы он асимметричен и смещен влево (так что справа у него как бы вытянутый шлейф).

Полигон для фоновых данных контрольной группы сравнительно близок к идеальной кривой, которая могла бы получиться для бесконеч­но большой популяции. Такая кривая -кривая нормального распределе­ния -имеет колоколообразную форму я строго симметрична. Если же количество данных ограничено (как в выборках, используемых для научных исследований), то в лучшем случае получают лишь некоторое приближение (аппроксимацию) к кривой нормального распределения.

Приложение f>

Если вы построите полигон для фоновых значений опытной группы и значений после воздействия для контрольной группы, то вы наверняка заметите, что так же будет обстоять дело и в этих случаях.

Оценка центральной тенденции

Если распределения для контрольной группы и для фоновых значе­ний в опытной группе более или. менее симметричны, то значения, получаемые в опытной группе после воздействия, группируются, как уже говорилось, больше в левой части кривой. Это говорит о том, что после употребления марихуаны выявляется тенденция к ухудшению показате­лей у большого числа испытуемых.

Для того чтобы выразить подобные тенденции количественно, ис­пользуют три вида показателей моду, медиану и среднюю.

1. Мода (Мо)-это самый простой из всех трех показателей. Она соответствует либо наиболее частому значению, либо среднему значе­нию класса с наибольшей частотой. Так, в нашем примере для экспери­ментальной группы мода для фона будет равна 15 (этот результат встречается четыре раза и находится в середине класса 14-15-16), а после воздействия (середина класса 8-910),

Мода используется редко и главным образом для того, чтобы дать общее представление о распределении. В некоторых случаях у распреде­ления могут быть две моды; тогда говорят о бимодальном распределе­нии. Такая хартина указывает на то> что в данном совокупности имеются две относительно самостоятельные группы (см,, например, данные Триона, приведенные в документе 3.5).

часть 4. я, другие и «иные» 23 страница - student2.ru

Бимодальное распределение

*

2, Медиана (Me) соответствует центральному значению в последова­тельном ряду всех полученных значений. Так, для фона в эксперимен­тальной группе, где мы имеем ряд

10 11 12 13 14 14 15 15 15 15 17 17 19 20 21,

медиана соответствует 8-му значению, т.е. 15. Для результатов воздей­ствия в экспериментальной группе она равна 10.

В случае если число данных п, четное, медиана равна средней арифметической между значениями, находящимися в раду на л/2-м и я/2 + 1-м местах. Так, для- результатов воздействия для восьми юношей опытной группы медиана располагается между значениями, находящимися на 4-м (8/2 = 4) и 5-м местах в ряду. Если выписать весь

Статистика и обработка данных

2У7

ряд для этих данных;, а именно

7 8 9 II 12 13 14 16,

то окажется, что медиана соответствует (II + 12)/2 =11,5 (видно, что медиана не соответствует здесь ни одному из полученных значений),

3. Средняя арифметическая (1Й) (далее просто «средняя») - это наибо­лее часто используемый показатель центральной тенденции. Ее приме­няют, в частности, в расчетах, необходимых для описания распределения и для его дальнейшего анализа. Ее вычисляют t разделив сумму всех значений данных на число этих данных. Так, для нашей опытной группы она составит- 15,2(228/15) для фона и 11,3(169/15) для результатов воздействия.

Если теперь отметить все эти три параметра на каждой из кривых для экспериментальной группы, то будет видно, что при нормальном расп­ределении они более или менее совпадают, а при асимметричном расп ред е л е ни и - нет.

Прежде чем идти дальше, полезно будет вычислить все эти показате­ли для обеих распределений контрольной группы-они пригодятся нам в дальнейшем: . .

часть 4. я, другие и «иные» 23 страница - student2.ru

часть 4. я, другие и «иные» 23 страница - student2.ru

Приложение Б

Оценка разброса

Как мы уже отмечали, характер распределения результатов после воздействия изучаемого фактора в опытной группе дает существенную информацию о том, как испытуемые выполняли задание. Сказанное относится и к обоим распределениям в контрольной группе:

Контрольная группа Мода (Мо) Мели* не (Me) Средни а (м)

Фон: .................
После воздействия: ч • - •:....... • •......• • ,...••.«••-.

Сразу бросается в глаза, что если средняя в обоих случаях почти одинакова, то во втором распределении результаты больше разбросаны, чем в первом, В таких случаях говорят, что у второго распределения больше диапазон, или размах вариаций, т.е, разница между максималь­ным и минимальным значениями.

Так, если взять контрольную группу, то диапазон распределения для фона составит 22 — 10 = 12, а после воздействия 25 — 8 — 17. Это позво­ляет предположить, что повторное выполнение задачи на глазодвига­тельную координацию оказало на испытуемых из контрольной группы определенное влияние; у одних показатели улучшились, у других ухуд­шились1. Однако для количественной оценки разброса результатов

1 Здесь мог проявиться эффект плацебо связанный с тем, что запах дыма травы вызвал у испытуемых уверенность в том, что они находятся под воз­действием наркотика. Для проверки этого предположения следовало бы повто­рить эксперимент со второй контрольной группой, в которой испытуемым будут давать только обычную сигарету.

часть 4. я, другие и «иные» 23 страница - student2.ru

часть 4. я, другие и «иные» 23 страница - student2.ru

u /lOfHtonmKit thmiwx

относительно средней в том или ином распределении существуют более точные методы, чем измерение диапазона.

Чаще всего для оценки разброса определяют отклонение каждого из полученных значений от средней (М-М)> обозначаемое буквой d, а затем вычисляют среднюю арифметическую всех этих отклонений. Чем она больше, тем больше разброс данных и тем более разнородна выборка. Напротив, если эта средняя невелика, то данные больше сконцентриро­ваны относительно их среднего значения и выборка более однородна.

Итак, первый показатель, используемый для оценки разброса,-это среднее отклонение. Его вычисляют следующим образом (пример, кото­рый мы здесь приведем, не имеет ничего общего с нашим гипотетиче­ским экспериментом). Собрав все данные и расположив их в ряд

3 5 6 9 11 14,

находят среднкУю арифметическую для выборки:

часть 4. я, другие и «иные» 23 страница - student2.ru

Затем вычисляют отклонения каждого значения от средней и сумми­руют их:

часть 4. я, другие и «иные» 23 страница - student2.ru

Однако при таком сложении отрицательные и положительные отклоне­ния будут уничтожать друг друга, иногда даже полностью, так что результат (как в данном примере) может оказаться равным нулю. Из этого ясно, что нужно находить сумму абсолютных значений индиви­дуальных отклонений и уже эту сумму делить на их общее число. При этом получится следующий результат:

среднее отклонение равно

часть 4. я, другие и «иные» 23 страница - student2.ru

Общая формула:

часть 4. я, другие и «иные» 23 страница - student2.ru

где часть 4. я, другие и «иные» 23 страница - student2.ru (сигма) означает сумму; \d\- абсолютное значение каждого инди­видуального отклонения от средней; «-число данных.

Однако абсолютными значениями довольно трудно оперировать в алгебраических формулах* используемых в более сложном статистиче­ском анализе. Поэтому статистики решили пойти по «обходному пути», позволяющему отказаться от значений с отрицательным знаком, а имен­но возводить все значения в квадрат, а затем делить сумму квадратов на

19-443

flfHLtlKXCVIttlC Л

число данных. В нашем примере это выглядит следующим образом:

часть 4. я, другие и «иные» 23 страница - student2.ru

В результате такого расчета получают так называемую варианеу1* Формула для вычисления вариансы, таким образом, следующая:

часть 4. я, другие и «иные» 23 страница - student2.ru

Наконец, чтобы получить показатель, сопоставимый по величине со средним отклонением, статистики решили извлекать из вариансы квад­ратный корень. При этом получается так называемое стандартное отклонение:

часть 4. я, другие и «иные» 23 страница - student2.ru

В нашем примере стандартное отклонение равно часть 4. я, другие и «иные» 23 страница - student2.ru

Следует еще добавить* что для того, чтобы более точно оценить стандартное отклонение для малых выборок (с числом элементов менее 30), в знаменателе выражения под корнем надо использовать не /г, а п — 1:

-

часть 4. я, другие и «иные» 23 страница - student2.ru

Вернемся теперь к нашему эксперименту и посмотрим, насколько полезен оказывается этот показатель для описания выборок.

На первом этапе, разумеется, необходимо вычислить стандартное

Г

1 Варнанса представляет собой один из показателей разброса, используемых в некоторых статистических методиках (например, при вычислении критерия F; см, следующий раздел). Следует отметить, что в отечественной литературе варианту часто называют дисперсией.-Прим. rtepee.

* Стандартное отклонение для популяции обозначается маленькой греческой буквой сигма часть 4. я, другие и «иные» 23 страница - student2.ru , а для выборки - буквой s. Это касается и вариансы, т.е. квадрата стандартного отклонения: для популяции она обозначается часть 4. я, другие и «иные» 23 страница - student2.ru , а для выборки - часть 4. я, другие и «иные» 23 страница - student2.ru

tt vtipafwniKct

отклонение для всех четырех распределений. Сделаем это сначала для фона опытной группы:

Расчет стандартного отклонения1 для фона контрольной группы

Испытуемые Число пора* Средняя женных мише-ней в серии

Отклоне- Квадрат от-

кие от клонздия от

средней (*/) средней (dl)

2 3   10 12 • 15,8 15,8 15,8   -ЗД + 5,8 + 3,8   10,24 33,64 14,44  
- - - 15,8 -6,2 г 38,44

Сумма

Стандартное отклонение

1 Формула для расчетов н сами расчеты приведены здесь лишь в качестве иллюстрации. В наше время гораздо проще при об* рести такой карманный микрокалькулятор, в котором подобные расчеты уже заранее запрограммированы, и для расчета стан­дартного отклонения достаточно лишь ввести данные, а затем нажать клавишу s.

О чем же свидетельствует стандартное отклонение, равное 3,07? Оказывается, оно позволяет сказать, что большая часть результатов (выраженных здесь числом пораженных мишеней) располагается в пре­делах 3,07 от средней, т.е. между 12,73 (15,8 - 3,07) и 18,87 (15,8 4- 3,07),

Для того чтобы лучше понять, что подразумевается под «большей частью результатов», нужно сначала рассмотреть те свойства стандарт­ного отклонения, которые проявляются при изучении популяции с нор­мальным распределением.

Статистики показали, что при нормальном распределении «большая часть» результатов, располагающаяся в пределах одного стандартного отклонения по обе стороны от средней, в процентном отношении всегда одна и та же и не зависит от величины стандартного отклонения: она соответствует 68% популяции (т, е. 34% ее элементов располагается слева и 34%-справа от средней):

часть 4. я, другие и «иные» 23 страница - student2.ru

часть 4. я, другие и «иные» 23 страница - student2.ru

часть 4. я, другие и «иные» 23 страница - student2.ru

Наши рекомендации