Способы табличного и графического представления результатов экспе-

римента.Виды таблиц и их построение. Графическое представление экспери-

ментальных данных. Гистограммы и их применение на практике.

МЕТОДЫ ПЕРВИЧНОЙ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ

РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

Методами статистической обработки результатов экспери-

мента называются математические приемы, формулы, способы

количественных расчетов, с помощью которых показатели, по-

лучаемые в ходе эксперимента, можно обобщать, приводить в си-

стему, выявляя скрытые в них закономерности. Речь идет о та-

ких закономерностях статистического характера, которые су-

ществуют между изучаемыми в эксперименте переменными ве-

личинами.

Некоторые из методов математико-статистического анализа

позволяют вычислять так называемые элементарные матема-

тические статистики, характеризующие выборочное распреде-

ление данных, например выборочное среднее, выборочная диспер-

сия, мода, медиана и ряд других. Иные методы математической

статистики, например дисперсионный анализ,регрессионный ана-

лиз, позволяют судить о динамике изменения отдельных статис-

тик выборки. С помощью третьей группы методов, скажем, кор-

реляционного анализа, факторного анализа, методов сравнения

выборочных данных, можно достоверно судить о статистических

связях, существующих между переменными величинами, кото-

рые исследуют в данном эксперименте.

________Ч

асть I I. В

ведение в научное психологическое исследование _______

Все методы математико-статистического анализа условно де-

лятся на первичные и вторичные1. Первичными называют мето-

ды, с помощью которых можно получить показатели, непосред-

ственно отражающие результаты производимых в эксперимен-

те измерений. Соответственно под первичными статистически-

ми показателями имеются в виду те, которые применяются в са-

мих психодиагностических методиках и являются итогом на-

чальной статистической обработки результатов психодиагности-

ки. Вторичными называются методы статистической обработки,

с помощью которых на базе первичных данных выявляют скры-

тые в них статистические закономерности.

К первичным методам статистической обработки относят, на-

пример, определение выборочной средней величины, выбороч-

ной дисперсии, выборочной моды и выборочной медианы. В чис-

ло вторичных методов обычно включают корреляционный ана-

лиз, регрессионный анализ, методы сравнения первичных ста-

тистик у двух или нескольких выборок.

Рассмотрим методы вычисления элементарных математичес-

ких статистик, начав с выборочного среднего.

Выборочное среднее значение как статистический показатель

представляет собой среднюю оценку изучаемого в эксперименте

психологического качества. Эта оценка характеризует степень его

развития в целом у той группы испытуемых, которая была под-

вергнута психодиагностическому обследованию. Сравнивая не-

посредственно средние значения двух или нескольких выборок,

мы можем судить об относительной степени развития у людей,

составляющих эти выборки, оцениваемого качества.

Выборочное среднее определяется при помощи следующей

формулы:

1 Приводимые здесь определения и высказывания не всегда являются до-

статочно строгими с точки зрения теории вероятностей и математической ста-

тистики как сложившихся областей современной математики. Это сделано для

лучшего понимания данного текста студентами, не подготовленными в облас-

ти математики:

_______Глава 3. Статистический анализ экспериментальных данных_______

где х — выборочная средняя величина или среднее арифметичес-

кое значение по выборке; п — количество испытуемых в выбор-

ке или частных психодиагностических показателей, на основе ко-

торых вычисляется средняя величина; хк — частные значения по-

казателей у отдельных испытуемых. Всего таких показателей п,

поэтому индекс k данной переменной принимает значения от 1

до п; Е — принятый в математике знак суммирования величин

тех переменных, которые находятся справа от этого знака. Выра-

жение X хк соответственно означает сумму всех х с индексом k от

1 до п.

Пример.Допустим, что в результате применения психодиаг-

ностической методики для оценки некоторого психологическо-

го свойства у десяти испытуемых мы получили следующие част-

ные показатели степени развитости данного свойства у отдель-

ных испытуемых: xi = 5, х2 = 4, х3 = 5, х4 = 6, х5 = 7, *6 = 3, х7 = 6, х& = 2, хд= 8, хт = 4. Следовательно, п = 10, а индекс k меняет свои

значения от 1 до 10 в приведенной выше формуле. Для данной

выборки среднее значение1, вычисленное по этой формуле, бу-

дет равно:

В психодиагностике и в экспериментальных психолого-пе-

дагогических исследованиях среднее, как правило, не вычисля-

ется с точностью, превышающей один знак после запятой, т.е. с

большей, чем десятые доли единицы. В психодиагностических

обследованиях большая точность расчетов не требуется и не име-

ет смысла, если принять во внимание приблизительность тех оце-

нок, которые в них получаются, и достаточность таких оценок

для производства сравнительно точных расчетов.

Дисперсия как статистическая величина характеризует, на-

сколько частные значения отклоняются от средней величины в

данной выборке. Чем больше дисперсия, тем больше отклонения

1 В дальнейшем, как это и принято в математической статистике, с целью

сокращения текста мы будем опускать слова «выборочное» и «арифметичес-

кое» и просто говорить о «среднем» или «среднем значении».

________Ч

асть I I. В

ведение в научное психологическое исследование

________

или разброс данных. Прежде чем представлять формулу для рас-

четов дисперсии, рассмотрим пример. Воспользуемся теми пер-

вичными данными, которые были приведены ранее и на основе

которых вычислялась в предыдущем примере средняя величи-

на. Мы видим, что все они разные и отличаются не только друг

от друга, но и от средней величины. Меру их общего отличия от

средней величины и характеризует дисперсия. Ее определяют для

того, чтобы можно было отличать друг от друга величины, име-

ющие одинаковую среднюю, но разный разброс. Представим се-

бе другую, отличную от предыдущей выборку первичных значе-

ний, например такую: 5, 4, 5, 6, 5, 6, 5, 4, 5, 5. Легко убедиться в

том, что ее средняя величина также равна 5,0. Но в данной вы-

борке ее отдельные частные значения отличаются от средней го-

раздо меньше, чем в первой выборке. Выразим степень этого

отличия при помощи дисперсии, которая определяется по следую-

щей формуле:

где S — выборочная дисперсия, или просто дисперсия;

— выражение, означающее, что для всех хк от перво-

го до последнего в данной выборке необходимо вычислить раз-

ности между частными и средними значениями, возвести эти раз-

ности в квадрат и просуммировать;

п — количество испытуемых в выборке или первичных зна-

чений, по которым вычисляется дисперсия.

Определим дисперсии для двух приведенных выше выборок

частных значений, обозначив эти дисперсии соответственно ин-

дексами 1 и 2:'

_______Глава 3, Статистический анализ экспериментальных данных_______

Мы видим, что дисперсия по второй выборке (0,4) значитель-

но меньше дисперсии по первой выборке (3,0). Если бы не было

дисперсии, то мы не в состоянии были бы различить данные вы-

борки.

Иногда вместо дисперсии для выявления разброса частных дан-

ных относительно средней используют производную от дисперсии

величину, называемую выборочное отклонение. Оно равно

квадратному корню, извлекаемому из дисперсии, и обозначается

тем же

самым знаком, что и дисперсия, только без квадрата— S :

Медианой называется значение изучаемого признака, кото-

рое делит выборку, упорядоченную по величине данного призна-

ка, пополам. Справа и слева от медианы в упорядоченном ряду

остается по одинаковому количеству признаков. Например, для

выборки 2, 3, 4, 4, 5, 6, 8, 7, 9 медианой будет значение 5, так как

слева и справа от него остается по четыре показателя. Если ряд

включает в себя четное число признаков, то медианой будет сред-

нее, взятое как полусумма величин двух центральных значений

ряда. Для следующего ряда 0, 1,1, 2, 3, 4, 5, 5, 6, 7 медиана будет

равна 3,5.

Знание медианы полезно для того, чтобы установить, явля-

ется ли распределение частных значений изученного признака

симметричным и приближающимся к так называемому нормаль-

ному распределению. Средняя и медиана для нормального рас-

пределения обычно совпадают или очень мало отличаются друг

от друга. Если выборочное распределение признаков нормаль-

но, то к нему можно применять методы вторичных статистичес-

ких расчетов, основанные на нормальном распределении данных.

В противном случае этого делать нельзя, так как в расчеты могут

вкрасться серьезные ошибки.

Если в книге по математической статистике, где Описывает-

ся тот или иной метод статистической обработки, имеются ука-

зания на то, что его можно применять только к нормальному или

близкому к нему распределению признаков, то необходимо не-

________Ч

асть I I. В

ведение в научное психологическое исследование _______

укоснительно следовать этому правилу и полученное эмпиричес-

кое распределение признаков проверять на нормальность. Если

такого указания нет, то статистика применима к любому распре-

делению признаков. Приблизительно судить о том, является или

не является полученное распределение близким к нормальному,

можно, построив график распределения данных, похожий на те,

которые представлены на рис. 72. Если график оказывается бо-

лее или менее симметричным, значит, к анализу данных можно

применять статистики, предназначенные для нормального рас-

пределения. Во всяком случае, допустимая ошибка в расчетах в

данном случае будет относительно небольшой.

Приблизительные картины симметричного и несимметрич-

ного распределений признаков показаны на рис. 72, где точками

mi и т2 на горизонтальной оси графика обозначены те величины

признаков, которые соответствуют медианам, а х\ и Х2 — те, ко-

торые соответствуют средним значениям.

Мода еще одна элементар-

ная математическая статистика

и характеристика распределе-

ния опытных данных. Модой

называют количественное зна-

чение исследуемого признака,

наиболее часто встречающееся

в выборке. На графиках, пред-

ставленных на рис. 72, моде со-

ответствуют самые верхние

точки кривых, вернее, те значе-

Рис. 72. Графики симметричного и не-

симметричного распределения при- ния этих точек, которые распола-

знаков: I — симметричное распределе- гаются на горизонтальной оси.

ние (все относящиеся к нему элемен- Для симметричных распреде-

тарные статистики обозначены с по- лений признаков,' в том числе

мощью индекса 1); II — несимметрич- для нормального распределе-

ное распределение (его первичные ста-

тистики отмечены на графике индек- ния, значение моды совпадает

сом 2).

со значениями среднего и меди-

аны. Для других типов распределений, несимметричных, это не

характерно. К примеру, в последовательности значений

признаков 1,2, 5,2,4, 2,6,7,2 модой

Глава 3. Статистический анализ экспериментальных данных

является значение 2, так как оно встречается чаще других значе-

ний — четыре раза.

Иногда исходных частных первичных данных, которые под-

лежат статистической обработке, бывает довольно много, и они

требуют проведения огромного количества элементарных ариф-

метических операций. Для того чтобы сократить их число и вмес-

те с тем сохранить нужную точность расчетов, иногда прибегают

к замене исходной выборки частных эмпирических данных на

интервалы. Интервалом называется группа упорядоченных по ве-

личине значений признака, заменяемая в процессе расчетов сред-

ним значением.

Пример.Представим следующий ряд частных признаков: О,

1,1,2,2,3,3,3,4,4,5,5,5,5,6,6,6,7,7,8,8,8,9,9,9,10,10,11,11, 11. Этот

ряд включает в себя 30 значений. Разобьем представленный ряд

на шесть подгрупп по пять признаков в каждом. Первая

подгруппа включит в себя первые пять цифр, вторая — сле-

дующие пять и т.д. Вычислим средние значения для каждой из

пяти образованных подгрупп чисел. Они соответственно будут

равны 1,2; 3,4; 5,2; 6,8; 8,6; 10,6. Таким образом, нам удалось свести

исходный ряд, включающий тридцать значений, к ряду, содер-

жащему всего шесть значений и представленному средними ве-

личинами. Это и будет интервальный ряд, а проведенная проце-

дура — разделением исходного ряда на интервалы. Теперь все

статистические расчеты мы можем производить не с исходным

рядом признаков, а с полученным интервальным рядом, и ре-

зультаты в равной степени будут относиться к исходному ряду.

Однако число производимых в ходе расчетов элементарных

арифметических операций будет гораздо меньше, чем количест-

во тех операций, которые с этой же целью пришлось бы проде-

лать в отношении исходного ряда признаков. На практике, со-

ставляя интервальный ряд, рекомендуется руководствоваться

следующим правилом: если в исходном ряду признаков больше

чем тридцать, то этот ряд целесообразно разделить на пять-шесть

интервалов и в дальнейшем работать только с ними.

Для проверки сказанного проведем пробное вычисление сред-

него значения по приведенному выше ряду, составляющему трид-

цать чисел, и по ряду, включающему только интервальные сред-

Ч

асть I I. В

ведение в научное психологическое исследование

ние значения. Полученные цифры с точностью до двух знаков

после запятой будут соответственно равны 5,97 и 5,97, т.е. явля-

ются одинаковыми.

Наши рекомендации