Для определения нормальности распределения используются вычисления стан- дартизации (Z-преобразования), асимметрии (As) и эксцесса (Ех)
Стандартизация– перевод измерения в стандартную Z-шкалу. Сначала для каждой переменной, измеренной на выборке, вычисляют среднее М, стандартное отклонение σ, а за- тем все значения Х пересчитываются по формуле:
(1.3)
Асимметрия– степень отклонения графика распределения частот от симметричного вида относительно среднего значения:
(1.4)
Для нормального (симметричного) распределения асимметрия равна 0. Если чаще встречаются значения меньше среднего, то говорят о левосторонней (положительной) асим- метрии (As>0). Если чаще встречаются значения больше среднего, то асимметрия правосто- ронняя (отрицательная) (As<0). Чем больше отклонение от нуля, тем больше асимметрия.
Эксцесс –мера плосковершинности или остроконечности графика распределения из- меренного признака:
(1.5)
Островершинное распределение характеризуется положительным эксцессом (Ех>0), а плосковершинное – отрицательным (-3<Ех <0). Нормальное (средневершинное) распределе- ние имеет нулевой эксцесс (Ех=0) (рис.3).
Рис.3 Графики нормального и отклоняющегося от нормального распределения
Критерии асимметрии и эксцесса определяют допустимую степень отклонения эмпи- рических значений асимметрии и эксцесса от нулевых значений, соответствующих нормаль- ному распределению. Допустимая степень отклонения – та, которая позволяет считать, что эти статистики существенно не отличаются от нормальных параметров. Величина допусти- мых отклонений так называемыми стандартными ошибками асимметрии и эксцесса:
(1.6) (1.7)
Выборочные значения асимметрии и эксцесса не отличаются от нуля, если они не превышают значения своих стандартных ошибок. Это можно считать признаком соответ- ствия выборочного распределения нормальному закону:
As<Assd, Ех<Ехsd
Компьютерные программы вычисляют показатели асимметрии, эксцесса и соответ- ствующим им стандартные ошибки по другим, более сложным формулам.
Причины отклонения от нормальности.
1. Особенность процедуры измерения: используемая шкала может обладать неравно- мерной чувствительностью к измеряемому свойству в разных частях диапазона его изменчи- вости. Например: если задания достаточно простые или время слишком велико, то измерение способности через количество выполненных заданий за определенный промежуток времени будет обладать достаточной чувствительностью лишь в отношении части испытуемых, для которых эти задания достаточно трудны. И слишком большая доля испытуемых будет ре- шать все или почти все задания. В итоге получается распределение с ярко выраженной пра- восторонней асимметрией. Чтобы повысить качество измерения, нужно либо повысить труд- ность заданий, либо сократить время выполнения.
2. Наличие «выбросов» - экстремально больших или малых значений переменной.
«Выбросами» можно считать значения переменной, отличающиеся от среднего значения (М) на 2σ (если N<50) или на 3σ (если N>50). Если таких значений не очень много, их можно ис- ключить из выборки, тем самым несколько уменьшив её объем. Если же исследователь не желает этого делать, то следует отказаться от предположения о нормальности распределения данной переменной.
Последствия отклонения от нормальности.
1. Соответствие ли несоответствие нормальности является тем свойством измеренного признака, который исследователь должен учитывать при выборе статистических процедур анализа данных.
2. При значительном отклонении эмпирического распределения от нормального, сле- дует отказаться от предположения о том, что признак измерен в метрической шкале.
3. Остается открытым лишь вопрос, какова мера существенности этого отклонения?
а) разные методы анализа данных обладают разной чувствительностью к отклонениям от нормальности (например, для выборки до 50 человек критерий Колмогорова-Смирнова недостаточно чувствителен);
б) некоторые процедуры анализа метрических данных вполне допускают отклонения от нормального распределения (одни – в большей степени, другие – в меньшей); мера жест- кости требования нормальности определяется в каждом конкретном методе индивидуально.