Распределения переменных величин
Переменная - количественно измеряемое свойство или признак, принимающий различные значения. Значения переменных могут изменяться либо непрерывно, либо дискретно. Так, в большинстве психофизиологических исследований измеряемые величины, в принципе, непрерывны, и точность их измерения зависит от точности измерительного устройства (прибора). Дискретные значения переменных встречаются в большинстве психодиагностических процедур, где измеряемый параметр чаще всего принимает целочисленные значения (количество положительных и отрицательных ответов, число правильно решенных задач и т. д.).
Понятия признака и переменной могут использоваться как взаимозаменяемые. Они являются наиболее общими. Иногда вместо них используются понятия показателя или уровня, например, уровень агрессивности, показатель вербального интеллекта и др. Понятия показателя и уровня указывают на то, что признак может быть измерен количественно, так как к ним применимы определения «высокий» или «низкий», например, высокий уровень интеллекта, низкие показатели тревожности и т.д.
Психологические переменные являются случайными величинами, поскольку заранее неизвестно, какое именно значение они примут.
Математическая обработка- это оперирование со значениями признака, полученными у испытуемых в психологическом исследовании. Такие индивидуальные результаты называют также «наблюдениями», «наблюдаемыми значениями», «вариантами», «датами», «индивидуальными показателями» и др.
Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Про случайную величину говорят, что она подчинена данному закону распределения.
В природе существует большое разнообразие законов распределения, объясняемое свойствами самих случайных величин и условиями, в которых они подлежат изучению (например, закон равномерного и закон нормального распределения).
Нормальный закон распределения (закон Гаусса) во всех естественных науках имеет фундаментальное значение. Из-за широкого распространения в природе он первоначально принимался за норму распределения любой случайной величины. Этим и обусловлено название «нормальный» закон. Ф. Гальтон и его последователи доказали, что и психологические особенности, например способности, подчиняются нормальному закону. Поэтому развитие измерительного подхода в психологии и статистического аппарата проверки гипотез происходило на базе этого общего закона.
Нормальное (гауссово) распределение измеряемой переменной величины встречается в тех случаях, когда переменная варьирует случайным образом и не подвержена влиянию какого-либо систематического фактора.
Свойства нормального распределения:
• Единицей измерения нормального распределения является стандартное отклонение.
• Кривая приближается к оси Z по краям асимптотически - никогда не касаясь ее.
• Кривая симметрична относительно X =0. Ее асимметрия и эксцесс равны нулю.
• Кривая имеет характерный изгиб: точка перегиба лежит точно на расстоянии в одну а от X.
• Площадь между кривой и осью Z равна 1.
Благодаря последнему свойству площадь под кривой интерпретируется как вероятность, или относительная частота. Действительно, вся площадь под кривой соответствует вероятности того, что признак примет любое значение из всего диапазона его изменчивости (от -» до +«).
Важной особенностью нормального распределения является то, что форма и положение его графика определяется только двумя параметрами: X (среднее, для генеральной совокупности оно обозначается буквой μ) и а (стандартное отклонение). Если стандартное отклонение а постоянно, а величина средней X меняется, то собственно форма нормальной кривой остается неизменной, а лишь ее график смещается вправо (при увеличении X) или влево (при уменьшении X) по оси абсцисс - ОХ. При условии постоянства средней X изменение а влечет за собой изменение только ширины кривой: при уменьшении а кривая делается более узкой и поднимается при этом вверх, а при увеличении а кривая расширяется, но опускается вниз. Однако во всех случаях нормальная кривая оказывается строго симметричной относительно средней, сохраняя правильную колоколообразную форму.
Для нормального распределения характерно совпадение величин средней арифметической, моды и медианы. Равенство этих показателей указывает на нормальность данного распределения. Это распределение обладает еще одной важной особенностью: чем больше величина признака отклоняется от среднего значения, тем меньше будет частота встречаемости (вероятность) этого признака в распределении.
Согласно теории вероятностей в явлениях, подчиняющихся нормальному закону распределения, между значениями средней арифметической, стандартного отклонения и вариантами существует строгая зависимость. Указанные взаимоотношения средней арифметической, стандартного отклонения и отдельных вариантов иногда называют правилом трех σ.
Несмотря на исходный постулат, в соответствии с которым свойства в генеральной совокупности имеют нормальное распределение, реальные данные, полученные на выборке, нечасто распределены нормально. В большинстве случаев сырые психологические данные часто дают асимметричные, «ненормальные» распределения. Как отмечает Е.В. Сидоренко, причина этого заключается в самой специфике некоторых психологических признаков. Бывает, что от 10 до 20 % испытуемых получают оценку «ноль», например, в методике Хекхаузена, когда в их рассказах не встречается ни одной словесной формулировки, которая отражала бы мотивы надежды на успех или боязни неудачи. Распределение таких оценок не может быть нормальным, как бы ни увеличивался объем выборки.
Несмотря на это, при обработке экспериментальных данных всегда целесообразно проводить оценку характера распределения, так как в зависимости от этого решается вопрос о возможности применения того или иного статистического метода. Кроме того, можно указать по крайней мере натри важных аспекта применения нормального распределения:
· Разработка тестовых шкал.
· Проверка нормальности выборочного распределения для принятия решения о том, в какой шкале измерен признак - в метрической или порядковой.
· Статистическая проверка гипотез, в частности- при определении риска принятия неверного решения.