Понятие нормального распределения
Нормальное распределение играет большую роль в математической статистике, поскольку многие статистические методы предполагают, что, анализируемые с их помощью экспериментальные данные распределены нормально. График нормального распределения имеет вид колоколообразной кривой (см. рис. 2).
Его важной особенностью является то, что форма и положение графика нормального распределения определяется только двумя параметрами: средней μ. (мю) и стандартным отклонением σ(сигма). Если стандартное отклонение σпостоянно, а величина средней μ меняется, то собственно форма нормальной кривой остается неизменной, а лишь ее график смещается вправо (при увеличении μ) или влево (при уменьшении μ) по оси абсцисс — ОХ. При условии постоянства средней μ изменение сигмы влечет за собой изменение только ширины кривой: при уменьшении сигмы кривая делается более узкой, и поднимается при этом вверх, а при увеличении сигмы кривая расширяется, но опускается вниз. Однако во всех случаях нормальная кривая оказывается строго симметричной относительно средней, сохраняя правильную колоколообразную форму.
Рис. 2. Параметры μ и σ для нормального распределения
Для нормального распределения характерно также совпадение величин средней арифметической, моды и медианы. Равенство этих показателей указывает на нормальность данного распределения. Это распределение обладает еще одной важной особенностью: чем больше величина признака отклоняется от среднего значения, тем меньше будет частота встречаемости (вероятность) этого признака в распределении. «Нормальным» такое распределение было названо потому, что оно наиболее часто встречалось в естественнонаучных исследованиях и казалось «нормой» распределения случайных величин.
В психологических исследованиях нормальное распределение используется в первую очередь при разработке и применении тестов интеллекта и способностей. Так, отклонения показателей интеллекта IQ следуют закону нормального распределения, имея среднее значение равное 100 для любой конкретной возрастной группы и стандартное отклонение в подавляющем большинстве случаев равное 16.
Исходя из закона нормального распределения можно установить, насколько близко к крайним значениям распределения подходит то или иное значение IQ, а используя таблицы стандартного нормального распределения, можно вычислить, какая часть популяции имеет то или иное значение IQ.
Однако применительно к другим психологическим категориям, в первую очередь к таким, как личностная и мотивационная сферы, применение нормального распределения представляется весьма дискуссионным. Известно, что в реальных психологических экспериментах редко получаются данные, распределенные строго по нормальному закону. В большинстве случаев сырые психологические данные часто дают асимметричные, «ненормальные» распределения. Как подчеркивает Е.В. Сидоренко (30), причина этого заключается в самой специфике некоторых психологических признаков. Бывает, что от 10 до 20% испытуемых получают оценку «ноль», например, в методике Хекхаузена, когда в их рассказах не встречается ни одной словесной формулировки, которая отражала бы мотивы надежды на успех или боязни неудачи. Распределение таких оценок не может быть нормальным, как бы ни увеличивался объем выборки.
Несмотря на это, при обработке экспериментальных данных всегда целесообразно проводить оценку характера распределения. Эта оценка важна, потому что в зависимости от характера распределения решается вопрос о возможности применения того или иного статистического метода. Как будет понятно из дальнейшего изложения, при нормальном распределении экспериментальных данных применяются особые методы статистической обработки.
Рис. Стандартное нормальное распределение
Таким образом:
□ если xi имеет нормальное распределение со средним М и стандартным отклонением о, то z = (х—Мх)/σ характеризуется единичным нормальным распределением со средним 0 и стандартным отклонением 1;
□ площадь между х, и хг в нормальном распределении со средним Мх стандартным отклонением о равна площади между z1 = (х1—Мх)/σ и z2 = (x2 — Mx)/σ в единичном нормальном распределении.
Итак, наиболее важным общим свойством разных кривых нормального распределения является одинаковая доля площади под кривой между одними и теми же двумя значениями признака, выраженными в единицах стандартного отклонения.
Полезно помнить, что для любого нормального распределения существуют следующие соответствия между диапазонами значений и площадью под кривой:
М+σсоответствует «68% (точно — 68,26%) площади;
М±2σ соответствует »95% (точно — 95,44%) площади;
М+3σ соответствует =100% (точно — 99,72%) площади.
Единичное нормальное распределение устанавливает четкую взаимосвязь стандартного отклонения и относительного количества случаев в генеральной совокупности для любого нормального распределения. Например, зная свойства единичного нормального распределения, мы можем ответить на следующие вопросы. Какая доля генеральной совокупности имеет выраженность свойства от — 1σ до +1σ? Или какова вероятность того, что случайно выбранный представитель генеральной совокупности будет иметь выраженность свойства, на 3σ превышающую среднее значение? В первом случае ответом будет 68,26% всей генеральной совокупности, так как от —1 до +1 содержится 0,6826 площади единичного нормального распределения. Во втором случае ответ: (100—99,72)/2= 0,14%.
Полезно знать, что если распределение является нормальным, то:
90%всех случаев располагается в диапазоне значений М± 1,64 σ;
95%всех случаев располагается в диапазоне значений М± 1,96 σ;
99%всех случаев располагается в диапазоне значений М± 2,58 σ.
Существует специальная таблица, позволяющая определять площадь под кривой справа от любого положительного z. Пользуясь ею, можно определить вероятность встречаемости значений признака из любого диапазона. Это широко используется при интерпретации данных тестирования.
Уточним некоторые значения.
Генеральная совокупность, средняя μ, ст. ошибка среднего
Доверительные интервалы:
Доверительная вероятность (1-α) | Границы доверительного интервала (для n>30) | Границы доверительного интервала (для n=15) |
90% | ||
95% | ||
99% |
При n=30
Доверительный интервал от до содержат μ с вероятностью 34,13%*2.
При n<30
Доверительный интервал рассчитывается по формуле , где t – квантиль распределения Стьюдента для соответствующей доверительной вероятности и df =n-1.
СТАНДАРТИЗАЦИЯ ПО ШКАЛАМ:
Типы стандартных шкал:
1) Z-оценок и производные от нее;
2) Квантильные шкалы;
3) Шкалы 10, 9, 7,5- балльные.
1)
1.стандартизированные
2. 2/3
3.со стандартами коэффициентами при z, по формуле
для: IQ - a=15, b=100;
T - a=10, b=50.
2)
разбиение квантилями выборки на одинаковое количество объектов (испытуемых):
Номер группы (по 10% в каждой) | ||||||||||
Правая граница группы в процентилях | ||||||||||
Правая граница в долях σ | -1,28 | -0,84 | -0,52 | -0,25 | +0,25 | +0,52 | +0,84 | +1,28 |
3)
Шкала | M | σ |
Стены (стандартная 10) | 5,5 | |
Станайны (стандартная 9) | ||
7-балльная | ||
5-бальная |
Соотношение типов шкал:
Тип | Номер группы | |||||||||
1. | 2. | 3. | 4. | 5. | 6. | 7. | 8. | 9. | 10. | |
2,28 | 4,4 | 9,19 | 14,98 | 19,15 | 19,15 | 14,98 | 9,19 | 4,4 | 2,28 | |
2/3 Z | 2,2 | 6,7 | 16,1 | 16,1 | 6,7 | 2,2 | ||||
Z | 2,28 | 13,59 | 68,26 | 13,59 | 2,28 |
Может быть произведен подсчет в интерпретируемые значения:
Номер группы | 1. | 2. | 3. | 4. | 5. |
Интерпретация | Низкие | Ниже среднего | Средние | Выше среднего | Высокие |
Шкалы пересчета сырых баллов | <55 | 55-64 | 65-85 | 86-95 | >95 |
Например, при нормировании (по Z-шкале): M=75, σ=10
Ненормированная стандартизация:
Например, тестирование по 12-балльной шкале. Тогда пересчитывают количество баллов, которые соответствуют нормативным процентам в стандартных шкалах.
Глава 5