Дополнительные сведения
Меры центральной тенденции
Существует три основные меры центральной тенденции распределения.
? Среднее значение (mean) равно сумме всех значений распределения, деленной
на их количество. Для распределения [3575689] среднее значение равно
(3 + 5 + 7 + 5 + 6 + 8 + 9)/7 - 6,14.
? Медиана (median) определяется как значение, находящееся в середине рас
пределения, полученного из исходного путем упорядочивания по возраста
нию. Для распределения [3 5 7 5 6 8 9J медиана равна 6, поскольку значение,
равное 6, находится в центре последовательности [3556789].
? Мода (mode) равна наиболее часто встречающемуся значению. В распре
делении [3575689] мода равна 5, поскольку число 5 встречается в нем
дважды.
Меры изменчивости
Выделяют две величины, характеризующие изменчивость, или разброс, значений распределения относительно среднего.
106____ Глава 7. Описательные статистиД
? Дисперсия (variance) равна сумме квадратов отклонений каждого значения
от среднего, деленной па N - 1, где N — число значений в распределении.
Для распределения [3575689] дисперсия равна ((3 - 6 14)2 + (5 - 6Д4)2 +
+ (7 - 6Д4)2 + (5 - 6,14)2 + (6 - 6Д4)2 + (8 - 6,14)2 + (9 - 6,14)2)/6 = 4,1429.
? Стандартное отклонение (standard deviation) равно квадратному корню
из дисперсии. Для распределения [3575689] стандартное отклонение
равно 2,0354.
Стандартное отклонение является довольно наглядной и информативной для исследователя характеристикой распределения, а дисперсия, как правило, используется как вспомогательная величина в статистических вычислениях.
Характеристики диапазона распределения
Дополнительными мерами изменчивости являются 4 простые характеристики, отражающие границы распределения и его размах.
Минимум (minimum) равен наименьшему из значений распределения. Для распределения [3575689] минимум равен 3.
Максимум (maximum) равен наибольшему из значений распределения. Для распределения [3575689] максимум равен 9.
Размах (range) составляет разность между максимумом и минимумом распределения. В случае распределения [3575689] размах равен 9-3 = 6.
Сумма (sum) равна сумме всех значений распределения. Для распределения [3575689] сумма равна 3 + 5 + 7 + 5 + 6 + 8 + 9 = 43.
Характеристики формы распределения
Для отражения близости формы распределения к нормальному виду существует две основные характеристики.
► Эксцесс (kurtosis) является мерой «сглаженности» («остро-» или «нлосковер-
шишюсти») распределения. Если значение эксцесса близко к 0, это означает,
что форма распределения близка к нормальному виду. Положительный экс
цесс указывает на «плосковершииное» распределение, у которого максимум
вероятности выражен не столь ярко, как у нормального. Значения эксцесса,
превышающие 5,0, говорят о том, что по краям распределения находится боль
ше значений, чем вокруг среднего. Отрицательный эксцесс, напротив, харак
теризует «островершишюе» распределение, график которого более вытянут
по вертикальной оси, чем график нормального распределения. Считается, что
распределение с эксцессом в диапазоне от -1 до +1 примерно соответствует
нормальному виду. В большинстве случаев вполне допустимо считать нор
мальным распределение с эксцессом, но модулю не превосходящим 2.
Пошаговый алгоритм вычислений _______________________ 107
^. Асимметрия (skewness) показывает, в какую сторону относительно среднего сдвинуто большинство значений распределения. Нулевое значение асимметрии означает симметричность распределения относительно среднего значения, положительная асимметрия указывает па сдвиг распределения в сторону меньших значений, а отрицательная асимметрия — в сторону больших значений. В большинстве случаев за нормальное принимается распределение с асимметрией, лежащей в пределах от -1 до +1. В исследованиях, не требующих высокой точности результатов, нормальным считают распределение с асимметрией, но модулю не превосходящей 2.
Стандартная ошибка
Стандартная ошибка (standard error) является характеристикой точности, или стабильности, величины, для которой она вычисляется. В контексте программы SPSS стандартная ошибка используется для среднего значения, асимметрии и эксцесса. Ее смысл заключается в следующем. Вы можете, взяв определенное количество случайно выбранных значений генеральной совокупности, составить выборку и вычислить для нее среднее значение. Повторив эту операцию некоторое количество раз, вы получите набор средних значений выборок, которые также представляют собой некоторое распределение. Стандартное отклонение этого распределения и будет являться стандартной ошибкой для среднего значения генеральной совокупности. Аналогичным способом вычисляются стандартные ошибки для асимметрии и эксцесса. Чем меньше значение стандартной ошибки, тем выше стабильность величины, для которой она вычисляется.
В мсто Analyze (Анализ) выберите команду Descriptive Statistics ► Descriptives (Описательные статистики ► Описательные статистики). На экране появится диалоговое окно Descriptives (Описательные статистики),
Понятие корреляции
Корреляция, или коэффициент корреляции, — это статистический показатель вероятностной связи между двумя переменными, измеренными в количественной шкале. В отличие от функциональной связи, при которой каждому значению одной переменной соответствует строго определенное значение другой переменной, вероятностная связь характеризуется тем, что каждому значению одной переменной соответствует множество значений другой переменной. Примером вероятностной связи является связь между ростом и весом людей. Ясно, что один и тот же рост может быть у людей разного веса, как и наоборот. Величина коэффици-
Понятие корреляции
еНта корреляции меняется от --1 до 1. Крайние значения соответствуют линейной функциональной связи между двумя переменными, 0 - отсутствию связи.
Наглядное представление о связи двух переменных дает график двухмерного рассеивания - соответствующая команда Scatter (Рассеивание) имеется в меню Graphs (Графики). На таком графике каждый объект представляет собой точку, коорди-шты которой заданы значениями двух переменных. Таким образом, множество объектов представляет собой на графике множество точек. По конфигурации этого множества точек можно судить о характере связи между двумя переменными.
Строгая положительная корреляция (perfect positive correlation) определяется значением г - 1. Термин «строгая» означает, что значения одной переменной однозначно определяются значениями другой переменной, а термин «положительная» — что с возрастанием значений одной переменной значения другой переменной также возрастают.
Строгая корреляция является математической абстракцией и практически не встречается в реальных исследованиях. Примером строгой корреляции является соответствие между временем пути и пройденным расстоянием при неизменной скорости.
Положительная корреляция соответствует значениям 0 < г < 1. Положительную корреляцию следует интерпретировать следующим образом: если значения одной переменной возрастают, то значения другой имеют тенденцию к возрастанию. Чем коэффициент корреляции ближе к 1, тем сильнее эта тенденция, и обратно, с приближением коэффициента корреляции к 0 тенденция ослабевает.
Примером значительной положительной корреляции служит зависимость между ростом и весом человека. Считается, что в этом случае коэффициент корреляции равен г = 0,83. Слабая положительная корреляция (г = 0,12) наблюдается между способностью человека к сочувствию и реальной помощью, которую он оказывает нуждающимся людям.
Отсутствие корреляции (no correlation) определяется значением г = 0. Нулевой коэффициент корреляции говорит о том, что значения переменных никак не связаны друг с другом. Примером пары величин с нулевой корреляцией является рост человека и результат его IQ-теста.
Отрицательная корреляция соответствует значениям -1 < г < 0. Если значения одной переменной возрастают, то значения другой имеют тенденцию к убыванию. Чем коэффициент корреляции ближе к -1, тем сильнее эта тенденция, и обратно, с приближением коэффициента корреляции к 0 тенденция ослабевает.
Слабая отрицательная корреляция (г = -0,13) наблюдается между агрессивностью человека по отношению к своему другу и помощью, которую он ему оказывает. Чем агрессивней человек, тем помощь меньше, однако зависимость выражена слабо. Примером значительной отрицательной корреляции (г = -0,73) служит .зависимость между нервной возбудимостью человека и его эмоциональной уравновешенностью. Чем выше оказывается результат его теста на возбудимость, тем более низкий результат имеет его тест на уравновешенность.
Строгая отрицательная корреляция (perfect negative correlation) определяется значением г = -1. Она, так же как и строгая положительная корреляция, является абстракцией и не находит отражения в практических исследованиях. Пример, иллюстрирующий строгую отрицательную корреляцию, можно взять из школьного учебника физики: при равномерном движении расстояние равно произведению времени па скорость. При заданном расстоянии время и скорость являются обратно пропорциональными величинами: чтобы пройти путь за половину времени, необходимо идти вдвое быстрее.
Дополнительные сведения