Формулы приближенных вычислений
Если выборка достаточно большая, а данные подчиняются закону нормального распределения, то можно очень быстро вычислить приблизительные значения среднего арифметического и стандартного отклонения по следующим формулам:
Для вычисления стандартного отклонения необходимо предварительно определить значение коэффициента К (делитель размаха), которое зависит от объема выборки. Оно находится по таблице.
n | 2 - 5 | 6 - 15 | 16 - 49 | 50 - 200 | 201 - 1000 | > 1000 |
K |
Методы первичного описания данных
Для первичного описания исходных данных чаще всего используются таблицы, вариационные ряды и графики. Частным случаем таблицы является таблица кросс-табуляции. Таблицы кросс-табуляциииспользуются для анализа номинативных данных и указывают частоту встречаемости явления. Например, приведенная ниже таблица 2 х 2 демонстрирует наличие или отсутствие интереса к математике у студентов факультета психологии СПбАА обоих полов.
М | Ж | |
Наличие интереса | ||
Отсутствие интереса | ||
Всего: |
Можно ли сказать, что у студентов-юношей интерес к математике выражен меньше, чем у студентов-девушек? Для ответа на данный вопрос следует использовать специальные статистические методы, например, критерий χ2 (читается «хи–квадрат»). Работе с указанным критерием будет посвящен специальный раздел пособия.
Вариационый ряд – упорядоченное отражение распределение значений признака, представляющий двойной ряд чисел и состоящий из обозначения классов и соответствующих частот. В строке признаков можно использовать не только градации (степень выраженности), но и метрические данные, и диапазоны метрических данных.
Степень экстра- версии | ||||
Частота (кол-во случаев) |
Графики (называются также диаграммами) – это чертежи, которые можно использовать для наглядности распределения количественно выраженной величины в выборке. При этом по оси ординат всегда откладывается частота. Ниже дан пример одного из видов графиков, называемого полигоном (представляет собой ломаную линию), демонстрирующего распределение показателей экстраверсии.
Среди графиков также часто используются гистограммы распределения. Они представляют собой столбиковые диаграммы, при этом каждый столбец опирается на значение признака (интервал значения) переменной. Высота столбца соответствует частоте встречаемости этого значения. Ниже приведен пример гистограммы (значения те же).