Тема 2. Варияционный ряд. Числовая характеристика дискретного статистического ряда. Средние величины. Полигон.
Ряд распределения – это последовательность качественых,количественных значений признака и частоты его встречаемости. Ряд, составленного на основе качественного признака – атрибутивных количественного – вариационный
Вариационный ряд (frequency table)- ранжированный ряд распределения по величине какого-либо признака. Этот признак носит название варьирующего, а его отдельные числовые значения называются вариантами и обозначаются через "х". Число, показывающее, сколько раз данная варианта встречается в вариационном ряду, называется частотой и обозначается через "р".
Вариационный ряд можно разбивать на отдельные (по возможности равные) части, которые называются квантилями (quantile). Наиболее часто употребляемые квантили представлены в таблице 1.
Название квантилей | Число частей, на которые разбивается ряд |
Медиана | |
Терциль | |
Квартиль | |
Дециль | |
Процентиль |
Таблица 1. Часто употребляемые квантили
Виды вариационных рядов: 1. В зависимости от вида случайной величины :
- дискретный; -
непрерывный .
2. В зависимости от группировки вариант:
- несгруппированный;
- сгруппированный (интервальный): 3.
В зависимости от частоты, с которой каждая варианта встречается в вариационном ряду:
- простой ( р =1);
- взвешенный ( р >1).
ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА:
1). Показатели, характеризующие центральную тенденцию (central tendency) или уровень ряда: средние величины или меры расположения (собственно средние и структурные средние).
2). Показатели, характеризующие разнообразие (рассеяние, вариацию, разброс) (spread) признака: стандартное отклонение, дисперсия, размах.
Средние величины
Средняя величина - обобщающий коэффициент, который характеризует наиболее типичный размер определенного признака в целом для совокупности или для отдельных ее частей. Расчет средних величин имеет смысл только для качественно однородной совокупности, в связи с этим в одной совокупности может быть столько средних, на сколько однородных групп она может быть разбита.
Виды средних величин
Средняя арифметическая(mean) - применяется, если варианты возрастают (убывают) в арифметической прогрессии.
Хвыб. сред.=
х - средняя арифметическая; xi - варианта; m- частота встречаемости варианты; n - число наблюдений.
Изучаемый признак (х),Частота признака (х) =m. ∑ m= n Сумма «m» равно объёму выборки. Отношение частоты (m) к объёму выборки (n) называют относительной частотой (P) P= m/ n
Структурные средние.
- Мода (Мо) (mode)- наиболее часто встречающаяся в вариационном ряду варианта. Мода используется:
- при малом числе наблюдений, когда велико влияние состава совокупности на среднюю ;
- для характеристики центральной тенденции при ассиметричных распределениях, когда велико влияние на среднюю крайних вариант;
- Медиана (Me)(median) - варианта, которая делит вариационный ряд на две равные части.
Медиана используется:
- при необходимости знать, какая часть вариант лежит выше и ниже срединного значения;
- для характеристики центральной тенденции при ассиметричных распределениях .
Для графического изображения статического распределения используются полигоны и гистограммы. Полигон обычно используются в случае небольшого количества вариант. Полигон (многоугольник) частот - график ряда, представленный ломаной линией точки - вершины которой соответствуют серединам интервалов, а высота точки над горизонталью пропорциональна частоте или частотности.
По оси 0х – откладывают значение вариант х, на оси 0у –значение частот или относительных час10,10,1
1 2 3 4 5
П о л и г о н
Рисунок 1. Полигон
ЗАДАЧА-ЭТАЛОН
В рамках НИРС проводилось исследование уровня депрессии у студентов ГМУ г. Семей. Результаты некоторых студентов представлены ниже. Единица измерения – баллы.
Баллы | |||||
Количество |
Задание: | РЕШЕНИЕ | |
1. | Определить среднюю | 2,3 |
2. | Определить медиану | |
3. | Определить моду | |
4. | Определить нижний квартиль | |
5. | Определить верхний квартиль | |
6. | Построить полигон |