Квартили, децили и перцентили
Обобщениями медианы являются квартили (квантили), децили и перцентили - числа, которые делят упорядоченную по неубыванию совокупность значений признака соответственно на 4, 10 и 100 равночисленных частей.
Одна четвертая единиц статистической совокупности имеют значения признака, равные или меньшие первого квартиля, второй квартиль является медианой. Три четвертых единиц статистической совокупности имеют значения признака, равные или меньшие третьего квартиля
Для вычисления k-го квартиля (k = 1,2,3) интервального ряда распределения надо найти k-й квартильный интервал – интервал, накопленная частота которого равна объема ряда или впервые превышает ее, и вычислить k-й квартиль по формуле:
, (1.7.3)
где – меньшая граница k-го квартильного интервала;
– длина k-го квартильного интервала;
– объем ряда;
– накопленная частота интервала, непосредственно предшествующего k-му квартильному интервалу;
– частота медианного интервала.
Для вычисления 9 децилей и 99 перцентилей надо в формуле (1.7.3) число заменить соответственно числами (k=1,2,…,9) и (k=1,2,…,99) и изменить названия интервалов.
Мода, медиана, квартили, децили и перцентили называются структурными средними рядов распределения.
С помощью статистических функций МОДА, МЕДИАНА и КВАРТИЛЬ.ВКЛ в Excel вычисляются соответствующие структурные средние по несгруппированным значениям признака. Последняя функция находит также наименьшее и наибольшее значения признака.
Рис. 1.7.3. Структурные средние
Применяя указанные функции, вычислим моду, медиану, квартили и найдем наименьший и наибольший размеры обуви по данным примера 1.5.1 (рис. 1.7.3).
Упражнение1.7.2.Вычислите квартили интервального ряда распределения, представленного в табл. 1.7.4.
Упражнение1.7.3. Применяя функции: МОДА, МЕДИАНА иКВАРТИЛЬ, вычислите моду, медиану, квартили, наименьшее и наибольшее значение признака по несгруппированным данным упражнения 1.5.1.
Тест 1.7.
1. Мода дискретного ряда – это:
а) наибольшая частота;
б) варианта с наибольшей частотой;
в) наиболее часто встречающееся значение группировочного признака;
г) наибольшее значение группировочного признака.
2. Мода интервального ряда распределения – это:
а) центр интервала с наибольшей частотой;
б) мода соответствующего вариационного ряда;
в) наиболее часто встречающееся значение группировочного признака;
г) наибольшее значение группировочного признака.
3. Медиана дискретного ряда – это:
а) первая накопленная частота, равная или большая половине объема ряда;
б) число, делящее упорядоченную по неубыванию совокупность всех значений группировочного признака на две равночисленные части;
в) частота ряда, записанная в центре графы частот;
г) варианта, накопленная частота которой равна или большая половине объема ряда.
3. Медиана интервального ряда – это:
а) накопленная частота, впервые превышающая половину объема ряда или равная ей;
б) интервал, накопленная частота которого впервые превышает половину объема ряда или совпадает с ней;
в) число, делящее упорядоченную по неубыванию совокупность всех значений группировочного признака на две равночисленные части;
г) интервал, частота которого впервые превышает половину объема ряда или совпадает с ней.
4. Квартили – это числа, делящие упорядоченную по неубыванию совокупность всех значений группировочного признака:
а) на две равночисленные части;
б) на десять равночисленных частей;
в) на четыре равночисленные части;
г) на сто равночисленных частей.
5. Вторая квартиль равна
а) моде;
б) медиане;
в) пятой децили;
г) пятидесятой перцентили;
6. Сколько всего перцентилей?
а) 100; б) 10; в) 99; г) 9.
1.8. Среднее значение признака и его виды
Среднее значение признака выявляет общие закономерности и сглаживает различия в значениях признака, возникающие по ряду причин у отдельных единиц статистической совокупности.
Среднее значение признака рассчитывается на основе определяющего соотношения по значениям признака, измеренного у единиц статистической совокупности, однородной по этому признаку.
В зависимости от определяющего соотношения среднее значение признака вычисляется по различным формулам и имеет различные названия.