Медиана: типическое значение для количественных и порядковых данных
Медиана располагается в центре данных и дает представление о списке значений. Чтобы найти медиану, надо предварительно упорядочить данные в порядке возрастания, а затем определить среднюю точку. Тогда половина элементов в наборе будет меньше значения в средней точке, а вторая половина – больше.
Медиану можно также определить, проставив соответствующие ранги. Ранги связывают числа (номера) 1, 2, 3, …, n со значениями данных таким образом, что наименьшее значение имеет ранг 1, следующее по величине значение – ранг 2 и т.д. до наибольшего значения, которое имеет ранг n.
Если все n значений были отсортированы и проставлены ранги, то при определении медианы возможны два варианта.
1). Если n – нечетное число, то медианой является значение с рангом (n+1)/2.
2). Если n – четное число, то медианой является среднее двух значений, расположенных в середине ряда и имеющих ранги (n/2) и (n/2+1).
Замечание 1. Значениями порядковых (нечисловых) данных являются категории, которые можно упорядочивать. При четном числе категорий медиана, в зависимости от двух расположенных в середине ряда значений, вычисляется по-разному.
Если два средних значения представляют различные категории, то обе эти категории будут медианами. Например, для списка рейтингов облигаций А, ААА, В, АА, ААА, В медиана вычисляется следующим образом:
медиана (А, ААА, В, АА, ААА, В) = медиана (ААА, ААА, АА, А, В, В) = АА и А.
Если два средних значения представляют одну и ту же категорию, то эта категория является медианой. Например, для списка рейтингов облигаций А, В, АА, А медиана равна:
медиана (А, В, АА, А) = медиана (АА, А, А, В) = А.
Замечание 2. Поясним отличие медианы от среднего. При нормальном распределении данных значения медианы и среднего близки между собой, поскольку нормальное распределение симметрично и имеет четко выраженную среднюю точку. Однако для реальных нормально распределенных данных, поскольку всегда присутствует некоторая случайность, медиана и среднее несколько отличаются друг от друга, т.к. определяются по-разному. Для нормально распределенных данных среднее является наиболее эффективной характеристикой.
Если набор данных имеет ассиметричное распределение, то медиана и среднее могут существенно различаться. Обычно среднее по отношению к медиане сдвинуто в направлении более длинного хвоста или в направлении выброса, т.к. среднее учитывает такие экстремальные наблюдения, в то время как для медианы важно, по какую сторону от нее лежит то или иное значение. Медиана является хорошей характеристикой ассиметричного распределения. Кроме того, медиана полезна при наличии выбросов, т.к. она устойчива к их влиянию.
Задание 5. | Определить медиану процентного изменения стоимости акций на момент открытия торгов в день обвала фондового рынка. |
В таблице 3 приведены данные о падении стоимости акций 29 промышленных компаний в первый день кризиса биржи в октябре 1987 года.
Таблица 3. Падение акций при открытии торгов
Фирма | Изменение стоимости, % | Фирма | Изменение стоимости, % | Фирма | Изменение стоимости, % |
-4,1 | -0,9 | -15,7 | |||
-5,1 | -3,5 | -12,3 | |||
-4,5 | -10,5 | -9,6 | |||
-5,4 | -7,2 | -12,0 | |||
-4,0 | -8,9 | -12,4 | |||
-11,6 | -6,8 | -8,6 | |||
-4,0 | -2,1 | -11,4 | |||
-3,0 | -17,2 | -10,8 | |||
-4,4 | -15,7 | -8,6 | |||
-9,3 | -8,9 |
1. В файле Описательная статистика.xls на Листе3 в ячейке A1 задайте метку Изменение стоимости. В диапазон A2:A30 введите данные Таблицы 3. Увеличьте ширину столбца, дважды щелкнув на правой границе заголовка столбца A.
2. Выделите диапазон A1:A30 и выполните упорядочивание данных с помощью команды:
Данные®Сортировка…
Параметры сортировки задайте, как указано ниже на рисунке.
3. В ячейку B1 введите метку Ранг, а в ячейку B2 введите число 1. Выделите диапазон B2:B30 и выберите команду Правка®Заполнить®Прогрессия …В диалоговом окне установите опцию Шаг: равной 1 и щелкните на кнопке ОК.
4. Теперь определите значение медианы. Для этого сначала присвойте имя переменной n ячейке B30. В ячейке D1 задайте метку Ранг, а в ячейку D2 введите формулу =(n+1)/2. В ячейке D5 задайте метку Медиана.В ячейкуD6 скопируйте из столбца процентного изменения стоимости акций значение, соответствующее вычисленному рангу медианы.
5. Постройте гистограмму процентных изменений стоимости акций для диапазона данных A1:A30, включая метку. Интервал входных значений задайте явно равным 2. Нижнюю границу диапазона входных значений примите равной –20, а верхнюю границу равной 0. Значения карманов вместе с меткой Карман расположите в ячейках F1:F12. Выведите гистограмму вместе с таблицей распределения частот в область H1:Р20. Можно ли считать, что распределение данных близко к нормальному?
6. В ячейке D9 задайте метку Среднее, а в ячейке D10 рассчитайте среднее значение процентного изменения. Уменьшите разрядность полученного значения до одного знака после запятой. Существенно ли отличаются друг от друга значения среднего и медианы?
Задание 6. | Определить медиану и среднее для служащих сферы общественного питания. |
В таблице 4 содержатся данные о количестве служащих в 10 фирмах общественного питания.
Таблица 4. Количество служащих в фирмах общественного питания
Фирма | Количество служащих | Фирма | Количество служащих |
1. В файле Описательная статистика.xls добавьте Лист4.
2. На Листе4 в ячейке A1 задайте метку Количество служащих, а в диапазон A2:A11 введите данные из Таблицы 4.
3. Постройте гистограмму для диапазона данных A1:A11, включая метку. Интервал входных значений задайте явно равным 20000. Нижнюю границу диапазона входных значений примите равной 26000, а верхнюю границу равной 486000. Значения карманов вместе с меткой Карман расположите в ячейках D1:D25. Расположите таблицу распределения частот в диапазоне F1:G26, а гистограмму – в диапазоне I1:M20. Какой характер распределения имеют данные?
4. В ячейку J25 введите метку Медиана. В ячейке J26 вычислите медиану, используя статистическую функцию МЕДИАНА.
5. В ячейку L25 введите метку Среднее. В ячейке L26 вычислите среднее, используя статистическую функцию СРЗНАЧ. Объясните причину отличия значений медианы и среднего.