Средняя величина статистики, ее сущность и условия применения
В качестве одной из важнейших характеристик вариационного ряда является средняя величина, представляющая обобщенную количественную характеристику признака в статистической совокупности однотипных явлений по одному из варьирующих признаков в конкретных условиях места и времени. Важнейшим свойством средней является то, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Сущность средней и заключается в том, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием основных факторов. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам. Типичность средней связана с однородностью статистической совокупности. Если совокупность неоднородна, то метод средних должен использоваться в сочетании с методом группировок, т.е. общие средние должны быть заменены или дополнены групповыми средними.
Средние величины - это обобщающие показатели, в которых находят выражение действие общих условий, закономерность изучаемого явления. Средняя должна ориентироваться на определенную величину, связанную со всеми единицами этой совокупности. Ее можно представить в виде функции:
f(x1,x2,...,xn) = f(x,x,...,x).
Для характеристики неоднородной совокупности ее необходимо расчленить на группы и находить среднюю по каждой из них. В отличие от средней, абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака из единиц, относящихся к разным совокупностям.
К некоторым общим принципам применения средних величин относятся следующие:
1) при определении средних величин нужно исходить из качественного содержания усредняемого признака, учитывать взаимосвязь изучаемых признаков, все имеющиеся для расчета данные;
2) рассчитывается, прежде всего, по однородной совокупности;
3) общие средние подкрепляются групповыми средними;
4) необходим обоснованный выбор единицы совокупности.
Виды (степенные: средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя хронологическая, и структурные: мода, медиана) и формы (простая и взвешенная) средних.
Средние величины
Средняя величина является обобщающей характеристикой изучаемой совокупности, показывающей типичный уровень варьирующего признака в расчете на единицу совокупности.
Среди степенных средних в статистическом анализе наибольшее применение нашли:
1. Средняя арифметическая простая
где – средняя арифметическая; хi – отдельные варианты признака; n – количество групп.
Средняя арифметическая простая используется в том случае, если у всех группировочных признаков равны между собой частоты признака.
Пример: Средняя з/п работников предприятия.
2.Средняя арифметическая взвешенная. При расчете средних величин отдельные значения признака, который осредняется, могут повторяться, поэтому расчет средней величины производится по сгруппированным данным.
Пример: Средний курс акций, при разном количестве проданных акций в разные дни. Определяется отношение общей суммы сделок к количеству проданных акций.
3.Простая средняя гармоническая используется тогда, когда веса значений признака одинаковы.
К примеру, нам нужно вычислить среднюю скорость двух автомашин, прошедших один и тот же путь, но с разной скоростью: первая - со скоростью 100 км/ч, вторая - 90 км/ч. Применяя метод средней гармонической, мы вычисляем среднюю скорость:
4. гармоническая взвешенная
Данная формула используется в тех случаях, когда веса (или объемы явлений) по каждому признаку не равны. В исходном соотношении для расчета средней известен числитель, но неизвестен знаменатель.
Например, при расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам не известно количество реализованных единиц (речь идет о разных товарах), но известны суммы реализаций этих различных товаров. Допустим, необходимо узнать среднюю цену реализованных товаров:
Вид товара | Цена за единицу, руб. | Сумма реализаций, руб. |
а | ||
б | ||
с |
Получаем
4) Средняя геометрическая ( )
простая
взвешенная
5). Формула средней хронологической величины (L) используется в целях расчета отдельных показателей для составления документов:
· Данные об остатках резервируемых обязательств
· Расчет величины наличных денежных средств в валюте Российской Федерации в кассе, исключаемых при расчете нормативной величины обязательных резервов
· Справка о выполнении обязанности по усреднению
L = (L1 / 2 + L2 + L3 + … + Ln / 2) / d(n-1)
L1 - Значение показателя на первую дату отчетного периода (периода усреднения)
Ln - Значение показателя на последнюю дату отчетного периода (периода усреднения)
n - Фактическое число календарных дат в отчетном периоде (периоде усреднения)
Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду.
Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.
Чтобы найти конкретное значение моды, необходимо использовать формулу
где xМо - нижняя граница модального интервала; iМо - величина модального интервала; fМо - частота модального интервала; fМо-1 - частота интервала, предшествующего модальному; fМо+1 - частота интервала, следующего за модальным.
Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.
Медиана (Ме) – это значение признака, которое приходится на середину ранжированного ряда распределения.
Ранжированный ряд распределения представлен значениями всех признаков в порядке возрастания.
Порядковый номер признака в ранжированном ряду распределения определяется по сумме накопленных частот (кумулятивным частотам).
В дискретном ряду распределения медиана определяется исходя из условий:
Если в вариационном ряду случаев (нечетное число), то значение признака у случая будет медианным, т.е.
.
Если в вариационном ряду случаев (четное число), то медиана равна средней арифметической из двух серединных значений
Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина.
Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин. Для нашего случая медиана равна (7+10) : 2= 8,5.
В интервальному ряду распределения медиана определяется по формуле
где - начало медианного интервала; - величина медианного интервала; - сумма накопленных частот до медианного интервала; - частота медианного интервала.
Медианный интервал определяется по кумулятивным частотам, где впервые сумма частот превысит половину всех частот.
Выбор вида средней для характеристики совокупности производится в зависимости от особенностей изучаемого явления и от цели определения средней.
18. Показатели вариации: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратичное отклонение, коэффициент вариации, коэффициент осцилляции, линейный коэффициент вариации и методика их расчета. Вариация – колеблемость, многообразие величины признака у отдельных единиц совокупности.
Средние величины, характеризуя вариационный ряд одним числом, не учитывают степень вариации признака.
Размах вариации (R). Это самый доступный по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым малым значениями признака у единиц данной совокупности:
.
Среднее линейное отклонение (Д), которое вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности. Эта величина определяется как средняя арифметическая из абсолютных значений отклонений от средней. Так как сумма отклонений значений признака от средней величины равна нулю, то все отклонения берутся по модулю.
простое ,
взвешенное .
При использовании показателя среднего линейного отклонения возникают определенные неудобства, связанные с тем, что приходится иметь дело не только с положительными, но и с отрицательными величинами, что побудило искать другие способы оценки вариации, чтобы иметь дело только с положительными величинами. Таким способом стало возведение всех отклонений во вторую степень. Обобщающие показатели, найденные с использованием вторых степеней отклонений, получили очень широкое распространение. К таким показателям относятся среднее квадратическое отклонение и среднее квадратическое отклонение в квадрате , которое называют дисперсией.
Средняя квадратическая простая
Средняя квадратическая взвешенная
Дисперсия есть не что иное, как средний квадрат отклонений индивидуальных значений признака от его средней величины.
Формулы дисперсии взвешенной и простой :
Преобразовав указанные формулы определения дисперсии, можно получить упрощенный вариант формулы (дисперсия методом моментов)
.
Среднее квадратическое отклонение ( ) определяется как квадратный корень из дисперсии.
.
Достоинство среднего квадратического отклонения по сравнению со средним линейным отклонением в том, что при его вычислении никакого условного допущения о необходимости суммирования отклонений вариантов от средней без учета их знаков не делается.
Кроме показателей вариации, выраженных в абсолютных величинах, в статистическом исследовании используются показатели вариации (V), выраженные в относительных величинах, особенно для целей сравнения колеблемости различных признаков одной и той же совокупности или для сравнения колеблемости одного и того же признака в нескольких совокупностях. Данные показатели рассчитываются как отношение размаха вариации к средней величине признака (коэффициент осцилляции), отношение среднего линейного отклонения к средней величине признака (линейный коэффициент вариации), отношение среднего квадратического отклонения к средней величине признака (коэффициент вариации) и, как правило, выражаются в процентах.
Формулы расчета относительных показателей вариации:
где VR - коэффициент осцилляции; - линейный коэффициент вариации; - коэффициент вариации.
Из приведенных формул видно, что чем больше коэффициент V приближен к нулю, тем меньше вариация значений признака. В статистической практике наиболее часто применяется коэффициент вариации. Он используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).