Сущность и значение средних величин в статистике
В предыдущих лекциях неоднократно подчеркивалось, что статистика как наука изучает массовые явления по варьирующим (изменяющимся) признакам. На величину индивидуального значения признака у отдельных единиц совокупности оказывают действие некоторые общие причины, а также индивидуальные особенности единицы и индивидуальные условия, в которых она находиться.
Рассмотрим пример. Заработная плата рабочих какого-либо предприятия является количественно варьирующим признаком. За один и тот же период различные рабочие получают, как правило, разную сумму зарплаты. В тоже время речь идет о рабочих одного предприятия, т.е. о качественно однородной совокупности. Какой статистический показатель может обобщено характеризовать уровень зарплаты рабочих данного предприятия? Нетрудно убедиться, что индивидуальная зарплата любого рабочего не годиться для этой цели, т.к. она обычно сильно отличается от зарплаты других рабочих. Не может характеризовать этот уровень и общая сумма зарплаты (ФЗП), начисленная рабочим предприятия за этот период, т.к. она зависит от числа рабочих. Однако можно исключить влияние численности рабочих, уровня их квалификации, условий труда, характера выполняемых работ, различий в профессии и т.д., если общую сумму заработной платы разделить на число рабочих. В результате получим статистических показатель, который и будет обобщенной характеристикой всей совокупности рабочих предприятия по этому признаку. В данном примере этот показатель называется средней заработной платой одного работника.
Другими словами заработная плата изучаемой совокупности рабочих данного предприятия получает обобщенную характеристику в средней величине.
Средняя является результатом абстрагирования от имеющихся у единиц совокупности различий. В средней компенсируются, погашаются случайные отклонения, присущие индивидуальным значениям, отражаются те общие условия, под влиянием которых формировалась вся совокупность. Именно в этом проявляется в самом общем виде закон больших чисел.
Итак, средняя отражает общее и типичное для всей совокупности благодаря взаимопоглащению в ней случайных индивидуальных различий единиц совокупности. Вместе с тем, являясь обобщенной характеристикой совокупности в целом, средняя не подменяет конкретных индивидуальных величин.
Однако для этого совокупность должна состоять из единиц, явлений, фактов одного и того же рода, быть качественно однородной. Только тогда можно говорить об общем для всей совокупности типе. Только в этом случае изменения средних показателей будет отражать общую основную тенденцию, под влиянием которых формируется процесс развития явления в целом. В отдельных индивидуальных единицах совокупности эта тенденция может и не обнаруживаться.
Средней величиной в статистике называются обобщенная характеристика качественно однородных явлений и процессов по какому-либо варьирующему признаку, которая показывает уровень признака отнесенный к единице совокупности.
Правильное понимание сущности средней состоит в том, что через единичное и случайное выявляется общее и необходимое, выявляется тенденция и закономерность в развитии массовых явлений.
Поэтому не случайно начиная уже с В. Петти (1623-1667), средние величины рассматривались в качестве основного приема статистического анализа. Еще первыми статистиками подчеркивалось, что статистические средние представляют собой не просто меру математического измерения изучаемого явления, а категорию объективной действительности.
Признаки, которые обобщают в средних, присущи всем единицам совокупности.
Средняя величина – величина абстрактная, т.к. характеризует значение признака у некоторой обезличенной абстрактной единицы совокупности. Но абстракция есть необходимая ступень любого научного исследования. В средней величине, как во всякой абстракции, осуществляется диалектическое единство отдельного и общего.
Применение средних в статистических исследованиях должно исходить из диалектического понимания категорий общего и индивидуального, массового и единичного.
Средняя отражает то общее, что складывается в каждой отдельной единице совокупности. Благодаря этому средняя получает большое значение для выявления закономерностей, присущих массовым явлениям и не заметным в отдельных единицах совокупности.
Отклонения индивидуального от общей – это проявление процесса развития. В отдельных единичных случаях могут быть заложены элементы нового, прогрессивного, передового. В этом случае именно конкретные факты, взятые на фоне средних величин, характеризуют процесс развития. Характеристики типичных, реальных уровней изучаемых явлений и их изменений во времени и пространстве являются одной из главных задач средних величин.
Так, изменение благосостояния населения страны на определенном этапе экономического развития находит свое отражение в средних показателях заработной платы, доходов семьи в целом и по отдельным социальным группам, уровня потребления продуктов, товаров и услуг.
Следует четко различать средние показатели интенсивности. Среднее из рассмотренного выше – это обобщенная характеристика по одному из изучаемых признаков, отражает то общее, что свойственно всем единицам совокупности. Так, заработную плату получают все рабочие предприятия (из нашего первого примера). А показатель интенсивности отражает отношение объемов двух разных совокупностей. Так, объем национального дохода страны на душу населения не означает, что каждая “душа” создает национальный доход (национальный доход страны создается только в сфере материального производства).
Виды средних
При использовании средних величин в статистических исследованиях необходимо четко представлять характер изучаемой статистической совокупности и цели данного статистического исследования. Как видели в предыдущих лекциях, в практике статистической обработки материалов правильно статистически организованного массового наблюдения возникают различные задачи, имеются особенности и в самих изучаемых явлениях, изучаемые признаками по отдельным единицам совокупности могут оцениваться (выражаться) в различных единицах измерениях.
Как указывалось в первом вопросе данной темы, свойство средней обнаруживать (улавливать) общую тенденцию изменения анализируемых признаков проявляется только в тех случаях, если она рассчитана на основе массовых данных. Однако это свое основное свойство – быть обобщающей характеристикой – средняя выполняет в том случае, если она будет получена из качественно однородной совокупности, т.е. из индивидуальных величин одного и того же типа. Поэтому прежде чем вычислять среднюю, необходимо убедиться, что в совокупности единиц нет таких, которые относятся к другим типам и видам явлений. Отсюда основным условием правильного применения средних величин в статистике является предварительная группировка изучаемых единиц совокупности. Если в изучаемом явлении выделены характерные типы и однородные группы единиц, тогда возможна их характеристика с помощью средних величин.
В результате группировки вся масса статистических данных распространяется по группам и для каждой группы характерен свой средний размер признаков, отличный от размера аналогичных признаков в других типовых группах. Исходя из сущности изучаемого явления и целей статистического исследования определяется ограничиться ли в данном исследовании “частными” средними для каждой отдельной группы входящей в изучаемую совокупность, или можно воспользоваться и самыми «общими» средними для всей совокупности.
Сочетание общих с групповыми средними позволяет вскрыть процессы нарождающегося нового качества. Например, распределение населения по доходу позволяет выявить формирование новых социальных групп. Законы диалектики указывают на то, что носителем нового качества сначала являются единичные факты, а затем количество этих единиц совокупности увеличивается, и новое становится массовым, типичным.
Из рассмотренных примеров видим, что средняя величина является отражением значений изучаемого признака, и, следовательно, измеряется в той же размерности, что и этот признак. Однако в статистических исследованиях приходится изучать уровни распределения непосредственно не сравниваемых между собой признаков (например, средняя численность населения по отношению к территории или средняя плотность населения.) В зависимости от того, какой именно фактор элиминизируется, определяется и содержание средней.
Из указанного можно сделать основной вывод, что в статистике используются различные средние.
Математическая статистика выводит различные средние из общей формулы степенной средней:
,
где - степенная средняя (при m=1 средняя арифметическая, при m=2 средняя квадратическая, при m=-1 получается средняя гармоническая, при m=0 средняя геометрическая и т.д.);
X – меняющаяся величина признака;
∑ - знак суммирования (сигма);
n – число данных.
В зависимости от характера первичных данных, области применения и способа расчета в статистике различают следующие основные виды средних: средняя арифметическая, средняя гармоническая, средняя геометрическая и средняя квадратическая.
Исходя из общей формулы степенной средней можно легко вывести формулы для расчета различных средних:
средняя арифметическая:
средняя гармоническая:
средняя квадратическая:
средняя геометрическая: ,
П – знак перемножения,
Где последняя формула выводится с помощью высшей математики с устранением так называемой “неопределенности”.
Рассмотрим пример:
X | X² | 1/X |
1/3 | ||
1/6 |
Отсюда
Величины средних в этом примере сильно отличаются. В общем виде соотношение между этими средними такое:
к> > g> h.
В статистике правильную характеристику изучаемой совокупности по варьирующему признаку в каждом отдельном случае дает только вполне определенный вид средней.
Вопрос о том, какой вид средней необходимо применить в отдельном случае, разрешается путем конкретного анализа изучаемой совокупности, определяется содержанием этой совокупности (характером изучаемых признаков), а также из принципа осмысленности результатов при суммировании или при взвешивании. Только тогда средняя будет применяться правильно, когда средняя величина имеет реальный смысл.
Эти и другие принципы в статистике выражаются теорией средних. Так, например, средняя арифметическая (наиболее часто применяемая средняя) и средняя гармоническая используются для характеристики среднего значения варьирующего признака у изучаемой совокупности. Средняя геометрическая применяется только при исчислении средних темпов динамики, а средняя квадратическая только при исчислении показателей вариации.
При расчете любых степенных средних используются следующие понятия и обозначения:
а) признак, по которому находится средняя, называется осредняемым признаком и обозначается ;
б) величина осредняемого признака у каждой единицы совокупности называется индивидуальным значением признака или вариантой, и обозначается как х1, х2,…хn;
в) повторяемость индивидуальных значений признака называется частотой и обозначается буквой f.
В зависимости от объема используемых при расчете средних статистического материала, как видели выше, можно говорить о групповых средних и общих средних.
Кроме степенных средних, в статистике применяют относительные характеристики распределения варьирующего признака: моду (наиболее часто встречающаяся варианта) и медиану (серединная варианта). Мода и медиана в статистической литературе иногда называются структурными (непараметрическими) средними. Будут рассмотрены в вопросе 5 темы.