Виды дисперсии. Эмпирический коэффициент детерминации.
Различают три вида дисперсий:
общая;
средняя внутригрупповая;
межгрупповая.
Общая дисперсия () характеризует вариацию признака всей совокупности под влиянием всех тех факторов, которые обусловили данную вариацию. Эта величина определяется по формуле
где - общая средняя арифметическая всей исследуемой совокупности.
Средняя внутригрупповая дисперсия () свидетельствует о случайной вариации, которая может возникнуть под влиянием каких-либо неучтенных факторов и которая не зависит от признака-фактора, положенного в основу группировки. Данная дисперсия рассчитывается следующим образом: сначала рассчитываются дисперсии по отдельным группам (), затем рассчитывается средняя внутригрупповая дисперсия :
где ni - число единиц в группе
Межгрупповая дисперсия (дисперсия групповых средних) характеризует систематическую вариацию, т.е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки. Эта дисперсия рассчитывается по формуле
где - средняя величина по отдельной группе.
Все три вида дисперсии связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:
Данное соотношение отражает закон, который называют правилом сложения дисперсий. Согласно этому закону (правилу), общая дисперсия, которая возникает под влиянием всех факторов, равна сумме дисперсий, которые появляются как под влиянием признака-фактора, положенного в основу группировки, так и под влиянием других факторов. Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки.
Коэффициент детерминации (R2)— это квадрат множественного коэффициента корреляции. Он показывает, какая доля дисперсии результативного признака объясняется влиянием независимых переменных.
ЭКД показывает какая доля в общей дисперсии показателя приходится на дисперсию в результате вариаций группировочного признака (на дисперсию влияет учтенный анализированный группировочный признак но есть и другие неучтенные признаки которые влияют на дисперсию)
Билет 26.
Средний уровень и вариация альтернативного признака.
Альтернативным назыв признак который может принимать два значения. Если признак есть он получает значен 1, если нет 0. Примеры: состоит в браке 1, не состоит 0, пол мужской 1, женский 0.
P=m/N, где m - кол-во един обладающий данным признаком, N – объем совокупности, P- доля един наблюд который имеет значен признака=0.
q=1-P, где q-доля един набл в которых этих признаков нет.
средней уровень альтернативного признака вычисляется по формуле среднего взвешенного
дисперсия альт признака это
Билет 27