Правила сложения дисперсии
Если исходная совокупность разделена на группы по какому-то существенному признаку, то вычисляют следующие виды дисперсий:
1) Общую дисперсию исходной совокупности по формуле: , где - общая средняя величина исходной совокупности; f – частоты исходной совокупности. Общая дисперсия характеризует отклонение индивидуальных значений признака от общей средней величины исходной совокупности.
2) Внутригрупповые дисперсии по формуле: , где j - номер группы; - средняя величина в каждой j-ой группе; - частоты j-ой группы. Внутригрупповые дисперсии характеризуют отклонение индивидуального значения признака в каждой группе от групповой средней величины. Из всех внутригрупповых дисперсий вычисляют среднюю по формуле: , где - численность единиц в каждой j-ой группе.
3) Межгрупповую дисперсию по формуле: . Межгрупповая дисперсия характеризует отклонение групповых средних величин от общей средней величины исходной совокупности. Правило сложения дисперсий заключается в том. что общая дисперсия исходной совокупности должна быть равна сумме межгрупповой и средней из внутригрупповых дисперсий: . Результат отношения межгрупповой к общей дисперсии исходной совокупности называется эмпирическим коэффициентом детерминации. Он показывает долю вариации изучаемого признака, обусловленную вариацией группировочного признака.
Дисперсия альтернативного признака.
Наряду с изучением вариаций количественных признаков определяют вариацию альтернативных признаков. Обозначим через pдолю единиц совокупности, обладающих альтернативным признаком; через q – долю единиц совокупности не обладающих альтернативны признаком. p+q=1
Наличие признака у единиц совокупности обозначается цифрой 1, отсутствие признака – 0. Вычислим среднюю величину альтернативного признака: . Средняя величина альтернативного признака равна доле единиц совокупности, обладающих этим альтернативным признаком. вычислим дисперсию альтернативного признака: . Дисперсия альтернативного признака равна произведению доли единиц совокупности, обладающих этим признаком и доли единиц совокупности не обладающих данным признаком.
Лекция №7
Выборочное наблюдение.
Выборочным называют не сплошное наблюдение, при котором обследованию и изучению подвергаются не все единицы исходной совокупности, а только часть единиц, при этом результат обследования части совокупности распространяется на всю исходную совокупность. Совокупность, из которой производится отбор единиц для дальнейшего обследования и изучения называется генеральной и все показатели, характеризующие эту совокупность, называются генеральными. Средняя величина признака в генеральной совокупности обозначается через , а численность единиц в генеральной совокупности обозначается через N.
Совокупность отобранных единиц называется выборочной и все показатели, характеризующие эту совокупность, называются выборочными. Средняя величина признака в выборочной совокупности обозначается через , а численность единиц выборочной совокупности обозначается через n.
Возможные пределы отклонений выборочной средней величины от генеральной средней величины называют ошибкой выборки. Чем больше ошибка выборки, тем в большей степени выборочные показатели отличаются от генеральных.
Задача выборочного наблюдения состоит в том, чтобы на основе данных выборочной совокупности дать верное представление о генеральной совокупности, т. е. необходимо максимально приблизить выборочные показатели к генеральным и знать возможный предел отклонений этих величин. При прочих равных условиях чем больше численность единиц выборочной совокупности, тем меньше величина ошибки выборки. Средняя ошибка выборки обозначатся буквой и характеризует среднюю величину отклонений выборочных показателей от генеральных и при этом должно соблюдаться следующее соотношение: .
Так как средняя ошибка выборки характеризует среднюю величину возможных отклонений выборочных показателей от генеральных, то всегда найдутся единицы генеральной совокупности, которые будут выходить за возможные пределы, такие, как и .
Если мы увеличим возможные пределы отклонений выборочных показателей от генеральных, то с большей вероятностью сможем утверждать, чтот показатели генеральной совокупности отличаются от выборочных показателей не более чем на какую-нибудь величину, которую называют предельной ошибкой выборки. Предельная ошибка выборки обозначается буквой и вычисляется по формуле , где - средняя ошибка выборки; t – коэффициент доверия, зависящий от вероятности, с которой можно гарантировать, что предельная ошибка выборки не превысит t-кратную среднюю ошибку, и всегда будет соблюдаться следующее неравенство: .
Таблица для справки:
Процент вероятности | Коэффициент доверия (t) |
68,3% | 1,0 |
95,0% | 1,96 |
95,4% | 2,0 |
99,0% | 2,58 |
99,7% | 3,0 |
99,9% | 3,28 |
По способу отбора единиц в выборочную совокупность различают следующие виды выборочного наблюдения (выборки):
- собственно-случайная
- механическая
- типическая
- серийная
По методу отбора единиц в выборочную совокупность различают повторный и бесповторный отбор.
При повторном отборе обследованная единица после изучения вновь возвращается в генеральную совокупность и не исключена возможность дальнейшего отбора этой единицы в выборочную совокупность.
При бесповторном отборе обследованная единица не возвращается в генеральную совокупность и не участвует в дальнейшем отборе единиц в выборочную совокупность.
1) Собственно-случайная выборка заключается в том, что отбор единиц в выборочную совокупность производится без определенной системности, например, методом жеребьевки. При этом каждая единица генеральной совокупности имеет одинаковую вероятность быть отобранной в выборочную совокупность. Средняя ошибка выборки рассчитывается по формулам:
Для повторного отбора: ; для бесповторного отбора: ; где - дисперсия выборочной совокупности.
2) Механическая выборка является разновидностью собственно-случайной выборки и заключается в том, что вся генеральная совокупность разбивается на определенное количество равных частей и затем из каждой части случайным образом производится отбор единиц в выборочную совокупность. Для определения средней ошибки выборки применяют те же формулы, что и при собственно-случайной выборке.
3) Типическая выборка проводится в тех случаях, когда вся генеральная совокупность разбивается на качественно-однородные группы и затем из каждой группы, случайным или механическим образом производится отбор единиц в выборочную совокупность.
Формула для повторного отбора: ; для бесповторного отбора: ; где - средняя из внутригрупповых дисперсий.
4) Серийная выборка состоит в том, что обследованию подвергаются не отдельные единицы совокупности, а целые группы или серии единиц. При этом, в данной группе обследованию подвергаются все единицы. Средняя ошибка выборки определяется по формулам: Для повторного отбора: ; для бесповторного отбора: ; где - межгрупповая дисперсия; r – количество групп или серий в выборочной совокупности; R – количество групп или серий в генеральной совокупности.
Для определения необходимой численности единиц в выборочной совокупности используют формулы, применяемые для расчета средней ошибки выборки.
Лекция №8.
Ряды динамики.
Одной из задач статистики является изучение изменения социально-экономических явлений и процессов во времени. Эта задача решается с помощью составления и анализа рядов динамики.
Ряд динамики представляет собой последовательность числовых значений изучаемого статистического показателя за определенные периоды времени. Числовые значения, составляющие ряд динамики называются уровнями ряда и обозначаются yi (i=1,2,…,n). В зависимости от вида показателей, составляющих ряд динамики, различают ряды абсолютных, относительных и средних величин. Уровни ряда динамики могут относиться к определенным моментам или периодам времени. В зависимости от этого ряды динамики подразделяются на моментные и интервальные.
Моментным называют ряд динамики, уровни которого характеризуют величину изучаемого показателя на определенный момент времени (на конкретную дату). Например: приводится численность населения Российской Федерации (млн. чел.): на 01.01.1999 – 146,3; на 01.01.2000 – 145,6; на 01.01.2001 – 144,8; на 01.01.2002 – 144,0; на 01.01.2003 -145,2.
Интервальным называют ряд динамики, уровни которого характеризуют величину изучаемого показателя за определенный период времени. Например: приводится объем кредитных вложений в экономику страны: 2000 г. – 808; 2001 г. – 1286; 2002 г. – 1755.