Статистические характеристики выборки и генеральной совокупности статистических данных. Их соотношения
Генеральная совокупность – это всё множество объектов, обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени, входящих в предмет изучения в соответствии с программой исследования.
Выборка (Выборочная совокупность) – часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.
В основе статистических выводов проведенного исследования лежит распределение случайной величины X, наблюдаемые же значения(х1, х2, … ,хn)называются реализациями случайной величины Х (n — объем выборки). Распределение случайной величины X в генеральной совокупности носит теоретический, идеальный характер, а выборочный аналог является эмпирическим распределением.
Для выборки же функцию распределения определить трудно, а иногда невозможно, поэтому параметры оценивают по эмпирическим данным, а затем их подставляют в аналитическое выражение, описывающее теоретическое распределение. В любом случае восстановленное по выборке эмпирическое распределение лишь грубо характеризует истинное. Важнейшими параметрами распределений являются математическое ожидание E(x) и дисперсия .
По своей природе распределения бывают непрерывными и дискретными. Наиболее известным непрерывным распределением является нормальное. Выборочными аналогами параметров E(x) и для него являются: среднее значение и эмпирическая дисперсия . Среди дискретных в социально-экономических исследованиях наиболее часто применяется альтернативное (дихотомическое) распределение. Параметр математического ожидания E(x) этого распределения выражает относительную величину (или долю) единиц совокупности, которые обладают изучаемым признаком X (она обозначена буквой p); доля совокупности, не обладающая этим признаком, обозначается буквой q (q = 1 — p). Дисперсия же альтернативного распределения также имеет эмпирический аналог .
В зависимости от вида распределения и от способа отбора единиц совокупности по-разному вычисляются характеристики параметров распределения. Долей выборки kn называется отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности: kn = n/N. Выборочная доля w — это отношение единиц, обладающих изучаемым признаком x к объему выборки n: w = nn/n.
Так как выборочная совокупность отлична от генеральной, то возникают ошибки выборки.
Связь: E(Xв(с чертой))=Хо(с чертой).
Е(Дв)=((n -1)/³)*До
Д(Хв(с чертой))=До/n
Схема Гаусса – Маркова
В рамках модели (1)
величины выборки (2) связаны следующей системой линейных алгебраических уравнений:
……………………..
Она называется системой уравнений наблюдений объекта в рамках линейной модели (1), или, иначе, схемой Гаусса – Маркова. Компактная запись:
где – вектор наблюденных значений эндогенной переменной y модели (1);
- ненаблюдаемый вектор случайных возмущений (остатков);
– матрица наблюденных значений предопределенной переменной x модели (1), расширенная (при наличии в функции регрессии определяемого коэффициента ) столбцом единиц;
Наконец, - вектор неизвестных коэффициентов функции регрессии модели, подлежащий оцениванию по выборке (2).
Теорема Гаусса-Маркова
Пусть матрица X уравнений наблюдений имеет размер , где , и обладает линейно-независимыми столбцами, а случайные возмущения удовлетворяют четырем условиям:
Тогда:
А) Наилучшая линейная процедура имеет вид:
Б) Эффективная линейная несмещенная оценка обладает свойством наименьших квадратов:
В) Ковариационная матрица оценки вычисляется по правилу
Г) Несмещенная оценка параметра модели находится по формуле
где n – число уравнений наблюдений, k+1 – количество неизвестных коэффициентов функции регрессии модели.