Числовые характеристики статистического ряда

ЛЕКЦИЯ 2

Базовые понятия математической статистики. Выборочный метод. Числовые характеристики статистических рядов Точечные статистические оценки и требования к ним. Метод доверительных интервалов. Проверка статистических гипотез.

Глава 3.
БАЗОВЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Выборочный метод

В этой главе приводится краткий обзор основных понятий и результатов математической статистики, которые используются в курсе эконометрики.

Одной из центральных задач математической статистики является выявление закономерностей в статистических данных, на базе которых можно строить соответствующие модели и принимать обдуманные решения. Первая задача математической статистики заключается в разработке методов сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных опытов. Вторая задача математической статистики заключается в разработке методов обработки и анализа статистических данных в зависимости от целей исследования. Элементами такого анализа, в частности, являются: оценка параметров известной функции распределения, проверка статистических гипотез о виде распределения и т.д.

Между математической статистикой и теорией вероятностей имеется тесная взаимосвязь. Теория вероятностей широко применяется при статистическом изучении массовых явлений, которые могут и не относится к категории случайных. Это осуществляется через теорию выборочного метода. Здесь вероятностных закономерностям подчиняются не сами изучаемые явления, а методы их исследования. Кроме того, теория вероятностей играет важную роль при статистическом исследовании вероятностных явлений. В этих случаях сами изучаемые явления подчиняются вполне определенным вероятностным закономерностям.

Основной задачей математической статистики является разработка методов получения научно обоснованных выводов о массовых явлениях и процессах из данных наблюдений или экспериментов. Например, нужно провести контроль качества изготовленной партии деталей или исследовать качество технологического процесса. Можно, конечно, провести сплошное обследование, т.е. обследовать каждую деталь партии. Однако если деталей слишком много, то провести сплошное обследование физически невозможно, а если обследование объекта связано с его уничтожением или требует больших затрат, то проводить сплошное обследование не имеет смысла. Поэтому приходится из всей совокупности объектов для обследования отбирать только часть, т.е. проводить выборочное обследование. Таким образом, на практике часто приходится давать оценку параметров большой совокупности по небольшому числу выбранных случайным образом элементов.

Вся подлежащая изучению совокупность объектов называется генеральной совокупностью. Та часть объектов, которая была отобрана из генеральной совокупности, называется выборочной совокупностью или более кратко – выборкой. Договоримся, обозначать объем выборки буквой n, а объем генеральной совокупности буквой N.

Выборка, в общем случае, образуется для оценки каких-либо характеристик генеральной совокупности. Однако не всякая выборка может давать реальное представление о генеральной совокупности. Например, детали, как правило изготовляются рабочими разной квалификации. Если на контроль попадут только детали, изготовленные рабочими более низкой квалификации, то представление о качестве всей продукции будет «заниженным», если только детали, изготовленные рабочими более высокой квалификации, то это представление будет завышенным.

Для того чтобы по данным выборки можно было уверенно судить об интересующем нас признаке генеральной совокупности необходимо, чтобы объекты выборки правильно ее представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (или представительной).

Репрезентативность выборки обеспечивается случайностью отбора. При случайном отборе все объекты генеральной совокупности имеют одинаковую возможность попасть в выборку. В этом случае, в силу закона больших чисел, можно утверждать, что выборка будет репрезентативной. Например, о качестве зерна судят по небольшой ее пробе. Хотя число наудачу отобранных зерен мало по сравнению со всей массой зерна, но само по себе оно достаточно велико. Следовательно, характеристики выборочной совокупности будут по вероятности мало чем отличаться от характеристик генеральной совокупности.

Различают повторные и бесповторные выборки. В первом случае отобранный объект перед отбором следующего возвращается в генеральную совокупность. Во втором – отобранный в выборку объект не возвращается в генеральную совокупность. Если объем выборки значительно меньше объема генеральной совокупности, то обе выборки будут практически эквивалентны.

Во многих случаях для анализа тех или иных экономических процессов важен порядок получения статистических данных. Но при рассмотрении так называемых пространственных данных порядок их получения не играет существенной роли. Кроме того, результаты выборочных значений x1, x2, …, xn количественного признака X генеральной совокупности, записанные в порядке их регистрации, обычно труднообозримы и неудобны для дальнейшего анализа. Задачей описания статистических данных является получение такого их представления, которое позволит наглядно выявить вероятностные характеристики. Для этого применяются различные формы упорядочения и группировки данных.

Статистический материал, получающийся в результате наблюдений (измерений) можно записать в виде таблицы, состоящей из двух строк. В первой строке отмечается номер измерения, во втором – полученной значение. Такая таблица называется простым статистическим рядом:

i n
x1 x2 xi xn

Однако при большом числе измерений статистический ряд трудно анализировать. Поэтому результаты наблюдений необходимо каким-либо образом упорядочить. Для этого наблюдаемые значения располагают в порядке их возрастания:

Числовые характеристики статистического ряда - student2.ru ,

где Числовые характеристики статистического ряда - student2.ru . Такой статистический ряд называется ранжированным.

Поскольку некоторые значения статистического ряда могут иметь одинаковые значения, то их можно объединить. Тогда каждому значению xi будет поставлено в соответствие число ni, равное частоте появлений данного значения:

x1 x2 xk
n1 n2 nk

Такой ряд называется сгруппированным.

Ранжированный и сгруппированный ряд называется вариационным. Наблюдаемые значения xi называются вариантами, а число всех наблюдений варианты ni – частотой. Число всех наблюдений n называется объемом вариационного ряда. Отношение частоты ni к объему ряда n называется относительной частотой:

Числовые характеристики статистического ряда - student2.ru . (3.1)

Кроме дискретных вариационных рядов, применяются и интервальные вариационные ряды. Для построения такого ряда необходимо определить величину интервалов и в соответствии сними группировать результаты наблюдений:

[x1, x2] (x2, x3] (x3, x4] (xk-1, xk]
n1 n2 n3 nk

Интервальный вариационный ряд строят обычно в тех случаях, когда число наблюдавшихся вариантов очень велико. Обычно такая ситуация возникает при наблюдении за непрерывной величиной (например, измерение какой-либо физической величины). Между интервальными и дискретными вариационными рядами существует определенная взаимосвязь: любой дискретный ряд можно записать в виде интервального и наоборот.

Для графического описания дискретного вариационного ряда использую полигон. Для построения полигона в прямоугольной системе координат наносят точки с координатами (xi,ni) или (xi,wi). Затем эти точки соединяют отрезками. Полученная ломаная линия называется полигоном (см., например, рис. 3.1а).

Для графического описания интервального вариационного ряда используют гистограмму. Для ее построения по оси абсцисс откладывают отрезки, изображающие интервалы варьирования, и на этих отрезках, как на основании, строят прямоугольники с высотами, равными частотам или относительным частотам соответствующего интервала. В результате получается фигура, состоящая из прямоугольников, которая и называется гистограммой (см., например, рис. 3.1б).

Числовые характеристики статистического ряда - student2.ru а Числовые характеристики статистического ряда - student2.ru б
Рис. 3.1

Числовые характеристики статистического ряда

Построение вариационного ряда – лишь первый шаг к осмыслению ряда наблюдений. Этого недостаточно для полного исследования распределения изучаемого явления. Наиболее удобным и полным методом является аналитической способ исследования ряда, состоящий в вычислении числовых характеристик. Числовые характеристики, применяемые для исследования вариационных рядов, аналогичны тем, которые применяются в теории вероятностей.

Наиболее естественной характеристикой вариационного ряда является понятие средней величины. В статистике используют несколько видов средних величин: среднее арифметическое, среднее геометрическое, среднее гармоническое и др. Наиболее распространенным является понятие средней арифметической величины:

Числовые характеристики статистического ряда - student2.ru . (3.2)

Если по данным наблюдений построен вариационный ряд, то используется понятие средней взвешенной арифметической величины:

Числовые характеристики статистического ряда - student2.ru . (3.3)

Средняя арифметическая величина обладает теми же самыми свойствами, что и математическое ожидание.

В качестве меры рассеяния значений наблюдаемой величины вокруг своего среднего значения принимают величину

Числовые характеристики статистического ряда - student2.ru , (3.4)

которая, как и в теории вероятностей, называется дисперсией. Величина

Числовые характеристики статистического ряда - student2.ru (3.5)

называется средним квадратичным отклонением (или стандартным отклонением). Статистическая дисперсия обладает теми же самыми свойствами, что и вероятностная дисперсия, и для ее вычисления можно использовать альтернативную формулу

Числовые характеристики статистического ряда - student2.ru . (3.6)

Пример 3.1. По территориям региона приводятся данные за 199X г. (таб. 3.1).

Таблица 3.1

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., x

Найти среднее арифметическое и стандартное отклонение. Постройте полигон частот.

Решение. Для расчета средней арифметической и дисперсии строим расчетную таблицу (табл. 3.2):

Таблица 3.2

x x2
Сумма

По данным таблицы находим:

Числовые характеристики статистического ряда - student2.ru , Числовые характеристики статистического ряда - student2.ru ,

Числовые характеристики статистического ряда - student2.ru , Числовые характеристики статистического ряда - student2.ru .

Построим полигон частот по исходным данным (рис. 3.2). â

Числовые характеристики статистического ряда - student2.ru

Рис. 3.2

Пример 3.2. Получены сгруппированные данные о дневной выручке магазине электротоваров (таб. 3.3).

Таблица 3.3

Сумма продаж, тыс. руб., x Число продаж, n
0-200
200-300
300-400
400-500
500-600
600-700

Найти среднее арифметическое и стандартное отклонение. Постройте гистограмму частот.

Решение. Для расчета средней арифметической и дисперсии строим расчетную таблицу (табл. 3.4):

Таблица 3.4

xi ni nixi nixi2
Сумма

Здесь вместо xi взяты середины соответствующих интервалов. По данным таблицы находим:

Числовые характеристики статистического ряда - student2.ru , Числовые характеристики статистического ряда - student2.ru ,

Числовые характеристики статистического ряда - student2.ru , Числовые характеристики статистического ряда - student2.ru .

Построим гистограмму частот по исходным данным (рис. 3.3). â

Числовые характеристики статистического ряда - student2.ru

Рис. 3.3

Наши рекомендации