Статистические характеристики

Имеющиеся ряды наблюдений необходимо представить в наиболее наглядном виде и каким-то образом охарактеризовать. В статистике разработан ряд достаточно простых и наглядных характеристик. При использовании их необходимо иметь в виду, что так как исходные ряды наблюдений являются выборочными, то и их характеристики также должны быть выборочными или статистическими. Естественно, что эти характеристики в той или иной мере могут отличаться от действительных характеристик, полученных по рядам бесконечной продолжительности (см. разд. 3.1).

Статистический ряд

Статистический ряд —первичная форма записи статистического' материала xi ( i=1, 2, . . ., п) в виде таблицы из двух-трех строк или колонок.

В первой строке или колонке таблицы указывают номер члена ряда, во второй — календарный срок или какую-то другую характеристику наблюдений (можно опустить), в третьей — в календарной последовательности располагают значения исходного ряда наблюдений. В табл. 3.1 в качестве примера представлен статистический ряд измеренных значений БПК5 в мг/л по р. Великой.

Таблица 3.2.

Статистический ряд измеренных значений БПК5 в мг/л

река Великая, г.Псков, верхний створ, за 1995 и 1996 г.

Номер п/п Дата БПК5 Номер п/п Дата БПК5 Номер п/п Дата БПК5
24.01.95 2,1 4.08.95 3,6 3.05.96 1,9
22.02.95 4,0 28.09.95 0,8 10.06.96 3,7
17.03.95 3,4 30.10.95 1,0 12.07.96 2,1
26.04.95 0,9 22.11.95 1,9 21.08.96 2.4
25.05.95 2,2 13.02.96 1,2 23.09.96 1,1
22.06.95 1,3 29.03.96 2,5 11.10.96 1,0
27.07.95. 3,0 24.04.96 0,9 13.11.96 2,2

Для более наглядного представления материала по данным статистического ряда строится график последовательности значений рассматриваемой величины во времени или пространстве. Таким графиком является, например, гидрограф стока (рис. 3.6 ), показывающий изменение стока во времени.

Статистические характеристики - student2.ru

Рис. 3.6. Гидрограф (а), гистограмма (б) и эмпирическая кривая обеспеченности (в) годового стока р. Кама – г. Пермь.

По этому графику можно составить определенное представление о рассматриваемом процессе: об амплитуде его колебаний, тенденции изменений среднего значения и размаха колебаний, регулярности наблюдений и т.д.

Статистическая совокупность. Гистограмма (статистический многоугольник распределения)

Одной из основных задач статистической обработки материалов наблюдений является определение вероятности того или иного значения или диапазона значений случайной величины. Приближенное представление об этой вероятности можно получить с помощью специальной таблицы. Для построения ее необходимо под­считать количество наблюдений тj, попадающих в тот или иной заранее заданный j-й интервал (группу) возможных значений данной случайной величины, и рассчитать частоту pj = mj/n попаданий наблюденных величин в каждый j-й интервал, где n – период наблюдений.

Статистическая совокупность – совокупность групп, на которые разбивают значения исследуемой случайной величины, и частот попадания данных наблюдений в каждую группу (табл. 3.3).

Графическое изображение статистической совокупности называется гистограммой или статистическим многоугольником.

Таблица 3.3.

Статистическая совокупность измеренных значений БПК5 в мг/л

река Великая, г.Псков, верхний створ, за период наблюдений с 1995 по 1998 г.

Группа 0,6-1,1 1,1-1,6 1,6-2,1 2,1-2,6 2,6-3,1 3,1-3,6 3,6-4,1
m
Статистические характеристики - student2.ru 0,18 0,33 0,15 0,13 0,10 0,05 0,08

Для построения гистограммы по оси абсцисс последовательно откладывают границы групп или интервалов исследуемой величины. На каждом из этих интервалов, как на основании, строят прямоугольник высотой р. Последовательность полученных прямоугольников, сумма высот которых равна 1, и представляет собой гистограмму (см. рис. 3.9.б).

Гистограмма позволяет сделать ряд достаточно определенных предположений об имеющемся ряде наблюдений: об амплитуде колебаний относительно средних значений, о наиболее вероятных значениях, симметричности колебаний относительно среднего значения, характере изменений частоты с изменением длин интервалов значений и т. д.

Следует отметить, что результаты анализа ряда наблюдений по гистограммам в некоторой степени зависят от числа групп или интервалов. Чрезмерное увеличение числа групп при ограниченном материале наблюдений приведет к истощению информации о каждой группе в отдельности и большим погрешностям в определении частоты ее значений. Уменьшение числа групп приведет к излишней схематизации анализа.

На основании имеющегося опыта обычно рекомендуется выби­рать число групп таким, чтобы среднее число точек наблюдений в группе было не меньше семи-восьми. Иногда для определения числа групп или интервалов используется формула

K = 5 lg n , (3.67)

где n – число членов ряда.

Эмпирическая (статистическая) функцией распределения F(X) случайной величины X – закон изменения частоты события X < х в данном статистическом материале (выборке)

Статистические характеристики - student2.ru Статистические характеристики - student2.ru (3.70)

где Статистические характеристики - student2.ru =т/п— частота события X < х; т — число событий X < x в данной выборке.

В практике часто (см. разд. 3.1.3) используется обратное соотношение X и х. Преобразованная таким образом функция называется эмпирической функцией обеспеченности:

Статистические характеристики - student2.ru Статистические характеристики - student2.ru (3.71)

где — Статистические характеристики - student2.ru вданном случае частота событий X Статистические характеристики - student2.ru х.

Графическое изображение эмпирической функции обеспеченности называется эмпирической кривой обеспеченности ( рис. 5.6 б).

Из формулы (3.71) следует, что для расчета эмпирической функции обеспеченности необходимо для каждого данного значения случайной величины ζj (j = 1, 2, .. ., k) сосчитать число опытов mj в которых случайная величина X приняла значение большее или равное ζj, и разделить на общее число опытов п.

В табл. 5.4 представлен расчет эмпирической функции обеспеченности. В верхней строке таблицы указана нижняя граница этой группы, затем число случаев т, когда значения X больше или равны нижней границе интервала. В нижней строке по формуле (3.71) дана частота события X ≥ х. По данным этой таблицы построен график эмпирической функции обеспеченности (см. рис. 3.6.в).

Таблица 3.4.

Расчет эмпирической функции обеспеченности измеренных значений БПК5 в мг/л , река Великая, г.Псков, верхний створ, за период наблюдений с 1995 по 1998 г.

Нижняя гра-ница группы 0,6 1,1 1,6 2,1 2,6 3,1 3,6 4,1
m
Статистические характеристики - student2.ru 0,82 0,50 0,35 0,22 0,12 0,08

Однако построения на основе статистической совокупности дают удовлетворительные результаты только в том случае, когда имеющийся объем выборки достаточен для детального освещения частоты каждого интервала значений. Как отмечалось выше, для этого требуется, чтобы в каждом интервале было не менее семи-восьми точек наблюдений. Поэтому в практике для расчета эмпирической кривой обеспеченности применяется другой прием, заключающийся в ранжирова­нии исходного ряда наблюдений путем расположения его значений в убывающем порядке. При этом принимается, что каждое значение ряда представляет собой определенную группу, частота которой pi равна 1/п. Тогда эмпирическая обеспеченность может быть определена так же, как и в предыдущем случае, путем последовательного суммирования от наибольшего (первого) члена к интересующему нас m-ому значению ранжированного ряда (см. табл. 4.3), т. е.

Статистические характеристики - student2.ru Статистические характеристики - student2.ru (3.72)

формула Хазена

Статистические характеристики - student2.ru Статистические характеристики - student2.ru (3.73)

формула Крицкого—Менкеля

Статистические характеристики - student2.ru Статистические характеристики - student2.ru (3.74)

формула Чегодаева

Статистические характеристики - student2.ru Статистические характеристики - student2.ru (3.75)

При использовании эмпирических обеспеченностей необходимо учитывать их выборочный характер, особенно при небольших п. Так, например, эмпирическая обеспеченность наиболее высокого максимума максимального стока р. Зеи у г. Зея за маловодный десятилетний период 1901 — 1910 гг., равный 5440 м3/с, составляет по формуле (3.75) 6,7 %. За период 1901 — 1920 гг. обеспеченность этого максимума составляет 30,9%, а за период 1901 — 1958 гг уже 41,0%.

Таким образом, для анализа эмпирического материала используются три вида табличных и графических построений: статистический ряд, гистограмма, эмпирическая функция распределения. Эти построения дают достаточно наглядное представление о характере имеющегося материала и позволяют выявить некоторые важные особенности исследуемой величины.

Наши рекомендации