Первичная обработка результатов наблюдений

В первичной обработке результатов наблюдений при анализе показателей работы разных отраслей производственной сферы (добыча нефти и газа, ремонт скважин, машиностроение, строительная индустрия и т.д.) и их прогнозировании используют методы математической статистики, которые позволяют установить закономерности производственных результатов с требуемой точностью, надежностью и минимальных материальных, трудовых затратах и оценить их основные свойства. Решение этих вопросов осуществляется методами математической статистики.

Основными понятиями математической статистики являются генеральная совокупность и выборка.

Генеральная совокупность – это некоторое множествоАили совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений определенной случайной величины.Например, множество всех единиц продукции данного предприятия. Выборка (выборочная совокупность)–случайно выбранное подмножество BÌAиз генеральной совокупности. Например, множество случайно выбранных единиц продукции, при этом некий наблюдатель измерил у них весв килограммах.

Одним из основных методов математической статистики является выборочный метод – метод исследования общих свойствмножестваА на основе изучения статистических свойствтолькоподмножества В.

Число N = | A | элементов множестваА называется объемом генеральной совокупности, а число n = | B | -объемом выборки. При изучении некоторого признакаХ (в данном примере –веса) выборки производят испытания или наблюдения (измерение веса).

Выборку образуют полученные разными способами отбора исходные данные, которые представляют собой множество чисел, расположенных в хаотичном порядке (беспорядке). По такой выборке невозможно выявить определенную закономерность их варьирования (изменчивости). Поэтому с целью обработки исходных данных применяют операцию ранжирования, которая заключается в том, что наблюдаемые значения случайной величины располагают в определенном порядке (возрастания или убывания).

После проведения операции ранжирования отдельные значения случайной величины группируют таким образом, чтобы в каждой отдельной группе значения случайной величины были одинаковыми. Каждое из таких значений называется вариантой Первичная обработка результатов наблюдений - student2.ru .

Число, которое показывает, сколько раз встречаются соответствующие значение варианты Первичная обработка результатов наблюдений - student2.ru в ряду наблюдений, называется частотой или эмпирической частотой и обозначается как Первичная обработка результатов наблюдений - student2.ru , где Первичная обработка результатов наблюдений - student2.ru - номер варианты.

Отношение wi = ni/n частоты ni к объему выборки nназывают относительной частотой (частостью) варианты хi.

Вариационным рядом (или статистическим распределением) называют последовательность вариантов, записанных в возрастающем порядке и соответствующих им частот или относительных частот.

Различают дискретные и непрерывные вариационные ряды.

Дискретным статистическим рядом принято называть ранжированную совокупность вариант Первичная обработка результатов наблюдений - student2.ru и соответствующих им частот Первичная обработка результатов наблюдений - student2.ru или частостей Первичная обработка результатов наблюдений - student2.ru .

Принято записывать дискретный статистический ряд в виде табл.1.1.

Таблица 1.1

Варианты,xi x1 x2 . . . xk
Частоты,ni n1 n2 . . . nk

В случае, когда исследуемая случайная величина Первичная обработка результатов наблюдений - student2.ru является непрерывной или число ее значений достаточно велико ( Первичная обработка результатов наблюдений - student2.ru ), то принято составлять интервальный вариационный ряд.

Интервальный вариационный ряд, формируется на основании следующего алгоритма:

1. Вычисляют размах R варьирования признака Х, как разность между наибольшим Первичная обработка результатов наблюдений - student2.ru и наименьшим Первичная обработка результатов наблюдений - student2.ru значениями признака совокупности:

Первичная обработка результатов наблюдений - student2.ru . (1.1)

2. Размах R варьирования признака Х делится на k равных частей и таким образом определяется число столбцов (интервалов) в таблице. Число kчастичных интервалов выбирают, пользуясь одним из следующих правил:

Первичная обработка результатов наблюдений - student2.ru ,

Первичная обработка результатов наблюдений - student2.ru ,(1.2)

Первичная обработка результатов наблюдений - student2.ru .

При небольшом объеме n выборки число k интервалов принимают равным от 6 до 10.

3. По формуле (1.3) рассчитывают длину частичного интервала Первичная обработка результатов наблюдений - student2.ru :

Первичная обработка результатов наблюдений - student2.ru , (1.3)

где Первичная обработка результатов наблюдений - student2.ru – шаг;

k– число интервалов.

Величину h обычно округляют до некоторого значения d. Так, если результаты Первичная обработка результатов наблюдений - student2.ru признака Х– целые числа, то h округляют до целого значения, если Первичная обработка результатов наблюдений - student2.ru содержат десятичные знаки, то h округляют до значения d, содержащего такое же число десятичных знаков.

4. Подсчитывается частотаni, с которой попадают значения Первичная обработка результатов наблюдений - student2.ru признака Х в i-й интервал.

Изучая полученные результаты наблюдений, выявляют, сколько значений случайной величины отнесено в каждый конкретный интервал. В интервал включаются значения, большие или равные нижней границе, а меньшие - верхней границы интервала. В первую строку таблицы статистического ряда распределения вписываются частичные промежутки Первичная обработка результатов наблюдений - student2.ru . Во вторую строку – количество наблюдений Первичная обработка результатов наблюдений - student2.ru (где Первичная обработка результатов наблюдений - student2.ru ) попавших в каждый конкретный интервал, т. е. частоты соответствующих интервалов.

В качестве начала первого интервала рекомендуется брать начальную величину, определяемую по формуле:

Первичная обработка результатов наблюдений - student2.ru , (1.4)

Конец последнего интервала ряда должен полностью удовлетворять условию:

Первичная обработка результатов наблюдений - student2.ru . (1.5)

Промежуточные интервалы обычно получают, прибавляя к верхней границе (концу) предыдущего интервала шаг.

Сформированный интервальный вариационный ряд записывают в виде табл. 1.2.

Таблица 1.2

Варианты-интервалы, ( Первичная обработка результатов наблюдений - student2.ru ; Первичная обработка результатов наблюдений - student2.ru ) ( Первичная обработка результатов наблюдений - student2.ru ; Первичная обработка результатов наблюдений - student2.ru ) ( Первичная обработка результатов наблюдений - student2.ru ; Первичная обработка результатов наблюдений - student2.ru ) . . . ( Первичная обработка результатов наблюдений - student2.ru ; Первичная обработка результатов наблюдений - student2.ru )
частоты, ni n1 n2 . . . nk

Для расчета статистик (выборочной средней, выборочной дисперсии, асимметрии и эксцесса) переходят от интервального к дискретному вариационному ряду. В данном случае серединное значение Первичная обработка результатов наблюдений - student2.ru -го интервала принимается за варианту Первичная обработка результатов наблюдений - student2.ru , а соответствующая интервальная частота Первичная обработка результатов наблюдений - student2.ru принимается за частоту данного варианта. При этом дискретный вариационный ряд записывается в виде табл. 1.3 или табл. 1.4.

Таблица 1.3

Варианты,xi x1 x2 . . . xk
Частоты,ni n1 n2 . . . nk

Здесь Первичная обработка результатов наблюдений - student2.ru , где n - объем выборки.

Таблица 1.4

Варианты,xi x1 x2 . . . xk
Частности, wi= ni/ n w1 w2 . . . wk

Здесь Первичная обработка результатов наблюдений - student2.ru .

Для характеристики свойств статистического распределения в математической статистике вводится понятие эмпирической функции распределения. Под эмпирической функцией или функцией распределения выборки понимается функция Первичная обработка результатов наблюдений - student2.ru , которая определяет частость события Первичная обработка результатов наблюдений - student2.ru для каждого отдельного значения Первичная обработка результатов наблюдений - student2.ru :

Первичная обработка результатов наблюдений - student2.ru , (1.6)

где Первичная обработка результатов наблюдений - student2.ru - объем выборки,

Первичная обработка результатов наблюдений - student2.ru – число наблюдений, меньших Первичная обработка результатов наблюдений - student2.ru Первичная обработка результатов наблюдений - student2.ru .

В случае увеличения объема статистической выборки частость события Первичная обработка результатов наблюдений - student2.ru приближается к вероятности данного события, поэтому эмпирическая функция Первичная обработка результатов наблюдений - student2.ru является оценкой интегральной функции Первичная обработка результатов наблюдений - student2.ru . Стоит отметить, что функции Первичная обработка результатов наблюдений - student2.ru и Первичная обработка результатов наблюдений - student2.ru обладают одинаковыми свойствами. К числу этих свойств относятся:

1. Первичная обработка результатов наблюдений - student2.ru ;

2. Первичная обработка результатов наблюдений - student2.ru - неубывающая функция;

3. Первичная обработка результатов наблюдений - student2.ru , Первичная обработка результатов наблюдений - student2.ru .

В теории вероятностей аналогом этой функции является интегральная функция распределения F(x), для которой достоверно приближенное равенство:

Первичная обработка результатов наблюдений - student2.ru , (1.7)

где Первичная обработка результатов наблюдений - student2.ru – дифференциальная функция распределения или функция плотности вероятности.

Выборочным тождеством функции Первичная обработка результатов наблюдений - student2.ru следует считать функцию:

Первичная обработка результатов наблюдений - student2.ru , (1.8)

где Первичная обработка результатов наблюдений - student2.ru – частость попадания наблюдаемых значений случайной величины Первичная обработка результатов наблюдений - student2.ru в интервал Первичная обработка результатов наблюдений - student2.ru . Следовательно, значение Первичная обработка результатов наблюдений - student2.ru является характеристикой плотности частости на данном интервале.

В случае, если наблюдаемые значения непрерывной случайной величины представлены в виде интервального вариационного ряда, и, предполагая, что wi – это частость попадания данных значений в интервал Первичная обработка результатов наблюдений - student2.ru , где Первичная обработка результатов наблюдений - student2.ru – длина частичного интервала, то выборочная функция плотности Первичная обработка результатов наблюдений - student2.ru задается соотношением:

Первичная обработка результатов наблюдений - student2.ru (1.9)

где Первичная обработка результатов наблюдений - student2.ru – конец последнего k-го интервала ряда.

В виду того, что функция Первичная обработка результатов наблюдений - student2.ru является тождеством распределения плотности случайной величины, то область под графиком данной функции всегда равна единице.

Наши рекомендации