Выборка. Обработка результатов

Раздел 14. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ.

Математическая статистика – раздел математики, изучающий математические методы сбора, систематизации, обработки и интерпретации результатов наблюдений с целью выявления статистических закономерностей. Математическая статистика опирается на теорию вероятностей.

Выборка. Обработка результатов.

В любой практической деятельности значительную роль играют статистические методы изучения случайных явлений. К этим методам прибегают всякий раз, когда требуется изучить распределение большой совокупности предметов, явлений, индивидуумов по некоторым признакам. Так как практически любой признак допускает количественную оценку, то можно говорить о распределении некоторой случайной величины Х.

Все возможные значения случайной величины Х называются генеральной совокупностью.

Способ «поголовного» обследования всей изучаемой совокупности связан с рядом трудностей. Поэтому обследование генеральной совокупности заменяют обследованием некоторой её наудачу выбранной части, которая называется выборкой или выборочной совокупностью.

Объёмом выборочной или генеральной совокупности называется число объектов этой совокупности.

Чтобы в выборке могли проявиться закономерности, существующие в генеральной совокупности, выборка должна быть достаточно большой, и все объекты генеральной совокупности должны иметь одинаковую вероятность попасть в выборку. При этом объекты выборки должны отбираться независимо друг от друга.

К сожалению, на практике не уделяют достаточного внимания анализу независимости отдельных измерений, что может привести к неприменимости выводов статистической теории.

Итак, предположим, что изучается некоторая случайная величина Х. С этой целью проводятся n независимых опытов (наблюдений), в результате которых величина Хприняла nчисловых значений (статистические данные): х1, х2,…,хn

Совокупность этих значений и есть произведённая нами выборка. n – объём выборки.

Первый этап обработки – это составление вариационного ряда: из выборки отбирают все различные значения и располагают их в порядке возрастания: Выборка. Обработка результатов - student2.ru ,где Выборка. Обработка результатов - student2.ruварианты.

Второй этап обработки – составление эмпирического (то есть полученного опытным путём) закона распределения. Форма его зависит от характера изучаемой случайной величины.

Пусть Х – дискретная случайная величина. Тогда естественной формой эмпирического закона распределения является таблица относительных частот, показывающая, с какой частотой наблюдалось то или иное значение.

Таблица частот имеет вид:

Выборка. Обработка результатов - student2.ru Выборка. Обработка результатов - student2.ru …. Выборка. Обработка результатов - student2.ru
Выборка. Обработка результатов - student2.ru Выборка. Обработка результатов - student2.ru Выборка. Обработка результатов - student2.ru

В первой строке – числа вариационного ряда, а во второй – их относительные частоты Выборка. Обработка результатов - student2.ru , где n – число всех опытов, ni – число опытов, в которых наблюдалось значение Выборка. Обработка результатов - student2.ru . Очевидно, что Выборка. Обработка результатов - student2.ru .

Можно ожидать, что с увеличением числа опытов таблица частот будет все более приближаться к истинному закону распределения случайной величины Х.

Если на плоскости в прямоугольной системе координат соединить последовательно точки ( Выборка. Обработка результатов - student2.ru ) , то получим ломаную, называемую полигоном частот.

Пример 1. По журналу собраны данные о числе пропущенных занятий по математике у 25 студентов второго курса. В итоге получены значения: 2, 6, 0, 2, 6, 3, 0, 2, 6, 4, 0, 3, 3, 2, 2, 4, 0, 0, 2, 3, 6, 0, 3, 0, 2.

Здесь объем выборки n=25, а вариационный ряд состоит из пяти различных чисел (вариант): 0, 2, 3, 4, 6. Найдем относительную частоту появления каждого из чисел и составим таблицу частот:

7/25 7/25 5/25 2/25 4/25

Полигон частот:

Выборка. Обработка результатов - student2.ru

Пусть Х – непрерывная случайная величина.

Пользоваться таблицей частот в прежнем её виде уже не имеет смысла. В этом случае составляют интервальную таблицу частот .

Диапазон изменения случайной величины Х разбивают на l интервалов [c1;c2], [c2;c3],…,[cl,cl+1].

Находим ni – количество значений Х, лежащих в i-ом интервале и определяют частоту попадания в i-интервал Выборка. Обработка результатов - student2.ru .

Возникает вопрос, если значение попало на границу двух интервалов, то к какому его отнести? Это безразлично. Условимся относить к левому.

Интервальная таблица частот тогда имеет вид:

12] 23] ll+1]
n1/n n2/n nl/n

Интервальная таблица частот изображается графически в виде гистограммы.

Это ступенчатая фигура, состоящая из прямоугольников с основанием [сii+1] и площадью ni/n, т.е. высоты прямоугольников

Выборка. Обработка результатов - student2.ru - плотность частоты попадания в i- интервал.

Вероятностный смысл гистограммы: верхняя ступенчатая линия гистограммы приближенно представляет плотность распределения вероятности случайной величины Х.

Число интервалов следует брать не очень большим, чтобы после группировки вариационный ряд не был громоздким, и не очень малым, чтобы не потерять особенности распределения признака.

В литературе по статистической обработке экспериментальных данных рекомендуется выбирать количество интервалов (равной длины) в пределах:

Выборка. Обработка результатов - student2.ru , где п – объем выборки.

Пример 2. Расстояние до цели измеряется радиодальномером. Случайная величина Х – ошибка измерения расстояния. С целью установления точности прибора произведено п=100 измерений этой ошибки (в метрах):

ошибка (м) (-20;-15] (-15;-10] (-10;-5] (-5;0] (0;5] (5;10] (10;15]
число ошибок ni

Построим гистограмму распределения.

Для этого составим интервальную таблицу частот, найдем плотность частоты попадания в каждый интервал:

ошибка (м) (-20;-15] (-15;-10] (-10;-5] (-5;0] (0;5] (5;10] (10;15]
число ошибок ni
относительная частота Выборка. Обработка результатов - student2.ru = Выборка. Обработка результатов - student2.ru 0,08 0,11 0,18 0,26 0,19 0,12 0,06
плотность частоты hi= Выборка. Обработка результатов - student2.ru 0,016 0,022 0,036 0,052 0,038 0,024 0,012

Построение гистограммы частот - на каждом i-ом интервале как на основании строим прямоугольник высоты hi :

Выборка. Обработка результатов - student2.ru

Из рисунка видно, что распределение величины Х (ошибки измерений) по форме близко к нормальному.

Наши рекомендации