Построение вариационного ряда
Введение
Наука, изучающая закономерности массовых случайных событий, называется теорией вероятностей. Применение теории вероятностей к обработке больших совокупностей чисел называется математической статистикой. Основная задача математической статистики состоит в разработке методов, позволяющих обобщать результаты наблюдений. Статистические совокупности могут быть взяты из самых разнообразных областей, поэтому математическая статистика находит себе применение во всевозможных исследованиях: в физике, астрономии, биологии, метеорологии, демографии, экономике, современном производстве и технике и т.д.
Любое статистическое исследование состоит из нескольких основных этапов:
1) организация и планирование статистических наблюдений;
2) сбор статистических данных;
3) анализ статистических данных;
4) принятие решений, рекомендаций и выводов;
5) прогнозирование случайных явлений;
6) статистический контроль регулирования хода технологических процессов, оценка качества партий продукции.
Цель методических указаний – формирование навыков статистической обработки экспериментального материала, которые могут быть использованы при выполнении исследовательских работ по различным учебным дисциплинам, при выполнении курсовых работ и дипломном проектировании, в научных исследованиях. Эти навыки будут полезны студентам всех специальностей и различных форм обучения.
Задания к РГР:
1. По результатам выборки построить вариационный ряд.
2. Представить графическое изображение вариационного ряда (полигон и гистограмму).
3. Составить эмпирическую функцию распределения и нарисовать ее график.
4. Вычислить основные выборочные характеристики.
5. Найти точечные и интервальные оценки параметров распределения.
6. На основе полученных результатов выдвинуть гипотезу о виде распределения (нормальное распределение).
7. С помощью критерия согласия Пирсона проверить гипотезу о нормальном распределении признака генеральной совокупности.
8. Построить эмпирическую кривую распределения.
Основные понятия математической статистики
Генеральной совокупностью называется совокупность всех наблюдений, которые могли быть сделаны при данном реальном комплексе условий измерений. Число членов, образующих генеральную совокупность, называется объемом генеральной совокупности N.
Генеральная совокупность является понятием модельным. Говоря о распределении случайной величины X в генеральной совокупности, мы можем делать различные предположения о функции распределения случайной величины или о параметрах этой функции.
Выборочной совокупностью или просто выборкой объема n называется совокупность n объектов, отобранных из исследуемой генеральной совокупности.
Пусть имеется выборка результатов испытаний.
8,91 7,36 9,10 9,80 8,43 10,10 7,45 9,01 8,07 8,86 | 10,19 10,71 9,68 9,33 8,93 9,03 10,11 7,46 9,30 8,62 | 8,92 7,33 8,63 9,24 8,66 8,44 9,54 8,02 8,62 8,12 | 9,73 8,43 7,95 9,89 9,93 8,49 6,75 8,38 8,72 9,57 | 9,96 9,42 9,24 9,56 8,29 7,13 9,42 9,84 8,06 8,67 |
8,98 8,43 9,04 10,60 9,63 10,97 8,77 9,07 8,91 10,38 | 9,31 9,29 9,04 10,13 9,68 8,66 8,88 9,43 8,81 8,20 | 10,43 8,97 9,18 10,33 10,04 9,14 10,22 9,10 8,25 8,66 | 9,68 10,50 9,51 9,88 8,16 8,98 8,13 7,21 9,33 10,60 | 8,99 9,13 9,14 10,25 6,84 8,72 10,35 8,12 9,94 7,41 |
В данном примере объем выборки n=100.
Для того чтобы суждения о законах распределения случайной величины X или об их числовых характеристиках были объективны, необходимо, чтобы выборка была представительной (репрезентативной), т.е. достаточно хорошо представляла исследуемую случайную величину. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку. Выборка считается большой, если ее объем n >30.
Построение вариационного ряда
Пусть изучается некоторая дискретная или непрерывная случайная величина, закон распределения которой известен. Статистический материал, полученный в результате измерений представляют в виде таблицы, состоящей из двух строк, в первой из которых находятся расположенные в возрастающем порядке значения признаков (для дискретной случайной величины) или интервалов (для непрерывной случайной величины), а во второй – их частота ; (число одинаковых значений дискретной случайной величины или число наблюдений в i-м интервале в случае непрерывной случайной величины). Такое представление признака и частот называется вариационным рядом.
На основе имеющейся выборки составляем интервальный статистический ряд.
Для выбора оптимальной длины интервалов h воспользуемся формулой: где и – соответственно максимальное и минимальное значения признака в выборке; l – количество интервалов, причём в данной работе мы будем использовать следующую формулу: , где n – объём выборки.
Для нашего случая: 6,75, 10,97 ,
Найдём количество интервалов: .
Найдём длину интервалов (шаг): (10,97–6,75)/10=0,422 0,43.
Нижнюю границу первого интервала принимаем 6,75.
Зная нижнюю границу первого интервала и длину интервала , построим весь интервальный ряд.
Проанализируем каждое значение имеющейся выборки на факт попадания в определённый интервал, а число значений, попавших в интервал, запишем в столбец «Частота » таблицы 1. Проведём проверку полученных значений частот: .
Найдем середину каждого интервала, используя формулу: , где и – конечное и начальное значения определённого интервала. Результаты занесем в таблицу 1.
Таблица 1.
Интервалы | Середина интервала | Частота | |
[6,75; 7,18) | 6,97 | *** | |
[7,18; 7,61) | 7,40 | ****** | |
[7,61; 8,04) | 7,83 | ** | |
[8,04; 8,47) | 8,26 | ************** | |
[8,47; 8,9) | 8,69 | ************** | |
[8,9; 9,33) | 9,12 | ************************ | |
[9,33; 9,76) | 9,55 | ************** | |
[9,76; 10,19) | 9,98 | ************ | |
[10,19; 10,62) | 10,41 | ********* | |
[10,62; 11,05) | 10,84 | ** |