Методические рекомендации по выполнению заданий.
Пример 1. В результате эксперимента получена выборка для дискретного признака X объёма n = 50:
Требуется: 1) составить вариационный ряд; 2) составить таблицу относительных частот; 3) построить полигон.
Решение: 1) выбираем различные варианты из выборки и записываем в возрастающем порядке ( )
12 13 14 15 16 17 18 19 20;
2) для каждой варианты определяем частоты ni и вычисляем относительные частоты. Результаты записываем в таблицу:
ni | |||||||||
( );
3) полигон: по горизонтальной прямой откладываем значения вариант, а по вертикальной – значения относительных частот. Полигон не является графиком в смысле функциональной зависимости, а лишь графическое изображение таблицы относительных частот. Поэтому наименьшее значение варианты y наносим в точке пересечения осей.
Рис. 1. Полигон
Замечание. В теории вероятностей дискретная случайная величина Х задаётся законом распределения, записанным в виде таблицы:
Таблица 2
хi | x1 | x2 | … | xn |
pi | p1 | p2 | … | pn |
где хi – значения, принимаемые дискретной случайной величиной, pi – соответствующие им вероятности, причём
Этот закон геометрически изображается в виде ломаной линии на плоскости, соединяющей точки (хi; pi) и называемой многоугольником распределения.
В основе понятия вероятности лежит статистический подход – частота событий.
Частотой события А называется число , где n(A) – число появления события А в произведённых n независимых опытах. Эмпирически установлено, что для большого числа опытов частота обладает свойствами устойчивости, т.е. начинает колебаться около некоторого постоянного Р(А) и амплитуда этих колебаний уменьшается с увеличением n, т.е.
.
Таким образом, при достаточно большом объёме выборки, относительная частота в таблице начинает стремиться к Рi, т.е. эмпирический закон распределения дискретного признака будет приближаться к истинному (теоретическому) закону распределения (табл. 2), и, соответственно, полигон приближенно будет принимать форму многоугольника.
Непрерывный вариационный ряд: в этом случае для изучения непрерывного признака X по выборке составляют интервальный вариационный ряд. Для этого весь диапазон изменения признака X разбивают на k частичных интервалов равной длины и вычисляют относительную частоту попадания варианты в i- интервал: где ni – число членов выборки, попавших в i-интервал [ ].
Таблица 3
[ ] | [c1;c2) | [c2;c3) | … | [cn;cn+1] |
… |
где =1, называется интервальной таблицей относительных частот.
Замечание. Если при построении интервалов какая-либо из вариантов попадает точно на границу соседних интервалов, то её относят к следующему (правому) интервалу. Для последующей обработки сгруппированных данных по формулам за значение интервала принимаем его середину (обозначим ), т.е. центральное значение.
Интервальная таблица относительных частот изображается в виде гистограммы относительных частот – ступенчатой фигурой, состоящей из прямоугольников, основаниями которых служат частичные интервалы длиной, равной , а площадь каждого i-го интервала Si равна соответствующей частоте , т.е. Si= .
Тогда высота i-го прямоугольника Нi равна: (i=1,2,…n).
При построении интервальных таблиц актуальными становятся вопросы о выборе числа интервалов и их длине. Они решаются конкретно для каждой задачи, исходя из целей исследования, объёма выборки и степени варьирования признака в выборке. Но приближенное число интервалов k и соответственно длину интервалов можно оценить исходя только из объёма n выборки. Делается это по формуле Стерджеса:
k=1+3,32lg n
или с использованием готовой таблицы.
Таблица 4
Объем выборки (n) | Число интервалов (k) |
25-40 | 5-6 |
40-60 | 6-8 |
60-100 | 7-10 |
100-200 | 8-12 |
Более 200 | 10-15 |
Длина частичных интервалов определяется по формуле
.