Вычисление выборочных числовых характеристик по интервальному ступенчатому ряду
Визуализация данных.
Построим гистограмму: по оси x отмечаются пределы частичных интервалов; по оси y откладываются относительные частоты:
Вывод: гистограмма показывает, что распределение вероятностей довольно равномерно растянуто. Построим график эмпирической функции распределения: по оси x отмечаются пределы частичных интервалов, по оси y откладываются накопленные частоты:
Теперь строим кривую Кетли:
Вычисление выборочных числовых характеристик по интервальному ступенчатому ряду.
Пусть теперь xi – середины интервалов:
x1=0,4; x2=1,2; x3=2; x4=2,8.
Составим таблицу 6 расчетов: 1-ый столбик – середины интервалов; 2-ой столбик – частоты (количество исходных данных, попавших в соответствующий интервал); остальные столбики соответствуют столбикам таблицы 3 предыдущей выборки:
xi | ni | xi*ni | xi- | (xi- )2 | (xi- )2*ni | (xi- )3 | (xi- )3*ni | (xi- )4 | (xi- )4*ni |
0,4 | -0,52 | 0,2704 | 16,224 | -0,141 | -8,436 | 0,073 | 4,387 | ||
1,2 | 27,6 | 0,28 | 0,0784 | 1,803 | 0,022 | 0,505 | 0,006 | 0,141 | |
1,08 | 1,1664 | 10,498 | 1,260 | 11,337 | 1,360 | 12,244 | |||
2,8 | 22,4 | 1,88 | 3,5344 | 28,275 | 6,645 | 53,157 | 12,492 | 99,936 | |
S | 56,8 | 56,56 | 116,7 | ||||||
*S | =0,92 | s2=0,568 m2 | m3=0,566 | m4=1,167 | |||||
0,574 |
Таблица 6:
Считаем среднее взвешенное:
= =0,92;
Считаем взвешенную дисперсию:
s2 = =0,568;
= =0,574;
σ= =0,754;
= =0,757;
Вывод: в среднем изучаемая случайная величина принимает значение 0,92 и колеблется в пределах 0,92 0,754.
Расчет коэффициента асимметрии:
= =1,32;
Рассчитаем коэффициент эксцесса:
= -3= -3=0,617;
Так как коэффициент эксцесса больше нуля, то распределение вероятностей имеет крутой вираж, чем в случае нормального распределения.
Вычисление моды для непрерывной случайной величины.
Мода - та точка числовой оси, в которой функция плотности распределения вероятности достигает своего максимума.
Математики получили оценку моды для непрерывного случая:
Выборочная мода:
Сначала нужно выбрать модальный интервал – это тот интервал, которому соответствует наибольшая частота.
- начало модального интервала;
=0;
– частота в модальном интервале;
=60;
- частота в интервале, который предшествует модальному;
=0;
- частота в интервале, который идет после модального;
=23;
h=0,8 – шаг.
= +h ;
=0+0,8 =0,495;
Вывод: модальным значением (значением, пользующимся модальным спросом) изучаемой случайной величины будет число 0,495. Это значит, что около будут концентрироваться те значения случайной величины, которые наиболее часто встречаются.
Вычисление медианы для непрерывного случая (отличается от дискретного случая).
В непрерывном случае для вычисления медианы выбирается медианный интервал – это тот интервал, на которой приходится накопление накопленная относительная частота, равная 0,5.
0,6 0,83 0,92 1
0 0,5 0,8 1,6 2,4 3,2
В нашем расчете медианный интервал – (0; 0,8)
- начало медианного интервала;
=0;
-частота внутри медианного интервала;
=60;
-накопленная частота до медианного интервала;
=0;
n – объем выборки; n=100;
h- шаг; h=0,8;
Статистика для выборочной медианы :
= +h ;
=0+0,8* = 0,667;
50% 50%
0,667
Медиана = 0,667 делит числовую ось на две равновероятные области событий; 50% данных равно 0 и 50% данных больше чем 0,667.
Вывод: распределение вероятностей изучаемой нами случайной величины не будет нормальным, так как не выполняется характеристическое свойство .