Не забудьте зафиксировать значение М(Х)!!!
По данным выборки выполните группировку данных. Вычислите математическое ожидание, моду, медиану, дисперсию, среднее квадратическое отклонение. Постройте гистограмму частот и график эмпирической функции распределения.
1) Для начала найдем минимальное и максимальное значения выборки:
Получим:
2) Поскольку выборка непрерывная необходимо применить разбиение на интервалы. Для этого следует определить количество интервалов (воспользуемся формулой Стерджесса , где n – это объем выборки) и шаг (длину интервалов).
Для начала определим объем выборки, воспользовавшись известной нам функцией СЧЕТ().
Далее определяем количество интервалов:
Количество интервалов округляем до большего целого. Поскольку у нас k=6.64, то будем использовать разбиение на 7 интервалов.
Шаг вычисляется как разность максимального и минимального значений выборки деленная на количество интервалов: .
Получаем:
Определим интервалы и частоты. Построим вспомогательную таблицу.
Определим интервалы. Очевидно, что первый интервал начинается с минимального значения выборки.
Чтобы вычислить конечное значение первого интервала, к началу интервала следует прибавить шаг (шаг есть величина постоянная, поэтому следует его зафиксировать, нажав кнопку F4).
Первый интервал получен:
Поскольку первый интервал заканчивается значение 18,2, то следующий интервал начинается с 18,3 (интервалы должны иметь четкие границы).
Далее следует выполнить копирование формулы из ячейки А21 вниз, и из ячейки В20 вниз.
Столбец «Дополнительно» заполняется вручную.
Для определения частоты воспользуемся функцией СЧЕТЕСЛИМН ().
Обратите внимание на фиксирование диапазона исходных данных (F4).
Копируем формулу вниз.
Вычислите в ячейке E27 сумму частот. Должно получится значение равное объему выборки.
Переходим к вычислению значений следующего столбца. Середина интервала (xi*) необходима для проведения дальнейших вычислений и вычисляется как полу сумма границ интервала.
Используйте форматирование ячеек, чтобы оставить один знак после запятой.
нажмите кнопку для открытия окна Формат ячеек.
3) Вычислим математическое ожидание. Как Вы помните мы можем воспользоваться двумя способами.
Первый способ: используем функцию СРЗНАЧ ():
Второй способ: используем формулу .
Для этого проведем вспомогательные вычисления.
Умножим середины интервалов на частоты:
Скопируем формулу вниз:
Найдем сумму полученных значений:
Переходим к вычислению математического ожидания. Осталось полученную сумму разделить на объем выборки:
4) Продолжим вычислять точечные характеристики:
а) Дисперсия: . Как мы уже говорили, для расчета точечных характеристик непрерывной выборки после интервальной группировки в расчетах вместо xi следует использовать - середина каждого интервала.
Для нахождения дисперсии выполним вспомогательные вычисления. Добавим в таблицу с интервалами три дополнительных столбца: , и (вместо ) используем для расчета значение М(Х)).
Вычислим первое значение в первом добавленном столбце.
Не забудьте зафиксировать значение М(Х)!!!
Проведем авто заполнение.
Вычислим значения во втором добавленном столбце.
Знак ^ означает степень. Т. е. ^2 – значит в степени 2. Чтобы поставить знак ^- нужно нажать сочетание клавиш shift+6.
Выполним авто заполнение.
Вычислим значения в третьем добавленном столбце:
Мы видим, что в числителе формулы для дисперсии стоит знак суммы. Суммируем значения последнего столбца (воспользуемся автосуммой).
Вычислим непосредственно дисперсия:
Дисперсию можно найти, воспользовавшись функцией ДИСП.Г. Но в данном случае значение дисперсии, вычисленное по формуле и с помощью функции будут отличаться. Поскольку в формуле берется значение середин. Значение, вычисленное с помощью функции более точное. Оно вычисляется на основе исходных данных.
Вычислим среднее квадратическое отклонение, как корень из дисперсии.