Расчет моды и медианы

Мода – это значение признака, которое чаще других встречается в совокупности данных. Она вычисляется функцией МОДА (или MODE). Ее аргументом является интервал ячеек с данными.

Медиана – это значение признака, которое разделяет совокупность на две равные по числу элементов части. Она вычисляется функцией МЕДИАНА (или MEDIAN). Ее аргументом является интервал ячеек.

Вычисление размаха варьирования. Наибольшее и наименьшее значения.

Размах варьирования R – это разность между наибольшим xmax инаименьшим xmin значениями признака совокупности (генеральной или выборочной): R=xmaxxmin. Для нахождения наибольшего значения xmax имеется функция МАКС (или MAX), а для наименьшего xmin – функция МИН (или MIN). Их аргументом является интервал ячеек. Для того, чтобы вычислить размах варьирования данных в интервале ячеек, например, от А1 до А100, следует ввести формулу: =МАКС (А1:А100)-МИН (А1:А100).

Выявление отклонения случайного распределения от нормального.

Нормально распределенные случайные величины широко распространены на практике, например, результаты измерения любой физической величины подчиняются нормальному закону распределения. Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью

Расчет моды и медианы - student2.ru

где σ2 дисперсия, a- среднее значение Расчет моды и медианы - student2.ru случайной величины X .

Для оценки отклонения распределения данных эксперимента от нормального распределения используются такие характеристики как асимметрия А и эксцесс Е. Для нормального распределения А=0 и Е=0.

Асимметрия показывает, на сколько распределение данных несимметрично относительно нормального распределения: если А>0, то большая часть данных имеет значения, превышающие среднее Расчет моды и медианы - student2.ru ; если А<0, то большая часть данных имеет значения, меньшие среднего Расчет моды и медианы - student2.ru . Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС (А1:А100).

Эксцесс оценивает «крутость», т.е. величину большего или меньшего подъема максимума распределения экспериментальных данных по сравнению с максимумом нормального распределения. Если Е>0, то максимум экспериментального распределения выше нормального; если Е<0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100).

Задание 1.

Одним и тем же вольтметром было измерено 25 раз напряжение на участке цепи. В результате опытов получены следующие значения напряжения в вольтах: 32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35, 34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.

1.Наберите результаты эксперимента в строку 1 таблицы листа Excel,

2. Создайте ранжированный (по возрастанию), ряд во 2й строке листа с помощью сортировки.

3. Сгруппируйте ранжированный ряд в 3й строке листа Excel

4. Постройте гистограмму по сгруппированному ряду

Задание 2.

По данным из первого задания найдите выборочные среднюю, дисперсию, стандартное отклонение, размах варьирования, моду, медиану. Проверьте отклонение от нормального распределения, вычислив асимметрию и эксцесс.

1.Активизируйте новый лист книги Excel Наберите результаты эксперимента в столбец А.

2.В ячейку В1 наберите «Среднее», в В2 – «выборочная дисперсия», в В3 – «стандартное отклонение», в В4 – «Максимум», в В5 – «Минимум», в В6 – « Размах варьирования», в В7 – «Мода», в В8 – «Медиана», в В9 – «Асимметрия», в В10 – «Эксцесс». Выровняйте ширину этого столбца с помощью Автоподбора ширины.

3.Выделите ячейку С1 и нажмите на знак «=» в строке формул. С помощью Мастера функций в категории Статистическиенайдите функцию СРЗНАЧ, затем выделите интервал ячеек с данными и нажмите Enter.

4.Выделите ячейку С2 и нажмите на знак «=» в строке формул. С помощью помощью Мастера функций в категории Статистические найдите функцию ДИСП, затем выделите интервал ячеек с данными и нажмите Enter.

5.Проделайте самостоятельно аналогичные действия для вычисления стандартного отклонения, максимума, минимума, моды, медианы, асимметрии и эксцесса.

6.Для вычисления размаха варьирования в ячейку С6 следует ввести формулу: =МАКС (А1:А25)-МИН(А1:А25).

2. Инструменты статистического анализа:Генерация случайных чисел, Гистограмма, Описательная статистика.

Загрузка Пакета анализа.

Пакет анализа без дополнительных установок автоматически не загружается при запуске Excel. Он входит в так называемую Надстройку – набор дополнительных подпрограмм, к которым относятся, например, уже известные вам Мастер диаграмм и Мастер функций. Для загрузки Пакет анализа необходимо:

1)в Основном меню выбрать пункт Сервис;

2)выбрать пункт Надстройки;

3)в появившемся списке Надстроек активизировать переключатель AnalysisToolPak-VBA и нажать ОК.

После этого в меню Сервис добавится пункт Анализ данных. К этому пункту следует обращаться для вызова Пакета анализа.

Инструмент: Генерация случайных чисел.

В Excel имеется встроенная функция СЛЧИСЛ (или RAND) для генерации равномерно распределенных случайных чисел в интервале [0,1].

Пакет анализа позволяет генерировать случайные числа с различными типами распределений: равномерное, нормальное, Бернулли, биномиальное, Пуассона и дискретное (определенное пользователем). Для генерации случайных чисел следует:

1)в меню Сервис выбрать команду Анализ данных;

2)в появившемся диалоговом окне Анализ данных в группе Инструменты анализа выбрать пункт Генерация случайных величини нажать ОК;

3)в появившемся диалоговом окне Генерация случайных чисел следует заполнить поля ввода:

- в полях Число переменных и Число случайных чисел указать нужное количество столбцов и сколько чисел вы хотите получить в каждом столбце;

- в поле Распределение следует выбрать один из имеющихся типов распределения случайных чисел;

- в группе Параметры следует указать диапазон чисел, т.е. min и max числа распределения для Равномерного распределения; или среднее значение и стандартное отклонение для Нормального распределения и т.д.

- поле Случайное рассеивание заполняется только в том случае, если вам необходимо несколько раз воспроизводить одну и туже последовательность случайных чисел;

- в поле Выходной интервал указывается место, куда следует поместить последовательность чисел, как правило, это интервал ячеек (или столбец целиком).

Инструмент: Гистограмма.

Графическое представление результатов обработки статистических данных обычно оформляется в виде гистограммы. Совокупность данных разбивается на частичные интервалы, называемые нормальными. Интервалы разбиения могут быть любой ширины, но обязательно они должны следовать в порядке возрастания. Интервалы разбиения откладываются по оси абсцисс гистограммы. На оси ординат гистограммы откладывается число значений, попавших в интервал разбиения. Это число значений признака совокупности называется частотой.

Для построения гистограммы:

1)в начале следует задать частичные интервалы разбиения;

2)затем в меню Сервис выбрать команду Анализ данныхи указать инструмент анализа –Гистограмма и нажать ОК;

3)в диалоговом окне Гистограмма следует указать:

- в группе Входные данные в поле Входной интервал – интервал ячеек с данными, а в поле Интервал карманов– интервал ячеек с частичными интервалами разбиения;

- в группе Параметры вывода указывается интервал ячеек для вывода частот и отмечается галочкой переключатель Вывод графика.

После нажатия ОК инструментГистограмма выводит два столбца: карман и частота. Сама гистограмма выводится правее столбца частот. Форматирование гистограммы производится так же, как и любой диаграммы в Excel ..

Инструмент: Описательная статистика.

В пакете анализа Excelсодержится инструмент Описательная статистика, который создает таблицу основных статистических характеристик для совокупности данных. В этой таблице будут содержаться следующие характеристики: среднее, стандартная ошибка, дисперсия, стандартное отклонение, мода, медиана, размах варьирования интервала, максимальное и минимальное значения, асимметрия, эксцесс, объем совокупности, сумму всех элементов совокупности, доверительный интервал (уровень надежности). Инструмент Описательная статистика существенно упрощает статистический анализ тем, что нет необходимости вызывать каждую функцию для расчета статистических характеристик отдельно.

Для того, чтобы вызвать Описательную статистику, следует:

1)в меню Сервис выбрать команду Анализ данных;

2)в списке Инструменты анализадиалогового окна Анализ данных выбрать инструмент

Описательная статистика и нажать ОК;

3)в появившемся диалоговом окне Описательная статистика необходимо:

- в группе Входные данные в поле Входной интервал указать интервал ячеек, содержащих данные;

- если первая строка во входном диапазоне содержит заголовок столбца, то в поле Метки в первой строке следует поставить галочку;

- активизировать переключатель (поставить галочку) Итоговая статистика, если нужен полный список характеристик;

- активизировать переключатель Уровень надежности и указать надежность в %, если необходимо вычислить доверительный интервал.

Задание 3.

Сгенерировать 500 случайных чисел, распределенных нормально. Построить гистограмму и полный список статистических характеристик с помощью инструмента Описательная статистика.

1. Выполните команду Сервис→Анализ данных→Генерация случайных чисел;

2..В диалоговом окне Генерация случайныхчисел введите в поле число переменных: 1; в поле Число случайных чисел 500; выберите Распределение Нормальное; задайте любое среднее значение (желательно около 100) и небольшое стандартное отклонение (не больше 10); в поле Выходной интервал укажите абсолютный адрес столбца $A$2. Нажмите ОК.

3.Теперь постройте гистограмму по совокупности случайных чисел. Сначала нужно задать интервалы решения. Пусть длины интервалов будут одинаковыми и равны 3. Для автоматического составления интервалов разбиения наберите в ячейку В2 начальное число, например, 75 для наших случайных чисел. Затем выполните команду Правка→Заполнить→Прогрессия. В появившемся диалоговом окне заполните данные:

- в группе переключателей поле Расположение установите по столбцам;

- в поле Шагнаберите 3;

- в поле Предельное значение наберите 125;

- в группе переключателей Тип установите арифметическаяи нажмите ОК.

В результате столбец В будет содержать интервалы разбиения (карманы).

4.Выполните команду Сервис→Анализ данных→Гистограмма. В появившемся диалоговом окне Гистограммазаполните:

- входной интервал появится, если щелкнуть мышью по столбцу А;

- интервал карманов появится, если щелкнуть мышью по столбцу В;

- поставьте галочку в поле метки;

- укажите столбец С в поле Выходной интервал;

- активизируйте переключатель Вывод графика; если это поле не содержит галочки, нажмите ОК.

5.Построение гистограммы займет от 5 до 10 минут. За это время письменно ответьте на контрольные вопросы. В результате вычисления получатся столбец под названием Карман, который дублирует ваш столбец интервалов разбиения, и столбец под название Частота с рассчитанными частотами. После того, как появилась гистограмма, измените ее размеры с помощью мыши так, чтобы хорошо были видны все столбцы и подписи.

6.Теперь осталось получить таблицу статистических характеристик с помощью Описательной статистики. Выполните команду СервисАнализ данныхОписательная статистика. В появившемся диалоговом окне Описательная статистика укажите:

- в поле Входной интервал появится адрес, если выделить мышью интервал сданными или с клавиатуры набрать адрес $A$2: $A$501;

- в поле Группирование активизировать переключатель по столбцам;

- активизировать переключатель Метки в первой строке;

- в группе Параметры вывода укажите Выходной интервал, щелкнув мышью по какой-либо пустой ячейке ниже столбца частот, например, по С 25;

- активизируйте переключатель Итоговая статистика (если в этом поле нет галочки);

- активизируйте переключатель Уровня надежности и установите 95%;

- снимите галочки с полей наименьший и наибольший и нажмите ОК.

Результаты покажите преподавателю.

Задание 4

В результате выборочного обследования студентов ВУЗа получено 100 измерений роста, данные в приведенной ниже таблице

Необходимо:

1. ранжировать ряд данных,

2. сгруппировать по диапазонам размером 5см.

3. построить гистограмму по сгруппированным данным

4. с помощью инструментов анализапровести анализ данных (как в Задании 3)

5. сформулировать выводы

Контрольные вопросы.

1.Для чего предназначена функция СРЗНАЧ?

2.С помощью каких характеристик оценивают разброс статистических данных? Какие функции в Excel их вычисляют? В чем отличие функции оценки разброса данных для генеральной и выборочной совокупности?

3.В чем отличие функций СЧЕТ и СЧЕТЗ?

4.Что такое мода и какая функция ее вычисляет?

5.Что такое медиана и какая функция ее вычисляет?

6.Как вычислить размах варьирования?

7.С помощью каких характеристик оценивают отклонение случайного распределения от нормального? Какой смысл этих характеристик и какие функции в Excel их вычисляют?

8.Что такое Инструменты Анализа? Как загрузить Пакет Анализа?

9.Опишите последовательность действий, которые необходимо совершить для генерации случайных чисел распределенных нормально.

10.Как построить гистограмму?

11.Для чего предназначен инструмент Описательная статистика?

Наши рекомендации