Формат исходных статистических данных

Обработка результатов

Эксперимента на основе анализа

Дисперсии, корреляции и регрессии

Методические указания и варианты заданий

к выполнению контрольной работы

для студентов – заочников технического ВУЗа по курсу

«Теория вероятностей и математической статистики»

Магнитогорск

Составители Л.Д. Девятченко, Л.А. Грачева

Обработка результатов эксперимента на основе анализа дисперсии, корреляции и регрессии: методические указания и варианты заданий к выполнению контрольной работы для студентов – заочников технического ВУЗа по курсу «Теория вероятностей и математическая статистика». Изд-во - Магни­тогорск: гос. тех ун-та им. Г.И. Носова, 2014. - 38 с.

Рецензент

© Л.Д. Девятченко, Л.А. Грачева , 2014

Введение.

Цель настоящей методических указаний - ознакомить студентов технических специальностей с основными статистическими методами обработки результатов эксперимента, научить применять эти методы. Наряду с отдельными приемами оценивания параметров и проверки гипотез в данной работе рассматриваются основные концепции дисперсионного, корреляционного и регрессионного анализов.

Особенностью данной работы является многовариантность используемых методов обработки к одним и тем же статистическим данным, что способствует сосредоточению внимания на самих результатах наблюдений при выборе подходящего метода их обработки, сообразно целям исследования.

Началом всякой обработки данных является оценка воспроизводимости этих данных в эксперименте (Задание 1), что достигается дублированием (повторением) опытов в отдельной, нескольких или во всех точках факторного пространства. В данной работе использован вариант повторения опытов во всех точках факторного пространства, что было целесообразно в условиях малого объема выборки необходимого для выполнения в учебных целях индивидуальных заданий по основным методам обработки экспериментальных данных. В этом случае статистический материал разбивается на отдельные подвыборки (группы). Такой принцип накопления (сбора) статистических данных позволяет не только оценить тесноту связей наблюдаемых переменных и выбрать подходящий вид этой связи, но и оценить степень детерминируемого объекта исследования независимо от вида используемой связи (линейной или какой - либо нелинейной). Именно поэтому дисперсионный метод обработки экспериментальных данных (Задание 2) следует сразу же после проверки однородности дисперсий в подвыборках и оценки ошибки воспроизводимости эксперимента.

Далее предлагается оценить тесноту линейной связи переменных и дать линейную аппроксимацию зависимости этих переменных (Задание 3).

Регрессионный анализ для линейного задания аппроксимации (Задание 4) и для нелинейного задания аппроксимации (Задание 5) предлагается выполнить в матричном формате, т.к. это наиболее удобное и универсальная форма особенно, в случае перехода от однофакторного к многофакторному эксперименту. Тем более, что в многофакторном эксперименте регрессионный анализ без ЭВМ весьма трудоемок из-за громоздкости вычислений. Поэтому Задание 5 предлагается выполнить с использованием ПК, что значительно снизит затраты на формирование и обращение корреляционной матрицы, вычисление невязок и другие алгебраические операции с векторами и матрицами.

Выполняя данную контрольную работу студент получает навыки применения основных статистических критериев, которые позволяют оценивать надежность и точность получаемых результатов.

На завершающем этапе выполнения данной индивидуальной работы предлагается (Задание 6) весьма актуальная задача: оценка объема подвыборок для близко расположенных (малоразличимых) средних результатов с учетом ошибки второго рода Формат исходных статистических данных - student2.ru при заданном уровне значимости Формат исходных статистических данных - student2.ru (ошибки первого рода). Действительно, полученные средние результаты диспергируя могут перекрывать друг друга, и поэтому их различимость может вызывать сомнения из-за большой ошибки Формат исходных статистических данных - student2.ru (при недостаточном объеме данных в этих частично пересекаемых группах).

Студенту предлагается в целях сравнения получаемых оценок Формат исходных статистических данных - student2.ru решить данную задачу для двух соседствующих групп на нелинейном и линейном участках исследуемой зависимости.

Кроме прилагаемых заданий данная инструкция содержит основные вопросы по теории вероятностей и математической статистики, которые прямо или косвенно возвращает студента к основным понятиям изучаемой дисциплины. Ответы на эти вопросы можно найти в учебниках, монографиях и учебных пособиях (библиографический список прилагается). Дополнительно к этому списку прилагается перечень литературы с подробным описанием программного обеспечения основных статистических пакетов обработки экспериментальных данных (STATISTICA, STATGRAPHICS, SPSS). При этом все предлагаемые для студентов задания можно выполнить поэтапно в известной офисной программе EXCEL.

Данная разработка предназначена для студентов технических специальностей заочной формы обучения по дисциплине «Теория вероятностей и математической статистика» и может быть рекомендована для студентов очной формы обучения в целях приобретения навыков обработки результатов эксперимента, по программе общего курса математики.

Формат исходных статистических данных

Изучение статистических данных и принятие по ним решений ставит следующие задачи:

· Разработка способов сбора и группировки данных;

· Разработка методов обработки и анализа данных в зависимости от целей наблюдения;

Следовательно, формат представления статистических данных предполагает возможный метод обработки этих данных.В демонстрационных данных (см. таблицу ниже) исходный материал представлен в формате, удобным для вычисления ошибки воспроизводимости эксперимента и для выполнения дисперсионного анализа. В таком же формате представлены данные (см. п. 4) для выполнения контрольной работы (варианты заданий для студентов). В дальнейшем формат этих данных легко можно изменить для выполнения корреляционного анализа (см. п. 2.2), регрессионного анализа в линейном и нелинейном вариантах (см. п. 2.4 и 5 соответственно).

Таблица демонстрационного варианта данных:

Признаки объекта Значения i- уровней факториального признака X
Результаты измерений В i -группах Формат исходных статистических данных - student2.ru 8,6 5,8 2,8 1,8 2,4 3,6
Формат исходных статистических данных - student2.ru 7,4 6,8 3,6 1,8 1,4 1,2 4,2
Формат исходных статистических данных - student2.ru 7,8 5,4 3,2 3,2 1,6 2,2 4,6
Формат исходных статистических данных - student2.ru 8,8 6,2 4,2 2,6 2,8 3,8 2,4
Формат исходных статистических данных - student2.ru 8,2 6,6 5,4 2,2 1,8 3,6

Для выполнения задания 6 (см. п. 2.6) данные представляются в «укороченном» формате: обрабатывается только отдельная пара подвыборок.

Наши рекомендации