Формат исходных статистических данных
Обработка результатов
Эксперимента на основе анализа
Дисперсии, корреляции и регрессии
Методические указания и варианты заданий
к выполнению контрольной работы
для студентов – заочников технического ВУЗа по курсу
«Теория вероятностей и математической статистики»
Магнитогорск
Составители Л.Д. Девятченко, Л.А. Грачева
Обработка результатов эксперимента на основе анализа дисперсии, корреляции и регрессии: методические указания и варианты заданий к выполнению контрольной работы для студентов – заочников технического ВУЗа по курсу «Теория вероятностей и математическая статистика». Изд-во - Магнитогорск: гос. тех ун-та им. Г.И. Носова, 2014. - 38 с.
Рецензент
© Л.Д. Девятченко, Л.А. Грачева , 2014
Введение.
Цель настоящей методических указаний - ознакомить студентов технических специальностей с основными статистическими методами обработки результатов эксперимента, научить применять эти методы. Наряду с отдельными приемами оценивания параметров и проверки гипотез в данной работе рассматриваются основные концепции дисперсионного, корреляционного и регрессионного анализов.
Особенностью данной работы является многовариантность используемых методов обработки к одним и тем же статистическим данным, что способствует сосредоточению внимания на самих результатах наблюдений при выборе подходящего метода их обработки, сообразно целям исследования.
Началом всякой обработки данных является оценка воспроизводимости этих данных в эксперименте (Задание 1), что достигается дублированием (повторением) опытов в отдельной, нескольких или во всех точках факторного пространства. В данной работе использован вариант повторения опытов во всех точках факторного пространства, что было целесообразно в условиях малого объема выборки необходимого для выполнения в учебных целях индивидуальных заданий по основным методам обработки экспериментальных данных. В этом случае статистический материал разбивается на отдельные подвыборки (группы). Такой принцип накопления (сбора) статистических данных позволяет не только оценить тесноту связей наблюдаемых переменных и выбрать подходящий вид этой связи, но и оценить степень детерминируемого объекта исследования независимо от вида используемой связи (линейной или какой - либо нелинейной). Именно поэтому дисперсионный метод обработки экспериментальных данных (Задание 2) следует сразу же после проверки однородности дисперсий в подвыборках и оценки ошибки воспроизводимости эксперимента.
Далее предлагается оценить тесноту линейной связи переменных и дать линейную аппроксимацию зависимости этих переменных (Задание 3).
Регрессионный анализ для линейного задания аппроксимации (Задание 4) и для нелинейного задания аппроксимации (Задание 5) предлагается выполнить в матричном формате, т.к. это наиболее удобное и универсальная форма особенно, в случае перехода от однофакторного к многофакторному эксперименту. Тем более, что в многофакторном эксперименте регрессионный анализ без ЭВМ весьма трудоемок из-за громоздкости вычислений. Поэтому Задание 5 предлагается выполнить с использованием ПК, что значительно снизит затраты на формирование и обращение корреляционной матрицы, вычисление невязок и другие алгебраические операции с векторами и матрицами.
Выполняя данную контрольную работу студент получает навыки применения основных статистических критериев, которые позволяют оценивать надежность и точность получаемых результатов.
На завершающем этапе выполнения данной индивидуальной работы предлагается (Задание 6) весьма актуальная задача: оценка объема подвыборок для близко расположенных (малоразличимых) средних результатов с учетом ошибки второго рода при заданном уровне значимости (ошибки первого рода). Действительно, полученные средние результаты диспергируя могут перекрывать друг друга, и поэтому их различимость может вызывать сомнения из-за большой ошибки (при недостаточном объеме данных в этих частично пересекаемых группах).
Студенту предлагается в целях сравнения получаемых оценок решить данную задачу для двух соседствующих групп на нелинейном и линейном участках исследуемой зависимости.
Кроме прилагаемых заданий данная инструкция содержит основные вопросы по теории вероятностей и математической статистики, которые прямо или косвенно возвращает студента к основным понятиям изучаемой дисциплины. Ответы на эти вопросы можно найти в учебниках, монографиях и учебных пособиях (библиографический список прилагается). Дополнительно к этому списку прилагается перечень литературы с подробным описанием программного обеспечения основных статистических пакетов обработки экспериментальных данных (STATISTICA, STATGRAPHICS, SPSS). При этом все предлагаемые для студентов задания можно выполнить поэтапно в известной офисной программе EXCEL.
Данная разработка предназначена для студентов технических специальностей заочной формы обучения по дисциплине «Теория вероятностей и математической статистика» и может быть рекомендована для студентов очной формы обучения в целях приобретения навыков обработки результатов эксперимента, по программе общего курса математики.
Формат исходных статистических данных
Изучение статистических данных и принятие по ним решений ставит следующие задачи:
· Разработка способов сбора и группировки данных;
· Разработка методов обработки и анализа данных в зависимости от целей наблюдения;
Следовательно, формат представления статистических данных предполагает возможный метод обработки этих данных.В демонстрационных данных (см. таблицу ниже) исходный материал представлен в формате, удобным для вычисления ошибки воспроизводимости эксперимента и для выполнения дисперсионного анализа. В таком же формате представлены данные (см. п. 4) для выполнения контрольной работы (варианты заданий для студентов). В дальнейшем формат этих данных легко можно изменить для выполнения корреляционного анализа (см. п. 2.2), регрессионного анализа в линейном и нелинейном вариантах (см. п. 2.4 и 5 соответственно).
Таблица демонстрационного варианта данных:
Признаки объекта | Значения i- уровней факториального признака X | ||||||||
Результаты измерений В i -группах | 8,6 | 5,8 | 2,8 | 1,8 | 2,4 | 3,6 | |||
7,4 | 6,8 | 3,6 | 1,8 | 1,4 | 1,2 | 4,2 | |||
7,8 | 5,4 | 3,2 | 3,2 | 1,6 | 2,2 | 4,6 | |||
8,8 | 6,2 | 4,2 | 2,6 | 2,8 | 3,8 | 2,4 | |||
8,2 | 6,6 | 5,4 | 2,2 | 1,8 | 3,6 |
Для выполнения задания 6 (см. п. 2.6) данные представляются в «укороченном» формате: обрабатывается только отдельная пара подвыборок.