Статистические методы управления качеством
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ДИЗАЙНА И ТЕХНОЛОГИИ»
(ФГБОУ ВПО «МГУДТ»)
СТАТИСТИЧЕСКИЕ МЕТОДЫ УПРАВЛЕНИЯ КАЧЕСТВОМ
Методические указания
Учебно-методический комплекс
по направлению подготовки 270301Стандартизация и метрология
Составитель: Бесшапошникова В.И., проф., д. т. н.
Москва
МГУДТ 2015
УДК [67:001](075)
Б 53
Б 53 Статистические методы управления качеством : Методические указания /Сост. Бесшапошникова В. И. – М. : МГУДТ, 2015. - 73 с.
Рецензент: д.т.н., проф. Родэ С.В.. (ФГБОУ ВПО «МГУДТ»)
Методические указания предназначены для обучающихся по направлению подготовки 27.03.01 – Стандартизация и метрология всех форм обучения и будут использованы при изучении дисциплины «Статистические методы контроля и управления качеством».
Методические указания содержат 8 практических работ по 4 основным темам дисциплины. В каждой работе изложены краткие теоретические сведения, рассмотрены примеры и подготовлены задания для самостоятельной работы, дана методика и порядок проведения работы, в том числе с применением программного обеспечения ПК.
УДК [67:001](075)
Подготовлено к печати на кафедре «Материаловедение»
Печатается в авторской редакции
СОДЕРЖАНИЕ
Введение | Стр. |
Практическая работа №1. Статистические методы управления качеством в международных и российских стандартах | |
Практическая работа №2. Проверка статистических гипотез 2.1. Проверка гипотезы о равенстве дисперсий. Двухвыборочный F-TECT для дисперсий | |
2.2. Проверка гипотезы о равенстве средних. Двухвыборочный Z-TECT для средних | |
2.3. Проверка гипотезы о виде распределения по 𝜒2-критерию | |
Практическая работа №3.Факторный анализ. Дисперсионный анализ | |
3.1. Однофакторный дисперсионный анализ | |
3.2. Двухфакторный дисперсионный анализ | |
Практическая работа №4.Корреляционный и регрессионный анализ | |
4.1. Регрессионный анализ | |
4.2. Корреляционный анализ | |
Список литературы | |
Приложения |
ВВЕДЕНИЕ
Методические указания по выполнению практических работ предназначены для закрепления лекционного материала по дисциплине «Статистические методы контроля и управления качеством».
Практические работы выполняются с использованием компьютерной программы MS Excel, которая благодаря пошаговому выполнению заданий, позволяет студентам усваивать сущность статистических методов контроля и управления качеством. Электронные таблицы Excel – один из самых распространенных программных продуктов, используемых для решения прикладных задач в статистике, промышленности, экономике.
Для использования Excel при работе со статистическими методами в задачах управления качеством могут применяться как обычные средства, такие как вставка статистических функций, мастер диаграмм и другие, так и специальные, в частности надстройка «Пакет анализа». Совместное использование этих инструментов позволяет решать многие задачи управления качеством: строить и осуществлять анализ гистограмм, исследовать корреляции и проводить регрессионный анализ, оценивать воспроизводимость процесса и его статистическую управляемость.
Каждая работа должна выполняться на отдельном листе Excel. Каждый лист называть по номеру выполненного задания. Имя файла должно состоять из фамилии студента и номера группы. По каждой работе студент должен представить краткий отчет, содержащий название работы, распечатку результатов выполнения заданий и аналитические выводы. По вопросам, содержащимся в задании, студент должен подготовить устный ответ.
Практическая работа №1
Практическая работа №2
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
САМОСТОЯТЕЛЬНАЯ РАБОТА ПО ТЕМЕ 2.1
Задание 2.1. Исследуются результаты деталей кроя на двух раскройных столах. В качестве контролируемого параметра взяли длину плечевого среза. Предполагается, что раскроя одинакова, т.е. что дисперсии равны. Для проверки этой гипотезы проведены замеры 22 деталей на первом столе и 24 деталей на втором. Результаты представлены (табл.2.2). Уровень значимости α= 0,05.
Таблица 2.2. Результаты замеров деталей
результаты замеров | результаты замеров | ||||
№ п/п | стол 1 | стол 2 | № п/п | стол 1 | стол 2 |
12,26 | 12,56 | 12,26 | 12,68 | ||
12,29 | 12,66 | 12,29 | 12,62 | ||
12,54 | 12,69 | 12,54 | 12,71 | ||
12,55 | 12,77 | 12,26 | 12,55 | ||
12,95 | 12,84 | 12,28 | 12,66 | ||
12,52 | 12,46 | 12,52 | 12,45 | ||
12,33 | 12,75 | 12,55 | 12,96 | ||
12,25 | 12,56 | 12,63 | 12,53 | ||
12,29 | 12,75 | 12,63 | 12,65 | ||
12,54 | 12,54 | 12,33 | 12,62 | ||
12,30 | 13,06 | 12,59 | |||
13,05 | 12,63 | 12,75 |
Проверьте гипотезу о равенстве дисперсий расчетным методом и при помощи электронных таблиц Excel (пакет «Анализ данных» инструмент Двухвыборочный F-тест для дисперсий). Сделайте вывод по полученным результатам.
Задание 2.2. Исследуются результаты обработки деталей обуви на двух станках. Предполагается, что точность обработки одинакова, т.е. что дисперсии равны. Для проверки этой гипотезы проведены замеры 22 деталей на первом станке и 24 деталей на втором (табл. 2.3). Проверьте гипотезу о равенстве дисперсий расчетным методом и при помощи электронных таблиц Excel (пакет «Анализ данных» инструмент Двухвыборочный F-тест для дисперсий). Сделайте вывод по полученным результатам.
Таблица 2.3. Результаты замеров
результаты замеров | результаты замеров | ||||
№ п/п | станок 1 | станок 2 | № п/п | станок 1 | станок 2 |
10,06 | 10,36 | 10,06 | 10,48 | ||
10,09 | 10,46 | 10,09 | 10,42 | ||
10,34 | 10,49 | 10,34 | 10,51 | ||
10,35 | 10,57 | 10,06 | 10,35 | ||
10,75 | 10,64 | 10,08 | 10,46 | ||
10,32 | 10,26 | 10,32 | 10,25 | ||
10,13 | 10,55 | 10,35 | 10,56 | ||
10,05 | 10,36 | 10,43 | 10,33 | ||
10,09 | 10,55 | 10,43 | 10,45 | ||
10,34 | 10,34 | 10,13 | 10,42 | ||
10,10 | 10,86 | 10,39 | |||
10,85 | 10,43 | 10,25 |
САМОСТОЯТЕЛЬНАЯ РАБОТА ПО ТЕМЕ 2.2
Задание 2.3. Проверьте гипотезу о равенстве средних по данным таблицы 2.5 расчетным методом. Проверьте гипотезу о равенстве средних при помощи электронных таблиц Excel (пакет «Анализ данных»). Сделайте вывод по полученным результатам.
Таблица 2.5. Результаты замеров деталей
результаты замеров | результаты замеров | ||||
№ п/п | станок 1 | станок 2 | № п/п | станок 1 | станок 2 |
13,06 | 13,36 | 13,06 | 13,48 | ||
13,09 | 13,46 | 13,09 | 13,42 | ||
13,34 | 13,49 | 13,34 | 13,51 | ||
13,35 | 13,57 | 13,06 | 13,35 | ||
13,75 | 13,64 | 13,08 | 13,46 | ||
13,32 | 13,26 | 13,32 | 13,25 | ||
13,13 | 13,55 | 13,35 | 13,56 | ||
13,05 | 13,36 | 13,43 | 13,33 | ||
13,09 | 13,55 | 13,43 | 13,45 | ||
13,34 | 13,34 | 13,13 | 13,42 | ||
13,1 | 13,86 | 13,39 | |||
13,85 | 13,43 | 13,25 |
Задание 2.4 Проверьте гипотезу о равенстве средних по данным таблицы 2.6 расчетным методом.
Таблица 2.6. Результаты замеров
№ п/п | станок 1 | станок 2 | № п/п | станок 1 | станок 2 |
14,06 | 14,36 | 14,06 | 14,48 | ||
14,09 | 14,46 | 14,09 | 14,42 | ||
14,34 | 14,49 | 14,34 | 14,51 | ||
14,35 | 14,57 | 14,06 | 14,35 | ||
14,75 | 14,64 | 14,08 | 14,46 | ||
14,32 | 14,26 | 14,32 | 14,25 | ||
14,13 | 14,55 | 14,35 | 14,56 | ||
14,05 | 14,36 | 14,43 | 14,33 | ||
14,09 | 14,55 | 14,43 | 14,45 | ||
14,34 | 14,34 | 14,13 | 14,42 | ||
14,1 | 14,86 | 14,39 | |||
14,85 | 14,43 | 14,25 |
Проверьте гипотезу о равенстве средних при помощи электронных таблиц Excel (пакет «Анализ данных»). Сделайте вывод по полученным результатам.
2.3. ПРОВЕРКА ГИПОТЕЗЫ О ВИДЕ РАСПРЕДЕЛЕНИЯ ПО𝜒2-КРИТЕРИЮ
Если закон распределения генеральной совокупности не известен, то по выборке проверяется гипотеза о виде закона распределения при помощи критериев согласия. Одним из наиболее используемых критериев является критерий 𝜒2-критерий.
Согласно этому критерию, наблюдаемое эмпирическое распределение выборки, выраженное абсолютными и относительными частотами сгруппированного ряда, сравнивается с гипотетическим теоретическим распределением соответствующей генеральной совокупности. Для этого выдвигается нулевая гипотеза Н0, утверждающая, что признак генеральной совокупности имеет функцию распределения F(x), которая сопоставляется с выборочной функцией и, в зависимости от величины отклонения эмпирического распределения от теоретического, выдвинутая гипотеза принимается или отвергается.
При проверке статистических гипотез о виде закона распределения строится интервальный (табл. 2.8) или дискретный вариационный ряд (табл. 2.7), где рi — вероятность попадания случайной величины в данный интервал для непрерывной случайной величины т.е. вероятность того, что случайная величина приняла данное значение для дискретной случайной величины, определяется согласно выдвинутой гипотезе, п — объем выборки.
Таблица 2.7. Дискретный вариационный ряд
Варианты, хi | Х1 | Х2 | … | хi | … | Xj |
Частоты, mi. | m1 | т2 | … | mi | … | mj. |
Вероятность, pi | p1 | p2 | … | pi | … | pj |
npi | np1 | пр2 | … | npi | … | npj |
Таблица 2.8. Интервальный вариационный ряд
Интервалы | x1-x2 | x2-x3 | xi-1-xi | xj-xj+1 | |
Частоты, mi | m1 | т2 | … | mi | … |
Вероятность, pi | p1 | p2 | … | pi | … |
npi | np1 | пр2 | … | npi | … |
По данным вариационного ряда определяется опытное значение критерия:
(2.4)
число степеней свободы k = j-r- 1,
где j — число вариант (интервалов) вариационного ряда, r — число оцениваемых параметров распределения.
Определяется вероятность того, что случайная величина Y примет значение больше , т.е.
α = P(Y> ) = 1-F(y), (2.5)
где F(y) — функция распределения 𝜒2 которая определяется зависимостью:
.
По величине вероятности (2) принимается или отвергается выдвинутая гипотеза H0 о виде закона распределения случайной величины. Для принятия гипотезы используются стандартные вероятности αкр= 0,05; αкр = 0,10. При α > αкр гипотеза принимается, в противном случае гипотеза отвергается.
Пример 2.3. Задачи с дискретным вариационным рядом. Имеется нормально распределенная совокупность из 100 данных испытания ткани на гигроскопичность со средним значением 12% и стандартным отклонением 0,25. Сделайте случайную выборку 20 элементов из этой совокупности. Используя критерий 𝜒2 (хи-квадрат), проверьте, действительно ли выборка сделана из нормально распределенной генеральной совокупности.
В качестве точечных оценок математического ожидания и дисперсии примем соответствующие выборочные характеристики. Найдем их, используя инструменты пакета «Анализ данных».
Для этого в таблицу Excel в ячейки $А$2: $А$101 заносим данные генеральной совокупности, результаты испытаний. С помощью пакета Анализ данных и инструмента Выборкав ячейку В2 сделать выборку объемом 20 (табл. 2.9).
С помощью инструмента «Гистограмма» найдем опытные частоты m1.
В диалоговое окно входной интервал заносим исходные данные ячейки $А$2: $А$101, в интервал кармана заносим данные выборки $В$2: $В$21.
При использовании критерия ХИ-квадрат количество опытных значений в каждом интервале, т.е. частот, должно быть не менее пяти. Например, если в каком-то интервале их меньше, то интервалы объединяют, суммируя частоты, при этом значение берется как среднее арифметическое соответствующих им значений кармана.
С учетом данного условия перестроим таблицу частот вручную, и сформируем границы в ячейки Е2Е12, а соответствующие им опытные частоты mi в ячейки F2:F12.
Функция стандартного нормального распределения вычисляется с помощью встроенной статистической функции НОРМРАСП (х, среднее значение, стандартное отклонение, интегральный).
Таблица 2.9. Результаты вычислений
A | B | C | D | E | F | G | H | I | |
Результаты испы-таний, генсово-купнос-ти, ni | Выбор-ка | Границы Интерва-ла | Опыт-ные частоты mi | НОРМ-РАСП | Вероят-ности pi | Расчет-ные частоты npi | |||
12,50 | 12,03 | Кар-ман | Часто-та | ||||||
12,63 | 11,9 | 11,29 | 11,3 | 0,00255 | 0,00255 | 0,2555 | |||
11,9 | 11,32 | 11,32 | 11,69 | 0,10748 | 0,10493 | 10,49326 | |||
11,65 | 12,4 | 11,32 | 11,9 | 0,34457 | 0,23709 | 23,70906 | |||
11,81 | 12,5 | 11,69 | 12,09 | 0,64057 | 0,29599 | 29,59982 | |||
11,41 | 12,5 | 11,8 | 12,28 | 0,86864 | 0,22806 | 22,80667 | |||
11,69 | 11,69 | 11,9 | 12,4 | 0,94520 | 0,07655 | 7,655759 | |||
11,32 | 12,68 | 11,9 | 12,5 | 0,97725 | 0,03204 | 3,204916 | |||
11,54 | 11,32 | 12,03 | 12,63 | 0,99413 | 0,01688 | 1,688239 | |||
11,29 | 11,9 | 12,03 | 12,64 | 0,99476 | 0,00063 | 0,063413 | |||
12,68 | 12,5 | 12,03 | 12,68 | 0,99673 | 0,00197 | 0,196951 | |||
12,56 | 11,8 | 12,28 | итого | ||||||
12,32 | 12,03 | 12,4 | хи2тест | 0,001 | |||||
12,49 | 12,5 | 12,45 | хи2обр | 2,16735 | |||||
12,28 | 12,45 | 12,5 | |||||||
12,34 | 11,29 | 12,5 | |||||||
13,03 | 12,63 | 12,5 | |||||||
13,05 | 12,03 | 12,5 | |||||||
13,6 | 12,28 | 12,63 | |||||||
11,8 | 12,63 | 12,63 | |||||||
12,5 | 12,68 | ||||||||
13,2 | Еще | ||||||||
12,4 | итого | ||||||||
12,56 | |||||||||
12,6 | |||||||||
… | … |
Для этого выделить ячейку G3, и в диалоговое окно функции НОРМРАСП в поле Х вводим значения границ интервала, значение «интегральный» = 1 (истина), в поле «среднее значение» вводим 12 и «стандартное отклонение» 0,25 (из условий задачи). Если эти данные не заданы, то их можно получит с помощью инструмента «Описательная статистика» при этом входной интервал укажите $Е$3:$Е$12 и выходной $К$3.
В результате в ячейке G3 записывается формула (=НОРМ.РАСП(E3;12;0,25;1)) и значение нормального распределения. Потянуть за крестик до ячейки G12.
Вероятность pi- вычисляется как разность между значениями НОРМРАСП в последующей и предыдущей строках. Для этого в ячейку Н3 первое значение переносим без изменения, а далее результат вычисления.
Расчетные частоты npi вычисляем (в ячейки I3:I12) через вероятность попадания нормально распределенной величины в соответствующий интервал. Для этого значение вероятности умножаем на объем совокупности п. В нашем случае п=100.
Для вычисления статистики ХИ-квадрат в Excel встроена статистическая функция ХИ2ТЕСТ. В ячейку, например, Н14 записываем ХИ2ТЕСТ, в ячейке I14 ставим знак «=» и выбираем функцию ХИ2ТЕСТ, в открывшемся диалоговом окне в качестве «фактического интервала» вводятся опытные частоты (F3:F12), в качестве «ожидаемого» - расчетные частоты (I3:I12).
Граница критической области - квантиль распределения ХИ-квадрат может быть найдена с помощью встроенной статистической функции ХИ20БР. Аргумент «вероятность» - это уровень значимости (α = 0,05), а степени свободы k=j-r-1определяются как количество интервалов (в нашем случае k=10) за вычетом количества оцениваемых параметров (здесь - два: т и σ) минус единица, т.е.
k=10-2-1 =7
Гипотеза о нормальности распределения принимается, если выборочное значение статистики ХИ2ТЕСТ окажется меньше критического ХИ20БР.
Вывод.Учитывая, что выборочное значение статистики ХИ2ТЕСТ меньше критического ХИ20БР, т.е. 0,001 2,16735, то гипотеза о нормальности распределения выборки принимается.
САМОСТОЯТЕЛЬНАЯ РАБОТА ПО ТЕМЕ 2.3
Задание 2.5. Имеется нормально распределенная совокупность из 200 данных испытания партии костюмной ткани на прочность со средним значением 72 даН. Сделайте случайную выборку 20 элементов из этой совокупности. Используя критерий 𝜒2 (хи-квадрат), проверьте, действительно ли выборка сделана из нормально распределенной генеральной совокупности. Сделайте выводы по полученным данным.
Задание 2.6. Имеется нормально распределенная совокупность из 150 данных испытания партии шелковой ткани на усадку со средним значением 2,5% и стандартным отклонением 0,25. Сделайте случайную выборку 15 элементов из этой совокупности. Используя критерий 𝜒2 (хи-квадрат), проверьте, действительно ли выборка сделана из нормально распределенной генеральной совокупности. Сделайте выводы по полученным данным.
Пример 2.4. Задачи с интервальным вариационным рядом.
Используя критерий 𝜒2 при уровне значимости α = 0,05, необходимо проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с эмпирическим распределением выборки объема п=100 из этой генеральной совокупности. Выборка представлена интервальным рядом:
Интервал | 3-8 | 8-13 | 13-18 | 18-23 | 23-28 | 28-33 | 33-38 |
Частота, тi |
Решение.
1. Определяем статистические оценки параметров распределения по формулам и результаты заносим в таблицу 2.10:
2. Вычисляем вероятность попадания нормальной случайной величины с параметрами и в интервал, для этого используем функцию Лапласа, приняв х1 = - , хj = .
где
- функция Лапласа (см. таблицу «Значения функции Лапласа» приложения 2).
Составляем следующую расчетную таблицу 2.10:
Таблица 2.10. Статистические оценки параметров распределения
Интервал | 3-8 | 8-13 | 13-18 | 18-23 | 23-28 | 28-33 | 33-38 |
Рi | 0,0405 | 0,1045 | 0,2103 | 0,2687 | 0,2181 | 0,1124 | 0,0455 |
nPi | 4,05 | 10,45 | 21,03 | 26,87 | 21,81 | 11,24 | 4,55 |
3. Вычисляем опытное значение критерия:
13,46
и число степеней свободы k: = 7 - 2 - 1=4.
4. По таблице распределения 𝜒2 (см. таблицу распределения Пирсона (𝜒2-распределение), приложение 3) определяем вероятность (можно использовать рассмотренную функцию ХИ2РАСП, см. пример 2.3.):
α = Р(Y> ) = 0,036.
Так как α < αкр = 0,05, то гипотезу о нормальном распределении генеральной совокупности отвергаем.
Решим данный пример с использованием функции ХИ2ТЕСТ.
САМОСТОЯТЕЛЬНАЯ РАБОТА ПО ТЕМЕ 2.3
Задача 2.7. Проведено 100 опытов оценки качества 7 партий тканей. Используя критерий 𝜒2 при уровне значимости α = 0,05, необходимо проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с эмпирическим распределением выборки объема п=100 из этой генеральной совокупности. Выборка представлена интервальным рядом:
Интервал | 5-10 | 10-15 | 15-20 | 20-25 | 25-30 | 30-35 | 40-45 |
Частота, тi |
Сделайте выводы по полученным данным.
Задача 2.8. Проведено 200 опытов оценки качества 6 партий обуви. Используя критерий 𝜒2 при уровне значимости α = 0,05, необходимо проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с эмпирическим распределением выборки объема п=200 из этой генеральной совокупности. Выборка представлена интервальным рядом:
Интервал | 5-13 | 13-21 | 21-29 | 29-37 | 37-45 | 45-53 |
Частота, тi |
Сделайте выводы по полученным данным.
Практическая работа №3
ФАКТОРНЫЙ АНАЛИЗ.
ДИСПЕРСИОННЫЙ АНАЛИЗ
Дисперсионный анализ - это статистический метод анализа результатов наблюдений, зависящих от различных, одновременно действующих факторов, выбор наиболее важных факторов и оценка их влияния. В дисперсионном анализе исследуется влияние одного или нескольких качественных факторов на количественный результативный признак. Суть анализа заключается в разложении общей вариации случайной величины на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Этот метод находит применение в различных областях науки и техники.
Факторами обычно называют внешние условия, влияющие на изучаемый объект. Например: температура, давление, время, тип оборудования и т.п. Действие фактора на объект должно быть значительно и должно поддаваться проверке. Факторы могут варьировать, благодаря чему можно исследовать влияние контролируемого фактора на объект. При этом фактор варьирует на разных уровнях или имеет несколько уровней. В зависимости от количества факторов, включенных в анализ, различают: однофакторный, двухфакторный анализ и многофакторный анализ.
Для проведения дисперсионного анализа необходимо соблюдать следующие условия:
· результаты наблюдений должны быть независимыми случайными величинами,
· иметь нормальное распределение
· иметь одинаковую дисперсию.
Только в этом случае можно оценить значимость полученных оценок дисперсий и математических ожиданий и построить доверительные интервалы.
Решение.
В данном случае т = 4, п = 5. Среднюю арифметическую каждой строки вычисляем по формуле
Имеем: =(200+140+170+145+165)/5=164; =170; =202; = 164.
Найдем среднюю арифметическую всей совокупности:
Вычислим величины, необходимые для построения табл. 3.4:
· сумму квадратов отклонений между группами SS1, с k1=т –1=
=4-1=3 степенями свободы:
· сумму квадратов отклонений внутри группы SS2 с k2 = тп – т= =20-4=16 степенями свободы:
· полную сумму квадратов SS c k=mn-1=20-1=19 степенями свободы:
По найденным значениям оценим дисперсию, по формулам (табл. 3.2) составим (табл. 3.4) для рассматриваемого примера.
Таблица 3.4
Компоненты дисперсии | Суммы квадратов | Число степеней свободы | Оценка дисперсий |
Межгрупповая | 1660,0 | ||
Внутригрупповая | 454,4 | ||
Полная | 644,7 |
Проведем статистический анализ по критерию Фишера. Вычислим FB = =(4980• 1/3)/(7270 • 1/16) =1660/454,4= 3,65.
По таблице F-распределения (см. приложения) находим значение FKp при k2 = 16 и k1 = 3 степенях свободы и уровне значимости α = 0,01. Имеем FKp = 5,29.
Вычисленное значение FB меньше табличного, поэтому можно утверждать, что нулевая гипотеза не отвергается, а это значит, что различие между тканями в партиях не влияет на величину разрывной нагрузки.
В пакете Анализ данных инструмент Однофакторный дисперсионный анализ используется для проверки гипотезы о сходстве средних значений двух или более выборок, принадлежащих одной и той же генеральной совокупности. Рассмотрим работу пакета для проведения однофакторного дисперсионного анализа.
Решим пример 3.1, используя инструмент Однофакторный дисперсионный анализ.
САМОСТОЯТЕЛЬНАЯ РАБОТА ПО ТЕМЕ 3.1
Задание 3.1. Имеется пять партий обуви. Из каждой партии отобрано по пять образцов и проведены испытания на определение величины разрывной нагрузки кожи. Результаты испытаний приведены в табл. 3.6.
Таблица 3.6
Номер партии, т | Разрывная нагрузка, даН, п | ||||
Требуется выяснить, существенно ли влияние различных партий сырья на величину разрывной нагрузки обуви.
Задание 3.2. Имеется четыре партии детской одежды. Из каждой партии отобрано по пять образцов и проведены испытания на определение гигроскопичности. Результаты испытаний приведены в табл. 3.7.
Таблица 3.7
Номер партии, т | Гигроскопичность, %, п | ||||
16,5 | 13,8 | 14,5 | 16,8 | 17,2 | |
14,9 | 16,2 | 16,8 | 15,9 | 17,6 | |
15,5 | 15,6 | 16,5 | 16,1 | 17,8 | |
15,7 | 16,1 | 16,7 | 17,3 | 15,2 |
Требуется выяснить, существенно ли влияние различных партий сырья на величину гигроскопичности одежды.
Решение.
Пусть фактор А (А1 и А2) – влияние работы конструкторов, а фактор В (В1, В2, В3) влияние качества работы закройщиков. Имеем r = 2, t = 3, п = rv = 6.
В матрице наблюдений (табл. 3.10) нижняя строка содержит средние значения по столбцам, а в правом крайнем столбце приведены средние значения по строкам, т.е. по уровням факторов. Общее среднее = 4,5.
По формулам (табл. 3.9) вычислим суммы квадратов:
SS1 = 37,5; SS2 = 13; SS3 = 3; SS= 53,5.
Рассчитаем оценки дисперсий:
= 37,5/1 = 37,5; = 13/2 = 6,5; = 3/(1 ∙ 2) = 1,5;
σ2 = 53,5/(2∙3- 1) = 10,7.
Вычисляем Fa и FВ: FА = =37,5/1,5=25
и FВ = =6,5/1,5=4,3
Для уровня значимости α = 0,05 и к2 = 2, к1 = 1 степеней свободы по таблице F-распределения (см. приложения) находим значения Fкр: FкрА=18,51 и FкрВ=19,0
Сравнивая табличные значения с вычисленными, имеем:
Fa > FKрА; FB < FкрB.
Полученные результаты позволяют сделать следующие выводы:
1 - нулевая гипотеза о равенстве средних по строкам не подтверждается, т.е. влияние фактора А на исследуемый признак значимо;
2 - нулевая гипотеза о равенстве средних по столбцам не опровергается, т.е. влияние фактора В на исследуемый признак незначимо.
Выполним расчеты в программе Excel.
В пакете Анализ данных инструмент Двухфакторный дисперсионный анализ без повторений представляет собой двухфакторный анализ дисперсии, не включающий более одной выборки на группу. Используется для проверки гипотезы о том, что средние значения двух или нескольких выборок одинаковы (выборки принадлежат одной и той же генеральной совокупности)
САМОСТОЯТЕЛЬНАЯ РАБОТА ПО ТЕМЕ 3.2
Задание 3.3.В текстильном производстве выработана ткань на трех ткацких станках из пряжи двух поставщиков. Требуется выяснить, значимо ли влияние качества пряжи и настройки ткацких станков на качество готовой ткани, если разрывная нагрузка тканей составила (табл. 3.12). Сделайте выводы по результатам дисперсионного анализа.
Таблица 3.12. Разрывная нагрузка тканей
В1 | В2 | В3 | |
А1 | |||
А2 |
Задание 3.4.В швейном цеху по производству верхней одежды имеется по два пресса для дублирования деталей одежды клеевым прокладочным материалом, который поступает от трех разных поставщиков. Требуется выяснить, значимо ли влияние настройки прессов и качества прокладочных материалов на качество готовой одежды, если прочность при расслаивании клеевого соединения дублированных деталей составила (табл. 3.13). Сделайте выводы по результатам дисперсионного анализа.
Таблица 3.13. Прочность при расслаивании клеевого соединения
В1 | В2 | В3 | |
А1 | 7,5 | 9,3 | 10,1 |
А2 | 7,9 | 8,9 | 9,4 |
Сделайте выводы по результатам дисперсионного анализа.
Практическая работа №4
РЕГРЕССИОННЫЙ АНАЛИЗ
При построении уравнения регрессии сначала необходимо установить наличие статистически значимых связей между переменными и оценить степень их тесноты. Виды корреляционных связей между измеренными признаками могут быть линейными и нелинейными, положительными или отрицательными. Возможна также ситуация, когда между переменными невозможно установить какую- либо зависимость. В этом случае говорят об отсутствии корреляционной связи. С целью выявления характеристик корреляционных зависимостей применяют корреляционный анализ.В задачи корреляционного анализа входит:
§ установление направления (положительное или отрицательное) и формы (линейная или нелинейная) связи между варьирующими признаками,
§ измерение тесноты связи (значения коэффициентов корреляции),
§ проверка уровня значимости коэффициентов корреляции.
Затем с использованием регрессионного анализа переходят к математическому описанию данного вида зависимостей. С этой целью определяют вид функций, связывающий результативный показатель у и аргументы х1, х2,..., хк, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных коэффициентов уравнения регрессии и анализируют точность полученной математической модели.
Уравнением регрессии называется функция, описывающая зависимость среднего значения результативного признака у от заданных значений аргументов х, т.е.
у = f(х1, х2,..., хк,, β0, β1,..., βk.).
Зависимость результативного показателя (отклика системы) у от аргументов (факторов) х1, х2,..., хк описывается полиномом вида:
y= bo +b1x1 +b2x2+b3x3+…+ bixi + b11 + b22 + b33 + bij +…+ + b12x1х2 + b12x1х2+ b13x1х3+ b23x2х3+ b123x1х2 х3 +…+ bijxiхj +…
Данный полином называют регрессионной зависимостью (оценкой уравнения регрессии), а коэффициенты bi bii, bij - статистическими оцен