Графическое представление данных
Федеральное государственное бюджетное общеобразовательное учреждение высшего профессионального образования «Московская государственная академия ветеринарной медицины и биотехнологии им. К.И.Скрябина».
Ветеринарно-биологический факультет
Расчетно-графическая работа по математической статистике
на тему:
«Статистический анализ вариационных рядов распределения настрига шерсти овец и длины
Волоса шерсти»
Выполнила:
студентка 2 курса ВБФ 2 группы
Прозорова М.С.
Проверила:
старший преподаватель каф. ИиМ
__________________Т.В.Федькина
Москва, 2011
I. Интервальные ряды распределения настрига и длины волоса шерсти.
1. Интервальный ряд распределения по длине волоса шерсти.
Минимальное значение – 11,9 см;
Максимальное значение – 24,4 см;
Размах вариации – 10,7 см; г = Xmax-Xmin;
Число групп вариаций – 6; k=1+3,322 lg n,
Длина интервала – 2,1см; d=r/k
Таблица 2
интервальный ряд распределения длины волоса шерсти | |||||
номер интервала | группа овец по длине волоса шерсти | число овец | середина интервала | накопленная частота | |
нижняя граница | верхняя граница | fi | X'i | fi' | |
11,9 | 12,95 | ||||
16,1 | 15,05 | ||||
16,1 | 18,2 | 17,15 | |||
18,2 | 20,3 | 19,25 | |||
20,3 | 22,4 | 21,35 | |||
22,4 | 24,5 | 23,45 | |||
итого |
Интервальный ряд распределения настрига шерсти.
Минимальное значение – 3,9 кг;
Максимальное значение – 5,5 кг;
Размах вариации – 1,6 кг; г = Xmax-Xmin;
Число групп вариаций – 6; k=1+3,322 lg n,
Длина интервала – 0,3; d=r/k
Таблица 3
интервальный ряд распределения настрига шерсти | |||||
номер интервала | группа овец по настригу шерсти | число овец fi | середина интервала | накопленная частота | |
нижняя граница | верхняя граница | Y'i | fi' | ||
3,9 | 4,2 | 4,05 | |||
4,2 | 4,5 | 4,35 | |||
4,5 | 4,8 | 4,65 | |||
4,8 | 5,1 | 4,95 | |||
5,1 | 5,4 | 5,25 | |||
5,4 | 5,7 | 5,55 | |||
итого |
Графическое представление данных.
Рис.1 Гистограмма интервального ряда распределения по настригу шерсти,кг.
Рис.2 Полигон интервального распределения по настригу шерсти,кг.
Рис.3 Кумулята интервального распределения по настригу шерсти,кг.
Рис.4 Гистограмма интервального ряда распределения длины волоса шерсти,см.
Рис.5 Полигон интервального ряда распределения длины волоса шерсти,см.
Рис.6 Кумулята интервального ряда распределения длины волоса шерсти,см.
II. Средние величины. Выборочные показатели вариации и показатели распределения.
Таблица 4
Показатели | Настриг шерсти | Длина волоса |
Среднее арифметическое | 4,704 | 18,532 |
Дисперсия | 0,149984 | 10,23898 |
Среднее квадратичное отклонение | 0,395264 | 3,265823 |
Коэффициент вариации | 8,402713 | 17,62262 |
Асимметрия | 0,104145 | -0,27233 |
Эксцесс | -0,28878 | -0,69014 |
Мода | 4,65 | 20,65 |
Медиана | 4,63 | 19,075 |
III. Ошибки выборочной средней. Доверительный интервал.
1. Абсолютная ошибка выборочной средней (̅хв)
=0,652
2. Предельная ошибка выборочной средней (̅хв)
,где t=2,06 2,1 при =95%
3. Доверительный интервал для генеральной средней.
Доверительный интервал для генеральной средней длины волоса шерсти, см: (18,532-1,37; 18,532+1,37)
(17,169; 19,9)
Это доверительный интервал ,который с вероятностью 95% содержит неизвестную среднюю длину волоса шерсти всей генеральной совокупности.
Доверительный интервал для генерального среднего настрига шерсти, кг:
(4,704-0,166; 4,704+0,166)
(4,538; 4,87)
Это доверительный интервал , который с вероятностью 95% содержит неизвестный средний настриг шерсти всей генеральной совокупности.
IV. Соответствие рядов распределения настрига и длины волоса шерсти нормальному закону распределения.
Проверка гипотезы Н0 :
Для признака Х: признак «длина волоса шерсти» распределен по нормальному закону (a=0,05).
Для признака У: признак «настриг шерсти» распределен по нормальному закону ((a=0,05).
Для проверки гипотезы Н0 выберем критерий согласия Пирсона - c2
Табличное значение для c2 =7,815 (для R=3;a=0,05)
Для признака Х:
Таблица 5.
Средняя арифметическая | 18,532 |
Среднее квадратичное отклонение | 3,2658 |
Уровень значимости | 0,05 |
Степени свободы вариации | |
Фактический уровень значимости | 0,481158969 |
Фактическое значение хи-квадрат | 4,490474245 |
Табличное значение хи-квадрат | 11,07049775 |
c2 фактическое=4,49
Вывод: c2 фактическое<c2 теоретическое – следовательно нет оснований отвергнуть нулевую гипотезу, т.е. признак «длина волоса шерсти» распределен по нормальному закону (a=0,05).
Для признака У:
Таблица 6.
Средняя арифметическая | 4,704 |
Среднее квадратичное отклонение | 0,395 |
Уровень значимости | 0,05 |
Степени свободы вариации | |
Фактический уровень значимости | 0,328607501 |
Фактическое значение хи-квадрат | 5,776207974 |
Табличное значение хи-квадрат | 11,07049775 |
c2 фактическое=5,78
Вывод: c2 фактическое<c2 теоретическое – следовательно нет оснований отвергнуть нулевую гипотезу, т.е. признак «настриг шерсти» распределен по нормальному закону (a=0,05).
Графическое представление данных:
Рис. 7 Полигон распределения длины волоса шерсти.
Рис.8. Полигон распределения настрига шерсти.
V. Дисперсионный анализ.
Проверка гипотезы Н0: длина волоса шерсти не влияет на вариацию настрига.
Таблица 7.
Настриг шерсти овец | |||||||||
Длина волоса шерсти | Номер овцы | ||||||||
11,9 | 4,2 | 3,9 | 4,2 | ||||||
16,1 | 4,2 | 4,5 | 4,4 | 4,3 | |||||
16,1 | 18,2 | 4,5 | 4,8 | 4,7 | |||||
18,2 | 20,3 | 4,7 | 4,8 | 4,6 | 4,6 | 4,7 | |||
20,3 | 22,4 | 4,8 | 5,1 | 4,9 | 5,2 | 5,1 | 4,5 | 5,1 | 4,9 |
22,4 | 24,5 | 5,4 | 5,5 |
Дисперсионный анализ | ||||||
Источник вариации | SS | df | MS | F | P-Значение | F критическое |
Между группами | 3,199933 | 0,639987 | 22,1220376 | 2,56218E-07 | 2,740057541 | |
Внутри групп | 0,549667 | 0,02893 | ||||
Итого | 3,7496 |
S2межгр.=3,2
S2внутригр.=0,55
S2общ.=3,75
h2 – доля влияния фактора (длины волоса шерсти) на изучаемый признак (настриг шерсти).
h2= =85%
Fнабл.=22,1 Fкр.=2,74
Вывод: F>Fкр., следовательно, длина волоса шерсти влияет на настриг шерсти, т.е. предположение о том, что длина волоса не влияет на вариацию настрига не имеет места.
VI. Регрессия. Уравнение линии регрессии. Коэффициент корреляции.
Корреляция – используется для установления зависимости между исследуемыми признаками.
R (или r) – коэффициент корреляции. Устанавливает есть ли связь между признаками и насколько она тесная.
-1£R£1
Если же модуль коэффициента корреляции ~1,то связь близка к линейной.
Коэффициент регрессии rу/х входит в формулу уравнения регрессии.
Таблица 8.
Регрессионная статистика | |
Множественный R | 0,877540876 |
R-квадрат | 0,770077989 |
Нормированный R-квадрат | 0,76008138 |
Стандартная ошибка | 0,193606006 |
Наблюдения |
Таблица 9.
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 2,887484429 | 2,887484429 | 77,03391994 | 8,4375E-09 | |
Остаток | 0,862115571 | 0,037483286 | |||
Итого | 3,7496 |
Таблица 10.
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
Y-пересечение | 2,73573373 | 0,227573729 | 12,02130727 | 2,13329E-11 | 2,264961605 | 3,206505854 | 2,264961605 | 3,206505854 |
Длина волоса шерсти, см (x) | 0,106209058 | 0,01210098 | 8,776896942 | 8,4375E-09 | 0,081176273 | 0,131241844 | 0,081176273 | 0,131241844 |
R=0,876
Вывод: связь между признаками тесная и близка к линейной.
R2 (коэффициент детерминации) =0,77=77%
Вывод: значит вариация настрига шерсти обусловлена влиянием длины волоса шерсти на 77%. Остальные 23% вариации настрига обусловлены неучтенными факторами.
Для того, чтобы составить уравнение регрессии необходимо найти B(У – пересечение) и .
Y-пересечение | 2,7 |
Длина волоса шерсти, см (x) | 0,106 |
Тогда уравнение регрессии будет иметь вид:
Вывод: При увеличении длины волоса шерсти на 1 см настриг шерсти в среднем увеличивается на 106 грамм.