Унификация порядковых признаков в номинальную шкалу
КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ В БИОМЕТРИИ
Рабочая тетрадь
МОСКВА 2014
Компьютерные технологии в биометрии: Рабочая тетрадь / А.В.Исачкин, В.А.Крючкова. М.: Изд-во РГАУ – МСХА, 2014, 105 c/
В рабочей тетради изложен учебный материал для практических занятий по курсу «Компьютерные технологии в биометрии».
Предназначено для магистров факультета садоводства и ландшафтной архитектуры.
Рекомендовано к изданию учебно-методической комиссией факультета садоводства и ландшафтной архитектуры (протокол № ___ от __.___. 2014 г..)
© Исачкин А.В., Крючкова В.А.,
составители, 2014
© ФГБОУ ВПО РГАУ – МСХА
имени К.А.Тимирязева, 2014
АННОТАЦИЯ
Дисциплина «Компьютерные технологии в биометрии» - одна из обязательных учебных дисциплин профессионального цикла в системе подготовки магистров по направлению 110500.68 «Садоводство». Дисциплина имеет теоретическую и практико-ориентированную направленность. При реализации знаний и умений, полученных в результате изучения дисциплины «Компьютерные технологии в биометрии» в профессиональной практической деятельности магистр должен:
- уметь унифицировать исходные эмпирические данные для проведения многомерного статистического анализа;
- уметь выделять и анализировать корреляционные плеяды признаков;
- уметь проводить многофакторный дисперсионный анализ и корректно интерпретировать его результаты;
- уметь проводить таксономический анализ объектов по комплексу признаков.
Общая трудоемкость дисциплины составляет 3 зачетных единицы (108 часов), в том числе, аудиторных занятий: 48 часов (лекций 8 часов, практических занятий406 часов); самостоятельная работа – 56 часов.
Дисциплина «Компьютерные технологии в биометрии» состоит из четырех взаимосвязанных разделов:
· раздел № 1 «Унификация признаков» (2 часа лекции, 8 час. практические занятия)
· раздел № 2 «Корреляционные плеяды признаков» (2 часа лекции, 8 часов практические занятия)
· раздел № 3 «Многофакторный дисперсионный анализ» (2 часа лекции, 14 час практические занятия)
· раздел №4 «Таксономический анализ» (2 часа, 10 час практические занятия)
Промежуточный контроль: экзамен.
ОГЛАВЛЕНИЕ
Раздел 1. УНИФИКАЦИЯ ПРИЗНАКОВ..5
Практическое занятие 1. Унификация признаков в номинальную шкалу. 5
Практическое занятие 2. Унификация признаков в порядковую шкалу. 10
Раздел 2. КОРРЕЛЯЦИОННЫЕ ПЛЕЯДЫ ПРИЗНАКОВ.. 17
Практическое занятие 3. Построение коррелограмм. 17
Практическое занятие 4. Метод максимального корреляционного пути. 20
Практическое занятие 5. Анализ корреляционных плеяд. 23
Раздел 3. МНОГОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ. 26
Практическое занятие 6. Двухфакторный дисперсионный анализ. 26
Практическое занятие 7. Трехфакторный дисперсионный анализ. 39
Практическое занятие 8. Иерархический дисперсионный анализ. 49
Раздел 4. ТАКСОНОМИЧЕСКИЙ АНАЛИЗ. 63
Практическое занятие 9. Нумерическая таксономия. 63
Практическое занятие 10. Таксономический анализ Смирнова. 75
Статистические таблицы.. 89
Рекомендуемая литература. 105
Раздел 1. УНИФИКАЦИЯ ПРИЗНАКОВ (8 часов)
Практическое занятие 1. УНИФИКАЦИЯ ПРИЗНАКОВ В НОМИНАЛЬНУЮ ШКАЛУ (4 часа)
Исходная матрица данных
Изучали 30 образцов алычи по 10 признакам. Получены следующие результаты:
№ образца | Форма листовой пластинки | Форма основания листовой пластинки | Окраска листа | Опушение листа снизу | Поражение морозами (балл) | Дата начала цветения | Диаметр цветка, мм | Окраска кожицы плода | Масса плода, г | Вкус, балл |
№ | ||||||||||
ов. | окр. | зел. | сильн. | 05.05 | желт. | 3,8 | ||||
ов.яйц. | конич. | т.зел. | отсут. | 07.05 | красн. | 3,9 | ||||
ов.обр.яйц. | конич. | зел. | отсут. | 03.05 | зел. | 3,5 | ||||
узк.яйц. | окр.конич. | зел. | слаб. | 06.05 | зел. | 4,3 | ||||
ов. | окр. | антоц. | слаб. | 10.05 | красн. | 3,7 | ||||
узк.ов. | окр.конич. | т.зел. | слаб. | 13.05 | оранж. | 3,5 | ||||
ов. | конич. | т.зел. | средн. | 01.05 | красн. | 4,4 | ||||
узк.обр.яйц. | окр.конич. | зел. | средн. | 04.05 | желт. | 4,1 | ||||
шир.ов. | окр. | зел. | слаб. | 04.05 | оранж. | 3,9 | ||||
ов.яйц. | окр. | зел. | слаб. | 12.05 | красн. | 4,2 | ||||
ов. | окр.конич. | зел. | средн. | 29.04. | зел. | 3,1 | ||||
ов. | окр.конич. | т.зел. | отсут. | 30.04. | желт. | 3,2 | ||||
узк.ов. | окр.конич. | зел. | слаб. | 04.05 | желт. | 3,7 | ||||
шир.яйц. | окр. | зел. | сильн. | 06.05. | желт. | 4,0 | ||||
ов. | окр.конич. | т.зел. | средн. | 06.05. | желт. | 3,9 | ||||
узк.ов. | конич. | зел. | средн. | 02.05. | красн. | 3,2 | ||||
ов. | окр.конич. | антоц. | отсут. | 08.05. | красн. | 3,7 | ||||
ов.обр.яйц. | окр.конич. | зел. | слаб. | 30.04. | красн. | 4,3 | ||||
ов.яйц. | окр. | т.зел. | слаб. | 02.05. | желт. | 3,9 | ||||
узк.яйц. | окр.конич. | зел. | средн. | 07.05. | красн. | 3,2 | ||||
ов. | конич. | зел. | слаб. | 05.05. | оранж. | 3,3 | ||||
узк.ов. | окр.конич. | антоц. | слаб. | 11.05 | желт. | 3,5 | ||||
шир.обр.яйц. | окр.конич. | зел. | слаб. | 15.05. | оранж. | 3,0 | ||||
шир.ов. | окр. | т.зел. | средн. | 10.05 | красн. | 3,8 | ||||
узк.яйц. | окр.конич. | зел. | средн. | 06.05. | красн. | 4,1 | ||||
узк.яйц. | окр.конич. | зел. | средн. | 06.05 | желт. | 3,8 | ||||
ов. | окр. | зел. | отсут. | 04.06 | желт. | 3,5 | ||||
узк.ов | окр.конич. | т.зел. | слаб. | 03.05. | желт. | 3,4 | ||||
ов. | конич. | т.зел. | средн. | 03.05. | красн. | 3,2 | ||||
ов.яйц. | окр. | антоц. | слаб. | 01.05. | красн. | 3,9 | ||||
шкала |
Унификация порядковых признаков в номинальную шкалу
2.1. Модификация исходных данных
признак «опушение листовой пластинки снизу» | |||
Исходные данные | Модифицированные данные | ||
степень опушения | частота встречаемости | степень опушения | частота встречаемости |
отсутствует | |||
слабое | |||
среднее | |||
сильное | |||
признак «поражение морозами, балл» | |||
Исходные данные | Модифицированные данные | ||
балл | частота встречаемости | балл | частота встречаемости |
признак «вкус плодов, балл» | |||
мин значение = макс. значение = lim = число классов = межклассовый интервал = | |||
Модифицированные данные | |||
балл | частота встречаемости | ||
3. Унификация интервальных признаков в номинальную шкалу
3.1. Модификация исходных данных
признак «дата начала цветения» | |
мин значение = макс. значение = lim = число классов = межклассовый интервал = | |
Модифицированные данные | |
дата начала цветения | частота встречаемости |
признак «диаметр венчика цветка, мм» | |
мин значение = макс. значение = lim = 27-15 = число классов = межклассовый интервал = | |
Модифицированные данные | |
диаметр венчика цветка | частота встречаемости |
признак «масса плода, г» | |
мин значение = макс. значение = lim = 43-15 = число классов = межклассовый интервал = | |
Модифицированные данные | |
масса плода | частота встречаемости |