Многомерные статистические методы
Многомерные статистические методы используют при работе с большими массивами данных. Наиболее распространенными из них являются – факторный и кластерный анализ.
Факторный анализ – статистический метод, основная задача которого состоит в уменьшении числа переменных (так называемой редукции данных) и выявлении структуры взаимосвязей между переменными. Идея факторного анализа состоит в выявлении общих скрытых (латентных) факторов, которые объединяют в себе несколько взаимосвязанных друг с другом признаков. Наиболее часто факторный анализ применяют при использовании семантического дифференциала, многомерных личностных опросников и т.д.
Каждая переменная, образующая тот или иной фактор, имеет факторную нагрузку, определяющую удельный вес данной переменной в формировании фактора. Так как факторный анализ основан на корреляции признаков (точнее коэффициентов корреляции Пирсона) минимальный уровень факторной нагрузки, значимой для формирования фактора равен 0,3. Однако, как правило, при анализе данных берутся в расчет только переменные с факторными нагрузками от 0,7 и выше по модулю.
В сущности, фактор представляет собой искусственный конструкт, на основе группировки переменных, образующих значимые корреляционные связи между собой. Такое образование может быть условным, поскольку изменив процедуру факторизации, уменьшив или увеличив количество переменных, мы можем получить другое количество факторов с новыми переменными и другими факторными нагрузками. В силу этого выводы в результате факторного анализа имеют значение только для конкретного исследования конкретной группы испытуемых.
Кластерный анализ позволяет исследователю разделить выборку на ряд групп, классов, типов или кластеров. Предполагается, что элементы, принадлежащие одному кластеру, более схожи между собой по каким-либо признакам, чем элементы, включенные в другие кластеры. Существуют иерархические и итеративные методы кластерного анализа.
Суть иерархических методов заключается в выстраивании так называемого «дерева» кластеров, где исследователь может проследить «историю» формирования окончательных кластеров, путем постепенного объединения или разделения первоначально существовавших кластеров.
Итеративные методы предполагают выделение кластеров путем первоначального разделения с последовательным приближением или итерацией признаков. Наиболее распространенным итеративным методом является метод К-средних.
Данный метод основан на том, что исследователь первоначально выделяет некоторое количество «кластеров-эталонов», к которым последовательно присоединяются все остальные переменные.
При применении кластерного анализа также стоит помнить о том, что его результаты носят эвристический характер и под влиянием новых переменных или условий результаты кластеризации могут быть другими. В таком случае исследователю требуется использование дополнительных методов проверки данных и решение вопроса о целесообразности выделения того или иного количества кластеров.
Более подробную информацию о многомерных статистических методах можно найти в следующей литературе: [2, 12, 15].
Независимо от вида применяемых статистических методов, всегда следует помнить о том, что данные методы являются инструментом обработки данных, полученных в ходе исследования и должны соответствовать цели и задачам курсовой/дипломной работы.
4.3.3. Правила оформления таблиц и рисунков
Курсовая и дипломная работы могут быть иллюстрированы таблицами и рисунками.
В настоящее время для иллюстрации научной работы можно использовать следующие графические и текстовые редакторы Word, Excel, PowerPoint, Paint, SPSS и др.
Оформление таблиц
В научной работе следует придерживаться общепринятых правил оформления таблиц.
· В состав таблицы входят: порядковый номер и тематический заголовок (название); боковая часть (перечень параметров, размещаемых по горизонтали); головная часть (заголовки вертикальных граф); сами горизонтальные и вертикальные графы (см. Рис. 2).
Таблица 1 | Порядковый номер | ||||
Наиболее предпочитаемые ценности | Тематический заголовок | ||||
Боковая часть | Заголовки граф | ||||
Ценность | Студенты | Учителя | Головная часть | ||
М | δ | М | δ | ||
Защита семьи | 5.67 | 1.11 | 6.00 | 1.03 | Основная часть (горизонтальные графы) |
Здоровье | 5.51 | 1.53 | 6.01 | 1.03 | |
Настоящая дружба | 5.50 | 1.11 | 5.12 | 1.16 | |
Смысл жизни | 5.48 | 1.53 | 5.31 | 1.42 | |
Интеллект | 5.26 | 1.15 | 5.31 | 1.42 | |
Основная часть (вертикальные графы) |
Рис. 2. Элементы таблицы
Примечание: М - средние значения, δ - стандартное отклонение
· Каждая таблица, содержащаяся в работе, нумеруется. При этом необходимо использовать сквозную нумерацию, при которой производится нумерация таблиц в рамках работы в целом. Если таблицы вынесены в работе в приложения, то нумерация их начинается вновь.
· Порядковый номер размещается в верхнем правом углу над таблицей и состоит из слова «Таблица» и ее порядкового номера арабскими цифрами, знак «№» не ставится.
· Если в основной части курсовой работы присутствует только одна таблица, то номер ей не присваивают и слово «Таблица» не пишут.
· Каждая таблица должна иметь название, которое помещается над таблицей, располагается посредине страницы и пишется с прописной буквы без точки на конце. Сокращения в заголовках не допускаются. Правильно сформулированный заголовок должен отражать показатель, находящийся на пересечении горизонтальных строк и вертикальных граф.
· Заголовок каждой графы в головной части таблицы должен быть по возможности кратким, пишется с прописной буквы без сокращений, в именительном падеже единственного числа, в конце ни точка, ни запятая не ставятся. Нужно следить за тем, чтобы заголовки отдельных граф не повторяли общего заглавия таблицы или его частей.
· Боковая часть таблицы, определяющая содержание строк, также должна быть лаконичной, записывается в именительном падеже единственного числа, и начинается с прописной буквы без точки в конце.
· Одни и те же данные не рекомендуется представлять и в форме таблиц, и в форме рисунков.
· В одной научной работе не должно быть двух одинаковых таблиц.
· Однотипные близко расположенные по тексту таблицы лучше объединять в одну.
· По общему правилу таблицы не разрываются. Если на странице осталось мало места, то следует продолжать текст, а таблицу перенести на следующую страницу. Разрешено разрывать таблицы лишь в том случае, если они не помещаются на целой странице. Если таблица не умещается на стандартном листе бумаги, ее можно давать с продолжением на следующей странице, для этого в таблицу вставляется дополнительная строка с цифровым обозначением столбцов, расположенных под ее головной частью, далее на следующей странице пишется «Продолжение таблицы (ее номер)» и повторяется строка с нумерацией столбцов. Название таблицы на новой странице не повторяется.
· В графах таблицы нельзя оставлять свободные места. Если данные отсутствуют, то рекомендуется ставить прочерк.
· Нумеровать графы (вводить в крайнее левое положение в боковой части графу с заголовком «№ п/п») и строки рекомендуется лишь в случае, если в тексте при обсуждении результатов необходимо ссылаться на определенные номера граф или строк.
· Примечание к таблице, в котором указывают поясняющие сведения, помещают под таблицей. Рекомендуется давать примечание шрифтом меньшего размера.
· При комментировании в тексте содержания таблицы следует обращать внимание читателя лишь на самое главное, не пересказывая подробно содержание всей таблицы.
· В ссылках в тексте слово «таблица» приводят в сокращенном виде. Например: «В табл. 6 приведены….», «Характеристики (табл. 5) отличаются…».
· В случае повторных ссылок в тексте к ссылке необходимо добавить общепринятое сокращение от слова «смотри» - «см.». Например: «(см. табл. 5)».
· При заимствовании таблицы из чужой работы необходимо указывать автора и делать библиографическую ссылку.
В табличном виде удобно представлять в работе результаты статистической обработки эмпирических данных. Существует несколько допустимых вариантов представления полученных значений математических коэффициентов и их уровней значимости: в самой таблице (табл. 6) или в примечании к таблице (табл. 7).
Пример 1:
Таблица 5
Значимость различий самоотношения у подростков-олигофренов
и подростков-нормотипов
Компоненты самоотношения | Подростки-олигофрены | Подростки-нормотипы | Значения U-критерия Манна-Уитни | Уровень значимости различий (р) |
Глобальное самоотношение | 1435,5 | 0,012 | ||
Самоуважение | 0,046 | |||
Самоинтересы | 1152,5 | 0,000 | ||
Самоуверенность | 1523,5 | 0,035 |
Пример 2:
Таблица 6
Взаимосвязь социально-психологических аттитюдов и удовлетворённости браком в супружеских парах с разным стажем семейной жизни (r-критерий Пирсона)
Аттитюды | Стаж семейной жизни | ||
1-5 лет | 6-10 лет | 11-18 лет | |
К людям | -0,391* | 0,063 | 0,000 |
К детям | -0,014 | 0,417** | 0,289 |
К разводу | -0,167 | 0,202 | -0,618** |
К любви | 0,375* | 0,623** | 0,060 |
К интимным отношениям | 0,370* | 0,577** | 0,191 |
К деньгам | -0,226 | -0,186 | -0,199 |
Примечание: * - взаимосвязь значима при р≤0,05, ** - взаимосвязь значима при р≤0,01.
Оформление рисунков
В научной работе следует придерживаться также общепринятых правил оформления рисунков.
· Структурными элементами рисунка являются: его изображение в виде схемы, графика и т.п., наименование, порядковый номер, тематический заголовок рисунка.
· Наименование – это условное сокращенное название, отображаемое с помощью сокращения от слова «рисунок» - «Рис.». Независимо от вида все иллюстрации в ссылках по тексту и в подписях к ним обозначают словом «Рис.». Нумерация должна быть сквозной, причем номер указывается арабскими цифрами без знака «№». После цифрового отображения номера рисунка точка ставится во всех случаях, например, Рис. 1., Рис. 2.
· Тематический заголовок рисунка содержит информацию о том, что на нем изображено. Он должен быть предельно кратким, точным и ясным. В конце названия рисунка точка не ставится. Заголовок принято размещать под рисунком.
· Все рисунки выполняются в черно-белом варианте, использовать цветную печать не рекомендуется.
· Рисунки следует располагать в работе сразу после их первого упоминания в тексте – непосредственно после него либо на следующей странице, свободной от текстового материала (в зависимости от формата рисунка).
· Текстовое описание рисунка должно следовать либо сразу после его первого упоминания в тексте, либо непосредственно вслед за рисунком.
· Количество поясняющих надписей на самом рисунке должно быть ограниченным.
· Однотипные подрисуночные подписи должны быть оформлены одинаково во всей научной работе.
· Ссылки на рисунок в тексте даются в той его части, где описывается этот рисунок или какие-то его фрагменты. Ссылка содержит порядковый номер, под которым рисунок помещен в тексте работы.
· Ссылка может быть оформлена в виде заключенного в скобки выражения, например, (рис. 4); либо введена в текст через специальное пояснение, например, «Как видно из рис. 4...», «Из рис. 4 следует, что ...». При повторных ссылках используется сокращение «см.»: (см. рис. 4).
· В научной работе не должно быть двух одинаковых рисунков.
· Примечание к рисунку, в котором указывают поясняющие сведения, помещают под названием рисунка. Рекомендуется давать примечание шрифтом меньшего размера.
· При заимствовании рисунка из чужой работы необходимо указывать автора и делать библиографическую ссылку.
В курсовой и дипломной работах наиболее частыми видами рисунков являются диаграммы (линейные, столбиковые и круговые), графики, профили, корреляционные кольца и корреляционные плеяды.
Диаграммыиспользуются главным образом для изображения соотношения между величинами. Это способ графического изображения величин при помощи фигур (секторов, столбцов, конусов и т.п.), площади которых пропорциональны этим величинам (рис. 2).
Пример столбиковой диаграммы:
Рис. 2. Удовлетворенность различными составляющими труда у штатных и внештатных сотрудников организации
Секторная или круговая диаграмма – это диаграмма, которой числа (обычно в %) изображены в виде круговых секторов, имеющих определенные площади.
Пример секторной (круговой) диаграммы:
Рис. 3 Соотношение различных типов мотивации профессиональной деятельности у сотрудников организации
Примечание:
1 – внутренняя мотивация;
2 – внешняя положительная мотивация;
3 – внешняя отрицательная мотивация.
Пример лепестковой диаграммы:
Рис. 4. Соотношение реальных и предпочитаемых типов организационной культуры предприятия
Примечание:
реальный тип организационных культур предприятия;
----- предпочитаемый тип организационных культур предприятия;
А – клановый тип организационной культуры;
B – адхократический тип организационной культуры;
C – рыночный тип организационной культуры;
D – иерархический тип организационной культуры.
Графикиявляются одним из видов диаграмм, однако их следует использовать, когда необходимо отобразить общий характер функциональной зависимости. График и представляют собой декартову систему координат. По оси абсцисс в изображенном масштабе откладываются независимые переменные, на оси ординат значения зависимой переменной. Вершины ординат соединяются отрезками, в результате чего получается ломаная линия.
Оси координат вычерчиваются сплошными линиями. На концах координатных осей стрелки не проставляются. Иногда графики снабжаются координатной сеткой, соответствующей масштабу шкал по оси абсцисс и ординат. Допускается при вычерчивании графиков вместо сетки по осям короткими рисками наносить масштаб.
По осям координат должны быть указаны условные обозначения и размерности откладываемых величин с общепринятыми сокращениями. Надписи, относящиеся к кривым и точкам, оставляют только в тех случаях, когда их немного и они являются краткими. Многословные надписи заменяют цифрами, а расшифровку приводят в подрисуночной подписи.
Если кривая, изображенная на графике, занимает небольшое пространство, то для экономии места числовые деления на осях координат можно начинать не с нуля, а ограничиваться теми значениями, в пределах которых рассматриваются данные зависимости.
Примеры рисунков с использованием графиков:
Рис. 5. Показатели агрессивности у лиц в ремиссии, наркозависимых и здоровых
Рис 6. Влияние типа организационной культуры на внутреннюю мотивацию персонала.
Профилииспользуются для представления результатов диагностики с использованием многопараметрических (многокомпонентных) тестов или тестовых наборов. Онипозволяют в наглядной форме представить индивидуальные и усредненные оценки по тестам или по факторам. В профиле информативными являются форма распределения, вариативность, средний уровень. Обычно профиль образует ломаная линия, соединяющая отметки значений по отдельным шкалам методики.
Пример рисунка с использованием профиля:
Рис. 7. Профиль личности подростков с низким уровнем агрессивности
Результаты корреляционного анализа можно представить в виде «корреляционного кольца». Для этого по периметру круга делают отметки, рядом с которыми пишут номера признаков. Эти отметки соединяют затем линиями. Вид линий кодирует характер корреляционной связи. Например: положительные связи могут быть изображены сплошными линиями, отрицательные - прерывистыми. Связи достоверные на 5%-ном уровне значимости (при р ≤ 0,05) - одной линией (более тонкой линией). На боле 1%-ном уровнях значимости (при р ≤ 0,01) — большим числом линий (более толстой линией). Используемые обозначения должны быть объяснены в тексте под рисунком.
Признаки лучше располагать группами, объединенными по какому-либо критерию. Если записываются номера, то они должны быть расшифрованы в примечании к рисунку.
Корреляционные плеяды являются формой графического отображения корреляционных связей между параметрами, включенными в корреляционный анализ. Параметры изображаются кружками. Внутри них проставляются номера признаков или сокращенно записывается название признаков. В центре корреляционной плеяды обычно размещают либо наиболее важный параметр, либо тот, у которого наибольшее число значимых коэффициентов корреляции.
Пример рисунка с использованием корреляционной плеяды:
Рис 8. Корреляционная плеяда выбора респондентами профессионально-значимых качеств личности