Тема 3. Проведение социологического опроса
Тема 1. Разработка структуры выполнения НИР и определение направлений исследования
Цель – изучение основных этапов проведения научно- исследовательских работ
План работы:
1. Определение проблемы и основных задач исследований
2. Определение основных направлений для решения поставленных задач и их краткая характеристика
3. Выбор наиболее перспективного направления и обоснование этого выбора
Методические указания
1. Изучить общую структуру исследовательской работы (приложение А), определить проблему и основные задачи для ее решения.
2. Выявить основные направления для решения поставленных задач, дать их краткую характеристику и определить значимость в решении проблемы.
3. Обосновать выбранные направления и ознакомиться с предлагаемой тематикой исследовательских работ (приложение Б)
4. Определить план теоретических исследований и обосновать необходимость проведения эксперимента
Тема 2. Разработка плана – программы эксперимента. Планирование
Объема выборки
Цель – изучение основных этапов проведения эксперимента
План работы:
1. Определение цели и основных задач эксперимента
2. Выбор объекта исследования, предмета исследования и основных критериев его оценки (выходного параметра);
3. Определение входных параметров эксперимента и условий их варьирования.
4. Планирование объема выборки при нормальном законе распределения случайных величин
Методические указания
1. Определение цели и основных задач эксперимента
Эксперимент является наиболее важной составной частью исследовательской работы, а необходимость его проведения должна быть доказана в теоретической части работы. Эксперимент – научно поставленный опыт, вообще опыт (проба) отличается от обычного пассивного наблюдения активным воздействием на изучаемое явление.
ОСНОВНАЯ ЦЕЛЬ – проверка теоретических положений (подтверждение научной гипотезы), а также более полное и глубокое изучение темы научного исследования.
2. Выбор объекта исследования, предмета исследования и основных критериев его оценки (выходного параметра)
После определения целей и задач эксперимента выбирается объект исследования и выходной параметр (параметр оптимизации). Одной из наиболее распространенных научно-технических задач является поиск оптимальных условий (выбор оптимальных режимов обработки, оптимальных конструктивных решений, повышение производительности труда, повышение качества продукции, снижение затрат и т.п.) Эксперимент, который ставится для решения задач оптимизации называется экстремальным (т.е. связан с поиском экстремума некоторой функции).
При правильном выборе объекта исследования следует соблюдать 2 условия:
1) воспроизводимость результатов (возможность при повторном воздействии факторов, имеющих постоянное значение через неравные промежутки времени получать значения параметра объекта с разбросом, не превышающим некоторой заранее заданной величины – наших требований к точности эксперимента);
2) объект должен быть управляемым, а эксперимент – активным ( т.е. предполагается активное вмешательство в процесс и возможность выбора в каждом опыте тех уровней факторов, которые представляют интерес).
Предмет исследования - существенные свойства или отношения объекта исследования, познание которых важно для решения теоретических или практических проблем.
Предмет исследования определяет границы изучения объекта в конкретном исследовании.
Если предполагать, что планирование эксперимента базируется на кибернетических представлениях об объекте исследований, то в качестве наиболее подходящей модели объекта исследований рекомендуется выбирать так называемый «черный ящик». Принципы построения такой модели обычно соответствует априорным представлениям экспериментатора об объекте исследования при решении в условиях неполного знания механизма явлений сложных многофакторных задач и используется обычно в задачах оптимизации.
Z1 Z2 Z3 Zp
¯ ¯ ¯ ¼¯
X1® Объект ®Y1
X2® исследо- ®Y2
¼ вания ¼
Xn® ®Yi
¼
W1 W2 … Wm
Входы характеризуют все способы возможного воздействия (входные параметры): X1-Xn - управляемые параметры (или факторы), Z1-Zp - контролируемые параметры (можно измерить в процессе исследования, но не изменяют целенаправленно, обычно возможность воздействия на них отсутствует), W1-Wm - возмущающие неконтролируемые параметры, недоступные для измерения, значения которых изменяются во времени случайным образом. Y1-Yi – выходной параметр (или параметр оптимизации).
Y = F (Xi, Zi, Wi) (1)
Требования к параметру оптимизации:
1) должен задаваться числом, т.е. иметь количественную оценку (области его определения могут быть непрерывными и дискретными, ограниченными и неограниченными). Если нет способа количественного измерения, то используют ранговый подход (ранжирование). При этом параметрам присваивают оценки- ранги по заранее выбранной шкале (например, пятибальной). Ранговый параметр имеет дискретную ограниченную область определения (в простейшем случае область содержит 2 значения: да, нет; хорошо, плохо). Ранг – это количественная оценка, которая носит субъективный характер и соответствует некоторому количественному признаку;
2) должен выражаться одним числом;
3) должен быть однозначным и эффективным в статистическом смысле, т.е. заданному набору значений факторов должна соответствовать одно значение параметра оптимизации (с точностью до ошибки);
4) должен быть универсальным и полным (т.е. способным всесторонне характеризовать объект);
5) должен иметь физический смысл, быть простым и по возможности легко вычисляемым.
3. Зная объект (предмет) исследования и параметры его оценки необходимо определить входные параметры, т.е. все параметры, которые могут повлиять на результат. Эти параметры необходимо разделить на 3 группы (управляемые, контролируемые и возмущающие). При этом следует помнить, что каждый воздействующий параметр можно отнести только к одной группе (либо Вы им управляете, либо можете проконтролировать, либо не можете заранее предвидеть степень его действия).
Фактор – управляемая независимая переменная, соответствующая одному из возможных способов воздействия на объект исследования. Фактор считается заданным, если указаны его название и область определения. В выбранной области определения он может иметь несколько значений, которые соответствуют числу его различных состояний. Выбранные для эксперимента количественные и качественные состояния фактора носят названия уровней фактора.
В процессе выбора факторов рекомендуется учитывать ряд требований. В качестве факторов целесообразно выбирать такие независимые переменные, которые:
1) соответствуют одному из разумных воздействий на объект исследования;
2) могут быть измерены имеющимися средствами с достаточно высокой гарантированной точностью;
3) являются управляемыми и однозначными;
4) совместимы один с другим;
5) не связаны между собой линейными корреляционными связями.
Желательно, чтобы факторы оценивались количественно, хотя возможна и качественная характеристика. При этом надо оценить границы областей определения факторов. Ограничения бывают нескольких типов: 1-ый тип – принципиальные ограничения, которые не могут быть нарушены ни при каких обстоятельствах ( например, нижним пределом температуры будет абсолютный нуль); 2-ой тип – ограничения, связанные с технико-экономическими соображениями ( например, стоимость сырья, время обработки и т.п.); 3-ий тип – ограничения, связанные с конкретными условиями проведения процесса (например, с технологией, с организацией производства).
Если изменяется (варьируется ) один фактор, то эксперимент является однофакторным; если несколько – многофакторным.
4. Планирование объема выборки
Для статистической оценки параметра необходимо знать закон распределения случайных значений определяемого параметра. Обычно этот закон уже известен. Если закон распределения не известен, то он устанавливается в поисковом эксперименте.
На первичном уровне исследований можно считать закон распределения случайных величин нормальным. Этот закон возникает тогда, когда отклонения вызываются множеством малозначащих причин, среди которых нет доминирующих. Для нормального закона распределения действует соотношение
n = t2s2/ d2, (2)
где n – объем выборки;
t – параметр, которому соответствует значение функции Лапласа Ф(t) = g/2; параметр t можно определить по таблице [4] в зависимости от заданной вероятности (надежности) оценки g (при g=0,95 t=1,96; g=0,9 t=1,65; g=0,.85 t=1,44; g=0,8 t=1,29);
d- точность (погрешность) измерений, задается в пределах 0,01-0,10.
Для инженерных расчетов допускается принимать g=0,8, а d=0,10;
s- среднее квадратичное отклонение (либо уже известно, либо находится в результате поискового эксперимента).
Задано: П – прочность ниточного соединения
П,н | 20,5 | 20,3 | 20,8 | 20,5 | 20,6 | 20,9 | 20,5 | 20,7 | 20,8 | 20,4 |
Номер замера | ||||||||||
П,н | 20.5 | 20,3 | 20,6 | 20,7 | 20,9 | 20,4 | 20,7 | 20,5 | 20,8 | 20,2 |
Номер замера |
_ П1 + П2 + П3 +…Пn 20,5+20,3+….
П ( среднее значение) = ¾¾¾¾¾¾¾¾ = ¾¾¾¾¾¾- = ?
N _ 20
Математическое ожидание прочностиМП » П, т.к. в другом эксперименте оно может быть другим
МП » П – точечная оценка, или числовая характеристика математического ожидания прочности, полученного по данной выборке.
Находим отличие экспериментальных данных от полученного среднего значения прочности (П).
- П – П | ||||||||
Номер замера | ….. |
Чтобы получить абсолютную величину отклонения можно либо откинуть знак, либо, как принято в теории вероятностей, возвести в квадрат ( т.к. при простом откидывании знака функция хуже обрабатывается математически, т.е. сложнее делать выводы и обоснование).
- (П – П)2 | ||||||||
Номер замера | ….. |
Снова считаем среднее значение от чисел возведенных в квадрат
-
∑ (П-П)2
ДП (дисперсия) = ¾¾¾¾¾¾¾¾¾¾¾¾ » ? > 0
(ДП =0 – если все значения одинаковые)
sП=ÖDп= ? – стандартное среднеквадратичное отклонение
Пример расчета: если s=0,47. g=0,8 (t=1,29), d=0,1, то n=1,292х0,462/0,102=28, т.е. следует сделать 28 повторов измерений при одних и тех же условиях.
Так при 3-х факторном 4-х уровневом эксперименте потребуется
N = 64 опыта х 28 повторов = 1792 измерения
Варианты задания представлены в таблице 2.
Таблица 2 – Данные для расчета объема выборки при нормальном законе распределения
№ варианта | n – объем выборки | d - погрешность (точность) | g- вероятность (надежность) | s- среднее квадратичное отклонение |
0,10 | 0,80 | 0,22 | ||
0,07 | 0,80 | 0,22 | ||
0,05 | 0,80 | 0,22 | ||
0,03 | 0,80 | 0,22 | ||
0,01 | 0,80 | 0,22 | ||
0,10 | 0,85 | 0,22 | ||
0,07 | 0,85 | 0,22 | ||
0,05 | 0,85 | 0,22 | ||
0,03 | 0,85 | 0,22 | ||
0,01 | 0,85 | 0,22 | ||
0,10 | 0,90 | 0,22 | ||
0,07 | 0,90 | 0,22 | ||
0,05 | 0,90 | 0,22 | ||
0,03 | 0,90 | 0,22 | ||
0,01 | 0,90 | 0,22 | ||
0,10 | 0,95 | 0,22 | ||
0,07 | 0,95 | 0,22 | ||
0,05 | 0,95 | 0,22 | ||
0,03 | 0,95 | 0,22 | ||
0,01 | 0,95 | 0,22 |
Тема 3. Проведение социологического опроса
Цель – изучение методологии проведения анкетного опроса
План работы:
1. Определение необходимого количества респондентов
2. Сведение данных в удобные формы записи
3. Оценка точности и надежности измерений
4. Графическая обработка результатов
5. Математическая обработка результатов
Методические указания
1. Если в эксперименте используется метод анкетирования, где ответ задан «да» или «нет», то для подсчета необходимого количества анкет рекомендуется использовать формулу Бернулли (действует, когда событие либо появляется, либо нет)
n = t2рq / d2, (3)
где n- количество анкет;
t- параметр, зависящий от заданной g;
р- вероятность данного события (если неизвестна, то проводится пробная выборка)
р = m/n, (4)
где m- наибольшее количество, ответивших «да» (или «нет»), например, р=7/10=0.7;
q- параметр, q=1-р.
Пример расчета: если g= 0.8 (t= 1.29), d= 0.10, р= 0.5, то
n=1.292х0.5х0.5/0.102=41.6, т.е. в данном случае необходимо получить результаты 42 анкет.
2. Для проведения пробной выборки необходимо составить примерную анкету и определить статус респондентов. Пример анкеты представлен в приложении В.
Полученные данные сводятся в общую таблицу и если количество анкет меньше расчетного, то определяется точность (d) полученных результатов по каждому вопросу.
Сводная таблица результатов социологического опроса (расчет d проводится при выбранной g)
Вопрос | Вариант ответа | Респонденты (общее кол-во=n) | m | р | q | d | ||||||||||
… | n | |||||||||||||||
1……. | а | + | + | + | + | + | ||||||||||
б | + | + | + | + | ||||||||||||
в | + | + | + | + | + | + | ||||||||||
г | + | + | ||||||||||||||
2……. | а | + | + | + | + | + | ||||||||||
б | + | + | + | + | + | |||||||||||
…….. |
3. Оценка точности и надежности измерений
Если в экспериментальной части работы планирование объема выборки не проводилось, то в этом разделе, на основе формул (1) и (2) можно оценить точность и надежность проведенных исследований.
d = ts / Ön (5)
d = tÖрq /Ön (6)
где d - точность оценки;
t - параметр, зависящий от заданной надежности g (g=0.8-0.99);
s- среднее квадратичное отклонение;
n - объем выборки (число измерений, анкет и т.п.);
р - вероятность события;
q – параметр формулы Бернулли (q=1-р).
Используя формулы (1) и (2) можно подобным образом найти надежность оценки (g) при заданной точности d (d=0.01-0.10).
4. Графическая обработка результатов
Наиболее наглядной является графическая обработка результатов. Графики, как правило, представляются в прямоугольной системе координат с использованием равномерных и неравномерных координатных сеток. Результаты могут быть представлены в виде диаграмм, монограмм и т.д. Основным требованием к графическим изображениям является их наглядность, т.е. представление о сущности исследуемого явления, выявление характера функциональных зависимостей, установление наличия экстремума функций. При этом особое внимание уделяется правильности обозначения осей координат, точности нанесения значений и виду кривых. Кривые, полученные на графиках, рекомендуется обрабатывать методами аппроксимации.
5. Обработка результатов методами математического анализа
В зависимости от целей и задач исследований, а так же от полученных данных для обработки результатов могут быть использованы различные виды математического анализа (корреляционный, регрессионный, дисперсионный и т.п.). При этом корреляционный анализ рекомендуется использовать для установления парной зависимости между параметрами (факторами), регрессионный – при исследовании закономерностей между явлениями, которые зависят от многих неизвестных факторов, дисперсионный – для оптимизации технологических процессов.