Средняя ошибка типической выборки
Лабораторная работа № 1
СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ
Орлов А.И., Русанова Г.В., Горчакова Л.С.
Исследование социально–экономических явлений предполагает сбор сведений – статистических данных.
Статистические данные - это совокупность количественных и качественных характеристик, полученных методом статистического наблюдения.
Статистическое наблюдение – это массовый, планомерный, научно организованный сбор и регистрация признаков единицы совокупности.
Целью данной лабораторной работы является сбор и анализ данных об одном из протекающих в студенческой жизни социально-экономических процессов.
Объект и единицу наблюдения исследователь определяет самостоятельно, исходя из выбранной темы исследования, а основные признаки единицы наблюдения - исходя из собственных представлений или поставленной задачи (уровень успеваемости, место проживания, состоятельность...). Если выбор признаков вызывает затруднение, возможно проведение пилотажного исследования.
Отчетной единицей в данной лабораторной работе является один опросный лист.
Общий отчет по лабораторной работе должен содержать:
- дерево целей;
- программу наблюдения;
- формуляр наблюдения (опросный лист);
- организационный план;
- сводку результатов;
- анализ полученных результатов;
- предложения по улучшению сложившейся ситуации, если есть недовольства опрошенных;
- анализ собственных допущенных ошибок.
Этап 1. Составление дерева целей, программы наблюдения и формуляра.
Дерево целей
Для более ясного видения всех задач и осознания цели статистического исследования и, в частности, наблюдения, составляется так называемое Дерево целей, используя метод направленного графа.
Во главе дерева целей располагается Ваша главная цель исследования («Изучение организации …», «Изучение отношения …» и т.п.).
Затем, на уровень ниже, располагаются основные направления изучения процесса, т.е. направления, по которым задаются вопросы в Программе наблюдения. Одним из направлений этого уровня, как правило, является категория «Личные данные» (т.к. при анкетировании необходимо определить некоторые признаки личности отвечающего, дабы затем при формировании результатов исследования установить степень влияния того или иного признака на результат).
Данные направления подразделяются на тезисы – пункты, по которым задавались вопросы. Для направления «Личные данные» такими тезисами могут быть: Пол, Возраст, Специальность и др.
Удобно дерево целей отображать в виде разветвленной структуры. Инструментом для этого может являться встроенный элемент MsWord – Организационная диаграмма.
Для MsOffice 2003 она располагается в меню Вставка – Организационная диаграмма.
В отчет по лабораторной работе №1 такое дерево целей необходимо включить отдельным листом. Зачастую ориентированность листа удобно делать Альбомной (Файл –> Параметры страницы –> Ориентация: Альбомная). Пример – см. Приложение 1.
Программа наблюдения.
Программа наблюдения – это перечень признаков (вопросов), подлежащих регистрации.
Чтобы правильно составить программу наблюдения необходимо использовать метод направленного графа. Для этого основную цель наблюдения (0-ой уровень) детализируют по составу входящих в неё задач, так появляется 1-ый уровень на-
правленного графа. Каждую задачу 1-ого уровня детализируют по составу подзадач - это 2-ой уровень и т.д. Процесс прекращается, когда по подзадаче опрашиваемому можно будет задать однозначный, четкий, вопрос, и получить такой же ответ. Этот вопрос и будет в последствии помещен в опросный лист (формуляр).
Этот метод позволяет определить состав и структуру подлежащей сбору информации.
Итак, в нашем случае ПРОГРАММА НАБЛЮДЕНИЯ – ЭТО ПЕРЕЧЕНЬ ВОПРОСОВ, которые вы намерены задать опрашиваемым для последующего достижения поставленной цели.
Данный перечень вопросов затем помещается в формуляр, или бланк анкеты статистического исследования. Порядок вопросов и оформление описаны в разделе Формуляр наблюдения (опросный лист).
Формуляр наблюдения.
(опросный лист, анкета)
Статистический формуляр - это документ единого образца, содержащий программу и результаты наблюдения.
В формуляр наблюдения необходимо включить:
1. Титульную часть - это наименование документа (опросный лист, анкета...). Цель проведения наблюдения и номер.
2. Адресную часть - кто проводит наблюдение (например, подгруппа № 3, группы ИБМ 1- 41).
3. Инструкцию по заполнению формуляра (например, « поставьте « ... » в поле выбранного ответа »). Инструкция начинается с обращения. Обращение является важной частью анкеты, так как оно создает первую коммуникацию между интервьюером и респондентом, настраивает на определённое отношение к заполняемому документу (внимание, заинтересованность, интригу ...), создает положительную мотивацию. Завершается обращение благодарностью за сотрудничество выражением надежды на искренность и полноту ответа.
4. Если для проведения анализа исследователю необходимо сгруппировать респондентов по некоторому признаку (успеваемость, место жительства...), то необходимо начинать формуляр с поля, где респонденты поместят сведения о себе.
5. Начинать вопросы необходимо с простых и доступных, постепенно усложняя. Если вопросов много (> 30), то необходимо включать так называемые разгрузочные вопросы, для снятия напряжения.
6. Возможно включение контрольных и фильтрующих вопросов, которые позволят определить степень компетентности или внимания опрашиваемого. Обычно в таких вопросах содержится противоречие или неточность.
Формулировка вопросов сложная и трудоёмкая работа, требующая специальных знаний в данном вопросе, статистике, социологии и определенных литературных способностей. Механически копировать существующие анкеты нельзя, это должна быть творческая задача.
Вопросы необходимо ранжировать по сложности и важности. Если это затруднительно, то возможно проведение пилотажного исследования.
Пилотажное исследование - это пробный опрос на ограниченной выборке, с целью проверки инструментария. В пилотажное исследование обычно включаются открытые вопросы (т. е. такие, на которые респонденты могут ответить любым способом).
Если будет проводиться групповой опрос, то необходимо либо создать один формуляр, содержащий только вопросы, а ответы респонденты будут помещать в свой собственный бланк, в соответствии с номером вопроса, либо формуляр с вопросами и большое поле для регистрации ответов. Респонденты будут голосовать, а помощник статистика будет регистрировать ответы.
При индивидуальном опросе - формуляр содержит слева вопросы, а справа размеченное поле ответа.
Категории вопросов:
A. Открытые (неструктуированные) - на которые ответ может быть представлен в любой форме. Открытые вопросы используются в тех случаях, когда трудно заранее определить группы возможных ответов (структурировать). Проблема открытых вопросов состоит в сложности последующей группировки ответов, на которую может повлиять мнение исследователя.
B. Закрытые (структурированные) вопросы - это такие, в которых респондент только выбирает ответ из нескольких заранее заданных.
Приём | Варианты ответов | ||||
Альтернативный вопрос | · Да | · Нет | |||
Вопрос с выборочным ответом | · Ответ 1 | · Ответ 2 | .... | ..... | · Ответ N |
С использованием шкалы Лайкерта | · Решительно не согласен | · Не согласен | · Не могу сказать | · Согласен | · Решительно согласен |
С использованием шкалы важности | · Исключительно важно | · Очень важно | · Довольно важно | · Не очень важно | · Не важно |
С использованием оценочной шкалы | · 1 | · 2 | · 3 | · 4 | · 5 |
C. Семантический дифференциал. Выбираются биполярные понятия, которые связываются оценочной шкалой. Респондент должен по каждому критерию (записанному в системе биполярных понятий) оценить своё отношение по пятибальной шкале. Это наиболее сложный и. в тоже время, мощный приём анкетирования. Он обладает наибольшей сводимостью результатов. При расчете результативного признака можно применять весь аппарат средних величин. При составлении сводки наглядно видна плотность распределения ответов.
Далее представлен семантический дифференциал признака “ Качество аудиторий “
« Оцените качество аудиторий, в которых Вы занимаетесь»
Освещение: слабое яркое
Проветриваемость: душно оптимальное
Температура: холодно жарко
Слышимость: плохая хорошая
Видимость: плохая хорошая
Доска: маленькая большая
Покрытие доски: хорошее плохое
Мебель: удобная неудобная
Плотность посадки: высокая просторно
В формуляр должны быть помещены все вопросы, касающиеся параметров последнего уровня направленного графа (уровня подзадач). Не рекомендуется использовать при составлении формуляра много различных приёмов анкетирования. Это осложнит в последствии составление сводки и сопоставимость результатов по различным приёмам. По возможности необходимо вопросы группировать по используемому приёму. Это облегчит заполнение анкеты респонденту.
Организационный план исследования.
Перед проведением наблюдения необходимо четко себе представить, увязать во времени и распределить между участниками все этапы работ. Лабораторная работа проводится группой студентов в 2-3 человека. Затраты времени после распределения работ между участниками должны быть равными.
Существует два способа наблюдения:
- групповой;
- индивидуальный.
При групповом способе наблюдения интервьюер собирает респондентов в определённое время в аудитории и зачитывает им вопросы из формуляра. Респонденты отмечают у себя в бланках ответы, в соответствии с номером вопроса. Затем бланки собираются и обрабатываются.
При индивидуальном способе наблюдения респондентам раздаются формуляры наблюдения, а после заполнения собираются,
В Приложении 2 приведены экспертные оценки трудоемкости этапов работ, в зависимости от выбранного способа.
Если возможно одновременное (параллельное) выполнение работ несколькими исполнителями, то продолжительность этапа сократится до tэт.
где:
Т эт. - трудоемкость этапа, чел.-час. ( см. Приложение 2 )
Р раб. - количество одновременно работающих исполнителей , чел.
К пар. - средний коэффициент параллельности выполнения работ по стадии.
0.5 £ К пар. £ 1
К пар. =1 - если работы независимы друг от друга.
Общая трудоёмкость исследования:
к
t сум. =å t эт. i
i=1
На основе полученных данных составляется план–график проведения работ (см. Приложение 3).
Кроме план–графика проведения работ, организационный план должен содержать описание всех этапов работ.
Проведение наблюдения.
В силу ограниченности времени на проведение лабораторной работы, охватить наблюдением необходимо не всю генеральную совокупность (в данном случае поток), а только её часть - выборочную совокупность (выборку). Способ выборки - бесповторный, индивидуальный или групповой.
Индивидуальный способ выборки означает, что обследуется только одна единица наблюдения.
Групповой - что обследуются все без исключения единицы заданной группы.
Бесповторный способ означает, что респондент может заполнять анкету только один раз, больше в выборную совокупность он не должен попадать.
Выбор способа наблюдения повлияет на способ вычисления ошибки выборки.
В данной лабораторной работе применимы следующие виды выборки.
А. Собственно-случайная выборка.
В этом случае единицы наблюдения отбираются из совокупности наудачу, бессистемно. Тогда средняя ошибка выборки насчитывается
где:
n - число респондентов;
N - число студентов в генеральной совокупности (потоке).
s - дисперсия отклонений значения признака (напр., уровня успеваемости студентов)
Вычисляется:
Пример
Средний Балл | 5,0 – 4,5 | 4,5 –4,0 | 4,0 – 3,5 | 3,5 –3,0 |
Число студентов |
В потоке - 110 человек.
Рассчитаем дисперсию табличным методом.
F | X | x | x*f | X*f | ( x - x` ) |
4,75 | 22,56 | 135,38 | 28,5 | 0,65 | |
4,25 | 18,06 | 72,25 | 17,0 | 0,15 | |
3,75 | 12,25 | 61,25 | 18,75 | -0,35 | |
3,25 | 10,56 | 31,69 | 9,75 | -0,85 | |
Итого: | 300,55 | 73,75 |
`x =4,1
`s = 4,08
балла
Таким образом, при анализе зависимости уровня организации учебного процесса и уровня успеваемости студента возможна средняя ошибка в 0.118 балла.
В. Типический отбор.
Для этого респондентов необходимо разделить на типические группы по выбранному признаку (уровень успеваемости, кафедра, удалённость места жительства), а затем случайным образом из каждой группы отбирать респондентов. Количество представителей каждой типической группы, попавших в выборочную совокупность, должно соответствовать структуре генеральной совокупности (потока).
где:
ni - количество представителей типической группы;
Ni - объём i -ой группы генеральной совокупности.
Средняя ошибка типической выборки
где:
-средняя из внутригрупповых дисперсий;
к -количество типических групп.
xi -значение выбранного признака;
fi - частота появления значения признака;
x-среднее значение признака, равное:
С. Серийный отбор.
В этом случае случайным образом выбирается серия (в данном случае, студенческая группа), а затем исследуется все без исключения единицы серии (студенты группы).
Этап 2. Составление сводки данных, анализ данных.
Сводка данных.
Собранные данные необходимо обобщить и систематизировать, т.е. получить сводную характеристику объекта исследования - сводку.
Простая сводка представляет собой подсчет общих итогов и структуры полученных данных.
Сложная группировка предполагает группировку единиц наблюдения и подсчёт итогов по каждой группе. В качестве основания группировки по подлежащему можно выбрать группы вопросов по 1-му уровню направленного графа, а по сказуемому - группировку по выбранному ранее признаку (уровень успеваемости, кафедра...).
Результаты наблюдения заносятся в статистическую таблицу, которая является статистическим предложением, подлежащее которого размещается слева (наименование строк) - это группы вопросов 1-ого уровня направленного графа, а сказуемое размещается справа (формирует верхние заголовки) - это количественная характеристика ответов респондентов.
Таблица бывает:
- простой, тогда в качестве подлежащего выступает простой перечень вопросов;
- групповой, если проводится группировка вопросов;
- комбинационной, если группировка проводится по 2-м признакам (подлежащему и сказуемому).
В зависимости от выбранного приёма опроса, результирующий признак может быть вычислен следуюшим образом:
А. Если данные были получены с помощью оценочной шкалы или семантического дифференциала, то вычисляется средний балл по вопросу по формуле
и процент появления данного значения признака
где:
- значение признака (балл);
- частота появления признака;
В. Если в приёме использованы атрибутивные признаки («важно», «согласен» .... ) то вычисляется только процентное отношение.