Формулы для определения численности простой случайной выборки
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«Калининградский государственный технический университет»
Кубина Наталья Ефимовна,
к.э.н.,доцент
С Т А Т И С Т И К А
Методические указания с контрольными заданиями для студентов заочной формы обучения направлений подготовки: 080100.62 «Экономика»; 080200.62 «Менеджмент», 100700,62 «Торговое дело» и специальностей: 080507.65 «Менеджмент организации»; 080301.65 «Коммерция(Торговое дело)»: 080502.65 «Экономика и управление на предприятии (в АПК)»;080502.65 «Экономика и управление на предприятии (в пищевой промышленности)»; 080105.65 «Финансы и кредит»; 080109.65 «Бухгалтерский учет, анализ и аудит»
Калининград
УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ КОНТРОЛЬНОЙ РАБОТЫ
Каждый вариант контрольной работы включает 7 задач по наиболее важным разделам курса. Их выполнение предполагает изучение студентами основных теоретических положений курса "Общая теория статистики".
Вариант контрольной работы определяется в зависимости от начальной буквы фамилии студента. Номера задач, включаемых в каждый вариант, приводятся в таблице 1.
Контрольную работу необходимо представить на проверку в электронном виде и сдать после этого на кафедру УАА, в ауд. 221 М.
Таблица I.
Начальная буква Номер Номера задач
фамилии варианта
А,Д,М,Щ,Ю 1
Б,Л,Ш,У,С 2
Г,Н,0,Р,Т 3
И,Х,Ф,Ц,Х 4
Е,Ж,П,Ч К 5
В,3,Э,Я 6
3, 10, 14, 25, 33, 37 40
1, | 3, | 16, | 13, | 29, | ||
4, | 13, | 23, | 28, | |||
2, | 15, | |||||
6, | 9, | 17, | 20, | 24, | 30, |
5, 12, 18, 21, 26, 32, 38
Методические указания по выполнению задач.
Задачи 1-6 составлены по двум темам: "Группировка и сводка" и "Средние величины". Для их решения необходимо понять смысл аналитической группировки. Из двух приведенных в условии задачи признаков один рассматривается как фактор, положенный в основание группировки, а второй - как результативный признак. Выделите группы по значению признака-фактора, определив число групп и величину интервала в них.
При решении вопроса о количестве групп нужно принимать во внимание количество единиц наблюдения и размах вариации. В предлагаемых задачах рекомендуется образовать 3-4 группы с равными интервалами. Величина, интервала в этом случае определяется по формуле:
где xmax , xmin - соответственно наибольшее и наименьшее значения признака в изучаемой совокупности;
m — принятое число групп.
Для расчета величины интервала по этой формуле необходимо заранее установить число групп (при числе наблюдений более 200 используют 10 — 15 групп).
Возможен и другой способ определения величины интервала, не требующий предварительного установления числа групп. В этом случае используется формула Стерджесса:
где п — число наблюдений.
Задачи 7-15 предполагают расчет средних показателейДля их решения следует изучить, какие виды и формы средних существуют, и усвоить методы их расчета.
По видам средние величины делятся на арифметические, гармонические, геометрические, квадратические, хронологические; по форме - на простые и взвешенные. Вид средней и ее форма зависят от того, какими данными для расчета мы располагаем.
Ниже приводятся формулы для расчета средних величин:
средняя арифметическая простая:
п
где хi - варианты (отдельные значения признака);
п — число единиц в совокупности.
средняя арифметическая взвешенная:
Средняя гармоническая:
где Fi – значение произведения варианты на соответствующую ей частоту;
xi - значения вариант.
средняя геометрическая простая
где n – число единиц в совокупности.
Для сгруппированных данных с неравными частотами применяется средняя геометрическая взвешенная
средняя квадратическая:
взвешенная (для сгруппированных данных):
простая (для несгруппированных данных):
средняя хронологическая:
Структурные средние: мода и медиана
Помимо перечисленных средних, в статистике используются и структурные средине: мода и медиана. Их расчет требуется произвести в задача:: 13-18.
Для определения моды в интервальных вариационных рядах с равными интервалами сначала находят модальный интервал, которым является интервал с наибольшей частотой, а затем ведут расчет по формуле:
где xMo- нижняя граница модального интервала;
d - величина интервала;
fMo – частота модального интервала;
fMo-1 – частота интервала, предшествующего модальному;
fMo+1 – частота интервала, следующего за модальным.
Расчет медианы проводят по формуле:
:
где xMe - нижняя граница медианного интервала;
dMe - величина медианного интервала;
SMe-1- сумма накопленных частот интервала, предшествующего медианному;
fMe — частота медианного интервала.
Медианный интервал - это интервал, кумулятивная (накопленная) частота которого равна или превышает половину суммы частот всего вариационного ряда.
Для выполнения задач 16-18 необходимо ознакомиться с темами "Показатели вариации" и "Средние величины".
Показатели вариации имеют две формы: простые и взвешенные, и зависят от формы средней величины. Если средняя по искомому показателю рассчитывается как простая, то и показатели вариации рассчитываются в форме простых, и наоборот.
Для характеристики размера вариации признака используются абсолютные и относительные показатели. К абсолютным показателям относятся:
• размах колебаний;
• среднее линейное отклонение;
• среднее квадратическое отклонение;
• дисперсия;
Размах колебаний (размах вариации)
где хmax, xmin – соответственно максимальное и минимальное значения признака
Среднее линейное отклонение определяется по формулам:
а) для несгруппированных данных (первичного ряда)
б) для вариационного ряда
Среднее квадратическое отклонение показывает, насколько в среднем каждый из признаков отклоняется от среднего значения признака. Оно равно квадратному корню из дисперсии.
Среднее квадратическое отклонение и дисперсияопределяются так:
а) для несгруппированных данных
б) для вариационного ряда
Формула для расчета дисперсии может быть преобразована:
Формулы расчета относительных показателей вариации следующие:
коэффициент вариации
Последний показатель исчисляется в процентах и показывает, на сколько процентов в среднем каждый из признаков отклоняется "от среднего значения признака.
Для решения задач 19-24 следует изучить тему "Выборочное наблюдение", понять смысл предельной и средней ошибки выборочной средней и выборочной доли.
Границы генеральной средней определяются как :
где - генеральная средняя; х - выборочная средняя:
Δ – предельная ошибка выборочной средней, определяемая по формуле:
где
- предельная (максимально возможная) ошибка средней;
- предельная (максимально возможная) ошибка доли;
м - величина средней квадратической стандартной ошибки;
t - коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки.
В зависимости от принятой вероятности Р определяется значение коэффициента кратности (t) по специальным таблицам доверия.
Величина средней ошибки в условиях большой выборки (n > 30) рассчитывается по известным из теории вероятностей формулам:
а) при случайной повторной выборке:
б) при случайной бесповторной выборке:
N - объем генеральной совокупности (число входящих в нее единиц);
п - объем выборочной совокупности (число единиц, попавших_в выборку);
- генеральная средняя (среднее значение признака в генеральной совокупности);
- выборочная средняя (среднее значение признака в выборочной совокупности);
р - генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности);
w- выборочная доля (доля единиц, обладающих данным признаком в выборочной совокупности);
где t- коэффициент доверия, зависящий от того, с какой вероятностью определяется предельная ошибка: при вероятности 0,-954 он равен 2, при вероятности 0,997 - 3;
Доверительная вероятность является функцией от t, определяемой по формуле
Доверительныеинтервалы для генеральной доли—
Формулы для определения численности простой случайной выборки
Способ отбора единиц | ||
повторный | бесповторный | |
Численность выборки (n): для средней | ||
для доли1 | ||
____________ 1 В случаях, когда частность w даже приблизительно неизвестна, в расчет вводят максимальную величину дисперсии доли, равную 0,25 (если w = 0,5, то w(1-w) = 0,25) |
Задачи 25 - 28 предполагают проведение анализа связей между показателями. Для их решения следует усвоить тему "Статистические методы изучения взаимосвязей".
Для определения степени тесноты парной линейной зависимости служит линейный коэффициент корреляции(r); при любой форме зависимости (линейной и криволинейной) - эмпирическое корреляционное отношение
Для расчета линейного коэффициента корреляциипо несгруппированным данным могут быть использованы следующие формулы:
Где -отклонение вариантов значений признака-фактора от их средней величины;
-отклонения вариантов значений результативного признака от их средней величины;
n – число единиц в совокупности;
уx, уy среднее квадратическое отклонение соответственно признака-фактора и результативного признака.
Линейный коэффициент корреляции может принимать значения в пределах от -1 до +1. Чем ближе он по абсолютной величине к 1, тем теснее связь. Знак при нем указывает направление связи: знак «+» соответствует прямой зависимости, знак «-» - обратной.
Если коэффициент корреляции равен нулю, то связи между признаками нет; если он равен единице (с любым знаком), то между признаками существует функциональная связь.