Категориальное распределение частот – состоит из категорий, являющихся значениями исследуемого признака и соответствующих этим категориям частот.

Категориальное распределение строится по данным, измеряемых номинальной или порядковой шкалой.

Пример 4. Политические предпочтения, чел.

Категории fi
Демократы
Коммунисты
Либералы
Всего

Пример 5. Данные просмотра фильма, чел.

Категории fi
Очень понравился
Понравился
Фильм средний
Не понравился
Всего

Для построения интервального ряда дадим определение интервала группировки как значения варьирующего признака, лежащего в определенных границах, причем нижней границей xmin интервала назовем наименьшее, а верхней границей xmax– наибольшее значение признака.

Группировка с равными интервалами используется в том случае, если вариация признака проявляется в узких границах, а распределение единиц носит равномерный характер; ее используют обычно внутри типичных групп для количественной оценки единиц, составляющих группу. Величина равного интервала может быть рассчитана по формуле

h = (xmax – xmin) /n (1)

где h – величина интервала, n — число групп.

Группировка с неравными интервалами используется в том случае, если размах вариации признака велик и значения признака варьируются неравномерно. Неравные интервалы могут быть прогрессивно возрастающими или прогрессивно убывающими в арифметической или геометрической прогрессии. Соответственно определяется величина интервала:

Арифметически возрастающий интервал a>0 hi+1 = hi + a а=3, hi=5, hi+1=5+3=8 hi+2=8+3=11
Арифметически убывающий интервал a<0 hi+1 = hi – a  
Геометрически возрастающий интервал g>0 hi+1 = hi g g=3, hi=5, hi+1=5*3=15 hi+2=15*3=45
Геометрически убывающий интервал g<0 hi+1 = hi / g  

Интервалы группировок могут быть закрытыми (т.е. иметь верхнюю и нижнюю границы) и открытыми (указана или верхняя или нижняя граница). Открытые интервалы используются в том случае, если признак изменяется неравномерно или в широких пределах, а так же когда отсутствуют качественные различия единиц, включаемых в группу. Рассмотрим построение интервального ряда с равными интервалами на примере: известны данные о результатах сдачи абитуриентами вступительных экзаменов (в баллах

Пример 6. Построение интервального ряда с равными интервалами.

Известны данные о результатах сдачи абитуриентами вступительных экзаменов:

18 16 20 17 19 20 17
17 12 15 20 18 19 18
18 16 18 14 14 17 19
16 14 19 12 15 16 20

Произвольно определим число групп (n=4) и по формуле (1) рассчитаем величину интервала h = 2 (балла), выделим группы с интервалом в 2 балла и подсчитаем частоту по каждой группе.

Таблица 5. Распределение абитуриентов по количеству набранных баллов.

Группы абитуриентов по числу баллов   Количество, чел   Накопленные частоты  
  12-14    
  14-16    
  16-18    
  18-20    
Всего    

Следует отметить, что если верхняя граница одного интервала совпадает с нижней границей последующего интервала, то единица, обладающая этим значением, относится к той группе, где эта величина выступает в роли верхней границы. Так, в нашем примере, к первой группе относятся абитуриенты, набравшие 12, 13 и 14 баллов, ко второй группе — набравшие 15 и 16 баллов и т.д.

Пример 7. построения интервального ряда с неравными интервалами.

Таблица 6. Распределение работников по уровню дохода

Группы работников , руб. Число работников, чел. Удельный вес, % к итогу
до 5000 52,2
5000-7500 39,1
7500 и более 8,7
Всего  

Вариационные ряды могут быть построены по самым разным объектам, в т.ч. по временным (месяцам, кварталам, годам, т.д.) и территориальным единицам (городам, округам, т.д.). Примеры построения таких рядов приведены в приложении.

Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения. Так, полигон используется для изображения дискретных вариационных рядов; в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси абсцисс строится шкала для выражения частот. Полученные на пересечении абсцисс и ординат точки соединяют прямыми линиями и получают ломаную линию.

Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени могут быть несравнимы из-за различного числа выделенных групп или неодинаковости границ интервалов. Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа.

Пример 8: Имеются данные о продолжительности телефонных разговоров. Построить распределение частот по 7 интервалам.

  1. определить величину интервала
  2. определить нижние границы
  3. 6+5=11, 11+5=16 и т.д.
  4. определить верхние границы 11-1=10 и т.д.
  5. определить точные границы (+ или – 0,5)
интервал Точные границы частота
6-10 5,5-10,5
11-15 10,5-15,5
16-20 15,5-20,5
21-25  
26-30  
31-35  
36-40 35,5-40,5

Самостоятельная работа

1. Дать понятие следующим терминам:

статистика, параметр, генеральная совокупность, выборка, репрезентативность выборки, данные, дискретные данные, непрерывные данные, переменная, признак, зависимая переменная, независимая переменная, описательная статистика, аналитическая статистика, гипотеза, измерение, шкала, номинальная шкала, порядковая шкала, интервальная шкала, относительная шкала, дихотомическая шкала

2. Ответьте на вопросы по теме:

а) Что такое статистика?

б) Почему в статистике рассматривают выборку?

в) Опишите разницу между выборочной и генеральной статистикой?

г) В чем различие между описательной статистикой и аналитической?

д) В чем различие между пятью различными видами шкал?

e) Почему статистики стоят распределение частот?

f) Чем отличается отношение частот, проценты, доли?

g) Какие способы графических представлений вам известны?

h) Для ответа на какие вопросы требуется строить кумуляту?

3. Задачи и упражнения для самостоятельной работы

I. В следующих утверждениях укажите, где используется описательная, а где аналитическая статистика:

а) Средний возраст студента в вашей группе равен 19, 3 лет.

б) Средний возраст студентов факультета находится в пределах 19-20 лет.

в) На отделении «менеджмент» среди первокурсников 44% юношей и 56% девушек.

г) Обучение при помощи компьютера эффективнее, чем при прослушивании лекции.

д) Исследования перед выборами показывают, что действующий кандидат получит 63% голосов, а новый – 37%.

е) Существует связь между курением и риском заболевания раком легких.

ж) В соответствии с данными страховых компаний шанс любого человека дожить до 83 лет составляет 62,8%.

II. В приведенных ниже примерах указать, какие переменные являются дискретными, а какие непрерывными:

а) Время, необходимое водителю, чтобы проехать определенную дистанцую.

б) Рост студента – первокурсника.

в) Рейтинг передач (плохо, средне, хорошо, отлично).

г) Зарплата кассиров крупных универмагов.

д) Семейное положение клиентов сберегательных банков.

е) Возраст студентов, записавшихся на военную кафедру.

ж) Температура внутри и вне самолета.

з) Вес новорожденного младенца.

и) Число книг на полке.

к) Километры, проезжаемые определенным автобусом в течение дня.

III. Укажите, какие из признаков, приведенных ниже количественные:

а) Цвет автомобилей в автосалоне.

б) Число мест в кинотеатре.

в) Длина кошек особых пород.

г) Число жалоб, полученных авиалинией за месяц.

IV. В приведенных ниже примерах переменных, указать, шкалой какого типа измеряется значение этих переменных:

a) Температура воздуха в лекционной аудитории.

b) Возраст сотрудника.

c) Пол студента

d) Семейное положение

e) Место жительства

f) Религиозные предпочтения

g) Время на подготовку домашнего задания

h) Трудолюбие

V. В следующих примерах указать исследуемую переменную (признак), границы генеральной совокупности и выборку:

а) Среди 200 случайно выбранных телезрителей 19% включат телевизор в течение ближайших 15 минут.

б) 4 из 15 опрошенных читателей газеты поддержат кандидатуру нынешнего губернатора на очередных выборах.

в) Время подготовки к занятиям превышает 3 часа в день у половины студентов.

г) 48% выпускников университета работают по специальности.

VI. По материалам газет и журналов приведите пример некорректного, с вашей точки зрения, статистического заключения. Объясните вашу точку зрения и укажите, как можно было избежать подобной ошибки.

VII. Вам предстоит провести исследование по поводу отношения людей к смертной казни. Какие гипотезы вы можете предложить? Какова генеральная совокупность и как вы предполагаете делать выборку? Описательная или аналитическая статистика будет использоваться вами для получения выводов?

VIII. Задачи и упражнения

1. Исследование показало, что в течение дня несколько испытуемых выпили количество чашек кофе, приведенное ниже. Постройте распределение частот. Нарисуйте гистограмму. Сделайте выводы.

0,0,5,5,4.3,5,4,0,1,4,3,2,1,3,2.1,0,4,4

2. Ниже собраны данные о возрасте 40 преподавателей одной из школ. Постройте распределение частот, используя восемь интервалов. Нарисуйте гистограмму. Сделайте выводы.

3. Посетители магазина. В течение 60 дней подсчитывалось число посетителей магазина. Постройте распределение частот, используя шесть категорий. Нарисуйте гистограмму. Сделайте выводы.

4. После проведения тестирования 108 случайно выбранных студентов были получены знания IQ Нарисуйте гистограмму, полигон и кумуляту для этих величин.

Интервал Частота
90-98
99-107
108-116
117-125
126-134

5. В ходе опроса 100 работающих женщин изучались основные причины, по которым каждая женщина работает вне дома. Постройте круговую диаграмму.

Материальная независимость
Дополнительные деньги
От нечего делать
Другое

6. Откуда берутся новости? В результате опроса 25 респондентов о получении новостей имеются следующие данные. Постройте частотное распределение для следующих данных ( Г=газета, Т=телевидение, Р=радио, Ж=журналы):

Г Г Р Е Е Р Г
Т Ж Р Ж Ж Г Р
Ж Т Р Ж Г Ж Т
Р Р Г Г      


Наши рекомендации