Ряды распределения, их виды и способы представления

ЯГМА

Медицинская физика

Лечебный факультет

Курс

Семестр

Поток

Лекция № 1

«Элементы математической статистики»

Составил: Бабенко Н.И.

Г.

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, ЕЕ ОСОБЕННОСТИ, ВИДЫ, ЗАДАЧИ.

Понятие "статистика" происходит от латинского слова "status", которое в переводе означает - положение, состояние, порядок явлений.

Развитие политической арифметики ( Англия ) и государствоведения

( Германия ) привело к появлению науки статистики.

В научный оборот термин "статистика" введен математиками Геттингенского универ­ситета в 18 веке.( Готфрид Ахенваль (1719-1772) ).

В настоящее время существует около 150 определений статистики как научной дисциплины. Одно из лучших определений статистики дал австрийский математик Абрахам Вальд : « Статистика – это совокупность методов, которые дают нам возможность принимать оптимальные решения в условиях неопределенности».

Из различных определений статистики для практической медицины наиболее применимо следующее:

"Статистика - это наука о сборе, классификации и количественной оценке данных с целью получения достоверных выводов, прогнозов и решений".

Статистика изучает случайные массовые явления. Массовые явления - это явления, которые встречаются в больших количествах, но отличаются друг от друга величиной определенного признака. Чем больше количество объектов взято для исследования, тем достовернее статистические выводы.

Статистика состоит из теоретической ( общей ) статистики и прикладной

( экономической, социальной, отраслевой ) статистики.

К отраслевым статистикам относится метеорологическая (статистика прогноза погоды), транспортная, экономическая, биологическая, медицинская.

Теоретическую статистику делят на описательную (дескриптивную) и аналитическую ( индуктивную ).

Описательная статистика - это статистика сбора общих данных. Она представляет собой совокупность методов сбора, группировки, классификации исходных данных и представлении их в удобном, для последующей обработки, виде ( таблицы, графики) .

Аналитическая статистика - это статистика выводов и прогнозов на основе математической обработки результатов, предоставленных описательной статистикой. Она включает в себя методы получения различных статистических заключений и выводов с целью их практического применения.

Медицинская статистика - это отраслевая статистика, комплекс методов прикладной статистики, которые применяются в научной, практической медицине и здравоохранении.

Основные задачи медицинской статистики:

ü статистика рождаемости и смертности;

ü статистика заболеваемости;

ü статистика деятельности учреждений здравоохранения.

Вместе описательная и аналитическая статистики решают следующую задачу:

ü сбор данных и описание их в удобном для статистической обработки виде;

ü обработка результатов методами теоретической ( общей ) статистики;

ü анализ полученных результатов, прогнозирование, выработка оптимальных решений.

ОСНОВНЫЕ ПОНЯТИЯ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ

И ИХ ХАРАКТЕРИСТИКА.

К основным понятиям описательной статистики относятся:

ü статистическая совокупность (генеральная и выборочная);

ü объем совокупности;

ü статистический вариант;

ü статистический признак;

ü статистическая частота ( абсолютная частота );

ü частость ( относительная частота).

Статистическая совокупность - это множество объектов, объединенных по какому-либо признаку для статистического изучения.

Виды совокупностей:

1. Генеральная совокупность ( конечная или бесконечная ).

2. Выборочная совокупность ( выборка ).

Генеральная совокупность - это совокупность всех объектов выбранного для исследования статистического множества.

Конечная генеральная совокупность – статистическая совокупность, в которой количество изучаемых объектов с данным признаком ограничено.

Пример: количество студентов в академии, жителей в городе, число измерений в опытах.

Бесконечная генеральная совокупность - это статистическая совокупность, в которой число объектов равно бесконечности. Используется в теоретических расчетах как математическая абстракция.

Выборочная совокупность ( выборка ) - это часть генеральной совокупности, взятая для статического изучения.

Объем совокупности - это количество объектов, входящих в совокупность.

Объем генеральной совокупности обозначается символом N, а выборочной - n.

Статистический вариант - это объект совокупности, отдельное наблюдение или измерение.

Варианты обозначаются латинскими буквами x, y, z c подстрочными индексами, указывающими номер варианты.

Пример: х1- объект или измерение номер один,

х2 - объект или измерение номер два и т.д.

Вариант без указания номера называется обобщенный вариант и обозначается латинской буквой с подстрочным буквенным индексом, например, xi.

Варианты ( объекты ) статистической совокупности характеризуются различными признаками, в том числе теми, на основе которых они объединены в совокупность.

Признак, который меняет свое значение от одного объекта к другому, называется варьирующим признаком, а само явление называется вариация.

ряды распределения, их виды и способы представления - student2.ru

Качественные признаки - это признаки, не имеющие количественного выражения. Это неизмеряемые признаки.

Пример: цвет, вкус, запах.

Количественные признаки - это измеряемые признаки, выражаемые определенным числом.

Пример: вес, длина, плотность, температура.

Дискретные количественные признаки- это количественные признаки, которые выражаются целыми числами.

Пример: число студентов в группе, пассажиров в автобусе, лепестков на цветке.

Непрерывные количественные признаки – это количественные признаки, которые выражаются как целыми, так и дробными числами.

Пример: вес арбуза 7 кг, вес дыни 1.7 кг.

Интервальный признак - это количественный признак, числовое значение которого лежит в определенных границах, называемых интервалами.

Пример: при измерении роста студентов, можно выделить интервальные группы 160 - 169 см, 170 – 179 см, 180 – 190 см.

Частота встречаемости ( абсолютная частота ) – число, показывающее, сколько раз объект с данным числовым значением признака встречается в совокупности или ее интервале.

Абсолютною частоту обозначают символом ni ( µi ).

Сумма всех абсолютных частот равна объему совокупности N, для которой подсчитываются частоты: ∑ni = N

Пример: число лиц мужского и женского пола в группе должно быть равно в сумме количеству студентов в этой группе.

Частость ( относительная частота ) – число, равное отношению абсолютной частоты к объему совокупности.

Частость обозначают символом f и вычисляют по формуле:

в долях единицы: fi = ряды распределения, их виды и способы представления - student2.ru ,

в процентах: fi = ряды распределения, их виды и способы представления - student2.ru 100%

Здесь ni- абсолютная частота, N- объем совокупности, равный сумме всех абсолютных частот.

Сумма всех относительных частот равна 1: ∑fi = 1

Пример: в студенческой группе из пятнадцати человек ( объем совокупности N=15 ) 12 студенток ( абсолютная частота n1=12 ) и 3 студента ( абсолютная частота n2=3 ). Частость f1 будет равна 12/15, а частость f2=3/15. При этом сумма частостей или относительных частот равна единице.

В статистике относительные частоты или частости называют весами.

РЯДЫ РАСПРЕДЕЛЕНИЯ, ИХ ВИДЫ И СПОСОБЫ ПРЕДСТАВЛЕНИЯ.

Ряд распределения - это последовательность чисел с указанием качественного или количественного значения признака и частоты его встречаемости.

Виды рядов распределения классифицируются по разным принципам.

По степени упорядоченности ряды делят на:

ü неупорядоченные

ü упорядоченные

Неупорядоченный ряд - это такой ряд, в котором значения признака записаны в порядке поступления вариантов при исследовании.

Пример: При исследовании роста группы студентов были записаны его значения в см (175,170,168,173,179).

Упорядоченный ряд- это ряд, полученный из неупорядоченного в котором значения признака перезаписаны в порядке возрастания или убывания. Упорядоченный ряд называется ранжированным, а процедура ранжирования

( упорядочивания ) называется сортировкой.

Пример: ( Рост 168,170,173,175,179 )

По виду признака ряды распределения делятся на:

ü атрибутивные

ü вариационные.

Атрибутивный ряд - это ряд, составленный на основе качественного признака.

Вариационный ряд - это ряд, составленный на основе количественного признака.

Вариационные ряды подразделяются на дискретные, непрерывные и интервальные.

Вариационные дискретные, непрерывные и интегральные ряды названы по соответствующему признаку, который лежит в основе составления ряда. Например, ряд по размеру обуви является дискретным по массе тела - непрерывным.

Способы представления рядов в практической и научной медицине делятся на три группы:

1. Табличное представление;

2. Аналитическое представление ( в виде формулы);

3. Графическое представление.

1. Простейшая таблица представляет собой два столбца или две строки, в одной из которых записаны значения признака xi в упорядоченном виде, а в другой - относительная или абсолютная частота его встречаемости ni, fi.

Пример табличного представления оценок в группе xiи числа их получивших студентов ni.

xi
ni -

2. Графическое представление рядов основано на табличных данных. Графики строят в прямоугольной системе координат, где по горизонтали всегда откладывают значения признака хi, а по вертикали абсолютною или относительную частоту ni .

Основные способы представления графиков:

1. Диаграмма в отрезках.

2. Гистограмма

3. Полигон частот.

4. Вариационная ( частотная ) кривая.

5.

Диаграмма в отрезках - это график представления ряда в виде вертикальных прямых-отрезков, положение которых на горизонтали определяется значением признака, а длина отрезка пропорциональна его абсолютной или относительной частоте.

Пример: диаграмма в отрезках для оценок успеваемости группы.

ряды распределения, их виды и способы представления - student2.ru ni

5 4 3 2 xi

Обычно диаграммы в отрезках строят для дискретно заданных признаков при небольшом числе вариантов.

Гистограмма - это график в виде ступенчатой фигуры из примыкающих друг к другу прямоугольников, основаниями которых являются интервалы значений признаков, а высоты прямоугольников пропорциональны частоте или частости ( количеству объектов, попавших в интервал ) . Площади прямоугольников соответствуют численности групп, в данном интервале.

Гистограммы - это графики интервальных рядов. Их строят преимущественно для больших объемов совокупностей.

Пример: Гистограмма нормального распределения эритроцитов в крови человека. По горизонтали - диаметр клеток хi(мк), по вертикали - частота ni числа клеток в интервале.

ряды распределения, их виды и способы представления - student2.ru ni

2 4 6 8 10 12 xi

Полигон ( многоугольник ), частот - график ряда, представленный ломаной линией точки - вершины которой соответствуют серединам интервалов, а высота точки над горизонталью пропорциональна частоте или частости.

Полигоны строят для непрерывных и дискретных вариационных рядов в тех случаях, когда в интервалах выделены средние значения признака. Полигоны предпочтительнее гистограмм при непрерывных рядах распределения

Пример: полигон частот на основе гистограммы распределения эритроцитов в крови человека.

ряды распределения, их виды и способы представления - student2.ru ni

2 4 6 8 10 12 xi

Вариационная ( частотная ) кривая - график ряда, полученный при условии, что объем совокупности, стремится к бесконечности ( N→∞ ), а длина самого интервала стремится к нулю ( Δх→0 ).

Для практических статистических расчетов в качестве стандартов выделено четыре группы частотных распределений:

1. Прямоугольное распределение.

2. Колоколообразное унимодальное ( одновершинное ) распределение.

3. Бимодальное ( двухвершинное ) распределение.

4. Экспоненциальное распределение:

a) нарастающее,

b) убывающее.

 
  ряды распределения, их виды и способы представления - student2.ru

ni


xi

xi

xi

xi

Прямоугольному распределению подчиняются случайные равновероятные события.

Колоколообразному симметричному распределению подчиняется широкий класс явлений ( показатели умственного и физического развития, рост, масса, и др ). На практике наиболее часто встречается симметричное унимодальное распределение, поэтому его классическая форма называется нормальным распределением.

Бимодальному распределению соответствует, например успеваемость студентов имеющих и не имеющих большого перерыва в учебе.

Экспоненциально убывающему распределению соответствует распределение доходов в капиталистическом обществе, ( частота убывает при возрастании дохода).

Наши рекомендации