Ряды распределения, их виды и способы представления
ЯГМА
Медицинская физика
Лечебный факультет
Курс
Семестр
Поток
Лекция № 1
«Элементы математической статистики»
Составил: Бабенко Н.И.
Г.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, ЕЕ ОСОБЕННОСТИ, ВИДЫ, ЗАДАЧИ.
Понятие "статистика" происходит от латинского слова "status", которое в переводе означает - положение, состояние, порядок явлений.
Развитие политической арифметики ( Англия ) и государствоведения
( Германия ) привело к появлению науки статистики.
В научный оборот термин "статистика" введен математиками Геттингенского университета в 18 веке.( Готфрид Ахенваль (1719-1772) ).
В настоящее время существует около 150 определений статистики как научной дисциплины. Одно из лучших определений статистики дал австрийский математик Абрахам Вальд : « Статистика – это совокупность методов, которые дают нам возможность принимать оптимальные решения в условиях неопределенности».
Из различных определений статистики для практической медицины наиболее применимо следующее:
"Статистика - это наука о сборе, классификации и количественной оценке данных с целью получения достоверных выводов, прогнозов и решений".
Статистика изучает случайные массовые явления. Массовые явления - это явления, которые встречаются в больших количествах, но отличаются друг от друга величиной определенного признака. Чем больше количество объектов взято для исследования, тем достовернее статистические выводы.
Статистика состоит из теоретической ( общей ) статистики и прикладной
( экономической, социальной, отраслевой ) статистики.
К отраслевым статистикам относится метеорологическая (статистика прогноза погоды), транспортная, экономическая, биологическая, медицинская.
Теоретическую статистику делят на описательную (дескриптивную) и аналитическую ( индуктивную ).
Описательная статистика - это статистика сбора общих данных. Она представляет собой совокупность методов сбора, группировки, классификации исходных данных и представлении их в удобном, для последующей обработки, виде ( таблицы, графики) .
Аналитическая статистика - это статистика выводов и прогнозов на основе математической обработки результатов, предоставленных описательной статистикой. Она включает в себя методы получения различных статистических заключений и выводов с целью их практического применения.
Медицинская статистика - это отраслевая статистика, комплекс методов прикладной статистики, которые применяются в научной, практической медицине и здравоохранении.
Основные задачи медицинской статистики:
ü статистика рождаемости и смертности;
ü статистика заболеваемости;
ü статистика деятельности учреждений здравоохранения.
Вместе описательная и аналитическая статистики решают следующую задачу:
ü сбор данных и описание их в удобном для статистической обработки виде;
ü обработка результатов методами теоретической ( общей ) статистики;
ü анализ полученных результатов, прогнозирование, выработка оптимальных решений.
ОСНОВНЫЕ ПОНЯТИЯ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ
И ИХ ХАРАКТЕРИСТИКА.
К основным понятиям описательной статистики относятся:
ü статистическая совокупность (генеральная и выборочная);
ü объем совокупности;
ü статистический вариант;
ü статистический признак;
ü статистическая частота ( абсолютная частота );
ü частость ( относительная частота).
Статистическая совокупность - это множество объектов, объединенных по какому-либо признаку для статистического изучения.
Виды совокупностей:
1. Генеральная совокупность ( конечная или бесконечная ).
2. Выборочная совокупность ( выборка ).
Генеральная совокупность - это совокупность всех объектов выбранного для исследования статистического множества.
Конечная генеральная совокупность – статистическая совокупность, в которой количество изучаемых объектов с данным признаком ограничено.
Пример: количество студентов в академии, жителей в городе, число измерений в опытах.
Бесконечная генеральная совокупность - это статистическая совокупность, в которой число объектов равно бесконечности. Используется в теоретических расчетах как математическая абстракция.
Выборочная совокупность ( выборка ) - это часть генеральной совокупности, взятая для статического изучения.
Объем совокупности - это количество объектов, входящих в совокупность.
Объем генеральной совокупности обозначается символом N, а выборочной - n.
Статистический вариант - это объект совокупности, отдельное наблюдение или измерение.
Варианты обозначаются латинскими буквами x, y, z c подстрочными индексами, указывающими номер варианты.
Пример: х1- объект или измерение номер один,
х2 - объект или измерение номер два и т.д.
Вариант без указания номера называется обобщенный вариант и обозначается латинской буквой с подстрочным буквенным индексом, например, xi.
Варианты ( объекты ) статистической совокупности характеризуются различными признаками, в том числе теми, на основе которых они объединены в совокупность.
Признак, который меняет свое значение от одного объекта к другому, называется варьирующим признаком, а само явление называется вариация.
Качественные признаки - это признаки, не имеющие количественного выражения. Это неизмеряемые признаки.
Пример: цвет, вкус, запах.
Количественные признаки - это измеряемые признаки, выражаемые определенным числом.
Пример: вес, длина, плотность, температура.
Дискретные количественные признаки- это количественные признаки, которые выражаются целыми числами.
Пример: число студентов в группе, пассажиров в автобусе, лепестков на цветке.
Непрерывные количественные признаки – это количественные признаки, которые выражаются как целыми, так и дробными числами.
Пример: вес арбуза 7 кг, вес дыни 1.7 кг.
Интервальный признак - это количественный признак, числовое значение которого лежит в определенных границах, называемых интервалами.
Пример: при измерении роста студентов, можно выделить интервальные группы 160 - 169 см, 170 – 179 см, 180 – 190 см.
Частота встречаемости ( абсолютная частота ) – число, показывающее, сколько раз объект с данным числовым значением признака встречается в совокупности или ее интервале.
Абсолютною частоту обозначают символом ni ( µi ).
Сумма всех абсолютных частот равна объему совокупности N, для которой подсчитываются частоты: ∑ni = N
Пример: число лиц мужского и женского пола в группе должно быть равно в сумме количеству студентов в этой группе.
Частость ( относительная частота ) – число, равное отношению абсолютной частоты к объему совокупности.
Частость обозначают символом f и вычисляют по формуле:
в долях единицы: fi = ,
в процентах: fi = 100%
Здесь ni- абсолютная частота, N- объем совокупности, равный сумме всех абсолютных частот.
Сумма всех относительных частот равна 1: ∑fi = 1
Пример: в студенческой группе из пятнадцати человек ( объем совокупности N=15 ) 12 студенток ( абсолютная частота n1=12 ) и 3 студента ( абсолютная частота n2=3 ). Частость f1 будет равна 12/15, а частость f2=3/15. При этом сумма частостей или относительных частот равна единице.
В статистике относительные частоты или частости называют весами.
РЯДЫ РАСПРЕДЕЛЕНИЯ, ИХ ВИДЫ И СПОСОБЫ ПРЕДСТАВЛЕНИЯ.
Ряд распределения - это последовательность чисел с указанием качественного или количественного значения признака и частоты его встречаемости.
Виды рядов распределения классифицируются по разным принципам.
По степени упорядоченности ряды делят на:
ü неупорядоченные
ü упорядоченные
Неупорядоченный ряд - это такой ряд, в котором значения признака записаны в порядке поступления вариантов при исследовании.
Пример: При исследовании роста группы студентов были записаны его значения в см (175,170,168,173,179).
Упорядоченный ряд- это ряд, полученный из неупорядоченного в котором значения признака перезаписаны в порядке возрастания или убывания. Упорядоченный ряд называется ранжированным, а процедура ранжирования
( упорядочивания ) называется сортировкой.
Пример: ( Рост 168,170,173,175,179 )
По виду признака ряды распределения делятся на:
ü атрибутивные
ü вариационные.
Атрибутивный ряд - это ряд, составленный на основе качественного признака.
Вариационный ряд - это ряд, составленный на основе количественного признака.
Вариационные ряды подразделяются на дискретные, непрерывные и интервальные.
Вариационные дискретные, непрерывные и интегральные ряды названы по соответствующему признаку, который лежит в основе составления ряда. Например, ряд по размеру обуви является дискретным по массе тела - непрерывным.
Способы представления рядов в практической и научной медицине делятся на три группы:
1. Табличное представление;
2. Аналитическое представление ( в виде формулы);
3. Графическое представление.
1. Простейшая таблица представляет собой два столбца или две строки, в одной из которых записаны значения признака xi в упорядоченном виде, а в другой - относительная или абсолютная частота его встречаемости ni, fi.
Пример табличного представления оценок в группе xiи числа их получивших студентов ni.
xi | ||||
ni | - |
2. Графическое представление рядов основано на табличных данных. Графики строят в прямоугольной системе координат, где по горизонтали всегда откладывают значения признака хi, а по вертикали абсолютною или относительную частоту ni .
Основные способы представления графиков:
1. Диаграмма в отрезках.
2. Гистограмма
3. Полигон частот.
4. Вариационная ( частотная ) кривая.
5.
Диаграмма в отрезках - это график представления ряда в виде вертикальных прямых-отрезков, положение которых на горизонтали определяется значением признака, а длина отрезка пропорциональна его абсолютной или относительной частоте.
Пример: диаграмма в отрезках для оценок успеваемости группы.
ni
5 4 3 2 xi
Обычно диаграммы в отрезках строят для дискретно заданных признаков при небольшом числе вариантов.
Гистограмма - это график в виде ступенчатой фигуры из примыкающих друг к другу прямоугольников, основаниями которых являются интервалы значений признаков, а высоты прямоугольников пропорциональны частоте или частости ( количеству объектов, попавших в интервал ) . Площади прямоугольников соответствуют численности групп, в данном интервале.
Гистограммы - это графики интервальных рядов. Их строят преимущественно для больших объемов совокупностей.
Пример: Гистограмма нормального распределения эритроцитов в крови человека. По горизонтали - диаметр клеток хi(мк), по вертикали - частота ni числа клеток в интервале.
ni
2 4 6 8 10 12 xi
Полигон ( многоугольник ), частот - график ряда, представленный ломаной линией точки - вершины которой соответствуют серединам интервалов, а высота точки над горизонталью пропорциональна частоте или частости.
Полигоны строят для непрерывных и дискретных вариационных рядов в тех случаях, когда в интервалах выделены средние значения признака. Полигоны предпочтительнее гистограмм при непрерывных рядах распределения
Пример: полигон частот на основе гистограммы распределения эритроцитов в крови человека.
ni
2 4 6 8 10 12 xi
Вариационная ( частотная ) кривая - график ряда, полученный при условии, что объем совокупности, стремится к бесконечности ( N→∞ ), а длина самого интервала стремится к нулю ( Δх→0 ).
Для практических статистических расчетов в качестве стандартов выделено четыре группы частотных распределений:
1. Прямоугольное распределение.
2. Колоколообразное унимодальное ( одновершинное ) распределение.
3. Бимодальное ( двухвершинное ) распределение.
4. Экспоненциальное распределение:
a) нарастающее,
b) убывающее.
ni
xi
xi
xi
xi
Прямоугольному распределению подчиняются случайные равновероятные события.
Колоколообразному симметричному распределению подчиняется широкий класс явлений ( показатели умственного и физического развития, рост, масса, и др ). На практике наиболее часто встречается симметричное унимодальное распределение, поэтому его классическая форма называется нормальным распределением.
Бимодальному распределению соответствует, например успеваемость студентов имеющих и не имеющих большого перерыва в учебе.
Экспоненциально убывающему распределению соответствует распределение доходов в капиталистическом обществе, ( частота убывает при возрастании дохода).