Використання в медико-біологічних дослідженнях розподілу Гаусса
Мета роботи: навчитися використовувати нормальний розподіл при аналізі медико-біологічних показників, що уворюють невпорядкований статистичний ряд варіюючих величин.
Обладнання: ПК, мікрокалькулятор.
Теоретичні відомості
Нормальний закон має важливе значення в медико-біологічних спостереженнях та експериментах. При дії великої кількості випадкових факторів, кожен з яких сам по собі, незалежно від інших, виявляє незначну дію на випадкову величину, остання описується нормальним розподілом Гаусса.
Практичне завдання лікаря — це створення раціональної та ефективної профілактики захворювання. При цьому лікар або науковий дослідник має справу з широким варіюванням ознак, явищ та подій і зобов’язаний обгрунтовано реалізувати медичне втручання.
Відомо, що одним із плідних методів опису характеру варіювання є використання відповідного розподілу, який визначає ймовірність того, що результат виміру параметра індивідуума, вибраного випадково, буде мати задане значення або лежатиме в певному інтервалі значень.
Закон розподілу випадкової величини — це математичний вираз, який дає зв’язок між можливими значеннями випадкової величини та ймовірностями їх прояву. Він досить часто використовується при визначенні термінів ізоляції або тривалості інкубаційного періоду інфекційних захворювань, при вивченні розподілу людей по групам крові, по складу білків плазми, клітинних елементів крові і т. д.
Для опису випадкових неперервних величин (варіант), які в заданому інтервалі можуть приймати неперервний ряд значень (наприклад, вага тіла, ріст людини, тиск крові, температура тіла, вміст гемоглобіну в крові і т. д.), використовують нормальний закон (розподіл Гаусса).
Закон розподілу неперервної випадкової величини х називається нормальним, якщо щільність розподілу дорівнює:
. (1.1.1)
Графік розподілу Гаусса описується симетричною відносно a = М(х) кривою (рис. 1.1.1), s має зміст середньоквадратичного відхилення:
.
При х = a ордината кривої нормальної густини ймовірності дорівнює
.
При зменшенні s ця ордината необмежено зростає і крива пропорційно витягується вздовж осі ординат так, що її площа залишається рівною одиниці (рис.1.1.2).
Тобто „розкид” можливих значень випадкової величини х зменшується при зменшенні s.
Теорія ймовірностей дозволяє виразити параметри розподілу неперервних випадкових величин через такі їх числові характеристики:
1) ймовірність того, що випадкова неперервна величина приймає якесь значення в інтервалі (а, b):
;
2) математичне сподівання (середнє значення) випадкової неперервної величини:
;
3) дисперсія неперервної випадкової величини:
;
4) умова нормування для неперервної випадкової величини:
.
Щільність розподілу f(x) зображає повну сукупність варіюючих величин, має мах при х=М. Для практичного використання зручніша так звана нормована крива.
Суть нормування: вся площа під нормованою кривою прирівнюється одиниці, початок координат переноситься в центр розподілу, а справа та зліва від 0 відкладаються нормовані відхилення змінної х, виражені в одиницях стандартного відхилення, від середнього значення х=М.
При нормованому розподілі між відстанню від середньої величини, вираженою в одиницях стандартного відхилення, та відносною величиною площі, обмеженої нормованою кривою, іcнує співвідношення: частина площі в межах від –s до +s складає 68,3% від числа всіх членів сукупності; в межах від –28 до +28 — 95,5%; від –38 до +38 — 99,7 % всіх членів сукупності (рис. 1.1.3).
Рис.1.1.1. Крива нормального розподілу.
Рис.1.1.2. Крива нормального розподілу
при різних значеннях s.
Рис.1.1.3. Нормована крива розподілу Гаусса
Відрізки площі під нормованою кривою виражають, разом з відносними частотами подій, їх ймовірність. Варіанти, що відрізняються від більше, ніж 2s, зустрічаються в 5% випадків.
Отже, ймовірність отримати в виборці з даної сукупності варіанти такої величини рівна 0,05. Якщо мова йде про ймовірності відхилення тільки в одну сторону (+ або –), ймовірність вдвічі менша і рівна 0,025. Це ж стосується і варіанти, що відрізняється від на 3s — її ймовірність 0,003 при оцінці двостороннього відхилення та 0,0015 при односторонньому. Поряд з щільністю ймовірності в математиці використовують функцію розподілу неперервної величини:
. (1.1.2)
Ця функція рівна ймовірності того, що випадкова величина хі менша наперед заданого значення х:
F(x) = P(xi<x).
Як і будь-яка ймовірність, функція розподілу не може бути від’ємною і більшою за одиницю:
.
Знаючи величину щільності розподілу (1.1.1), можна визначити ймовірність попадання випадкової величини в деякий інтервал (а, b). Ця ймовірність виражається через різницю двох нормованих функцій розподілу Ф(Z), значення яких приведені в спеціальних таблицях [Ф(Z) — функція Лапласа]:
Р(a<x<b) = Ф(Z2) — Ф(Z1), де
Ляпунов А. А. — спеціаліст в області теорії функцій і математичних питань кібернетики — вперше пояснив причини значного поширення нормального закону. Він показав, що якщо випадкова величина може розглядатись як сума великого числа маленьких доданків, то при достатньо загальних умовах закон розподілу цієї випадкової величини близький до нормального незалежно від того, які закони розподілу окремих доданків. А оскільки практично всі випадкові величини є результатом накладання великого числа різних причин, то нормальний закон є найбільш поширеним законом розподілу.
Серед емпіричних розподілів часто спостерігаються асиметрія розподілу і ексцес. Графічно асиметрія проявляється в вигляді скошеної варіаційної кривої, вершина якої може знаходитись лівіше (правостороння або додатня асиметрія) або правіше (лівостороння або від’ємна асиметрія) відносно осі симетрії Хс (рис.1.1.4 а, б).
Рис.1.1.4. Правостороння додатня асиметрія (а)
та (б) лівостороння від’ємна асиметрія.
Рис.1.1.5. а) Додатній ексцес розподілу —
гостровершинна крива (1) порівняно з нормальною кривою (2) та б) від’ємний ексцес розподілу — плосковершинна крива (1) порівняно з нормальною кривою (2).
Поряд з асиметричними мають місце гостровершинні та плосковершинні розподіли. Гостровершинність кривої розподілу спостерігається тоді, коли різко зростає частотність варіант в центральних класах варіаційного ряду — в результаті вершина варіаційної кривої сильно підіймається вгору (рис.1.1.5, а) — має місце додатний ексцес розподілу.
Окрім одновершинних зустрічаються дво- та багатовершинні криві, плосковершинні та двогорбі криві, що свідчить про наявність від’ємного ексцесу (рис.1.1.5, б). Величина асиметрії та ексцесу може бути різною, тому важливо її не тільки виявити, але і виміряти та врахувати при оцінці відповідних показників.