Математична статистика
Лабораторна робота 1
Числові характеристики статистичної вибірки
Мета роботи:
навчатися застосовувати вибірковий метод задля аналізу якості друкованих та мультимедійних видань
Навчальний матеріал
Математична статистика
Для контролю якості технологічних процесів створення друкованих та мультимедійних видань (насамперед, в поліграфії) використовуються методи математичної статистики. Вони є ефективним інструментарієм збору і аналізу інформації щодо якості виробничих операцій та готової продукції.
Математична статистикавивчає загальні питання аналізу масових кількісних даних та має справу звипадковими величинами (тобто з тими величинами, чиї значення визначаються множиною чинників випадкового характеру). Саме до таких – випадкових – величин відносяться характеристики технологічного процесу в поліграфії.
2. Поняття випадкової величини
Випадковою величиною називається така змінна величина, яка приймає те чи інше значення з деякої множини в залежності від випадку.
Виділяють дискретні та неперервні випадкові величини.
Дискретна випадкова величина – це випадкова величина, множина значень якої є скінченою або зліченною.
Неперервна випадкова величинаприймає свої значення з множини дійсних чисел.
3. Закон розподілу дискретної випадкової величини
Будь-яка випадкова величина характеризується своїм розподілом, тобто описанням того, з якою частотою зустрічається кожне значення випадкової величини.
Для повного описання дискретної випадкової величини необхідно:
- вказати усі її можливі значення;
- задати ймовірність, з якою приймаються ці значення.
Відповідність між можливими значеннями дискретних випадкових величин та їхніми ймовірностями називається законом розподілу дискретної випадкової величини.
Зручно застосовувати табличний спосіб описання закону розподілу дискретної випадкової величини: у першому рядку таблиці вказують значення випадкової величини (хi, i=1, 2, 3…), в другому рядку – ймовірність цих значений (pi, i=1, 2, 3…). Таку таблицю називають рядом розподілу дискретної випадкової величини(табл. 1).
Таблиця 1
Ряд розподілу дискретної випадкової величини
Х | х1 | х2 | … | хi | … |
P | p1 | p2 | … | pi | … |
Оскільки дискретна випадкова величина обов'язково прийме одне зі своїх значень хi, події {хi, i=1, 2, 3…} утворюють повну групу подій, тобто виконується умова:
,
де pi, – ймовірність того, що випадкова величина прийме значення хi .
4. Функція та щільність розподілу випадкової величини
Ряд розподілу – не універсальна характеристика випадкової величини. Він існує тільки для дискретних випадкових величин.
Універсальною характеристикою, яка використовується як для дискретних, так і для неперервних випадкових величин, є функція розподілу.
Функція розподілувипадкової величини визначається формулою:
,
де: Х – значення випадкової величини,
х – дійсне число.
Функція розподілу випадкової величини X описує ймовірність того, що випадкова величина X набуде значень, менших заданого значення х, де х – будь-яке дійсне число.
Властивості F(x):
1. Значення F(x) належать відрізку [0, 1], тобто 0≤F(x)≤1.
2. F(x) – функція, що не убуває (тобто якщо x1<x2, то F(x1)≤F(x2)).
Похідна від функції розподілу F(x) називається щільністю розподілу випадкової величини: f(x)= F'((x) (рис. 1-3).
Рис. 1. Графіки функції розподілу та щільності розподілу випадкової величини, розподіленої за експоненціальним законом
Рис. 2. Графіки функції розподілу та щільності розподілу випадкової величини, яка має рівномірний розподіл
Рис. 3. Графік щільності розподілу випадкової величини, розподіленої за нормальним законом
5. Числові характеристики випадкових величин
Числові характеристики у стислій формі виражають істотні особливості розподілу випадкової величини. Основними характеристиками випадкової величини є її математичне сподівання та дисперсія.
Математичним сподіванням дискретної випадкової величини Х, яка задана своїм рядом розподілу (табл. 1), називається число
. | (1) |
Математичним сподіванням неперервної випадкової величини Х називається число
. | (2) |
Таким чином, математичне сподівання приблизно дорівнює середньому арифметичному ймовірних значень випадкової величини.
Дисперсієювипадкової величини Х називається математичне сподівання квадрата відхилення випадкової величини Х від свого математичного сподівання:
.
Якщо випадкова величина X дискретна та задана своїм рядом розподілу, то
. | (3) |
Якщо випадкова величина X неперервна та задана на відрізку [а, b], то
. | (4) |
Дисперсія характеризує міру розсіювання значень випадкової величини Х відносно свого математичного сподівання.
Розмірність дисперсії дорівнює квадрату розмірності величини X. Тому для цілей аналізу часто використовують величину , яка називається середнім квадратичним відхиленням випадкової величини. Її розмірність збігається з розмірністю величини Х.
6. Вибірковий метод в статистиці
Збір інформації про технологічний процес і вироблену продукцію здійснюється шляхом статистичного спостереження.
Виділяють два різновиди статистичного спостереження: суцільне та несуцільне. Суцільне спостереження передбачає дослідження ознак усіх об’єктів загальної сукупності, що вивчається. Цей метод дослідження пов'язаний із значними трудовими і матеріальними витратами. При несуцільному спостереженні досліджують ознаки лише частини загальної сукупності та, виходячи з результатів дослідження, роблять висновки про властивості усієї сукупності в цілому.
У статистичній практиці найпоширенішим є вибіркове спостереження.
Вибіркове спостереження– це таке несуцільне спостереження, при якому відбір об’єктів, що підлягають обстеженню, здійснюється у випадковому порядку, відібрана частина вивчається, а результати розповсюджуються на всю загальну сукупність об’єктів. Спостереження організовується таким чином, що відібрана частина об’єктів репрезентує в зменшеному масштабі усю загальну сукупність.
Сукупність об’єктів, з якої здійснюється відбір, називається генеральною сукупністю, і всі її узагальнені показники називаються генеральними.
Сукупність відібраних одиниць іменують вибірковою сукупністю, і всі її узагальнені показники називають вибірковими.
Вибіркове спостереження має бути організоване й проведено у відповідності з науковими принципами теорії вибіркового методу. Основними з таких принципів є принцип забезпечення випадковості відбору об’єктів та принцип достатності їхньої кількості. Дотримання цих принципів дозволяє отримати об'єктивну гарантію репрезентативності вибіркової сукупності.
Задача вибіркового спостереження полягає в тому, щоб на основі характеристик вибіркової сукупності отримати достовірні судження про характеристики генеральної сукупності.
Прояв досліджуваної ознаки в генеральній сукупності є випадковою величиною (так, наприклад, випадковою величиною є ширина полів в друкарському виданні). Тому основними характеристиками генеральної сукупності є генеральне математичне сподівання та генеральна дисперсія досліджуваної ознаки.
Приблизні значення генерального математичного сподівання та генеральної дисперсії можна визначити за їхніми вибірковими аналогами.
Для математичного сподівання випадкової величини M(X) вибірковим аналогом є середнє арифметичне спостережуваних значень випадкової величини:
, , | (5) |
де: xi – значення випадкової величини, спостережуване в i-тому досліді (тобто результат i-го вимірювання ознаки),
n – кількість дослідів (вимірювань).
Цю характеристику називають вибірковим середнім випадкової величини.
Згідно з законом великих чисел, при необмеженому збільшенні кількості дослідів значення вибіркового середнього наближається до значення генерального математичного сподівання. При обмеженій кількості дослідів вибіркове середнє є випадковою величиною, яка, проте, пов'язана з генеральним математичним сподіванням і може дати про нього деяке уявлення.
Вибіркові аналоги існують для всіх числових характеристик випадкових величин. Так, вибірковим аналогом генеральної дисперсії є вибіркова дисперсія S2, яка розраховується за формулою:
, | (6) |
де: – вибіркове середнє,
xi – значення випадкової величини, спостережуване в i-тому досліді (результат i-го вимірювання ознаки),
n – кількість дослідів (вимірювань).
Показник S, який дорівнює кореню з вибіркової дисперсії, називається вибірковим середньоквадратичним відхиленням.
7. Незміщені вибіркові характеристики
Вибіркова характеристика називається незміщеною, якщо вона не містить систематичної помилки, тобто середнє значення вибіркової характеристики, яке визначене при багатократному повторенні вибірки об'ємом n з однієї й тієї ж генеральної сукупності, сходиться до дійсного значення відповідного генерального параметра.
Вибіркове середнє є незміщеною оцінкою генерального середнього.
Незміщеною оцінкою генеральної дисперсії є виправлена вибіркова дисперсія, що обчислюється за формулою:
, | (7) |
де: xi – значення випадкової величини, спостережуване в i-тому досліді (результат i-го вимірювання ознаки),
– вибіркове середнє,
n – кількість дослідів (вимірювань).
Тобто для отримання незміщеної оцінки вибіркову дисперсію S2, отриману за формулою (6), треба помножити на величину n/(n - 1).
Показник виправленої вибіркової дисперсії використовується при малому числі спостережень (n<30). Зазвичай вже при n>20 розбіжність зміщеної та незміщеної оцінок стає неістотною.