Закон рівномірної щільності.
(27)
Приклад 5. Відомі імовірнісні характеристики нормально розподіленої випадкової величини Х: m =17; s=0,6. Знайти ймовірність події Р(a<X<b); а також імовірність того, що Р(|х-m| < d ), якщо a =16,8; b = 17,2; d=0,3.
Рішення.
Обчислимо ймовірність того, що Х належить інтервалу (16,8; 17,2).
=
Визначимо ймовірність того, що х відхилиться свого середнього значення m менш чим на d
.
Завдання 5 і 6 варто виконувати після вивчення теми «Елементи математичної статистики». Нагадаємо основні положення й визначення.
Генеральною сукупністю називають сукупність об'єктів,зяких проводять вибірку.
Вибірковою сукупністю, або просто вибіркою, називають сукупність випадково відібраних об'єктів.
Обсягом сукупності (вибіркової або генеральної) називають число об'єктів цієї сукупності.
Варіантой називають кожне окреме значення досліджуваної ознаки
x1, x2, …, xn...
Частотою називають число, що показує, скільки разів зустрічається та або інша варіанта. Частоти позначають відповідно m1, m2, …, mn...
Варіаційний ряд являє собою таблицю, в одному рядку якої розташовують варіанти в зростаючому або убутному порядку, а в іншій — відповідні їм частоти.
Однією з найважливіших характеристик варіаційного ряду є середня величина. Середню арифметичну визначають за формулами:
незважена
(28)
зважена
(29)
Дисперсію невзважену і зважену обчислюють за формулами:
(30)
Середнє квадратичне відхилення визначається як квадратний корінь з дисперсії.
s = ÖD (31)
Оцінки числових характеристик випадкових величин і їхні властивості.
З n дослідів оцінку математичного сподівання можна визначити як середнє арифметичне значення Х.
`х = , (33)
де 1/n - імовірність появи значення xi у кожному з n дослідів, якщо всі значення Х різні.
, (34)
Оцінка математичного сподівання, отримана за формулою (33), є лінійною функцією n незалежних випадкових величин xi, тому вона сама є випадковою величиною, а отже має свої числові характеристики: математичне сподівання й дисперсію:
(35)
(36)
Інші оцінки числових характеристик визначають за формулами:
(37)
(38)
Довірчий інтервал і довірча ймовірність
Нехай для оцінки математичного сподівання mx* потрібно визначити можливу помилку l. Призначають досить велику ймовірність b таку, що подію з цією ймовірністю можна вважати практично достовірною. b - імовірність того, що помилка не перевищує ± l, для неї справедлива рівність
P{| mx - mx*| < l} = b. (39)
Більші за абсолютним значенням помилки, чим ± l, будуть зустрічатися з імовірністю
a = 1 - b.
Перепишемо (39) у вигляді
P{ (mx*- l) < mx < (mx* + l)} = b. (40)
Рівність (40) означає, що з імовірністю b невідоме значення параметра mx буде перебувати в інтервалі L=[mx*- l, mx* + l].
Таким чином, значення b і L характеризують ступінь упевненості й величину погрішності при визначенні дійсного значення шуканого параметра mx. При цьому величину b називають довірчою ймовірністю, а величину L - довірчим інтервалом.
Приклад 6.Випадкову величину Х нормально розподілено з відомим середнім квадратичним відхиленням s, вибірковим середнім `хВ, обсягом вибірки n. Знайти довірчий інтервал для оцінки невідомого математичного сподівання m генеральної сукупності з довірчою ймовірністю b , якщо s = 4; `хВ =15,6; п = 64; b=0,95.
Рішення. Для визначення довірчого інтервалу використаємо формулу
Р(|`хВ-m|<d) = b = 2*Ф(d*Ö п /s).
Довірчий інтервал знаходимо у вигляді `хВ-d<m<`хВ+d .
За умовою 2*Ф(d*Ö п /s)=0,95, звідки Ф(d*Ö п /s)= 0,475. З таблиці значень функції Лапласа знаходимо (d*Ö п /s)=1,96;
Тоді, d=1,96*4 /Ö64=0,98.
Довірчий інтервал для оцінки m, що відповідає довірчої ймовірності b=0,95:
15,6-0,98 < m < 15,6+0,98,
або
14,62 < m < 16,58.
Приклад 7. За заданим статистичним розподілом вибірки
xі | |||||
mi |
знайти вибіркову середню хВ, дисперсію DВ, середнє квадратичне відхилення sВ.
Рішення. Значення вибіркових середньої, дисперсії, середнього квадратичного відхилення можна знайти за формулами:
sВ = ÖDВ
де n - обсяг вибірки , n = S mi.
Для спрощення обчислень введемо умовну варіанту
xі' = (xі-a)/Dx,
де а – варіанта з найбільшою частотою mi; Dx - крок варіювання:
Dx = xі+1 - xі.
За допомогою умовної варіанти знаходимо хВ і DВ за формулами:
.
Шукані значення вибіркових середньої й дисперсії визначають таким чином:
`хВ = `хВ' * Dx + а, DВ=DВ' * (Dx)2.
Найбільшу частоту (m3 = 50) має х3 = 20, тому в якості а приймаємо 20; Dx=5, тоді xі' = (xі-20)/5.
Розрахунки виконуємо в таблиці
хi | mi | xi' | xi'*mi | (xi')2*mi |
-2 | -12 | |||
-1 | -16 | |||
S |
`хВ' = 4 / 100 = 0,04, DВ'=80 / 100 - (0,04) 2=0,798.
Шукані значення вибіркових характеристик:
`хВ = 0,04*5+20=20,2;
DВ =0,798*52=19,96;
sВ = Ö19,96 = 4,47.
Завдання 7 варто виконувати після вивчення теми «Елементи регресійного й кореляційного аналізу».
Кореляційна залежність.
Кореляційною залежністю Y від Х називають функціональну залежність
yХ = j(x) (41)
Це рівняння називається рівнянням регресії Y на Х, функція j(x) - регресією Y на Х.
Коефіцієнт регресії
Кутовий коефіцієнт лінійної регресії Y на Х називають коефіцієнтом регресії й позначають rух:
yХ = rухx + а2 (42)
Якщо підбирати параметри rух і а2 за методом найменших квадратів, то одержимо:
rух = а1= Kxy* / Dx*; а2 = `y – a1`х (43)
або
, (44)
коефіцієнт кореляції, що визначає тісноту лінійного зв'язку між Y і Х:
(45)
Кореляційна таблиця
При кореляційному аналізі складають кореляційну таблицю. У першому рядку вказують значення фактору X, у першому стовпці – значення ознаки Y. У кожній внутрішній клітині вказують число спостережень відповідних ознак, на перетинанні яких розташовано клітину.
Якщо дані спостережень задано в кореляційній таблиці, параметри рівняння лінійної регресії Y на X
, (46)
можна визначити за формулами:
n = Snx = Sny. (47)
(48)
; (49)
Якщо для зручності обчислень перейти до умовних варіант
, (50)
де Dx, Dy - крок варіювання; a1, a2 - варіанти за х і у з найбільшою частотою, то для обчислення параметрів рівняння лінійної регресії з умовними варіантами маємо:
n = Snx = Sny. (51)
(52)
; (53)
Для переходу до дійсних значень застосовують формули:
`х = `х' * Dx + a1, `y = `y' * Dy + a2. (54)
sx2 = sx'2 * (Dx)2; sy2 = sy'2 * (Dy)2 ; rb = rb'. (55)
Приклад 8. Задано кореляційну таблицю розподілу 100 заводів за засобами виробництва в млн. грн. (х) і добове вироблення продукції в тоннах (у). Скласти рівняння лінійної регресії y на х.
Х Y | ny | `xy | |||||
65,83 | |||||||
75,65 | |||||||
72,5 | |||||||
81,25 | |||||||
nx | |||||||
`yx | 12,5 | 21,43 | 29,23 | 29,28 |
Рішення. У якості умовних варіант приймаємо
, тобто a1 =70; a2 =25; Dх = 10; Dу= 5.
xi' yk' | -2 | -1 | nу | nуу' | nуу'2 | nхуx'у' | ||||
-3 | -12 | |||||||||
-2 | -16 | |||||||||
-1 | -12 | |||||||||
-1 | ||||||||||
nх | ||||||||||
nxx' | -8 | -21 | S=25 | |||||||
nxх'2 | S=119 | |||||||||
nхуx'у' | S=81 | |||||||||
S= | S= | S= | ||||||||
`x' = 25/100 = 0,25; `y' = 16/100 = 0,16; sx'2 = 119/100 – (0,25) 2 = 1,128;
sy'2 = 168/100 – (0,16) 2 = 1,424;= 112.75; (x = 0,25*10+70 = 72,5;
`y = 0,16*5+25 = 25,8; sx2 = 1,128*102 = 112,8; sy2 = 1,424*52 = 35,6
rb' = rb = (0,81-0,25*0,16)/(Ö1,28 * Ö1,424) = 0,608.
Шукане рівняння:
`yх – 25,8 = 0,608 * (х-72,5) *5,97/10,618;
`yх = 0,342х + 1,03.
Необхідно зробити перевірку відповідності рівняння регресії значенням, отриманим зі спостережень:
нехай х = 60, тоді
yx=60 = (2*10+4*15+5*20+6*25+4*30)/21 = 21,428,
з рівняння регресії
yx=60 = 0,342*60 + 1,03 = 21,55; помилка становить 0,122;
нехай х=80, тоді
yx=80 = (25*10+10*30+6*35)/26 = 29,3,
з рівняння регресії
yx=80 = 0,342 * 80 + 1,03 = 28,39; помилка становить 0,84.