Charakteristiky variability 9 страница
Z interpretačního hlediska je jistou nevýhodou rozptylu to, že je vyjádřen ve čtvercích měrové jednotky příslušné číselné proměnné.
Směrodatná odchylka
Variabilitu je rovněž možné popisovat pomocí nezáporné druhé odmocniny z rozptylu, která nese název směrodatná odchylka
(1.60) |
Směrodatná odchylka n hodnot x1, x2, ..., xn, které nemusí být uspořádány, je definována jako kvadratický průměr odchylek jednotlivých hodnot sledované proměnné od jejich aritmetického průměru
(1.61) |
Směrodatná odchylka udává, jak se v průměru ve zkoumaném statistickém souboru odchylují jednotlivé hodnoty sledované proměnné od jejich aritmetického průměru. Směrodatná odchylka je uvedena ve stejných měrových jednotkách jako sledovaná proměnná, což je její značnou výhodou. Jestliže chceme symbolicky rozlišit směrodatnou odchylku základního souboru a směrodatnou odchylku výběrového souboru, tak směrodatná odchylka základního souboru se označuje zpravidla s a směrodatná odchylka výběrového souboru s.
Průměrná odchylka
Průměrná odchylka n hodnot, x1, x2, ..., xn, které nemusí být uspořádány, je definována jako aritmetický průměr absolutních hodnot odchylek jednotlivých hodnot sledované proměnné od jejich aritmetického průměru
(1.62) |
Jsou-li hodnoty proměnné setříděny do tabulky rozdělení četností, vypočítá se průměrná odchylka
(1.63) |
Průměrná odchylka je uvedena ve stejných měrových jednotkách jako sledovaná proměnná.
Kvantilové odchylky
Kvantilové odchylkyjsou definovány jako aritmetický průměr kladných odchylek sousedních kvantilů.
Kvartilová odchylka je definována jako aritmetický průměr kladných odchylek sousedních kvartilů
(1.64) |
V čitateli vztahu (1.64) je kvartilové rozpětí. Kvartilová odchylka se uvádí ve stejných měrových jednotkách jako sledovaná proměnná.
Charakteristiky relativní variability
Pomocí charakteristik absolutní variability nelze srovnávat variabilitu proměnné u dvou nebo více statistických souborů, které se výrazně liší polohou sledované proměnné, nebo variabilitu dvou nebo více proměnných, které jsou vyjádřeny v různých měrových jednotkách. V těchto případech používáme charakteristiky relativní variability, které vliv polohy proměnné nebo vliv měrové jednotky proměnné vylučují, neboť dávají do poměru charakteristiku absolutní variability k aritmetickému průměru nebo k mediánu.
Variační koeficient
Variační koeficient je nejznámější charakteristikou relativní variability. Je definován jako podíl směrodatné odchylka a aritmetického průměru
(1.65) |
Variační koeficient je bezrozměrné číslo, po vynásobení stem udává variabilitu v procentech. Velmi hrubé pravidlo říká, že variační koeficient vyšší než 50 % značí poměrně velkou nesourodost statistického souboru. Variační koeficient po vynásobení stem udává, z kolika procent se směrodatná odchylka podílí na aritmetickém průměru.
Skutečnost, že variační koeficient je možné interpretovat v procentech, může zavádět uživatele v tom smyslu, že za definiční obor variačního koeficientu považují pouze interval od 0 do 1 nebo v procentech od 0 % do 100 %, což je veliký omyl. Protože směrodatná odchylka může být obecně větší než aritmetický průměr vypočtený ze stejných hodnot jako směrodatná odchylka, může být tedy variační koeficient větší než 1 nebo v procentech větší než 100 %. Protože aritmetický průměr může být obecně i záporné číslo a směrodatná odchylka je nezáporné číslo, může být tedy variační koeficient i číslo záporné. Variační koeficient se tedy obecně pohybuje v intervalu (-¥, +¥).
Variační koeficient se používá mimo jiné hlavně tehdy, srovnáváme-li variabilitu hodnot dvou nebo více různorodých proměnných vyjádřených zpravidla v různých měrových jednotkách. Variační koeficient používáme rovněž při srovnávání variability hodnot stejné proměnné ve dvou nebo více statistických souborech, jestliže se aritmetické průměry dané proměnné v těchto statistických souborech podstatně liší.
Rovněž variační koeficient má některé důležité vlastnosti:
1. | Přičteme-li ke všem hodnotám, resp. odečteme-li od všech hodnot, proměnné libovolnou kladnou konstantu (a > 0), variační koeficient se zmenší | ||
(1.66) | |||
resp. zvětší | |||
(1.67) | |||
2. | Násobíme-li, resp. dělíme-li, všechny hodnoty proměnné libovolnou nenulovou konstantou (k ≠ 0) variační koeficient se nezmění | ||
(1.68) | |||
Ze vztahů (1.66) a (1.67) vyplývá, že i při stejné absolutní variabilitě dvou nebo více statistických souborů mohou mít tyto statistické soubory různou relativní variabilitu, protože při
(1.69) |
je
(1.70) |
Při stejné relativní variabilitě ve dvou nebo více statistických souborech může existovat různá absolutní variabilita těchto statistických souborů.
Charakteristika komplexní variability
Protože směrodatná odchylka měří objektivně absolutní variabilitu a variační koeficient měří objektivně relativní variabilitu, byla zkonstruována charakteristika komplexní variability hodnot kardinální proměnné, která měří variabilitu hodnot jak z hlediska absolutních rozdílů mezi hodnotami proměnné, tak z hlediska podílů hodnot proměnné.
Charakteristika komplexní variability hodnot kardinální proměnné je z n hodnot x1, x2, ..., xn, které nemusí být uspořádány a kde xi > 0, i = 1, 2, ..., n, definována
(1.71) |
Upravíme čitatele vztahu (1.71)
neboť platí, že
a
Čitatel vztahu (1.71) je tedy
(1.72) |
Jestliže dosadíme vztah (1.72) do vztahu (1.71), získáváme
tedy
(1.73) |
Výraz v závorce vztahu (1.73)
(1.74) |
je kovariance hodnot proměnné x a logaritmů hodnot proměnné x, kterou značíme c(x, ln x). Charakteristiku komplexní variability hodnot kardinální proměnné můžeme tedy zapsat
(1.75) |
Charakteristika komplexní variability hodnot kardinální proměnné má opět některé důležité vlastnosti:
1. | Přičteme-li ke všem hodnotám proměnné libovolnou kladnou konstantu (a > 0), charakteristika komplexní variability hodnot kardinální proměnné se zmenší. |
2. | Odečteme-li od všech hodnot proměnné kladnou konstantu a < xmin, charakteristika komplexní variability hodnot kardinální proměnné se zvětší. |
3. | Násobíme-li všechny hodnoty proměnné kladnou konstantou (k > 0), charakteristika komplexní variability hodnot kardinální proměnné se násobí touto konstantou. |
Příklad 1.17
Ze 42 hodnot xi, i = 1, 2, …, 42 byl vypočítán aritmetický průměr a rozptyl sx2 = 2,5. Při kontrole bylo zjištěno, že chybí tři jednotky s hodnotami x43 = 4,2, x44 = 7,3 a x45 = 9,6. Opravte uvedený aritmetický průměr a rozptyl.
Řešení:
Vyjdeme ze vzorce prostého aritmetického průměru (1.12). Musíme však odlišovat původní (špatnou) hodnotu aritmetického průměru od nové (správné) hodnoty aritmetického průměru. Rovněž původní (špatný) počet statistických jednotek npuv = 42 a nový (správný) počet statistických jednotek nnov = 45 (po přičtení chybějících tří statistických jednotek). Původní aritmetický průměr je
odtud součet původních 42 hodnot je
K tomuto součtu původních 42 hodnot je třeba přičíst chybějící tři hodnoty
Tím jsme získali součet všech 45 hodnot. Nyní vypočteme opravený aritmetický průměr
tj. správný aritmetický průměr je
Nyní je třeba opravit rozptyl. Vyjdeme přitom z prostého rozptylu ve výpočtovém tvaru (1.50)
tedy špatný rozptyl
odtud součet čtverců původních 42 hodnot
Potřebujeme ale součet čtverců všech 45 hodnot
Nyní vypočteme opravený rozptyl všech 45 hodnot
Opravený rozptyl tedy je
Příklad 1.18
Sledovali jsme proměnnou x a dodatečně jsme zjistily chyby u dvou jednotek. Místo 90 má být správně 100 a místo 125 má být správně 155. Ostatních 18 údajů je správných. Opravte vypočítaný aritmetický průměr a rozptyl, byl-li aritmetický průměr 115 a rozptyl 900.
Řešení:
Počet statistických jednotek se v tomto případě nemění, a tedy npuv = nnov = n = 18 + 2 = 20 (18 správných hodnot a 2 špatné hodnoty). Nejprve opět opravíme vypočítaný aritmetický průměr a opět vyjdeme ze vzorce prostého aritmetického průměru (1.12)
Odtud součet 20 hodnot, mezi kterými jsou ale i dvě špatné hodnoty, je
Tento součet 20 hodnot je však špatný, neboť místo 90 je třeba započítat 100 (tedy o 10 více) a místo 125 je třeba započítat 155 (tedy o 30 více). Získáme tak opravený součet 20 hodnot
Nyní již známe správný součet 20 hodnot a můžeme tedy vypočítat správný aritmetický průměr
opravený aritmetický průměr je tedy
Nyní přistoupíme k rozptylu. Opět vyjdeme z prostého rozptylu ve výpočtovém tvaru (1.50)
odtud součet čtverců 20 hodnot, mezi nimiž jsou i dvě hodnoty nesprávné, je
Místo 902 je třeba započítat 1002 (nelze přičíst 102) a místo 1252 je třeba započítat 1552 (nelze přičíst 302)
což je opravený součet čtverců 20 hodnot. Nyní vypočteme opravený rozptyl
opravený rozptyl je tedy
Příklad 1.19
Obchodní firma odebírá určitý druh zboží od čtyř výrobců. První výrobce dodává zboží v průměru za 210 Kč a směrodatná odchylka jeho ceny (cena během roku kolísá) je 30 Kč, dodávky tohoto výrobce tvoří 20 % celkového odběru firmy. Odběrní cena od druhého výrobce je v průměru 198 Kč se směrodatnou odchylkou 32 Kč a jeho podíl na celkových dodávkách firmy je 10 %. Odběrní cena od třetího výrobce je v průměru 220 Kč se směrodatnou odchylkou 34 Kč, podíl tohoto výrobce na celkových dodávkách firmy je 40 %. Podíl posledního výrobce je 30 % a zboží dodává v průměru za 200 Kč se směrodatnou odchylkou 33 Kč. Stanovte průměrnou cenu výrobku a celkový rozptyl ceny, se kterým musí obchodní firma počítat od všech výrobců.
Řešení:
Jedná se o čtyři výrobce, statistický soubor je tedy rozdělen do k = 4 dílčích podsouborů, přičemž známe aritmetické průměry v jednotlivých dílčích podsouborech
směrodatné odchylky v jednotlivých dílčích podsouborech
a relativní četnosti v jednotlivých dílčích podsouborech
Nejprve je třeba vypočítat rozptyly six2 v dílčích podsouborech. Potřebné výpočty jsou obsaženy v tabulce 1.34.
Tabulka 1.34 | |||||||||||
i | |||||||||||
0,2 0,1 0,4 0,3 | 302 = 322 = 342 = 332 = | 1 024 1 156 1 089 | 210 ∙ 0,2 = 198 ∙ 0,1 = 220 ∙ 0,4 = 200 ∙ 0,3 = | 19,8 | 900 ∙ 0,2 = 1 024 ∙ 0,1 = 1 156 ∙ 0,4 = 1 089 ∙ 0,3 = | 102,4 462,4 326,7 | |||||
Celkem | X | X | 1,0 | X | 209,8 | 1 071,5 | |||||
(210 − 209,8)2 ∙ 0,2 = (198 − 209,8)2 ∙ 0,1 = (220 − 209,8)2 ∙ 0,4 = (200 − 209,8)2 ∙ 0,3 = | 0,008 13,924 41,616 28,812 | ||||||||
84,360 |
Z tabulky 1.34 získáváme
Protože neznáme absolutní četnosti ni, i = 1, 2, 3, 4, v jednotlivých dílčích podsouborech, ale známe pouze relativní četnosti pi, i = 1, 2, 3, 4, k výpočtu použijeme vždy vzorec vyjádřený pomocí relativních četností. Celkový aritmetický průměr za celý statistický soubor dohromady vypočteme s využitím vztahu (1.13)