Властивості вибіркового середнього
31)
32)
33) Дисперсія сталої величини дорівнює нулю, тобто , де .
Додавання константи до значень випадкової величини не змінює дисперсії: .
Константу можна виносити в квадраті за знак дисперсії: .
Дисперсія випадкової змінної є невід'ємною величиною, тобто .
34) Статистична оцінка- це наближене значення шуканого параметра генеральної сукупності, яке одержано за результатами вибірки й забезпечує можливість прийняття обґрунтованих рішень про невідомі параметри генеральної сукупності. Основними властивостями статистичних оцінок є спроможність, незмі-щенність, ефективність:
o Спроможність. Статистична оцінка ®n спроможна тоді, коли при постійному збільшенні обсягу вибірки (n -"со) вона наближається до значення параметра ©, який оцінює. Статистика ©" є спроможною оцінкою параметpa 0 , коли для будь-якого додатного числа є є справедливим співвідношення
limP{©n -0>є = 0. (4.2)
Наприклад, вибіркове середнє X є спроможною оцінкою генерального середнього fi, оскільки при збільшені числа випробувань X наближається до свого математичного сподівання (див. вираз (3.45)). Спроможною оцінкою вважається і вибіркова дисперсія.
Вимога спроможності означає, що оцінка має нести практичний сенс, наближати нас до істини і не бути абсурдною. З другого боку, у більшості ситуацій можна запропонувати декілька спроможних оцінок для одного й того ж самого параметра. Отже, властивість спроможності необхідна, але недостатня вимога. її необхідно доповнити іншими вимогами.
o Незміщенність. Статистика вважається незміщеною, якщо її математичне сподівання дорівнює параметру, що оцінюється. Вибіркове середнє X є незміщеною оцінкою генерального середнього fi, оскільки м[ X ] =ц, чого не можна сказати, наприклад, про вибіркові поo Ефективність. Точкова оцінка називається ефективною, якщо вона має найменшу міру дисперсії вибіркового розподілу у порівнянні з аналогічними оцінками, тобто виявляє найменшу випадкову варіативність. Наприклад, серед трьох показників положення центру нормального розподілу (середнього Х, медіани ма і моди Мо) найбільш ефективною оцінкою вважається Х і найменш ефективною - Мо, оскільки для їхніх дисперсій характерказники дисперсії.
Властивості вибіркового середнього
· Нехай — функція вибіркового розподілу. Тоді для будь-якого фіксованого функція є (невипадковою) функцією дискретного розподілу.
· Вибіркове середнє — незміщена оцінка теоретичного середнього значення: .
· Вибіркове середнє — строго конзистентна оцінка теоретичного середнього: майже напевне при .
· Вибіркове середнє — асимтотично нормальна оцінка. Нехай дисперсія випадкових величин скінченна і ненульова, тобто . Тоді за розподілом при , де — нормальний розподіл з середнім і дисперсією .
· Вибіркове середнє з нормальної вибірки — ефективна оцінка її середнього.
36) а) дисперсія оцінок, даних j-му напрямку
Mj визначається за формулою (5.13), а їх значення наведені в табл. 5.8, п.3. Для прикладу розрахуємо дисперсію оцінок по 1-му напрямку (Mj=92.5)
б) коефіцієнт варіації оцінок, даних j-oму напрямку
Для першого напрямку коефіцієнт варіації оцінок складе
в) загальна дисперсія оцінок
де
г) загальна дисперсія рангів
Загальна дисперсія оцінок та рангів відображає узагальнену характеристику узгодженості думок експертів по всіх напрямках, в той час як показники, які розраховані в п.п. а); б) - тільки по окремих напрямках. Основними властивостями статистичних оцінок є спроможність, незмі-щенність, ефективність:
o Спроможність. Статистична оцінка ®n спроможна тоді, коли при постійному збільшенні обсягу вибірки (n -"со) вона наближається до значення параметра ©, який оцінює. Статистика ©" є спроможною оцінкою параметpa 0 , коли для будь-якого додатного числа є є справедливим співвідношення
limP{©n -0>є = 0. (4.2)
Наприклад, вибіркове середнє X є спроможною оцінкою генерального середнього fi, оскільки при збільшені числа випробувань X наближається до свого математичного сподівання (див. вираз (3.45)). Спроможною оцінкою вважається і вибіркова дисперсія.
Вимога спроможності означає, що оцінка має нести практичний сенс, наближати нас до істини і не бути абсурдною. З другого боку, у більшості ситуацій можна запропонувати декілька спроможних оцінок для одного й того ж самого параметра. Отже, властивість спроможності необхідна, але недостатня вимога. її необхідно доповнити іншими вимогами.
o Незміщенність. Статистика вважається незміщеною, якщо її математичне сподівання дорівнює параметру, що оцінюється. Вибіркове середнє X є незміщеною оцінкою генерального середнього fi, оскільки м[ X ] =ц, чого не можна сказати, наприклад, про вибіркові поo Ефективність. Точкова оцінка називається ефективною, якщо вона має найменшу міру дисперсії вибіркового розподілу у порівнянні з аналогічними оцінками, тобто виявляє найменшу випадкову варіативність. Наприклад, серед трьох показників положення центру нормального розподілу (середнього Х, медіани ма і моди Мо) найбільш ефективною оцінкою вважається Х і найменш ефективною - Мо, оскільки для їхніх дисперсій характерказники дисперсії.
37) Помилки вибіркового спостереження виникають внаслідок обстеження частини сукупності, або при порушенні правил формування вибіркової сукупності. Вони проявляються у розбіжності між генеральними і вибірковими характеристиками. Ці помилки поділяються на випадкові та систематичні. Випадкові помилки (помилки репрезентативності) можна оцінити із заданим рівнем імовірності. Систематичні помилки, що виникають внаслідок невдалого відбору, оцінюванню не підлягають, тому їх не можна враховувати.
Випадкові помилки вибіркового спостереження залежать від двох факторів:
- чисельність вибіркової сукупності ( або частки чи процента відбору);
- варіації ознаки.
Доведено, що чим більшою є чисельність вибіркової сукупності (частка відбору), тим меншою є помилка вибіркового спостереження, і навпаки, чим більшою є варіація ознаки, Тим більша й помилка.
Залежність величини помилки вибіркового спостереження від названих факторів виражається через формули граничної помилки вибірки:
а) при повторному випадковому відборі гранична помилка визначається
- для середньої = t
- для частки = t
Приклад розрахунку помилок середньої та частки при випадковому повторному відборі. Обстежено 200 одиниць продукції, з яких 150 відповідають вимогам, а 50 – не відповідають. Середня вага одиниці продукції у вибірці – 850 г, дисперсія ваги – 184.
Для узагальнюючої характеристики помилки вибірки визначають середню
помилку. Середня помилка вибірки визначається за формулою:
Таблиця 21. Дані вибіркового обстеження урожайності зернових
Інтервал Ni Yi Yi(Ni (Yi-Yс)2(Ni
33,0 35,2 3 34,08 102,24 103,553925
35,16 37,32 3 36,24 108,72 41,4081331
37,32 39,48 1 38,4 38,4 2,41864704
39,48 41,64 9 40,56 365,04 3,29204736
41,64 43,8 9 42,72 384,48 68,7970714
Разом 25
998,88 219,469824
Знайдемо вибіркову середню:
Вибіркова дисперсія буде дорівнювати:
Отже середня помилка вибірки для середньої арифметичної буде
дорівнювати:
, t = 2
Підставивши ці дані у формулу граничної помилки вибірки при безповторній
вибірці матимемо:
Можливі границі середньої в генеральній сукупності:
Отже з ймовірністю 0,95 можна стверджувати, що різниця між вибірковою і
генеральною середніми не перевищує 5,78 ц/га, а середня врожайність
знаходиться в межах від 34,14 до 45,74 ц/га
38) Розподілі Стьюдента - це розподіл випадкової величини
т=% (3.62)
де випадкові величини и і X незалежні, и має стандартний нормальний розподіл N(0,1), а X- розподіл хі-квадрат з п ступенями вільності. При цьому п називається "числом ступенів вільності" розподілу Стьюдента.
На рис. 3.51. показано сімейство графіків розподілу Стьюдента для трьох ступенів вільності (1; 2; 8), а також графік стандартного нормального розподілу N(0,1)
Ритерій узгодженості Стьюдента - статистичний критерій згоди, заснований на порівнянні з розподілом Стьюдента (t-розподілом). Розроблений англійським хіміком-харчовиком Вільямом Госсетом (псевдонім — Стьюдент). Для практичного вивчення робочих процесів закон нормального розподілу часто не підходить, хоча існують підстави вважати, що змінна розподілена нормально. Це пов'язано з тим, що як аргумент до нормального розподілу входять математичне сподівання та СКВ , які звичайно залишаються невідомими, тому його замінюють розподілом Стьюдента, який застосовується для нормально розподіленої послідовності. Закон розподілу
,
де - взаємно незалежні нормально розподілені випадкові величини з і довільними дисперсіями .
Закон Стьюдента свідчить, що залежить від числа ступенів вільності та величини . Критерій може набувати різних форм, а -розподіл лежить в основі теорії малих вибірок, яка відіграла значну роль в плануванні експериментів.
Криві розподілу
Криві розподілу
Максимуми частоти нормального та -розподілів лежать при одному й тому ж значенні абсциси. Проте на відміну від нормального розподілу висота і ширина кривих нормованого -розподілу залежать від числа ступенів вільності відповідного СКВ. Чим менше , тим більш похилий хід має крива при одному й тому ж значенні . При -розподіл переходить у нормальний розподіл. Відповідно до цього для ходу кривої, який залежить від , межі інтегрування при заданій надійній імовірності все більше віддаляються від середнього значення зі зменшенням числа ступенів вільності . Так, для = 0,95 виміряні значення не лежать в області ± 25. Цей інтервал стає тим ширшим, чим менше вимірювань було проведено
40) першу чергу розглянемо побудову довірчого інтервалу для генеральних середньої та частості w при достатньо великих вибірках (при n>30-40). Цей підхід побудовано на знані точного чи асимптотичного розподілу вибіркових характеристик.
У такому випадку довірчий інтервал обирається симетричним відносно параметру θ, тобто (θ-Δ, θ+Δ), а найбільше відхилення Δ вибіркової середньої (частості), від генеральної середньої (частості), яке можна задати з довірчою ймовірністю γ, називається граничною похибкою вибірки. За достатньо великою кількістю елементів вибірки користуючись центральною граничною теоремою можна довести наступне твердження:
Ймовірність того, що відхилення вибіркової середньої (або частості) від генеральної середньої (або частості), не перевищить Δ>0 дорівнює:
41) Розглянемо тепер побудову довірчого інтервалу для генеральної середньої та частості за вибірками малого об’єму (n<10 – 20). В цьому випадку наведені раніше методи побудови інтервальних оцінок для генеральної частості та генеральної середньої не можна застосовувати в силу наступних обставин:
- необґрунтованою стає висновок про нормальний закон розподілу вибіркових середніх та частості (так як його зроблено з центральної граничної теореми).
- необґрунтованою стає заміна невідомих генеральної дисперсії та частості їх точковими оцінками, так як з закону про великі числа, це можливо лише при великих n.
Задача побудови довірчого інтервалу для генеральної середньої може бути вирішеною, якщо в генеральної сукупності ознака має нормальний розподіл. Однак на практиці майже завжди генеральна дисперсія (як і генеральна середня ) невідома. Якщо замінити σ2 її найкращою оцінкою за вибіркою, а саме – виправленою вибірковою дисперсією, то велику цікавість для практичного застосування являє розподіл вибіркової статистики або
Уявимо цю статистику у вигляді
42) Статистичні ряди розподілу є одним з найважливіших елементів статистики. Вони являють собою складову частину методу статистичних зведень і групувань. Проте практично жодне із статистичних досліджень неможливо провести без попереднього представлення результатів зведення й групування матеріалів статистичного спостереження. А подібні результати подаються у вигляді статистичних рядів розподілу.
Статистичний ряд розподілу — впорядкований розподіл одиниць досліджуваної сукупності на групи за групувальною (варіативною) ознакою. Вони характеризують склад (структуру) досліджуваного явища, дозволяють судити про однорідність сукупності, межі її зміни, закономірності розвитку досліджуваного об'єкта. Залежно від ознаки статистичні ряди розподілу діляться на:
1. атрибутивні (якісні);
2. варіаційні (кількісні):
· дискретні;
· інтервальні.
Атрибутивні ряди розподілу
Атрибутивні ряди утворюються за якісними ознаками, якими можуть виступати посада, професія, стать, освіта тощо.
Приклад 1 | |||
Освіта робітників | Кількість робітників | ||
абсолютне, чол. | відносне, % | ||
вища | 15,4 | ||
неповна вища | 19,2 | ||
середня спеціальна | 26,9 | ||
середня | 38,5 | ||
Разом |
Тут групувальною ознакою виступає освіта працівників підприємства (вища – середня). Дані ряди розподілу є атрибутивними, оскільки варіаційна ознака представлена не кількісними, а якісними показниками.
Варіативні ряди розподілу
Варіаційні ряди будуються на основі кількісної групуючої ознаки. Варіаційні ряди складаються з наступних елементів:
· варіант — окремих значень варіаційної ознаки, що їх приймає ця ознака в ряді розподілу. Варіанти можуть бути позитивними й негативними, абсолютними й відносними;
· частот — чисельностей окремих варіант або кожної з груп варіаційного ряду.
Частоти, виражені в частках одиниці або у відсотках, називаються частостями. Сума частот називається обсягом сукупності й визначає число елементів усієї сукупності (повна сума дорівнює одиниці або 100%). Заміна частот частостями дозволяє зіставляти варіаційні ряди з різним числом спостережень.
Варіаційні ряди залежно від характеру варіації підрозділяються на дискретні й інтервальні. Дискретні ряди розподілу засновані на дискретних (перервних) ознаках, що мають лише цілі значення (наприклад, тарифний розряд робітників, число дітей у родині тощо); інтервальні ряди розподілу базуються на неперервно змінному значенні ознаки, що приймає будь-які (у тому числі й дробові) кількісні вирази, тобто значення ознак таких рядів задається у вигляді інтервалу.
За наявності досить великої кількості варіантів значень ознаки первинний варіаційний ряд стає важкооглядовим, і тому лише безпосередній його розгляд не дає повного уявлення про розподіл одиниць за значенням ознаки в сукупності, що розглядається. У цьому випадку першим кроком в упорядкуванні ряду є його ранжирування — розташування всіх варіант у зростаючому (спадаючому) порядку.
Для побудови дискретного ряду з невеликим числом варіант спочатку виписуються всі ці варіанти та значення ознаки, а потім підраховується частота повторення варіант. Ряд розподілу прийнято оформляти у вигляді таблиці, що складається із стовпчиків (або/та рядків), де в одних представлені варіанти, а в інших — частоти. Для побудови ряду розподілу дискретних ознак, представлених у вигляді інтервалів, необхідно встановити оптимальне число груп (інтервалів), на які слід розбити всі одиниці досліджуваної сукупності.
Розрахунок середніх величин рядів розподілу
Середні величини розраховуються, як правило, для отримання узагальнених кількісних характеристик рівня певної варіаційної ознаки за сукупністю однорідних основних властивостей одиниць конкретного явища або процесу. У статистиці всі середні величини позначаються як .
Існує кілька видів середніх величин. Основною середньою величиною є середня степенева. Вона має такий вигляд:
,
де — середня величина,
— змінна величина ознаки варіанти,
— показник степеня середньої,
— кількість ознак чи варіант.
В залежності від значення показника степеня середньої, вона приймає наступний вид:
· невиважена середня арифметична — коли :
;
· виважена середня арифметична — присутні частоти (або маси) :
.
43) Критерії асиметрії та ексцесу застосовують для приблизної перевірки гіпотези про нормальність емпіричного розподілу. Асиметрія характеризує ступінь несиметричності, ексцес - ступінь загостреності (згладженості) кривої диференціальної функції емпіричного розподілу в порівнянні з функцією щільності нормального розподілу.
Для нормального розподілу N(¿1,0) з математичним сподіванням /г і дисперсією а1третій і четвертий центральні моменти мають сенс асиметрії і ексцесу. Відповідні коефіцієнти А і Е дорівнюють нулю:
Отже, нормальний розподіл є симетричний відносно середнього значення і є "ідеальний" - не загострений і не згладжений.
Дисперсії асиметрії та ексцесу відповідно дорівнюють
Вважається, що при нормальному розподілі вибіркові показники асиметрії та ексцесу дорівнюватимуть нулю, але реально таке майже не спостерігається. Тому емпіричний розподіл вважають близьким до нормального (приймають нульову гіпотезу), якщо виконуються умови:
|4x| * 3ЩА) і К| ^ 5л/ОД . (5.3)
Технологічно у цьому методі розраховують показники tA і tE
Про достовірну відмінність емпіричного розподілу від нормального свідчать показники tA і tE, якщо приймають значення 3 і більше.
44)
45)
46)