Генеральної частки за великими вибірками
Теорема 3.1Ймовірність того, що відхилення вибіркового середньго (чи частки) не перевищить число Δ>0 (за абсолютною величиною), дорівнює:
, (3.4) де , | , (3.5) де , |
- функція (інтеграл ймовірностей) Лапласа.
Доведення. Вибіркове середнє і вибіркова частка w повторної вибірки є сумою n незалежних випадкових величин , де має один і той самий закон розподілу – зі скінченним математичним сподіванням і дисперсією. Звідси, на основі теореми Ляпунова при розподіли і необмежено наближаються до нормальних (практично при розподіли і w можна вважати наближено нормальними). Для безповторної вибірки і w є сумою залежних випадкових величин. Можна показати, що і в цьому випадку при закон розподілу і w наближається до нормального.
Формули (3.4) і (3.5)випливають безпосередньо із властивості нормального закону . Ці формули отримали назву формул довірчої ймовірності для середнього та частки.
Означення 3.2 Середнє квадратичне відхилення вибіркового середнього та вибіркової частки власно-випадкової вибірки називається середньою квадратичною (стандартною) похибкою вибірки.
Наслідок 1 При заданій довірчій ймовірності γ гранична похибка вибірки дорівнює t-кратній величині середньої квадратичної похибки, де , тобто
,(3.6)
. (3.7)
Наслідок 2Інтервальні оцінки (довірчі інтервали) для генерального середнього і генеральної частки можуть бути знайдені за формулами:
(3.8)
(3.9)
Оскільки генеральні частка p і дисперсія невідомі, то в формулах табл. 3.1 заміняємо їх спроможними оцінками по вибірці – відповідно w і , бо при достатньо великому об’ємі вибірки n практично достовірно, що
Таблиця 3.1
Оцінюваний параметр | Формули середніх квадратичних похибок вибірки | |
повторна вибірка | безповторна вибірка | |
Середнє | (3.10) | (3.11) |
Частка | (3.12) | (3.13) |
При визначенні середньої квадратичної похибки вибірки для частки, якщо навіть w невідома, в якості pq можна взяти його максимально можливе значення .
◄ Приклад 3.3При дослідженні виробітку 1000 робітників цеху в звітному році у порівнянні з попереднім за схемою власно-випадкової вибірки було відібрано 100 робітників. Отримані наступні дані (див. перші дві графи табл. 1.1, розділ 1). Необхідно визначити: а) ймовірність того, що середній виробіток робітників цеху відрізняється від попереднього вибіркового не більше, ніж на 1% (за абсолютною величиною); б) межі, між якими з ймовірністю 0,9545 знаходиться середній виробіток робітників цеху. Розглянути випадки повторної і безповторної вибірки.
Розв’язання. а) Маємо , . Раніше в прикладі 1.8були обчислені , . Знайдемо середню квадратичну похибку вибірки для середнього:
для повторної вибірки | для безповторної вибірки |
Тепер шукану довірчу ймовірність знаходимо за (3.5):
(Значення знаходимо за стандартною таблицею, яку можна знайти в додатках будь – якої книжки, що запропонована у переліку використаної
літератури).
Отже, ймовірність того, що вибіркове середнє відрізняється від генерального середнього не більше, ніж на 1% (за абсолютною величиною),
дорівнює 0,715 для повторної і 0,741 для безповторної вибірок.
б) Знайдемо граничні похибки повторної і безповторної вибірок за формулою (2.22), в якій (знаходимо із співвідношення ).
. | . |
Тепер шуканий довірчий інтервал визначаємо за (3.8):
або . | або . |
Таким чином, з надійністю 0,9545 середній виробіток робітників цеху знаходиться в межах від 117,33 до 121,07%, якщо вибірка повторна, і від 117,03 до 120,97%, якщо вибірка безповторна.►
Об’єм вибірки
Для проведення вибіркового спостереження досить важливо правильно визначити об’єм вибірки n, який значною мірою визначає необхідні при цьому часові, трудові і вартісні витрати. Для визначення n необхідно задати надійність (довірчу ймовірність) оцінки γ і точність (граничну похибку вибірки) Δ.
Об’єм вибірки знаходиться з формули, що виражає граничну похибку вибірки через дисперсію ознаки. Наприклад, для повторної вибірки фо-
рмула має вигляд: , звідки , де . Аналогічно можуть бути отримані й інші формули об’єму вибірки, які зведемо в таблицю 3.2. Для визначення об’єму вибірки необхідно знати характеристики генеральної сукупності або , які невідомі, і для визначення яких передбачаєтся проведення вибіркового спостереження.
В якості цих характеристик зазвичай використовують вибіркові дані
або попереднього дослідження в аналогічних умовах, тобто вважають (або ) або .
Таблиця 3.2
Оцінюваний параметр | Повторна вибірка | Безповторна вибірка |
Генеральне середнє | (3.14) | (3.15) |
Генеральна частка | (3.16) | (3.17) |
При оцінці генеральної частки (якщо про неї нічого невідомо) замість проведення пробної вибірки можна в якості взяти його максимально можливе значення, рівне 0,25, але при цьому необхідно враховувати, що знайдене значення об’єму вибірки буде більшим від мінімально необхідного для заданих точності та надійності оцінок.
◄ Приклад 3.4За умовою прикладу 3.3визначити об’єм вибірки, при якому із ймовірністю 0,9973 відхилення середнього виробітку робітників у вибірці від середнього виробітку всіх робітників цеху не перевищить 1% (за абсолютною величиною).
Розв’язання. В якості невідомого значення для визначення об’єму вибірки беремо його спроможну оцінку , знайдену раніше в прикладі 3.3. Враховуючи, що і , знайдемо об’єм повторної вибірки за (3.14), тобто . Об’єм безповторної вибірки за (3.15):
.
Як бачимо, при одній і тій самій точності і надійності
оцінки, об’єм безповторної вибірки значно менший, ніж повторної. ►