Переваги вибіркового методу
1. Дозволяє суттєво економити на витраті ресурсів (матеріальних, трудових, часових);
2. Являється єдино можливиму випадку нескінченної генеральної сукупності чи у випадку, коли дослідження пов’язане зі знищенням об’єктів, за якими ведеться спостереження (наприклад, дослідження довговічності електричних лампочок, граничних режимів роботи приладів і т.п.);
3. При тих самих витратах ресурсів дає можливість проведення поглибленого дослідження за рахунок розширення програми дослідження;
4. Дозволяє знизити похибки реєстрації, тобто розбіжності між істинним та зареєстрованим значеннями ознаки.
Основний недолік вибіркового методу – похибки дослідження, чи похибки репрезентативності (представництва).
Для того, щоб за даними вибірки мати можливість робити висновки про генеральну сукупність, вона повинна бути вибрана випадково. Випадковість відбору елементів у вибірку досягається дотриманням принципу рівної можливості всім елементам генеральної сукупності бути відібраними. На практиці це досягається тим, що постачання елементів у вибірку проводиться методом жеребкування (лотереї) чи за допомогою випадкових чисел, що містяться у спеціальних таблицях, чи вироблених ЕОМ за допомогою датчика випадкових чисел.
Вибірка називається репрезентативною(представницькою), якщо вона достатньо добре відтворює генеральну сукупність.
Розрізняють наступні види вибірок:
1. власно-випадкова вибірка, утворена випадковим вибором елементів
без роздроблення на частини чи групи;
2. механічна вибірка, в яку елементи з генеральної сукупності вибира-
ються через певний інтервал. Наприклад, якщо об’єм вибірки має складати 10% (10%-на вибірка), то відбирається кожний 10-й її елемент і т.д.;
3. типова (стратифікована) вибірка, в яку випадковим чином відбира-
ються елементи з типових груп, на які за деякою ознакою розбивається генеральна сукупність;
4. серійна (гніздова) вибірка, в яку випадковим чином відбираються не
елементи, а цілі групи сукупності (серії), а самі серії підлягають загальному спостереженню.
Використовують два способи утворення вибірки:
- повторний відбір(за схемою поверненої кулі), коли кожен елемент, випадково відібраний і досліджений, повертається у загальну сукупність і може бути повторно відібраним;
- безповторний відбір(за схемою неповерненої кулі) , коли відібраний елемент не повертається у загальну сукупність.
Математична теорія вибіркового методу базується на аналізі власно-випадкової вибірки. Розглядом цієї вибірки ми і обмежимось.
Позначимо
– значення ознаки (випадкової величини );
N та n – об’єми генеральної та вибіркової сукупностей;
та – кількість елементів генеральної та вибіркової сукупностей зі значеннями ознаки ;
та – кількість елементів генеральної та вибіркової сукупностей, що мають дану ознаку.
Середні арифметичні розподілу ознаки в генеральній та вибірковій сукупностях називаються відповідно генеральним та вибірковим середнім,
а дисперсії цих розподілів – генеральною та вибірковою дисперсіями.
Відношення кількості елементів генеральної та вибіркової сукупностей, що мають певні ознаки , до їх об’ємів, називаються відповідно генеральною і вибірковою частками. Всі формули зведемо в таблицю 2.1.
Таблиця 2.1
Найменування характеристики | Генеральна сукупність | Вибірка |
Середнє | (2.1) | (2.2) |
Дисперсія | (2.3) | (2.4) |
Частка | (2.5) | (2.6) |
Найважливішим завданням вибіркового методує оцінка параметрів (характеристик) генеральної сукупності за даними вибірки. Теоретичною основою застосування вибіркового методу є закон великих чисел, згідно з яким при необмеженому збільшенні об’єму вибірки практично вірогідно, що випадкові вибіркові характеристики як завгодно близько наближаються (збігаються за ймовірністю) до певних параметрів генеральної сукупності.
Поняття оцінки параметрів
Нехай розподіл ознаки X – генеральної сукупності – задається функцією ймовірностей (для дискретної випадкової величини X) або густиною ймовірностей (для неперервної випадкової величини X), яка містить невідомий параметр θ. Наприклад, це параметр λ в розподілі Пуассона чи параметри a та для нормального закону розподілу і т.д. Про параметр θ намагаються судити по вибірці, що складається із значень (варіант) . Ці значення можна розглядати як частинні значення (реалізації) n незалежних випадкових величин ,кожна з яких має той самий закон розподілу, що й сама випадкова величина X.
Означення 2.1Оцінкою параметра θ називають кожну функцію результатів спостереження над випадковою величиною X ( по-іншому – статистику), за допомогою якої роблять висновки про значення параметра θ: .
Оскільки – випадкові величини, то і оцінка (на відміну від параметра, що оцінюється – величини невипадкової) є випадковою величиною, яка залежить від закону розподілу випадкової величини X та числа n.
Завжди існує множина функцій від результатів спостережень (від n «екземплярів» випадкової величини X), які можна запропонувати в якості параметра θ. Наприклад, якщо параметр θ є математичним сподіванням величини X, тобто генерального середнього , то в якості його оцінки по вибірці можна взяти: середнє арифметичне результатів спостережень – вибіркове середнє , моду , медіану , півсуму найбільшого і найменшого значень у вибірці, тобто і т.д. Про якість оцінки слід судити не за її індивідуальними значеннями, а лише за розподілом її значень у великій мережі дослідів, тобто за вибірковим розподілом оцінки. Для того, щоб значення було близьким до θ, необхідно поставити вимогу, щоб розкид випадкової величини відносно θ (що виражається, наприклад, математичним сподіванням квадрата відхилення оцінки від параметра, що оцінюється ) був найменшим. Така основна умова, яку має задовольняти «найкраща» оцінка.
Властивості оцінок
Означення 2.2 Оцінка параметра θ називається незміщеною, якщо її математичне сподівання рівне параметру, що оцінюється, тобто .В іншому випадку оцінка називається зміщеною.
Вимога незміщеності гарантує відсутність систематичних похибок при оцінюванні. Якщо при скінченному об’ємі вибірки n , тобто зміщення оцінки , але , то така оцінка називається асимптотично незміщеною.
Означення 2.3 Оцінка параметра θ називається спроможною,якщо вона задовольняє закону великих чисел, тобто збігається за ймовірністю до параметра, що оцінюється: ,
У випадку використання спроможних оцінок виправдовується збільшення об’єму вибірки, оскільки при цьому стають малоймовірними значні похибки при оцінюванні. Тому практичне значення мають тільки спроможні оцінки. Якщо оцінка параметра θ є незміщеною, а її дисперсія при , то оцінка є також спроможною.Це безпосередньо випливає з нерівності Чебишова .
Означення 2.4 Незміщена оцінка параметра θ називається ефективною, якщо вона має найменшу дисперсію серед усіх можливих незміщених оцінок параметра θ, обчислених за вибірками одного і того самого об’єму n.
Оскільки для зміщеної оцінки існує дисперсія , то ефективність є вирішальною властивістю, яка визначає якість оцінки.
Ефективність оцінки визначають співвідношенням: ,
де та –відповідно дисперсії ефективної та даної оцінок. Чим ближчим є e до 1, тим ефективнішою є оцінка. Якщо при , то така оцінка називається асимптотично ефективною.
В якості статистичних оцінок параметрів генеральної сукупності бажано використовувати оцінки, що задовольняють одночасно вимогам незміщеності, спроможності та ефективності. Однак, досягнути цього вдається не завжди.
Методи знаходження оцінок
Метод моментів,запропонований К. Пірсоном.
У цьому методі визначена кількість вибіркових моментів (початкових чи центральних , або тих та інших) прирівнюється до відповідних
теоретичних моментів розподілу ( чи ) випадкової величини X.
, - дискретна випадкова величина з функцією ймовірностей ;
, - для неперервної випадкової величини з густиною ймовірностей , де .
◄ Приклад 2.1Знайти оцінку методом моментів для параметра λ закону Пуассона.
Розв’язання. В даному випадку для знаходження єдиного параметра λ достатньо прирівняти теоретичний та емпіричний початкові моменти першого порядку. – математичне сподівання випадкової величини X. Для випадкової величини, розподіленої за законом Пуассона, . Момент ,згідно з формулою для початкових моментів, дорівнює . Звідси, оцінка методом моментів параметра λ закону Пуассона є вибіркове середнє .►
Оцінки методом моментів параметра зазвичай спроможні, однак за ефективністю вони не є «найкращими».
Метод максимальної правдоподібності, запропонований Р. Фішером.
Основу методу складає функція правдоподібності, що виражає густину ймовірностей (ймовірність) сумісної появи результатів вибірки :
, або
.
Згідно з методом максимальної правдоподібності в якості оцінки невідомого параметра θ приймається таке значення , яке максимізує функцію L.
Пошук оцінки спрощується, якщо максимізувати не саму функцію L, а , оскільки максимум обох функцій досягається при одному і тому
самому значенні θ. Тому , . Потім знаходимо точку максимума функції.
◄ Приклад 2.2 Знайти оцінку методом максимальної правдоподібності для ймовірності p настання деякої події A за даним числом m появи цієї події в n незалежних випробуваннях.
Розв’язання. Складемо функцію правдоподібності:
, або .
Тоді і , звідки . Можна показати, що при виконується достатня умова екстремуму функції L.
Таким чином, оцінкою методом максимальної правдоподібності ймовірності p події A буде частота цієї події.►
◄Приклад 2.3Знайти оцінки методом максимальної правдоподібності для параметрів a і нормального розподілу за даними вибірки.
Розв’язання. Густина ймовірності нормально розподіленої випадкової величини . Тоді функція правдоподібності має вигляд:
.
Прологарифмуємо та отримаємо:
.
Для знаходження параметрів a і необхідно прирівняти до нуля частинні похідні по параметрах a і , тобто розв’язати систему рівнянь правдоподібності:
звідки оцінки максимальної правдоподібності рівні:
, .
Таким чином, оцінками методу максимальної правдоподібності математичного сподівання a і дисперсії нормально розподіленої випадкової величини є відповідно вибіркове середнє і вибіркова дисперсія .►
Важливість методу максимальної правдоподібності пов’язана із його оптимальними властивостями. Так, якщо для параметра θ існує ефективна оцінка , то оцінка максимальної правдоподібності єдина і рівна . Крім цього, при достатньо загальних умовах оцінки максимальної правдоподібності є спроможними, асимптотично незміщеними, асимптотично ефективними і мають нормальний розподіл.
Основний недолік методу максимальної правдоподібності – важкість обчислення оцінок.
Метод найменших квадратів – один із найбільш простих прийомів побудови оцінок. Він полягає у тому, що оцінка визначається з умови мінімізації суми квадратів відхилень вибіркових даних від шуканої оцінки.
◄Приклад 2.4Знайти оцінку методом найменших квадратів для генерального середнього .
Розв’язання. Згідно із методом найменших квадратів знайдемо оцінку з умови мінімізації суми: Використовуючи необхідну умову екстремуму, прирівняємо до нуля похідну
, звідки і , тобто оцінка методом найменших квадратів генерального середнього є вибірковим середнім .►
Метод найменших квадратів , по-перше, не потребує знання закону розподілу вибіркових даних; по-друге, достатньо добре розроблений в плані обчислювальної реалізації.