Суть і значення середніх величин в статистиці і способи їх обчислення
Середня величина в статистиці - це абстрактна, узагальнююча величина, що характеризує рівень варіюючої ознаки в якісно однорідній сукупності. За допомогою середньої величини можливо охарактеризувати сукупність за кількісно варіаційною ознакою.
Середня завжди узагальнює кількісну варіацію ознаки, за допомогою якої ми характеризується сукупність, і яка в різному степені належить всім одиницям сукупності.
Середні - це база для кореляційного, регресійного та дисперсійного аналізу.
Середні, що застосовують в статистиці, належать до класу степеневих, які в узагальнюючий формі мають вигляд:
де х - це індивідуальне значення варіаційної ознаки (варіанти); т -показник ступеня середньої; п - кількість варіант.
Види середніх величин і способи їх обчислення
Середня арифметична проста дорівнює сумі окремих значень ознаки, поділеної на число цих значень:
Для незгрупованих даних розраховують середню арифметичну просту. Для згрупованих даних (які представлені у вигляді рядів розподілу) розраховують середню арифметичну зважену.
Середня арифметична зважена дорівнює:
де хі - індивідуальне значення ознаки (варіанта); - повторюваність ознаки (частота).
Таким чином середня гармонійна проста рахується по залежності:
Крім середньої гармонійної простої визначається середня гармонійна зважена:
Середня геометрична використовується в статистиці досить обмежено, переважно для визначення темпів росту базисних або ланцюгових величин.
Середня хронологічна застосовується переважно в бухгалтерському обліку для визначення середньорічних залишків матеріальних цінностей (за квартал, за рік).
Характеристики центру розподілу: мода і медіана
До характеристики центру розподілу, крім середньої арифметичної, належить мода і медіана. Середня арифметична і середня гармонійна є узагальнюючими характеристиками сукупності за тою чи по іншою варіаційною ознакою. Мода і медіана - це допоміжні описові характеристики розподілу варіаційної ознаки.
Мода - це величина ознаки (варіанта), яка найчастіше зустрічається у даній сукупності. У варіаційному ряді модою є варіанта, яка має найбільшу частоту.
Медіаною називається варіанта, яка знаходиться в середині варіаційного ряду. Медіана поділяє ряд на дві, рівні за чисельністю, частини.
Мода і медіана, на відміну від ступеневих середніх, є конкретними характеристиками ряду розподілу, їх значення має певна варіанта у варіаційному ряді.
Мода використовується в тих випадках, коли потрібно охарактеризувати величину ознаки, яка найчастіше повторюється. Наприклад, найбільше розповсюджений розмір заробітної плати на підприємстві, ціна на ринку, за якою була продана найбільша кількість товару, розмір взуття, який має найбільший попит серед населення.
Медіана цікава тим, що показує кількісну межу значення варіаційної ознаки, яку досягла половина членів сукупності. Наприклад, середня заробітна плата на підприємстві складає 760 грн. в місяць. Ця характеристика може бути доповнена тим, якщо виявиться, що половина працівників отримали заробітну плату 770 грн. і більше, тобто обчислюється медіана.
Мода і медіана - це типові характеристики в тих випадках, коли сукупності однорідні і великі за чисельностю.
Показники варіації
Середні величини дають узагальнюючу характеристику сукупності за варіаційними ознаками і показують типовий для даних умов рівень цих ознак. В дисперсійному аналізі варіацією вважається відхилення індивідуальних значень від загальних. Для характеристики варіацій застосовують таку систему показників:
Розмах варіації:
В інтервальних рядах розподілу Я визначають як різницю між верхньою межею останнього інтервалу і нижньою межею першого, або як різницю між середніми значеннями цих інтервалів.
Середнє арифметичне або лінійне відхилення- це середній модуль відхилень індивідуальних значень ознаки від їх середньої величини:
для незгрупованих даних,
для згрупованих даних.
Коефіцієнт осциляції - відношення розмаху варіації до середньої величини ознаки:
Лінійний коефіцієнт варіації визначається, як відношення середнього лінійного відхилення до середнього значення ознаки:
Основними узагальнюючими характеристиками варіації є дисперсія і середнє квадратичне відхилення.
Дисперсія - це середня арифметична квадратів відхилень кожного значення ознаки від середньої величини. Дисперсію також називають середнім квадратом відхилень. Для незгрупованих даних розраховується проста дисперсія:
Для згрупованих даних розраховується зважена дисперсія:
Середнє квадратичне відхилення - це узагальнююча характеристика абсолютних розмірів варіації ознаки в сукупності. Визначається як корінь квадратний із дисперсії:
для незгрупованих даних
для згрупованих даних
Середнє квадратичне відхилення завжди виражається в тих же одиницях виміру, що і ознака (в метрах, тонах, відсотках, гектарах) і є абсолютною мірою варіації.
Основною метою дисперсійного аналізу є виявлення на основі величини загальної дисперсії впливу окремих чинників на варіацію ознаки. Загальна дисперсія характеризує варіацію ознаки у статистичній сукупності в результаті впливу всіх чинників.
Міжгрупова дисперсія показує рівень відхилення групових середніх від загальної середньої, тобто характеризує вплив чинника, покладеного в основу групування.
Внутрішньогрупова дисперсія (залишкова) характеризує варіацію ознаки в середині кожної групи статистичного групування.
Отже, загальна дисперсія складається із суми внутрішньогрупової дисперсії і міжгрупової дисперсії.
Сутність зв'язку між ознаками характеризує коефіцієнт детермінації, який розраховується як відношення міжгрупової дисперсії до загальної дисперсії:
Правило додавання дисперсій. Загальна дисперсія дорівнює сумі середньої із групових дисперсій і міжгрупової дисперсії.