Дискретний варіаційний ряд часток
Варіанти, хі | x1 | x2 | … | xm |
Частки, wi | w1 | w2 | … | wm |
де wі = fi /n – частка варіантихі, п – обсяг сукупності.
Групувати статистичну сукупність у д. в. р. зручно, коли число т порівняно невелике: m<<n, що характерно для дискретної ознаки. Тому у статистиці зазвичай прийнято для дискретної ознаки будувати д. в. р.
Якщо д. в. р. w будується для дискретної ознаки, то його можна розглядати як статистичний аналог закону розподілу генеральної сукупності, з якої вибрана статистична сукупність, що згрупована в даний д. в. р. w.
Інтервальний варіаційний ряд (або і. в. р. ) може мати два види: і. в. р. частот та і. в. р. часток.
Інтервальним варіаційним рядом частот(або і. в. р. f) називається упорядкована послідовність пар “інтервал-частота”, розташованих у порядку зростання меж інтервалів: , де т – кількість інтервалів; fi – частота і-го інтервалу, тобто кількість елементів статистичної сукупності (або з.в.р.), які належать і-му інтервалу; та – відповідно ліва і права межі і-го інтервалу; < .
Інтервали і. в. р. f можуть бути рівними або нерівними, а крайній лівий або правий можуть не мати відповідно лівої та правої меж. В останньому випадку крайні інтервали і. в. р. f називаються відкритими. Надалі розглядатимемо побудову і. в. р. f з рівними закритими інтервалами.
Усі інтервали, крім останнього, вважаються замкненими зліва і незамкненими справа. Останній інтервал ‑ замкненим і справа.
Для побудови і. в. р. f спочатку необхідно вибрати або знайти число інтервалів т. Число т може вибиратись дослідником суб’єктивно на основі його власного досвіду, а може обчислюватись за однією з формул: , або m=1+[log2n], або , або m≈1+ log2n, де [х] – ціла частина числа х. Оскільки т натуральне число, то праві частини останніх двох рівностей повинні округлюватись до цілих. Зауважимо, що
Після вибору числа т знаходимо ширину h інтервалів за формулою
, (1.9)
де та ‑ довільні числа, для яких виконуються умови: ≤ , ≤ , де та – відповідно найменше та найбільше значення варіант: =у1, =уп. При цьому бажано, щоб відхилення та від відповідно та було якомога меншим і хоча б наближено виконувалась рівність – = – .
Іноді зручно ширину інтервалу обчислювати за формулою
.
Якщо при цьому не виникає необхідність округлення величини h, то це означає, що = , = . Якщо величину h треба округлювати, то округлення необхідно робити тільки з надлишком, інакше число уп може не потрапити в останній інтервал. При цьому бажано, щоб похибка округлення не перевищувала 0,1h. Після округлення величини h значення та необхідно змінити так, щоб рівність (1.9) виконувалась точно.
Після обчислення числа h знаходимо межі інтервалів:
Будується і. в. р. f зазвичай у вигляді таблиці з двома рядками або стовпцями. У верхньому рядку або лівому стовпцю записуються інтервали, у нижньому рядку або правому стовпцю – частоти (табл. 1.3).
Таблиця 1.3