Статистичний взаємозв’язок результатів вимірів
Якщо одному значенню показника відповідає декілька інших, то взаємозв’язок між ними називають статистичним. Серед них найбільш істотні кореляційні, що походять від латинського слова «сorrelatio» – співвідношення, відповідність. У спортивних статистичних дослідженнях часто доводиться встановлювати взаємозв’язок між певними ознаками. Такі задачі розв’язують методом кореляційного аналізу, де визначають тісноту та напрямок взаємозв’язку між ознаками, що досліджуються [4, 8].
Якщо є пара змінних, наприклад, х і y, то кореляцію між ними називають парною. Для дослідження тісноти взаємозв’язків знаходять коефіцієнт кореляції, який позначають через . Кореляційний аналіз виконують за два етапи:
■ якісний, при якому будують кореляційне поле (діаграму розсіювання), де значенню відповідає значення ;
■ апроксимаційний, при якому кореляційне поле замінюють прямими або кривими лініями.
Для оцінки тісноти взаємозв’язків між ознаками х і y обчислюють коефіцієнт кореляції
,
де N – кількість значень цих ознак; і – відповідні значення 1 і 2-ї ознак.
Для відповідного обсягу вибірки коефіцієнт кореляції можна визначити ще й за такою формулою
,
де N – число вимірів; – середньоарифметичні показники х і y; – середньоквадратичні (стандартні) відхилення.
У статистиці коефіцієнт кореляції змінюється у межах від «–1» до «+1». Його чисельне значення зручно знаходити в інтервалі від нуля до одиниці, тобто 0 < = 1. Найчастіше у спортивних дослідженнях використовують лінійну кореляцію (так звану кореляцію К. Пірсона), яка відображає ступінь лінійних зв’язків між змінними. Властивості коефіцієнта кореляції 0 < = 1 такі:
▲ = 0 – зв’язок відсутній;
▲ = 1 – зв’язок дуже тісний;
▲ 0.2 < > 0.49 – зв’язок слабкий;
▲ 0.5 < > 0.69 – зв’язок середній;
▲ 0.7 < > 0.99 – зв’язок сильний.
Знак перед коефіцієнтом показує направлення зв’язку, яке може бути негативним або позитивним. Наприклад, для випадку залежності дальності польоту від початкової швидкості вильоту снаряда коефіцієнт кореляції має позитивне значення, а для випадку залежності часу бігу від швидкості бігу навпаки – негативне.
Значення коефіцієнта парної кореляції «–1» означає цілковиту негативну залежність, значення «+1» – цілковиту позитивну, тобто між змінними, які підлягають спостереженню, є точна лінійна залежність з негативним або позитивним коефіцієнтом кореляції. Значення коефіцієнту, рівне нулю, означає відсутність кореляції. Таким чином, кореляція характеризує ступінь пропорційності змінних, які досліджуються, між собою. Чим ближче коефіцієнт кореляції до своїх крайніх значень, тим тісніше групуються значення змінних навколо прямої лінії та збільшується її нахил. При позитивних або негативних значеннях кореляції нахил прямої лінії буде відповідно позитивним або негативним. Зрозуміло, що дві змінні позитивно корельовані, якщо при збільшенні значень однієї збільшуються значення іншої, і негативно корельовані, якщо при збільшенні значень однієї змінної, значення іншою зменшуються.
Кореляція дуже тісна, якщо на графіку залежність між змінними можна представити з великою точністю прямою лінією (з позитивним або негативним нахилом). Коефіцієнт кореляції – величина безрозмірна і може визначатися для змінних з різними розмірностями у різних масштабах вимірювань. У практиці статистичних досліджень використовують наступні типи кореляції:
● множинно-численну, де має місце залежність між однією і декількома змінними;
● канонічну, коли знаходять залежності між двома та безліччю змінних;
● приватну, що заснована на розгляді умовних кореляцій між двома величинами при фіксованій 3-й величині.
Існують також рангові кореляції, які засновані на рангах, відповідних номеру спостереження у варіаційній низці. З урахуванням цього ранговий коефіцієнт кореляції (коефіцієнт Спірмена) обчислюють таким чином
.
Відсутність кореляції або слабка кореляція показує на відсутність чи слабкість взаємозв’язку двох змінних. В цьому випадку точки відповідних значень змінних розташовуються хаотично по відношенню до прямої лінії. Кореляція К. Пірсона служить для опису лінійних залежностей. Відхилення від лінійності збільшують спільну суму квадратів відхилень від регресійної прямої, що може представляти велику тісноту взаємозв’язків між змінними, які вивчають. Регресія – це рух від складного процесу до простого. Тому після обчислення кореляцій необхідно побудувати діаграму розсіяння, що дозволить визначити, як добре отримане поле крапок описується лінійною залежністю. У практичних дослідженнях необхідно апроксимувати масив значень – приблизно описати діаграму розсіювання математичним рівнянням, наприклад, такого вигляду y = ах + b, яке представляє регресійну пряму. Коефіцієнти а і b називають параметрами рівняння регресії.
У разі нелінійних залежностей математичний запис може бути вираженим рівнянням параболи, гіперболи й тому подібним. І тоді слід використовувати інші кореляційні критерії. Необхідно відзначити, що існують також й помилкові кореляції. Тобто, якщо у дослідженнях отримано високі значення коефіцієнтів кореляції, то це ще не означає, що між змінними існує причинний зв’язок і що на змінні, які підлягають досліджуванню, не впливають інші змінні, що не входять у поле тих, які вивчають. Для виявлення впливу сторонніх змінних можна використовувати приватні кореляції.
Статистичні гіпотези
Після відповідної статистичної обробки необхідно провести оцінку параметрів генеральної сукупності, наприклад, вибірковим методом. З цією метою вводять так звану нульову гіпотезу, яка передбачає, що генеральні та вибіркові параметри суттєво не відрізняються один від одного. Тоді із заданою точністю можна встановити межі, в яких вони знаходяться. Цей процес називають встановленням міждовірчого інтервалу.
Для визначення середньої арифметичної (просто середньої) генеральної сукупності використовують формулу
,
де – середня арифметична вибірки; u – нормоване відхилення, яке визначають порогом довірчої вірогідності P; – помилка репрезентативності. Довірча вірогідність Р – це число випадків, виражене у відсотках, коли гіпотеза заслуговує на довіру. Величину, яка доповнює надійність до 100 %, називають рівнем значущості гіпотези. У спорті прийнято три пороги довірчої вірогідності:
P = 95 % (u = 1.96); P = 99 % (u = 2.58); P = 99.9 % (u = 3.29).
Величина відповідає максимальній похибці оцінки генерального параметра . Методику встановлення міждовірчого інтервалу можна так само вважати методикою оцінки похибки вимірювань, де дійсне значення параметра, який підлягає вимірюванню, встановлюють так
,
де – абсолютна похибка вимірювання; – вибіркове середнє.
Інший показник генеральної сукупності – середньоквадратичне відхилення
,
де – вибіркове середньоквадратичне відхилення, залежне від об’єму вибірки N та від рівня довірчої вірогідності Р. Для визначення кордонів довірчого інтервалу при Р = 95 % значення q наведено у табл. 2.2.
У спорті, де необхідна відповідність нормальному закону розподілу значень, використовують критерій Стьюдента, який служить для порівняння двох різновеликих груп за середніми показниками
,
де – середні арифметичні двох вибірок; – помилки репрезентативності порівнюваних вибірок. Для заданого рівня надійності Р можна записати таку формулу .
Таблиця 2.2
N | q | N | q | N | q |
1.37 | 0.59 | 0.42 | |||
1.09 | 0.55 | 0.40 | |||
0.92 | 0.52 | 0.39 | |||
0.80 | 0.48 | 0.37 | |||
0.71 | 0.46 | 0.32 | |||
0.65 | 0.44 | 0.28 |
За допомогою табл. 2.3 визначають граничні значення критерію . Вони мають місце при P = 95 %, коли К < 30, де К – число ступенів вільності.
Таблиця 2.3
K | K | K | |||
12.7 | 2.36 | 2.09 | |||
4.3 | 2.23 | 2.07 | |||
3.18 | 2.18 | 2.06 | |||
2.78 | 2.14 | 2.06 | |||
2.57 | 2.12 | 2.05 | |||
2.45 | 2.10 | 2.04 |
Якщо , то відмінності між статистично достовірні, якщо < , то відмінності між випадкові, тобто обумовлені наявністю випадкових чинників.
У тому разі, якщо дотримання нормального закону необов’язкове, для визначення відмінностей за стабільністю варіювання малих і середніх вибірок різного об’єму використовують критерій Фішера
,
де і – більша і менша дисперсії. При цьому число ступенів вільності відповідає більшій і меншій вибіркам. Якщо ® ¥, то / ® 1. Відмінності варіювання ознак достовірні, якщо , та випадкові, якщо < . Для Р = 95 % і < 10 граничні значення критерію Фішера надано у табл. 2.4.
Таблиця 2.4
18.1 | 19.2 | 19.3 | 19.3 | 19.3 | 19.4 | 19.4 | 19.4 | 19.4 | ||
10.1 | 9.6 | 9.3 | 9.1 | 9.0 | 8.9 | 8.9 | 8.8 | 8.8 | 8.8 | |
7.7 | 6.9 | 6.6 | 6.4 | 6.3 | 6.2 | 6.1 | 6.0 | 6.0 | 6.0 | |
6.6 | 5.8 | 5.4 | 5.2 | 5.1 | 5.0 | 4.9 | 4.8 | 4.8 | 4.7 | |
6.0 | 5.1 | 4.8 | 4.5 | 4.4 | 4.3 | 4.2 | 4.2 | 4.1 | 4.1 | |
5.6 | 4.7 | 4.4 | 4.1 | 4.0 | 3.9 | 3.8 | 3.7 | 3.7 | 3.6 | |
5.3 | 4.5 | 4.1 | 3.8 | 3.7 | 3.6 | 3.5 | 3.4 | 3.4 | 3.3 | |
5.1 | 4.3 | 3.9 | 3.6 | 3.5 | 3.4 | 3.3 | 3.2 | 3.0 | 3.1 | |
5.0 | 4.1 | 3.7 | 3.5 | 3.3 | 3.2 | 3.1 | 3.1 | 2.9 | 2.9 |
Питання для самоконтролю
1. Що являє собою предмет математичної статистики?
2. Що називають вибіркою та генеральною сукупністю?
3. Що називають варіантою, варіаційною низкою, кроком інтервалу, частотою?
4. Як визначають середнє арифметичне вимірювань, дисперсію, стандартне відхилення, коефіцієнт варіації, математичне очікування випадкової величини?
5. Що називають модою, медіаною, ексцесом?
6. У чому відмінність функціонального і статистичного взаємозв’язків?
7. Що розуміють під словом «кореляція»?
8. Як визначають коефіцієнт кореляції, які його властивості?
9. У чому полягає сенс статистичних гіпотез?
10. Що називають довірчою вірогідністю?
ОСНОВИ ТЕОРІЇ ТЕСТІВ
Основні поняття
Тестом у спорті називають вимірювання чи випробування, які проводять для визначення стану або здібностей спортсмена, можливостей спортивного устаткування й тому подібне [3]. При цьому необхідно виконувати вимоги, які пред’являють до тестування: зазначити мету застосу-вання тестів, використовувати стандартизовану методику вимірювань, додержуватися надійності, інформативності та системи оцінок результатів, що отримані, виду контролю (оперативний, поточний, етапний). Процедуру виконання тесту називають тестуванням, а чисельне значення, одержане у ході вимірювань, – результатом тестування. Наприклад, процедура проведення забігу на 100 м і хронометражу його – це тестування, час бігу – результат тесту.
Усі тести підрозділяють на декілька груп:
1) тести для показників, вимірюваних у спокої, таких як довжина і маса тіла, товщина жирових складок, об’єм м’язової та жирової тканин й так інше;
2) тести для показників, що характеризують функціонування основних систем організму, таких як частота серцевих скорочень (ЧСС), склад крові, психічний стан й так далі;
3) стандартні тести, коли одному або групі спортсменів пропонують виконати однакове завдання, наприклад, протягом хвилини підтягнутися на поперечці 10 разів. Особливістю цих тестів є те, що їх виконують при неграничному навантаженні, тобто відсутня мотивація (настрій) на досягнення максимально можливого результату, який залежить від способу завдання навантаження. Якщо задають механічну величину навантаження, то вимірюють медико-біологічні показники й навпаки. Наприклад, для визначення споживання кисню при бігу на тредбані використовують рівняння виду y = ax + b,де x = v – швидкість бігу, м/хв; b – споживання кисню, мл∙кг/хв. Такі ж рівняння будуть справедливими і для вирішення зворотних завдань;
4) тести, при виконанні яких необхідно показати максимально можливий руховий результат. Їх називають руховими або моторними. Внаслідок тестування вимірюють параметри різних функціональних систем: ЧСС, максимальне споживання кисню (МСК) й таке інше. Особливості цих тестів – високий психологічний настрій (мотивація) спортсмена на досягнення граничних результатів.
Зрозуміло, що будь-яке змагання можна розглядати як своєрідну форму тестування. Якщо результати тесту залежать від одного чинника, то такий тест називають гомогенним(однорідним), а від двох і більш чинників – гетерогенним(різнорідним). В основному оцінку підготовленості спортсменів проводять за декількома тестами, яка має кінцеву мету, наприклад, оцінку стану спортсмена у змагальному періоді тренування. Таку групу тестів називають комплексом або батареєю тестів. У трьох існуючих видах контролю – етапному, поточному, оперативному – можлива безліч варіантів тестування, тому комплекс тестів (батарея) повинен включати ті необхідні показники, наприклад, рухових якостей, від яких залежить успіх у змаганнях.
Вимірювання різних сторін підготовленості спортсменів треба проводити систематично, що надасть можливість порівнювати значення показників на різних етапах тренування і відповідно динаміці приростів у тестах нормувати навантаження. Ефективність нормування залежить від точності результатів контролю, яка, у свою чергу, залежить від стандартності проведення тестів і від вимірювання за ними результатів. Наприклад, виявлено, що при одному ритмі існує різниця у результатах вимірювання МСК при вправах на тредбані і на велоергометрі. Це пояснюється відмінністю у значеннях роботи з переміщення центру мас спортсмена по вертикалі. В цьому випадку чим більша маса спортсмена, тим більше МСК. Відрізнятимуться також результати бігу на стадіоні та у манежі.
Для усунення позначених чи інших можливих відмінностей у результатах тестування необхідно використовувати стандартну методику, дотримуючись при цьому наступних вимог:
● режим дня, попередній тестуванню, будується за однією схемою, куди виключають великі й малі навантаження, але можливі також заняття відновного характеру;
● розминка перед тестуванням має бути стандартною за тривалістю, підбором вправ та послідовністю їх виконання;
● тестування по можливості проводять спеціалісти однієї кваліфікації;
● схема виконання тесту не змінюється від тестування до тестування;
● інтервали між повторенням одного й того ж тесту спрямовані на ліквідування стомленості спортсмена, яке виникло під час попередньої спроби;
● спортсмен прагне показати у тесті максимально можливий результат, цебто вже у ході тестування створюється обстановка змагання.