Математичний апарат педагогічних досліджень

4.1. Числові характеристики вибірки

Основними поняттями в математичній статистиці є генеральна та вибіркова сукупності. Нехай потрібно вивчити деяку ознаку властиву великій множині однотипних об’єктів. Сукупність значень ознаки всіх об’єктів даного типу називається генеральною сукупністю. При цьому припускається, що число N в генеральній сукупності досить велике, навіть нескінченне.

На практиці загальне обстеження застосовують досить рідко, а вибирають зі всієї сукупності обмежене число об’єктів й піддають їх дослідженню. Ця обмежена кількість і називається вибіркою. Наприклад: необхідно виявити зріст чи вагу всіх дітей 12 років у якомусь місті (генеральна сукупність) і порівняти їх з такими ж показниками в іншому. Зрозуміло, що всіх дітей в обох містах дослідити технічно неможливо, до того ж в цьому нема потреби. Достатньо декількох сотень дітей у різних школах (вибіркова сукупність) у кожному місті і на основі аналізу цих даних зробити висновки.

До числових характеристик вибірки, які найбільш широко використовуються в дослідженнях в галузі фізичної культури і спорту, відносять середнє арифметичне, дисперсію, стандартне відхилення, коефіцієнт варіації

Середнє арифметичне значень дорівнює:

математичний апарат педагогічних досліджень - student2.ru

де ∑ - знак суми, і = 1,2,3..., r – кількість варіантів, хi – значення варіантів ряду, nі – значення частоти ряду, n – об'єм сукупності.

Дисперсіяслужить мірою однорідності сукупностей емпіричних даних. Чим вища однорідність, тим нижче значення дисперсії. Для повністю однорідних сукупностей дисперсія дорівнює нулю.

Дисперсія генеральної сукупності обсягом n визначається як:

математичний апарат педагогічних досліджень - student2.ru

де: δ2 – дисперсія, nі – значення частоти ряду, n –об'єм сукупності, xСР – середнє арифметичне.

Стандартне відхилення вибірки визначається як:

математичний апарат педагогічних досліджень - student2.ru математичний апарат педагогічних досліджень - student2.ru

де: d – стандартне відхилення, d2–дисперсія.

Коефіцієнт варіації Vх використовується у разі порівняльної оцінки різноякісних середніх величин і визначається (у тому числі у %) як відношення стандартного відхилення до середнього арифметичного:

Vх = d/ математичний апарат педагогічних досліджень - student2.ru ·100%

де: Vх – коефіцієнт варіації, математичний апарат педагогічних досліджень - student2.ru – середнє арифметичне, d – стандартне відхилення

Розрахунки зазначених статистичних показників, крім коефіцієнту варіації, який вираховується вручну, можна здійснити в Microsoft Excel пакету програм Microsoft Office 2003 різними способами.

У наших рекомендаціях ми пропонуємо спосіб отримання показників вибірки за допомогою пакета «Анализ данных» розділу «Описательная статистика». Процедура відбувається у такій послідовності:

а) розташувати в листі Excel стовпчиком обчислювану вибірку;

б) виконати команди головного меню Excel [Сервис -> Анализ данных], обрати розділ «Описательная статистика» (рис 4.1.), натиснути ОК, після чого з’явиться відповідне діалогове вікно. Якщо зайшовши в «Сервис», серед функцій, які тут пропонуються, ви не знайдете «Анализ данных», треба її встановити. Для цього треба зайти в «Сервис», потім в «Надстройки», в діалоговому вікні, яке з’явиться, обрати «Пакет анализа», натиснути ОК;

математичний апарат педагогічних досліджень - student2.ru

Рис. 4.1. Зразок діалогового вікна «Анализ данных»

Столбец1  
Среднее 2,454545455
Стандартная ошибка 0,365902033
Медиана
Мода
Стандартное отклонение 1,213559752
Дисперсия выборки 1,472727273
Эксцесс 0,65386374
Асимметричность 0,949490433
Интервал
Минимум
Максимум
Сумма
Счет

Рис. 4.2. Зразок виводу даних після обчислення їх

в «Описательной статистике»

в) у діалоговому вікні «Описательная статистика» встановити вхідні дані:

- обрати групування «по столбцам».

- установити «Входной интервал». Для цього поставити курсор у вікно напроти цієї опції, після чого виділити в листі Excel раніше введену стовпчиком вибірку;

г) встановити параметри виводу:

- обрати «Итоговая статистика»;

- позначити опцію «Выходной интервал», поставити курсор у вікно напроти цієї опції і позначити в листі Excel комірку в якій би ви хотіли розмістити верхню зліва комірку таблиці обчислюваних показників (рис. 4.2.), виконати команду ОК.

4.2. Параметричні критерії достовірності (t-критерій Стьюдента)

У педагогічній діяльності при визначенні ефективності методик розвитку рухових здібностей або тренувальних засобів у різних кількісних варіантах часто доводиться порівнювати дані експериментальної і контрольної груп, відомості між якими повинні бути статистично доведеними. Для цього вираховується коефіцієнт достовірності (t-критерій Стьюдента).

Для застосування даного критерію необхідно аби початкові дані мали нормальний розподіл. У разі застосування двовибіркового критерію для незалежних вибірок також необхідне дотримання умови рівності дисперсій. Проте, існують альтернативи критерію Стьюдента для ситуації з нерівними дисперсіями.

Двовибірковий t-критерій для незалежних вибірок.Даний критерій використовується для порівняння між собою показників двох груп досліджуваних, наприклад: середніх показників ваги учнів двох класів. При цьому, у випадку, якщо розмір вибірок відрізняється незначно, застосовується спрощена формула наближених розрахунків:

математичний апарат педагогічних досліджень - student2.ru

У випадку, якщо розмір вибірок відрізняється значно, застосовується складніша і точніша формула:

математичний апарат педагогічних досліджень - student2.ru

Де М1, М2– середнє арифметичне вибірок, σ1, σ2– стандартне відхилення вибірок, а N1, N2– розміри вибірок.

Отримання показників t-критерію Стьюдента за допомогою пакета «Анализ данных» розділу «Двухвыборочный t-тест с одинаковыми дисперсиями» здійснюється у такій послідовності:

а) розташувати в листі Excel двома стовпчиками обчислювані вибірки;

б) виконати команди головного меню Excel [Сервис -> Анализ данных], обрати розділ «Двухвыборочный t-тест с одинаковыми дисперсиями», натиснути ОК, після чого з’явиться однойменне діалогове вікно. Якщо зайшовши в «Сервис» серед функцій, які тут пропонуються ви не знайдете «Анализ данных», треба її встановити так, як це описано вище в пункті б) підрозділу 4.1.

в) у діалоговому вікні «Двухвыборочный t-тест с одинаковыми дисперсиями» встановити вхідні дані. Для цього поставити курсор у вікно «Интервал переменной 1» і виділити першу вибірку. Так само задати «Интервал переменной 2», виділивши другу вибірку;

г) встановити параметри виводу. Для цього позначити «Выходной интервал», поставити курсор у вікно напроти цієї опції і позначити в листі Excel комірку в якій би ви хотіли розмістити верхню зліва комірку таблиці обчислюваних показників. Встановити «Альфу» (заданий рівень достовірності). Як правило це 0,05. Виконати команду ОК;

Двухвыборочный t-тест с одинаковыми дисперсиями
           
Переменная 1 Переменная 2  
Среднее 119,3 108,1      
Дисперсия 74,9 51,21111      
Наблюдения      
Объединенная дисперсия 63,05556        
Гипотетическая разность средних        
df        
t-статистика 3,153852        
P(T<=t) одностороннее 0,002746        
t критическое одностороннее 1,734064        
P(T<=t) двухстороннее 0,005492        
t критическое двухстороннее 2,100922        

Рис. 4.3. Зразок виводу даних після обчислення їх в

«Двухвыборочном t-тесте с одинаковыми дисперсиями»

д) необхідні показники будуть відображені в певних рядках (рис 4.3.):

- розрахований t-критерій Стьюдента буде знаходитись в рядку «t-статистика»;

- граничне значення при заданому рівні достовірності – в рядку «t критическое двухстороннее»;

- обернений t-критерій, який характеризує рівень значимості змін в даному випадку – в рядку «P(T<=t) двухстороннее»;

е) після знаходження t-критерія Стьюдента необхідно з’ясувати достовірність змін, порівнюючи показник «t-статистика» з «t критическое двухстороннее». Якщо «t-статистика» більше «t критическое двухстороннее», то зміни при заданому рівні достовірності («Альфа» у вхідних даних) достовірні, якщо менше – то недостовірні.

Двовибірковий t-критерій для залежних вибірок. Даний критерій використовується при порівняння між собою показників однієї і тієї ж групи досліджуваних у різних умовах. Наприклад, порівняння середніх показників ваги учнів одного і того ж класу на початку і в кінці навчального року. У цьому випадку застосовується наступна формула:

математичний апарат педагогічних досліджень - student2.ru

де: Мd – середнє арифметичне різниць значень, а σd – стандартне відхилення різниць.

Отримання показників t-критерію Стьюдента для залежних вибірок за допомогою пакета «Анализ данных» відбувається так само, як і для незалежних, але замість розділу «Двухвыборочный t-тест с одинаковыми дисперсиями» необхідно обрати «Парный двухвыборочный t-тест для средних». Таблиця виводу даних буде мати такий самий вигляд, як і при розрахунку t-критерію Стьюдента для незалежних вибірок (рис 4.3.) При цьому необхідні показники будуть відображені в інших рядках:

- розрахований t-критерій Стьюдента буде знаходитись – в рядку «t-статистика»;

- граничне значення при заданому рівні достовірності – в рядку «t критическое одностороннее»,;

- обернений t-критерій, який характеризує рівень значимості змін в даному випадку – в рядку «P(T<=t) одностороннее».

Після знаходження t-критерія Стьюдента необхідно з’ясувати достовірність змін порівнюючи показник «t-статистика» з «t критическое одностороннее». Якщо «t-статистика» більше «t критическое одностороннее», то зміни при заданому рівні достовірності («Альфа» у вхідних даних) достовірні, якщо менше – недостовірні.

Коефіцієнт кореляції

У природі існує багато речей, які певним чином пов’язані між собою. При цьому зв’язки можуть бути функціональними і кореляційними. Прикладом першого типу зв’язків може бути залежність прискорення тіла у вакуумі від його маси і сили прикладеної до нього. Ця залежність виражається певною формулою і діє у всіх без винятку випадках.

На відміну від функціональних, кореляційні зв’язки відображають взаємозалежність явищ не настільки очевидних. Наприклад – зв'язок між вагою і зростом людини. Зрозуміло, чим вища людина, тим більші всі її габарити, а відповідно й вага. Але, незважаючи на цю очевидну тенденцію, завжди можна зустріти особу, яка нижче за когось зростом, але при цьому має більшу вагу. Для описання подібних зв’язків використовуються різноманітні коефіцієнти кореляції. Серед них найбільш поширеним у дослідженнях у галузі фізичного виховання і спорту вважається коефіцієнт лінійної кореляції Пірсона.

Загальна формула за якою розраховується коефіцієнт лінійної кореляції має наступний вигляд:

математичний апарат педагогічних досліджень - student2.ru

Де Хi и Уi - порівнювані кількісні ознаки, n – число порівнюваних спостережень, σx и σy – стандартні відхилення в порівнюваних рядах.

Для розрахунків вручну використовується перетворена формула:

математичний апарат педагогічних досліджень - student2.ru

Незважаючи на уявну громіздкість формули, вона значно полегшує розрахунок вручну.

Отримання показників коефіцієнта кореляції Пірсона за допомогою пакета «Анализ данных» розділу «Корреляция» здійснюється у такій послідовності:

а) розташувати в листі Excel стовпчиками вибірки, між якими необхідно знайти коефіцієнт кореляції;

б) виконати команди головного меню Excel [Сервис -> Анализ данных], обрати розділ «Корреляция», натиснути ОК, після чого з’явиться однойменне діалогове вікно. Якщо зайшовши в «Сервис» серед функцій, які тут пропонуються ви не знайдете «Анализ данных», треба її встановити так, як це описано вище в пункті б) підрозділу 4.1.;

в) у діалоговому вікні «Корреляция» встановити вхідні дані:

- обрати групування «по столбцам»;

- встановити «Входной интервал». Для цього поставити курсор у вікно напроти цієї опції, після чого виділити в листі весь масив даних, введений, як це вказано в пункті а);

г) встановити параметри виводу. Для цього позначити «Выходной интервал», поставити курсор у вікно напроти цієї опції і позначити в листі Excel комірку в якій би ви хотіли розмістити верхню зліва комірку таблиці обчислюваних показників. Виконати команду ОК;

Столбец 1 Столбец 2 Столбец 3 Столбец 4
Столбец 1      
Столбец 2 0,894692611    
Столбец 3 0,945227496 0,985379531  
Столбец 4 0,878865659 0,996181037 0,975913433

Рис. 4.4. Зразок виводу даних після обчислення їх в

розділі «Корреляция»

д) серед запропонованих коефіцієнтів на перетині рядків і стовпців знайти ті, які вам необхідні, так як це робиться під час пошуку результатів матчів в підсумковій таблиці чемпіонату з футболу або іншого ігрового виду спорту. Наприклад, коефіцієнт кореляції між другим і третім показником знаходиться на перетині стовпчика «Столбец 2» і рядка «Столбец 3»;

е) з’ясувати достовірність кореляційних зв’язків шляхом порівняння здобутого показника з критичними табличними (додаток Е), маючи на увазі, що n – кількість значень в вибірках, а р – заданий рівень значущості.

Наши рекомендации