Психолого-педагогічні вимоги до створення програм для контролю рівня навчальних досягнень учнів
Перевірка рівня навчальних досягнень учнів є одним із важливих етапів навчального процесу. Застосування комп’ютерів дає змогу вчителеві забезпечити об’єктивність оцінювання знань учнів шляхом використання спеціальних програм. Перевірку засвоєння теоретичних знань найпростіше реалізувати на комп’ютері у формі тестів.
Більшість комп’ютерних програм призначені для розробки тестів, в яких учням пропонується вводити правильну відповідь одним з трьох способів: обирати одну правильну відповідь з декількох запропонованих (одноваріантний вибір), обирати кілька можливих значень з числа запропонованих (поліваріантний вибір), вводити відповідь власноруч (тест з відкритою відповіддю).
Кожна з форм введення відповіді має власні позитивні та негативні риси. Так, найпростіший у реалізації тест з одноваріантним вибором відповіді надає високу ймовірність випадкового вибору правильного варіанту, що знижує об’єктивність оцінювання. При поліваріантному виборі потребує чіткого трактування питання оцінювання часткового вибору правильних варіантів. Не всі програми мають властивості розрізняти відповіді з неповною відповіддю (вибір одного або двох варіантів з трьох потрібних тощо) або відповіді що містять неправильні варіанти разом з правильними. Введення відповіді з клавіатури ускладнено можливостями несуттєвих для предмету оцінювання граматичних або синтаксичних помилок та накладає додаткові вимоги на довжину рядка, який потрібно вводити з клавіатури.
Для об’єктивності оцінювання знань учнів при тестовій системі перевірки знань, крім вибору форми введення відповідей, важливо забезпечити зміст питань, що забезпечує валідність тесту. Валідність — це міра відповідності тесту вимірюваним знанням, умінням і навичкам, для перевірки яких був розроблений тест, міра відповідності стандартам і програмам навчання, а також результатам тестування. Це найбільш важлива, комплексна характеристика, що відображає точність тестування.
Наведемо основні правила розробки якісних тестів, запропоновані в [31].
Тест повинен мати необхідний і достатній рівень складності. Складність — міра розумових зусиль, потрібних для вибору відповіді. Часто цей параметр називається вагою і визначається як частка правильних або неправильних відповідей при відповіді на завдання в групі учасників тестування.
Тест повинен бути:
- об'єктивним і надійним. Надійність — міра правильності і адекватності відображення тестом рівня знань учнів. Надійний тест забезпечує рівні права кожній групі учнів і кожному учню в групі;
- стійким і таким, що може бути зіставлений певній шкалі. Стійкість тесту — міра зберігання надійності і валідності при перенесенні тесту в інше, аналогічне середовище, міра рівнозначності і однорідності тестів для різних груп учнів. Шкалювання тесту — властивість тесту відображати результати навчальних досягнень у деякій системі (шкалі) оцінок або балів.
- репрезентативним. Репрезентативність тесту (або бази тестів) — міра повноти охоплення завданнями навчального матеріалу, програми, відображення тестами різних рівнів навчання.
- значущим і дискримінантним. Значущість тесту — міра необхідності, актуальності включення в тест ключових знань. Дискримінантність тесту — міра диференціації учасників тестування щодо максимального або мінімального рівня навчання.
- вірогідним, науковим, несуперечливим. Вірогідність, науковість, несуперечність тесту — міри істинності тесту, узгодженості, відповідності сучасному стану науки і технології, методиці навчання. Необхідно забезпечити узгодженість завдань тесту як між собою (внутрішня узгодженість), так і з іншими тестами (зовнішня узгодженість).
Тестове завдання повинно бути сформульовано ясно і чітко, не допускати двозначного тлумачення і сприяти формулюванню правильної відповіді.
Час, виділений на тестове завдання, повинен бути витрачений на пошук відповіді, а не на з'ясування умови питання. Потрібно намагатися формулювати завдання у вигляді одного речення. Бажано використовувати просту, граматично правильну стверджувальну форму завдання у вигляді одного речення з 5—20 слів. Слова, що повторюються, і словосполучення у відповідях повинні бути виключені і перенесені в основну частину умови. У учня не повинне виникнути питання по уточненню умови або змісту варіанта відповіді (дистрактора) у процесу пошуку правильної відповіді.
Кожне завдання тесту повинне бути функціонально завершеним, тобто перевіряти конкретне знання, уміння або навичку.
Бажано якомога рідше використовувати «нестрогі» слова типу «іноді», «часто», «завжди», «все», «ніколи», «великий», «невеликий», «малий», «багато», «менше», «більше» і граматичні обороти типу «Чому не може не...», «Чи правда, що ...», «Чи можливо...», подвійні заперечення тощо.
Відповіді повинні містити не більше 2–3 ключових слів з умовою питання. Бажано будувати відповіді однакової форми і довжини. Кількісні відповіді бажано упорядковувати за зростанням або спаданням, а якщо відповіді легко обчислити, то першою не повинна бути вказана правильна відповідь.
Необхідно виключити можливість вибору правильної (або неправильної) відповіді інтуїтивно і асоціативно. Відповіді повинні бути незалежні, однаково привабливими для вибору, а вплив вгадування правильної відповіді на загальний результат тестування повинен бути якомога менше.
У кожному завданні кількість дистракторов (правдоподібних варіантів відповіді) повинна бути від 3 до 5. Всі дистрактори повинні бути дібрані грамотно, вміло, без каверз, але не довільно, а відповідно до типових помилок, що можуть бути припущені (прогнозовані) за даним завданням. З відповіді на одне тестове завдання не можна одержувати яким-небудь чином (наприклад, евристично) відповідь на інше завдання.
Якщо можлива побудова якісного тестового завдання закритої форми (структури), то бажано використання цієї форми. Недоліком тестових завдань у закритій формі вважається можливість дізнатися відповідь, не знаючи її. До переваг можна віднести просту структуру, доступність сприйняття, що сприяють отриманню оптимального результату.
Тест повинен складатися з мінімальної кількості завдань, достатніх для повного визначення рівня навчальних досягнень. Рекомендується уникати непотрібного дублювання знань, що перевіряються, умінь і навичок, а також передбачити всі необхідні.
Необхідно мінімізувати «привабливості» використання шпаргалок, списування і добору відповідей «навмання», оскільки ймовірність вгадування при малій кількості варіантів відповідей зазвичай висока і складає 0,2—0,25. Тільки грамотні, цікаві питання і ситуації можуть викликати у учня прагнення відповісти, а не підібрати відповідь.
Списування можна виключити наступними методами: підготовкою достатнього числа рівноцінних тестів, «перемішуванням» одного і того самого набору завдань усередині групи, чітким вимірюванням витрат часу і обмеженням у часі.
Можна порекомендувати прийом: включати в число дистракторів варіанти, по яких можна судити про явну непідготовленість з цієї теми або випадковому доборі відповіді. Місце таких відповідей у кожному завданні фіксується, і за ці відповіді нараховуються не позитивні, а негативні, «штрафні» бали. Про наявність таких відповідей учнів наперед потрібно попередити перед початком тестування.
Якщо тестування проводиться в системі оцінок з двома варіантами відповідей («так», «ні»), то і результат тестування повинен бути оцінений у полярній шкалі: «залік — не залік», «складено — не складено».
Таким чином, тест повинен відповідати необхідним і вимірюваним знанням, умінням і навичкам, стандартам і програмам навчання, повинен забезпечувати однакові права і рівноцінні завдання для кожної групи учасників тестування, відображати результати навчальних досягнень у системі оцінок, що задається, бути актуальним.