Средние показатели результатов
Понятие «среднего» может быть не связано с каким-то цифровым показателем, а представлять обобщенную категорию мышления, например, средний ученик, средний учитель, средняя успеваемость. Но может быть и в цифровой форме, когда отражаются те или иные средние величины совокупности, вычисляются средние величины объема.
Средние объема характеризуются тем, что их числовое значение изменяется при изменении значения любого члена совокупности. Обычно в качестве объемного среднего в педагогическом исследовании применяют арифметическое среднее, реже применяют гармоническое, квадратическое и хронологическое среднее.
Средние положения или структурные средние характеризуются тем, что изменяются тогда, когда происходят сдвиги в структуре совокупности (изменяется их количество, последовательность). В качестве средних положений применяют главным образом медиану (средний член упорядоченной частоты, по обеим сторонам которого остается равное количество членов) и моду (наиболее часто повторяющееся значение в статистическом распределении частоты). Реже применяют квартилы (распределение частоты на четыре части, в каждой из которых имеется равное количество членов ряда), децилы (делят статистический ряд на десять равных частей).
Три квартилы можно легко определить, как и медиану, с помощью процентной кривой кумулятивной частоты. Квартилы находят на пересечении линий 25%, 50% и 75%. Значение средней квартилы совпадает со значением медианы.
Наиболее простой статистикой «центральной тенденции» совокупности результатов интервального измерения является мода. Модой (доминантой) называется наиболее часто встречающаяся (доминирующая) частота. Мода (Mo) соответствует либо наиболее частому значению, либо среднему значению класса с наибольшей частотой. Необходимо подчеркнуть, что мода представляет собой наиболее частое значение признака, а не частоту этого значения. Мода используется редко, обычно в тех случаях, когда необходимо дать общее представление о распределении.
Мода необходима там, где требуется быстро охарактеризовать совокупность на основе явления, встречающегося чаще всего. При изготовлении детской мебели, например, за основу берется мода (рост, вес ребенка, встречающиеся в данной возрастной группе чаще всего), а не средние арифметические данные детей.
В коротком статистическом упорядоченном ряду моду можно найти «на глаз». Например: 8, 4, 5, 8, 7, 7, 8, 9, 10, 3, 11, 8. Упорядочим этот статистический ряд от меньшего к большему и получим следующий ряд: 3, 4, 5, 7, 7, 8, 8, 8, 8, 9, 10, 11. Чаще всего здесь встречается число 8, следовательно, оно и является модой. Например, в совокупности оценок успеваемости 2, 3, 4, 4, 4, 5, 5 модой является оценка 4, потому что эта оценка встречается чаще других.
В некоторых случаях у распределения могут быть две моды. Например, в совокупности 2, 3, 3, 4, 5, 5 модами являются оценки 3 и 5. В этом случае говорят, что совокупность оценок является бимодальной. Большие совокупности оценок рассматриваются как бимодальные, если они образуют полигон частот с двумя вершинами, даже тогда, когда частоты не строго равны.
Принято считать, что в случае, когда все значения оценок встречаются одинаково часто, совокупность данных моды не имеет. Например, в совокупности 2, 2, 3, 3, 4, 4, 5, 5 моды нет.
Мода, как мера центральной тенденции, имеет следующую интерпретацию. Она является такой характеристикой, т.е. имеет такое значение, которое наилучшим образом «заменяет все значения». Когда заменяют модой любое значение ряда чисел, мы имеем наибольшую частоту совпадений с числами ряда.
Следует заметить, что для малых групп часто о такой замене не может быть и речи. Например, группа из 5 учащихся имеет следующую успеваемость 2, 2, 2, 5, 5. Модальный актив группы составляет величину два. Эта цифра точно характеризует успеваемость трех учащихся группы, но является чрезвычайно некорректной в отношении двух других.
Медиана (Me) соответствует центральному значению в последовательном ряду всех имеющихся значений. Медиану также, как и квартилы и децилы легко найти на процентной кривой кумулятивной частоты.
Медиана, или центральная величина ряда,– это величина члена, приходящего на середину ранжированного ряда, при нечетном числе членов ранжированного ряда медиана соответствует центральной величине ряда. Например, мы имеем следующий ранжированный ряд: 4, 5, 7, 9, 11, 13, 15, 17, 18. В середине данного ряда находится число 11, следовательно, оно и является медианой.
Порядковый номер медианы вычисляется по формуле:
где N – число членов в ряду.
Медиана в интервальном ряду вычисляется по формуле:
где xMe – значение нижней границы медианного интервала;
k – длина медианного интервала;
N – число членов совокупности (fi при сумме малых частот N = fi + 1);
fMe – частота медианного интервала.
Для больших совокупностей данных, где есть объединенные классы, медиана находится следующим образом (смотри таблицу 8). Пусть мы имеем 16 оценок:
Таблица 8
Таблица оценок
Оценка | Частота | Накопленная частота |
n = 16
Медиана выбирается 8-й и 9-й оценками. По таблице 8 видно, что она располагается в интервале четверок. Поскольку в верхней границе ряда оценок накоплено 4 оценки (1 + 3 = 4), мы должны еще накопить 8 - 4 = 4 частоты, а всего в интервале 8 четверок. Поэтому медиана делит интервал четверок пополам. В интервале между значениями 3,5 и 4,5 лежит 8 четверок. Следовательно, медиана равна 3,5 + 4:8 = 4.
Интерпретируем значение медианы на следующем примере. Пусть мы получили следующий ряд оценок 2, 2, 3, 4, 5, 5, 5, где медиана равна оценке 4. Разность между 4 и 2 составляет два, между 4 и 5 минус один. Сумма этих разностей, взятых по абсолютному значению (т.е. без знака), равна 2+2+1+1+1+1 = 8 и всегда меньше суммы разностей относительно любого другого числа данного ряда. В самом деле разности между 5 и другими числами соответственно равны 3, 3, 2, 1, 0, 0, а их сумма абсолютных разностей всех значений относительно медианы всегда меньше суммы разностей относительно любой другой точки. Из этого следует, что если вместо каждой оценки ряда выбрать медиану, то будет допущена минимальная суммарная ошибка.
Медиану применяют в том случае, когда хотят определить точную середину ряда. Некоторые интервалы особенно большой частоты могут в значительной мере повлиять на среднее арифметическое. Преимуществом медианы является то, что на нее такие чрезвычайные интервалы не влияют. Центральная тенденция совокупности данных с большими крайними выбросами наилучшим образом характеризуется медианой, когда гистограмма унимодальна.
Медиана является одним из членов ряда распределения или, как это бывает в четных рядах, очень близкой к нему величиной. Опираясь на значение медианы, еще точнее на квартилы, можно охарактеризовать структуру ряда вокруг среднего, имеется ли равномерное распределение вокруг среднего, накопление величин по возрастающим или убывающим интервалам.
Средняя арифметическая – наиболее часто используемый показатель центральной тенденции, вычисляется при делении суммы всех значений на число этих данных.
Средняя совокупность n значений обозначается . Если каждый вариант распределения частоты появляется только один раз, то получается формула, при помощи которой вычисляется так называемая простая арифметическая средняя:
Короче эту же самую формулу можно записать следующим образом:
где xi – величина отдельных элементов совокупности;
fi – количество членов совокупности (объем совокупности).
Из формулы следует, что среднее совокупности чисел находится суммированием всех чисел и делением полученной суммы на общее число членов ряда. Смысл (интерпретация) среднего в том, что среднее заменяет все значения в совокупности чисел. Иными словами, взамен каждого значения ряда берется среднее, при этом обеспечивается минимальная ошибка отклонений от среднего. Среднее арифметическое дает возможность охарактеризовать исследуемую совокупность одним числом; сравнить отдельные величины со средним арифметическим; определить тенденцию развития какого-либо явления; сравнить разные совокупности; вычислить другие статистические показатели, так как многие статистические вычисления опираются на средние арифметические.
Совокупность характеризуется посредством среднего арифметического в том случае, если распределение параметров расположено симметрично по отношению к середине. При асимметричном распределении или многовершинном полигоне частот среднее арифметическое не подходит для описания совокупности. В таких случаях для характеристики совокупности лучше пользоваться модой.
Итак, центральная тенденция распределения частот чаще всего выражается в трех измеряемых средних величинах. Это мода (Mo), медиана (Me) и среднее арифметическое . При нормальном распределении эти три показателя центральной тенденции более-менее совпадают, а при асимметричном распределении получают различное значение.
Следует отметить, что каждая мера центральной тенденции числовых рядов измерений и оценки знаний обладает характеристиками, которые ценны в определенных условиях.
В малых совокупностях чисел мода, как правило, нестабильна. Например, для совокупности 2, 2, 2, 3, 4, 4 мода равна 2, но если одну из оценок 2 заменить оценкой 4, то мода станет равной 4.
Медиана более стабильна. На нее не влияют «большие» и «малые» оценки. Например, для больших совокупностей оценок медиана не изменится, если число минимальных или максимальных оценок резко изменится. Так, например, совокупности 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5 и 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5 имеют одинаковые медианы (Me = 3,5).
На величину среднего влияет изменение каждого значения оценки. Для многих числовых совокупностей педагогических измерений мода близка к двум другим мерам – медиане и среднему. Медиана занимает промежуточное положение между модой и средним.
Некоторые совокупности результатов педагогических измерений просто не имеют центральной тенденции. Это наблюдается для многомодальных совокупностей оценок (имеющих две и более моды). Например, для совокупностей оценок 2, 2, 2, 2, 2, 4, 4, 4, 4, 4 среднее и мода равна трем, несмотря на то, что даже не существует учащегося с такой оценкой. Ни среднее, ни медиана не в состоянии дать правильного представления об успеваемости этой группы. Более правильное представление об успеваемости этой группы дает словесное описание: «50% в группе имеют оценки «2», а остальные – хорошие». Последнее на языке статистики может быть выражено так: гистограмма бимодальна, т.е. имеет две моды, одна равна 2, другая – 4.