Табличное представление первичной обработки статистических данных
Результаты измерения, как правило, фиксируют сначала в произвольном или в алфавитном порядке (например, при проверке скорости чтения учащихся вызывают в том порядке, в каком они записаны в классном журнале), или в том порядке, в каком поступают результаты измерения (например, результаты проверки тестирования поступают в том порядке, в каком лежат бланки ответов). В такой форме полученные данные неудобны для анализа и выявления закономерностей.
Первичная обработка статистических данных состоит в упорядочении данных (по возрастанию или убыванию), подсчете некоторых показателей, характеризующих эти значения, в группировании данных.
Проиллюстрируем все сказанное на конкретном примере.
Пример 2. В таблице 7.1 представлены данные о скорости чтения учащихся 2-го класса, т. е. количество слов, которые ученик прочитывает за минуту.
Таблица 7.1
№ ученика1 | |||||||||||||
Скорость чтения | |||||||||||||
№ ученика | |||||||||||||
Скорость чтения |
1 –номер ученика используется вместо его фамилии
Первый шаг обработки этих данных – составить ранжированный вариационный ряд. Для рассматриваемого примера в таблице 7.2 представлены те же 25 данных, но упорядоченные по убыванию от 90 до 34.
Эта таблица позволяет установить ранг ученика, т. е. место, которое он занимает среди проверявшихся учеников, по скорости чтения. Чем меньше ранг, тем больше скорость чтения ученика. Ученик с рангом 1 имеет наибольшую скорость чтения. Поскольку имеются ученики с одинаковой скоростью чтения, то их ранги целесообразно считать одинаковыми, а именно – равными средним арифметическим соответствующих значений.
Например, ученики со скоростью чтения 85 слов/мин занимают 2-е и 3-е места, ранг каждого из них равен . Ученики со скоростью чтения 53 слова/мин занимают 14-е, 15-е, 16-е и 17-е, поэтому ранг каждого из них равен .
Таблица 7.2
№ ученика1 | |||||||||||||
Скорость чтения | |||||||||||||
Ранг ученика | 2,5 | 2,5 | 6,5 | 6,5 | 6,5 | 6,5 | |||||||
№ ученика | |||||||||||||
Скорость чтения | |||||||||||||
Ранг ученика | 15,5 | 15,5 | 15,5 | 15,5 | 23,5 | 23,5 |
Почему ранг учащихся со скоростью чтения 64 слова/мин равен 11?
В случае если некоторые значения встречаются неоднократно, составляют дискретный вариационный ряд. Число случаев, в которых встречается значение хі, называют частотой значения хі и обозначают рі1. Составляют таблицу абсолютных частот:
а i | а1 | а2 | а3 | … | аm |
рі | р1 | р2 | р3 | … | рm |
Упорядочение данных и подсчет их частот можно выполнять с помощью редактора электронных таблиц Microsoft Excel. Для этого используются команды или и статистическая функция (ЧАСТОТА).
Сумму р1 + р2 + ... + рт называют объемом совокупности данных и обозначают п; число различных значений, которые принимает исследуемая величина – т.
В рассматриваемом примере т = 13, п = 25.
Частота значения величины является ее определенной характеристикой, но недостаточной: в ней не учтен объем совокупности данных. Поэтому рассматривают такой показатель, как относительная частота значения.
Относительной частотой[1] рі* значения хі называют отношение частоты рі этого значения к объему п совокупности данных:
. (7.5)
В таблице относительных частот сопоставляются событие аi с его относительной частотой:
аi | а1 | а2 | а3 | … | аm |
рі* | р1* | р2* | р3* | … | рm* |
Для рассматриваемого примера абсолютные и относительные частоты скоростей чтения приведены в таблице 7.3.
Таблица 7.3
хі | |||||||||||||
рі | |||||||||||||
рі* | 0,04 | 0,08 | 0,04 | 0,16 | 0,04 | 0,12 | 0,04 | 0,16 | 0,04 | 0,04 | 0,12 | 0,08 | 0,04 |
Относительная частота значения является краткой и содержательной характеристикой рассматриваемой информации. Например, если считать, что для ученика 2-го класса нормой скорости чтения является 60 слов/мин, то относительная частота значений, не меньших нормы (т. е. от 90 до 64), в рассматриваемом случае равна , то есть меньше половины второклассников достигли нормы.