Обработка эмпирических данных

Первичная обработка данных

В ходе математико-статистической обработки данных (на специальном жаргоне) термины «признак», «показатель», «параметр» и «переменная» нередко употребляются как синонимы. Важно отличать от них понятие «значение». Каждое значение — это эмпирически выявленная, вполне определенная числовая величина того или иного показателя у конкретного испытуемого. Например, время реакции на раздражитель в третьей (первой, второй, десятой…) пробе, время решения пятой задачи в третьей серии, выбранный испытуемым вариант ответа из семи предложенных и т.п.

Составление таблиц

В большинстве случаев обработку целесообразно начать с составления таблиц (сводных таблиц) полученных данных. В таблицу можно свести не только числовые данные. К данным качественного характера также могут быть применены простейшие способы количественной обработки. Для всей выборки и отдельных подвыборок могут быть подсчитаны частоты встречаемости (количество случаев появления события), а затем и частости (относительные частоты, т.е. частоты, деленные на количество испытаний) интересующих вас индикаторов, проявлений некоторого вида.

Так, например, при использовании рисуночного теста "Дерево" можно в качестве параметра рассматривать наличие/отсутствие листьев на ветках в рисунке. Если этот параметр будет определен у всех испытуемых, это позволит подсчитать частость его появления по всей выборке и для отдельных групп внутри ее. В таблицу могут быть сведены данные и по другим параметрам теста "Дерево", а затем подсчитаны частости. Далее можно составить таблицу, в которой будут представлены данные не по отдельным испытуемым, а для всей вашей выборки и отдельных групп. Это позволит сделать шаг к более целостному представлению информации.

Основной для сводной таблицы исходных данных является следующая форма. Каждая строка содержит значения всех показателей одного испытуемого. В каждом столбце (поле) записаны значения одного показателя по всем испытуемых. Таким образом, в каждой ячейке (клетке) таблицы записано только одно значение одного показателя одного испытуемого.

В самой верхней строке дана нумерация всех столбцов. Во второй строке названы измеренные вами показатели, шкальные оценки и т.п. Вторая строка облегчает вам ориентировку в таблице. Оператору, который будет вводить ваши данные через клавиатуру компьютера, эта строка не нужна. В каждой последующей строке записана фамилия испытуемого и значения всех, измеренных у него параметров; разумеется, для всех испытуемых в одном и том же порядке показателей. Все строки и все столбцы должны быть пронумерованы. Последовательность признаков может быть упорядочена по разным основаниям. В первых столбцах лучше разместить демографические или социально-демографические показатели: пол, возраст, уровень образования (если важен) и т.д. Затем, по убывающей значимости (предполагаемой информативности), приведены измеренные в эксперименте параметры. Параметры, полученные с помощью одной методики, удобнее располагать компактно — в одной группе (рядом друг с другом) Например, все шкалы одной методики, шкалы следующей и т.д.

Испытуемых можно перечислить в алфавитном порядке, но лучше использовать этот принцип на самом нижнем уровне деления. Сначала лучше разделить испытуемых по их принадлежности к каким-либо подгруппам, которые будут сравниваться между собой. Внутри этих подгрупп полезно упорядочить испытуемых по полу, возрасту или другому, важному для вас, параметру. (см. табл. 8)

Таблица 8. Форма сводной таблицы данных

№ п/п Фамилия, имя, отчество Пол Ио Ид Ин А В С Е
Глухарь П.И.
Орел С.С.
Петух И.И.
Кура Н.Н.
Сова Т.О.
Утка Л.А.

Таблицам необходимо давать заголовки, достаточно полно отражающие их содержание и специфику. При большом количестве таблиц без заголовков по ходу ознакомления с текстом трудно понять их назначение.

И для ручной, и для компьютерной обработки в исходную сводную таблицу чаще всего заносят начальные данные. Сейчас преимущественной формой математико-статистической обработки стала — компьютерная. Если форма распределения эмпирических данных незначительно отличается от нормального распределения, то предварительное центрирование, нормирование или перевод в шкальные (стандартизированные) оценки по имеющимся в данной методике таблицам не требуется. В начальный период обработки данных можно предположить, что собранный вами материал подходит для обработки средствами параметрической статистики. Получив на первом шаге компьютерных вычислений первичные статистики признаков, можно сделать дальнейшие, более точные, предположения о форме распределения каждого признака.

В ходе обработки данных весьма вероятно, что потребуются несколько пользовательских программ. Современные программы предоставляют довольно широкие возможности перевода данных из одной — в другую. Однако не будет лишним соблюсти некоторые правила, чтобы облегчить преобразование формата данных.

Старайтесь, без особой необходимости, не заносить в таблицу различные текстовые символы (точки, запятые, тире…). Всю информацию, которую можно закодировать числами, лучше перевести в числовую форму. Это даст больше возможностей для разных видов обработки данных. Исключением является строка, в которой записаны названия (чаще, краткие названия — аббревиатуры) измеренных показателей.

До начала набора данных в электронную таблицу узнайте в каком виде должны записываться десятичные дроби — какой знак (точка или запятая) должен разделять целую дробную части.

Не объединяйте, без необходимости, ячейки рабочей таблицы. Эстетическому чувству полезно дать проявиться при оформлении таблицы в тексте рукописи, — когда все подсчитано, но не ранее. Особо внимательно отнеситесь к первым ячейкам — в левом верхнем углу таблицы. Лучше заполнить их произвольными числами, чем оставлять пустыми. Без этого при экспорте в другой формат может быть не считана вся первая строка или может измениться структура всей таблицы.

Наши рекомендации