Работа с электронной таблицей
Заведите в электронную таблицу те данные, которые вы намерены обрабатывать. Для этого удобно использовать программу Paradox или Excel. Я предпочитаю Paradox по той причине, что перед каждой операцией по трансформации или обработке данных эта программа запрашивает подтверждение. При этом с массивом данных невозможно сделать что-либо случайно (по ошибке) или не заметив всех произошедших изменений с данными. Вероятно, тем, кто много работает с Excel, она удобнее, им легче контролировать свои действия.
И в той и в другой программе итог будет схожим. Возникнет таблица данных, в каждую ячейке (клетке) которой вписано (впечатано вами на клавиатуре) одно значение. Напомним, что в этой таблице все данные одного испытуемого записаны в одной строке, все значения одного параметра по всем испытуемым в одном столбце.
Обработку данных полезно начать с того, что сделать копию набранной базы данных (массива данных в электронном виде). Придерживайтесь этого правила постоянно. Все базы данных — продукт большого труда, поэтому их надо беречь особенно. Таблицы с вычислениями создаются быстрее. Удобнее новому файлу присвоить имя, немного изменив имя оригинала. Например, добавьте к имени оригинал буквы «cop», «cp» или одну «c». Некоторые программы не воспринимают буквы русского алфавита в именах файлов, поэтому используйте буквы латинского алфавита.
Далее надо перевести (конвертировать) данные из одной программы в другую. Если обработка будет производиться в программе Statistica, то после запуска программы выбираем модуль «Data Management». То есть, ставим указатель в окне выбора модулей на надпись «Data Management» и дважды щелкаем левой клавишей мыши. В верхней строке с основными меню щелчком мыши выбираем меню «File”, затем опцию “Import Date”. После этого распахнется окно “Select File to Import”. В окне-фрагменте “Directories” щелчками левой клавиши мыши последовательно выбираем директории, пока не доберемся до той папки, в которой находится импортируемый файл. Затем обращаемся к окну-фрагменту “List Files of Type”. Пользуясь его полосой прокрутки, находим нужный тип файла. Например, файлы данных в Excel имеют расширение “.xls”, а в программе Paradox — “.db”. Щелкнув один раз по обозначению нужного вида расширения, мы выбираем тип файла. В окне-фрагменте, расположенном немного выше, появляются все файлы выбранного типа, имеющиеся в найденной перед этим папке. Находим нужный файл, при необходимости пользуясь полосой прокрутки. Дважды щелкаем левой клавишей мыши по его надписи. Далее программа идентифицирует тип файла и запрашивает нашего подтверждения. Нажимаем клавишу Enter или щелкаем по кнопке “ОК”. Происходит конвертация файла, после которой мы видим данные в поле таблицы.
Из Excel в Statistica можно переносить данные и без этого диалога, через буферную память — примерно также, как переносим фрагмент текста в программе Word из одного открытого файла в другой. Например, так. Ставим указатель мыши в крайний правый угол таблицы (крайнюю правую нижнюю ячейку), нажимаем левую клавишу мыши и, удерживая нажатой, ведем влево вдоль всей нижней строки. Далее, продолжая держать клавишу нажатой, ведем указатель по всему крайнему левому столбцу до верхней строки. Отпускаем клавишу мыши. В поле таблицы появился маркированный прямоугольник с обратным контрастом — белые цифры на черном фоне. Таким же образом можно выделять не только всю таблицу, но и любую ее часть — прямоугольную или квадратную. Ставим указатель мыши в маркированную часть таблицы и нажимаем правую клавишу мыши. После этого нажатия активизируется контекстное меню. Выбираем команду «Копировать» и щелкаем по ней левой клавишей мыши. Теперь весь выделенный фрагмент таблицы находится в буферной памяти. В нижней служебной строке экрана находим пиктограмму «Statistica», щелкаем по ней левой клавишей мыши. На экране появится ее рабочее окно. В верхней строке с основными меню щелчком мыши выбираем меню «File”, затем опцию “New Date” (Новые данные). Если левая верхняя ячейка таблицы не выделена рамкой, то ставим указатель в эту ячейку и делаем один щелчок левой клавишей мыши. Нажимаем правую клавишу мыши, откроется контекстное меню. Выбираем команду «Вставить» (Paste) и щелкаем по ней левой клавишей мыши. Данные будут внесены в поле таблицы.
Проверка данных
На следующем шаге целесообразно проверить набранные данные. Это можно сделать визуально, внимательно осмотрев все значения. Но лучше осуществить проверку, использовав первичные статистики. Для этого выбираем модуль "Basic statistics & tables" (Основные статистики и таблицы). В верхней строке с основными меню щелчком мыши выбираем меню «Analysis”, затем опцию “ Descriptive statistics ”. Откроется диалоговое окно: "Descriptive statistics" (Описательные статистики). В окне мы увидим множество кнопок с надписями. Нажав кнопку, мы запускаем определенные вычисления или операции с данными. Но первое, что необходимо сделать, это выбрать переменные, над которыми мы хотели произвести те или иные операции. Поэтому нажимаем кнопку «Variables». После ее нажатия откроется новое окно, в котором будут перечислены все переменные. Чтобы задать ряд переменных, ставим указатель мыши на первую из этого ряда, нажимаем левую клавишу мыши и, удерживая клавишу нажатой, проводим указатель по списку до последней переменной в намеченном нами ряду. Нажимаем клавишу Enter или щелкаем по кнопке “ОК”.
Далее выбираем какие именно статистики будем вычислять. Для этого в окнах-фрагментах "Statistics" и "More statistics", необходимо отметить флажками (галочками) те числовые характеристики распределения, которые требуется вычислить Для проверки набранных данных целесообразно отметить флажками такие статистики: Valid N, Mean, Standard Deviation (стандартное отклонение), Minimum&Maximum, Skewness (коэффициент асимметрии), Kurtosis (коэффициент эксцесса). Нажимаем клавишу Enter или щелкаем по кнопке “ОК” в окне-фрагменте. Затем, еще раз Enter. Появляется таблица с подсчитанными статистиками.
Сначала надо проверить числа в столбце “ Valid n ” (Число случаев, по которому были проведены расчеты). Они должны соответствовать количеству испытуемых, данные которых включены в обработку. Затем проверить минимальные и максимальные значения. Здесь могут обнаружиться ошибки, возникшие при наборе данных или появиться первые кандидаты в выскакивающие варианты. То есть, в массиве данных есть значения, резко отличающиеся от других. Такое может быть следствием неправильно понятой испытуемым инструкции, серьезном сбое в работе по ходу эксперимента, ошибок записей в протоколах и др. Далее надо проанализировать стандартные отклонения, коэффициенты асимметрии, коэффициенты эксцесса. У однотипных данных они должны быть схожи. Если есть значительные отклонения, то надо выяснить чем это обусловлено. Причины отклонений могут быть и не в ошибках, а в том, что они отражают действительное влияние некоторых переменных. Но в начале надо убедиться, что нет ошибок в фиксации показателей при сборе данных и при подготовке электронной базы данных.
Построение гистограмм
Построение гистограммы может облегчить решение ряда задач: поиск ошибок при наборе, анализ распределения значений переменной, наглядное представление результатов, при котором хорошо видны размах варьирования переменной, мода (значение с самой высокой частотой, графически это пик кривой или ломаной линии), близость к нормальному распределению (или отдаленность), асимметрия и эксцесс. В виде гистограммы хорошо могут быть представлены данные, которые не удается включить в корреляционный и факторный анализ. Например, динамика показателей по сериям опытов, по дням обучения, возрастная динамика при наличии данных о характеристиках в разных возрастных группах и др.
Для построения гистограммы распределения в программе Statistica выбираем модуль: «Basic statistics & tables» (Основные статистики и таблицы), в нем диалоговое окно: “Descriptive statistics" (Описательные статистики). Затем выбираем одну или несколько переменных, для которых хотим построить гистограммы, поэтому нажимаем кнопку «Variables».
Для построения гистограммы надо нажать кнопку "Histograms". Если будет отмечен флажок "Normal expected frequencies", то на гистограмме будет вычерчена кривая, соответствующая нормальному распределению анализируемой случайной величины. По умолчанию программа примет 10 интервалов квантования или скорректирует это число с учетом количества значений и характера распределения. Но можно задать число интервалов квантования от 5 до 36. Для этого надо в строке "Categorization" указать количество интервалов ("Number of intervals"). Построенную гистограмму можно перенести в текст, набираемый в Word. Для этого в поле гистограммы надо щелкнуть правой клавишей мыши, в появившемся контекстном меню выбрать «Сору Graph», перейти в текстовый файл в Word. В нем поставить указатель в то место страницы, где должна быть гистограмма, щелкнуть правой клавишей мыши, в появившемся контекстном меню выбрать «Вставить». С гистограммой в Word далее можно осуществить множество операций для того, чтобы она удовлетворяла вашим требованиям. С этой целью в поле гистограммы надо щелкнуть правой клавишей мыши, а затем в появившемся контекстном меню выбирать необходимые операции.