Метода группировок и метода средних 11 страница

Оцените согласованность мнений экспертов с помощью коэффициента конкордации и проверьте его существенность с уровнем значимости 0,05. Сделайте выводы.

Тема 14. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ИНФОРМАЦИИ

В СРЕДЕ WINDOWS

Система STATISTICA представляет собой интегрированную систему статистического анализа и обработки данных. Система состоит из следующих основных компонент:

• многофункциональной системы для работы с данными;

• мощной графической системы для визуализации данных и результатов статистического анализа;

• набора статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;

• специального инструментария для подготовки отчетов;

• встроенных языков SCL и STATISTICA BASIC, которые позволяют автоматизировать рутинные процессы обработки данных в системе.

STATISTICA работает с четырьмя различными типами документов, которые соответствуют основным структурным компонентам системы. Это:

• электронная таблица Spreadsheet, которая предназначена для ввода исходных данных и их преобразования;

• электронная таблица Scrollsheet для вывода численных и текстовых результатов анализа;

• график — документ в специальном графическом формате для визуализации и графического представления численной информации;

• отчет — документ в формате RTF (Расширенный текстовой формат) для вывода текстовой и графической информации.

В соответствии со стандартами среды Windows каждый тип документа выводится в своем собственном окне в рабочей области системы STATISTICA. Как только это окно становится активным, изменяется панель инструментов и меню. В них появляются команды и кнопки, доступные для активного документа.

Статистический анализ данных может быть проведен пользователем в одном из следующих режимов.

• Интерактивный режим работы. В этом случае взаимодействие с системой осуществляется при помощи последовательного выбора различных команд из меню. Этот способ работы применяется обычно на этапе предварительного анализа данных.

• Использование макрокоманд. В STATISTICA имеется возможность записи последовательности команд в одну макрокоманду. При этом можно записывать как последовательности нажатий клавиш на клавиатуре, так и движения мыши. Это удобное средство позволяет автоматизировать выполнение часто повторяющихся шагов статистического анализа.

• При помощи встроенного командного языка системы STATISTICA (язык SCL — STATISTICA Command Language) пользователь имеет возможность выполнять статистическую обработку данных в пакетном режиме. Кроме того, имеется возможность установить соответствие между этой программой и ярлыком на рабочем пространстве Windows и запускать ее как обычное Windows приложение.

• При помощи встроенного языка STATISTICA BASIC пользователь может написать свои собственные процедуры обработки данных. Это мощный язык, ориентированный на структуру данных системы STATISTICA, содержит большое количество специальных математических и статистических функций (например, операции работы с матрицами — всевозможные разложения матриц, нахождения собственных векторов и собственных значений и др., вычисление всевозможных статистических распределений и т. д.).

Статистическая обработка данных в системе STATISTICA обычно состоит из следующих основных шагов:

• ввод исходных данных в электронную таблицу системы STATISTICA;

• предварительные преобразования данных перед непосредственным применением конкретного статистического метода;

• визуализация данных при помощи того или иного типа графиков;

• статистический .анализ при помощи некоторого статистического метода; подбор модели и задание необходимых параметров в статистических процедурах;

• вывод численных, текстовых и графических результатов, как на рабочее пространство системы, так и в файл с отчетом;

• анализ результатов.

Данные в STATISTICA организованы в виде электронной таблицы — Spreadsheet. Они могут содержать как численную, так и текстовую информацию. Данные в электронной таблице могут иметь различные форматы, например, даты времени, денежный и научный форматы и др. Электронные таблицы в STATISTICA поддерживают различные типы операций с данными, такие как: операции с использованием буфера обмена Windows; операции с выделенными блоками значений (аналогично MS® Excel®), в том числе и с использованием метода Drag-and-Drop — "Перетащить и опустить"; автозаполнение блоков и т. д.

Ввести данные в электронную таблицу можно одним из следующих способов.

• Непосредственно ввести их в электронную таблицу с клавиатуры;

• Вычислить новые данные на основе уже введенных данных при помощи формул, которые можно задать в электронной таблице. При этом имеется возможность быстрого доступа к большому количеству специализированных математических и статистических функций, допускается использование логических операторов. Для задания сложных процедур преобразования данных можно воспользоваться встроенным языком STATISTICA BASIC;

• Воспользоваться данными, подготовленными в другом приложении.

Для более сложных процедур обработки исходных данных в STATISTICA существует ряд специализированных инструментов. Это, прежде всего:

• специализированный модуль Data Managment — Управление данными, который содержит большое количество вспомогательных процедур по работе с данными (иерархическая сортировка, проверка, категоризация и ранжирование и др.);

• встроенный язык STATISTICA BASIC, который непосредственно ориентирован на структуру данных системы STATISTICA и при помощи которого можно самостоятельно написать сложные процедуры задания и преобразования исходных данных;

• STATISTICA Megafile Manager — Менеджер мегафайлов — специальная система управления базами данных для обработки больших массивов данных и данных, которые содержат длинные текстовые значения. В Менеджер мегафайлов включены также простейшие средства статистической обработки данных. Он может быть использован для предварительной обработки данных перед их вводом в электронную таблицу системы STATISTICA.

Система STATISTICA обладает широкими графическими возможностями. STATISTICA включает в себя большое количество разнообразных категорий и типов графиков (включая научные, деловые, трехмерные и двухмерные графики в различных системах; координат, специализированные статистические графики — гистограммы, матричные, категоризованные графики и др.).

В систему STATISTICA включено большое количество инструментов настройки всех компонент графиков. Имеется возможность выбора различных типов линий, форматов разметки осей, цветов, легенд, названий и других атрибутов графика. Настроенные атрибуты могут быть сохранены в специальном файле и потом применяться к другим графикам. Доступ ко всем основным командам настройки реализован при помощи контекстных меню, которые появляются при нажатии на правую кнопку мыши, общего меню и из панели инструментов графика.

Графические средства системы STATISTICA доступны в любом статистическом модуле и на любом шаге статистического анализа. Они могут быть использованы в целях:

• визуализации численных и текстовых значений непосредственно из электронной таблицы с исходными данными STATISTICA или таблицы Scrollsheet с результатами анализа;

• вывода результатов статистического анализа в виде последовательности (очереди) графиков.

Визуализация данных является важным этапом статистического анализа. В систему STATISTICA включены удобные инструментальные средства для проведения интерактивного графического анализа данных. При помощи так называемой Кисти, включенной в STATISTICA, вы можете выделить какие-либо точки на построенном графике (например, выбросы значений переменной) и провести дальнейший статистический анализ без значений, которые соответствуют этим точкам. Эти точки могут быть помечены специальным образом, им может быть присвоена метка. Численные значения, соответствующие выделенным точкам на графике, могут быть отмечены в специальной электронной таблице, которая связана с графиком и просмотрены в специальном Редакторе данных графика.

STATISTICA содержит удобные инструменты для размещения нескольких графиков и других документов в одном окне. При помощи этих средств можно легко компоновать сложную графическую, текстовую и численную информацию. Более того, STATISTICA полностью поддерживает технологию OLE — Связывание и внедрение объектов (как в режиме сервера, так и в режиме клиента), при помощи которой вы можете внедрять и связывать документы из различных приложений в графический документ STATISTICA и наоборот — вставлять графики из STATISTICA в другие Windows приложения. Графический документ в STATISTICA может быть сохранен как:

• графический документ в специальном графическом формате системы STATISTICA (расширение файла *.stg), который может быть открыт позже и использован в процессе анализа;

• в графическом растровом формате (расширение файла *.Ьтр, *.рсх);

• в графическом формате Windows метафайла (*.wmf).

Статистические процедуры системы STATISTICA сгруппированы в нескольких специализированных статистических модулях. В каждом модуле вы можете выполнить определенный способ обработки, не обращаясь к процедурам из других модулей.

Модуль «Основные статистики и таблицы»

Этот статистический модуль включает в себя приведенные ниже группы статистических процедур.

Наши рекомендации