Пункт 13 выполняется на зачетном занятии.
13. Оценки M[x], полученные по выборкам объемов N1 и N2 собрать в блок и построить график, вызвав Block Stats/Columns->Graphs->Box Plot/Mean. Повторить построение графика для блока оценок SD[x].
( обозначения на графике Box Plot: Mean – среднее по ряду измерений, SD - среднеквадратическое отклонение случайной величины, SE – среднеквадратическое отклонение среднего ).
Объяснить, что изображено на графике и в чем состоит отличие построенных интервалов от доверительных.
14. Оформить отчет, содержащий расчеты и графики по всем пунктам задания.
Контрольные вопросы:
1. Что такое интервальная оценка? Как определить точность интервальной оценки?
2. Что такое доверительная вероятность?
3. Как рассчитать интервальную оценку для M[x] ?
4. Как рассчитать интервальную оценку для D[x ] ?
5. Какие особенности интервальной оценки M[x] вы можете отметить?
6. Какие особенности интервальной оценки D[x] вы можете отметить?
7. Как проявляется величина доверительной вероятности при интервальном оценивании? Приведите пример из лабораторной работы.
8. Как зависит ширина доверительного интервала от объема выборки ? Приведите пример из лабораторной работы.
9. Как зависит ширина доверительного интервала от доверительной вероятности? Приведите пример из лабораторной работы.
10. Какие стандартные статистики связаны с оценкой математического ожидания ?
11. Какая стандартная статистика связана с оценкой дисперсии?
III. Методические указания для выполнения лабораторных работ с использованием пакета STATISTICA v.5.5
Пакет STATISTICA имеет модульную структуру. Каждый модуль включает ряд процедур, реализующих конкретное направление обработки данных.
После запуска исполняемого файла на экране открывается рабочее окно системы со строкой меню в верхней части и окном Module Switcher - Переключателя модулей, при помощи которого выбирается модуль для работы. Основными модулями являются:
· Basic Statistics/ Tables – основные статистики и таблицы,
· Multiple Regression – множественный регрессинный анализ,
· Data Management/ MFM – управление данными,
· Nonlinear Estimation – нелинейное оценивание,
· ANOVA/MANOVA – одномерный и многомерный дисперсионный анализ
и другие.
Если открыто только окно Переключателя модулей,следует начать работу с модуля Data Management/ MFMили Basic Statistics/ Tables.
После переключения на нужный модуль позиция Analysis строки меню в открытом окне будет относиться к данному модулю. Работа с модулем начинается с активизации этой позиции.
Рассмотрим выполнение основных действий, необходимых при работе с данными.
Создание файла для хранения данных выполняется при выборе позиций File->New Data в верхней строке меню. Эта позиция является общей для всех модулей. Первоначальный вид открывшейся таблицы: 10 столбцов и 10 строк. Увеличить количество столбцов можно после выбора позиций – Vars->Add,а строк- Cases->Add.
Данные, испльзуемые в пакете, могут быть разных типов, они организованы в виде электронной таблицы Spreadsheet и хранятся в файлах с расширением *.sta. Данные могут быть введены в таблицу вручную с клавиатуры, из других приложений, например, через буфер обмена, рассчитаны по заданным формулам.
2. Моделирование переменных, т.е. расчет значений по заданной формуле, происходит в следующей последовательности:
· щелчком мыши по названию столбца отметить переменную в таблице,
· нажать правую клавишу мыши и в открытом окне выбрать позицию Variable Specs спецификация переменной,
· в открытом окне для конкретной переменной можно задать ее смысловое имя (например, Х1 вместо место Var1), способ вычисления значений, условные обозначения пропущенных данных и т.п. Формулы для вычислений значений можно ввести вручную в нижнем окне или выбрать из перечня стандартных функций, открывающегося кнопкой Functions.
Для моделирования случайной величины X с нормальным распределением математическим ожиданием m=2 и среднеквадратическим отклонением s=5 следует щелчком мыши отметить столбец, в котором будут размещены значения, ввести название переменной –Х вместо Var, а нижнем окне задать формулу
VNormal ( rnd (1) ;2;5).
После появления сообщения Expression OK выполнить вычисления.
3. Построение графиков выполняется после выбора позиции Graphs в верхней строке меню. В открывшемся подменю можно выбрать:
· Quick Stats Graphs – быстрое построение статистических графиков ( в том числе двумерных и трехмерных гистограмм),
· Stats 2D Graphs – построение основных двумерных статистических графиков: гистограммы, диаграммы накопленных частот,
· Stats 3D Graphs – построение основных трехмерных статистических графиков,
· Custom graphs – построение пользовательских графиков
и другие.
Построенный график может быть сохранен как документ в формате системы - *.stg, в растровом графическом формате - *.bmp,может быть скопирован в буфер и перенесен в приложение.
4. Расчет основных статистических характеристик выполняется при переключении на модуль Basic Statistics/ Tables. Позиция Analysis в верхней строке экрана позволяет открыть подменю модуля и выбрать вид анализа, например, Descriptive Statistics– описательные статистики.
5. Множественный регрессионный анализ проводится после вызова модуля Multiple Regression. После активизации позиции Analysis следует выбрать Startup Panel – стартовая панель, с которой задаются независимые и зависимые переменных, тип алгоритма расчета и, при необходимости, открыть файл данных.
После выполнения расчетов открывается окно результатов, в котором представлена следующая краткая информация:
· Имя зависимой переменной,
· Количество данных,
· R - коэффициент множественной корреляции,
· RI - коэффициент детерминации,
· Std. Error of Estimate - оценка среднего квадратичного отклонения предсказания,
· Intercpt - оценка свободного члена в регрессии,
· Std. Error of intercpt - оценка среднего квадратичного. отклонения оценки свободного члена,
· Значение t-статистики и вероятность - p для проверки значимости свободного члена,
· Значение F- статистики, df - число степеней свободы и вероятность- р для проверки значимости регрессии в целом.
Ниже этих значений расположены функциональные кнопки для вызова дополнительной информации о результатах расчетов.
Кнопкой Regression Summery – итог расчета регрессии - вызывается таблица с оценками параметров модели, их ошибками, значениями t-статистик и вероятностями -p для проверки их значимости. Кнопкой Residual Analysis вызывается анализ остатков. В этом разделе можно рассчитать предсказанные по модели значения зависимой переменной –Predicted values, остатки -Residuals и провести статистический анализ и визуальный анализ остатков с помощью графиков.
6. Создание отчета – файла (в форматах *.txt или *.rtf ), в котором сохраняется текстовая или графическая информация. В дальнейшем файл может редактироваться с помощью встроенного редактора системы или в любом текстовом редакторе.
Создание отчета возможно в автоматическом режиме и вручную копированием необходимых данных. Для автоматического создания отчета необходимо выполнить следующие операции:
· Из позиции File выбрать Page /Out Setuр,
· в открытом окне установить тип выводимой информации – текст или графики, канал вывода – File, Window, Printer, имя файла отчета, условие автоматического дополнения отчета (Auto Retrieve the Contents of the Text),
· Из позиции Fileвыбрать Print каждый раз когда необходимо дополнить файл отчета.
Примечание: автоматический отчет может использоваться как временное оперативное хранилище данных.
Отчет по лабораторным работамдолжен содержать в каждом пункте:
· Содержание работы или исследования,
· основные результаты в виде таблиц, графиков и т.п.
· содержательные выводы по результатам в соответствии с заданием.