Числовые характеристики выборок. Характеристики положения.
- среднее арифметическое (среднее) значение:
- медиана – то значение x, которое делит пополам площадь построенной по данным выборки гистограммы или полигона
- мода – наиболее часто встречающееся в выборке значение x
- среднее геометрическое значение:
Числовые характеристики выборок. Характеристики рассеяния (разброса)
• выборочное среднеквадратичное отклонение:
• выборочная дисперсия:
• размах : .
• выборочное среднее отклонение :
Статистическая обработка результатов измерений может производиться с помощью компьютерных технологий, среди которых такие как Microsoft Excel, Microsoft Aссess, MathCAD и др.
Microsoft Excel — программа для работы с электронными таблицами, созданная корпорацией Microsoft для Microsoft Windows, Windows NT и MacOS. Она предоставляет возможности экономико-статистических расчетов, графические инструменты и, за исключением Excel 2008 под Mac OS X, язык макропрограммирования VBA (Visual Basic for Application). Microsoft Excel входит в состав Microsoft Office и на сегодняшний день Excel является одним из наиболее популярных приложений в мире. Excel был первым табличным процессором, позволявшим пользователю менять внешний вид таблицы на экране: шрифты, символы и внешний вид ячеек. Он также первым представил метод умного пересчёта ячеек — обновления только ячеек, зависящих от изменённых ячеек: раньше табличные процессоры пересчитывали все ячейки.
Приложение Microsoft Office Excel 2007 — это мощный инструмент, используемый для создания и форматирования электронных таблиц, анализа данных и обмена информацией для принятия более обоснованных решений. Пользовательский интерфейс Microsoft Office Fluent, наглядная визуализация данных и представления сводной таблицы упрощают создание и использование профессионально оформленных диаграмм. Приложение Office Excel 2007, объединенное со службами Excel, — это новая технология, предоставляемая с Microsoft Office SharePoint Server 2007 и характеризующаяся значительно более удобными средствами обмена данными и повышенным уровнем безопасности, благодаря которому вы сможете более свободно предоставлять сотрудникам, клиентам и бизнес-партнерам безопасный доступ к конфиденциальной коммерческой информации. При совместном использовании электронных таблиц в Office Excel 2007 и службах Excel можно просматривать, сортировать, фильтровать и вводить параметры, а также взаимодействовать с представлениями сводной таблицы непосредственно в веб-браузере. В EXEL имеется достаточно большой встроенный справочник формул, в там числе и формул статистических. Формулы также можно вводить вручную. Формулы представляют собой выражения, по которым выполняются вычисления на листе.
Microsoft Office Access или просто Microsoft Access — реляционная СУБД[17] корпорации Microsoft. Имеет широкий спектр функций, включая связанные запросы, связь с внешними таблицами и базами данных. Благодаря встроенному языку VBA, в самом Access можно писать приложения, работающие с базами данных.
Основные компоненты MS Access:
- построитель таблиц;
- построитель экранных форм;
- построитель SQL[18]-запросов;
- построитель отчётов, выводимых на печать.
MS Access позволяет разрабатывать приложения и БД практически «с нуля» или написать оболочку для внешней БД.
Mathcad — система компьютерной алгебры из класса систем автоматизированного проектирования, ориентированная на подготовку интерактивных документов с вычислениями и визуальным сопровождением, отличается легкостью использования и применения для коллективной работы. Mathcad имеет интуитивный и простой для использования интерфейс пользователя. Для ввода формул и данных можно использовать как клавиатуру, так и специальные панели инструментов.
Работа осуществляется в пределах рабочего листа, на котором уравнения и выражения отображаются графически. При создании документов-приложений используется принцип WYSIWYG (What You See Is What You Get — «что видишь, то и получаешь»). Несмотря на то, что эта программа, в основном, ориентирована на пользователей-непрограммистов, Mathcad также используется в сложных проектах, чтобы визуализировать результаты математического моделирования. Также Mathcad часто используется в крупных инженерных проектах, где большое значение имеет трассируемость и соответствие стандартам.
Mathcad достаточно удобно использовать для обучения, вычислений и инженерных расчетов. Открытая архитектура приложения в сочетании с поддержкой технологий .NET[19] и XML[20] позволяют легко интегрировать Mathcad практически в любые ИТ-структуры и инженерные приложения. Есть возможность создания электронных книг (e-Book).
Mathcad содержит сотни операторов и встроенных функций для решения различных технических задач. Программа позволяет выполнять численные и символьные вычисления, производить операции со скалярными величинами, векторами и матрицами, автоматически переводить одни единицы измерения в другие.
Среди возможностей Mathcad можно выделить:
• Решение дифференциальных уравнений, в том числе и численными методами
• Построение двумерных и трёхмерных графиков функций (в разных системах координат, контурные, векторные и т. д.)
• Использование греческого алфавита как в уравнениях, так и в тексте
• Выполнение вычислений в символьном режиме
• Выполнение операций с векторами и матрицами
• Символьное решение систем уравнений
• Аппроксимация кривых
• Выполнение подпрограмм
• Поиск корней многочленов и функций
• Проведение статистических расчётов и работа с распределением вероятностей
• Поиск собственных чисел и векторов
• Вычисления с единицами измерения
• Интеграция с САПР-системами, использование результатов вычислений в качестве управляющих параметровС помощью Mathcad инженеры могут документировать все вычисления в процессе их проведения.
Регрессия — зависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин (в последнем случае — имеем множественную регрессию). Следовательно, при регрессионной связи одному и тому же значению x величины X (в отличие от функциональной связи) могут соответствовать разные случайные значения величины Y. Распределение этих значений называется условным распределением Y при данном X = x. Уравнение, связывающее эти величины, называется уравнением регрессии, а соответствующий график — линией регрессии величины Y по X. Переменная х называется регрессионной переменной или регрессором. Точность, с которой линия регрессии Y по х передает изменение Y в среднем при изменении х, измеряется дисперсией величины Y, вычисляемой для каждого значения х:
Регрессионные модели часто применяются в качестве моделей процессов, построенных на основе экспериментальных данных.
Mathcad включает ряд функций для вычисления регрессии. Обычно эти функции создают кривую или поверхность определенного типа, которая в некотором смысле минимизирует ошибку между собой и имеющимися данными. Функции отличаются прежде всего типом кривой или поверхности, которую они используют, чтобы аппроксимировать данные. Эти функции не требуют, чтобы аппроксимирующая кривая или поверхность проходила через точки данных. Функции регрессии гораздо менее чувствительны к ошибкам данных, чем функции интерполяции. Конечный результат регрессии — функция, с помощью которой можно оценить значения в промежутках между заданными точками.
Линейная регрессия.Эти функции возвращают наклон и смещение линии, которая наилучшим образом приближает данные в смысле наименьших квадратов.
Эти функции полезны не только, когда данные по существу должны представлять линейную зависимость, но и когда они представляют экспоненциальную зависимость. Тогда можно применить эти функции к логарифму данных и использовать тот факт, что log(y) = log(A) + kx. Такое приближение взвешивает ошибки по-другому, нежели приближение показательной функцией в смысле наименьших квадратов, но обычно это — хорошая аппроксимация.
Полиномиальная регрессия. Эти функции полезны, когда есть набор измеренных соответствующих значений y и x, между которыми ожидается полиномиальная зависимость, и нужно приблизить эти значения с помощью полинома наилучшим в определённом смысле образом. На практике не следует использовать степень полинома выше n = 4.