Вычисление объема совокупности
Лабораторная работа 8
Статистический анализ данных, описательная статистика
Вопросы
Проведение статистического исследования. Генеральные и выборочные совокупности. Статистические таблицы. Графическое изображение данных. Основные статистические характеристики. Инструменты статистического анализа.
Цель работы: научиться обрабатывать статистические данные с помощью встроенных функций Excel; изучить возможности Пакета анализа и его некоторые инструменты.
Указания к выполнению работы:
Математическая статистика имеет дело с совокупностью объектов , которые обладают некоторым набором признаков (показателей, характеристик). Это т.н. статистическая совокупность.
Статистическая совокупность может включать все изучаемые объекты, в этом случае она называется генеральной совокупностью или только часть объектов, тогда она называется выборкой
Случайная выборка из генеральной совокупности
Чтобы по выборке можно было делать выводы о свойствах всей генеральной совокупности, она должна быть представительной (репрезентативной). Это обеспечивается в тех ситуациях, когда выборка является случайной. Модель случайной выборки должна отвечать следующим требованиям:
1) каждый из объектов, составляющих генеральную совокупность, должен иметь одинаковую возможность быть представленным в выборке;
2) все n измерений, изучаемого показателя, образующих выборку, должны быть независимыми, т. е. результаты каждого измерения не должны зависеть от предыдущих измерений.
Измерения изучаемого показателя, составляющие выборку, обычно, помещаются в таблицу.
Чаще всего используются два вида статистических таблиц: простые и групповые
Простые таблицы содержат перечень отдельных измерений, входящих в состав совокупности. В групповых таблицах измерения объединяются в определенные группы в соответствии с каким-либо признаком.
Например: простая таблица содержит ряд измерений веса
Простая ранжированная таблица (данные размещены по возрастанию)
Групповая таблица с размером диапазонов разброса - 5
Диапазоны группировки | 55-60 | 61-65 | 66-70 |
Кол-во значений в группе |
Основные статистические характеристики.
Для анализа статистических данных можно использовать различные программные пакеты. Для несложных расчетов описательной статистики применим MS Excel, которыйимеет широкий набор средств работы с данными. Наиболее часто используемые статистические функции встроены в основное ядро Excel и доступны с момента запуска программы. Другие более специализированные функции входят в дополнительную подпрограмму, называемую «пакетом анализа». Команды и функции пакета анализа называют Инструментами анализа. Рассмотрим нескольких основных встроенных статистических функций и наиболее полезные инструменты анализа данных из пакета.
Вычисление среднего значения.
Формула среднего значения
Функция СРЗНАЧ (или AVERAGE) вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).
Вычисление дисперсии и среднего квадратического отклонения.
Для оценки разброса данных используются такие статистические характеристики, как дисперсия D и среднее квадратическое (или стандартное) отклонение σ. Стандартное отклонение есть квадратный корень из дисперсии:. Большое стандартное отклонение указывает на то, что значения измерения сильно разбросаны относительно среднего, а малое – на то, что значения сосредоточены около среднего.
В Excel имеются функции, отдельно вычисляющие выборочную дисперсию Dви стандартное отклонениеσ ви генеральные дисперсию Dг и стандартное отклонение σ г. Поэтому, прежде чем вычислять дисперсию и стандартное отклонение, следует четко определиться, являются ли ваши данные генеральной совокупностью или выборочной. В зависимости от этого нужно использовать для расчета Dг и σ г ,Dв и σ в.
Для вычисления выборочной дисперсии Dв и выборочного стандартного отклонения σв имеются функции ДИСП (или VAR) и СТАНДОТКЛОН (или STDEV). Аргументом этих функций является набор чисел, как правило, заданный диапазоном ячеек, например, =ДИСП (В1:В48).
Для вычисления генеральной дисперсии Dг и генерального стандартного отклонения σг имеются функции ДИСПР (или VARP) и СТАНДОТКЛОНП (или STDEVP), соответственно.
Аргументы этих функций такие же как и для выборочной дисперсии.
Вычисление объема совокупности.
Объем совокупности выборочной илигенеральной – это число элементов совокупности. Функция СЧЕТ (или COUNT) определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ (С2:С16).
Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3. Ее аргументом является интервал ячеек.