Статистическая зависимость
Н.л.новротская,
М.л.петрович
Элементы
Математической
Статистики
Часть II
Минск
Авторы: Новротская Надежда Леонидовна, доцент кафедры высшей математики и статистики ИУП;
Петрович Мария Людвиговна, доцент кафедры высшей математики и статистики ИУП, кандидат экономических наук.
Рецензент: Марков Лев Николаевич, профессор, доктор технических наук.
Утверждено и рекомендовано к опубликованию на заседании кафедры «Высшей математики и статистики»
Учебное пособие написано в соответствии с программой подготовки специалистов по управлению и экономике в Институте управления и предпринимательства.
Компьютерный набор и верстка В.И.Дробудько
Оригинал-макет изготовлен
на настольно-издательской системе ИУиП
Подписано к печати 20.05.2000.
Формат 60х84 1/16.
Гарнитура Таймс.
Институт управления и предпринимательства,
г. Минск, ул. Славинского, 1, корп. 2г.
ã Новротская Н.Л.
ã Петрович М.Л.
Содержание
Часть I
Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
Тема 1. | Генеральная совокупность, выборка и выборочные распределения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | |
§ 1.1. Предмет математической статистики . . . . . . . . . . . . . . . | ||
§ 1.2. Генеральная совокупность и выборка . . . . . . . . . . . . . . . | ||
§ 1.3. Выборка и способы ее получения . . . . . . . . . . . . . . . . . . | ||
§ 1.4. Статистическое распределение выборки. Геометрическое изображение (полигон, гистограмма) . . . . . . . . . . . . . . . | ||
§ 1.5. Выборочные распределения . . . . . . . . . . . . . . . . . . . . . . . | ||
Вопросы для самопроверки . . . . . . . . . . . . . . . . . . . . . . . . | ||
Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
Тема 2. | Статистическое оценивание параметров . . . . . . . . . . . . . . . | |
§ 2.1. Постановка задачи и точечное оценивание . . . . . . . . . . . | ||
§ 2.2. Свойства оценок . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 2.3. Интервальное оценивание . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 2.4. Интервальные оценки математического ожидания . . . . | ||
§ 2.5. Доверительный интервал для вероятности . . . . . . . . . . . | ||
§ 2.6. Построение доверительного интервала для среднего квадратического отклонения s и дисперсии s нормально распределенной генеральной совокупности . . . . . . . . . . . . . . | ||
§ 2.7. Методы оценивания . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 2.8. Оценки с минимальной дисперсией . . . . . . . . . . . . . . . . . | ||
Вопросы для самопроверки . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
Тема 3. | Проверка статистических гипотез . . . . . . . . . . . . . . . . . . . . . | |
§ 3.1. Статистическая гипотеза и ошибки первого и второго рода. | ||
§ 3.2. Процедура построения критерия для проверки гипотезы | ||
§ 3.3. Односторонний и двусторонний критерий . . . . . . . . . . . | ||
§ 3.4. Понятие о Р-значении . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 3.5. Этапы проверки параметрической гипотезы . . . . . . . . . . | ||
§ 3.6. Параметрические критерии проверки гипотез . . . . . . . . | ||
Вопросы для самопроверки . . . . . . . . . . . . . . . . . . . . . . . . | ||
Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
Часть II
Тема 4. | Корреляционный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . . . | |
§ 4.1. Статистическая зависимость . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 4.2. Вычисление коэффициента корреляции по выборке . . | ||
§ 4.3. Свойства и значимость коэффициента корреляции . . . . | ||
§ 4.4. Коэффициент детерминации . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 4.5. Частный и множественный коэффициенты корреляции | ||
Тема 5. | Регрессионный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | |
§ 5.1. Простая линейная регрессионная модель и оценивание по методу наименьших квадратов . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 5.2. Проверка гипотез и доверительные интервалы . . . . . . . | ||
§ 5.3. Множественная линейная регрессия и ее исследование | ||
§ 5.4. Проверка адекватности регрессионной модели . . . . . . . | ||
§ 5.5. Анализ остатков . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 5.6. Интерпретации оценок параметров линейного уравнения множественной регрессии . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 5.7. Понятие о нелинейной регрессии . . . . . . . . . . . . . . . . . . . | ||
Вопросы для самопроверки . . . . . . . . . . . . . . . . . . . . . . . . | ||
Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
Тема 6. | Однофакторный дисперсионный анализ . . . . . . . . . . . . . . . | |
§ 6.1. Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 6.2. Проверка гипотез . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 6.3. Вопросы для самопроверки . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 6.4. Проверка гипотез . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
Тема 7. | Анализ временных рядов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | |
§ 7.1. Временной ряд и его составляющие . . . . . . . . . . . . . . . . | ||
§ 7.2. Стационарные временные ряды и их основные характеристики . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 7.3. Методы сглаживания временного ряда (выделение неслучайной составляющей) . . . . . . . . . . . . . . . . . . . . . . . . . . . . | ||
§ 7.4. Прогнозирование экономических показателей, основанное на использовании моделей временных рядов . . . . . . . | ||
Вопросы для самопроверки . . . . . . . . . . . . . . . . . . . . . . . . | ||
Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
Тема 4. корреляционный анализ
статистическая зависимость
В естествознании и технике определено понятие функциональной зависимости, сущность которой заключается в том, что какая-либо физическая величина определяется как однозначная функция одной или нескольких величин. Например, из физики известна формула
,
отражающая функциональную зависимость давления газа на стенки сосуда (Р) от температуры (Т), объема сосуда (V), постоянной величины R; из математики известна формула площади круга , где S является функцией радиуса r.
Между случайными величинами может существовать связь и другого рода, а именно, одна из случайных величин реагирует на изменение другой случайной величины изменением своего закона распределения. Такая связь называется стохастической (вероятностной, статистической). Стохастическая связь между двумя случайными величинами появляется обычно тогда, когда имеются общие факторы, влияющие как на одну, так и на другую случайную величину. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой. В этом случае статистическая зависимость называется корреляционной.
Пример. Пусть Y – урожай зерна, Х – количество удобрений. С одинаковых по площади участков земли при равном количестве внесенных удобрений снимают различный урожай, т.е. между Y и Х не существует функциональной зависимости. Это объясняется тем, что на урожай, кроме количества удобрений, влияют другие (случайные) факторы, такие, как осадки, температура воздуха, расположение участка и др. Вместе с тем, как показывает опыт, средний урожай является функцией количества удобрений, т.е. Y связана с Х корреляционной зависимостью.
Известно, что в экономике многие явления происходят в обстановке воздействия многочисленных факторов, влияние каждого из факторов незначительно, но число этих факторов бывает велико, так что учесть влияние всех их практически невозможно. Поэтому возникает задача изучения корреляционной зависимости, для характеристики которой может служить коэффициент корреляции rxy (см. [7]).
В корреляционном анализе ставятся две задачи:
1. Определение существования линейной зависимости между двумя переменными.
2. Оценка по выборке тесноты линейной зависимости между двумя переменными с учетом влияния других переменных (парная корреляция), без учета влияния других переменных (частная корреляция) и между одной (результирующей) переменной и несколькими (более двух) другими переменными (множественная корреляция).
Корреляция может быть обусловлена:
а) непосредственной причинно-следственной зависимостью между переменными, например, между себестоимостью продукции и затратами на ее производство (наши идеи о причине должны приходить извне статистики, в конечном счете из некоторой другой теории);
б) общей зависимостью от других факторов (см. частная корреляция);
в) неоднородностью статистических данных, которая проявляется, если изобразить статистические данные в виде диаграммы рассеяния (рис. 4.1) несколькими отдельными сгущениями («облачками»).
Если не обращать внимание на неоднородность, т.е. на два или более отдельных «облачков», то можем получить коэффициент корреляции по всем данным, значительно отклоняющимся от нуля, в то время как коэффициент корреляции по отдельным «облачкам» мал. Например [2], пусть Х – содержание гемоглобина в крови, Y – размеры кровяных шариков. Вычислив коэффициент корреляции отдельно для мужчин (М), детей (Д) и женщин (Ж), получим: . Если статистические данные объединить, то .
Примеры статистической зависимости в экономике: зависимость объемов производства от размера основных фондов, их возраста, числа производственного персонала; зависимость спроса от уровня дохода, цен на товары; зависимость себестоимости продукции от зарплаты, производительности труда и т.д.
Опознание причинной корреляции осуществляется путем исключения других возможностей. На практике можно воспользоваться следующей схемой:
§ 4.2. вычисление коэффициента корреляции по выборке
Начнем с визуального определения корреляционной зависимости. Для этого строят диаграмму рассеяния на координатной плоскости ХОY (рис.4.2), путем нанесения на координатную сетку
(X; Y) множества точек , возможных значений случайных величин Х, Y.
а) r = 0 б) r = 0 в) r > 0
г) r < 0 д) r = 1 е) r = –1.
Рис. 4.2. Визуальное определение корреляционной зависимости