Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам.

Для построения доверительных интервалов для параметров генеральных совокупностей могут быть реализованы два подхода, основанных на знании точного (при данном объеме выборки п) или асимптотического (при п->оо) распределения выборочных характеристик (или некоторых функций от них). Первый подход реализован далее при построении интервальных оценок параметров для малых выборок. В данном параграфе рассматривается второй подход, применимый для больших выборок (порядка сотен наблюдений).

Теорема. Вероятность того, что отклонение выборочной средней (или доли) от генеральной средней (или доли) не превзойдет число Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (по абсолютной величине), равна:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , где Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (23)

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , где Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (24)

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru - функция (интеграл вероятности) Лапласса

Выше (§ 9.4) показано, что выборочная средняя Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и выборочная доля Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru повторной выборки представляют сумму n независимых случайных величин Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , где Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

имеет один и тот же закон распределения — соответственно (13) и (10) с конечными математическим ожиданием и дисперсией. Следовательно, на основании теоремы Ляпунова при Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru распределения Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru неограниченно приближаются к нормальным (практически при Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru распределения Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru можно считать приближенно нормальными).

Для бесповторной выборки Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru представляют сумму зависимых случайных величин. Однако Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru можно показать, что и в этом случае при Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru закон распределения Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru как угодно близко приближается к нормальному.

Формулы (23)и (24)следуют непосредственно из свойства 2 нормального закона формулы.

Формулы (23)и (24)получили название формул доверительной вероятности для средней и доли.

Определение.Среднее квадратическое отклонение выборочной средней Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и выборочной доли Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru собственно-случайной выборки называется средней квадратической (стандартной) ошибкой выборки.(Для бесповторной выборки обозначаем соответствено Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru ).

Из рассмотренной теоремы вытекают следующие следствия.

Следствие 1.При заданной доверительной вероятности Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru предельная ошибка выборки равна (-кратной величине средней квадра-тической ошибки, где Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , т.е.

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

(25)

(26)

Следствие 2.Интервальные оценки {доверительные интервалы) для генеральной средней и генеральной доли могут быть найдены по формулам:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (28), (27)

Формулы средних квадратических ошибок выборки Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru могут быть легко получены из формул (16), (17), (11), (12) соответствующих дисперсий Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru . Поместим их в таблицу:

Таблица 2

Оцениваемый параметр Формулы средних квадратических ошибок выборки  
повторная выборка   бесповторная выборка
Средняя Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru
Доля Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Так как генеральные доля ри дисперсия Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru неизвестны, то в формулах табл. 2 заменяем их состоятельными оценками по выборке — соответственно Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , ибо при достаточно большом объеме выборки ппрактически достоверно, что Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru .

При определении средней квадратической ошибки выборки для доли, если даже Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru неизвестна, в качестве Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru можно взять его максимально возможное значение Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , (так как Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru то рqмаксимально при р= 0,5).

Объем выборки.Для проведения выборочного наблюдения весьма важно правильно установить объем выборки п, который в значительной степени определяет необходимые при этом временные, трудовые и стоимостные затраты. Для определения п необходимо задать надежность (доверительную вероятность) оценки Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и точность (предельную ошибку выборки) Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Объем выборки находится из формулы, выражающей предельную ошибку выборки через дисперсию признака. Например, для повторной выборки при оценке генеральной средней с надежностью Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru с учетом (25)и (29)эта формула имеет вид:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru откуда Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , где Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru . Аналогично могут быть получены и другие формулы объема выборки, которые сведем в таблицу:

Оцениваемый параметр Повторная выборка Бесповторная выборка
Генеральная средняя Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru   Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru
Генеральная доля Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru  

Если найден объем повторной выборки п, то объем соответствующей бесповторной выборки п' можно определить по формуле:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , (37)

Так как Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , то при одних и тех же точности и надежности оценок объем бесповторной выборки n всегда меньше объема повторной выборки Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru . Этим и объясняется тот факт, что на практике в основном используется бесповторная выборка.

Как видно из формул (33)—(36), для определения объема выборки необходимо знать характеристики генеральной совокупности Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru или р, которые неизвестны и для определения которых предполагается провести выборочное наблюдение. В качестве этих характеристик обычно используют выборочные данные Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru или Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru предшествующего исследования в аналогичных условиях, т.е. полагают Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (или) Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru или Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru .

Если никаких сведений о значениях Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru или рнет, то организуют специальную пробную выборку небольшого объема, находят оценку Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (более точную, чем Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru для малой выборки) или Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и, полагая Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru или Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , находят объем «основной» выборки.

При оценке генеральной доли (если о ней ничего неизвестно) вместо проведения пробной выборки можно в формулах (35), (36)в качестве рq = р(1 - р)взять его максимально возможное значение, равное 0,25, но при этом надо учитывать, что найденное значение объема выборки будет больше (иногда существенно больше) минимально необходимого для заданных точности и надежности оценок.

Объем бесповторной выборки п'мог быть вычислен и по (37), так как уже известен объем повторной выборки п, т.е.

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Как видим, при одной и той же точности Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru и надежности Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru = 0,9973 оценки объем бесповторной выборки существенно меньше, чем повторной.

Замечание. Если генеральная совокупность бесконечна Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , либо объем бесповторной выборки значительно меньше объема генеральной совокупности Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , расчеты средних квадратических ошибок (для средней и доли) и необходимого объема бесповторной выборки следует проводить по соответствующим формулам для повторной выборки.

Построение доверительного интервала для генеральной доли по умеренно большим выборкам.Объем выборки может быть не настолько велик (например, десятки наблюдений), чтобы использовать приближенную формулу (31) Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru Вместо точной Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

В то же время распределение выборочной доли Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru можно по-прежнему считать приближенно нормальным. В этом случае, учитывая (24), (26), доверительный интервал для генеральной доли рследует искать из условия

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru . (38)

Возводя обе части неравенства (9.38) в квадрат, преобразуем его к равносильному:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , (39)

Областью решения неравенства (39) является внутренняя часть эллипса, проходящего через точки (0;0) и (1;1) и имеющего в этих точках касательные, параллельные оси абсцисс.

Так как величина Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru заключена между 0 и 1, то область Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru нужно еще ограничить слева и справа прямыми Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (наличие «лишних» областей, выходящих за полосу Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , объясняется тем, что при значениях р, близких к 0 или 1. допущение о нормальном законе распределения Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru становится неправомерным).

По найденному по выборке значению Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru границы доверительного интервала Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru для ропределяются как точки пересечения соответствующей вертикальной прямой с эллипсом (рис. 2). Чем больше объем выборки п, тем «доверительный эллипс» более вытянут, тем уже доверительный интервал.

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Рис. 2

Границы р1и р2доверительного интервала для рмогут быть найдены из соотношения (39) по формуле:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , (40)

В случае больших выборок, при Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , величинами Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (по сравнению с 1), Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (по сравнению с Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru ), Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (по сравнению с Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru можно пренебречь, и получим:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

т.е. доказанные ранее формулы (28)и (26).

Корреляция и регрессия. Функциональная, статистическая и корреляционная зависимость между переменными. Линейная парная корреляционная связь. Коэффициент корреляции, его вычисления и сво-ва. Линейная парная регрессия. Метод наименьших квадратов для оценки параметров регрессии. Прогноз неизвестных экономических показателей по известным значениям других.

КОРРЕЛЯЦИЯ — (лат. correlatio — взаимосвязь) — в статистике: понятие, отражающее наличие связи между явлениями, процессами и характеризующими их величинами.

РЕГРЕССИЯ-зависимость между зависимой переменной Y и одной или несколькими независимыми переменными

Диалектический подход к изучению природы и общества требует рассмотрения явлений в их взаимосвязи и непрестанном изменении.

Понятия корреляции и регрессии появились в середине XIX в. благодаря работам английских статистиков Ф. Гальтона и К. Пирсона. Первый термин произошел от латинского «correlatio» — соотношение, взаимосвязь. Второй термин (от лат. «regressio» — движение назад) введен Ф. Гальтоном, который, изучая зависимость между ростом родителей и их детей, обнаружил явление «регрессии к среднему» — у детей, родившихся у очень высоких родителей, рост имел тенденцию быть ближе к средней величине.

В естественных науках часто речь идет о функциональной зависимости (связи), когда каждому значению одной переменной соответствует вполне определенное значение другой (например, скорость свободного падения тела в вакууме в зависимости от времени и т.п.).

В экономике в большинстве случаев между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. Иначе говоря, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такая зависимость получила название статистической (или стохастической, вероятностной).

Возникновение понятия статистической связи обусловливается тем, что зависимая переменная подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками. Примером статистической связи является зависимость урожайности от количества внесенных удобрений, производительности труда на предприятии от его энерговооруженности и т.п.

В силу неоднозначности статистической зависимости между Y и X для исследователя, в частности, представляет интерес усредненная по x схема зависимости, т.е. закономерность в изменении условного математического ожидания МХ(Y) (математического ожидания случайной переменной Y, вычисленного в предположении, что переменная X приняла значение х в зависимости от х.

Определение. Корреляционной зависимостьюмежду двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.

Корреляционная зависимость может быть представлена в виде:

Мх(Y)=φ(x) (1) или МY(X)=φ(y) (2)

Уравнения (1) и (2) называются модельными уравнениями регрессии (или просто уравнениями регрессии) соответственно Y по X и X по Y, функции φ(х) и ψ(у) - модельными функциями регрессии (или функциями регрессии), а их графики — модельными линиями регрессии (или линиями регрессии).

Для отыскания модельных уравнений регрессии, вообще говоря, необходимо знать закон распределения двумерной случайной величины (Х,Y). На практике исследователь, как правило, располагает лишь выборкой пар значений (хi, уi) ограниченного объема. В этом случае речь может идти об оценке (приближенном выражении) по выборке функции регрессии. Такой наилучшей (в смысле метода наименьших квадратов) оценкой является выборочная линия (кривая) регрессии Y по X:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (3)

где yх — условная (групповая) средняя переменной Y при фиксированном значении переменной Х= х; b0,b1…bp — параметры кривой.

Аналогично определяется выборочная линия (кривая) регрессии Х по Y:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (4)

где ху — условная (групповая) средняя переменной X при фиксированном значении переменной Y = у; c0,c1,...,cp — параметры кривой.

Уравнения (3), (4) называют также выборочными уравнениями регрессии соответственно Y по X и X по Y.

Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа.

Основной задачей регрессионного анализа является установление формы и изучение зависимости между переменными. Основной задачей корреляционного анализа — выявление связи между случайными переменными и оценка ее тесноты.

Линейная парная регрессия

Данные о статистической зависимости удобно задавать в виде корреляционной таблицы.

Рассмотрим в качестве примера зависимость между суточной выработкой продукции Y (т) и величиной основных производственных фондов X (млн руб.) для совокупности 50 однотипных предприятий (табл. 1).

В дальнейшем для краткости там, где это очевидно по смыслу, мы часто и выборочные уравнения (линии) регрессии будем называть просто уравнениями (линиями) регрессии.

(В таблице через хi и уj обозначены середины соответствующих интервалов, а ni и nj — соответственно их частоты).

Изобразим полученную зависимость графически точками координатной плоскости (рис. 1). Такое изображение статистической зависимости называется полем корреляции.

Для каждого значения хi (i = 1,2,...,l), т.е. для каждой строки корреляционной таблицы вычислим групповые средние

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (5)

где nij — частоты пар (хi, уj ) и Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , m — число интервалов по переменной Y.

Таблица 1

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Рис. 1

Вычисленные групповые средние Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru поместим в последнем столбце корреляционной таблицы и изобразим графически в виде ломаной, называемой эмпирической линией регрессии Y по X (рис. 1).

Аналогично для каждого значения yj (j = 1,2,...,m) по формуле

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (6)

вычислим групповые средние х, (см. нижнюю строку корреляционной таблицы), где Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , l - число интервалов по переменной X.

По виду ломаной можно предположить наличие линейной корреляционной зависимости Y по X между двумя рассматриваемыми переменными, которая графически выражается тем точнее, чем больше объем выборки (число рассматриваемых предприятий) п:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (7)

Поэтому уравнение регрессии (3) будем искать в виде:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (8)

Найдем формулы расчета неизвестных параметров уравнения линейной регрессии. С этой целью применим метод наименьших квадратов, согласно которому неизвестные параметры Ь0 и Ь1 выбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru вычисленных по формуле (5), от значений Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , найденных по уравнению регрессии (8), была минимальной:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (9)

На основании необходимого условия экстремума функции двух переменных S = S(Ь0, b1,) приравниваем нулю ее частные производные, т.е.

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

откуда после преобразований получим систему нормальных уравнений для определения параметров линейной регрессии:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (10)

Учитывая (5), преобразуем выражения:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Теперь с учетом (7), разделив обе части уравнений (10) на п, получим систему нормальных уравнений в виде:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (11

где соответствующие средние определяются по формулам:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Подставляя значение Ь0 = Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru - Ьx из первого уравнения системы (11) в уравнение регрессии (8), получим Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Коэффициент Ь1 в уравнении регрессии, называемый выборочным коэффициентом регрессии (или просто коэффициентом регрессии) У по X, будем обозначать символом Ьух. Теперь уравнение регрессии Y по X запишется так:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Коэффициент регрессии У по X показывает, на сколько единиц в среднем изменяется переменная Y при увеличении переменной X на одну единицу.

Решая систему (12.11), найдем

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

где Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru — выборочная дисперсия переменной X:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

μ — выборочный корреляционный момент или выборочная ковариация:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Рассуждая аналогично и полагая уравнение регрессии (4) линейным, можно привести его к виду:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

— выборочный коэффициент регрессии (или просто коэффициент регрессии) X по Y, показывающий, на сколько единиц в среднем изменяется переменная X при увеличении переменной У на одну единицу,

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

—выборочная дисперсия переменной Y.

Так как числители в формулах (17) и (21) для Ьyx и Ьxy совпадают, а знаменатели — положительные величины, то коэффициенты регрессии Ьyx и Ьxy , имеют одинаковые знаки, определяемые знаком μ. Из уравнений регрессии (16) и (20) следует, что коэффициенты Ьyx и 1/Ьxy определяют угловые коэффициенты (тангенсы углов наклона) к оси oх соответствующих линий регрессии, пересекающихся в точке ( Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru , Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru ) (см. рис. 3).

Коэффициент корреляции

Перейдем к оценке тесноты корреляционной зависимости. Рассмотрим наиболее важный для практики и теории случай линейной зависимости вида (16).

На первый взгляд подходящим измерителем тесноты связи Y от X является коэффициент регрессии Ьуx ибо, как уже отмечено, он показывает, на сколько единиц в среднем изменяется Y, когда X увеличивается на одну единицу. Однако Ьуx зависит от единиц измерения переменных. Например, в полученной ранее зависимости он увеличится в 1000 раз, если величину основных производственных фондов X выразить не в млн руб., а в тыс. руб. Очевидно, что для «исправления» Ьуx как показателя тесноты связи нужна такая стандартная система единиц измерения, в которой данные по различным характеристикам оказались бы сравнимы между собой. Статистика знает такую систему единиц. Эта система использует в качестве единицы измерения переменной ее среднее квадратическое отклонение S.

Представим уравнение (16) в эквивалентном виде:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (28)

В этой системе величина

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru (29)

показывает, на сколько величин Sy изменится в среднем Y, когда Xувеличится на одно Sx Величина r является показателем тесноты связи и называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции).

На рис. 2 приведены две корреляционные зависимости переменной Y по X. Очевидно, что в случае а) зависимость между переменными менее тесная и коэффициент корреляции должен быть меньше, чем в случае б), так как точки корреляционного поля а) дальше отстоят от линии регрессии, чем точки поля б). Нетрудно видеть, что r совпадает по знаку с Ьуx (а значит, и с Ьху).

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Рис. 2

Если r> 0 (Ьух>0, Ьху>0), то корреляционная связь между переменными называется прямой, если r< О (Ьуx<0, Ьху<0) — обратной. При прямой (обратной) связи увеличение одной из переменных ведет к увеличению (уменьшению) условной (групповой) средней другой.

Учитывая (17), формулу для r представим в виде:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Отсюда видно, что формула для rсимметрична относительно двух переменных, т.е. переменные Х и Y можно менять местами. Тогда аналогично (24) можно записать:

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

Найдя произведение обеих частей равенств (29) и (31), получим

Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. - student2.ru

т.е. коэффициент корреляции r переменных X и Y есть средняя геометрическая коэффициентов регрессии, имеющая их знак.

Наши рекомендации