Ковариация и коэффициент корреляции двух случайных величин.

Для двумерной случайной величины Ковариация и коэффициент корреляции двух случайных величин. - student2.ru характеристики ее составляющих Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , Ковариация и коэффициент корреляции двух случайных величин. - student2.ru никак не отражают зависимости между Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru или ее отсутствия. Поэтому вводится еще одна числовая характеристика − корреляционный момент или ковариация.

Определение. Ковариацией или корреляционным моментом Ковариация и коэффициент корреляции двух случайных величин. - student2.ru случайных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru называется математическое ожидание произведения отклонений этих величин от их математических ожиданий:

. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

Используя формулы для математических ожиданий, получаем

для дискретных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru ,

для непрерывных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Ковариация характеризует зависимость величин.

Свойства корреляционного момента

1. Для независимых случайных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

2. Если Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , то случайные величины Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru зависимы.

3. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru . (Для доказательства достаточно раскрыть скобки под знаком математического ожидания в определении.) В частности

для дискретных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru ,

для непрерывных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

4. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru . (Свойство сразу вытекает из 3.)

5. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru . (Выразите дисперсию через математические ожидания.)

6. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

7. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru . (Доказательство этого свойства можно найти в [1, гл.14, § 17].)

Ковариация имеет размерность произведения размерностей случайных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и зависит от того, в каких единицах измерялись величины. Для получения безразмерной характеристики вводится понятие коэффициента корреляции.

Определение. Коэффициентом корреляции Ковариация и коэффициент корреляции двух случайных величин. - student2.ru случайных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru называется отношение корреляционного момента к произведению средних квадратических отклонений этих случайных величин:

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Свойства коэффициента корреляции

1. Для независимых случайных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

2. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru . Коэффициент корреляции по абсолютной величине не превосходит единицы.

3. Если Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , то случайные величины Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru связаны линейной зависимостью, т.е. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Определение. Случайные величины Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru называются некоррелированными, если Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , и коррелированными, если Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Следует помнить, что понятия некоррелированности и независимости не совпадают, несмотря на внешнее сходство. Независимые величины − некоррелированные, но обратное неверно. Коррелированные величины − зависимые, но обратное неверно. Любые коррелированные величины всегда зависимые, любые независимые величины всегда некоррелированные.

Пример.У случайных величин Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , Ковариация и коэффициент корреляции двух случайных величин. - student2.ru . Найдите Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Решение. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Ответ. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

19. Генеральная и выборочные совокупности. Понятие выборки и её свойства.

Генеральная совокупность – это множество всех подлежащих обследованию по некоторому признаку (признакам) объектов.

Выборочная совокупность (выборка) - это специальным образом отобранная часть генеральной совокупности, отражающая ее основные свойства, и предназначенная для формирования содержательных суждений о всей генеральной совокупности, оценки ее параметров.

Количество единиц статистической совокупности (генеральной, выборочной) называется ее объемом.

Если при формировании выборки отобранный объект перед отбором следующего возвращается в генеральную совокупность и вновь может участвовать в отборе, то выборку называют повторной, в противном случае - бесповторной. На практике обычно используют бесповторные выборки.

Выборка должна правильно представлять пропорции генеральной совокупности, то есть быть репрезентативной (представительной). А для этого она должна быть соответствующим образом сформирована. В практике наибольшее распространение получили следующие способы отбора:

1. Собственно-случайная или простая выборка представляет собой жеребьевку или лото, с помощью которых единицы из генеральной совокупности отбираются в выборочную в случайном порядке.

2. Механическая выборка – применяется в тех случаях, когда генеральная совокупность каким-либо образом упорядочена (ранжирована, пронумерована и т.д.). Для проведения механической выборки устанавливается пропорция отбора, которая определяется соотнесением объемов выборочной и генеральной совокупностей. Отбор единиц осуществляется в соответствии с установленной пропорцией через равные интервалы.

3. Типический отбор применяется, если генеральную совокупность можно разбить на несколько типических групп, при этом отбор из каждой группы происходит случайным или механическим способом.

4. Серийная выборка – особый способ отбора из генеральной совокупности, когда случайно или механически выбирают не отдельные единицы, а целые их серии, внутри которых ведется сплошное наблюдение.

Каждый способ отбора предполагает использование особого метода формирования выборочной совокупности.

Но выборочная совокупность как часть генеральной совокупности не может быть во всех отношениях ей адекватной. Поэтому всегда могут иметь место некоторые отклонения ее параметров от соответствующих параметров генеральной совокупности – ошибки наблюдения: разность между соответствующими характеристиками генеральной и выборочной совокупностей.

Ошибки наблюдения складываются из ошибок репрезентативности и регистрации. Ошибками репрезентативности –это ошибки представительности – порождены тем, что выборка является лишь частью генеральной совокупности. Они бывают:систематические – из-за нарушений правил отбора; случайные – из-за обследования только части совокупности. Ошибки регистрации –следствиенедостаточной квалификации,неточностей, погрешностей, искажений (присущи и сплошному наблюдению).

Основная задача выборочного метода заключается в том, чтобы на основе изучения выборочной совокупности получить такие выборочные характеристики, которые как можно более точно отражали бы соответствующие характеристики генеральной совокупности. А достичь этого можно только в том случае, когда разность между выборочными и генеральными характеристиками будет достаточно мала. С этой точки зрения основная задача выборочного метода сводится к минимизации ошибок репрезентативности.

Теоретической основой выборочного метода является закон больших чисел. Так, неравенство Чебышева применительно к выборке может быть записана в следующем виде:

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

где: Ковариация и коэффициент корреляции двух случайных величин. - student2.ru - выборочная средняя арифметическая,

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru - генеральная средняя арифметическая,

s - среднее квадратное отклонение в генеральной совокупности,

n – объем выборки,

ε > 0 – любое число.

Теорема Чебышева в этом случае формулируется так: с вероятностью, сколько угодно близкой к единице (достоверности), можно утверждать, что при достаточно большом объеме выборки n и ограниченной дисперсии генеральной совокупности s2 разность выборочной Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и генеральной Ковариация и коэффициент корреляции двух случайных величин. - student2.ru средних будет сколько угодно малa.

В математической статистике очень большое внимание уделяется вопросам определения величины допущенной ошибки выборочного исследования и возможных ее пределов.

Одним из важнейших условий минимизации ошибок репрезентативности является требование, чтобы используемые выборочные оценки параметров генеральной совокупности были «хорошими», то есть обладали определенными свойствами (несмещенность, состоятельность, эффективность, достаточность).

20. Эмпирическая функция распределения – определение и свойства.

Эмпирической функцией распределения (функцией распределения выборки) называют функцию Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , определяющую для каждого значения x относительную частоту события X<x. Таким образом, по определению Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , где Ковариация и коэффициент корреляции двух случайных величин. - student2.ru – число вариант, меньших x, n – объем выборки.

В отличие от эмпирической функции распределения выборки, функцию распределения Ковариация и коэффициент корреляции двух случайных величин. - student2.ru генеральной совокупности называют теоретической функцией распределения.Различие между этими функциями состоит в том, что теоретическая функция
Ковариация и коэффициент корреляции двух случайных величин. - student2.ru определяет вероятностьсобытия X<x, тогда как эмпирическая – относительную частотуэтого же события.

При росте n относительная частота события X<x, т.е. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru стремится по вероятности к вероятности Ковариация и коэффициент корреляции двух случайных величин. - student2.ru этого события. Иными словами:

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Свойства эмпирической функции распределения

Значения эмпирической функции принадлежат отрезку [0,1].

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru – неубывающая функция.

Если Ковариация и коэффициент корреляции двух случайных величин. - student2.ru – наименьшая варианта, то Ковариация и коэффициент корреляции двух случайных величин. - student2.ru =0 при Ковариация и коэффициент корреляции двух случайных величин. - student2.ru ,

если Ковариация и коэффициент корреляции двух случайных величин. - student2.ru – наибольшая варианта, то Ковариация и коэффициент корреляции двух случайных величин. - student2.ru =1 при Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.

Пример. Построим эмпирическую функцию по распределению выборки:

Варианты Ковариация и коэффициент корреляции двух случайных величин. - student2.ru
Частоты Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

Найдем объем выборки: 12+18+30=60. Наименьшая варианта равна 2, поэтому Ковариация и коэффициент корреляции двух случайных величин. - student2.ru =0 при x£2. Значение x£6, т.е. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , наблюдалось 12 раз, следовательно, Ковариация и коэффициент корреляции двух случайных величин. - student2.ru =12/60=0,2 при 2<x£6. Аналогично, значения X£10, т.е. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru наблюдались 12+18=30 раз, поэтому Ковариация и коэффициент корреляции двух случайных величин. - student2.ru =30/60 =0,5 при 6<x£10. Так как
x=10 – наибольшая варианта, то Ковариация и коэффициент корреляции двух случайных величин. - student2.ru =1 при x>10. таким образом, искомая эмпирическая функция имеет вид:

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

21. Характеристики выборки: выборочное среднее и выборочная дисперсия, начальные и центральные выборочные моменты.

Пусть выборка задана вариационным рядом

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru Ковариация и коэффициент корреляции двух случайных величин. - student2.ru Ковариация и коэффициент корреляции двух случайных величин. - student2.ru . . . Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , где Ковариация и коэффициент корреляции двух случайных величин. - student2.ru
Ковариация и коэффициент корреляции двух случайных величин. - student2.ru Ковариация и коэффициент корреляции двух случайных величин. - student2.ru Ковариация и коэффициент корреляции двух случайных величин. - student2.ru . . . Ковариация и коэффициент корреляции двух случайных величин. - student2.ru  

Выборочным средним называется величина Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

Выборочная дисперсия Ковариация и коэффициент корреляции двух случайных величин. - student2.ru а корень квадратный из выборочной дисперсии называется выборочным средним квадратическим отклонением

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

Выборочные начальные и центральные моменты порядка Ковариация и коэффициент корреляции двух случайных величин. - student2.ru определяются соответственно формулами:

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

Модой Ковариация и коэффициент корреляции двух случайных величин. - student2.ru называется вариант, наиболее часто встречающийся в данном вариационном ряду.

Медианой Ковариация и коэффициент корреляции двух случайных величин. - student2.ru называется вариант Ковариация и коэффициент корреляции двух случайных величин. - student2.ru такой, что Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru Медиана обладает тем свойством, что сумма абсолютных величин отклонений вариантов от медианы меньше, чем от любой другой величины (в том числе и от выборочной средней).

Важность эмпирических характеристик заключается в том, что они близки (при достаточно большом Ковариация и коэффициент корреляции двух случайных величин. - student2.ru ) к соответствующим теоретическим значениям. Поскольку выборочные характеристики являются случайными величинами, а теоретические - числа, то близость понимается в смысле сходимости по вероятностям.

Пример 161.Известно распределение золотых медалистов, окончивших в 2001 году школы Ярославской области, по районам:

Кол-во золотых медалистов
Кол-во районов

Дайте характеристику распределения признака (число золотых медалистов по районам), вычислив для этого:

а) выборочную среднюю, б) моду и медиану, в) показатели вариации (дисперсию, среднее квадратическое отклонение, размах варьирования).

Решение. а) Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

б) Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , т.к. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru .

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru , т.к. Ковариация и коэффициент корреляции двух случайных величин. - student2.ru и Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

в) Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

Ковариация и коэффициент корреляции двух случайных величин. - student2.ru

22. Свойства точечных оценок параметров неизвестного распределения – состоятельность, несмещенность, эффективность.

Числовая характеристика случайной величины, определенная при ограниченном объеме информации, называется оценкой. "Точечная" означает, что оценка представляет собой число или точку на числовой оси.

Обозначим через θ некоторую оцениваемую характеристику (ею может быть математическое ожидание, дисперсия и любая другая числовая характеристика случайной величины Х). Ее числовое значение неизвестно, однако предложен некоторый алгоритм или формула вычисления точечной оценки θn* этой характеристики по результатам x1, x2, ..., xn наблюдений величины Х. Обозначим буквой f этот алгоритм:

θn*=f(x1,x2,…,xn).

Подставив в формулу конкретные результаты наблюдений, получим число, которое и принимают за приближенное значение неизвестной характеристики θ. Найти погрешность этого приближения нельзя, поскольку истинное числовое значение характеристики неизвестно. Чтобы ответить на вопрос: хорошо или нет найденное приближение – рассмотрим оценку θn* и ее свойства.

Так как результаты наблюдений x1,x2,…,xn – случайные величины, то и оценка θn* также величина случайная. Следовательно, можно говорить о ее математическом ожидании M(θn*), дисперсии D(θn*) и законе распределения. Интерпретация оценки θn* как случайной величины позволяет сформулировать свва, которыми должна обладать оценка, чтобы ее можно было считать хорошим приближением к неизвестной оценке θ. Это свойства состоятельности, несмещенности и эффективности.

Состоятельность. Оценка θn* характеристики θ называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру: limn→∞Pθn*θ<ε=1 или θn*→ θ при n→∞. Если говорить коротко то, чем больше объем исходной информации, тем ближе оценка к оцениваемому параметру. Если это так, то θn* состоятельная оценка.

Если оценка несостоятельная, то она не имеет практического смысла: увеличение объема исходной информации не будет приближать нас к истине. Поэтому свойство состоятельности следует проверять в первую очередь.

Несмещенность. Оценка θn* характеристики θ называется несмещенной, если ее математическое ожидание равно оцениваемому параметру:

M(θn*) =θ.

В противном случае оценка называется смещенной. Если это равенство не выполняется, то оценка θn*, полученная по разным выборкам, будет либо завышать θ, если M(θn*) > θ, либо занижать θ, если M(θn*) < θ. Таким образом, требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.

Эффективность. Несмещенная оценка θn* характеристики θ называется эффективной,

Наши рекомендации