Коррелированность и зависимость составляющих X,Y двумерной СВ X,Y
Две СВ X,Y наз-т коррелированными,если их корреляционный момент (или,что то же ,коэффициент корреляции) отличен от нуля,X,Y наз-т некоррелированными величинами,если их корреляционный момент равен нулю
Две коррелированные величины также и зависимы.Действительно,допустим противное,мы должны заключит,что µxy = 0, а это противоречит условию,так как для коррелированных величин µxy не равно 0.Обратное прелположение не всегда имеет место,т.е. если две величины зависимы,то они могут быть как коррелированными,так и некоррелированными. Другими словами ,коррелированный момент двух зависимых величин может быть не равен нулю,но может и равняться нулю.
2.29. Лин.регресссияПрямые среднеквадорат. Регрессии.Коэффиц. регрессии.Остаточная регрессия.Центр совместного распределения.
Рассмотрим двумерную величину СВ (Х,У),где Х и У-зависимые СВ будем полагать 1 из них как ф-ю другой.Уz g(x)=kX+b, где к и b-подлежащие определению коэф-ты.Для их определ. Применяют метод наименьших квадратов,закл. В том, что мат. Ожидание М(У-g(х))2 приняло как можно меньше знач.мод наз. Среднеквадр. Регрессией величины У относит. Х.Исследовав ф-ю М((У-g(х))2)=М((У-кХ-b2))получим, что наимен. Ее знач. =σх2(1-τху2) если k= τху и b=М(У)- τху М(Х). Величина σу2(1-τ2ху)наз. Остаточной дисперсией У относит. Х,она характеризует ошибку,кот. Достигается при замене У на g(х).Если τху = 1,то остаточная дисперсия =0. K - коэф-т регрессииУ относит. Х, а прямую заданную уравнением у= τху (x-mх)+mуназ. Прямой среднеквадрат. Регрессии У относит.Х. Аналогично можно получить прямую среднеквадрат. Регрессии Х относит. У: Х= τху (у-mу)+mx. Коэф-т регрессии Х относит. У - τху . Остаточная дисперсия Х относит. У. σ2х(1- τху2). Если τху= 1, то обе прямые регрессии совпадают. В любом случае прямые проходят через точку с координатами (mx,my),кот. Наз. Центром совместного распределения Х и У).
2.30. Лин. Корреляц. Распредел. Двумерной случ. Величины.
Если обе ф-ии М(У/Х=х) и М(Х/У-у) линейны, кот. Говорят, что СВ Х и У связаны лин. Коррел. Зависимостью.Графики лин. Ф-й регрессии – прямые линии,совпадающие с прямыми среднеквадрат. Регрессии. ТЕОРЕМА. Если(Х,У)- двумерная СВ,распредел. По норм. Закону, тоХ и У связаны лин. Корреляц. Зависимостью. Док-во. F(х,у)- плотность распредел. Двумерной СВ (Х,У), f1(х) – плотность вероятности .ψ (у/х)= = . Как видно,это норм. Распредел. Мат. Ожидание равно: М(У/Х=х)=а2+ τху (х-а1). D(У/Х=х)=/у2(1-r2ху).
3.1 Задачи мат. статистики: - указать способы сбора и группировки статистических сведений. – разработать методы анализа статистических данных, в зависимости от целей исследования.
Выборочный метод - статистический метод исследования общих свойств совокупности каких-либо объектов на основе изучения свойств лишь части этих объектов, взятых на выборку.
Генеральная совокупность – совокупность объектов, из которых производится выборка.
Выборочная совокупность – совокупность случайно отобранных объектов.
Повторной называют выборку, при которой отобранный объект возвращается в генеральную совокупность.
Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот (числа наблюдений называют частотами, а их отношение к объему выборки ni/n=wi – относительными частотами).
Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(x), определяющая для каждого значения х относительную частоту события Х<x. F*(x)=nx/n, где nx - число вариант, меньших х, n – объем выборки, Х – статистическое распределение частот количественного признака.
Полигоном частот называют ломанную, отрезки которой соединяют точки (х1, n1), (х2, n2),…, (хk, nk). Для построения полигона частот на оси абсцисс откладывают варианты хi, а на оси ординат – соответствующие им частоты ni. Точки (хi, ni) соединяют отрезками прямых и получают полигон частот.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты). Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni/h.
3.2 Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.
Несмещенной называют статистическую ошибку Q*, математическое ожидание которой равно оцениваемому параметру Q при любом объеме выборки, т.е. М (Q*)=Q. Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема (n велико!) к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при n → ∞ стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n → ∞ стремится к нулю, то такая оценка оказывается и состоятельной.
3.3 Генеральной средней ¯Хг называют среднее арифметическое значении признака генер. совокупности. Если все значения Х1, Х2,…, Хn признака генер. совокупности объема N различны, то ¯Хг =( Х1+ Х2+,…, Хn)/N. Если значения признака Х1, Х2,…, ХК имеют соответственно частоты N1, N2, ….Nк , причем N1+ N2+, ….Nк= N, то ¯Хг =(x1N1+x2N2+…+xkNk)/N. Выборочной средней ¯Хв называют среднее арифметическое значение признака выборочной совокупности. . Если все значения Х1, Х2,…, Хn признака выборки объема n различны, то ¯Хв =( Х1+ Х2+,…, Хn)/n. Если значения признака Х1, Х2,…, ХК имеют соответственно частоты n1, n2, ….nк , причем n1+ n2+, ….nк= n, то ¯Хв =(x1n1+x2n2+…+xknk)/n. Групповой средней называют среднее арифметическое значений признака, принадлежащее к группе. Общей средней ¯х назыавют среднее арифметическое значений признака, принадлежащих всей совокупности. Модой М0 называют варианту, которая имеет наибольшую частоту. Медианой mе (me= (xk+xk+1)/2) называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. Размахом варьирования R называют разность между наибольшей и наименьшими вариантами (R= xmax-xmin). Средним абсолютным отклонением Ѳ называют среднее арифметическое абсолютных отклонений (Ѳ=(∑ni|xi-¯Хв |)/∑ni). Коэффициентом вариации V называют выражении в процентах отношение выборочного среднего квадратического отклонения к выборочной средней (V=σв/¯Хв *100%).
3.5. Генеральной дисперсией Dг наз. среднее арифметич. квадратов отклонений знач. признака генер. совок-ти от их сред. знач. . Если все значения х1, х2,…,хn признака генер. совок-ти объема N различны, то . Если все значения х1, х2,…,хк имеют соответственно частоты N!, N2,…, NK, причем N1+N2+…+Nk=N, то , т.е. генер. дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответств. частотам. Выборочной дисперсией Dв наз. среднее арифметич. квадратов отклонений наблюдаем. значений признака от их сред. значения . . Если все значения х1, х2,…,хn признака выборки объема n различны, то . Если все значения х1, х2,…,хк имеют соответственно частоты n!, n2,…, nK, причем n1+n2+…+nk=n, то , т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответств. частотам. Групповой средней наз. среднее арифметич. значений признака, принадлежащих группе. Общей средней наз. среднее арифметич. значений признака, принадлежащих всей совокупности. Общая средняя равна средней арифметич. групп. средних, взвешенной по объемам групп. Модой Мо наз. варианту, кот. имеет наиб частоту. Медианой mе наз. варианту, кот. делит вариац. ряд на две части, равные по числу вариант. Размахом варьирования R наз. разность между наибольшей и наименьшей вариантами: . Средним абсолютным отклонением наз. сред. арифметич. абсолютных отклонений: . Коэффициентом вариации V наз. выраженное в процентах отношение выборочного среднего квадрат. откл. к выбороч. средней: *100% .
3.6 Групповой дисперсией наз. дисперсию значений признак, принадлжежащих группе, относительно групповой средней: , где nj-частота значения хi; j – номер группы; -групповая средняя группы j; Nj= -объем группы j. Внутригрупповой дисперсией наз. среднюю арифм. дисперсий, взвешенную по объемам групп: , Nj-объем группы j; -объем всей совокупности. Межгрупповой дисперсией наз. дисперсию групповых средних относительно общей средней: , – групповая средняя группы j; Nj-объем группы j; -общая средняя; -объем всей совокупности. Общей дисперсией наз. дисперсию значений признака всей совок-ти относительно общей средней: . Теорема о сложении дисперсий: если совок-ть состоит из нескольких групп, то общая дисперсия равна сумме внутригру. и межгруп. дисперсий: Dобщ=Dвнгр+Dмежгр.