Классическое и статистическое определение вер
Событие. Виды случайных событий.
Событием называется любой исход опыта.События которые при испытании обязат наступ назыв достоверными. Событ, котор при испытании наступить не может назыв невозможными. Событ котор при испытании может наступить называется случайным. События называется несовместными если появление одного из них исключает появление другого при одном и том же испытании, в противном случае они называются несовместными. Событ назыв единственно возможным если при испытании наступает хотя бы одно из этих событий. Событ назыв равновозможными если при испытании они имеют равные возможности появления.Два единственно возможных события явл противоположными.
Классическое и статистическое определение вер
Вероятностью события А называют отношение числа благоприятствующих этому событию исходов к общему числу всех равновозможных несовместных элементарных исходов, образующих полную группу. Итак, вероятность события А определяется формулой P(A) = m/n, где m-число элементарных исходов, благоприятствующих А; n-число всех возможных элементарных исходов испытания.
. Из определения вероятности вытекает следующие свойства: 1.Вероятность достоверного события равна единице. 2.Вероятность невозможного события равна нулю. 3.Вероятность случайного события есть положительное число, заключенное между нулем и единицей т.е . 0 <= P(A)<= 1.
Статистическое определение вероятности заключается в том, что за вероятность события А принимается постоянная величина, вокруг которой колеблются значения частостей при неограниченном возрастании числа n.
Число появлений А при m испытаний назыв частотой А
Отношение частоты к общему числу произв испытаний назыв относительной частотой w(A)=m/n
4. Теорема сложения вер несовместных событий
Суммой 2-х событий A и B называют событие А+В состоящ в появлен хотя бы одного из этих событий. Если А и В несовм, то вместе они появиться не могут. Суммой двух несовм событ А и В назыв событ сост в появл одного из 2-х событ.
Вер-сть появл-я 1 из двух несовм. событий, безразлично какого, равна сумме вер-стей этих событий: Р(А + В) = Р (А) + Р(В). Следствие 1. В-сть появления 1 из нескольких попарно несовм. событий, безразлично какого, равна сумме в-стей этих событий:Р (A1 + A2 + ... + An) = Р (A1) + Р (A2) + ... + Р (An).
С л е д с т в и е 2: Сумма в-стей противоп. событий равна 1: P(A)+P(A с чертой)=1.
5. Зависимые и независимые события. Условная вер
Событ А и В назыв независ если вер появл одного из них не зависит от того наступило др. событ или нет, в противном случае – зависимые.
Вер-сть события В при усл-и, что А уже произошло, наз. условной в-стью события В. Обозн. РА(В) или Р(В/А). РB(А)= =Р(АВ)/Р(В),Р(В)не равно 0.
6. Теорема умножения вер завис и независ событ
Произведением событий А и В назыв событ АВ сост в совместном появл этих событий. Вероятность совместного появления двух событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную в предположении, что первое событие уже наступило: Р(АВ)=Р(А)*Ра(В). В частности для независимых событий Р(АВ)=Р(А)*Р(В), т.е. вероятность совместного появления двух независимых событий равна произведению вероятностей этих событий.
7. Ф-ла полн вер
Вероятность событ А, котор может наступ лишь при появл одного из несовместных событий В1, В2..Вn образ полную группу, равна сумме произведений вер каждой из гипотез на соответ условн вер события А
Это равенство и назыв ф-лой полной вероятности.
где
8. Ф-ла Байеса
Пусть событие А может наступить лишь при условии появл одного из несовместн событий В1..Вn котор образ полн группу событий. Если событ А уже произошло, то вр гипотез могут быть переоценены по ф-лам Байеса
9. Понят случ вел. Закон распределения случ вел
Случайной называется величина, которая в результате опыта может принимать то или иное значение., причем заранее не известно какое именно. Случайные величины принято обозначать (X,Y,Z), а соответствующие им значения (x,y,z) Дискретными называются случайные величины принимающие отдельные изолированные друг от друга значения, которые можно переоценить. Непрерывными величины возможные значение которых непрерывно заполняют некоторый диапазон. Законом распределения случайной величины называется всякое соотношение устанавливающее связь между возможными значениями случайных величин и соответствующими им вероятности. Ряд и многоугольник распределения. Простейшей формой закона распределения дискретной величины является ряд распределения.
x x1 x2 x3
P P1 P2 P3
Графической интерпретацией ряда распределения является многоугольник распределения.
10. Функция распределения и ее с-ва
Для непрерывных случайных величин применяют такую форму закона распределения, как функция распределения. Функция распределения случайной величины Х, называется функцией аргумента х, что случайная величина Х принимает любое значение меньшее х (Х<х) F(х)=Р(Х<х) F(х)
обладает следующими свойствами:
1)для любого xÎR: 0£ F(x) £ 1.
2) F(-¥) = limx®¥ F(x) = 0 ; F(+¥) = limx®¥ F(x) = 1;
3) F(x)-неубывающая функция, т.е.для любых α,βтаких, что α< β :F(β) - F(α);
4)непрерывна слева
11. Плотность распределения и ее с-ва
Плотн распредел вер непрерывной случ вел назыв первую первообразную от функции распределения
Вер того что непрер случ вел Х примет значен принадл интервалу (a, b) определ равенством
Зная плотн распределения можно найти ф-ю распредел
С-ва:
Плотн распредел неотрицательна
Несобственный интеграл от плотности распредел в пределах от
до равен единице
12. Мат ожидан и дисперсия дискр случ вел.С-ва.(с-ва дописать)
Математическим ожиданием случайной величины х (M[x])называется средне взвешенно значение случайной величины причем в качестве весов выступают вероятности появления тех или иных значений. Для дискретной случайной величины Для непрерывной M(X)=np, n – число независимых испытаний, р – вероятность появл. события.
Дисперсия (D[x]) характеризует рассеивание или разряженность случайной величины около ее математического ожидания.
Для дискретных Для непрерывных
Дисперсия случайной величины всегда величина положительная. Размерность дисперсии равна квадрату разности случайной величины.
По опр.: D(X)=M(X2)-(M(X))2. Дисперсия числа появл. события в n-независимых испытаниях: D(X)=npq.
13. Числов характеристики непрерывных случ вел
Мат. ожиданием непр. случ. величин Х, все возм. значения кот. принадлежат интервалу [a;b], назыв. определённый интеграл.
Если все возм. значения принадлежат всей числ. оси, то
при этом предполог., что несобственный интеграл -¥ до +¥ сходится.
Дисперсией непр. случ. величины Х, все возм. значения кот принадлеж. интервалу [a;b], назыв. мат. ожидание квадрата её отклонения.
На практике исп. др. формулу
Среднеквадратическое (стандартное) отклонение.
14. Формула Бернулли
Если производится n независимых опытов в каждом из которых событие А появляется с одинаковой вероятностью р, причем то тогда вероятность того, что событие А появится ровно m раз определяется по формуле.
формула Бернули применяется в тех случаях, когда число опытов невелико, а вероятности появления достаточно велики.
15. Найвероятнейшая частота
Число наступлений m0 события А называется наивероятнейшим, если оно имеет наибольшую вероятность по сравнению с вероятностями наступления события А любое другое количество раз. Наивероятнейшее число наступлений события А в n испытаниях заключено между числами np-q и np+p : np-q≤m0≤np+p. Если np-q – целое число, то наивероятнейших чисел 2: np-q и np+p.
16. Ф-ла Пуассона
Если число испытаний велико, а вер-сть появл-я события в каждом испытании очень мала, то используют приближенную формулу Пуассона, т.е. n- велико, а р – мало и pn=λ, то приблизительное значение:
,для редких событий
17. Локальная теорема Лапласса
Вероятность того что в n независ испытан, в каждом из котор вер появл событ равна p , событие наступит ровно m раз , безразлично в какой последовательности, приближенно равна
Pn(m)≈ , где х= , а
18. Биноминальный закон распределения
Биномиальным называют законы распределения случайной величины Х числа появления некоторого события в n опытах если вероятность р появления события в каждом опыте постоянна
Сумма вероятностей представляют собой бином Ньютона
Для определения числовых характеристик в биномиальное распределение подставить вероятность которая определяется по формуле Бернули.
19. Закон распределения Пуассона
CВ Х распределена по закону Пуассона, если она принимает целые значения 0,1,2,… с вероятностями
p(k)= Р(Х = k) =
где λ> 0 – параметр распределения. При этом
Мат ожидание идисперсия пуассоновской СВ равны параметру распределения:
MX= λ;DX=λ.
20. Равномерный закон распределения
Непрерывная СВ Х распределена равномерно на отрезке [a;b], если ее плотность вероятности р(х) постоянна на этом отрезке и равна нулю вне его, т.е. Р(х)= {1/ (b-a), при а< =х<=b, О, при х<а, х>b
Ф-ия распределения СВ, распределенной по равномерному закону, имеет вид: f(x)= Мат. ожидание и дисперсия равномерной СВ:
МХ= ; DX=
21. Закон нормального распределения
Непрерывная СВ Х имеет нормальное распределение (закон Гаусса) с параметрами a и (сигма), если ее плотность вероятности имеет вид: p(x)= , где 0. Ф-ия распределения нормальной СВ Х:
MX=a; DX=
Выделяется стандартная нормальная СВ при a=0 и =1. Для стандартного распределения плотность равна
, а ф-ия распределения
22. Функция Лапласса и ее с-ва
Ф-ция Лапласа( знач-я Ф(х) при х>=0 даются в таблицах):
Ф-ей Лапласа назыв ф-я след вида
С-ва: Ф-я монотонно возраст на интерв от –беск до +беск
Ф-я Лапласа нечетная Ф-х=-Фх
lim x стрем к беск Ф(х)=1
При Х Є [0;+∞] Ф(х) монотонно возрастает от 0 до 1.
23. Вер попадания в интервал случ вел, распредение по случайному закону
Если случ вел распределена по норм закону то ее ф-я распред им вид Ф(х)=1/2+1/2Ф(х-а/ сигма)
Вероятность того, что отклонение СВ Х, распределенной по нормальному закону, от математического ожидания а не превысит величину (по абсолютной величине), равна
Вероятность попадания значений нормальной СВ Х в интервал [ ] определяется формулой
24. Интегральная теорема Лапласса и ее следствие
Вероятность того, что в n независ испытаниях в каждом из котор вер появл событ равна p , событие наступит не меньше a раз и не более b раз прибл равна
P(a≤m≤b) ≈ ,где
- функция Лапласа
25. Неравенство Маркова
Если значение случайной величины Х неотрицательны и существует математическое ожидание МХ = а, то для любого ε>0
Р (Х ≤ ε) ≥ 1 – a/ε
Или
Р (Х > ε) < a/ε
Неравенство называется неравенством Маркова.
26. Неравенство Чебышева
Если Х-СВ, мат. ожидание к-рой М(Х) = а, а дисперсия D(Х) конечна, то д/любого числа ε > 0 выполняются неравенства:
27. Теорема Чебышева
Имеется последовательность случайных величин X1, X2, X3, …, Xn, … Независимы и одинаково распределены со средними MXi = a и дисперсиями DXi = DX, то справедлива теорема Чебышева:
Из этого неравенства при n → ∞ следует закон больших чисел:
Смысл закона больших чисел заключается в том, что средние значения случайных величин стремятся к их математическому ожиданию при n → ∞ по вероятности. Отклонение средних значений от математического ожидания становится сколь угодно малым с вероятностью, близкой к единице, если n достаточно велико. Другими словами, вероятность любого отклонения средних значений от а сколь угодно мала с ростом n.
28. Понятие о выборочном методе. Характеристики генеральной и выборочной совокупностей.
Статистич совок назыв совокупность предметов или явлений, объединен к-л общим признаком. Генеральной совокупностью называется совокупность объектов или набдюдений, все элементы которой подлежат изучению при статистическом анализе.
Часть объектов генеральной совокупности, используемая для исследования, называется выборочной совокупностью или выборкой.
Сущность выборочного метода в математической статистике заклюсается в том, чтобы по определенной части генеральной совокупности (выборке) судить о ее свойствах в целом.
Выборка (x1, x2,…, xn) объема n из генеральной совокупности. Различные элементы выборки - варианты. Ряд вариант, расположенных в порядке возрастания их значений, с соответствующими им весами - вариационный ряд. Бывают дискретными и интервальными.Различают сле характеристики генер и выб совок: ген и выб средн, ген и выб доли, ген и выб дисперсия, Арифм корень из ген и выб совок
29. Оценка генеральной средней по выборочной средней. (в тетр)
30. Ошибка выборки при определении среднего значения признака и его доли.
Ошибкой выборки при определении ср значен признака назыв среднее квадратич отклонение выборочной средней и обознач
1) выборка повторная
2) выборка бесповторная
Ошибкой выборки при определении доли признака назыв средн квадратическое отклонение выборочной доли
1) выборка повторная
2) выборка бесповторная
31. Статистическая оценка параметров. Смещенные и несмещенные оценки. стр 157
Статистической оценкой неизвестного параметра теоретического распределения называют ф-ю от наблюдаемых случ вел
Различают точечные и интервальные статистические оценки.
Интервальная – оценка, определяемая 2 числами – концами интеграла. Интервальная оценка позволяет установить точность и надежность оценки.
Точечной называют статистич оценку, котор определ одним числом где результаты n наблюдений над количественным признаком Х
Несмещенной называют точечную выборку, математич ожидание которой равно оцениваемому параметру при любом объеме выборки.
Смещенной называют точечную оценку, матем ожидан котор не равно оцениваемому параметру.
Несмещенной оценкой генеральной средней служит выборочная средняя
Смещенной оценкой генер дисперсии служит выборочная дисперсия
Несмещенной оценкой генер дисперсии служит исправленная выборочная дисперсия
32. Формулы доверительных вероятностей. Доверительные границы для генеральной средней и генеральной доли.
для случая нормального распределения мы можем пользоваться следующими формулами:
С вероятностью 95%
С вероятностью 99%
В общем виде c вероятностью Р(t)
Доверительный интервал уровня надежности для гер средней а будет иметь вид
где предельная ошибка выборки, зависящая от
При n>30 для повторн выб
бесповторн
Доверит инт для генер доли равен
При n>30 для повторн выб
бесповторн
33. Состоятельные и эффективные оценки.
Состоятельной называют статистическую оценку , которая при n →∞ стремится по вероят-ности к оцениваемому параметру. Статистика θn является состоятельной оценкой параметра θ тогда и только тогда, когда для любого положительного числа ε справедливо предельное соотношение
Эффективной называют статистическую оценку , которая (при заданном объёме выборки n) имеет наименьшую возможную дисперсию.
34. Необходимый объем выборки
При решен статистич задач часто требуется определить необходимый объем выборки для достижения требуемой надежности доверительного интервала. Объем n определяется уровнем надежности и предельной ошибкой. оБем выборки находится по след ф-лам.
35. Функциональная и статистическая зависимости. Корреляционная таблица.
При функциональной зависимости двух величин значению одной из них обязательно соответствует одно или несколько точно определенных значений другой величины. Функциональная связь двух факторов возможна лишь при условии, что вторая величина зависит только от первой и не зависит ни от каких других величин.
Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения других (другой), и эти другие величины принимают некоторые значения с определенными вероятностями.
При большом числе наблюдений одно и то же значение может встретиться раз, одно и то же значение раз, одна и та же пара чисел может наблюдаться раз. Поэтому данные наблюдений группируют, т.е. подсчитывают частоты , , . Все сгруппированные данные записывают в виде таблицы, которую называют корреляционной.
36. Условные средние. Корреляционная зависимость.
Условным средним`у от х называют среднее арифметическое наблюдавшихся значений Y, соответствующих Х=х.
Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.
37. Уравнения прямых регрессий.
38. Линейный коэффициент корреляции и его с-ва.
- корреляционный момент (ковариация), где K(X ,Y ) = = M{[X -M(X )][Y -M(Y)]} Две случайные величины X и Y называются коррелированными, если их коэф-т корреляции отличен от нуля. СВ X и Y называются некоррелированными, если их корреляционный момент равен нулю.
выборочный коэф. коррел. Свойства коэф-та корреляции: 1. Коэф-т корреляции принимает значения на отрезке [-1;1], т.е. 1 1 в -1 £ r £ 1; 2.Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, то величина выборочного коэф-та корреляции не изменится. 3.При 1 r = ±1 корреляц. связь представл. линейную функц. зависимость. При этом линии регрессии Y на X и X на Y совпадают, все наблюдаемые значения располагаются на общей прямой. 4.Если с ростом значений одной СВ значения второй возрастают, то 0 в r > , если убывают, то 0 в r < . 5.При 0 в r = линейная корреляц. связь отсутствует, групповые средние переменных совпадают с их общими средними, а линии регрессии Y на X и X на Y параллельны осям координат. Выборочный коэф-т корреляции r является оценкой генерального коэф-та корреляции
39. Статистическая гипотеза. Нулевая и конкурирующая гипотезы.
Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.
Например , статистическими будут гипотезы:
1) генеральная совокупность распределена по закону Пуассона;
2) дисперсии двух нормальных совокупностей равны между собой.
Нулевой называют выдвинутую гипотезу Н0.
Конкурирующей называют гипотезу Hi, которая противоречит нулевой .
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10, то конкурирующая гипотеза , в частности, может состоять в предположении, что а#10.
40. Уровень значимости и мощности критерия.
При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.
Вероятность ошибки первого рода называется уровнем значимости и обозначается α. Таким образом, α = P{UΨ | H0}, т.е. уровень значимости α – это вероятность события {UΨ}, вычисленная в предположении, что верна нулевая гипотеза Н0.
Уровень значимости однозначно определен, если Н0 – простая гипотеза. Если же Н0 – сложная гипотеза, то уровень значимости , вообще говоря, зависит от функции распределения результатов наблюдений, удовлетворяющей Н0.
Вероятность ошибки второго рода есть P{Uне принадлежитΨ | H1}. Обычно используют не эту вероятность, а ее дополнение до 1, т.е. P{Uне принадлΨ | H1} = 1 - P{Uне принадлΨ | H1}. Эта величина носит название мощности критерия . Итак, мощность критерия – это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.
41. Проверка гипотезы о среднем значении при известной и неизвестной дисперсиях. стр 221
42. Проверка гипотезы о равенстве значений двух средних из нормально распределенных генеральных совокупностей.
43. Критерий согласия Пирсона
Критерий согласия Пирсона (χ2) применяют для проверки гипотезы о соответствии эмпирического распределения предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100).
Использование критерия χ2 предусматривает разбиение размаха варьирования выборки на интервалы и определения числа наблюдений (частоты) nj для каждого из e интервалов. Для удобства оценок параметров распределения интервалы выбирают одинаковой длины.
Число интервалов зависит от объема выборки. Обычно принимают: при n = 100 e = 10 ÷ 15, при n = 200 e = 15 ÷ 20
Статистикой критерия Пирсона служит величина
, где pj - вероятность попадания изучаемой случайной величины в j-и интервал, вычисляемая в соответствии с гипотетическим законом распределением F(x).