Основы математической статистики
A b
2) [ a. b) -множество действительных чисел, расположенных между числами aи b, включая только конец a; [ a, b) -полуинтервал, изображается:
0 a b
Основные операции над множествами:
Ø Объединение: АÈВ={x|xÎA xÎB};
Ø Пересечение: АÇВ={x|xÎA и xÎB};
Ø Разность: А\В={x|xÎA и xÏB};
Ø Дополнение: =I\A={x|xÎI и xÏA}.
Декартово произведение двух множеств.
Декартовым произведением множества X = { x } и множества Y = { y } называется множество всевозможных упорядоченных пар ( x, y ) таких, что x Î X, y ÎY. Обозначается:
X×Y={(x,y) |xÎXиyÎY }.
Пример .
X={1, 2, 4},Y={6, 7},X×Y={(x,y) |xÎX ; yÎY}=
{( 1, 6 ) ,( 1, 7 ), ( 2, 6 ), ( 2, 7 ), ( 4, 6 ), ( 4, 7 ) }.
Если в декартовом произведении используются множества бесконечные,
то X × Y нельзя задать в виде конечного множества пар элементов, как в Примере 1. Тогда декартово произведение X × Y удобнее изобразить с помощью чертежа, где элементы x из множества X откладываются на горизонтальной прямой, а элементы y из множества Y на вертикальной прямой, пересекающей первую под прямым углом в точке 0.
Пример.
X=[2, 4],Y={1, 2, 3, 4}.
Y
X | ||||||
Вычисление площадей и объемов.
Площадь квадрата со стороной авычисляется по формуле S= а2. Площадь прямоугольника со сторонами аи bвычисляется по формуле S= аb.
Объем куба с ребром авычисляется по формуле V= а3, площадь поверхности куба вычисляется по формуле S= 6а2.
Площадь поверхности прямоугольного параллелепипеда с измерениями а, b, свычисляется по формуле S= 2с( а+ b) + 2аb. Объем вычисляется по формуле V= аbс.
Диагональным сечением параллелепипеда (куба) называется сечение, образованное двумя противоположными боковыми ребрами и двумя диагоналями оснований, соединяющими концы этих ребер.
Основы математической статистики
Статистические данные – сведения о числе объектов какой-либо обширной совокупности, обладающими теми или иными признаками (например, число студентов, родившихся в 1985 году). Являются исходным материалом для любого статистического исследования. На основании статистических данных можно сделать научно обоснованные выводы. Для этого статистические данные должны быть предварительно определённым образом систематизированы и обработаны.
Одним из основных методов обработки статистических данных является выборочный метод. При выборочном исследовании из всей совокупности отбирают некоторым образом определённое число объектов и только их подвергают исследованию.
Выборочная совокупность (выборка) – набор случайно отобранных объектов из генеральной совокупности.
Основными показателями выборки являются:
1) вариант; 2) объем; 3) размах; 4) частота; 5)относительная частота.
Вариант – количественное значение элемента выборки.
Генеральная совокупность – совокупность всех исследуемых объектов. Генеральную совокупность образуют, например, все больные с данным диагнозом, все новорождённые и дети и т. д. Общую сумму членов генеральной совокупности называют её объёмом и обозначают буквой N. Теоретически объём генеральной совокупности ничем не ограничен (N → ∞). Поэтому обычно изучается какая-то часть объектов генеральной совокупности – выборка.
Объём выборки (будем обозначать буквой n) – число объектов выборки (например, из 10000 студентов для контрольной флюорографии отобраны 100 студентов, то объем генеральной совокупности равен 10000, а объем выборки равен 100).
Таблица, в первой строке которой записаны все значения величины (варианты), во второй – соответствующие им частоты, называется таблицей распределения.
числовые характеристики выборки:
1) Размах выборки – это разница между минимальной и максимальной вариантой. На графике – это длина области определения полигона.
2) Мода выборки – это наиболее часто встречающаяся ее варианта.
3) Среднюю варианту в группированном ряду данных называют медианой измерения. Если средних вариант две, то медиана равна их полусумме.
Пример 1.На уроке физкультуры 14 школьников прыгали в высоту, а учитель записывал результаты. Получался такой ряд данных (в сантиметрах) :
125, 110,130, 125, 120, 130, 140, 125,
110, 130, 120, 125, 120, 125.
Требуется сгруппировать данные, составить таблицу их распределения, найти размах, моду и медиану измерения.
Решение. Выпишем все варианты измерения в порядке возрастания(точнее, не убывания), разделяя пробелами группы одинаковых результатов:
110, 110, 120, 120, 120, 125, 125, 125, 125, 125,
130, 130, 130, 140.
Это сгруппированный ряд данных. Размах изменения равен 140 – 130 =30.Варианта 140 встретилось однажды, кратность равна 1. Варианта 110 встретилась дважды, кратность равна 2. Варианта 125 встретилась наибольшее число раз, ее кратность равна 54 это мода измерения. Составляем таблицу распределения:
Варианта | сумма | |||||
кратность |
Если двигаясь по сгруппированному ряду слева направо отсчитать половину (7) результатов, то мы остановимся на результате 125 см. Следующая половина результатов начинается также со 125. Значит , 125- медиана измерения.
Подчеркнем , что в процессе упорядочивания, группировки данных и составления таблиц распределения с самими данными ничего не происходит: они остаются неизменными. Изменяется только способ их представления. По существу меняется только дизайн информации, способ ее оформления.
Записать в виде вариационного и статистического рядов выборку: 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4.
Определить объем и размах выборки. Вычислить математическое ожидание, построить полигон частот.
Р е ш е н и е:
Математическая статистика позволяет получать обоснованные выводы о параметрах, видах распределений и других видах свойствах случайных величин по конечной совокупности наблюдений над ними – выборке.
Вариационным рядом выборки х1, х2, …, хn называется способ ее записи, при котором элементы упорядочиваются по величине, т. е. записываются в виде последовательности х(1), х(2), …, х(n), где х(1) х(2) … х(n). Разность между максимальным и минимальным элементами выборки х(n) – х(1) = w называется размахом выборки.
Пусть выборка (х1, х2,…, хn) содержит k различных чисел х1, х2, …, хк, причем хi встречается ni раз (i = 1, 2, …, k). Число ni называется частотой элемента выборки хi.
Очевидно, что .
Статистическим рядом называется последовательность пар i=1 (хi, ni). Обычно статистический ряд записывается в виде таблицы, первая строка которой содержит элементы хi, а вторая - их частоты, третья строка – относительные частоты.
Для данной задачи объем выборки n = 15,
размах выборки w = 10 – 2 = 8.
Упорядочив элементы выборки по величине, получим вариационный ряд:
2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10.
Различными в данной выборке являются элементы х1 = 2, х2 = 3, х3 = 4, х4 =5, х5 = 7, х6 = 10;их частоты соответственно равны n1 = 3, n2 = 1, n3 = 2, n4 = 3, n5 = 4, n6 = 2. Следовательно, статистический ряд исходной выборки можно записать в виде следующей таблицы:
хi | ||||||
ni | ||||||
рi | 0,2 | 0,07 | 0,13 | 0,2 | 0,26 | 0,13 |
Для контроля правильности находим ni = 15, рi = 1.
Математическое ожидание приближенно равно (тем точнее, чем больше число испытаний) среднему арифметическому наблюдаемых значений случайной величины.
Математическое ожидание можно найти по одной из трех формул:
; ;
= (2 + 2 + 2 + 3 + 4 + 4 + 5 + 5 + 5 + 7 + 7 + 7 + 7 + 10 + 10) 5,3;
= (2 · 3 + 3 · 1 + 4 · 2 + 5 · 3 + 7 · 4 + 10 · 2) 5,3;
= (2 · 0,2 + 3 · 0,07 + 4 · 0,13 + 5 · 0,2 + 7 · 0,26 + 10 · 0,13) 5,3.
Полигон частот строится следующим образом:
По горизонтали откладываем значения элементов выборки, а по вертикали – соответствующие частоты, соединяем полученные точки ломаной линией. Для данной задачи получим: