Пусть имеется выборка результатов испытаний

Столбец 1 Столбец 2 Столбец 3 Столбец 4 Столбец 5
X Y X Y X Y X Y X Y
4.22 117.00 4.14 112.58 4.20 116.18 4.17 114.23 3.71 89.89
4.08 109.32 3.44 77.16 3.57 83.29 4.08 109.12 3.51 80.42
3.59 83.82 4.06 108.45 3.99 104.67 4.39 127.32 4.31 122.32
4.17 114.48 4.67 144.03 4.35 124.64 3.47 78.42 3.81 95.21
4.06 108.41 3.85 97.31 3.86 97.60 3.46 77.66 4.26 119.62
3.55 82.29 3.59 84.20 3.75 92.15 3.09 61.54 4.43 129.80
3.74 91.68 3.32 71.68 3.67 87.80 3.71 90.13 3.37 73.56
3.25 68.56 4.12 111.71 3.74 91.60 3.82 95.46 3.81 94.98
4.62 141.25 3.80 94.52 3.73 90.79 3.41 75.40 4.02 106.08
3.76 92.47 3.09 61.50 3.98 104.09 3.96 102.85 3.95 102.18
 
Столбец 6 Столбец 7 Столбец 8 Столбец 9 Столбец 10
X Y X Y X Y X Y X Y
4.39 127.41 4.16 113.98 3.50 79.82 4.53 135.36 4.56 137.33
4.05 107.47 3.34 72.44 3.42 75.84 3.56 82.58 4.16 113.93
3.30 70.41 4.00 104.74 3.62 85.32 3.51 80.18 3.24 68.20
4.61 140.41 4.57 137.84 3.61 85.22 4.31 122.69 3.80 94.29
4.33 123.40 4.40 127.68 4.31 122.34 4.24 118.58 4.53 135.55
4.06 108.22 4.57 138.05 3.15 64.29 4.70 146.14 3.83 95.92
4.16 113.97 4.06 108.50 3.93 101.01 3.68 88.22 4.20 115.89
3.46 77.92 3.43 76.55 4.42 128.98 3.60 84.53 3.54 81.49
4.51 134.19 4.04 107.16 4.20 116.16 3.67 87.73 3.77 93.19
4.53 135.43 3.86 97.62 4.12 111.35 4.40 127.44 3.37 73.59

В данном примере объем выборки n =100

Для того, чтобы суждения о законах распределения СВ X или об ее числовых характеристиках были объективны, необходимо, чтобы выборка была представительной (репрезентативной), т.е. достаточно хорошо представляла исследуемую случайную величину. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку. Выборка считается большой, если ее объем n >30, в противном случае выборка называется малой.

2. ПОСТРОЕНИЕ ВАРИАЦИОННОГО РЯДА.

Пусть изучается некоторая дискретная или непрерывная СВ, закон распределения которой известен. Статистический материал, полученный в результате измерений, представляют в виде таблицы, состоящей из двух строк, в первой из которых находятся расположенные в возрастающем порядке значения признака (для дискретной СВ) или интервалы (для непрерывной СВ), а во второй – их частота Пусть имеется выборка результатов испытаний - student2.ru ; (число одинаковых значений дискретной СВ или число наблюдений в i-м интервале в случае непрерывной СВ). Такое представление признака и частот называется вариационным рядом.

На основе имеющейся выборки составляем интервальный статистический ряд для непрерывной СВ.

Для выбора оптимальной длины интервалов h воспользуемся формулой:

Пусть имеется выборка результатов испытаний - student2.ru

где Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru – соответственно максимальное и минимальное значения признака X в выборке; l– количество интервалов. В данной работе мы будем использовать следующую формулу: Пусть имеется выборка результатов испытаний - student2.ru , где n – объём выборки (можно воспользоваться формулой Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru ).

Для нашего случая: Пусть имеется выборка результатов испытаний - student2.ru

Найдём количество интервалов: Пусть имеется выборка результатов испытаний - student2.ru .

Найдём длину интервалов (шаг): Пусть имеется выборка результатов испытаний - student2.ru Примем значение шага равным 0.17.

Нижнюю границу первого интервала принимаем равной минимальному значению признака Пусть имеется выборка результатов испытаний - student2.ru в выборке, т.е. Пусть имеется выборка результатов испытаний - student2.ru .

Зная нижнюю границу первого интервала Пусть имеется выборка результатов испытаний - student2.ru и длину интервала Пусть имеется выборка результатов испытаний - student2.ru , построим весь интервальный ряд (Таблица 1. Столбец «Интервалы»).

Найдем середину каждого интервала (Таблица 1. Столбец «Середина интервала»), используя формулу: Пусть имеется выборка результатов испытаний - student2.ru , где Пусть имеется выборка результатов испытаний - student2.ru – конечное и начальное значения определённого интервала.

Проанализируем каждое значение имеющейся выборки на факт попадания в определённый интервал, а число значений, попавших в интервал, запишем в столбец «Частота». Проведём проверку полученных значений частот: Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru .

В столбец «Накопленная частота» запишем значения, полученные по формуле: Пусть имеется выборка результатов испытаний - student2.ru

Все вычисленные значения представим в виде таблицы 1.

3. ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ ВАРИАЦИОННЫХ РЯДОВ

Для наглядности статистические ряды представляют графиками, наиболее распространёнными являются полигон и гистограмма. Полигон применяется для изображения как дискретных, так и интервальных статистических рядов, гистограмма – для изображения только интервальных рядов. Покажем построение этих графиков на примере.

Таблица 1.

I Интервалы Середина интервала, Пусть имеется выборка результатов испытаний - student2.ru Частота, Пусть имеется выборка результатов испытаний - student2.ru Относительная частота, Пусть имеется выборка результатов испытаний - student2.ru Накопленная частота, Пусть имеется выборка результатов испытаний - student2.ru Относит. накопл. частота, Пусть имеется выборка результатов испытаний - student2.ru
[3,09; 3,26) 3,175 ***** 0,05 0,05
[3,26; 3,43) 3,345 ******* 0,07 0,12
[3,43; 3,60) 3,515 ************** 0,14 0,26
[3,60; 3,77) 3,685 ************* 0,13 0,39
[3,77; 3,94) 3,855 *********** 0,11 0,5
[3,94; 4,11) 4,025 ************** 0,14 0,64
[4,11; 4,28) 4,195 ************** 0,14 0,78
[4,28; 4,45) 4,365 *********** 0,11 0,89
[4,45; 4,62) 4,535 ******** 0,08 0,97
[4,62; 4,79] 4,705 *** 0,03
      Проверка: Σ=100      


Для построения гистограммы частот на оси абсцисс откладываем частичные интервалы значений случайной величины Пусть имеется выборка результатов испытаний - student2.ru , на каждом из которых строим прямоугольник, высота которого равна соответствующей частоте интервала Пусть имеется выборка результатов испытаний - student2.ru .

Если на гистограмме частот соединить середины верхних сторон элементарных прямоугольников, то полученная замкнутая ломаная образует полигон распределения частот (рисунок 1).

Пусть имеется выборка результатов испытаний - student2.ru

Рисунок 1. – Графическое изображение вариационного ряда.

В теории вероятностей гистограмме и полигону относительных частот соответствует график плотности распределения. По виду полигона делают первоначальное предположение о законе распределения исследуемой случайной величины.

4. ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ

Пусть известен статистический ряд количественного признака X. Введем обозначения: Пусть имеется выборка результатов испытаний - student2.ru – число наблюдений, при которых наблюдалось значение признака меньше х (накопленная частота); n – объем выборки; Пусть имеется выборка результатов испытаний - student2.ru – относительная частота события Х < х (относительная накопленная частота).

Эмпирической функцией распределения называют функцию Пусть имеется выборка результатов испытаний - student2.ru , равную относительной накопленной частоте события Х <х.

Пусть имеется выборка результатов испытаний - student2.ru

В отличие от эмпирической функции распределения выборки интегральную функцию Пусть имеется выборка результатов испытаний - student2.ru распределения генеральной совокупности называют теоретической функцией распределения. Теоретическая функция распределения определяет вероятность события Х < х, т.е. Р(Х < х), эмпирическая – относительную частоту этого события. Вследствие закона больших чисел (теорема Бернулли) относительная частота события Х < х, т.е. F*(x) стремится к вероятности этого события, т.е. к F(x). Пусть имеется выборка результатов испытаний - student2.ru обладает всеми свойствами F(x), а именно:

1) 0< Пусть имеется выборка результатов испытаний - student2.ru <1;

2) Пусть имеется выборка результатов испытаний - student2.ru – неубывающая функция;

3) Пусть имеется выборка результатов испытаний - student2.ru =0 при х Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru ,

4) Пусть имеется выборка результатов испытаний - student2.ru =1 при х > Пусть имеется выборка результатов испытаний - student2.ru .

Эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.

Для построения графика эмпирической функции распределения (кумуляты) на оси абсцисс откладывают интервалы, на оси ординат – относительные накопленные частоты, соответствующие правым границам интервала. Пусть имеется выборка результатов испытаний - student2.ru на левой границе первого интервала равна нулю. Кумулята представляет собой ломаную линию (рисунок 2).

Пусть имеется выборка результатов испытаний - student2.ru

Рисунок 2. – График эмпирической функции распределения.

5. ОСНОВНЫЕ ВЫБОРОЧНЫЕ ХАРАКТЕРИСТИКИ

К основным выборочным характеристикам (показателям) относятся: средняя арифметическая, мода, медиана, дисперсия, среднее квадратическое отклонение, коэффициент вариации, коэффициент асимметрии, эксцесса. Для определения перечисленных показателей удобно составить таблицу 2.

Таблица 2

i Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru Пусть имеется выборка результатов испытаний - student2.ru
3,175 15,875 –0,748 2,79752 –2,09254 1,565224
3,345 23,415 –0,578 2,338588 –1,3517 0,781285
3,515 49,21 –0,408 2,330496 –0,95084 0,387944
3,685 47,905 –0,238 0,736372 –0,17526 0,041711
3,855 42,405 –0,068 0,050864 –0,00346 0,000235
4,025 56,35 0,102 0,145656 0,014857 0,001515
4,195 58,73 0,272 1,035776 0,281731 0,076631
4,365 48,015 0,442 2,149004 0,94986 0,419838
4,535 36,28 0,612 2,996352 1,833767 1,122266
4,705 14,115 0,782 1,834572 1,434635 1,121885
Пусть имеется выборка результатов испытаний - student2.ru 392,3   16,4152 –0,05896 5,518533

В зависимости от характеризуемых особенностей распределения обобщающие показатели можно разбить на три группы:

1. показатели центра распределения (центра группирования);

2. показатели степени рассеяния (вариации);

3. показатели формы распределения.

1. Показатели центра распределения

Для характеристики центра распределения в вариационном ряду используются:

1) Средняя арифметическая, которая определяется по формуле:

Пусть имеется выборка результатов испытаний - student2.ru

где Пусть имеется выборка результатов испытаний - student2.ru – значение признака для дискретного ряда или середина интервала для интервального статистического ряда.

В нашем случае: Пусть имеется выборка результатов испытаний - student2.ru .

2) Мода – наиболее часто встречающееся значение признака. Для дискретного ряда мода – значение признака, соответствующего наибольшей частоте. Для интервального ряда мода вычисляется по следующей приближенной формуле:

Пусть имеется выборка результатов испытаний - student2.ru ,

где Пусть имеется выборка результатов испытаний - student2.ru – нижняя граница модального интервала, то есть интервала, имеющего наибольшую частоту;

Пусть имеется выборка результатов испытаний - student2.ru – длина интервала;

Пусть имеется выборка результатов испытаний - student2.ru – частота модального интервала;

Пусть имеется выборка результатов испытаний - student2.ru – частота интервала, предшествующего модальному;

Пусть имеется выборка результатов испытаний - student2.ru – частота интервала, следующего за модальным.

В примере модальным является 6 интервал.

Пусть имеется выборка результатов испытаний - student2.ru

Мода может быть определена приближенно графическим способом. Для этого правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых приближенно будет модой распределения. В рассматриваемом примере Пусть имеется выборка результатов испытаний - student2.ru = 4.11 (рисунок 1).

3) Медиана – значение признака, которое делит весь упорядоченный ряд значений пополам. Для дискретного ряда, если число вариант нечетно, т. е. n = 2k+l, Me = Пусть имеется выборка результатов испытаний - student2.ru , при четном n = 2k Me = Пусть имеется выборка результатов испытаний - student2.ru /2. Для интервального статистического ряда медиана вычисляется по следующей приближенной формуле:

Пусть имеется выборка результатов испытаний - student2.ru

где Пусть имеется выборка результатов испытаний - student2.ru – нижняя граница медианного интервала, то есть интервала, которому соответствует первая из накопленных частот, превышающая половину объема совокупности; Пусть имеется выборка результатов испытаний - student2.ru – длина интервала; Пусть имеется выборка результатов испытаний - student2.ru – частота медианного интервала; Пусть имеется выборка результатов испытаний - student2.ru – накопленная частота интервала, предшествующего медианному.

В примере медианным является 3-й интервал.

Пусть имеется выборка результатов испытаний - student2.ru .

По кумуляте (рисунок 2) приближённо определим значение медианы: на уровне 0.5 (накопленная относительная частота) проведем горизонтальную линию до пересечения с кумулятой; в точке пересечения опустим перпендикуляр на ось абсцисс; точка, в которой перпендикуляр пересекает ось абсцисс, показывает приближенное значение медианы. В нашем примере Пусть имеется выборка результатов испытаний - student2.ru .

2. Показатели рассеяния

Для характеристики отклонения значений признака от среднего арифметического используются:

1) Дисперсия, которая определяется по формуле:

Пусть имеется выборка результатов испытаний - student2.ru

В нашем случае: Пусть имеется выборка результатов испытаний - student2.ru .

2) Среднее квадратическое отклонение

Пусть имеется выборка результатов испытаний - student2.ru

В нашем случае: Пусть имеется выборка результатов испытаний - student2.ru .

3) В качестве относительной характеристики рассеяния используют коэффициент вариации, который показывает, насколько велико рассеяние значений признака по сравнению со средней арифметической. Коэффициент вариации определяется по формуле:

Пусть имеется выборка результатов испытаний - student2.ru

В отличие от дисперсии и среднего квадратического отклонения коэффициент вариации – величина безразмерная, что позволяет сравнивать изменчивость признаков как в пределах одной совокупности, так и разных совокупностей, независимо от единиц измерения разных сопоставляемых признаков.

Совокупность считается однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному).

Исходя из величины коэффициента вариации, можно установить характеристику изменчивости, например, по следующей схеме:

Коэффициент вариации, Пусть имеется выборка результатов испытаний - student2.ru До 5% 6–10% 11–20% 21–50% 50%
Изменчивость слабая умеренная значительная большая очень большая

В нашем случае: Пусть имеется выборка результатов испытаний - student2.ru , следовательно, изменчивость умеренная, совокупность однородна.

3. Показатели формы распределения

На практике приходится встречаться с самыми различными распределениями. Однородные совокупности характеризуются, как правило, одновершинным распределением. Многовершинность свидетельствует о неоднородности изучаемой совокупности. При изучении распределений, отличных от нормального, возникает необходимость количественно оценить это различие. С этой целью вводят такие характеристики, как коэффициент асимметрии Пусть имеется выборка результатов испытаний - student2.ru и коэффициент эксцесса ε. Для нормального распределения эти характеристики равны нулю. Поэтому, если для изучаемого распределения асимметрия и эксцесс имеют небольшие значения Пусть имеется выборка результатов испытаний - student2.ru ;‌‌ Пусть имеется выборка результатов испытаний - student2.ru , то можно предположить близость этого распределения к нормальному.

Коэффициент асимметрии определяется по формуле:

Пусть имеется выборка результатов испытаний - student2.ru .

Если Пусть имеется выборка результатов испытаний - student2.ru =0, то ряд симметричен относительно моды.

При Пусть имеется выборка результатов испытаний - student2.ru >0 скошенность вправо, средняя арифметическая правее моды, «длинная часть» кривой распределения расположена справа от моды. При правосторонней асимметрии Пусть имеется выборка результатов испытаний - student2.ru .

При Пусть имеется выборка результатов испытаний - student2.ru <0 скошенность вправо, средняя арифметическая левее моды, «длинная часть» кривой распределения расположена слева от моды. При левосторонней асимметрии Пусть имеется выборка результатов испытаний - student2.ru .

Наши рекомендации