Статистические функции непрерывных распределений
Функции нормального распределения
Функция НОРМРАСП
См. также НОРМОБР, НОРМСТРАСП, НОРМСТОБР, НОРМАЛИЗАЦИЯ.
Синтаксис:
НОРМРАСП (х; среднее; стандартное откл; интегральная)
Результат:
Рассчитывает нормальное распределение.
Аргументы:
х: значение, для которого вычисляется нормальное распределение;
среднее: средняя арифметическая распределения;
стандартное откл: стандартное отклонение распределения;
интегральная: логическое значение, определяющее форму функции. Если аргумент интегральная = 1, то функция НОРМРАСП рассчитывает интегральную функцию распределения; если аргумент интегральная = 0 - дифференциальную функцию распределения.
Математико-статистическая интерпретация;
Нормальный закон распределения (часто называемый законом Гaycca) имеет в статистике широкий круг приложений и занимает среди других законов распределения особое положение. Главная особенность, выделяющая нормальный закон среди других, состоит в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся условиях.
Доказано, что сумма достаточно большого числа независимых (или слабо зависимых) случайных величин, подчиненных каким-либо законам распределения, приближенно подчиняется нормальному закону; и это выполняется тем точнее, чем большее количество случайных величин суммируется. Основное ограничение, налагаемое на суммируемые величины, состоит в том, что они все должны играть в общей сумме относительно малую роль. Если ни одна из случайно действующих величин по своему действию не окажется преобладающей над другими, то закон распределения очень близко подходит к нормальному.
Такая закономерность проявляется во многих практических случаях. Например, еще Кетле (один из создателей научной статистики) обнаружил, что вариация в однородной группе характеризуется нормальной кривой. Если построить эмпирическую кривую распределения людей одной нации, пола и возраста по росту, весу, то она напоминает кривую Гаусса - Лапласа. Поэтому нормальное распределение часто применяется в тех случаях, когда истинный закон распределения известен, но вычисления по этому закону затруднительны, а аппроксимация его нормальным распределением допустима.
Примечание. Несмотря на широкое распространение, нормальное распределение не универсально. Если нет уверенности в его применимости, следует проверить возможность использования нормального распределения для описания случайной величины с помощью критериев согласия.
Уравнение для плотности нормального распределения имеет вид
f(x, ,σ) =
а уравнение нормальной функции распределения –
F(x, ,σ) = = Ф
Функция НОРМРАСП использует первое уравнение, если аргумент интегральная=0, и второе уравнение, если аргумент интегральная = 1. Так, формула =НОРМРАСП(42;40;1,5;0) рассчитает значение 0,109, а формула =НОРМРАСП(42;40;1,5;1) — значение 0,909.
Кривая плотности нормального распределения имеет симметричный холмообразный вид (см. рис. 6.2).
Максимальная ордината кривой соответствует точке х = = Мо = Ме. По мере удаления от этой точки плотность распределения падает, и при х ± кривая асимптотически приближается к оси абсцисс. Изменение при постоянстве σ приводит к смещению кривой вдоль оси абсцисс, не меняя ее формы. С увеличением σ кривая становится более пологой, с уменьшением σ — более острой. Площадь, заключенная под кривой, асимптотически приближающейся к оси абсцисс, равна единице.
Для нормального распределения выполняются следующие равенства: μ1= μ3 = 0; μ2 = σ2; μ4 = 3σ4; А s = 0; Ek = 0.
Весьма важной практической задачей является определение вероятности того, что случайная величина попадет на заданный интервал вещественной оси (a, b). Для нормального распределения она определяется следующей формулой:
P(a<x<b) = Ф - Ф
Пример 6.1. Для закупки и последующей продажи мужских зимних курток фирмой было проведено выборочное обследование мужского населения города в возрасте от 18 до 65 лет в целях определения его среднего роста. В результате было установлено, что средний рост = 176 см, стандартное отклонение σ = 6 см. Необходимо определить, какой процент общего числа закупаемых курток должны составлять куртки 5-го роста (182—186 см). Предполагается, что рост мужского населения города распределен по нормальному закону.
Формула для решения задачи имеет следующий вид:
=НОРМРАСП(186;176;6;ИСТИНА) - НОРМРАСП(182;176;6;ИСТИНА) = 0,95221 -0,84134 = 0,11086= 11%.
Таким образом, куртки 5-го роста должны составлять приблизительно 11% общего числа закупаемых курток.
Функция НОРМОБР
См. также НОРМРАСП, НОРМСТРАСП, НОРМСТОБР, НОРМАЛИЗАЦИЯ, ДОВЕРИТ.
Синтаксис.
НОРМОБР (вероятность; среднее; стандартное откл)
Результат;
Рассчитывает обратное нормальное распределение.
Аргументы;
вероятность; вероятность, соответствующая нормальному распределению;
среднее: средняя арифметическая распределения;
стандартное откл: стандартное отклонение распределения.
Замечания;
Функция НОРМОБР использует для вычисления метод итераций и производит вычисления, пока не получит результат с точностью ±3 10-7. Если результат не сходится после 100 итераций, то функция помещает в ячейку значение ошибки #Н/Д.
Математико-статистическая интерпретация;
См. описание функции НОРМРАСП
Функция обратного нормального распределения используется в ситуациях, когда известна вероятность определенного значения случайной величины и необходимо рассчитать это значение.
Например, формула =НОРМОБР(0,90879;40;1,5) рассчитывает значение 42,00001 (сравните с формулой =НОРМРАСП(42;40;1,5;1), рассчитывающей значение 0,90879).
На практике часто встречается задача, обратная задаче вычисления вероятности попадания нормально распределенной случайной величины на участок, симметричный относительно математического ожидания . Формула для вероятности попадания случайной величины на участок, симметричный относительно математического ожидания, имеет следующий вид:
P( = 2Ф - 1
где l — половина длины участка, симметричного относительно математического ожидания.
Пример 6.2. Для задачи, рассмотренной в примере 6.1, рассчитать границы интервала роста мужского населения города, вероятность попадания в который случайной величины роста составляет 0,95.
Для этого предварительно необходимо преобразовать аргументы НОРМОБР к стандартному виду, в результате чего имеем
l = НОРМОБР ((Р + 1)/2;0;σ).
После подстановки данных получим формулу = НОРМОБР ((0,95 + 1)/2;0;6), которая рассчитает значение 11,7598. Таким образом, границы искомого интервала составят 164,24 и 187,76 см.
В качестве границ интервалов часто берутся точки, отстоящие от математического ожидания на целое число стандартных отклонений (обычно σ , 2σ , 3σ ). Приведем значения вероятности попадания нормально распределенной величины в интервалы с такими границами.
Границы интервала | Вероятность |
- σ , + σ | 0,68269 |
-2σ , + 2σ | 0,95450 |
- 3σ , + 3σ | 0,99730 |
Функция НОРМСТРАСП
См. также НОРМРАСП, НОРМОБР, НОРМСТОБР, НОРМАЛИЗАЦИЯ.
Синтаксис
НОРМСТРАСП (z)
Результат;
Рассчитывает стандартное нормальное распределение.
Аргументы;
z: значение, для которого вычисляется стандартное нормальное распределение.
Математико-статистическая интерпретация;
См. описание функции НОРМРАСП.
Стандартное нормальное распределение представляет собой не что иное, как «обычное» нормальное распределение, у которого среднее равно нулю, а стандартное отклонение — единице.
Особое выделение функции стандартного нормального распределения связано с тем, что она используется при вычислении нормальных функций с другими значениями и σ (отличными от 0 и 1 соответственно). Практически во всех учебниках по теории вероятностей и теории статистики приведены таблицы для функции стандартного нормального распределения.
Например, формула =НОРМСТРАСП((42—40)/1,5) рассчитает значение 0,90879, такое же, как и формула =НОРМРАСП(42;40;1,5;1) (см. описание функции НОРМРАСП).
Функция НОРМСТОБР
См. также НОРМРАСП, НОРМОБР, НОРМСТРАСП, НОРМАЛИЗАЦИЯ.
Синтаксис;
НОРМСТОБР (вероятность)
Результат;
Рассчитывает обратное стандартное нормальное распределение.
Аргументы;
вероятность; вероятность, соответствующая нормальному распределению.
Математико-статистическая интерпретация;
См. описание функций НОРМСТРАСП, НОРМОБР
Функция обратного стандартного нормального распределения используется в ситуациях, когда известна вероятность определенного значения случайной величины и необходимо рассчитать это значение.
Например, формула =НОРМСТОБР(0,69146) вычисляет значение 0,5 (сравните с формулой =НОРМСТРАСП(0,5), рассчитывающей значение 0,69146). Кроме того, формула =НОРМСТОБР (0,69146) может быть заменена формулой =НОРМОБР(0,69146; 0;1), также рассчитывающей значение 0,5 (см. описание функции НОРМОБР).
Функция НОРМАЛИЗАЦИЯ
См. также НОРМРАСП, НОРМОБР, НОРМСТРАСП, НОРМСТОБР ДОВЕРИТ.
Синтаксис;
НОРМАЛИЗАЦИЯ (х; среднее; стандартное откл)
Результат;
Рассчитывает нормализованное значение для нормального распределения.
Аргументы;
х: нормализуемое значение;
среднее: средняя арифметическая распределения;
стандартное откл: стандартное отклонение распределения.
Математико-статистическая интерпретация;
Нормализация (нормирование) заключается в переходе от случайной величины х с математическим ожиданием и дисперсией σ2 к нормированной величине
t =
получаемой в результате деления центрированной случайной величины х - на стандартное отклонение σ. Величину t называют нормированной или стандартизованной случайной величиной, которая самостоятельно не применяется, а входит составной частью в выражение интегральной функции нормального распределения (см. описание функции НОРМРАСП).
Функцию НОРМАЛИЗАЦИЯ удобно использовать в качестве аргумента функции НОРМСТРАСП.
Например, формула =НОРМСТРАСП(НОРМАЛИЗАЦИЯ (42;40;1,5)) рассчитывает значение 0,90879, такое же как и формулы =НОРМСТРАСП((42-40)/1,5) и =НОРМРАСП(42;40;1,5;1) (см. описание функций НОРМСТРАСП и НОРМРАСП).
Функция ДОВЕРИТ
См. также НОРМАЛИЗАЦИЯ, НОРМОБР НОРМРАСП, НОРМСТОБР, НОРМСТРАСП, ZTECT.
Синтаксис;
ДОВЕРИТ (альфа; станд откл; размер)
Результат;
Рассчитывает значение предельной ошибки выборки.
Аргументы;
альфа: уровень значимости, используемый для вычисления уровня надежности. Уровень надежности равняется 100 (1—альфа) % (например, альфа, равное 0,05, означает 95%-ный уровень надежности).
станд. откл: стандартное отклонение генеральной совокупности для интервала данных, предполагается известным;
размер: размер выборки.
Математико-статистическая интерпретация;
Одна из основных задач выборочного исследования состоит в том, чтобы на основе характеристик выборочной совокупности получить достоверные суждения об этих характеристиках в генеральной совокупности. Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются разностью между значением характеристики в генеральной совокупности и ее значением, вычисленным по результатам выборочного наблюдения. Для средней арифметической это расхождение определяется по формуле
Зная выборочную среднюю величину признака ( ) и предельную ошибку выборки ( ), можно определить границы, в которых заключена генеральная средняя :
- +
Интервал - ; + получил название доверительного интервала.
Вероятность того, что случайный интервал ( - ; + ) содержит в себе достоверную, но не известную наблюдателю характеристику , получила название доверительной вероятности γ. Иногда говорят, что вероятность γ характеризует надежность статистической оценки , и наряду с термином «доверительная вероятность применяют для γ термин «надежность».
Примечание. Необходимо отметить, что в качестве аргумента функции ДОВЕРИТ используется не доверительная вероятность γ, а уровень значимости α = 1 — γ, откуда γ =1-α.
Предельная ошибка выборки связана со средней ошибкой выборки следующим соотношением:
= t
где t — коэффициент доверия (определяется в зависимости от того, с какой доверительной вероятностью нужно гарантировать результаты выборочного обследования).
Известный русский математик А. М. Ляпунов дал выражение конкретных значений множителя t для различных значений доверительной вероятности γ в виде функции
Ф(t) = Р{ =
На практике пользуются готовыми таблицами этой функции, которые приведены практически в каждом учебнике по теории вероятностей или теории статистики.
В Microsoft Excel для нахождения значения доверительной вероятности γ (значения функции Ф (t)) можно использовать формулу =2НОРМСТРАСП(t)- 1, а для нахождения значения коэффициента доверия t — формулу =НОРМСТОБР((γ+1)/2) (см. описание функции НОРМАЛИЗАЦИЯ, НОРМРАСП, НОРМОБР, НОРМСТРАСП, НОРМСТОБР).
Применение функции ДОВЕРИТ для решения практических задач рассмотрим на следующем примере.
Пример 6.3. В результате выборочного обследования жилищных условий жителей города, осуществленного на основе собственно-случайной повторной выборки, получен следующий ряд распределения (табл. 6.3). Требуется с уровнем надежности 95% определить границы интервала, в который попадет средний размер общей площади.
Табл.6.3
Общая площадь, приходящаяся на 1 чел., м2 | До 5 | 5-10 | 10-15 | 15-20 | 20-25 | 25-30 | 30 и более |
Число жителей |
Рассмотрим решение задачи в среде Microsoft Excel (табл. 6.4).
Табл. 6.4
В табл. 6.4 приведены два варианта решения задачи. Первый вариант основан на последовательном применении рассмотренных выше формул для нахождения предельной ошибки выборки . Во втором варианте (более быстром) используется функция ДОВЕРИТ.
Содержимое ячеек в табл. 6.4:
массивы В3:В9 и D3:D9 содержат исходные данные задачи;
массив С3:С9 содержит середины рассматриваемых интервалов;
ячейка D10 содержит формулу =СУММ(D3:D9) — рассчитывается размер выборочной совокупности n.
ячейка D11 содержит формулу =СУММПРОИЗВ(С3:С9;D3:D9)/D10 — определяется значение выборочной средней ;
ячейка D12 содержит формулу =(СУММПРОИЗВ(Е3:Е9;D3:D9)/D10))*D10/(D10-1) — вычисляется значение генеральной дисперсии σ 2ГЕН
ячейка D13 содержит формулу =KOPEHЬ(D12) — рассчитывается значение стандартного отклонения σ ГЕН для генеральной совокупности;
ячейка D14 содержит формулу =D13/KOPEHЬ(D10) — определяется значение средней ошибки выборки ;
ячейка D15 содержит формулу =НОРМСТОБР((0,95+1)/2) — вычисляется значение коэффициента доверия t для уровня надежности 95 %;
ячейка D16 содержит формулу =D15*D14 — рассчитывается значение предельной ошибки выборки ;
ячейка D17 содержит формулу =D11-D16 — определяется нижняя граница генеральной средней - ;
ячейка D18 содержит формулу =D11+D16 — рассчитывается верхняя граница генеральной средней + ;
ячейка D19 содержит формулу =ДОВЕРИТ(0,05;D13; D10), демонстрирующую альтернативный вариант нахождения предельной ошибки выборки.
Таким образом, на основании проведенного выборочного обследования с уровнем надежности 95 % можно предположить, что средний размер обшей площади, приходящейся на 1 человека, в целом по городу лежит в пределах от 18,56 до 19,45 м.
Перечислим другие непрерывные распределения, реализованные в среде Microsoft Excel:
Функции гамма-распределения;
Функции бета-распределения
Функции логарифмического нормального распределения
Функции экспоненциального распределения
Функция распределения Вейбулла
Функции χ 2 – распределения (распределения Пирсона)
Функции F-распределения (Фишера)