Законы распределения вероятностей
Примеры законов распределения:
1.. Нормальный закон распределения-распределение Гаусса Содержат случайную оштбку в измерениях, малые отклонения от истинного результата встречаются в малом числе, а истинные результаты – в большом числе. Непрерывная случайная величина Х имеет нормальный закон распределения с параметрами и , если ее плотность вероятности имеет вид:
фи(Х)= (1 / дисп кв.корень из 2пи )*е в степени -(х-а)в кв /2 дисп. в кв.
2.. Распределение Стьюдента (t – распределение с n степенями свободы)
Пусть х и х2 – это независимые СП, при этом Х имеет норм.распределение, а х2 – распределение с n степенями свободы.
3.. Распределение Фишера (F-распределение) Пусть имеем две СВ распределенные по закону «хи квадрат» Х КВ (к1) и х в кв (К2) со степенями свободы и соответственно. Тогда следующая случайная переменная:
Ф(к1,к2)=х в кв(К1)/к1 / х в кв (к2)/к2 называется СВ с F- распределением (т.е. распределением Фишера) с и степенями свободы (обозначают также через ) .
4.. Равномерное распределение.
Ф(х)= сиситема 1)к,0 или = х,где к=конст, 2)0,во всех ост.случаях
5. Распределение (хи-квадрат) с n степенями свободы – распределение Пирсона
Распределение с n степенями свободы называется распределение суммы квадратов n независимых СВ, распределенных по стандартному нормальному закону:
Х в кв с инд н=сумма зэт в кв итый , где зэт=Н(0,1) .
Число степеней свободы функций (т.е. число ).
Интервал показаний совокупных переменных, для симметричного интервала .
Закон распределения вероятностей позволяет определить две другие важные характеристики совокуп.переменных, а именно матем.ожидание и дисперсию.
14.. Метод наименьших квадратов.
Регрессионное уравнение, разрешённое относительно исследуемой переменной у при наличии одной факторной переменной x, в общем виде записывается как:ур=ф(х) ,
Если f(x) является линейной функцией, то мы имеем общий вид модели парной линейной регрессии:у р=а+ б*х ,
где a – постоянная величина (или свободный член уравнения), b – коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны наблюдения. Фактическое значение исследуемой переменной y тогда может быть представлено в виде:у=а+б*х+эпселент,
где ? – разность между фактическим значением (результатом наблюдения) и значением, рассчитанным по уравнению модели. Если модель адекватно описывает исследуемый процесс, то ? – независимая нормально распределённая случайная величина с нулевым математическим ожиданием (М? = 0) и постоянной дисперсией (D? = ?2). Наличие случайной компоненты ? отражает тот факт, что присутствуют другие факторы, влияющие на исследуемую переменную и не учтённые в модели.
Для оценки параметров a и b линейной парной регрессии с использованием имеющегося набора результатов наблюдений наиболее часто используют метод наименьших квадратов (МНК), который минимизирует сумму квадратов ?i - отклонения результатов наблюдений yi от рассчитанных по линейной модели (2.3) значений yрi:
б=(сумма [(хитый - хср)*(у итый-у ср)]/ сумма (хитый- хср)в кв. (а=уср-б*х ср). Такое решение может существовать только при выполнении условия сумма (х итый - х ср) в кв не равно о,то есть когда не все наблюдения проводились при одном и том же значении факторной переменной (сумма квадратов равна нулю, если каждое слагаемое равно нулю).
Метод оценки д.б. такими чтобы получить «хорошие» оценки. Метод используемый чаще других для нахождения параметров регрессионного уравнения и известный как метод наименьших квадратов (МНК), при расчете параметров линии с помощью этого метода минимизируются суммы квадратов значений ошибок .
Метод наименьших квадратов — один из методов регрессионного анализа для оценки неизвестных величин по результатам измерений, содержащим случайные ошибки.
Метод наименьших квадратов применяется также для приближённого представления заданной функции другими (более простыми) функциями и часто оказывается полезным при обработке наблюдений.
Когда искомая величина может быть измерена непосредственно, как, например, длина отрезка или угол, то, для увеличения точности, измерение производится много раз, и за окончательный результат берут арифметическое среднее из всех отдельных измерений. Это правило арифметической середины основывается на соображениях теории вероятностей; легко показать, что сумма квадратов уклонений отдельных измерений от арифметической середины будет меньше, чем сумма квадратов уклонений отдельных измерений от какой бы то ни было другой величины. Само правило арифметической середины представляет, следовательно, простейший случай метода наименьших квадратов.
Пусть дано решить систему уравнений
a1x + b1y + c1z + … + n1 = 0
a2x + b2y + c2z + … + n2 = 0 (1)
a3x + b3y + c3z + … + n3 = 0
15. Регрессионные модели. Однофакторное регрессионное уравнение.
Регрессионное уравнение, разрешённое относительно исследуемой переменной у при наличии одной факторной переменной x, в общем виде записывается как:Ур=ф(х), Если f(x) является линейной функцией, то мы имеем общий вид модели парной линейной регрессии: ,
где a – постоянная величина (или свободный член уравнения), b – коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны наблюдения. Фактическое значение исследуемой переменной y тогда может быть представлено в виде
:у=а+в*х+эпселент,
Регрессионный анализ своей целью имеет вывод, определение (идентификацию) уравнения регрессии , включая статистическую оценку его параметров. Уравнение регрессии позволяет найти значение зависимой переменной, если величина независимой или независимых переменных известна.
Практически, речь идет о том, чтобы, анализируя множество точек на графике (т.е. множество статистических данных), найти линию, по возможности точно отражающую заключенную в этом множестве закономерность (тренд, тенденцию), линию регрессии.
По числу факторов различают одно-, двух- и многофакторные уравнения регрессии .
По характеру связи однофакторные уравнения регрессии подразделяются:
а) на линейные: у=а+вх, где x экзогенная (независимая) переменная, y эндогенная (зависимая, результативная) переменная, a , b параметры;
б) степенные: у=а*х в ст б,
в)показательные: у=а*б в ст х, г)прочие
Смысл регрессионного анализа – построение функциональных зависимостей между двумя группами переменных величин Х1, Х2, … Хр и Y. При этом речь идет о влиянии переменных Х (это будут аргументы функций) на значения переменной Y (значение функции). Переменные Х мы будем называть факторами, а Y – откликом.
Сегодня мы разберем наиболее простой случай – установление зависимости одного отклика y от одного фактора х. Такой случай называется парной (простой) регрессией/
В общем виде однофакторное регрессионное уравнение можно записать в виде:
М(у/х)=f(х), где левая часть – это условие математического ожидания переменной у при заданном значении переменной х. Частный случай однофакторного РУ является линейная модель зависимость которой записывается следующим образом ,
У – зависимая переменная. Х – независимая переменная, а –свободный член регрессии (постоянное число), в –коэффициент регрессии, показывает наклон линии, - ошибка или случайная компонента.