Подбор подходящего теоретического распределения

Критерии согласия

Для подбора подходящего теоретического распределения пре­жде всего следует построить экспериментальную кривую плот­ности распределения, после чего визуально выбрать похожую кривую из известных типов теоретических распределений. При построении экспериментальной кривой данные ран­жируют в порядке возрастания, разбивают на группы, строят гистограмму, а по ней - экспериментальную кривую. Разумеет­ся, что при наличии оснований отдать предпочтение тому или иному теоретическому закону распределения необходимость в построении экспериментальной кривой отпадает.

Выбрав тип предполагаемого теоретического распределения, выдвигают нулевую гипотезу о взаимном соответствии теорети­ческого и экспериментального распределений, проверяют ее на заданном уровне значимости, используя критерии согласия.

При больших выборках (n >100) предпочтение следует отда­вать критерию согласия Пирсона. Иногда этот критерий исполь­зуют при существенно меньших выборках. Критерий Колмого­рова— Смирнова дает хорошие результаты при n>30 и удов­летворительные при 100 > n >10. При n<10 лучшие результаты дает критерий Крамера - фон Мизеса. Эти рекомендации весьма приблизительны, так как каждый из критериев имеет свои сильные и слабые стороны, и от­носительно выбора между ними можно дать лишь самые общие указания.

Критерий Пирсона(хи-квадрат) применим только к сгруп­пированным данным. Рекомендуется, чтобы численность каждой группы (интервала) была не меньше 5. Если это не так, то смежные малочисленные группы следует объединять с сосед­ними.

Разбив исходные данные на т интервалов (групп), для каж­дого интервала вычисляют:

экспериментальные частоты рi* = ni /n, где ni - количество дан­ных, попавших в i-й интервал, п - общее количество данных (объем выборки);

теоретические частоты Подбор подходящего теоретического распределения - student2.ru , найденные по таб­лицам или формулам для выбранного типа теоретического рас­пределения; экспериментальную величину

Подбор подходящего теоретического распределения - student2.ru (1.54)

По таблицам квантилей распределения χ2 при заданном уровне значимости β (обычно 5%) и известном числе степеней свободы f находят теоретическое значение χ2. Число степеней свободы f равно количеству интервалов минус число независимых условий (связей), наложенных на эксперименталь­ные частоты рi*. Примерами таких условий могут быть: равенст­во 1 суммы всех частот (такое условие накладывается всегда), совпадение статистического среднего с гипотетическим, совпаде­ние дисперсий и т. п. Следовательно f=т–1-r, где т - число интервалов, 1 - отмеченное выше условие, r -число парамет­ров, определяемых из опытных данных. Так, если предполага­емое распределение нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклоне­ние), поэтому f=т-1-r=т-1-2=т-3; при распределении по закону Пуассона, содержащему лишь один параметр λ, будем иметь r=1, поэтому f=т-1-2 =т—2. Если дополнительные условия (кроме первого) не наложены, то f = m -1.

При выполнении условия

Подбор подходящего теоретического распределения - student2.ru (1.55)

считается, что при заданном уровне значимости (β=5%) функция распределения согласуется с экспериментальными данными.

Более жесткие требования по уровню значимости следует выдвигать с осторожностью. Увеличение доверительной вероят­ности уменьшает вероятность того, что незначимое различие будет принято за значимое и правильная функция будет отверг­нута. Однако это увеличивает вероятность того, что значимое различие будет принято за незначимое.

Во избежание возможных ошибок первого и второго рода, в особенности, если согласование теоретических и эмпирических частот «слишком хорошее», следует проявлять осторожность. Например, можно повторить опыт, увеличив число наблюдений, воспользоваться другим критерием согласия, вычислить асим­метрию и эксцесс и сопоставить их с известными для данного распределения.

Критерий Колмогорова - Смирноваопределяется разностью максимальных абсолютных значений статистической функции распределения F* (х) и соответствующей теоретической функции распределения F(x), т. е.

Подбор подходящего теоретического распределения - student2.ru (1.56)

Смирновым Н. В., а затем Колмо­горовым А. Н. было доказано, что ка­кой бы вид ни имела функция F(х), при неограниченном возрастании чи­сла независимых наблюдений п веро­ятность неравенства

Подбор подходящего теоретического распределения - student2.ru (1.57)

стремится к пределу

Подбор подходящего теоретического распределения - student2.ru (1.58)

Для практического использования критерия составлена табли­ца квантилей, определенных из соотношения k (λа)=α, где функция распределения записана в несколько ином виде:

Подбор подходящего теоретического распределения - student2.ru

Схема применения критерия Колмогорова — Смирнова сле­дующая.

По результатам п наблюдений строится (рис.1.18) статисти­ческая функция распределения F* (х).

Подбор подходящего теоретического распределения - student2.ru Подбор подходящего теоретического распределения - student2.ru

Рис. 1.18. К использова­нию критерия Колмого­рова

На том же графике наносится предполагаемая теоретическая функция распределения F(x).

Определяется максимальная величина модуля разности орди­нат D и вычисляется величина λ=D Подбор подходящего теоретического распределения - student2.ru .

С помощью таблицы по заданному уровню значимости β (до­верительной вероятности α) находится значение λа. Если λ<λа, то теоретическое и экспериментальное распределения согласуются на заданном уровне значимости.

Планирование эксперимента

Планирование эксперимента позволяет оптимизировать тру­довые, временные и материальные затраты на проведение ис­следований, обеспечить их наиболее эффективное выполнение, а отсутствие соответствующего плана может существенно повы­сить трудоемкость исследований или сделать экспериментальную программу полностью безрезультатной.

Исторически теория планирования эксперимента начала раз­виваться с факторного планирования, основы которого зароди­лись еще в 30-х годах XXстолетия. Основы этой теории состоят в построении экономичных планов, по результатам эксперимен­тальных измерений в точках которых можно делать статистичес­кие выводы о неизвестных параметрах функций регрессии, при­чем делать это на основе четко формализованных процедур. Факторное планирование включает построение полных и дроб­ных факторных планов, ортогональных латинских квадратов и сбалансированных блок-схем. В отличие от классического экс­перимента, в котором влияние различных значений входных переменных на результаты исследования рассматривается по одно­му, при факторном планировании эти значения одновременно комбинируются в разных вариантах. Это позволяет дать более точные оценки неизвестных параметров регрессии при равном числе измерений [19].

К настоящему времени сложилась стройная теория планиро­вания эксперимента, оперирующая с достаточно сложным мате­матическим аппаратом, имеющая свою терминологию. Рассмотрим основные положения этой теории, позволя­ющие организовать процесс моделирования не очень сложных систем. При этом ограничимся рассмотрением двухуров­невых планов, в которых влияние на результат эксперимента каждой из входных переменных изучается на двух уровнях, т. е. при наименьшем и наибольшем значениях этой переменной в пределах исследуемой области. Двухуровневые планы в силу ряда преимуществ получили наибольшее распространение при факторном планировании эксперимента.

Поскольку математические методы планирования экспериме­нта основаны на кибернетическом подходе, наиболее подходящей моделью эксперимента является «черный ящик», для которого известно лишь то, что подается на его вход, и то, что получается на выходе, а устройство этого ящика значения не имеет. Соответ­ственно мы будем иметь два типа переменных (входных и выход­ных), которые называют факторами и откликами. Для выясне­ния различий между ними рассмотрим простой эксперимент, в котором рассматриваются лишь две переменные х и у и целью которого является ответ на вопрос: как при изменении х будет изменяться y?В этом случае х - фактор, а у - отклик. В лите­ратуре встречаются другие термины: для фактора - режим, не­зависимая переменная, входная переменная, экзогенная перемен­ная; для отклика - реакция, выход, зависимая переменная, пере­менная состояния, эндогенная переменная. Подобная терминоло­гия возникла в связи с тем, что первые исследования с применени­ем статистических экспериментов проводились в сельском хозяй­стве, биологии, а затем стремительно вторгались в другие ниши, пополняясь там терминами, наиболее близкими и понятными читателям.

Каждый фактор хi может принимать в эксперименте одно из нескольких значений, называемых уровнями. Каждому уровню соответствует определенная точка в многомерном пространстве, а множество таких точек образует поверхность отклика. На рис.1.19 показана поверхность отклика для двухфакторного экспери­мента. Факторами являются переменные х1 и х2. В точках 1, 2, 3, 4 эти факторы принимают определенные значения, которым отвечают соответствующие точки на поверхности отклика.

Подбор подходящего теоретического распределения - student2.ru

Рис. 1.19. Поверхность отклика.

Подбор подходящего теоретического распределения - student2.ru (1.59)

Конфигурация поверхности отклика, следовательно, функция (1.59) не известна. Целью эксперимента является либо описание этой поверхности (хотя бы приближенное) в интересной для исследо­вателя области варьирования факторов, либо определение экст­ремального значения отклика. Вторая задача может быть сведена к пошаговому выполнению первой, поэтому на начальном этапе нас будет интересовать только поиск аналитического выражения, близкого к искомой функции (1.59) в заданной области. Этот поиск осуществляют на основе обработки экспериментальных данных в точках 1, 2, 3, 4 (см. рис. 1.19) факторного пространства.

Наши рекомендации