Возможно использование электронных бланков

При этом к минусам электронной формы контрольного листка по сравнению с бумажной можно отнести:

- большую сложность для использования;

- необходимость тратить больше времени на внесение данных.

К плюсам:

- удобство обработки и анализа данных;

- высокая скорость получения необходимой информации;

- возможность одновременного доступа к информации множества людей.

Однако большинство собираемых данных приходится дублировать в бумажном виде. Проблема в том, что это ведет к снижению производительности: время, которое экономится на проведение анализа, хранение и получение необходимой информации большей частью нивелируется за счет двойной работы по регистрации данных.

Гистограмма– инструмент, который позволяет наглядно изобразить и легко выявить структуру и характер изменения полученных данных (оценить распределение), которые трудно заметить при их табличном представлении.

Проведя анализ формы полученной гистограммы и ее местоположения относительно интервала допуска можно сделать заключение о качестве рассматриваемой продукции или состоянии изучаемого процесса. На основе заключения вырабатываются меры по устранению отклонений качества продукции или состояния процесса от нормы.

В зависимости от способа представления (сбора) исходных данных, методика построения гистограммы разбивается на 2 варианта:

I вариантДля сбора статистических данных разрабатываются контрольные листки показателей продукции или процесса. При разработке бланка контрольных листков необходимо сразу определиться с количеством и размером интервалов, в соответствии с которыми будет производиться сбор данных, на основе которых в свою очередь будет построена гистограмма. Это необходимо в связи с тем, что после заполнения контрольного листка пересчитать значения показателя для других интервалов будет практически невозможно. Максимум, что можно будет сделать – не учитывать интервалы, в которые не попало ни одно значение и объединять по 2, 3 и т.д. интервала, не боясь исказить данные. Как вы понимаете при таких ограничениях, к примеру, из 11 интервалов сделать 7 практически невозможно.

Методика построения:

1. Определите количество и ширину интервалов для контрольного листка.

Точное количество и ширину интервалов стоит выбирать исходя из удобства использования или по правилам статистики. Если для измеряемого показателя существуют допуски, то стоит ориентироваться на 6-12 интервалов внутри допуска и 2-3 интервала за пределами допуска. Если допусков нет, то оцениваем возможный разброс значений показателя и тоже делим на 6-12 интервалов. При этом ширина интервалов обязательно должна быть одинаковой.

2. Разработайте контрольные листки и с их помощью произведите сбор необходимых данных.

3. С помощью заполненных контрольных листков подсчитайте частоту попадания (т.е. сколько раз) полученных значений показателя в каждый интервал.

Обычно для этого выделяют отдельный столбец, расположенный в конце таблицы регистрации данных.

Если значение показателя точно соответствует границе интервала, то добавьте по половинке обоим интервалам на границу которых попало значение показателя.

4. Для построения гистограммы используйте только те интервалы, в которые попало хотя бы одно значение показателя.

Если между интервалами, в которые попали значения показателя, имеются пустые интервалы, то их тоже нужно построить на гистограмме.

5. Вычислите среднее значение результатов наблюдения.

На гистограмму необходимо нанести среднее арифметическое значение полученной выборки.

Стандартная формула, используемая для вычислений:

Возможно использование электронных бланков - student2.ru

где xi – полученные значения показателя,

N – общее количество полученных данных в выборке.

Каким образом ею воспользоваться, если нет точных значений показателя x1, x2 и т.д. нигде не объясняется. В нашем случае для приблизительной оценки среднего арифметического могу предложить воспользоваться собственной методикой:

а) определите среднее значение для каждого интервала по формуле:

Возможно использование электронных бланков - student2.ru

где j – интервалы, выбранные для построения гистограммы,

xj max – значение верхней границы интервала,

xj min – значение нижней границы интервала.

б) определите среднее арифметическое выборки по формуле:

Возможно использование электронных бланков - student2.ru

где n – количество выбранных интервалов для построения гистограммы,

vj – частота попадания результатов выборки в интервал.

6. Постройте горизонтальную и вертикальную оси.

7. На горизонтальную ось нанесите границы выбранных интервалов.

Для удобства восприятия рекомендуется перед первым и после последнего интервалов оставить место размером не менее одного интервала. Также необходимо предусмотреть место для нанесения границ допуска, если он есть.

Если в дальнейшем планируется сравнивать гистограммы, описывающие похожие факторы или характеристики, то стоит при нанесении шкалы на ось абсцисс руководствоваться не интервалами, а единицами измерения данных.

8. На вертикальную ось нанесите шкалу значений в соответствии с выбранным масштабом и диапазоном.

9. Для каждого выбранного интервала постройте столбик, ширина которого равна интервалу, а высота равна частоте попадания результатов наблюдений в соответствующий интервал (частота уже подсчитана ранее).

Нанесите на график линию, соответствующую среднему арифметическому значению исследуемого показателя. При наличии поля допуска постройте линии, соответствующие границам и центру интервала допуска.

II вариантСтатистические данные уже собраны (например, проставлены в журналах регистрации) или их предполагается собрать в виде точно измеренных значений. В связи с этим мы не ограничены никакими начальными условиями, поэтому можем выбирать, а также в любой момент изменять количество и ширину интервалов в соответствии с текущими потребностями.

Методика построения:

1. Полученные данные сведите в один документ в удобном для дальнейшей обработки виде (например, в виде таблицы).

2. Вычислите диапазон значений показателя (выборочный размах) по формуле:

Возможно использование электронных бланков - student2.ru

где xmax – наибольшее полученное значение,

xmin – наименьшее полученное значении.

3. Определите количество интервалов гистограммы.

Для этого можно воспользоваться таблицей, рассчитанной на основе формулы Стерджесса:

Возможно использование электронных бланков - student2.ru

Возможно использование электронных бланков - student2.ru

Можно также воспользоваться таблицей, рассчитанной на основе формулы:

Возможно использование электронных бланков - student2.ru

Возможно использование электронных бланков - student2.ru

4. Определите ширину (размер) интервалов по формуле:

Возможно использование электронных бланков - student2.ru

5. Округлите полученный результат в большую сторону до удобного значения.

Обратите внимание, что вся выборка должна быть разделена на интервалы одинакового размера.

6. Определите границы интервалов. Сначала определите нижнюю границу первого интервала таким образом, чтобы она была меньше xmin. К ней прибавьте ширину интервала, чтобы получить границу между первым и вторым интервалами. Далее продолжайте прибавлять ширину интервала (Н) к предыдущему значению для получения второй границы, затем третьей и т. д.

После произведенных действий следует удостовериться, что верхняя граница последнего интервала больше xmax.

7. Для выбранных интервалов подсчитайте частоты попадания значений исследуемого показателя в каждый интервал.

Если значение показателя точно соответствует границе интервала, то добавьте по половинке обоим интервалам, на границу которых попало значение показателя.

8. Вычислите среднее значение исследуемого показателя по формуле:

Возможно использование электронных бланков - student2.ru

Следуйте порядку построения гистограммы, начиная с п.5, приведенной выше методики для I варианта.

Анализ гистограммы также разбивается на 2 варианта, в зависимости от наличия технологического допуска.

I вариант Допуски для показателя не заданы. В этом случае производим анализ формы гистограммы:

Обычная (симметричная, колоколообразная) форма. Среднее значение гистограммы соответствует середине размаха данных. Максимальная частота также приходится на середину и постепенно уменьшается к обоим концам. Форма симметричная.

Возможно использование электронных бланков - student2.ru

Такая форма гистограммы встречается наиболее часто. Она свидетельствует о стабильности процесса.

Отрицательно скошенное распределение (положительно скошенное распределение). Среднее значение гистограммы располагается правее (левее) середины размаха данных. Частоты резко уменьшаются при движении от центра гистограммы вправо (влево) и медленно влево (вправо). Форма ассиметричная.

Возможно использование электронных бланков - student2.ru

Такая форма образуется либо, если верхняя (нижняя) граница регулируется теоретически или по значению допуска либо, если правое (левое) значение невозможно достигнуть.

Распределение с обрывом справа (распределение с обрывом слева). Среднее значение гистограммы располагается далеко правее (левее) середины размаха данных. Частоты очень резко уменьшаются при движении от центра гистограммы вправо (влево) и медленно влево (вправо). Форма ассиметричная.

Возможно использование электронных бланков - student2.ru

Такая форма часто встречается в ситуации 100 %-го контроля изделий по причине плохой воспроизводимости процесса.

Гребенка (мультимодальный тип). Интервалы через один или два обладают более низкими (высокими) частотами.

Возможно использование электронных бланков - student2.ru

Такая форма образуется либо, если количество единичных наблюдений, входящих в интервал, колеблется от интервала к интервалу либо, если применяется определенное правило округления данных.

Гистограмма, не имеющая высокой центральной части (плато). Частоты в середине гистограммы примерно одинаковые (для плато все частоты примерно равны).

Возможно использование электронных бланков - student2.ru

Такая форма встречается, если объединяется несколько распределений со средними значениями близко расположенными друг к другу. Для дальнейшего анализа рекомендуется применить метод стратификации.

Двухпиковый тип (бимодальный тип). В окрестностях середины гистограммы частота низкая, но с каждой стороны есть по пику частот.

Возможно использование электронных бланков - student2.ru

Данная форма встречается, если объединяется два распределения со средними значениями, далеко отстоящими друг от друга. Для дальнейшего анализа рекомендуется применить метод стратификации.

Гистограмма с провалом (с «вырванным зубом»). Форма гистограммы близка к распределению обычного типа, но есть интервал с частотой ниже, чем в обоих соседних интервалах.

Возможно использование электронных бланков - student2.ru

Данная форма встречается, если ширина интервала не кратна единице измерения, если неправильно считаны показания шкалы и др.

Распределение с изолированным пиком. Совместно с обычной формой гистограммы появляется небольшой изолированный пик.

Возможно использование электронных бланков - student2.ru

Такая форма образуется при включении небольшого количества данных из другого распределения, например, если нарушена управляемость процесса, произошли ошибки при измерении или произошло включение данных из другого процесса.

II вариант. Для исследуемого показателя существует технологический допуск. В этом случае производится анализ, как формы гистограммы, так и ее расположение по отношению к полю допуска. Возможны варианты:

Гистограмма имеет вид обычного распределения. Среднее значение гистограммы совпадает с центром поля допуска. Ширина гистограммы меньше ширины поля допуска с запасом.

Возможно использование электронных бланков - student2.ru

В данной ситуации процесс не нуждается в корректировке.

Гистограмма имеет вид обычного распределения. Среднее значение гистограммы совпадает с центром поля допуска. Ширина гистограммы равна ширине интервала допуска, в связи с чем возникают опасения появления некондиционных деталей как со стороны верхнего, так и со стороны нижнего полей допуска.

Возможно использование электронных бланков - student2.ru

В этом случае необходимо либо рассмотреть возможность изменения технологического процесса с целью уменьшения ширины гистограммы (например, увеличение точности оборудования, использование более качественных материалов, изменение условий обработки изделий и т.д.) либо расширить поле допуска, т.к. требования к качеству деталей в данном случае трудновыполнимы.

Гистограмма имеет вид обычного распределения. Среднее значение гистограммы совпадает с центром поля допуска. Ширина гистограммы больше ширины интервала допуска, в связи с чем обнаруживаются некондиционные детали как со стороны верхнего, так и со стороны нижнего полей допуска.

Возможно использование электронных бланков - student2.ru

В этом случае необходимо реализовать меры, описанные в пункте 2.

Гистограмма имеет вид обычного распределения. Ширина гистограммы меньше ширины поля допуска с запасом. Среднее значение гистограммы сдвинуто влево (вправо) относительно центра интервала допуска, в связи с чем имеются опасения, что могут находится некондиционные детали со стороны нижней (верхней) границы поля допуска.

Возможно использование электронных бланков - student2.ru

В данной ситуации необходимо проверить, не вносят ли систематическую ошибку применяемые средства измерения. Если средства измерения исправны, следует отрегулировать процесс таким образом, чтобы центр гистограммы совпал с центром поля допуска.

Гистограмма имеет вид обычного распределения. Ширина гистограммы примерно равна ширине поля допуска. Среднее значение гистограммы сдвинуто влево (вправо) относительно центра интервала допуска, причем один или несколько интервалов выходят за границу поля допуска, что свидетельствует о наличии дефектных деталей.

Возможно использование электронных бланков - student2.ru

В этом случае первоначально необходимо отрегулировать технологические операции таким образом, чтобы центр гистограммы совпадал с центром поля допуска. После этого нужно принять меры для уменьшения размаха гистограммы или увеличения размера интервала допуска.

Центр гистограммы смещен к верхнему (нижнему) пределу допуска, причем правая (левая) сторона гистограммы рядом с верхней (нижней) границей допуска имеет резкий обрыв.

Возможно использование электронных бланков - student2.ru

В этом случае можно сделать вывод, что изделия со значением показателя, выходящим за пределы поля допуска, исключили из партии или умышленно распределили как годные, для включения в пределы допуска. Следовательно, необходимо выявить причину, которая привела к появлению данного явления.

Центр гистограммы смещен к верхнему (нижнему) пределу допуска, причем правая (левая) сторона гистограммы рядом с верхней (нижней) границей допуска имеет резкий обрыв. Кроме того один или несколько интервалов выходят за границы поля допуска.

Возможно использование электронных бланков - student2.ru

Случай аналогичен 6., но интервалы гистограммы, выходящие за границы поля допуска указывают на то, что измерительное средство было неисправно. В связи с эти необходимо провести поверку средств измерения, а также провести повторный инструктаж работникам по правилам выполнения измерений.

Гистограмма имеет два пика, хотя измерение значений показателя проводилось у изделий из одной партии.

Возможно использование электронных бланков - student2.ru

В этом случае можно сделать вывод, что изделия были получены в разных условиях (например, использовались материалы разных сортов, изменялась настройка оборудования, изделия производились на разных станках и т.д.). В связи с этим для дальнейшего анализа рекомендуется применить метод стратификации.

Основные характеристики гистограммы в порядке (соответствуют случаю 1.), при этом имеются дефектные изделия со значениями показателя, выходящими за пределы поля допуска, которые образуют обособленный «островок» (изолированный пик).

Возможно использование электронных бланков - student2.ru

Данная ситуация могла возникнуть в результате небрежности, при которой дефектные детали были перемешаны с доброкачественными. В этом случае необходимо выявить причины и обстоятельства, приводящие к возникновению данной ситуации, а также принять меры к их устранению.

Определение статистической гипотезы

Статистической называется гипотеза о предполагаемом виде неизвестного распределения или утверждение относительно значений одного или нескольких параметров известного распределения. Например, совокупность наблюдаемых значений распределена по закону Пуассона, математическое ожидание случайной величины равно – статистические гипотезы.

Гипотеза, которая подвергается проверке, называется нулевой и обозначается . Альтернативной гипотезой называется гипотеза, конкурирующая с нулевой, т. е. ей противоречащая. Простой называется гипотеза, содержащая только одно предположение. Сложная гипотеза состоит из конечного или бесконечного числа простых гипотез.

Пример. Пусть проверяется гипотеза о равенстве некоторого параметра значению , т. е. гипотеза . В этом случае альтернативной гипотезой можно рассматривать одну из следующих гипотез: ; ; ; . Все приведенные гипотезы простые, и только – сложная гипотеза.

Выбор альтернативной гипотезы определяется формулировкой решаемой задачи. Причина выделения нулевой гипотезы состоит в том, что чаще всего такие гипотезы рассматриваются как утверждения, которые более ценны, если они опровергаются. Это основано на общем принципе, в соответствии с которым теория должна быть отвергнута, если есть противоречащий ей факт, но не обязательно должна быть принята, если противоречащих ей фактов на текущий момент нет.

Правило, по которому выносится решение принять или отклонить гипотезу , называется статистическим критерием. Проверка статистических гипотез осуществляется по результатам наблюдений (экспериментов, опытов), из которых формируют функцию результатов наблюдений, называемую проверочной статистикой. Таким образом, статистический критерий устанавливает, при каких значениях этой статистики проверяемая гипотеза принимается, а при каких она отвергается.

Пусть по независимым наблюдениям случайной величины получена некоторая оценка . Предположим, что есть основания считать истинное значение оцениваемого параметра равным некоторой величине . Однако даже если истинное значение параметра и равно , то оценка , скорее всего, не будет в точности равняться из-за статистической изменчивости, присущей . Поэтому возникает вопрос. Если предположить, что , то при каком отклонении от это предположение (гипотеза) должно быть опровергнуто как несостоятельное? Ответ на этот вопрос можно получить, вычислив вероятность любого значимого отклонения от , используя закон распределения случайной величины .

Если вероятность превышения разности и заданного уровня мала, то этот уровень следует считать значимым и гипотезу следует отвергнуть. Если вероятность превышения данной разности не является малой, то наличие этой разности можно отнести за счет обычной статистической изменчивости и гипотезу можно считать правдоподобной. Природа статистических выводов такова, что при отклонении гипотезы можно заранее оценить вероятность возможной ошибки (отклонения истинной гипотезы); напротив, если гипотеза принята, то это не означает, что она подтверждена с заданной вероятностью. Это лишь означает, что гипотеза согласуется с опытными данными, но возможно, что для другого эксперимента гипотеза будет отвергнута.

Приведенные рассуждения представляют собой простейший вид статистической процедуры, называемой проверкой гипотез. Предполагаем, что – несмещенная оценка параметра – имеет плотность распределения . Если гипотеза верна, то функция должна иметь среднее значение , как это показано на рис. 8.9.

Вероятность того, что величина не будет превышать нижнего уровня , равна

,

Область принятия
Область отклонения
Площадь равна a/2
Область отклонения
 
 
a0
aa/2
a1-a/2
Площадь равна a/2
Площадь равна 1- a
Рис. 8.9. Области принятия и отклонения при проверке гипотез

а вероятность того, что превзойдет верхнюю границу , составит

.

Таким образом, вероятность того, что выйдет за пределы интервала с границами и , составит . Величина выбирается настолько малой, чтобы попадание за пределы интервала, заключенного между и , было бы практически невозможным событием. Если в результате эксперимента величина выходит за пределы интервала , то в этом случае есть серьезные основания сомневаться в справедливости проверяемой гипотезы . В самом деле, если гипотеза верна, то значение будет маловероятным, и поэтому гипотезу о равенстве параметра величине следует отвергнуть. С другой стороны, если оценка попадает в интервал , то нет серьезных оснований подвергать сомнению справедливость проверяемой гипотезы , и гипотезу о равенстве следует принять.

загрузка...

Малое значение вероятности , используемое при проверке гипотезы, называется уровнем значимости критерия. Интервал значений , для которых гипотезу следует отвергнуть, называется областью отклонения гипотезы, иликритической областью. Интервал значений , при которых гипотезу следует принять, носит название области принятия гипотезы (см. рис. 8.9). Приведенный способ проверки гипотезы называется двусторонним критерием, так как если гипотеза верна, то величина может быть как больше, так и меньше . Необходимо проверять значимость расхождения между и с обеих сторон. В некоторых задачах может оказаться достаточно одностороннего критерия. Например, пусть гипотеза состоит том, что . В этом случае гипотеза будет ошибочной только тогда, когда , а критерий будет использовать только нижнюю границу плотности распределения .

Площадь равна β
a0
a0-d
 
a0+d
aα/2
a1-α/2
Площадь равна 1-β
Площадь равна 1-β
 
Рис. 8.10. Ошибка второго рода при проверке гипотезы

При проверке статистических гипотез возможны ошибки двух типов. Во-первых, гипотеза может быть отклонена, хотя в действительности она верна. Эта возможная ошибка называется ошибкой первого рода. Во-вторых, гипотеза принимается, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода. Как видно на рис. 8.9, ошибка первого рода происходит в том случае, когда при справедливости гипотезы попадает в область ее отклонения. Таким образом, вероятность ошибки первого рода равна , т. е. уровню значимости критерия.

Для того чтобы найти вероятность ошибки второго рода, следует определить каким-то образом величину отклонения истинного значения параметра от гипотетического значения параметра , которое требуется определить. Предполагается, что истинное значение параметра в действительности равно или (см. рис. 8.10). Если согласно гипотезе , а на самом деле , то вероятность того, что попадет в область принятия гипотезы , т. е. в интервал , составляет . Таким образом, вероятность ошибки второго рода равна при выявлении отклонения истинного значения параметра на от гипотетической величины .

Вероятность называется мощностью критерия. Понятно, что при заданном значении (объеме опытных данных) вероятность ошибки первого рода может быть сделана сколь угодно малой за счет уменьшения уровня значимости . Однако при этом растет вероятность – ошибка второго рода (уменьшается мощность критерия). Единственный способ уменьшить и , и состоит в увеличении объема выборки , используемой при вычислении . Исходя из этих соображений определяется объем необходимых опытных данных в статистических экспериментах.

Проверка гипотезы о равенстве статистических
средних значений

При проведении статистических экспериментов со случайными величинами самой различной природы большое внимание уделяется воспроизводимости результатов опытов при неоднократном повторении серии экспериментов. Часто возникает ситуация, когда среднее значение в одной серии опытов заметно отличается от величины этого параметра в другой серии. Естественно возникает вопрос, чем объяснить обнаруженное расхождение средних значений: либо случайными ошибками, либо это расхождение вызвано какими-то незамеченными или даже неизвестными ранее закономерностями.

Пусть над случайной величиной проводятся две серии опытов. Первая серия объемом испытаний: . Вторая серия экспериментов объемом испытаний: . При этом известно, что случайная величина распределена по нормальному закону с математическим ожиданием и дисперсией в первой серии опытов и параметрами и – во второй.

По экспериментальным данным получены статистические средние значения и . Необходимо проверить гипотезу при альтернативной гипотезе .

Для случая, когда дисперсии и известны, оценки и имеют нормальное распределение с параметрами и соответственно (см. 7.3 и 7.4). Так как случайные величины и независимы, то их разность тоже имеет нормальный закон распределения с параметрами и (нормальный закон устойчив к композиции).

Таким образом, случайная величина

,

которая является нормированной разностью оценок математических ожиданий, имеет нормальное распределение с нулевым математическим ожиданием и единичной дисперсией. Эта величина выбирается в качестве проверочной статистики.

Критическим для проверяемой гипотезы являются значения

,

где – квантиль порядка стандартного нормального распределения, т. е. значение гауссовой случайной величины, вероятность попасть правее которой равна (см. рис. 8.9).

Когда дисперсии и неизвестны, то сначала их необходимо оценить по экспериментальным данным. Пусть получены оценки и , которые незначительно отличаются друг от друга. В этом случае считается, что , и получают оценку так называемой "объединенной" дисперсии, используя результаты обеих серий опытов:

.

Случайная величина имеет распределение с степенями свободы. В качестве статистики для проверки гипотезы о равенстве математических ожиданий выбирается случайная величина

,

имеющая распределение Стьюдента с .

Критическими для проверяемой гипотезы являются значения

,

где – -процентная точка распределения Стьюдента с степенями свободы.

Пример. В двух сериях опытов над нормальной случайной величиной объемом соответственно и испытаний оценены математические ожидания и получено, что в первой серии , а во второй – . Дисперсия случайной величины известна: . Нужно при уровне значимости проверить нулевую гипотезу при альтернативной гипотезе .

Значение проверочной статистики равно

.

С использованием табл. 8.4 получаем, что . Так как , то нулевая гипотеза принимается, т. е. математические ожидания совпадают с уровнем значимости 0,1.

Если предположить, что дисперсия случайной величины неизвестна, то ее оценки по результатам обеих серий испытаний оказались равными: и . Кроме этого, предполагаем, что полученные оценки мало отличаются одна от другой, и поэтому вычисляем оценку объединенной дисперсии по формуле

,

а значение проверочной статистики

.

Используя таблицу процентных точек t-распределения Стьюдента (прил. 4), получаем

.

Так как и в этом случае , то гипотеза о равенстве математических ожиданий принимается.

Проверка гипотезы о равенстве двух дисперсий

Проверка гипотезы о равенстве дисперсий особенно важна в различных экспериментах над случайными величинами, поскольку знание дисперсии позволяет оценить степень рассеивания случайной величины и соответственно судить о точности и надежности результатов. Как и в предыдущей задаче, проводятся две серии опытов по и испытаний, а полученные экспериментальные данные имеют нормальное распределение с параметрами и соответственно. По опытным данным найдены несмещенные оценки и . Ставится задача определить, лежит ли различие между этими оценками в границах возможных случайных изменений, т. е. можно ли оба значения рассматривать как оценки дисперсии одной и той же случайной величины , имеющей нормальное распределение.

Таким образом, необходимо проверить гипотезу . В качестве альтернативной гипотезы выбирается гипотеза .

При сравнении дисперсий в качестве проверочной статистики выбирается случайная величина

. (8.26)

Распределение величины находим из условия, что при справедливости гипотезы дисперсии равны, т. е. . Поэтому перепишем выражение (8.26), учитывая (8.19) в виде

. (8.27)

Соотношение (8.27) не зависит от неизвестного параметра . Случайная величина имеет распределение Фишера илиF-распределение с и степенями свободы.

Критическими для проверяемой гипотезы являются значения:

; .

Для сокращения объема таблиц процентных точек распределения Фишера за значение принимается большая из полученных оценок дисперсии.

Пример. В двух сериях опытов над нормальной случайной величиной объемом соответственно и испытаний получены оценки дисперсии: ; . Необходимо проверить гипотезу о равенстве дисперсий при уровне значимости .

Величина проверочной статистики равна

.

По таблице процентных точек F-распределения Фишера находим критическое значение

.

Получили, что . Поэтому нулевая гипотеза о равенстве дисперсий принимается с уровнем значимости 0,1.

Критерий согласия

На практике часто возникает задача аппроксимации построенной гистограммы аналитическим выражением, представляющим собой некоторый теоретический закон распределения (плотности вероятности ). При этом стремятся к тому, чтобы такая аппроксимация была в определенном смысле наилучшей. Заметим, что любая аналитическая функция , с помощью которой аппроксимируется статистическое распределение, должна обладать основными свойствами плотности распределения:

.

Чтобы оценить, насколько хорошо выбранный теоретический закон распределения согласуется с экспериментальными данными, используются так называемые критерии согласия. Таких критериев существует несколько, но наиболее часто применяется критерий согласия , предложенный Пирсоном.

Критерий согласия является непараметрическим критерием проверки статистических гипотез в отличие от ранее рассмотренных критериев, которые являются параметрическими.

Пусть проведено независимых опытов, в каждом из которых случайная величина приняла определенное значение. Результаты опытов сведены в интервалов, и построены статистический ряд, выборочная функция распределения и гистограмма, т. е. экспериментальные данные описываются выборочным законом распределения . Необходимо проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина имеет выбранный теоретический закон распределения , который может быть задан функцией распределения или плотностью . Альтернативная гипотеза в этом случае – .

Знание теоретического закона распределения позволяет найти теоретические вероятности попадания случайной величины в каждый интервал ( , : .

Проверка согласованности теоретического и статистического распределений сводится к оценке расхождений между теоретическими вероятностями и полученными частотами . В качестве меры расхождения удобно выбрать сумму квадратов отклонений , взятых с некоторыми "весами" :

.

Смысл коэффициентов ("весов" интервалов) состоит в том, что отклонения, относящиеся к разным интервалам, нельзя считать одинаковыми по значимости. То есть одно и то же по абсолютной величине отклонение может быть мало значимым, если сама вероятность велика, и, наоборот, быть заметным, если эта вероятность мала. Естественно, веса выбирать по величине обратно пропорционально вероятностям .

Пирсон доказал, что если выбрать , то при больших закон распределения случайной величины практически не зависит от функции распределения и числа испытаний , а зависит только от числа разрядов и стремится к распределению .

Обозначив через меру расхождения , получаем

. (8.28)

Распределение зависит от параметра , называемого числом "степеней свободы". Для критерия согласия Пирсона , где – число интервалов, – число независимых условий ("связей"), накладываемых на частоты и параметры распределения. Так, при аппроксимации нормального распределения , а при исследовании распределения Пуассона .

Схема применения критерия для оценки согласованности теоретического и статистического распределения сводится к следующим процедурам (этапам):

1. На основании полученных экспериментальных данных рассчитываются значения частот в каждом из интервалов.

2. Вычисляются, исходя из теоретического распределения, вероятности попадания значений случайной величины в интервалы .

3. По формуле (8.28) рассчитывается значение .

4. Определяется число степеней свободы .

5. По таблице процентных значений распределения (прил. 3) определяется вероятность того, что случайная величина, имеющая распределение с степенями свободы превзойдет полученное на этапе 3 значение . Если эта вероятность мала, то гипотеза отбрасывается как неправдоподобная. Если же эта вероятность относительно велика, то гипотезу можно признать не противоречащей опытным данным.

Пример. Пусть случайная величина – значения напряжения на выходе генератора шума. Проверим, согласуются ли полученные данные с нормальным законом распределения.

Получено значений, при этом оценки математического ожидания и среднего квадратичного значения соответственно равны: . Для теоретического нормального распределения с полученными параметрами и вычисляем вероятности попадания в каждый из 10 интервалов по формуле

,

где – границы -го интервала, – функция Лапласа, таблица значений которой приведена в прил. 2.

Затем создается таблица, содержащая число попаданий в каждый разряд и соответствующие значения для .

Интервалы -10¸-8 -8¸-6 -6¸-4 -4¸-2 -2¸0 0¸2 2¸4 4¸6 6¸8 8¸10
                     
  2,25 10,32 32,75 72,36 110,94 118,12 88,34 44,84 15,98 3,95

По формуле (8.28) получаем

.

Так как число степеней свободы , то по таблице процентных точек распределения (прил. 3) находим, что . Поскольку для малой вероятность , следует признать: полученные экспериментальные данные противоречат <

Наши рекомендации