Вычисление параметров эмпирических распределений.

Точечное оценивание

Рассмотрение вопросов обработки экспериментальных данных начнем с простейшей ситуации, когда отклик регистрируется при фиксированных уровнях всех контролируемых факторов и при проведении опытов (в результате влия­ния неконтролируемых факторов) исследователь получает хотя и близкие, но отличные друг от друга результаты.

Пример 3.1.При производстве железнодорожных рельсов широкой колеи типа Р65 (по ГОСТ 18267-82) были получены следующие три значения твердо­сти НВ (по ГОСТ 9012-59) на поверхности катания головки одного и того же рельса (на обоих концах на расстоянии не более 1 м от торцов и в средней час­ти рельса): 351, 370 и 365.

Попытаемся найти ответ на вопрос - чему равна твердость на поверхно­сти катания данного рельса?

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

На первый взгляд решение поставленной задачи не вызывает никаких особых проблем, и начинающие исследователи, не особенно искушенные в об­ласти теории вероятностей и математической статистики, скорее всего ответят, что твердость на поверхности катания рельса равна (HSi - первый вариант от­вета)

НВ-\ = (351 + 370 + 365)/3 = 362,00 ,

т.е. будет найдено среднее арифметическое (выборочное среднее ариф­метическое) из трех полученных значений отклика.

Однако опытные данные можно усреднять и другими способами. Напри­мер, можно подсчитать среднее геометрическое (НВ2 - второй вариант ответа):

НВ2 =3351-370 -365 =361,91,

или найти среднее, только между минимальным (351) и максимальным (370) значениями - так называемую середину размаха (НВ3 - третий вариант ответа):

НВз = (351 + 370)/2 = 360,50,

или, расположив все значения в возрастающей последовательности 351, 365, 370, взять средний член полученного ряда - средний член вариационного ряда (НВ4 - четвертый вариант ответа):

НВл, = 365,00.

Можно придумать и какие-либо другие способы (например, очень «ориги­нальной» может быть идея еще раз усреднить все четыре полученных значе­ния), однако остановимся пока только на этих четырех вариантах ответа на по­ставленный перед нами вопрос.

Мы видим, что, не привлекая никаких дополнительных соображений, нам пока достаточно трудно обосновать тот или иной вариант, на котором было бы предпочтительно остановиться.

Так, если выбирать тот ответ, который потребует от нас меньшего коли­чество вычислений, то тогда лучше всего отдать предпочтение значению Не4=365,00 (вообще не требует никаких расчетов). Однако подобное обоснова­ние вряд ли можно считать достаточно надежным и убедительным.




3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Поэтому давайте остановимся и задумаемся о том, почему вообще мы столкнулись с подобной ситуацией.

Ведь если бы, например, нам нужно было найти ответ на вопрос, какое количество проходов при прокатке данного профиля осуществляется в двух­валковых рельсовых калибрах, и мы по ходу технологического процесса про­следили за тремя различными раскатами, то в результате было бы получено три абсолютно одинаковых значения (допустим, пять). В подобной ситуации нет необходимости считать ни выборочное среднее, ни среднее геометрическое, ни середину размаха, ни находить средний член вариационного ряда и т.д., по­скольку можно сразу указать то количество рельсовых калибров, которые про­ходит раскат в процессе прокатки.

Следовательно, между такими величинами, как число рельсовых калиб­ров и твердость на поверхности катания головки, есть принципиальная разница, которая заключается в том, что первая из двух названых величин является де­терминированной, а вторая - случайной. И если для того, чтобы описать де­терминированную величину, достаточно указать одно ее значение (например, число рельсовых калибров равно пяти), то для описания случайной величины нужно знать ее распределение. Другими словами, для случайной величины не­достаточно указать только лишь какое-либо ее значение (или комбинацию ее значений, как, например, выборочное среднее арифметическое), а нужно запи­сать функцию, которая однозначно определяет вероятность того, что случайная величина принимает заданное значение или принадлежит к некоторому задан­ному интервалу.

Поэтому ответ на вопрос примера 3.1 надо начинать не с поиска каких-либо вариантов усреднения опытных данных, а прежде всего с констатации то­го факта, что твердость на поверхности катания головки рельса - это случайная величина!!!

Далее нужно отметить, что твердость - это непрерывная случайная вели­чина, поскольку (если, например, рельсы отвечают требованиям первого клас­са) она может принимать любые значения из конечного интервала (Н6=341...388, см. пункт 1.4 ГОСТ 18267-82).

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

После этого можно выдвинуть гипотезу (предположение), что такая слу­чайная величина, как твердость на поверхности катания головки рельса, не должна противоречить нормальному закону распределения. Согласно цен­тральной предельной теореме математической статистики, данную гипотезу скорее всего можно будет принять в качестве рабочей, поскольку опытные дан­ные в примере 3.1 получены при измерении твердости в различных точках по длине одного и того же рельса. Следовательно, наиболее существенные фак­торы, которые определяют механические свойства данного металла на всех стадиях технологического процесса (получение металла, прокатка, термическая обработка), зафиксированы на одних и тех же уровнях. Кроме того, отклик (твердость металла) становится случайной величиной только в результате влияния малозначимых неконтролируемых факторов, число которых на различ­ных этапах металлургического цикла, по всей видимости, стремится к беско­нечности.

Итак, в качестве ответа на вопрос примера 3.1 мы можем сказать, что твердость на поверхности катания головки рельса - это непрерывная случай­ная величина, функцию распределения которой скорее всего можно записать в виде

х (х-М т У

F (НВ ) = —.'т dx .

л]2тга2нв -I

Теперь, казалось бы, только осталось подсчитать по (2.15) математиче­ское ожидание Мнв и по (2.17) - дисперсию Стнв2, т.е. два параметра этой слу­чайной величины, и у нас появится возможность определять вероятность того, что твердость на поверхности катания головки рельса принадлежит к некоторо­му заданному интервалу (например, НВ = 341.. .388).

Однако на данном этапе мы попадаем в какой -то замкнутый круг: ведь для того, чтобы записать функцию нормального распределения, необходимо определить математическое ожидание и дисперсию; для вычисления этих двух параметров нужно знать плотность распределения (см. (2.15) и (2.17)), а плот­ность распределения - это первая производная от функции распределения (см.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

(2.7)), т.е. в итоге, для того, чтобы найти функцию распределения, нужно знать функцию распределения.

Выход из подобного замкнутого круга может быть найден только лишь после того, как будет определена причина, по которой мы в него попадаем.

Итак, нам необходима функция распределения, причем для начала пусть хотя бы одно из ее значений, например F(341J. По определению (2.3) - это ве­роятность того, что случайная величина НВ принимает значение не более 341. В свою очередь вероятность данного события F(34^) = Р(НВ < 341J есть предел частоты реализации события НВ < 341 (отношение числа наблюдений, в кото­рых твердость на поверхности катания головки рельса оказалась не более 341, к общему количеству наблюдений) при неограниченном числе повторений од­ного и того же комплекса условий.

А вот неограниченным числом повторений (генеральной совокупностью) в условиях примера 3.1 мы как раз и не располагаем, поскольку имеется только лишь три участка (сечения) рельса (три наблюдаемых единицы), в которых оп­ределена твердость на поверхности катания головки (три результата наблюде­ния).

Наблюдаемая единица - действительный или условный предмет, над ко­торым проводят серию наблюдений.

Результат наблюдения - характеристика свойств единицы, полученная опытным путем.

Генеральная совокупность - множество всех рассматриваемых единиц.

Другими словами, генеральная совокупность - это такое воображаемое, в пределе бесконечно большое число предметов, над которыми можно провести наблюдения при неограниченном числе повторений одного и того же комплекса условий.

В примере 3.1 под генеральной совокупностью можно понимать, допус­тим, все участки одного и того же рельса, в которых в принципе можно было бы замерить твердость, либо вообще все рельсы Р65, которые когда-либо изго­тавливались или еще будут производиться по ГОСТ 18267-82.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

В распоряжении исследователя, конечно же, никогда нет генеральной со­вокупности, и он может изучать только ее часть - выборку, причем всегда огра­ниченного объема.

Выборка - любое конечное подмножество генеральной совокупности, предназначенное для непосредственных исследований.

Объем - количество единиц в выборке.

По выборке невозможно однозначно определить ни функцию распреде­ления, ни плотность распределения, ни параметры распределения (например, математическое ожидание или дисперсию) случайной величины, поскольку для этого потребуется неограниченное (бесконечно большое) количество результа­тов наблюдений, т.е. необходимо исследовать всю генеральную совокупность.

Следовательно, имея конечное подмножество генеральной совокупности (выборку), мы должны либо вообще отказаться от поиска распределения ис­следуемой случайной величины, либо удовлетвориться лишь некоторыми при­ближенными значениями неизвестных параметров ее распределения, т.е. про­вести оценивание случайной величины.

Оценивание - определение приближенного значения неизвестного пара­метра генеральной совокупности по результатам наблюдений.

Идея оценивания должна быть вполне понятна из соображений обычной житейской практики. Ведь для того, чтобы, например, купить пару килограмм яблок, у нас никогда не возникает желание съесть все имеющиеся у данного продавца фрукты (изучить всю генеральную совокупность), мы пробуем дольку только лишь одного яблока (исследуем выборку), определяем ее вкус (оцени­ваем) и принимаем решение, стоит нам или нет покупать именно эти яблоки.

Исходными данными при оценивании, как и при проверке любых предпо­ложений (статистических гипотез), касающихся неизвестного распределения случайной величины, конечно же, могут быть лишь только те результаты на­блюдений, которые были получены в ходе проведения опытов (на выборке ог­раниченного объема). Причем предварительная обработка экспериментальных данных обычно начинается с подсчета тех или иных функций от результатов наблюдений (статистик).

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Статистика - функция результатов наблюдений, используемая для оцен­ки параметров распределения и (или) для проверки статистических гипотез.

По выборке невозможно найти параметры распределения случайной ве­личины (поскольку для этого требуется бесконечное количество результатов наблюдений - изучение всей генеральной совокупности), поэтому, имея в сво­ем распоряжении всегда ограниченный объем экспериментальных данных, ис­следователю остается довольствоваться только лишь получением некоторых оценок.

Оценка - статистика, являющаяся основой для оценивания неизвестного параметра распределения.

Для одного и того же параметра распределения может быть предложено несколько оценок.

В примере 3.1 рассматривалось четыре различных оценки для такого па­раметра распределения твердости, как математическое ожидание данной слу­чайной величины (выборочное среднее арифметическое, выборочное среднее геометрическое, середина размаха и средний член вариационного ряда).

Поэтому при оценивании всегда возникает проблема выбора наилучшей оценки из всех возможных оценок данного параметра.

Причем, когда формулируются те или иные требования, по которым оценку целесообразно считать наилучшей, прежде всего учитывается тот факт, что любая оценка - это также случайная величина.

Ведь если бы в условиях примера 3.1 было бы найдено, допустим, выбо­рочное среднее арифметическое твердости на поверхности катания головки ка­кого-либо другого рельса, то, конечно же, совершенно не обязательно, что оно опять оказалось бы равно именно 362,00 единицам по Бринеллю.

Из тех соображений, что любая оценка 0* какого-либо параметра рас­пределения 0 случайной величины тоже есть случайная величина, к оценкам предъявляются требования состоятельности, несмещенности и эффективно­сти.

Состоятельная оценка - оценка, сходящаяся по вероятности к значению оцениваемого параметра при безграничном возрастании объема выборки.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

lim &* (п)= ©, (3.1)

где 0 - оцениваемый параметр; 0* - оценка; п - объем выборки.

Иными словами, для состоятельной оценки ©Отклонение ее от 0 на малую величину 8 и более становится маловероятным при большом объеме выборки.

Вполне естественно, что исследователей в первую очередь интересуют те оценки, которые хотя бы в пределе (при проведении бесконечно большого количества наблюдений) давали им возможность определить интересующий их параметр распределения, т.е. чтобы оценки прежде всего были состоятельны­ми. Однако следует отметить, что на практике приходится оценивать неиз­вестные параметры и при малых объемах выборки.

Естественным является требование, при выполнении которого оценка не дает систематической погрешности в сторону завышения (или занижения) ис­тинного значения параметра ©.

Несмещенная оценка - оценка, математическое ожидание которой равно значению оцениваемого параметра:

М(0*)=0. (3.2)

Удовлетворение требованию несмещенности позволяет устранить сис­тематическую погрешность оценки параметра, которая зависит от объема вы­борки пив случае состоятельности оценки стремится к нулю при п^-оо.

Эффективная оценка - несмещенная оценка, имеющая наименьшую дис­персию из всех возможных несмещенных оценок данного параметра.

M{(0*-0)2}=min (33)

или

Аф>.-е)^лф,,.-еП(3.4)

где 0* - любая другая оценка.

Иными словами, дисперсия эффективной оценки параметра в некотором классе является минимальной среди дисперсий всех оценок из рассматривае­мого класса несмещенных оценок.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Из всех состоятельных и несмещенных оценок следует предпочесть та­кую, которая оказывается наиболее близкой к оцениваемому параметру (эф­фективной), однако используемые в математической статистике оценки не все­гда одновременно удовлетворяют всем трем перечисленным выше требовани­ям.

После того как исследователь выбрал и подсчитал состоятельную, не­смещенную и эффективную оценки интересующего его параметра распределе­ния исследуемой случайной величины, первое и наиболее простое, что он мо­жет сделать, так это принять значение оценки как неизвестное значение пара­метра распределения, т.е. выполнить точечное оценивание.

Точечное оценивание - способ оценивания, заключающийся в том, что значение оценки принимают как неизвестное значение параметра распределе­ния.

Рассмотрим некоторые точечные оценки основных параметров распре­деления для непрерывной случайной величины, не противоречащей нормаль­ному закону распределения.

Выборочное среднее арифметическое х - сумма значений рассматри­ваемой величины, полученных по результатам испытания выборки, деленная на ее объем.


x = /jxi, 1= 1, 2, ...,П, ,о с\

где п - объем выборки; х\- результат измерения i-й единицы.

В математической статистике доказано, что выборочное среднее ариф­метическое является наилучшей (состоятельной, несмещенной и эффективной) оценкой математического ожидания случайной величины, подчиняющейся нор­мальному закону распределения.

В примере 3.1, даже если предположить, что твердость на поверхности катания головки рельса не противоречит нормальному закону распределения, из четырех полученных оценок предпочтение следует отдать значению НВ-\ = (351 + 370 + 365)/3 = 362,00 (выборочному среднему арифметическому) как наилучшей оценке для математического ожидания данной случайной вели-

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

чины. Три другие рассмотренные в этом примере оценки также являются со­стоятельными для математического ожидания. Однако среднее геометрическое

НВ2 =л/351-370-365 = 361,91 - это смещенная оценка (она будет наилучшей только тогда, когда случайная величина подчиняется так называемому лога­рифмически нормальному распределению, т.е. когда закону Гаусса подчиняет­ся не сама случайная величина, а ее логарифм). Середина размаха /-/6з=(351+370)/2=360,50 и средний член вариационного ряда НВл, = 365,00 - это хотя и несмещенные оценки для математического ожидания, но их эффектив­ность, как показано в математической статистике, меньше, чем у выборочного среднего арифметического (меньше единицы).

Выборочная дисперсия Szx или Szx - сумма квадратов отклонений выбо­рочных результатов наблюдений от их выборочного среднего арифметического в выборке, деленная на п-1 или на п.


УД:

x; -xl

S2 i=l
zz---------
х

п-1 (3-6)

или

2 __ i=l

x
п

• (3.7)

Оценки Si и S^ являются состоятельными, несмещенными и, в случае

нормального распределения, асимптотически эффективными оценками дис­персии о2.

Для практических расчетов выражение (3.6) можно преобразовать к виду


X

„,1

п


(-1

и \ ( п Л \

Xх'2 — Xх' •(3-8)

V '"-1 J

В условиях примера 3.1 выборочная дисперсия твердости на поверхности катания головки рельса равна

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

п2 1

3-1

(3512 +3702 + 3652)—(351 + 370 + 365)

97,00.

Выборочное среднее квадратичное отклонение х или х - положи­тельный квадратный корень из выборочной дисперсии:

э

Sx —+vS

sx=+yjs2x.

или

(3.9) (3.10)

В примере 3.1 Sx = +V97 = 9,85.

Зная выборочное среднее арифметическое х и выборочное среднее

квадратичное отклонение Sx , можно подсчитать меру относительной изменчи­вости случайной величины - выборочный коэффициента вариации v - по фор-

муле

S

X

(3.11)

или, в процентах,

S

v = ^-100%.

х

(3.12)

Для примера 3.1 выборочный коэффициент вариации твердости равен v=9,85/362 = 0,027, или 2,7%.

Через выборочное среднее арифметическое х и выборочное среднее

квадратическое отклонение Sx могут быть сделаны точечные оценки для лю­бых значений функции распределения, а также для вероятности попадания случайной величины в любой из заданных интервалов.

Так, для какого - либо значения функции нормального распределения, поскольку


а
а
а

/ \ Х-М х-М х-М х-М
г\х) = Р(Х < х) = Р(---------- <--------- ) = P(Z <--------- ) = Ф(-------- ),

а

(3.13)



3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

в качестве точечной оценки F(x) можно использовать

\х)- ( ). (3.14)

Точечную оценку вероятности попадания случайной величины X с нор­мальным законом распределения в любой из заданных интервалов (x1, х2) мож-но найти по формуле

1/ .. \ ^х2-х ^х1

Р(х1 < Х<х2) = Ф( )-ф(-------- ). (3.15)

sx sx

В соответствии с (2.32) точечная оценка квантили хр порядка р для нор­мального распределения равна

* -

Хр =x+zpSx. (3.16)

В примере 3.1 предположим, что получено только два значения твердо­сти на поверхности катания головки рельса (на обоих концах на расстоянии не более 1 м от торцов): 351 и 370, а третье испытание (в средней части) еще не проводилось.

Оценим при этих условиях вероятность того, что после измерения твер­дости в средней части рельса ее значение окажется ниже, чем 341, т.е. вероят-ность того, что в результате третьего испытания рельс попадет во второй класс (для которого твердость на поверхности катания головки может лежать в диа­пазоне 311…341) или его придется подвергнуть повторной однократной терми­ческой обработке (закалке и отпуску).

Кроме того, оценим вероятность того, что после определения твердости в средней части рельса он будет по - прежнему удовлетворять требованиям первого класса по пункту 1.4 ГОСТ 18267-82 (НВ = 341 …388).

Если предположить, что твердость на поверхности катания головки рель­са не противоречит нормальному закону распределения, то наилучшими точеч­ными оценками для математического ожидания и дисперсии этой случайной величины в соответствии с (3.5) и (3.8) будут значения

1 хнв =(351 + 370) = 360,5,

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Вычисление параметров эмпирических распределений. - student2.ru Вычисление параметров эмпирических распределений. - student2.ru п2 1

2-1

(3512 +3702)—(351 + 370)

= 180,5,

а по (3.10) выборочное среднее квадратичное отклонение составит

Sx = +-у/180,5 = 13,435 .

Тогда по (3.14) получаем, что

F(341) = Р(НВ < 341) = Ф( 341-360,5 ) = Ф(-1,45).

13,435

Поскольку согласно (2.29) Ф(-1,45) = 1 - Ф(1,45), то по таблицам для функции Лапласа (см. прил. П1) находим Ф(1,45) = 0,92647, и, следовательно,

^(341)=Ф(-1,45) = 1 - 0,92647 ~ 0,07.

В электронных таблицах Microsoft Excel для подобных расчетов можно использовать функцию НОРМСТРАСП.

НОРМСТРАСП((341-СРЗНАЧ(351;370))/СТАНДОТКЛОН(351;370)) =0,07333 ,

где СРЗНАЧ(351;370) и СТАНДОТКЛОН(351;370)- статистические функции для вычисления соответственно выборочного среднего арифметического зна­чения и выборочного среднего квадратичного отклонения.

Точно такое же значение может быть получено через функцию НОРМ-РАСП.

НОРМАСП(341;СРЗНАЧ(351;370);СТАНДОТКЛОН(351;370);ИСТИНА)=0,0733.

Итак, точечной оценкой (полученной по двум выборочным значениям 351 и 370) функции распределения твердости НВ на поверхности катания головки

рельса от значения 341 является величина f(341) = p(hb< 341) = 0,07. Другими словами, точечная оценка вероятности того, что при испытании твердости в средней части рельса ее значение окажется меньше 341, равна 0,07. Или, если проведено два испытания на обоих концах рельса и получены значения 351 и 370, то после определения твердости в средней части, возможно, только семь рельсов из ста придется перевести во второй класс или подвергнуть повторной однократной термической обработке.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Для оценки вероятности того, что после определения твердости в сред­ней части рельс по-прежнему будет удовлетворять требованиям первого клас­са, воспользуемся соотношением (3.15) и получим

Р(341 < НВ <388) = Ф( 388-360,5 ) - Ф( 341-360,5 ) =Ф(2,05)-Ф(-1,45).

13,435 13,435

Значение Ф(-1,45) ~ 0,07 нами было уже найдено, а Ф(2,05) ~ 0,98 (по таблицам [11], в табл. П.1 или в Microsoft Excel НОРМСТРАСП(2,05)= 0,979818).

Следовательно, Р(341<НВ<388)«0,98-0,07 = 0,91, т.е. 91% всех рель­сов, после измерения твердости в средней части, будут по-прежнему отвечать требованиям пункта 1.4 ГОСТ 18267-82 (НВ = 341...388), если на их концах уже были получены значения 351 и 370.

Добавим, что значения 341 и 388 являются оценками квантилей порядка

* *

соответственно 0,07 и 0,98, т.е. HB0,07 =341, a HB0,98 =388, и если, допустим, не­обходимо оценить квантиль порядка 0,99, то по формуле (3.16) можно получить следующее значение:

НВ0.99 =360,5+z09913,453 =360,5 +2,326-13,435 =391,80,

где z0,99 - квантиль нормированного нормального распределения порядка 0,99 - можно найти по таблицам [11], в табл. П.2 или в Microsoft Excel с исполь­зованием функции НОРМСТОБР(0,99) =2,326342 , а также НОРМОБР(0,99;0;1)= 2,326342.

Следовательно, если на обоих концах рельса получены значения 351 и 370, то скорее всего только в одном случае из ста твердость на поверхности ка­тания головки в средней части может оказаться больше 391,8.

Однако все последние приведенные в примере 3.1 выводы и заключения относительно оценок различных вероятностей не следует понимать в букваль­ном смысле слова. Так, если бы удалось собрать данные по твердости в сред­ней части на ста рельсах, у которых значения этого показателя качества по концам составляли бы ровно 351 и 370, то, конечно же, совершенно не обяза­тельно, что именно только на одном рельсе из ста твердость оказалась бы

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

больше, чем 391,8. Такое событие вполне могло бы быть отмечено и на двух, и на трех и т.д. рельсах либо вообще ни разу не встретиться.

Дело здесь заключается в том, что, во-первых, даже если бы нам уда­лось найти саму теоретическую вероятность какого-либо события (изучить всю генеральную совокупность), а не ее оценку (полученную по выборке ограничен­ного объема), то и в этом случае фактическая частота реализации этого собы­тия вполне могла бы отличаться (хотя и не очень сильно) от соответствующей ей теоретической вероятности. Так, например, если сто раз подбросить "иде­альную" монету, то совершенно не обязательно, что ровно в 50 случаях выпа­дет "орел", а в остальных 50 - "решка". Хотя то, что во всех 100 случаях выпа­дет "орел" и ни разу - "решка", мы вряд ли увидим (если тот, кто подбрасывает монету, не факир или фокусник, то вероятность подобного события равна (0,5)100 = 8-10-31).

И, во-вторых, если в нашем распоряжении имеются только лишь какая-либо точечная оценка, то вообще совершенно невозможно сказать, насколько близко она располагается относительно оцениваемого ею параметра. Так, на­пример, если вероятность того, что при получении твердости на концах рельса 351 и 370 он и после измерения этой величины в средней части будет отвечать пункту 1.4 ГОСТ 18267-82 оценивается значением 0,91, то на самом деле (для всей генеральной совокупности, т.е. для всех рельсов Р65, выпускаемых по ГОСТ 18267-82) эта вероятность может быть равна и 0,85, и 0,95 и т.д.

По значению точечной оценки не представляется возможным опреде­лить, хотя бы в каком диапазоне находится оцениваемый ею параметр. Этот существенный недостаток точечного оценивания может быть компенсирован оцениванием с помощью так называемого доверительного интервала.

Наши рекомендации