Вычисление параметров эмпирических распределений.
Точечное оценивание
Рассмотрение вопросов обработки экспериментальных данных начнем с простейшей ситуации, когда отклик регистрируется при фиксированных уровнях всех контролируемых факторов и при проведении опытов (в результате влияния неконтролируемых факторов) исследователь получает хотя и близкие, но отличные друг от друга результаты.
Пример 3.1.При производстве железнодорожных рельсов широкой колеи типа Р65 (по ГОСТ 18267-82) были получены следующие три значения твердости НВ (по ГОСТ 9012-59) на поверхности катания головки одного и того же рельса (на обоих концах на расстоянии не более 1 м от торцов и в средней части рельса): 351, 370 и 365.
Попытаемся найти ответ на вопрос - чему равна твердость на поверхности катания данного рельса?
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
На первый взгляд решение поставленной задачи не вызывает никаких особых проблем, и начинающие исследователи, не особенно искушенные в области теории вероятностей и математической статистики, скорее всего ответят, что твердость на поверхности катания рельса равна (HSi - первый вариант ответа)
НВ-\ = (351 + 370 + 365)/3 = 362,00 ,
т.е. будет найдено среднее арифметическое (выборочное среднее арифметическое) из трех полученных значений отклика.
Однако опытные данные можно усреднять и другими способами. Например, можно подсчитать среднее геометрическое (НВ2 - второй вариант ответа):
НВ2 =3351-370 -365 =361,91,
или найти среднее, только между минимальным (351) и максимальным (370) значениями - так называемую середину размаха (НВ3 - третий вариант ответа):
НВз = (351 + 370)/2 = 360,50,
или, расположив все значения в возрастающей последовательности 351, 365, 370, взять средний член полученного ряда - средний член вариационного ряда (НВ4 - четвертый вариант ответа):
НВл, = 365,00.
Можно придумать и какие-либо другие способы (например, очень «оригинальной» может быть идея еще раз усреднить все четыре полученных значения), однако остановимся пока только на этих четырех вариантах ответа на поставленный перед нами вопрос.
Мы видим, что, не привлекая никаких дополнительных соображений, нам пока достаточно трудно обосновать тот или иной вариант, на котором было бы предпочтительно остановиться.
Так, если выбирать тот ответ, который потребует от нас меньшего количество вычислений, то тогда лучше всего отдать предпочтение значению Не4=365,00 (вообще не требует никаких расчетов). Однако подобное обоснование вряд ли можно считать достаточно надежным и убедительным.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Поэтому давайте остановимся и задумаемся о том, почему вообще мы столкнулись с подобной ситуацией.
Ведь если бы, например, нам нужно было найти ответ на вопрос, какое количество проходов при прокатке данного профиля осуществляется в двухвалковых рельсовых калибрах, и мы по ходу технологического процесса проследили за тремя различными раскатами, то в результате было бы получено три абсолютно одинаковых значения (допустим, пять). В подобной ситуации нет необходимости считать ни выборочное среднее, ни среднее геометрическое, ни середину размаха, ни находить средний член вариационного ряда и т.д., поскольку можно сразу указать то количество рельсовых калибров, которые проходит раскат в процессе прокатки.
Следовательно, между такими величинами, как число рельсовых калибров и твердость на поверхности катания головки, есть принципиальная разница, которая заключается в том, что первая из двух названых величин является детерминированной, а вторая - случайной. И если для того, чтобы описать детерминированную величину, достаточно указать одно ее значение (например, число рельсовых калибров равно пяти), то для описания случайной величины нужно знать ее распределение. Другими словами, для случайной величины недостаточно указать только лишь какое-либо ее значение (или комбинацию ее значений, как, например, выборочное среднее арифметическое), а нужно записать функцию, которая однозначно определяет вероятность того, что случайная величина принимает заданное значение или принадлежит к некоторому заданному интервалу.
Поэтому ответ на вопрос примера 3.1 надо начинать не с поиска каких-либо вариантов усреднения опытных данных, а прежде всего с констатации того факта, что твердость на поверхности катания головки рельса - это случайная величина!!!
Далее нужно отметить, что твердость - это непрерывная случайная величина, поскольку (если, например, рельсы отвечают требованиям первого класса) она может принимать любые значения из конечного интервала (Н6=341...388, см. пункт 1.4 ГОСТ 18267-82).
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
После этого можно выдвинуть гипотезу (предположение), что такая случайная величина, как твердость на поверхности катания головки рельса, не должна противоречить нормальному закону распределения. Согласно центральной предельной теореме математической статистики, данную гипотезу скорее всего можно будет принять в качестве рабочей, поскольку опытные данные в примере 3.1 получены при измерении твердости в различных точках по длине одного и того же рельса. Следовательно, наиболее существенные факторы, которые определяют механические свойства данного металла на всех стадиях технологического процесса (получение металла, прокатка, термическая обработка), зафиксированы на одних и тех же уровнях. Кроме того, отклик (твердость металла) становится случайной величиной только в результате влияния малозначимых неконтролируемых факторов, число которых на различных этапах металлургического цикла, по всей видимости, стремится к бесконечности.
Итак, в качестве ответа на вопрос примера 3.1 мы можем сказать, что твердость на поверхности катания головки рельса - это непрерывная случайная величина, функцию распределения которой скорее всего можно записать в виде
х (х-М т У
F (НВ ) = —. \е 2о'т dx .
л]2тга2нв -I
Теперь, казалось бы, только осталось подсчитать по (2.15) математическое ожидание Мнв и по (2.17) - дисперсию Стнв2, т.е. два параметра этой случайной величины, и у нас появится возможность определять вероятность того, что твердость на поверхности катания головки рельса принадлежит к некоторому заданному интервалу (например, НВ = 341.. .388).
Однако на данном этапе мы попадаем в какой -то замкнутый круг: ведь для того, чтобы записать функцию нормального распределения, необходимо определить математическое ожидание и дисперсию; для вычисления этих двух параметров нужно знать плотность распределения (см. (2.15) и (2.17)), а плотность распределения - это первая производная от функции распределения (см.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
(2.7)), т.е. в итоге, для того, чтобы найти функцию распределения, нужно знать функцию распределения.
Выход из подобного замкнутого круга может быть найден только лишь после того, как будет определена причина, по которой мы в него попадаем.
Итак, нам необходима функция распределения, причем для начала пусть хотя бы одно из ее значений, например F(341J. По определению (2.3) - это вероятность того, что случайная величина НВ принимает значение не более 341. В свою очередь вероятность данного события F(34^) = Р(НВ < 341J есть предел частоты реализации события НВ < 341 (отношение числа наблюдений, в которых твердость на поверхности катания головки рельса оказалась не более 341, к общему количеству наблюдений) при неограниченном числе повторений одного и того же комплекса условий.
А вот неограниченным числом повторений (генеральной совокупностью) в условиях примера 3.1 мы как раз и не располагаем, поскольку имеется только лишь три участка (сечения) рельса (три наблюдаемых единицы), в которых определена твердость на поверхности катания головки (три результата наблюдения).
Наблюдаемая единица - действительный или условный предмет, над которым проводят серию наблюдений.
Результат наблюдения - характеристика свойств единицы, полученная опытным путем.
Генеральная совокупность - множество всех рассматриваемых единиц.
Другими словами, генеральная совокупность - это такое воображаемое, в пределе бесконечно большое число предметов, над которыми можно провести наблюдения при неограниченном числе повторений одного и того же комплекса условий.
В примере 3.1 под генеральной совокупностью можно понимать, допустим, все участки одного и того же рельса, в которых в принципе можно было бы замерить твердость, либо вообще все рельсы Р65, которые когда-либо изготавливались или еще будут производиться по ГОСТ 18267-82.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
В распоряжении исследователя, конечно же, никогда нет генеральной совокупности, и он может изучать только ее часть - выборку, причем всегда ограниченного объема.
Выборка - любое конечное подмножество генеральной совокупности, предназначенное для непосредственных исследований.
Объем - количество единиц в выборке.
По выборке невозможно однозначно определить ни функцию распределения, ни плотность распределения, ни параметры распределения (например, математическое ожидание или дисперсию) случайной величины, поскольку для этого потребуется неограниченное (бесконечно большое) количество результатов наблюдений, т.е. необходимо исследовать всю генеральную совокупность.
Следовательно, имея конечное подмножество генеральной совокупности (выборку), мы должны либо вообще отказаться от поиска распределения исследуемой случайной величины, либо удовлетвориться лишь некоторыми приближенными значениями неизвестных параметров ее распределения, т.е. провести оценивание случайной величины.
Оценивание - определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений.
Идея оценивания должна быть вполне понятна из соображений обычной житейской практики. Ведь для того, чтобы, например, купить пару килограмм яблок, у нас никогда не возникает желание съесть все имеющиеся у данного продавца фрукты (изучить всю генеральную совокупность), мы пробуем дольку только лишь одного яблока (исследуем выборку), определяем ее вкус (оцениваем) и принимаем решение, стоит нам или нет покупать именно эти яблоки.
Исходными данными при оценивании, как и при проверке любых предположений (статистических гипотез), касающихся неизвестного распределения случайной величины, конечно же, могут быть лишь только те результаты наблюдений, которые были получены в ходе проведения опытов (на выборке ограниченного объема). Причем предварительная обработка экспериментальных данных обычно начинается с подсчета тех или иных функций от результатов наблюдений (статистик).
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Статистика - функция результатов наблюдений, используемая для оценки параметров распределения и (или) для проверки статистических гипотез.
По выборке невозможно найти параметры распределения случайной величины (поскольку для этого требуется бесконечное количество результатов наблюдений - изучение всей генеральной совокупности), поэтому, имея в своем распоряжении всегда ограниченный объем экспериментальных данных, исследователю остается довольствоваться только лишь получением некоторых оценок.
Оценка - статистика, являющаяся основой для оценивания неизвестного параметра распределения.
Для одного и того же параметра распределения может быть предложено несколько оценок.
В примере 3.1 рассматривалось четыре различных оценки для такого параметра распределения твердости, как математическое ожидание данной случайной величины (выборочное среднее арифметическое, выборочное среднее геометрическое, середина размаха и средний член вариационного ряда).
Поэтому при оценивании всегда возникает проблема выбора наилучшей оценки из всех возможных оценок данного параметра.
Причем, когда формулируются те или иные требования, по которым оценку целесообразно считать наилучшей, прежде всего учитывается тот факт, что любая оценка - это также случайная величина.
Ведь если бы в условиях примера 3.1 было бы найдено, допустим, выборочное среднее арифметическое твердости на поверхности катания головки какого-либо другого рельса, то, конечно же, совершенно не обязательно, что оно опять оказалось бы равно именно 362,00 единицам по Бринеллю.
Из тех соображений, что любая оценка 0* какого-либо параметра распределения 0 случайной величины тоже есть случайная величина, к оценкам предъявляются требования состоятельности, несмещенности и эффективности.
Состоятельная оценка - оценка, сходящаяся по вероятности к значению оцениваемого параметра при безграничном возрастании объема выборки.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
lim &* (п)= ©, (3.1)
где 0 - оцениваемый параметр; 0* - оценка; п - объем выборки.
Иными словами, для состоятельной оценки ©Отклонение ее от 0 на малую величину 8 и более становится маловероятным при большом объеме выборки.
Вполне естественно, что исследователей в первую очередь интересуют те оценки, которые хотя бы в пределе (при проведении бесконечно большого количества наблюдений) давали им возможность определить интересующий их параметр распределения, т.е. чтобы оценки прежде всего были состоятельными. Однако следует отметить, что на практике приходится оценивать неизвестные параметры и при малых объемах выборки.
Естественным является требование, при выполнении которого оценка не дает систематической погрешности в сторону завышения (или занижения) истинного значения параметра ©.
Несмещенная оценка - оценка, математическое ожидание которой равно значению оцениваемого параметра:
М(0*)=0. (3.2)
Удовлетворение требованию несмещенности позволяет устранить систематическую погрешность оценки параметра, которая зависит от объема выборки пив случае состоятельности оценки стремится к нулю при п^-оо.
Эффективная оценка - несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра.
M{(0*-0)2}=min (33)
или
Аф>.-е)^лф,,.-еП(3.4)
где 0* - любая другая оценка.
Иными словами, дисперсия эффективной оценки параметра в некотором классе является минимальной среди дисперсий всех оценок из рассматриваемого класса несмещенных оценок.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Из всех состоятельных и несмещенных оценок следует предпочесть такую, которая оказывается наиболее близкой к оцениваемому параметру (эффективной), однако используемые в математической статистике оценки не всегда одновременно удовлетворяют всем трем перечисленным выше требованиям.
После того как исследователь выбрал и подсчитал состоятельную, несмещенную и эффективную оценки интересующего его параметра распределения исследуемой случайной величины, первое и наиболее простое, что он может сделать, так это принять значение оценки как неизвестное значение параметра распределения, т.е. выполнить точечное оценивание.
Точечное оценивание - способ оценивания, заключающийся в том, что значение оценки принимают как неизвестное значение параметра распределения.
Рассмотрим некоторые точечные оценки основных параметров распределения для непрерывной случайной величины, не противоречащей нормальному закону распределения.
Выборочное среднее арифметическое х - сумма значений рассматриваемой величины, полученных по результатам испытания выборки, деленная на ее объем.
1Л
x = /jxi, 1= 1, 2, ...,П, ,о с\
где п - объем выборки; х\- результат измерения i-й единицы.
В математической статистике доказано, что выборочное среднее арифметическое является наилучшей (состоятельной, несмещенной и эффективной) оценкой математического ожидания случайной величины, подчиняющейся нормальному закону распределения.
В примере 3.1, даже если предположить, что твердость на поверхности катания головки рельса не противоречит нормальному закону распределения, из четырех полученных оценок предпочтение следует отдать значению НВ-\ = (351 + 370 + 365)/3 = 362,00 (выборочному среднему арифметическому) как наилучшей оценке для математического ожидания данной случайной вели-
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
чины. Три другие рассмотренные в этом примере оценки также являются состоятельными для математического ожидания. Однако среднее геометрическое
НВ2 =л/351-370-365 = 361,91 - это смещенная оценка (она будет наилучшей только тогда, когда случайная величина подчиняется так называемому логарифмически нормальному распределению, т.е. когда закону Гаусса подчиняется не сама случайная величина, а ее логарифм). Середина размаха /-/6з=(351+370)/2=360,50 и средний член вариационного ряда НВл, = 365,00 - это хотя и несмещенные оценки для математического ожидания, но их эффективность, как показано в математической статистике, меньше, чем у выборочного среднего арифметического (меньше единицы).
Выборочная дисперсия Szx или Szx - сумма квадратов отклонений выборочных результатов наблюдений от их выборочного среднего арифметического в выборке, деленная на п-1 или на п.
УД: |
x; -xl
S2 i=l
zz---------
х
п-1 (3-6)
или
2 __ i=l
x |
п |
• (3.7)
Оценки Si и S^ являются состоятельными, несмещенными и, в случае
нормального распределения, асимптотически эффективными оценками дисперсии о2.
Для практических расчетов выражение (3.6) можно преобразовать к виду
X |
„,1
п
(-1 |
и \ ( п Л \
Xх'2 — Xх' •(3-8)
V '"-1 J
В условиях примера 3.1 выборочная дисперсия твердости на поверхности катания головки рельса равна
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
п2 1
3-1
(3512 +3702 + 3652)—(351 + 370 + 365)
97,00.
Выборочное среднее квадратичное отклонение х или х - положительный квадратный корень из выборочной дисперсии:
э
Sx —+vS
sx=+yjs2x.
или
(3.9) (3.10)
В примере 3.1 Sx = +V97 = 9,85.
Зная выборочное среднее арифметическое х и выборочное среднее
квадратичное отклонение Sx , можно подсчитать меру относительной изменчивости случайной величины - выборочный коэффициента вариации v - по фор-
муле
S
X
(3.11)
или, в процентах,
S
v = ^-100%.
х
(3.12)
Для примера 3.1 выборочный коэффициент вариации твердости равен v=9,85/362 = 0,027, или 2,7%.
Через выборочное среднее арифметическое х и выборочное среднее
квадратическое отклонение Sx могут быть сделаны точечные оценки для любых значений функции распределения, а также для вероятности попадания случайной величины в любой из заданных интервалов.
Так, для какого - либо значения функции нормального распределения, поскольку
а |
а |
а |
/ \ Х-М х-М х-М х-М
г\х) = Р(Х < х) = Р(---------- <--------- ) = P(Z <--------- ) = Ф(-------- ),
а
(3.13)
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
в качестве точечной оценки F(x) можно использовать
\х)- ( ). (3.14)
Точечную оценку вероятности попадания случайной величины X с нормальным законом распределения в любой из заданных интервалов (x1, х2) мож-но найти по формуле
1/ .. \ ^х2-х ^х1-х
Р(х1 < Х<х2) = Ф( )-ф(-------- ). (3.15)
sx sx
В соответствии с (2.32) точечная оценка квантили хр порядка р для нормального распределения равна
* -
Хр =x+zpSx. (3.16)
В примере 3.1 предположим, что получено только два значения твердости на поверхности катания головки рельса (на обоих концах на расстоянии не более 1 м от торцов): 351 и 370, а третье испытание (в средней части) еще не проводилось.
Оценим при этих условиях вероятность того, что после измерения твердости в средней части рельса ее значение окажется ниже, чем 341, т.е. вероят-ность того, что в результате третьего испытания рельс попадет во второй класс (для которого твердость на поверхности катания головки может лежать в диапазоне 311…341) или его придется подвергнуть повторной однократной термической обработке (закалке и отпуску).
Кроме того, оценим вероятность того, что после определения твердости в средней части рельса он будет по - прежнему удовлетворять требованиям первого класса по пункту 1.4 ГОСТ 18267-82 (НВ = 341 …388).
Если предположить, что твердость на поверхности катания головки рельса не противоречит нормальному закону распределения, то наилучшими точечными оценками для математического ожидания и дисперсии этой случайной величины в соответствии с (3.5) и (3.8) будут значения
1 хнв =(351 + 370) = 360,5,
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
п2 1
2-1
(3512 +3702)—(351 + 370)
= 180,5,
а по (3.10) выборочное среднее квадратичное отклонение составит
Sx = +-у/180,5 = 13,435 .
Тогда по (3.14) получаем, что
F(341) = Р(НВ < 341) = Ф( 341-360,5 ) = Ф(-1,45).
13,435
Поскольку согласно (2.29) Ф(-1,45) = 1 - Ф(1,45), то по таблицам для функции Лапласа (см. прил. П1) находим Ф(1,45) = 0,92647, и, следовательно,
^(341)=Ф(-1,45) = 1 - 0,92647 ~ 0,07.
В электронных таблицах Microsoft Excel для подобных расчетов можно использовать функцию НОРМСТРАСП.
НОРМСТРАСП((341-СРЗНАЧ(351;370))/СТАНДОТКЛОН(351;370)) =0,07333 ,
где СРЗНАЧ(351;370) и СТАНДОТКЛОН(351;370)- статистические функции для вычисления соответственно выборочного среднего арифметического значения и выборочного среднего квадратичного отклонения.
Точно такое же значение может быть получено через функцию НОРМ-РАСП.
НОРМАСП(341;СРЗНАЧ(351;370);СТАНДОТКЛОН(351;370);ИСТИНА)=0,0733.
Итак, точечной оценкой (полученной по двум выборочным значениям 351 и 370) функции распределения твердости НВ на поверхности катания головки
рельса от значения 341 является величина f(341) = p(hb< 341) = 0,07. Другими словами, точечная оценка вероятности того, что при испытании твердости в средней части рельса ее значение окажется меньше 341, равна 0,07. Или, если проведено два испытания на обоих концах рельса и получены значения 351 и 370, то после определения твердости в средней части, возможно, только семь рельсов из ста придется перевести во второй класс или подвергнуть повторной однократной термической обработке.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Для оценки вероятности того, что после определения твердости в средней части рельс по-прежнему будет удовлетворять требованиям первого класса, воспользуемся соотношением (3.15) и получим
Р(341 < НВ <388) = Ф( 388-360,5 ) - Ф( 341-360,5 ) =Ф(2,05)-Ф(-1,45).
13,435 13,435
Значение Ф(-1,45) ~ 0,07 нами было уже найдено, а Ф(2,05) ~ 0,98 (по таблицам [11], в табл. П.1 или в Microsoft Excel НОРМСТРАСП(2,05)= 0,979818).
Следовательно, Р(341<НВ<388)«0,98-0,07 = 0,91, т.е. 91% всех рельсов, после измерения твердости в средней части, будут по-прежнему отвечать требованиям пункта 1.4 ГОСТ 18267-82 (НВ = 341...388), если на их концах уже были получены значения 351 и 370.
Добавим, что значения 341 и 388 являются оценками квантилей порядка
* *
соответственно 0,07 и 0,98, т.е. HB0,07 =341, a HB0,98 =388, и если, допустим, необходимо оценить квантиль порядка 0,99, то по формуле (3.16) можно получить следующее значение:
НВ0.99 =360,5+z09913,453 =360,5 +2,326-13,435 =391,80,
где z0,99 - квантиль нормированного нормального распределения порядка 0,99 - можно найти по таблицам [11], в табл. П.2 или в Microsoft Excel с использованием функции НОРМСТОБР(0,99) =2,326342 , а также НОРМОБР(0,99;0;1)= 2,326342.
Следовательно, если на обоих концах рельса получены значения 351 и 370, то скорее всего только в одном случае из ста твердость на поверхности катания головки в средней части может оказаться больше 391,8.
Однако все последние приведенные в примере 3.1 выводы и заключения относительно оценок различных вероятностей не следует понимать в буквальном смысле слова. Так, если бы удалось собрать данные по твердости в средней части на ста рельсах, у которых значения этого показателя качества по концам составляли бы ровно 351 и 370, то, конечно же, совершенно не обязательно, что именно только на одном рельсе из ста твердость оказалась бы
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
больше, чем 391,8. Такое событие вполне могло бы быть отмечено и на двух, и на трех и т.д. рельсах либо вообще ни разу не встретиться.
Дело здесь заключается в том, что, во-первых, даже если бы нам удалось найти саму теоретическую вероятность какого-либо события (изучить всю генеральную совокупность), а не ее оценку (полученную по выборке ограниченного объема), то и в этом случае фактическая частота реализации этого события вполне могла бы отличаться (хотя и не очень сильно) от соответствующей ей теоретической вероятности. Так, например, если сто раз подбросить "идеальную" монету, то совершенно не обязательно, что ровно в 50 случаях выпадет "орел", а в остальных 50 - "решка". Хотя то, что во всех 100 случаях выпадет "орел" и ни разу - "решка", мы вряд ли увидим (если тот, кто подбрасывает монету, не факир или фокусник, то вероятность подобного события равна (0,5)100 = 8-10-31).
И, во-вторых, если в нашем распоряжении имеются только лишь какая-либо точечная оценка, то вообще совершенно невозможно сказать, насколько близко она располагается относительно оцениваемого ею параметра. Так, например, если вероятность того, что при получении твердости на концах рельса 351 и 370 он и после измерения этой величины в средней части будет отвечать пункту 1.4 ГОСТ 18267-82 оценивается значением 0,91, то на самом деле (для всей генеральной совокупности, т.е. для всех рельсов Р65, выпускаемых по ГОСТ 18267-82) эта вероятность может быть равна и 0,85, и 0,95 и т.д.
По значению точечной оценки не представляется возможным определить, хотя бы в каком диапазоне находится оцениваемый ею параметр. Этот существенный недостаток точечного оценивания может быть компенсирован оцениванием с помощью так называемого доверительного интервала.