Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий

Теория вероятностей – математический фундамент современной статистики. Известен целый ряд умозрительных опытов и задач, а также их экспериментальные аналоги, которые приводят к классическим вероятностным схемам. Таковыми являются подбрасывание однородной симметричной монеты, игральной кости, карточные игры, игры с урнами, содержащими различные объекты. В результате решения этих задач были заложены формальные основы теории вероятности, которые кратко обсуждаются ниже.

Случайное событие и вероятность. В статистических исследованиях фигурируют сложные природные, технологические или социальные механизмы, результаты проявления которых невозможно достоверно предсказать. В качестве примера можно представить многоэтапный технологический процесс производства некоего продукта. Поэтому статистика, как и теория вероятностей, рассматривает изучаемые явления как случайные. В экспериментах случайные явления представлены случайными событиями. Для примера с производством продукта сформулировать статистический эксперимент по оценке качества производственного процесса. Тогда в качестве случайного события может, например, выступать появление в контрольной партии продукции некоторого количества дефектных изделий. Чтобы адекватно описать исследуемое случайное явление, необходимо сопоставить представляющему его случайному событию некую количественную меру, которая отражала бы частоту появления этого события (например, как часто в партии из 100 изделий встречается 5 дефектных). Такая мера в теории получила название вероятности Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru и понимается как некая функция пространства элементарных случайных событий. Это положительное вещественное число в интервале от 0 до 1. Вероятность невозможного события считается равной 0, вероятность достоверного события – 1.

Случайная величина и ее описание. При проведении экспериментов случайные события, как правило, формально соотносят с некоторой величиной Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru , которую принято называть случайной. В зависимости от природы исследуемого явления соответствующие случайные величины могут быть дискретными (например, количество дефектных изделий в партии) или непрерывными (как значение артериального давления). Исчерпывающее описание случайной величины дает ее функция распределения. Функция распределения для некоторого конкретного значения Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru определяется вероятностью того события, что случайная величина Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru примет значение, меньшее этого конкретного Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru : Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru

Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru

Рис. 1. Функция распределения случайной величины.

Функция распределения – положительная неубывающая функция, принимающая значения от 0 до 1 (рис.1). Для дискретных случайных величин можно указать вероятность Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru появления конкретного значения Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru . Для непрерывных случайных величин такого рода описанием является первая производная функции распределения, которая получила название плотности вероятности значений случайной величины Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru (иногда ее называют просто распределением случайной величины):

Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru

Чтобы понять смысл плотности вероятности, можно воспользоваться аналогией с массой и плотностью тела, представив в качестве массы тела функцию распределения, объема тела – интервал значений случайной величины, плотности тела – плотность вероятности. Это положительная функция, площадь под кривой которой относительно оси значений случайной величины Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru равна единице (рис. 2). Таким образом, случайную величину полностью характеризуют ее функция распределения (для дискретных и непрерывных величин) или плотность вероятности (для непрерывных величин).

Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru

Рис. 2. Плотность вероятности случайной величины.

Для более компактного (частичного) описания случайной величины служат числовые характеристики (или статистики) случайных величин. Важнейшие из них – среднее значение Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru и дисперсия Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru , или же среднеквадратичное (стандартное) отклонение Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru , равное корню квадратному из дисперсии. Среднее значение – это некоторое центральное значение случайной величины, которое определяет положение кривой плотности вероятности вдоль оси Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru значений случайной величины. В частности, при увеличении среднего значения Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru кривая плотности вероятности сдвигается вправо (рис.3). Среднеквадратичное отклонение характеризует разброс основной массы значений случайной величины относительно среднего. При увеличении дисперсии (или среднеквадратичного отклонения Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru ) кривая плотности вероятности «размазывается» вдоль оси Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru значений случайной величины (рис. 3).

Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru Рис. 3. Изменение кривой плотности вероятности при увеличении среднего и дисперсии.

Результаты наблюдений трактуются как реализации соответствующей случайной величины. Все возможные (реально или умозрительно) реализации случайной величины составляют ее т.н. генеральную совокупность (популяцию). Генеральная совокупность редко наблюдаема в опыте главным образом по причине ограниченности ресурсов (времени, стоимости обследования, емкости устройств хранения информации и т.п.).

Статистический опыт (эксперимент). Совокупность наблюдений с точки зрения практической статистики есть данные. Известно, что с классическими функциями можно производить арифметические действия как с функциями. С вероятностями как с функциями также можно оперировать, и в теории вероятности формализованы законы сложения и умножения вероятностей. Эти формализации, в свою очередь, являются основой статистических вычислений. Получение конкретной реализации случайной величины называется статистическим опытом. При многократном повторении опыта – получении множества реализаций – предполагается (но зачастую явно не оговаривается) неизменность условий опыта. Абсолютную неизменность условий любого опыта, понятно, нельзя обеспечить, поэтому на практике речь идет лишь об обеспечении относительно стабильных условий. Обеспечение стабильности условий эксперимента в значительной степени искусство. Выполнение требований стабильности опыта – предмет методологии сбора данных. Чаще, статистик призван обрабатывать уже кем-то собранные данные. Необходимо, однако, учитывать возможность того, что данные были получены в условиях непостоянства условий опыта; для последующей обработки и анализа таких данных следует использовать адекватные методы.

Центральная предельная теорема. Наиболее распространенной вероятностной моделью в статистике является нормальная (гауссова) модель. К ней сводится большое количество практических задач теории вероятности и математической статистики. Генеральной совокупностью данной модели является множество исходов статистического опыта, отражающего аддитивное взаимодействие большого количества независимых случайных явлений (процессов).

Данная вероятностная модель относится к классу т.н. параметрических моделей, т.е. моделей, аналитический вид которых однозначно задается с помощью конечного числа параметров. В гауссовом случае параметрами модели являются математическое ожидание μ (среднее значение генеральной совокупности) и дисперсия Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий - student2.ru – мера разброса значений случайной величины относительно математического ожидания.

Распространенность гауссовой модели объясняется фундаментальным свойством природы, характеризующим распределение вероятности суммы большого числа независимых случайных явлений (процессов). Это свойство, формулируемое как центральная предельная теорема, проявляется в том, что, сумма n одинаково распределенных случайных величин, стремится к нормальному (гауссову) распределению при бесконечном увеличении n. (На практике оказывается достаточным эффект аддитивного взаимодействия порядка n=30 независимых случайных величин.)

Наряду с параметрическими, в статистике используются также непараметрические модели. В непараметрических моделях закон распределения вероятностей генеральной совокупности полагается неизвестным.

Библиография

1. Головина, Г. М., Крылов, В. Ю., Савченко, Т. Н. Математические методы в современной психологии: статус, разработка, применение / Г.М. Головина, В.Ю. Крылов, Т.Н. Савченко. - М.: Изд-во Института психологии РАН. - 1995. – 260с.

2. Суходольский, Г. В. Математические методы в психологии / Г.В. Суходольский. - Харьков: Изд-во Гуманитарный Центр. - 2006. – 512с.

3. Тарасов, С.Г. Основы применения математических методов в психологии. / С.Г. Тарасов. - СПб.: Изд-во: Санкт - Петербург. ун-та. - 1999. – 326с.

4. Глинский, В. В., Ионин, В. Г. Статистический анализ данных / В.В. Глинский, В.Г. Ионин. - М.: Филин. - 2008. – 265с.

Лекция 3.

Наши рекомендации