Отчет по лабораторной работе № 1
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
САНКТ-ПЕТЕРБУРГСКИЙ «ГОРНЫЙ» УНИВЕРСИТЕТ
Отчет по лабораторной работе № 1
По дисциплине: Методы математической статистики в маркшейдерском обеспечении
Характеристики случайного распределения результатов измерений горно-геологических показателей
Выполнил: ст. гр. ГГ-12-1 _________ Большаков А. Н.
(подпись) (Ф. И. О.)
Проверил: асс. каф. МД _________ Алексенко А. Г.
(подпись) (Ф. И. О.)
Дата: 22.11.2016
Санкт-Петербург
Цель работы – изучение начальных понятий математической статистики, способа построения вариационного ряда, нахождения числовых характеристик статистических значений показателя.
В качестве примера рассмотрена выборка представленная в таблице 1. В данной таблице указано содержание свинца в полиметаллических рудах (в %), объемом 100 значений.
Таблица 1 – Выборка результатов определения содержания свинца
Содержание полезного компонента в рудном теле может принимать любые значения, поэтому данные случайные величины являются непрерывными. Для непрерывной случайно величины составляют интервальные вариационные ряды. Величина интервала подсчитывается по формуле Стерджеса (1):
(1)
где – объем выборки; – максимальное значение из выборки; – минимальное значение из выборки.
В выборке значения показателей называются вариантами, а объем каждого варианта – его частотой.
Для сопоставимости вариационных рядов с различными объемами выборок используют значения относительных частот или частостей, вычисляемых по формуле (2):
(2)
Для упрощения вычислений при отработке вариационных рядов удобно пользоваться условными значениями вариантов (3):
(3)
где – среднее значение показателя в i-м интервале; – среднее значение интервала с наибольшей частотой.
Положение центра распределения определяют:
– математическим ожиданием;
– модой;
– медианой.
Для оценки рассеивания отдельных значений относительно центра пользуются:
– дисперсией;
– СКО;
–коэффициентом вариации;
– асимметрией;
– эксцессом.
Среднее выборочное значение показателя рассчитывается по формулам (4):
(4)
Мода – значение показателя, которое имеет наибольшую вероятность (частоту). Мода рассчитывается по формуле (5):
(5)
где и – частоты и частости предыдущего, модального и последующего интервалов вариационного ряда соответственно; – нижняя граница модального интервала.
Медиана – значение показателя в выборке, которое делит ряд распределения по частоте или частости на две равные части. Медиану определяют по формулам (6):
(6)
где , – накопленные частости или частоты до начала медианного интервала.
Приближенная оценка симметричности распределения:
– симметричное распределение;
– левосторонняя асимметрия;
– правосторонняя асимметрия.
Выборочная дисперсия (7):
(7)
где , – условные моменты первого и второго порядка соответственно.
Условные моменты (8):
(8)
СКО (9):
(9)
Коэффициент вариации характеризует относительную величину рассеивания значений показателя (10):
(10)
Асимметрия (11):
(11)
где – центральный момент третьего порядка: .
Оценка симметричности распределения:
–симметричное распределение;
– левосторонняя асимметрия;
– правосторонняя асимметрия.
СКО величины (12):
(12)
Асимметрию считают не существенной, если .
Эксцесс (оценка «крутизны» эмпирической кривой) (13):
(13)
где – центральный момент четвертого порядка: .
СКО величины (14):
(14)
Эксцесс существенный, если .
Результаты вычислений представлены ниже.
Величина интервала по формуле (1):
Таблица 2 – Распределение вариационного ряда
Среднее выборочное значение показателя по формуле (4):
Мода по формуле (5):
(5)
Медиана по формуле (6):
(6)
Приближенная оценка симметричности распределения:
– левосторонняя асимметрия.
Выборочная дисперсия (7):
(7)
где , – условные моменты первого и второго порядка соответственно.
СКО (9):
(9)
Коэффициент вариации характеризует относительную величину рассеивания значений показателя (10):
(10)
Асимметрия (11):
(11)
Оценка симметричности распределения:
– левосторонняя асимметрия.
СКО величины (12):
(12)
Асимметрия несущественная, так как .
Эксцесс (13):
(13)
СКО величины (14):
(14)
Эксцесс несущественный, так как .
Также была выполнена проверка гипотезы по двум критериям. Для этого была создана таблица, содержащая вероятности попадания в интервал, накопленные вероятности и их разности – таблица 3.
Значение рассчитано по формуле:
(15)
Значения функции плотности распределения были взяты из таблицы, а также вычислены использованием встроенной статистической функции в табличный процессор MS Excel.
Вероятность попадания в интервал получена по формуле:
(16)
где первое значение .
Теоретические частоты получаются путем умножения на число измерений .
Накопленные вероятности и получаются последовательным суммированием и . Величина .
Таблица 3 – Вероятности попадания в интервал, накопленные вероятности
Критерий согласия Пирсона вычисляется по формуле:
(17)
где – число интервалов.
Гипотеза соответствия распределения наблюденного ряда случайных величин нормальному закону принимается, если соблюдается условие: , где – значение, выбираемое по числу степеней свободы ( при нормальном законе распределения).
, а , следовательно, можно сделать вывод о несоответствии нормальному закону распределения по критерию согласия Пирсона.
Критерий согласия Колмогорова:
(18)
Гипотеза принимается, если соблюдается условие: . Значения зависят от уровня значимости. В нашем случае .
, следовательно, можно утверждать о близости фактического распределения величин к нормальному по критерию согласия Колмогорова.
По результатам расчетов были построены эмпирическая и теоретическая кривые распределения показателя.
Рисунок 1 – Эмпирическая и теоретическая кривые распределения показателя
Вывод: в данной лабораторной работе были изучены начальные понятия математической статистики, способ построения вариационного ряда, нахождение числовых характеристик статистических значений показателя, а также некоторые критерия отнесения распределения величин к нормальному распределению.