Вариационный ряд. гистограмма. полигон
Задачи математической статистики
Математическая статистика – это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений с целью выявления существующих закономерностей. Единственный способ получения информации о случайной величине – это проведение экспериментов. Все характеристики должны быть получены по экспериментальным данным.
Одна из основных задач математической статистики состоит в том, чтобы по экспериментальным данным сделать выводы о параметрах распределения. Например, определить их приближенные значения (оценки) и указать ошибку их определения.
Важным разделом является статистическая проверка предположений (гипотез) о законах распределения случайных величин, равенстве математических ожиданий, дисперсии и т.п.
Основные задачи математической статистики заключаются в следующим:
1. статистическое оценивание параметров законов распределения.
2. статистическая проверка гипотез.
Генеральная совокупность и выборка
Обычно исследования проводятся не на единичных, а на групповых объектах объединённых по какому-либо признаку. Совокупность таких относительно однородных, но индивидуально различных единиц наблюдения, объединяемых по некоторым качественным или количественным признакам, характеризующим эти объекты, называется совокупностью.
Опр. Совокупность всех мыслимых наблюдений или мысленно возможных объектов исследования называется генеральной.
Генеральная совокупность есть понятие условно математическое или абстрактное, а на практике обычно используется часть членов генеральной совокупности, которая носит название выборки или выборочной совокупности.
Например, чтобы дать ответ об эффективности некоторого препарата для лечения гриппа, необходимо его проверить в отношении всех больных страдающих этим заболеванием на земном шаре. Такая группа больных относится к генеральной совокупности. На практике клиническая апробация препаратов проводится на ограниченном контингенте больных (выборочной совокупности).
Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности).
Ввиду неполного отображения выборкой статистических характеристик генеральной совокупности необходимо:
1. организовать получение выборки так, чтобы она наиболее полно характеризовала свойства и особенности генеральной совокупности (репрезентативность выборки);
2. в каждом конкретном случае устанавливать, с какой уверенностью можно перенести результаты выборочного наблюдения на всю генеральную совокупность.
Для выполнения первого условия необходимо, чтобы выборка была типичной и объективной, что достигается использованием принципа случайного отбора объектов исследования из генеральной совокупностью.
Выделяют два метода проведения исследования: повторный и бесповторный. В первом случае все объекты после проведения наблюдений над ними возвращаются обратно в генеральную совокупность. При бесповторном отборе выбранный объект обратно в генеральную совокупность не возвращается.
Вариационный ряд. Гистограмма. Полигон
Входе экспериментов, исследователь получает набор числовых данных, отражающих результаты измерений или наблюдений исследуемых объектов. Совокупность этих числовых данных представленных в виде последовательности результатов наблюдений х1, х2, х3, ….., хп - есть выборка из генеральной совокупности. Основная задача первичного статистического анализа состоит в том, чтобы по имеющимся экспериментальным данным охарактеризовать исследуемую генеральную совокупность небольшим числом параметров.
Если полученные данные расположить в порядке убывания или возрастания числовых значений исследуемого признака, то такой ряд чисел будет называться вариационным рядом.
В том случае, когда среди числовых данных есть одинаковые значения, их можно представить в виде таблицы. В первой строке таблицы указываются значения признака (варианты), а во второй – абсолютные или относительные частоты их встречаемости. Такое представление вариационного ряда называют статистическим распределением.
Опр. Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.
Пример 3.1. Ежедневное количество студентов, посещающих методический кабинет на протяжении ряда дней: 15,17,16,18,20,21,18,17,20,15,18,17,16,19,17,16,18,19,18,19. Составить статистическое распределение выборки.
Значение признака хi | |||||||
Частота встречаемости mi | |||||||
Относительная частота fi = | 0,1 | 0,15 | 0,2 | 0,25 | 0,15 | 0,1 | 0,05 |
Для графического изображения статистического распределения строят полигоны и гистограммы.
Опр. Гистограммой называется график, по оси абсцисс которого отложены границы классов, а по оси ординат – их частоты.
Для построения гистограммы весь диапазон измеряемой величины разбивается на равные интервалы, называемые классами. Ширину интервала можно определить по формуле Стерджеса: , где h – ширина интервала, максимальное, – минимальное значение выборочной величины, n – количество выборочных данных. Однако эта формула носит эмпирический характер и на практике количество интервалов выбирают в пределах 7-12. После выбора количества интервалов устанавливают границы классов (Сi) и срединные значения классов ( ), где - середина i-го класса, i=1,2,3,…..,k – количество классов.
Пример 3.2.Построить гистограмму и полигон для примера 3.1.
Интервал | 14,5-15,5 | 15,5-16,5 | 16,5-17,5 | 17,5-18,5 | 18,5-19,5 | 19,5-20,5 | 20,5-21,5 |
Частота встречаемости mi | |||||||
Относительная частота fi = | 0,1 | 0,15 | 0,2 | 0,25 | 0,15 | 0,1 | 0,05 |
Полигон частот можно получить из гистограммы путём соединения срединных значений классов. График полигона частот легко построить и по статистическому распределению. На оси абсцисс из точек хi, проводятся перпендикуляры высотой и соединяются ломанной прямой.