Тема 2. Генеральная совокупность, выборка, среднее арифметическое, медиана
Основные понятия и термины: генеральная совокупность, выборка, среднее арифметическое и среднее геометрическое, медиана.
Краткое изложение теоретических вопросов:
Математическая статистика –это наука, занимающаяся методами обработки экспериментальных данных.
Математическая статистика решает задачи :
1) систематизировать полученный статистический материал;
2) на основании полученных экспериментальных данных оценить интересующие нас числовые характеристики наблюдаемой случайной величины;
3) определить число опытов, достаточное для получения достоверных результатов при минимальных ошибках измерения.
Таким образом, математическая статистика помогает экспериментатору лучше разобраться в полученных опытных данных, оценить, значимы или нет определенные факты, принять или отбросить те или иные гипотезы о природе рассматриваемого явления.
Определение. Всю совокупность объектов, подлежащих изучению, называют генеральной совокупностью.
Генеральной совокупностью могут быть всё население страны, месячная продукция завода и т.д.
Но генеральная совокупность - это не просто множество. Если интересующая нас совокупность объектов слишком многочисленна, или объекты труднодоступны, или имеются другие причины, не позволяющие изучить все объекты, прибегают к изучению какой-то части объектов.
Определение. Та часть объектов, которая попала на проверку, исследование и т.п., называется выборочной совокупностью или простовыборкой.
Определение. Число элементов в генеральной совокупности и выборке называется их объёмами.
Большая осведомлённость позволяет действовать лучше, но всё равно на некоторой стадии наступает незнание и, как результат – случайный выбор.
Что представляют собой выборки? Это ряды чисел.
Определение. Различные значения случайной величины называются вариантами.
Определение. Вариационным рядом называется ряд, расположенный в порядке возрастания (или убывания) вариантов с соответствующими им частотами
Задача
Дана выборка: 1,3; 1,8; 1,2; 3,0; 2,1; 5; 2,4; 1,2; 3,2;1,2; 4; 2,4.
Это ряд вариантов. Расположив эти варианты в возрастающем порядке, мы получим вариационный ряд: 1,2; 1,2; 1,2; 1,3; 1,8; 2,1; 2,4; 2,4; 3,0; 3,2; 4; 5.
Составим таблицу
xi | 1,2 | 1,3 | 1,8 | 2,1 | 2,4 | 3,0 | 3,2 | ||
ni | |||||||||
ni/n | 3/12=1/4 | 1/12 | 1/12 | 1/12 | 2/12 | 1/12 | 1/12 | 1/12 | 1/12 |
Такие таблицы называют частотными. В них числа второй строки – частоты; они показывают, как часто встречаются в выборке те или другие её значения.
Определение. Относительной частотой значений выборки называют отношение её частоты к числу всех значений выборки.
Найдём размах ряда: R=5-1,2=3,8; Размах ряда равен 3,8.
Выборки характеризуются центральными тенденциями: средним значением, модой и медианой. Средним значением выборки называют среднее арифметическое всех её значений. Мода выборки – те её значения, которые встречаются чаще всего. Медиана выборки – это число, “разделяющее” пополам упорядоченную совокупность всех значений выборки.
Задача
Дана выборка: 1,3; 1,8; 1,2; 3,0; 2,1; 5; 2,4; 1,2; 3,2;1,2; 4; 2,4.
Это ряд вариантов. Расположив эти варианты в возрастающем порядке, мы получим вариационный ряд: 1,2; 1,2; 1,2; 1,3; 1,8; 2,1; 2,4; 2,4; 3,0; 3,2; 4; 5.
Среднее значение этого ряда равно 2,4.
Медиана ряда 2,25.
Мода ряда –1,2.
Медианой вариационного ряда называется то значение случайной величины, которое приходится на средину вариационного ряда (Ме).
Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине.
Модой вариационного ряда называют вариант (значение случайной величины), которому соответствует наибольшая частота (Мо), т.е. которая встречается чаще других.
Среднеарифметическим значением вариационного ряда называется результат деления суммы значений статистической переменной на число этих значений, то есть на число слагаемых.
Размахомряда называется разность между R=xmax - xmin, т.е. наибольшим и наименьшим значениями этих вариантов.
Проверим, правильно ли мы нашли среднее значение этого ряда, медиану и моду, опираясь на определения.
Сосчитали число членов, их 12 - чётное число членов, значит надо найти среднее арифметическое двух чисел записанных посередине, то есть 6 и 7-ой варианты. (2,1+2,4)\2=2.25 – медиана.
Мода. Модой является 1.2, т.к. только это число встречается 3 раза, а остальные встречаются меньше, чем 3 раза.
Среднеарифметическое значение находим так:
(1,2*3+1,3+1,8+2,1+2,4*2+3,0+3,2 +4+5)\12=2,4
Составим таблицу
xi | 1,2 | 1,3 | 1,8 | 2,1 | 2,4 | 3,0 | 3,2 | ||
ni | |||||||||
ni/n | 3/12=1/4 | 1/12 | 1/12 | 1/12 | 2/12 | 1/12 | 1/12 | 1/12 | 1/12 |
Такие таблицы называют частотными. В них числа второй строки – частоты; они показывают, как часто встречаются в выборке те или другие её значения.
Относительной частотой значений выборки называют отношение её частоты к числу всех значений выборки.
Найдём размах ряда: R=5-1,2=3,8; Размах ряда равен 3,8.
В статистике широкое применение находят такие характеристики, как мода и медиана.
Мода является наиболее приемлемым показателем при выявлении расфасовки некоторого товара, которой отдают предпочтение покупатели; цены на товар данного вида, распространённый на рынке; как размер обуви, одежды, пользующийся наибольшим спросом; вид спорта, которым предпочитают заниматься большинство населения страны, города, посёлка школы и т.д.