Генеральная совокупность и выборка
Понятия генеральной совокупности и выборки из нее являются основополагающими в статистике. Строгие определения заимствованы из теории вероятностей, хотя терминология этих двух наук различается. Вместо случайной величины в теории вероятностей, в математической статистике вводится понятие о генеральной совокупности. Под генеральной совокупностьюпонимают множество всех возможных значений случайной величины [3, 4, 9].
Вместо эксперимента (испытания, опыта), в результате которого случайная величина приняла значение (в теории вероятностей), в математической статистике вводится понятие о случайном выборе из генеральной совокупности значения . Уместная в теории вероятностей фраза «в результате независимых испытаний случайная величина приняла значения » преобразуется: «случайная выборка объема извлечена из генеральной совокупности ».
Рассмотрим определения понятия «выборка», даваемые в [3, 4, 5].
Выборка – множество независимых, одинаково распределенных случайных величин.
Выборка – множество числовых значений, которые приняла исследуемая случайная величина в повторных независимых испытаниях (при этом отдельные числовые значения случайной величины в каждом испытании называются реализациями данной случайной величины, а сами испытания проводятся в неизменных условиях).
Эти два определения эквивалентны. Действительно, при рассмотрении задачи – вычисление среднего значения случайной величины Х (числа очков на грани игральной кости) – можно построить опыт двумя способами: подбрасывать один кубик много раз ( раз) и вычислить среднее арифметическое по этим n реализациям (второе определение), или можно взять n одинаковых кубиков, подбросить их один раз, обеспечивая одинаковые условия испытаний (первое определение). Очевидно, значения средних арифметических, вычисленных по результатам обоих опытов, будут различны, поскольку среднее арифметическое как функция от реализаций случайной величины само является случайной величиной. А математическое ожидание как среднее по всей генеральной совокупности будет одинаковым и равным .
Выборку можно понимать и как совокупность случайно отобранных объектов. В этом случае генеральная совокупность – совокупность объектов, из которых производится выборка. Приводя данное определение, необходимо упомянуть о повторных и бесповторных выборках. Повторная выборка производится таким образом, что отобранный объект возвращается в генеральную совокупность перед отбором следующего. При бесповторной выборке отобранные объекты не возвращаются в генеральную совокупность.
Статистический ряд
Вариационным (статистическим) рядом называется таблица, первая строка которой содержит в порядке возрастания элементы ', а вторая - их частоты (относительные частоты .
В математической статистике исследуются утверждения, которые могут быть сделаны на основе измерения некоторой величины, на простейшем примере поясним постановку (одной из многих) задач математической статистики.
Пусть требуется измерить некоторую величину . Результаты измерений
естественно рассматривать как значения случайных величин , полученных в данном эксперименте. Если измерительный инструмент не имеет систематической ошибки, то можно положить . Следовательно, возникает задача оценить параметр . Для решения задачи рассмотрим случайную величину Тогда
Это обстоятельство приводит к мысли построить статистические характеристики:
Первая представляет среднее арифметическое наблюденных значений случайной величины и статистическую дисперсию - во втором случае. В соответствии с законом больших чисел эти среднеарифметические сходятся по вероятности соответственно к математическому ожиданию величины и к дисперсии
При ограниченности наблюдений эксперимента заменой и на и совершаем погрешность, а при небольшом числе наблюдений величины , являются случайными величинами. Возникает задача об оценке неизвестных параметров , случайной величины на основе экспериментальных данных, т.е. задача - найти подходящие значения этих параметров.
Множество результатов измерений величины называется выборкой объема . Для того, чтобы иметь возможность воспользоваться аппаратом теории вероятностей, целесообразно наблюдаемую величину рассматривать как случайную величину, функцию распределения которой следует определить.
Полученный статистический материал , , ... наблюдений представляет собой первичные данные о величине, подлежащей статистической обработке. Обычно такие статистические данные оформляются в виде таблицы, графика, гистограммы и т.д. Если выборка объема содержит различных элементов , причем встречается раз, то число называется частотой элемента , а отношение называетсяотносительной частотой элемента . Очевидно, что