Схема 2. Структура статистической совокупности

На примере нашего исследования — статистическая совокупность — это студенты, обучающиеся в данном вузе на протяжении всего периода обучения.

Различают два вида совокупности — генеральная и выборочная.

Генеральная совокупность — это группа, состоящая из всех относительно однородных элементов в соответствии с поставленной целью.

Выборочная совокупность — отобранная для исследования часть генеральной совокупности и предназначенная для характеристики всей генеральной совокупности. Она должна быть репрезентативна (представительна) по количеству и качеству по отношению к генеральной совокупности.

Репрезентативность количественнаяоснована на законе больших чисел и означает достаточную численность элементов выборочной совокупности, рассчитываемую по специальным формулам и таблицам.

Репрезентативность качественная основана на законе вероятности и означает соответствие (однотипность) признаков, характеризующих элементы выборочной совокупности по отношению к генеральной.

В нашем примере генеральной совокупностью являются все студенты медицинского вуза; выборочной совокупностью — часть студентов каждого курса и факультета данного вуза.

Как правило, основной задачей любого эксперимента является получение информации об изучаемых объектах и/или явлениях. Саму суть понятия «информация» достаточно сложно сформулировать, хотя бы из-за того, что любое определение данного понятия будет являться тавтологией по своей сути. Кроме того, еще А. Н. Колмогоров, стоявший у истоков создания теории информации, задавался вопросом о том, существует ли информация независимо от ее восприятия или определяется индивидуальными особенностями исследователя. Таким образом, возникает противоречие, которое можно лишь отчасти разрешить, если описывать информацию как потенциальное свойство.

Информация — это потенциальные свойства некого объекта или системы, которые доступны для хранения, передачи, преобразования и выявления при изучении разумным существом.

Данные — это информация, представленная в формализованном виде.

Формализация данных может достигаться различными методами.

Тип данных— это метод формализации, который определяется сущностью изучаемого параметра.

Переменная — это совокупность первичных сигналов, содержащая данные определенного типа, доступные для изменения.

Прежде чем перейти к анализу собранных данных, надо понять, какого они типа. Так же как знание пищевых предпочтений рыбы говорит рыбаку, на какую наживку ловить разные виды, знание типа данных подскажет нам выбор измерительного инструмента.

Первая попытка классификации переменных в статистике, сохранившая своё значение до настоящего времени, была предпринята в 1946 г. Стэнли Смитом Стивенсом (Stanley Smith Stevens). Схема классификации была основана на типах операций, допустимых для данной переменной. Например, для переменных, обозначающих пол или религию допустимы только сравнения типа равно – не равно, а сравнения типа больше – меньше или арифметические операции не допустимы; как следствие, для этих переменных может быть определена такая статистика, как мода (наиболее вероятное значение), и не может быть определено математическое ожидание (среднее значение). В порядке возрастания числа допустимых операций Стивенс ввёл следующие уровни классификации переменных: номинальный (nominal), порядковый (ordinal) и непрерывный (continuous), причём последний делился на подуровни интервальный (interval) и относительный (ratio).

Важность понимания различий типов данных обусловлена потребностью исследователя в их анализе и последующем осмыслении результатов. Различия в типах данных являются отправной точкой для выбора математических методов, которые должны применяться для анализа результатов эксперимента или наблюдения, а также для правомочности использования того или иного способа представления данных (схема 3).

 
  Схема 2. Структура статистической совокупности - student2.ru


Наши рекомендации