Теорема. Дисперсия равна среднему квадратов значений признака минус квадрат общей средней
Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия:
.
Кроме дисперсии, для характеристики рассеяния значений признака генеральной совокупности вокруг своего среднего значения пользуются сводной характеристикой – средним квадратическим отклонением.
Выборочным средним квадратическим отклонением (стандартом)называют квадратный корень из выброчной дисперсии:
.
Генеральным средним квадратическим отклонением (стандартом)называют квадратный корень из генеральной дисперсии:
.
Оценка характеристик положения
Наиболее распространенными опенками характеристик положения являются среднее арифметическое выборки (выборочное среднее), выборочная медиана и выборочная мода. В дальнейшем будем, опускать термин «выборочная», имея, однако, в виду, что любая оценка, начисляемая по выборке, является всего лишь приближенным значением соответствующей характеристики генеральной совокупности
В качестве меры относительного разброса данных используют коэффициент вариации
или
Величину отклонения выборочного показателя (статистики) от его генерального параметра называют статистической ошибкой. Для измерения этой ошибки некоторой статистики квадратичная (стандартная) ошибка статистики (нельзя путать со средним квадратичным отклонением изучаемой случайной переменной). Так, стандартная ошибка среднего арифметического может быть найдена по формуле:
Доверительный интервал
По известным точечным выборочным характеристикам можно построить интервальную оценку или доверительный интервал, в котором с той или иной вероятностью находится генеральный параметр. Вероятности, признанные достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей, называют доверительными. Обычно в медико-биологических исследованиях приемлемым является значение доверительной вероятности Р=0,05 (95%). При этом вероятность выхода истинного значения параметра за пределы этих границ не превышает 1-0,95=0,05 (5%). Величину, дополняющую доверительную вероятность да единицы, обычно обозначают α.
Как известно из центральной предельной теоремы, независимо от распределения исходной совокупности, из которой извлечены выборки, выборочные средние имеют приближенно нормальное распределение. Таким образом, доверительный интервал для выборочного среднего значения находится между границами и , где - стандартная ошибка среднего, - коэффициент Стьюдента, величина, зависящая от объема выборки (или соответствующего числа степеней свободы ) и выбранного уровня доверительной вероятности, определяется по таблицам распределений Стьюдента. Величина коэффициента , определяется по таблице на уровне α, дополняющем доверительную вероятность до 1,т.е. в случае 95% доверительного интервала на уровне (1 -0,95) = 0,05 с учетом симметрии интервала.
Вариационный ряд — числовые значения признака, представленные в ранговом порядке с соответствующими этим значениям частотами.
Основные обозначения вариационного ряда:
- варианта, отдельное числовое выражение изучаемого признака;
- частота (“вес”) варианты, число ее повторений в вариационном ряду;
n — общее число наблюдений (т.е. сумма всех частот, n=Σ );
- крайние варианты, ограничивающие вариационный ряд (лимиты ряда);
- амплитуда ряда (т.е. разность между максимальной и минимальной вариантами, ).
Виды вариационных рядов:
а) простой — ряд, в котором каждая варианта встречается по одному разу (р=1);
б)взвешенный — ряд, в котором отдельные варианты встречаются неоднократно и с разной частотой.
Назначение вариационного ряда
Вариационный ряд используется для определения средней величины ( ) и критериев разнообразия признака, подлежащего изучению ( ).
Средняя величина - обобщающая характеристика размера изучаемого признака. Она позволяет одним числом количественно охарактеризовать качественно однородную совокупность.
Применение средних величин:
а) для оценки состояния здоровья - например, параметров физического развития (средний рост, средний вес, средний объем жизненной емкости легких и др.), соматических показателей (средний уровень сахара в крови, средний пульс, средняя СОЭ и др.);
б) для оценки организации работы лечебно-профилактических и санитарно-противоэпидемических учреждений, а также деятельности отдельных врачей и других медицинских работников (средняя длительность пребывания больного на койке, среднее число посещений на 1 ч приема в поликлинике и др.);
в) для оценки состояния окружающей среды.
Среднеквадратическое отклонение - мера колеблемости (вариабельности) вариационного ряда. Сигма - величина именованная, т.е. выражается в тех же единицах, что и варианты ряда.
Применение среднеквадратического отклонения:
а) для суждения о колеблемости вариационных рядов и сравнительной оценки типичности (представительности) средних арифметических величин. Это необходимо в дифференциальной диагностике при определении устойчивости признаков;
б) для реконструкции вариационного ряда, т.е. восстановления его частотной характеристики на основе правила «трех сигм». В интервале М±3σ находится 99,7% всех вариант ряда, в интервале М±2σ— 95,5% и в интервале М±1σ— 68,3% вариант ряда;
в) для выявления «выскакивающих» вариант (при сопоставлении реального и реконструированного вариационных рядов);
г) для определения параметров нормы и патологии с помощью сигмальных оценок;
д) для расчета коэффициента вариации;
е) для расчета средней ошибки средней арифметической величины.
Коэффициент вариации (C) - процентное отношение среднеквадратического отклонения к среднеарифметической величине:
Коэффициент вариации - это относительная мера колеблемости вариационного ряда.
Применение коэффициента вариации
а) для оценки разнообразия каждого конкретного вариационного ряда и, соответственно, суждения о типичности отдельной средней (т.е. ее способности быть полноценной обобщающей характеристикой данного ряда). При С<10% разнообразие ряда считается слабым, при С от 10% до 20% - средним, а при С>20% - сильным. Сильное разнообразие ряда свидетельствует о малой представительности (типичности) соответствующей средней величины и, следовательно, о нецелесообразности ее использования в практических целях.
б) для сравнительной оценки разнообразия (колеблемости) разноименных вариационных рядов и выявления более-менее стабильных признаков, что имеет значение в дифференциальной диагностике.
ЗАДАЧА-ЭТАЛОН
Условие задачи. В городе N в 2000 г. проведено измерение массы тела 7-летних мальчиков. По данным аналогичного исследования, выполненного в городе N в 1990 г., средняя масса тела 7-летних мальчиков составила 23,8 кг, σ± 3,6 кг.
Задание.1. Вычислить среднюю арифметическую величину ( ) и критерии разнообразия вариационного ряда (σ, С).
2. Оценить полученные результаты, сравнить их с данными предыдущего исследования, сделать соответствующие выводы.
РЕШЕНИЕ ЗАДАЧИ