Связь между качественными признаками
Для изучения корреляционных связей статистиками разработаны разные методы, каждый из которых решает свои конкретные задачи. Одни коэффициенты связи пригодны для измерения взаимосвязей качественных признаков, другие — для качественных и количественных, третьи — для количественных. Абсолютное большинство их применимо в социально-правовых и криминологических изучениях, поэтому необходимо познакомиться с ними хотя бы в самом общем виде.
Для измерения связи между качественными (атрибутивными) признаками в статистике широко используются коэффициент сопряженности А.А.Чупрова, коэффициент ассоциации К.Пирсона, а также коэффициенты ранговой корреляции Спирмена и Кендалла.1. Коэффициент ассоциации К.Пирсона (КП) в плане исчисления — относительно простой показатель сопряженности величин. Он применяется к вариации двух качественных признаков, распределенных по двум группам.
2. Коэффициент взаимной сопряженности, разработанный отечественным статистиком А.А.Чупровым (КЧ), в отличие от коэффициента Пирсона применяется для измерения связи между соотношением двух атрибутивных признаков по трем и более группам.
3. Особая роль в выявлении связей не только между качественными, но и количественными признаками принадлежит параллельным статистическим рядам. С одной стороны, они представленном явлении, и вижу, что, сколько бы и как бы подробно я ни наблюдал стрелку часов, клапан и колеса паровоза и почку дуба, я не узнаю причину Благовеста, движения паровоза и весеннего ветра. Для этого я должен изменить совершенно свою точку наблюдения и изучать законы движения пара, колокола и ветра».
Ранговый коэффициент корреляции
Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.
Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:
1) Сопоставать каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).
2) Определить разности рангов каждой пары сопоставляемых значений.
3) Возвести в квадрат каждую разность и суммировать полученные результаты.
4) Вычислить коэффициент корреляции рангов по формуле:.
Понятия регрессия
Регрессия (лат. regressio — обратное движение) в статистике — статистическая зависимость среднего значения случайной величины от значений другой случайной величины или нескольких случайных величин; введена Фрэнсисом Гальтоном (1886).
Классическим примером средней регрессии служит зависимость среднего роста детей от роста родителей (Фрэнсис Гальтон, 1886), а также зависимость средних диаметров сосен от их высот, зависимость среднего роста человека от его веса и т.п.
Графические способы выражения рядов
Метод наименьших квадратов
Задача заключается в нахождении коэффициентов линейной зависимости, при которых функция двух переменных а и b формула принимает наименьшее значение. То есть, при данных а и b сумма квадратов отклонений экспериментальных данных от найденной прямой будет наименьшей. В этом вся суть метода наименьших квадратов.
Таким образом, решение примера сводится к нахождению экстремума функции двух переменных.
Метод наименьших квадратов— один из базовых методов регрессионного анализа для оценки неизвестных параметров регрессионных моделей по выборочным данным. Метод основан на минимизации суммы квадратов остатков регрессии.
Линейная регрессия
Линейная регрессия (англ. Linear regression) — используемая в статистике регрессионная модель зависимости одной (объясняемой, зависимой) переменной y от другой или нескольких других переменных (факторов, регрессоров, независимых переменных) x с линейной функцией зависимости.
Модель линейной регрессии является часто используемой и наиболее изученной в эконометрике. А именно изучены свойства оценок параметров, получаемых различными методами при предположениях о вероятностных характеристиках факторов, и случайных ошибок модели. Предельные (асимптотические) свойства оценок нелинейных моделей также выводятся исходя из аппроксимации последних линейными моделями. Необходимо отметить, что с эконометрической точки зрения более важное значение имеет линейность по параметрам, чем линейность по факторам модели.
Коэффициент регрессии
Коэффициенты регрессии показывают интенсивность влияния факторов на результативный показатель. Если проведена предварительная стандартизация факторных показателей, то b0 равняется среднему значению результативного показателя в совокупности. Коэффициенты b1, b2, ..., bn показывают, на сколько единиц уровень результативного показателя отклоняется от своего среднего значения, если значения факторного показателя отклоняются от среднего, равного нулю, на одно стандартное отклонение. Таким образом, коэффициенты регрессии характеризуют степень значимости отдельных факторов для повышения уровня результативного показателя. Конкретные значения коэффициентов регрессии определяют по эмпирическим данным согласно методу наименьших квадратов (в результате решения систем нормальных уравнений).