Изучение взаимосвязи явлений
В статистике, как и в других науках, большое значение имеет закон всеобщей связи явлений, например: балансовая связь объемных показателей; зависимость средних величин от структуры совокупности; взаимосвязь индексных показателей; связь между изменениями одного и другого признаков и др.
При изучении связи между признаками и явлениями основными задачами статистики выступают:
а) проверка положений теории данного явления о возможности связи или выявление наличия связи;
б) определение формы и придание аналитического выражения исследуемой зависимости;
в) оценка тесноты связи между признаками и явлениями.
Принято различать следующие основные виды связи: балансовая, компонентная, факторная.В свою очередь факторная связь подразделяется нафункциональную и корреляционную. При функциональной связи определенному значению факторного признака (признаков) соответствует строго определенное значение результативного признака. В корреляционной связи одному итому же значению фактора могут соответствовать разные значения результативного признака.
Изучение взаимосвязи явлений может осуществляться с помощью приемов и методов статистики и математики. К первой группе методов относятся такие, как построение корреляционных таблиц, метод аналитических группировок и метод определения групповых средних, параллельное сопоставление рядов распределения, построение взаимосвязанных индексов, приемы выявления количественной оценки тренда рядов динамики, методы графических построений и др. Ко второй группе относятся методы корреляционного и регрессивного анализа.
При методе параллельного сопоставления рядов распределения записываются в первом столбце (первой строке) упорядоченные индивидуальные значения факторного признака (х), а во втором столбце (второй строке) – соответствующие им индивидуальные значения результативного признака (у).
Если количество единиц, входящих в наблюдение, относительно велико, данные о взаимосвязанных признаках целесообразно заносить в корреляционные таблицы. Цифры, помещенные в такие таблицы, показывают, сколько разданная величина одного признака повторяется в сочетании с соответствующей величиной другого признака.
Корреляционная связь обнаруживается более тесно, если применять метод аналитической группировки и определения групповых средних.
При исчислении групповых средних значений факторного признака и соответствующих им определенных значений результативного признака влияния случайных причин взаимопоглощаются.
Наличие и приблизительно тесноту связи можно определить по форме корреляционного поля. Корреляционное поле представляет собой точечный график, для построения которого по масштабной шкале оси абсцисс откладываются значения факторного признака х, а по масштабной шкале оси ординат – значения результативного признака у.
Каждой единице изучаемой совокупности на графике соответствует одна точка, положение которой определяется индивидуальными значениями двух рассматриваемых признаков. Если такой график имеет форму шара, то связь между признаками отсутствует или очень мала. Если точки образуют эллипс и ось эллипса не параллельна ни одной из осей, то связь есть. При этом чем больше вытянут эллипс, тем выше теснота связи.
Если материал статистического наблюдения был подвергнут аналитической группировке и по каждой группе вычислены средние арифметические, то эти средние также в виде точки могут быть нанесены на график корреляционного поля. Последовательное соединение точек этого графика образует эмпирическую линию связи (линию регрессии). По виду этой линии определяется форма (прямолинейная или криволинейная) и теснота связи (положительная
или отрицательная, тесная или слабая).
В теоретической линии регрессии находит графическое выражение форма (закон) корреляционной связи между изучаемыми признаками.
Численные значения параметров уравнения корреляционной связи определяются на основе имеющихся данных наблюдения способом наименьших квадратов из условия
где у, ух – соответственно эмпирические и теоретические значения результативного признака.
Для нахождения параметров уравнения прямой ух = a + bx используется система нормальных уравнений:
Степень тесноты корреляционной связи может оцениваться с использованием различных показателей: коэффициентов парной, частной и множественной корреляции; корреляционного отношения, индекса корреляции, коэффициентами ранговой корреляции и др.
Например, коэффициент парной (или линейной) корреляции может исчисляться по формуле
Если для количественной оценки тесноты связи используются ранжированные данные, то применяются непараметрические показатели: коэффициенты ранговой корреляции по Спирмену, по Кендэлу, коэффициент конкордации.
Например, коэффициент ранговой корреляции Спирмена определяется по формуле
где Rx , Ry – ранги изучаемых признаков;
n – количество единиц наблюдения.