Непараметрические методы оценки связи

Методы корреляционного и дисперсионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий), поэтому они получили название параметрических методов.

Между тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических.

Если изучается взаимосвязь двух качественных признаков, то используют комбинационное распределение единиц совокупности в форме так называемых таблиц взаимной сопряженности.

Рассмотрим методику анализа таблиц взаимной сопряженности на конкретном примере социальной мобильности как процесса преодоления замкнутости отдельных социальных и профессиональных групп населения. Ниже приведены данные о распределении выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей (табл.8.1).

Таблица 8.1 – Распределение выпускников средних школ по сферам занятости

    Число детей, занятых в      
Занятия            
промышленности сельском сфере сфере Всего  
родителей интеллектуального  
и строительстве хозяйстве обслуживания    
     
        труда    
1. Промышленность            
и строительство  
2. Сельское            
хозяйство  
3. Сфера            
обслуживания  
4. Сфера            
интеллектуального  
труда            
Всего  
             


Распределение частот по строкам и столбцам таблицы 8.1 взаимной сопряженности позволяет выявить основные закономерности социальной мобильности: 42,9 % детей родителей группы 1 («Промышленность и строительство») заняты в сфере интеллектуального труда (39 из 91); 38,9 % детей, родители которых трудятся в сельском хозяйстве, работают в промышленности (34 из 88) и т.д.

Можно заметить и явную наследственность в передаче профессий. Так, из пришедших в сельское хозяйство 29 человек, или 64,4 %, являются детьми работников сельского хозяйства; более чем у 50 % в сфере интеллектуального труда родители относятся к той же социальной группе и т.д.

Однако важно получить обобщающий показатель, характеризующий тесноту связи между признаками и позволяющий сравнить проявление связи в разных совокупностях. Для этой цели исчисляют, например, коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К):

Непараметрические методы оценки связи - student2.ru

          f              
  C =         (8.11)  
               
1+ f    
                   
                     
                           
          f              
K =                   (8.12)  
                     
                     
                 
      (K1 -1)(K 2 -1)  

Непараметрические методы оценки связи - student2.ru

где f 2 – показатель средней квадратической сопряженности, определяемый путем вычитания

единицы из суммы отношений квадратов частот каждой клетки корреляционной таблицы к произведению частот соответствующего столбца и строки:

  φ              
φ2 = å ij   - 1, где f = å f и f   = å f (8.13)  
         
ij f f     i j ij   j i ij    
  i   j            

К1 и К2 –число групп по каждому из признаков.Величина коэффициента взаимной сопряженности,отражающая тесноту связи между качественными признаками, колеблется в обычных для этих показателей пределах от 0 до 1.

Непараметрические методы оценки связи - student2.ru Непараметрические методы оценки связи - student2.ru

В социально-экономических исследованиях нередко встречаются ситуации, когда признак не выражается количественно, однако единицы совокупности можно упорядочить. Такое упорядочение единиц совокупности по значению признака называется ранжированием. Примерами могут быть ранжирование студентов (учеников) по способностям, любой совокупности людей по уровню образования, профессии, по способности к творчеству и т.д.



При ранжировании каждой единице совокупности присваивается ранг, т.е. порядковый номер. При совпадении значения признака у различных единиц им присваивается объединенный средний порядковый номер. Например, если у 5-й и 6-й единиц совокупности значения признаков одинаковы, обе получат ранг, равный

(5 + 6) / 2 = 5,5.

Измерение связи между ранжированными признаками производится с помощью ранговых коэффициентов корреляции Спирмена (r) и Кендэлла (t). Эти методы применимы не только для качественных, но и для количественных показателей, особенно при малом объеме совокупности, так как непараметрические методы ранговой корреляции не связаны ни с какими ограничениями относительно характера распределения признака.


Наши рекомендации