Классический анализ родственных корреляций

Сходство родственников, принадлежащих к разным поколениям (предки — потомки), обычно оценивается коэффициентом корреля­ции Пирсона, который называют также межклассовым коэффициен­том корреляции. В случае близнецов и сиблингов применяется коэф­фициент внутриклассовой корреляции, подсчитываемый на основе дисперсионного анализа:

где х/и х. — значения одного и того же признака у близнецов одной пары.

Использование внутриклассовой корреляции в данном случае обус­ловлено тем, что нет генетического критерия для отнесения того или иного члена пары в тот или другой вариационный ряд. В табл. 8.4 при­веден пример вычисления внутриклассовой корреляции для МЗ близ­нецов.

Таблица 8.4 Вычисление внутриклассового коэффициента корреляции

Значение признака х-х2 гх2У х,+х2  
Пары близнец 1 *. близнец 2 Х2
2 3 4 5 4 3 2 4 7 6 2 1 3 2 -2 1 1 1 4 4 1 1 1 16 10 5 3 7 256 100 25 9 49
    СУММЫ

Конец страницы №194

Начало страницы №195

Внутриклассовый коэффициент корреляции, в отличие от меж­классового, не изменяется при перемене мест членов пары.

При подсчете коэффициента корреляции обычно вычисляется и ошибка его измерения. Это важно, так как наличие ошибок измерения ведет к иска­жению коэффициента корреляции и, следовательно, при проведении генети­ческого анализа по коэффициентам корреляции между родственниками бу­дут получаться смещенные оценки компонентов дисперсии признака. В свя­зи с этим производится поправка коэффициентов корреляции на дисперсию ошибки измерения, для чего проводят повторные измерения признаков у од­них и тех же индивидов. Дисперсия ошибки измерения равна внутрипарной дисперсии (Ve — W), вычисленной по повторным измерениям. Когда диспер­сия ошибки подсчитана, коррекция межклассовых коэффициентов корреля­ции осуществляется с использованием следующей формулы:

где Я — исходный коэффициент корреляции между первыми и вторыми род­ственниками по изучаемому признаку; S,, S2 — дисперсии признака у соот­ветствующих родственников.

Использование индексов 1-й (например, родители) и 2-й (например, дети) групп родственников обусловлено тем, что указанные группы могут отличать­ся друг от друга по изучаемым признакам вследствие половых, возрастных и тому подобных различий.

Коррекция коэффициентов внутриклассовой корреляции (между близне­цами, сиблингами) на дисперсию ошибки измерения проводится по формуле:

где В— межпарная дисперсия, W— внутрипарная дисперсия. Если приведен­ные в табл. 8.5 данные рассматривать как повторные измерения одних и тех же индивидов, то дисперсия ошибки измерения Ve = W= 1,1, а внутриклассовая корреляция в данном случае соответствует коэффициенту воспроизводимости.

Корреляции разных типов родственников несут в себе специфи­ческую информацию о разных составляющих фенотипической дис­персии в популяции (табл. 8.5). Например, при изучении пары прием­ный родитель — усыновленный ребенок можно получить оценку вклада

Конец страницы №195

Начало страницы №196

общей семейной и родительско-детской среды. При изучении же только корреляций биологических родителей и детей разделить составляю­щие генетической аддитивной дисперсии и родительско-детской сре­ды невозможно, поскольку их объединяет и общая среда, и 50% об­щих генов. Этот метод применим только в сочетании по крайней мере с одним другим методом, который позволил бы разделить влияния генетических и средовых компонентов.

Таблица 8.5

Вклады аддитивного (VA), доминантного (VD) и общего средового ( VEC) компонентов фенотипической дисперсии в фенотипические корреляции разных типов родственников

Типы родственников уА    
Биологические родители и дети Уг о у
Приемные родители и дети о ' С(ВРО) у
Сиблинги с одним общим родителем « ' С(АРО) у
Сиблинги Уг 1А у
Двуяйцевые близнецы Уг V* QFS) у
Однояйцевые близнецы 1,0 1,0 rC(DZ) 'C(MZ)

Примечание. Здесь и далее:

ВРО — родители х дети (biological parent-offspring); АРО — приемные родите­ли х дети (adopted parent-offspring); HS — полусиблинги (half-sibling); FS — пол­ные сиблинги (full-sibling); DZ — ДЗ близнецы (dizygotic twins); MZ' — МЗ близ­нецы (monozygotic twins).

С целью максимизации информации, полученной при анализе раз­ных типов родственников, ученые совмещают несколько методов в рам­ках одного исследования. Выбор методов для исследования того или иного признака является специальной задачей. Главное правило здесь заключается в том, что количество независимых исходных статистик (т.е. количество корреляций между родственниками) должно превышать количество неизвестных в системе уравнений. Если это правило не выдерживается, система уравнений однозначного решения не имеет.

Например, представим себе, что мы исследуем по некоторому признаку биологические семьи, каждая из которых растит по крайней мере двух детей. Соответственно, мы можем определить корреляции по исследуемому признаку как между родителями и детьми, так и между сиблингами в данных семьях. Любая из этих пар будет иметь в среднем 50% общих генов, что позволяет, используя информацию из табл. 8.5, записать следующую систему уоавнений:

Конец страницы №196

Начало страницы №197

Очевидно, что полученное после некоторых алгебраических пре­образований уравнение rgpo - VQBPO) = rfS - [V*VD + VC(FS>]/Vp одно­значного решения не имеет, поскольку в нем присутствуют только 2 известных, но 3 неизвестных члена.

Напротив, совмещение родительско-детских корреляций, полу­ченных в приемных и биологических семьях, позволяет записать сис­тему уравнений, решающих эту проблему:

После преобразования получим

Данное уравнение имеет однозначное решение, поскольку VJ Vp — ~ ^ГВРО ~ ГАРО>-

Чем больше различных пар родственников включено в анализ, тем больше компонентов дисперсии может быть определено однозначно и тем более сложные и разветвленные модели могут оцениваться.

В качестве иллюстрации рассмотрим два метода, используемых для разделения генетической и средовой составляющих фенотипической дисперсии в популяции (подробнее о методах психогенетики — в гл. VII).

Метод близнецов. Этот метод, без сомнения, был и до сих пор является одним из ведущих методов психогенетики. Классический ва­риант метода близнецов основывается на том, что монозиготные (МЗ) и дизиготные (ДЗ) близнецы характеризуются различной степенью генетического сходства, в то время как их среда может считаться при­близительно одинаковой. На языке составляющих фенотипической дисперсии (см. табл. 8.2 и 8.3) это можно выразить так:

Соотнеся первое и третье уравнения, получим: 1 - г = V IV

1 ' MZ ' N' V P •

МЗ близнецы представляют собой идентичные генетические ко­пии друг друга, поэтому теоретически корреляция МЗ близнецов по признаку, вариативность которого в популяции находится полностью под генетическим контролем, должна равняться 1,0. Разницу между 1,0 и реальной корреляцией МЗ близнецов можно объяснить влияни­ями индивидуальной среды или ошибки измерения (компонент VN содержит в нерасчлененном виде обе эти составляющие).

Отметим, что приведенные закономерности соотношения МЗ и ДЗ близнецов справедливы только при следующих условиях (частично речь о них шла в гл. VII):

Конец страницы №197

Начало страницы №198

Центральным допущением при использовании метода близне­цов в любом его варианте является допущение о равенстве среды МЗ и ДЗ близнецов. Важно отметить, что оно подразумевает не одинако­вость близнецовых сред, а тот факт, что распределение (частота встре­чаемости и разброс) средовых компонентов монозиготных близнецов не превышает разнообразия сред дизиготных. Правомерность этого допущения до сих пор исследуется и обсуждается психогенетиками: если оно не справедливо, то получаемые этим методом оценки коэф­фициента наследуемости искажены. Как уже говорилось, это допуще­ние касается не всей близнецовой среды, а только тех ее аспектов, которые связаны с изучаемым признаком (если они известны).

2. Vax Е = 0, т.е. принимается допущение об отсутствии ГС-взаи­
модействия. Заметим, что в некоторых случаях такое допущение впол­
не правомерно, в большинстве же случаев оно требует тщательной
эмпирической проверки.

3. Сом' = 0, т.е. принимается допущение об отсутствии генотип-
средовой ковариации. Прямо проверить это допущение в рамках клас­
сического близнецового метода невозможно. Поэтому, как и в случае
двух предыдущих допущений, отсутствие ГС-ковариации и корреля­
ции при использовании классического метода близнецов принимает­
ся на веру.

4. Ассортативность по исследуемому признаку не отличается от
нуля (т.е. ц = 0). Как уже говорилось, это допущение для большинства
исследуемых в психогенетике признаков неверно: неслучайность под­
бора супружеских пар у человека — скорее правило, чем исключение.
Поэтому допущение об отсутствии ассортативности надо обязательно
проверять (в том случае, если в литературе отсутствуют необходимые
сведения) по данным о супружеских парах. В общем случае корреля­
ция между супругами включает в себя компонент, обусловленный
ассортативностью брака, и компонент, обусловленный влиянием се­
мейных систематических средовых факторов. Самым простым и на­
дежным способом проверки этого допущения является обследование
родителей близнецов. Не имея данных о родителях (т.е. корреляций
между родителями по исследуемому признаку), исследователь не мо­
жет «развести» эффекты ассортативности и эффекты семейной среды.
Наличие же значимой ассортативности повышает возможность полу­
чения ДЗ одинаковых генов от обоих родителей (у МЗ и без этого
фактора их 100%), повышая гдз и тем самым снижая разность гт — г
и, следовательно, величину коэффициента наследуемости (о нем речь
пойдет ниже).

5. В генетическом механизме изучаемого признака отсутствуют эпи-статические взаимодействия (Vr). Это условие принимается как долж­ное практически во всех психологических исследованиях (многие ис­следователи принимают данное допущение a priori, даже не обсуждая его правомерность). Однако в ситуациях, когда это допущение не-

Конец страницы №198

Начало страницы №199

справедливо, оценки составляющих фенотипической дисперсии мо­гут быть сильно искажены, поскольку эпистатическое взаимодействие генов может значительно уменьшить генетическое сходство ДЗ близ­нецов, тем самым увеличивая разницу между гт и гдз и приводя к завышенным оценкам коэффициента наследуемости.

Однако даже в том (весьма неправдоподобном!) случае, когда ис­следуется психологический признак, для которого соблюдаются все вышеперечисленные условия, оценить все четыре компонента феноти­пической дисперсии (VA, VD, Vc, VN) в рамках метода близнецов невоз­можно, так как четыре независимых величины не могут быть определе­ны из трех линейных уравнений. Ученые, тем не менее, сделав несколь­ко упрощающих допущений, разработали несколько способов оценки коэффициента наследуемости на основе метода близнецов. Отметим, что ни один из этих методов не является «правильным» или «непра­вильным» — каждый из них обладает определенными достоинствами и недостатками. Рассмотрим кратко хотя бы три наиболее часто встре­чающихся в литературе метода оценки коэффициента наследуемости.

КОЭФФИЦИЕНТ ХОЛЬЦИНГЕРА

К. Хольцингер предложил следующую формулу для оценки насле­дуемости:

Данная формула, как и следующая, адекватна только в случае, если среда МЗ равна таковой у ДЗ, при наличии же VD эта оценка будет смещенной. Поскольку в этой формуле Vc и VN заменены на удвоенную VN, то нетрудно заметить, что при Vc < VN этот коэффи­циент будет завышен, а при Vc > VN, наоборот, занижен.

КОЭФФИЦИЕНТ ИГНАТЬЕВА*

В качестве первой оценки величины генетической составляющей фенотипической дисперсии часто используется коэффициент Игна­тьева, вычисляемый следующим образом:

* Данный способ оценки генетического компонента дисперсии в зарубежной психогенетике связан с именем Д. Фальконера, работа которого вышла в 1960 г. Однако этот коэффициент был предложен еще в 1934 г. М.В. Игнатьевым. Кратко об этом см. во Введении, а также в работах В.М. Гиндилиса [97J и Б.И. Кочубея [132, гл. I]. В формуле Игнатьева используются иные символы, но, поскольку в современной науке утвердились приводимые далее обозначения, будем пользо­ваться ими и мы. В приводимой ниже формуле Ео6п — то же, что Ес, a Emj) — то же, что EN в предыдущем тексте (см. табл. 8.3).

Конец страницы №199

Начало страницы №200

При наличии доминантного компонента дисперсии VD оценка наследуемости будет завышена.

Очевидно, что влияние любых факторов, изменяющих разницу между корреляциями двух типов близнецов (например, завышение корреляции между МЗ близнецами, возникающее в результате дей­ствия специфической для этого типа близнецов среды), будет влиять на эту оценку наследуемости. Хотя в последние годы появились и все чаще употребляются более современные и сложные методы статисти­ческого анализа, этот коэффициент, в силу своей аргументированно­сти и простоты получения, остается в арсенале психогенетики. Более того, Р. Пломин предложил с помощью этой формулы оценивать — тоже в первом приближении, конечно, — и долю средовых компо­нентов:

где Ебт — общесемейная среда (Vc), E д — индивидуальная среда (VN).

Правда, в оценку индивидуальной среды неизбежно включается часть дисперсии, вызванная ошибкой измерения. Возможность кор­рекции этого дефекта обсуждена выше.

МЕТОД ДЕ ФРИЗА И ФУЛКЕРА (ДФ-МЕТОД)

Дж. де Фриз и Д. Фулкер разработали две регрессионные модели: 1) классическую регрессионную модель, в которой частная регрессия значения со-близнеца на значение близнеца—условного пробанда и коэффициент родства представляет собой тест генетической этиоло­гии исследуемого признака, и 2) расширенную регрессионную мо­дель, предоставляющую прямое свидетельство того, насколько инди­видуальные различия внутри исследуемой группы объясняются гене­тическими и средовыми влияниями. Эти два регрессионных уравнения записываются следующим образом:

где С — значение со-близнеца по исследуемому признаку (данный метод подразумевает выделение в каждой паре одного близнеца — условного пробанда, тогда второй близнец называется со-близнецом); Р — значение близнеца-пробанда по тому же признаку; R — коэффи­циент родства (1 для МЗ и 0,5 для ДЗ близнецов); PR — произведение

Конец страницы №200

Начало страницы №201

значения пробанда по исследуемому признаку на коэффициент род­ства; А — константа регрессионного уравнения.

Решение этих уравнений позволяет оценить следующие парамет­ры: 5, представляет собой показатель среднего сходства между МЗ и ДЗ близнецами; В2 — оценку удвоенной разницы между средними в группах МЗ и ДЗ близнецов (с учетом ковариации между значениями МЗ и ДЗ пробандов); fi3 оценивает долю дисперсии, объясняемую сре­довыми влияниями, общими для членов близнецовой пары (Yc/Vp или С2); ВА отражает разницу И2 — h2, где h2— коэффициент наследу­емости в широком смысле и h2g — коэффициент наследуемости в оп­ределенной группе (например, коэффициенты наследуемости IQ в группах здоровых людей и людей, страдающих ФКУ, отличаются друг от друга; В4 показывает разницу коэффициентов наследуемости, по­лученных в генеральной популяции и специфической выборке); и, наконец, В5 оценивает коэффициент наследуемости (Л2), т. е. показа­тель того, насколько индивидуальные различия в исследуемой выбор­ке объясняются наследуемыми влияниями.

Интересной особенностью ДФ-метода является то, что он позво­ляет тестировать гипотезу о сходстве или различии этиологии нор­мально распределенных и экстремальных значений. Сравнение рег­рессионных коэффициентов В2 и Вь позволяет проверить гипотезу о том, сходны ли этиологии девиантных и «средних» значений, напри­мер, по тесту на математические способности. Если этиология неспо­собности к математике отличается от этиологии средних математи­ческих способностей, то В2 и В5 должны статистически надежно отли­чаться друг от друга. Если же дети, которые имеют трудности в овладении математикой, представляют собой не отдельную группу, а край нормального распределения, то В2 и Вь статистически отличать­ся друг от друга не должны.

Разные формулы для вычисления коэффициентов наследуемости характеризуются разного рода допущениями и ограничениями. В не­скольких исследованиях было продемонстрировано, что применение разных формул на одном и том же эмпирическом материале дает раз­ные результаты. Поэтому интерпретация данных, полученных одним методом близнецов, должна проводиться с учетом всех ограничений, свойственных этому методу. Ф. Фогель и А. Мотульски [159] отмечают, что даже при сильно упрощающих допущениях (например, отсутствия ассортативности, доминирования и т.д.) все равно остаются система­тические ошибки, которые невозможно полностью проконтролиро­вать. Они рекомендуют вычислять из одних и тех же эмпирических данных альтернативные оценки и сравнивать, насколько хорошо они совпадают.

Метод приемных детей. При допущении, что среда семей-усыно­вителей не коррелирует со средой тех биологических семей, из кото­рых данные дети усыновляются, корреляции детей с их биологичес-

Конец страницы №201

Начало страницы №202

кими родителями представляют собой «чистые» генетические корре­ляции (т.е. прямую оценку И2 или VG/VP), а с родителями-усыновите­лями — «чистые» средовые корреляции (с2 или Vc/Vp). Однако в том случае, если среды биологических и приемных семей похожи, допу­щение о «чистоте» полученных оценок генетической и средовой со­ставляющих чаще всего неправомерно (по крайней мере в тех случа­ях, когда корреляция сред неизвестна). Методологически адекватным, хотя практически и не всегда возможным решением в подобной ситу­ации служит получение нескольких оценок генетического и средово-го компонентов при разных значениях корреляции сред.

Таким образом, главной причиной беспокойства при использова­нии метода приемных детей является допущение об отсутствии кор­реляции между биологическими и приемными семьями. Кроме того, исследователи должны убедиться в том, что семьи-усыновители реп­резентативны общей популяции, т.е. не отличаются от среднепопуля-ционной семьи по уровню благосостояния, образования и т.п. Если семьи-усыновители нерепрезентативны, закономерности, полученные в результате их анализа, не могут считаться справедливыми для гене­ральной популяции.

АНАЛИЗ ПУТЕЙ

Приведенная выше логика разложения фенотипической диспер­сии на ее составляющие, реализованная в нескольких эмпирических методах, представляет собой один из способов определения коэффи­циента наследуемости того или иного признака. Но понятие наследу­емости можно также проанализировать при помощи «анализа путей».

Анализ путей в последние десятилетия широко используется и в психогенетике, и в науках о поведении вообще. Он был предложен генетиком С. Райтом еще в 30-х годах и затем им же и другими иссле­дователями детально разработан. Четкое изложение его основ и пра­вил использования содержится в упоминавшемся труде М. Нила и Л. Кардона [342], которые характеризуют этот метод следующим образом.

Диаграмма путей — эвристйчный способ наглядного графическо­го представления причинных и корреляционных связей (путей) меж­ду переменными, позволяющий дать полное математическое описа­ние линейной модели, которую применяют исследователи. Тем са­мым диаграмма путей способствует ее пониманию, верификации или представлению результатов. В целом путевые модели — «экстремально обобщенный» способ анализа, один из многих мультивариативных методов (к ним же относятся методы множественной регрессии, фак­торный и дискриминантный анализы и т.д.).

Существуют определенные правила построения диаграмм пу­тей (рис. 8.4). Прямоугольники (или квадраты) обозначают наблюда-

Конец страницы №202

Начало страницы №203

Рис.8.4. Диаграмма путей, объединяющая три латентных (А, В, Q и две

наблюдаемых (D и Е) переменных.

р и q — корреляции; г, s, w, x, у, z — путевые коэффициенты.

Рис.8.5. Диаграмма путей для корреляций совместно живущих пар МЗ и ДЗ близнецов.

Tv Г, — близнецы одной пары. G — генотип; С— общая среда; U — индивидуаль­ная (уникальная) среда; /— эпистаз. Пути А, с — влияния G, С на исследуемую черту.

емые переменные; круги (или эллипсы) — латентные, неизмеряе-мые переменные (на рис. 8.4. D и Е; А, В, С соответственно).

Связи между переменными обозначаются стрелками: постулиро­ванные исследователем причинно-следственные — направленной в одну сторону («путь» от причины к следствию); наблюдаемые ассо­циации — двусторонней. На рис. 8.4 первые — w, x, у, z, r, s (путевые коэффициенты); вторые — р и q (коэффициенты корреляции). Ина­че говоря, модель выделяет зависимые переменные (D и Е), подле­жащие объяснению или прогнозированию, и независимые {А, В, С), действие которых должно объяснить или предсказать зависимые пе­ременные и их связи. Есть и другие, более детальные, правила офор­мления и чтения путевых диаграмм, но мы их рассматривать не будем. На рис. 8.5 даны модели путей для корреляций совместно живу­щих пар МЗ и ДЗ близнецов по экстраверсии, из которых следует, что

Конец страницы №203

Начало страницы №204

корреляция МЗ близнецов Г, и Тг может быть выражена через сумму путей, связывающих их, т.е. /г/г и ее; иначе говоря, гиз = h22. Для ДЗ это будут пути h*'/2*h и се, т.е. rдз = '/2h2 + с2. Вычитая, получим rm — гдз = h2 + с2 — '/2h2 — с2 = V2h2; чтобы получить полную генетичес­кую дисперсию (а не половину ее), удваиваем разность корреляций И2 = 2(rмз — rдз) и получаем описанный выше коэффициент наследу­емости, справедливый для близнецовых исследований. Аналогичным образом могут быть построены путевые диаграммы для семейных и любых других данных.

Единицы измерения, используемые в анализе путей, отличаются от тех, которыми мы оперировали тогда, когда рассматривали по­нятие наследуемости на примере разложения фенотипической дис­персии. Если при разложении дисперсии мы пользовались квадратич­ными единицами (например, h2, Vc), то в данном случае наследуе­мость описывается на языке стандартных отклонений. Тогда путевые коэффициенты являются коэффициентами регрессии, полученными для переменных не в исходных единицах, а для стандартизованных переменных.

Несмотря на широкое использование этого метода и его достоин­ства, которые заключаются прежде всего в наглядной демонстрации представлений о компонентах, влияющих на исследуемый признак, он имеет и своих критиков. Так, Ф. Фогель и А. Мотульски «не уверены в том, что этот метод биометрического анализа внесет существенный вклад в наше понимание генетических факторов» [159]. Одно из глав­ных сомнений вызывает тот факт, что в диаграмму путей и, следова­тельно, в дальнейший математический анализ закладываются уже имеющиеся у исследователя предположения о влияющих на признак факторах, их причинно-следственных отношениях и т.д., и результат анализа зависит, таким образом, от корректности заранее имеющих­ся исходных позиций.

АНАЛИЗ МНОЖЕСТВЕННЫХ ПЕРЕМЕННЫХ

До сих пор наши рассуждения концентрировались в основном на одном фенотипе, т.е. нашей конечной переменной являлся какой-то конкретно взятый фенотип. А если мы заинтересованы в одновремен­ном изучении двух фенотипов, которые теоретически могут быть свя­заны между собой? Например, связана ли вариативность в популяции по таким высоко коррелирующим признакам, как вербальный и не­вербальный интеллект? Насколько вероятно предположение о том, что вариативность по этим двум признакам может быть объяснена действием одних и тех же генетических и средовых влияний? Иными словами, если два признака коррелируют на фенотипическом уровне, то эта корреляция может быть результатом действия как генетичес-

Конец страницы №204

Начало страницы №205

Рис. 8.6. Диаграмма путей фенотипической корреляции двух призна­ков Рх и Ру, демонстрирующая роль генетической rG и средовой гЕ со­ставляющих.

ких, так и средовых факторов, и задача может заключаться в том, чтобы понять происхождение не только самих фенотипов, но и их корреляции.

Среди генетических причин, которые могут привести к появлению корре­ляции между признаками на фенотипическом уровне, следует указать на так называемый эффект плейотропии, или множественного влияния одних и тех же генов на разные признаки. Кроме того, различные популяционные про­цессы, например неслучайное скрещивание и смешивание популяций, также могут привести к возникновению корреляции между фенотипами.

Примером средового влияния на формирование фенотипической корре­ляции может служить дефицит питания: недоедающие дети обычно значи­тельно ниже своих сверстников как по весу, так и по росту, т.е. связь этих двух характеристик обеспечивается одним средовым фактором.

Значимость такого рода одновременного моделирования множе­ственных переменных трудно переоценить. Существуют целые классы поведенческих признаков, которые высоко коррелируют между собой (например, различные показатели когнитивной сферы, показатели эмоционально-волевой сферы и т.п.). Предположение о том, что ва­риативность по высоко коррелирующим психологическим признакам может объясняться действием одних и тех же генетических и/или сре­довых факторов кажется весьма правдоподобным.

Математическое описание множественных моделей достаточно просто. Рис. 8.6 представляет собой иллюстрацию того, как модель путей, рассмотренная нами, может быть разработана для одновре­менного анализа двух коррелирующих признаков. Подобно тому как фенотипическая вариативность отдельно взятого признака (Рх) отра­жает вариативность генотипов (hx) и сред (ех), фенотипическая кор­реляция между X я Y (гРхРу) может быть результатом набора генети­ческих (hx hy r0) и средовых (ех еу гЕ) путей, где rG и гЕ представляют

Конец страницы №205

Начало страницы №206

собой генетическую и средовую корреляции, соответственно. В зультате

rPxPy = hx hy rG + ex ev rF

ОЦЕНКА СОСТАВЛЯЮЩИХ ФЕНОТИПИЧЕСКОЙ ДИСПЕРСИИ МЕТОДОМ ПЕРЕБОРА (ПОДБОРА) МОДЕЛЕЙ (МПМ)

Некоторые корреляции родственников (например, корреляции МЗ близнецов, разлученных при рождении, или приемных сиблингов — усыновленных детей-неродственников, выросших в одном доме) сами по себе дают информацию, которой достаточно для получения отве­тов на центральные вопросы психогенетики о том, насколько вариа­тивность данного признака объясняется разнообразием сред и гено­типов, наблюдаемых в данной популяции. Подобное может быть сказано и о тех методах психогенетики, которые сопоставляют корреляции, полученные у двух типов родственников, например корреляции МЗ и ДЗ близнецов, приемных детей — с биологическими и приемными семьями.

Однако в современных исследованиях предпочтение при анализе психогенетических данных отдается не прямым оценкам составляю­щих фенотипической дисперсии, а применению метода перебора (подбора) моделей. Этот метод представляет собой специфическую адаптацию метода структурного моделирования к задачам генетики количественных признаков. МПМ отличается несколькими преиму­ществами: 1) более точной оценкой искомых параметров; 2) воз­можностью оценивать более сложные генетические модели, напри­мер учитывать половые различия и моделировать ГС-корреляции и в-заимодействия; 3) возможностью сводить в одном анализе данные, относящиеся к разным типам родственников, и получать, благодаря этому, относительно несмещенные оценки параметров и 4) возмож­ностью тестирования нескольких альтернативных моделей с целью выбора той, которая наилучшим образом соответствует исходным дан­ным.

В рамках генетики количественных признаков применение метода перебора моделей сводится к решению систем уравнений для обна­ружения такого набора параметров (т.е. подбора такой модели), ко­торый наилучшим образом соответствует набору исходных данных (корреляций родственников). Главное преимущество МПМ заклю­чается в том, что он позволяет тестировать все те допущения, которые не учитываются в традиционных методах генетики коли­чественных признаков. Например, обсуждая метод близнецов, мы указывали на то, что одним из допущений этого метода является допущение об отсутствии ассортативности. МПМ позволяет срав­нить две модели (учитывающую ассортативность и не учитываю-

Конец страницы №206

Начало страницы №207

Рис. 8.7. Диаграмма путей фенотипических корреляций по исследуемому признаку для двух типов МЗ близнецов: (а) выросших вместе и (б) разлу­ченных при рождении [по: 364]. Обозначения — в тексте.

щую ее) и выбрать ту, которая наилучшим образом соответствует эмпирическим данным.

В качестве еще одного примера применения МПМ рассмотрим анализ родственных корреляций на основе модели, приведенной на рис. 8.7. Эта модель описывает фенотипическое сходство МЗ двух типов — выросших вместе (а) и разлученных при рождении (б). Каждая из моделей содержит: две измеряемых переменных — фе-нотипические значения близнецов, Рт и PMZ), и две латентных, неизмеряемых переменных — эффекты генотипа (С), и эффекты сре­ды (Е). Среды близнецов, выросших вместе, коррелируют гЕ . Путь от латентной переменной — генотипа (G) к измеряемой перемен­ной — фенотипу (Р) обозначается /г; путь от латентной переменной среды (Е) к измеряемой переменной фенотипа (Р) обозначается е. Задача моделирования заключается в том, чтобы решить систему уравнений и оценить два неизвестных параметра — е и /г. Применяя правила анализа путей, запишем следующую систему уравнений:

Эта система содержит два уравнения и два неизвестных и решает­ся алгебраически. Итак, мы проиллюстрировали простое приложение МПМ. На пер­вом этапе с помощью диаграмм путей записывается система уравне­ний, описывающих фенотипические корреляции для всех типов род­ственников, данные которых анализируются. Затем исследователь фор­мулирует набор альтернативных моделей, среди которых и ведется поиск модели с наилучшим соответствием эмпирическим данным

Конец страницы №207

Начало страницы №208

Например, исследователь может протестировать соответствие полу­ченным данным следующих трех моделей, согласно которым феноти-пическое сходство родственников по определенному признаку объяс­няется: 1) только аддитивной генетической составляющей; 2) только доминантной генетической составляющей; 3) наличием и аддитив­ной, и доминантной генетических составляющих. Модель наилучшего соответствия выбирается на основе значения %-квадрата и других ста­тистических показателей, оценивающих степени соответствия модели исходным данным.

Как уже указывалось, перебираемые модели могут быть очень раз­ветвленными и сложными; они могут включать в себя множественные фенотипы, измеренные у нескольких типов родственников лонгитюд-ным методом (т.е. несколько раз за время исследования) и т.д.

Результаты применения МПМ могут быть использованы только при тестировании альтернативных моделей. Иными словами, МПМ не дает «доказательств» правильности тестируемой научной гипоте­зы; он позволяет лишь выбрать наиболее адекватную материалу гене­тическую модель. МПМ является элегантным и сложным статисти­ческим методом, применение которого требует наличия определен­ных навыков*.

СТРУКТУРНОЕ МОДЕЛИРОВАНИЕ

Структурное моделирование — сложный современный метод, требующий и больших объемов выборок, и специальной квалификации исследователя, и наличия соответствующих компьютерных программ. Детальное изложение его не входит в задачи данного учебника, мы даем краткую характеристику его возможностей, чтобы читатель, столкнувшись в литературе с этим типом ана­лиза, смог адекватно понять его смысл.

Статистические методы моделирования с помощью линейных структур­ных уравнений (МЛСУ)**, описывающих латентные переменные, были разра­ботаны на основе приемов статистического анализа множественных пере­менных, используемых биологами, экономистами, психологами и социолога­ми. МЛСУ предполагает формулирование набора гипотез о влиянии одних переменных (независимых) на другие (зависимые) переменные. Соответствие подобного набора гипотез, т.е. теоретической модели, и реальных данных, собранных при работе с конкретной выборкой, т.е. эмпирической модели, формализуется с помощью статистического алгоритма, оценивающего сте­пень их согласованности (меру соответствия).

* Полное описание спецификации МПМ в рамках количественной генети­
ки выходит за пределы данного учебника. Подробное изложение этого метода да­
ется в руководствах Лоэлина [320], а также Нила и Кардона [342]. На русском
языке пример применения МПМ в рамках психогенетики приведен в работе
Е.А. Григоренко и М. ЛаБуды [44].

* * История возникновения и этапы детальной разработки МЛСУ описаны
Бентлером [189; 190], а в работах Боллена [198] и Бентлера и его коллег [191]
соде

Наши рекомендации