Классический анализ родственных корреляций
Сходство родственников, принадлежащих к разным поколениям (предки — потомки), обычно оценивается коэффициентом корреляции Пирсона, который называют также межклассовым коэффициентом корреляции. В случае близнецов и сиблингов применяется коэффициент внутриклассовой корреляции, подсчитываемый на основе дисперсионного анализа:
где х/и х. — значения одного и того же признака у близнецов одной пары.
Использование внутриклассовой корреляции в данном случае обусловлено тем, что нет генетического критерия для отнесения того или иного члена пары в тот или другой вариационный ряд. В табл. 8.4 приведен пример вычисления внутриклассовой корреляции для МЗ близнецов.
Таблица 8.4 Вычисление внутриклассового коэффициента корреляции
Значение признака | х-х2 | (хгх2У | х,+х2 | |||
Пары | близнец 1 *. | близнец 2 Х2 | ||||
2 3 4 5 | 4 3 2 4 | 7 6 2 1 3 | 2 -2 1 1 1 | 4 4 1 1 1 | 16 10 5 3 7 | 256 100 25 9 49 |
СУММЫ |
Конец страницы №194
Начало страницы №195
Внутриклассовый коэффициент корреляции, в отличие от межклассового, не изменяется при перемене мест членов пары.
При подсчете коэффициента корреляции обычно вычисляется и ошибка его измерения. Это важно, так как наличие ошибок измерения ведет к искажению коэффициента корреляции и, следовательно, при проведении генетического анализа по коэффициентам корреляции между родственниками будут получаться смещенные оценки компонентов дисперсии признака. В связи с этим производится поправка коэффициентов корреляции на дисперсию ошибки измерения, для чего проводят повторные измерения признаков у одних и тех же индивидов. Дисперсия ошибки измерения равна внутрипарной дисперсии (Ve — W), вычисленной по повторным измерениям. Когда дисперсия ошибки подсчитана, коррекция межклассовых коэффициентов корреляции осуществляется с использованием следующей формулы:
где Я — исходный коэффициент корреляции между первыми и вторыми родственниками по изучаемому признаку; S,, S2 — дисперсии признака у соответствующих родственников.
Использование индексов 1-й (например, родители) и 2-й (например, дети) групп родственников обусловлено тем, что указанные группы могут отличаться друг от друга по изучаемым признакам вследствие половых, возрастных и тому подобных различий.
Коррекция коэффициентов внутриклассовой корреляции (между близнецами, сиблингами) на дисперсию ошибки измерения проводится по формуле:
где В— межпарная дисперсия, W— внутрипарная дисперсия. Если приведенные в табл. 8.5 данные рассматривать как повторные измерения одних и тех же индивидов, то дисперсия ошибки измерения Ve = W= 1,1, а внутриклассовая корреляция в данном случае соответствует коэффициенту воспроизводимости.
Корреляции разных типов родственников несут в себе специфическую информацию о разных составляющих фенотипической дисперсии в популяции (табл. 8.5). Например, при изучении пары приемный родитель — усыновленный ребенок можно получить оценку вклада
Конец страницы №195
Начало страницы №196
общей семейной и родительско-детской среды. При изучении же только корреляций биологических родителей и детей разделить составляющие генетической аддитивной дисперсии и родительско-детской среды невозможно, поскольку их объединяет и общая среда, и 50% общих генов. Этот метод применим только в сочетании по крайней мере с одним другим методом, который позволил бы разделить влияния генетических и средовых компонентов.
Таблица 8.5
Вклады аддитивного (VA), доминантного (VD) и общего средового ( VEC) компонентов фенотипической дисперсии в фенотипические корреляции разных типов родственников
Типы родственников | уА | ||
Биологические родители и дети | Уг | о | у |
Приемные родители и дети | о | ' С(ВРО) у | |
Сиблинги с одним общим родителем | « | ' С(АРО) у | |
Сиблинги | Уг | 1А | у |
Двуяйцевые близнецы | Уг | V* | QFS) у |
Однояйцевые близнецы | 1,0 | 1,0 | rC(DZ) 'C(MZ) |
Примечание. Здесь и далее:
ВРО — родители х дети (biological parent-offspring); АРО — приемные родители х дети (adopted parent-offspring); HS — полусиблинги (half-sibling); FS — полные сиблинги (full-sibling); DZ — ДЗ близнецы (dizygotic twins); MZ' — МЗ близнецы (monozygotic twins).
С целью максимизации информации, полученной при анализе разных типов родственников, ученые совмещают несколько методов в рамках одного исследования. Выбор методов для исследования того или иного признака является специальной задачей. Главное правило здесь заключается в том, что количество независимых исходных статистик (т.е. количество корреляций между родственниками) должно превышать количество неизвестных в системе уравнений. Если это правило не выдерживается, система уравнений однозначного решения не имеет.
Например, представим себе, что мы исследуем по некоторому признаку биологические семьи, каждая из которых растит по крайней мере двух детей. Соответственно, мы можем определить корреляции по исследуемому признаку как между родителями и детьми, так и между сиблингами в данных семьях. Любая из этих пар будет иметь в среднем 50% общих генов, что позволяет, используя информацию из табл. 8.5, записать следующую систему уоавнений:
Конец страницы №196
Начало страницы №197
Очевидно, что полученное после некоторых алгебраических преобразований уравнение rgpo - VQBPO) = rfS - [V*VD + VC(FS>]/Vp однозначного решения не имеет, поскольку в нем присутствуют только 2 известных, но 3 неизвестных члена.
Напротив, совмещение родительско-детских корреляций, полученных в приемных и биологических семьях, позволяет записать систему уравнений, решающих эту проблему:
После преобразования получим
Данное уравнение имеет однозначное решение, поскольку VJ Vp — ~ ^ГВРО ~ ГАРО>-
Чем больше различных пар родственников включено в анализ, тем больше компонентов дисперсии может быть определено однозначно и тем более сложные и разветвленные модели могут оцениваться.
В качестве иллюстрации рассмотрим два метода, используемых для разделения генетической и средовой составляющих фенотипической дисперсии в популяции (подробнее о методах психогенетики — в гл. VII).
Метод близнецов. Этот метод, без сомнения, был и до сих пор является одним из ведущих методов психогенетики. Классический вариант метода близнецов основывается на том, что монозиготные (МЗ) и дизиготные (ДЗ) близнецы характеризуются различной степенью генетического сходства, в то время как их среда может считаться приблизительно одинаковой. На языке составляющих фенотипической дисперсии (см. табл. 8.2 и 8.3) это можно выразить так:
Соотнеся первое и третье уравнения, получим: 1 - г = V IV
1 ' MZ ' N' V P •
МЗ близнецы представляют собой идентичные генетические копии друг друга, поэтому теоретически корреляция МЗ близнецов по признаку, вариативность которого в популяции находится полностью под генетическим контролем, должна равняться 1,0. Разницу между 1,0 и реальной корреляцией МЗ близнецов можно объяснить влияниями индивидуальной среды или ошибки измерения (компонент VN содержит в нерасчлененном виде обе эти составляющие).
Отметим, что приведенные закономерности соотношения МЗ и ДЗ близнецов справедливы только при следующих условиях (частично речь о них шла в гл. VII):
Конец страницы №197
Начало страницы №198
Центральным допущением при использовании метода близнецов в любом его варианте является допущение о равенстве среды МЗ и ДЗ близнецов. Важно отметить, что оно подразумевает не одинаковость близнецовых сред, а тот факт, что распределение (частота встречаемости и разброс) средовых компонентов монозиготных близнецов не превышает разнообразия сред дизиготных. Правомерность этого допущения до сих пор исследуется и обсуждается психогенетиками: если оно не справедливо, то получаемые этим методом оценки коэффициента наследуемости искажены. Как уже говорилось, это допущение касается не всей близнецовой среды, а только тех ее аспектов, которые связаны с изучаемым признаком (если они известны).
2. Vax Е = 0, т.е. принимается допущение об отсутствии ГС-взаи
модействия. Заметим, что в некоторых случаях такое допущение впол
не правомерно, в большинстве же случаев оно требует тщательной
эмпирической проверки.
3. Сом' = 0, т.е. принимается допущение об отсутствии генотип-
средовой ковариации. Прямо проверить это допущение в рамках клас
сического близнецового метода невозможно. Поэтому, как и в случае
двух предыдущих допущений, отсутствие ГС-ковариации и корреля
ции при использовании классического метода близнецов принимает
ся на веру.
4. Ассортативность по исследуемому признаку не отличается от
нуля (т.е. ц = 0). Как уже говорилось, это допущение для большинства
исследуемых в психогенетике признаков неверно: неслучайность под
бора супружеских пар у человека — скорее правило, чем исключение.
Поэтому допущение об отсутствии ассортативности надо обязательно
проверять (в том случае, если в литературе отсутствуют необходимые
сведения) по данным о супружеских парах. В общем случае корреля
ция между супругами включает в себя компонент, обусловленный
ассортативностью брака, и компонент, обусловленный влиянием се
мейных систематических средовых факторов. Самым простым и на
дежным способом проверки этого допущения является обследование
родителей близнецов. Не имея данных о родителях (т.е. корреляций
между родителями по исследуемому признаку), исследователь не мо
жет «развести» эффекты ассортативности и эффекты семейной среды.
Наличие же значимой ассортативности повышает возможность полу
чения ДЗ одинаковых генов от обоих родителей (у МЗ и без этого
фактора их 100%), повышая гдз и тем самым снижая разность гт — г
и, следовательно, величину коэффициента наследуемости (о нем речь
пойдет ниже).
5. В генетическом механизме изучаемого признака отсутствуют эпи-статические взаимодействия (Vr). Это условие принимается как должное практически во всех психологических исследованиях (многие исследователи принимают данное допущение a priori, даже не обсуждая его правомерность). Однако в ситуациях, когда это допущение не-
Конец страницы №198
Начало страницы №199
справедливо, оценки составляющих фенотипической дисперсии могут быть сильно искажены, поскольку эпистатическое взаимодействие генов может значительно уменьшить генетическое сходство ДЗ близнецов, тем самым увеличивая разницу между гт и гдз и приводя к завышенным оценкам коэффициента наследуемости.
Однако даже в том (весьма неправдоподобном!) случае, когда исследуется психологический признак, для которого соблюдаются все вышеперечисленные условия, оценить все четыре компонента фенотипической дисперсии (VA, VD, Vc, VN) в рамках метода близнецов невозможно, так как четыре независимых величины не могут быть определены из трех линейных уравнений. Ученые, тем не менее, сделав несколько упрощающих допущений, разработали несколько способов оценки коэффициента наследуемости на основе метода близнецов. Отметим, что ни один из этих методов не является «правильным» или «неправильным» — каждый из них обладает определенными достоинствами и недостатками. Рассмотрим кратко хотя бы три наиболее часто встречающихся в литературе метода оценки коэффициента наследуемости.
КОЭФФИЦИЕНТ ХОЛЬЦИНГЕРА
К. Хольцингер предложил следующую формулу для оценки наследуемости:
Данная формула, как и следующая, адекватна только в случае, если среда МЗ равна таковой у ДЗ, при наличии же VD эта оценка будет смещенной. Поскольку в этой формуле Vc и VN заменены на удвоенную VN, то нетрудно заметить, что при Vc < VN этот коэффициент будет завышен, а при Vc > VN, наоборот, занижен.
КОЭФФИЦИЕНТ ИГНАТЬЕВА*
В качестве первой оценки величины генетической составляющей фенотипической дисперсии часто используется коэффициент Игнатьева, вычисляемый следующим образом:
* Данный способ оценки генетического компонента дисперсии в зарубежной психогенетике связан с именем Д. Фальконера, работа которого вышла в 1960 г. Однако этот коэффициент был предложен еще в 1934 г. М.В. Игнатьевым. Кратко об этом см. во Введении, а также в работах В.М. Гиндилиса [97J и Б.И. Кочубея [132, гл. I]. В формуле Игнатьева используются иные символы, но, поскольку в современной науке утвердились приводимые далее обозначения, будем пользоваться ими и мы. В приводимой ниже формуле Ео6п — то же, что Ес, a Emj) — то же, что EN в предыдущем тексте (см. табл. 8.3).
Конец страницы №199
Начало страницы №200
При наличии доминантного компонента дисперсии VD оценка наследуемости будет завышена.
Очевидно, что влияние любых факторов, изменяющих разницу между корреляциями двух типов близнецов (например, завышение корреляции между МЗ близнецами, возникающее в результате действия специфической для этого типа близнецов среды), будет влиять на эту оценку наследуемости. Хотя в последние годы появились и все чаще употребляются более современные и сложные методы статистического анализа, этот коэффициент, в силу своей аргументированности и простоты получения, остается в арсенале психогенетики. Более того, Р. Пломин предложил с помощью этой формулы оценивать — тоже в первом приближении, конечно, — и долю средовых компонентов:
где Ебт — общесемейная среда (Vc), E д — индивидуальная среда (VN).
Правда, в оценку индивидуальной среды неизбежно включается часть дисперсии, вызванная ошибкой измерения. Возможность коррекции этого дефекта обсуждена выше.
МЕТОД ДЕ ФРИЗА И ФУЛКЕРА (ДФ-МЕТОД)
Дж. де Фриз и Д. Фулкер разработали две регрессионные модели: 1) классическую регрессионную модель, в которой частная регрессия значения со-близнеца на значение близнеца—условного пробанда и коэффициент родства представляет собой тест генетической этиологии исследуемого признака, и 2) расширенную регрессионную модель, предоставляющую прямое свидетельство того, насколько индивидуальные различия внутри исследуемой группы объясняются генетическими и средовыми влияниями. Эти два регрессионных уравнения записываются следующим образом:
где С — значение со-близнеца по исследуемому признаку (данный метод подразумевает выделение в каждой паре одного близнеца — условного пробанда, тогда второй близнец называется со-близнецом); Р — значение близнеца-пробанда по тому же признаку; R — коэффициент родства (1 для МЗ и 0,5 для ДЗ близнецов); PR — произведение
Конец страницы №200
Начало страницы №201
значения пробанда по исследуемому признаку на коэффициент родства; А — константа регрессионного уравнения.
Решение этих уравнений позволяет оценить следующие параметры: 5, представляет собой показатель среднего сходства между МЗ и ДЗ близнецами; В2 — оценку удвоенной разницы между средними в группах МЗ и ДЗ близнецов (с учетом ковариации между значениями МЗ и ДЗ пробандов); fi3 оценивает долю дисперсии, объясняемую средовыми влияниями, общими для членов близнецовой пары (Yc/Vp или С2); ВА отражает разницу И2 — h2, где h2— коэффициент наследуемости в широком смысле и h2g — коэффициент наследуемости в определенной группе (например, коэффициенты наследуемости IQ в группах здоровых людей и людей, страдающих ФКУ, отличаются друг от друга; В4 показывает разницу коэффициентов наследуемости, полученных в генеральной популяции и специфической выборке); и, наконец, В5 оценивает коэффициент наследуемости (Л2), т. е. показатель того, насколько индивидуальные различия в исследуемой выборке объясняются наследуемыми влияниями.
Интересной особенностью ДФ-метода является то, что он позволяет тестировать гипотезу о сходстве или различии этиологии нормально распределенных и экстремальных значений. Сравнение регрессионных коэффициентов В2 и Вь позволяет проверить гипотезу о том, сходны ли этиологии девиантных и «средних» значений, например, по тесту на математические способности. Если этиология неспособности к математике отличается от этиологии средних математических способностей, то В2 и В5 должны статистически надежно отличаться друг от друга. Если же дети, которые имеют трудности в овладении математикой, представляют собой не отдельную группу, а край нормального распределения, то В2 и Вь статистически отличаться друг от друга не должны.
Разные формулы для вычисления коэффициентов наследуемости характеризуются разного рода допущениями и ограничениями. В нескольких исследованиях было продемонстрировано, что применение разных формул на одном и том же эмпирическом материале дает разные результаты. Поэтому интерпретация данных, полученных одним методом близнецов, должна проводиться с учетом всех ограничений, свойственных этому методу. Ф. Фогель и А. Мотульски [159] отмечают, что даже при сильно упрощающих допущениях (например, отсутствия ассортативности, доминирования и т.д.) все равно остаются систематические ошибки, которые невозможно полностью проконтролировать. Они рекомендуют вычислять из одних и тех же эмпирических данных альтернативные оценки и сравнивать, насколько хорошо они совпадают.
Метод приемных детей. При допущении, что среда семей-усыновителей не коррелирует со средой тех биологических семей, из которых данные дети усыновляются, корреляции детей с их биологичес-
Конец страницы №201
Начало страницы №202
кими родителями представляют собой «чистые» генетические корреляции (т.е. прямую оценку И2 или VG/VP), а с родителями-усыновителями — «чистые» средовые корреляции (с2 или Vc/Vp). Однако в том случае, если среды биологических и приемных семей похожи, допущение о «чистоте» полученных оценок генетической и средовой составляющих чаще всего неправомерно (по крайней мере в тех случаях, когда корреляция сред неизвестна). Методологически адекватным, хотя практически и не всегда возможным решением в подобной ситуации служит получение нескольких оценок генетического и средово-го компонентов при разных значениях корреляции сред.
Таким образом, главной причиной беспокойства при использовании метода приемных детей является допущение об отсутствии корреляции между биологическими и приемными семьями. Кроме того, исследователи должны убедиться в том, что семьи-усыновители репрезентативны общей популяции, т.е. не отличаются от среднепопуля-ционной семьи по уровню благосостояния, образования и т.п. Если семьи-усыновители нерепрезентативны, закономерности, полученные в результате их анализа, не могут считаться справедливыми для генеральной популяции.
АНАЛИЗ ПУТЕЙ
Приведенная выше логика разложения фенотипической дисперсии на ее составляющие, реализованная в нескольких эмпирических методах, представляет собой один из способов определения коэффициента наследуемости того или иного признака. Но понятие наследуемости можно также проанализировать при помощи «анализа путей».
Анализ путей в последние десятилетия широко используется и в психогенетике, и в науках о поведении вообще. Он был предложен генетиком С. Райтом еще в 30-х годах и затем им же и другими исследователями детально разработан. Четкое изложение его основ и правил использования содержится в упоминавшемся труде М. Нила и Л. Кардона [342], которые характеризуют этот метод следующим образом.
Диаграмма путей — эвристйчный способ наглядного графического представления причинных и корреляционных связей (путей) между переменными, позволяющий дать полное математическое описание линейной модели, которую применяют исследователи. Тем самым диаграмма путей способствует ее пониманию, верификации или представлению результатов. В целом путевые модели — «экстремально обобщенный» способ анализа, один из многих мультивариативных методов (к ним же относятся методы множественной регрессии, факторный и дискриминантный анализы и т.д.).
Существуют определенные правила построения диаграмм путей (рис. 8.4). Прямоугольники (или квадраты) обозначают наблюда-
Конец страницы №202
Начало страницы №203
Рис.8.4. Диаграмма путей, объединяющая три латентных (А, В, Q и две
наблюдаемых (D и Е) переменных.
р и q — корреляции; г, s, w, x, у, z — путевые коэффициенты.
Рис.8.5. Диаграмма путей для корреляций совместно живущих пар МЗ и ДЗ близнецов.
Tv Г, — близнецы одной пары. G — генотип; С— общая среда; U — индивидуальная (уникальная) среда; /— эпистаз. Пути А, с — влияния G, С на исследуемую черту.
емые переменные; круги (или эллипсы) — латентные, неизмеряе-мые переменные (на рис. 8.4. D и Е; А, В, С соответственно).
Связи между переменными обозначаются стрелками: постулированные исследователем причинно-следственные — направленной в одну сторону («путь» от причины к следствию); наблюдаемые ассоциации — двусторонней. На рис. 8.4 первые — w, x, у, z, r, s (путевые коэффициенты); вторые — р и q (коэффициенты корреляции). Иначе говоря, модель выделяет зависимые переменные (D и Е), подлежащие объяснению или прогнозированию, и независимые {А, В, С), действие которых должно объяснить или предсказать зависимые переменные и их связи. Есть и другие, более детальные, правила оформления и чтения путевых диаграмм, но мы их рассматривать не будем. На рис. 8.5 даны модели путей для корреляций совместно живущих пар МЗ и ДЗ близнецов по экстраверсии, из которых следует, что
Конец страницы №203
Начало страницы №204
корреляция МЗ близнецов Г, и Тг может быть выражена через сумму путей, связывающих их, т.е. /г/г и ее; иначе говоря, гиз = h2 +с2. Для ДЗ это будут пути h*'/2*h и се, т.е. rдз = '/2h2 + с2. Вычитая, получим rm — гдз = h2 + с2 — '/2h2 — с2 = V2h2; чтобы получить полную генетическую дисперсию (а не половину ее), удваиваем разность корреляций И2 = 2(rмз — rдз) и получаем описанный выше коэффициент наследуемости, справедливый для близнецовых исследований. Аналогичным образом могут быть построены путевые диаграммы для семейных и любых других данных.
Единицы измерения, используемые в анализе путей, отличаются от тех, которыми мы оперировали тогда, когда рассматривали понятие наследуемости на примере разложения фенотипической дисперсии. Если при разложении дисперсии мы пользовались квадратичными единицами (например, h2, Vc), то в данном случае наследуемость описывается на языке стандартных отклонений. Тогда путевые коэффициенты являются коэффициентами регрессии, полученными для переменных не в исходных единицах, а для стандартизованных переменных.
Несмотря на широкое использование этого метода и его достоинства, которые заключаются прежде всего в наглядной демонстрации представлений о компонентах, влияющих на исследуемый признак, он имеет и своих критиков. Так, Ф. Фогель и А. Мотульски «не уверены в том, что этот метод биометрического анализа внесет существенный вклад в наше понимание генетических факторов» [159]. Одно из главных сомнений вызывает тот факт, что в диаграмму путей и, следовательно, в дальнейший математический анализ закладываются уже имеющиеся у исследователя предположения о влияющих на признак факторах, их причинно-следственных отношениях и т.д., и результат анализа зависит, таким образом, от корректности заранее имеющихся исходных позиций.
АНАЛИЗ МНОЖЕСТВЕННЫХ ПЕРЕМЕННЫХ
До сих пор наши рассуждения концентрировались в основном на одном фенотипе, т.е. нашей конечной переменной являлся какой-то конкретно взятый фенотип. А если мы заинтересованы в одновременном изучении двух фенотипов, которые теоретически могут быть связаны между собой? Например, связана ли вариативность в популяции по таким высоко коррелирующим признакам, как вербальный и невербальный интеллект? Насколько вероятно предположение о том, что вариативность по этим двум признакам может быть объяснена действием одних и тех же генетических и средовых влияний? Иными словами, если два признака коррелируют на фенотипическом уровне, то эта корреляция может быть результатом действия как генетичес-
Конец страницы №204
Начало страницы №205
Рис. 8.6. Диаграмма путей фенотипической корреляции двух признаков Рх и Ру, демонстрирующая роль генетической rG и средовой гЕ составляющих.
ких, так и средовых факторов, и задача может заключаться в том, чтобы понять происхождение не только самих фенотипов, но и их корреляции.
Среди генетических причин, которые могут привести к появлению корреляции между признаками на фенотипическом уровне, следует указать на так называемый эффект плейотропии, или множественного влияния одних и тех же генов на разные признаки. Кроме того, различные популяционные процессы, например неслучайное скрещивание и смешивание популяций, также могут привести к возникновению корреляции между фенотипами.
Примером средового влияния на формирование фенотипической корреляции может служить дефицит питания: недоедающие дети обычно значительно ниже своих сверстников как по весу, так и по росту, т.е. связь этих двух характеристик обеспечивается одним средовым фактором.
Значимость такого рода одновременного моделирования множественных переменных трудно переоценить. Существуют целые классы поведенческих признаков, которые высоко коррелируют между собой (например, различные показатели когнитивной сферы, показатели эмоционально-волевой сферы и т.п.). Предположение о том, что вариативность по высоко коррелирующим психологическим признакам может объясняться действием одних и тех же генетических и/или средовых факторов кажется весьма правдоподобным.
Математическое описание множественных моделей достаточно просто. Рис. 8.6 представляет собой иллюстрацию того, как модель путей, рассмотренная нами, может быть разработана для одновременного анализа двух коррелирующих признаков. Подобно тому как фенотипическая вариативность отдельно взятого признака (Рх) отражает вариативность генотипов (hx) и сред (ех), фенотипическая корреляция между X я Y (гРхРу) может быть результатом набора генетических (hx hy r0) и средовых (ех еу гЕ) путей, где rG и гЕ представляют
Конец страницы №205
Начало страницы №206
собой генетическую и средовую корреляции, соответственно. В зультате
rPxPy = hx hy rG + ex ev rF
ОЦЕНКА СОСТАВЛЯЮЩИХ ФЕНОТИПИЧЕСКОЙ ДИСПЕРСИИ МЕТОДОМ ПЕРЕБОРА (ПОДБОРА) МОДЕЛЕЙ (МПМ)
Некоторые корреляции родственников (например, корреляции МЗ близнецов, разлученных при рождении, или приемных сиблингов — усыновленных детей-неродственников, выросших в одном доме) сами по себе дают информацию, которой достаточно для получения ответов на центральные вопросы психогенетики о том, насколько вариативность данного признака объясняется разнообразием сред и генотипов, наблюдаемых в данной популяции. Подобное может быть сказано и о тех методах психогенетики, которые сопоставляют корреляции, полученные у двух типов родственников, например корреляции МЗ и ДЗ близнецов, приемных детей — с биологическими и приемными семьями.
Однако в современных исследованиях предпочтение при анализе психогенетических данных отдается не прямым оценкам составляющих фенотипической дисперсии, а применению метода перебора (подбора) моделей. Этот метод представляет собой специфическую адаптацию метода структурного моделирования к задачам генетики количественных признаков. МПМ отличается несколькими преимуществами: 1) более точной оценкой искомых параметров; 2) возможностью оценивать более сложные генетические модели, например учитывать половые различия и моделировать ГС-корреляции и в-заимодействия; 3) возможностью сводить в одном анализе данные, относящиеся к разным типам родственников, и получать, благодаря этому, относительно несмещенные оценки параметров и 4) возможностью тестирования нескольких альтернативных моделей с целью выбора той, которая наилучшим образом соответствует исходным данным.
В рамках генетики количественных признаков применение метода перебора моделей сводится к решению систем уравнений для обнаружения такого набора параметров (т.е. подбора такой модели), который наилучшим образом соответствует набору исходных данных (корреляций родственников). Главное преимущество МПМ заключается в том, что он позволяет тестировать все те допущения, которые не учитываются в традиционных методах генетики количественных признаков. Например, обсуждая метод близнецов, мы указывали на то, что одним из допущений этого метода является допущение об отсутствии ассортативности. МПМ позволяет сравнить две модели (учитывающую ассортативность и не учитываю-
Конец страницы №206
Начало страницы №207
Рис. 8.7. Диаграмма путей фенотипических корреляций по исследуемому признаку для двух типов МЗ близнецов: (а) выросших вместе и (б) разлученных при рождении [по: 364]. Обозначения — в тексте.
щую ее) и выбрать ту, которая наилучшим образом соответствует эмпирическим данным.
В качестве еще одного примера применения МПМ рассмотрим анализ родственных корреляций на основе модели, приведенной на рис. 8.7. Эта модель описывает фенотипическое сходство МЗ двух типов — выросших вместе (а) и разлученных при рождении (б). Каждая из моделей содержит: две измеряемых переменных — фе-нотипические значения близнецов, Рт и PMZ), и две латентных, неизмеряемых переменных — эффекты генотипа (С), и эффекты среды (Е). Среды близнецов, выросших вместе, коррелируют гЕ . Путь от латентной переменной — генотипа (G) к измеряемой переменной — фенотипу (Р) обозначается /г; путь от латентной переменной среды (Е) к измеряемой переменной фенотипа (Р) обозначается е. Задача моделирования заключается в том, чтобы решить систему уравнений и оценить два неизвестных параметра — е и /г. Применяя правила анализа путей, запишем следующую систему уравнений:
Эта система содержит два уравнения и два неизвестных и решается алгебраически. Итак, мы проиллюстрировали простое приложение МПМ. На первом этапе с помощью диаграмм путей записывается система уравнений, описывающих фенотипические корреляции для всех типов родственников, данные которых анализируются. Затем исследователь формулирует набор альтернативных моделей, среди которых и ведется поиск модели с наилучшим соответствием эмпирическим данным
Конец страницы №207
Начало страницы №208
Например, исследователь может протестировать соответствие полученным данным следующих трех моделей, согласно которым феноти-пическое сходство родственников по определенному признаку объясняется: 1) только аддитивной генетической составляющей; 2) только доминантной генетической составляющей; 3) наличием и аддитивной, и доминантной генетических составляющих. Модель наилучшего соответствия выбирается на основе значения %-квадрата и других статистических показателей, оценивающих степени соответствия модели исходным данным.
Как уже указывалось, перебираемые модели могут быть очень разветвленными и сложными; они могут включать в себя множественные фенотипы, измеренные у нескольких типов родственников лонгитюд-ным методом (т.е. несколько раз за время исследования) и т.д.
Результаты применения МПМ могут быть использованы только при тестировании альтернативных моделей. Иными словами, МПМ не дает «доказательств» правильности тестируемой научной гипотезы; он позволяет лишь выбрать наиболее адекватную материалу генетическую модель. МПМ является элегантным и сложным статистическим методом, применение которого требует наличия определенных навыков*.
СТРУКТУРНОЕ МОДЕЛИРОВАНИЕ
Структурное моделирование — сложный современный метод, требующий и больших объемов выборок, и специальной квалификации исследователя, и наличия соответствующих компьютерных программ. Детальное изложение его не входит в задачи данного учебника, мы даем краткую характеристику его возможностей, чтобы читатель, столкнувшись в литературе с этим типом анализа, смог адекватно понять его смысл.
Статистические методы моделирования с помощью линейных структурных уравнений (МЛСУ)**, описывающих латентные переменные, были разработаны на основе приемов статистического анализа множественных переменных, используемых биологами, экономистами, психологами и социологами. МЛСУ предполагает формулирование набора гипотез о влиянии одних переменных (независимых) на другие (зависимые) переменные. Соответствие подобного набора гипотез, т.е. теоретической модели, и реальных данных, собранных при работе с конкретной выборкой, т.е. эмпирической модели, формализуется с помощью статистического алгоритма, оценивающего степень их согласованности (меру соответствия).
* Полное описание спецификации МПМ в рамках количественной генети
ки выходит за пределы данного учебника. Подробное изложение этого метода да
ется в руководствах Лоэлина [320], а также Нила и Кардона [342]. На русском
языке пример применения МПМ в рамках психогенетики приведен в работе
Е.А. Григоренко и М. ЛаБуды [44].
* * История возникновения и этапы детальной разработки МЛСУ описаны
Бентлером [189; 190], а в работах Боллена [198] и Бентлера и его коллег [191]
соде