Практические аспекты генетики человека 177
Более того, можно предсказать, что если генная терапия достигнет успеха в обозримом будущем, то это произойдет скорее всего в отношении некоторых дефектов ферментных систем. Воспроизведение аномальных зигот, однако, ведет лишь к очень медленному увеличению частоты вредных генов (разд. 6.2.1.2). Увеличения частоты рецессивных заболеваний можно не бояться еще и по другой причине, в настоящее время большинство популяций не находятся в равновесии по рецессивным генам. Разрушение изоляции и резкое уменьшение числа близкородственных браков создали ситуацию, в которой общее число гомозигот намного ниже расчетного равновесного значения. В отсутствие других факторов, которые могли бы изменить известные преимущества гетерозигот в плане отбора, эта тенденция должна привести к медленному увеличению числа гомозигот через сотни будущих поколений (разд. 6.3.1.2) Поскольку 100 поколений соответствуют периоду времени в 2500-3000 лет, нет нужды волноваться по этому поводу уже теперь. За такой долгий период времени условия жизни могут измениться совершенно непредсказуемым образом.
Таким образом, в популяциях индустриальных стран Европы и в США, где браки заключаются случайным образом, можно ожидать очень медленного увеличения частоты рецессивных заболеваний по сравнению с современным уровнем. Однако это предсказание не принимает в расчет искусственного отбора, осуществляемого путем генетического консультирования, пренатальной диагностики и, возможно, реализации скрининговых программ для гетерозигот Если пренатальная диагностика станет обычной процедурой, то в программу скрининга можно будет, вероятно, включить самые частые рецессивные заболевания, например ß-талассемию для населения средиземноморского бассейна и юго-восточной Азии или кистозно-фиброзную дегенерацию для населения СевероЗападной Европы и белого населения Северной Америки. Более редкие дефекты включить в скрининг вряд ли удастся.
Совокупность всех данных по четко определенным генетическим аномалиям, та-
ким, как хромосомные аберрации, доминантные и Х-сцепленные болезни и аутосомно-рецессивные заболевания, позволяет нам с достаточной уверенностью предсказать, что современная цивилизация не вызовет существенного увеличения частоты этих аномалий. Будет ли вообще увеличиваться эта частота, останется на близком к современному уровне или даже снизится - это в значительной степени зависит от обстоятельств жизни нашего общества. Сможем ли мы сохранить в разумных пределах воздействие мутагенных факторов, о чем говорилось выше? Насколько эффективно в плане уменьшения наследственных заболеваний будет работать искусственный отбор в форме генетического консультирования и пренатальной диагностики? И еще одно обстоятельство - как долго общество будет проявлять готовность платить за «роскошь» разработки планов предотвращения и лечения редких заболеваний? В настоящее время мы не можем сделать сколько-нибудь точных предсказаний.
Постепенная утрата функций, которые обеспечиваются мулътифакториалъными генетическими системами. В популяции существует изменчивость не только для четко определенных генетических дефектов, о которых шла речь до сих пор, но и для функциональных систем, которые зависят от сложного, но упорядоченного взаимодействия различных генов в период эмбрионального развития. Сердце, глаза и иммунная система являются примерами таких систем. Эволюционно эти системы развивались под постоянным и интенсивным давлением отбора. Как только это давление снижается, начинают накапливаться мутации, которые приводят к небольшим функциональным недостаткам, и в течение очень долгих эволюционных периодов эти системы медленно, но неуклонно «отмирают». У животных самые известные примеры обнаружены среди видов, которые в течение многих поколений жили в полной темноте пещер или на больших глубинах океана, где интактная зрительная система не дает никаких преимуществ в плане отбора. Как правило, сначала увеличивается изменчивость глаз, особи с небольшими
178 9. Практические аспекты генетики человека
дефектами начинают встречаться все чаще. Затем у большинства животных глаза оказываются больше или меньше поврежденными, и, наконец, возникает безглазый вид. В цивилизованном обществе небольшие дефекты зрительной системы не ставят их носителей в невыгодное положение перед отбором. Это уже привело к значительному увеличению изменчивости в зрительной активности: такие состояния, как близорукость, дальнозоркость или астигматизм, встречаются, вероятно, чаще, чем в примитивных популяциях, которые до недавнего времени жили в условиях сурового отбора (разд. 7.2.5). Будет ли этот процесс развиваться в том же направлении? С такой тенденцией можно было бы смириться - просто будет больше людей, которые носят очки. Их «дефект» обеспечивает средства к существованию людям других профессий - офтальмологам и оптикам - и создает производство по изготовлению очков.
Более опасные последствия может иметь медленное повреждение иммунной системы. В разд. 6.2.1.6 говорилось о высокой смертности среди младенцев и детей до недавнего времени, которая обусловлена главным образом инфекционными заболеваниями. Сложная система обнаружения и уничтожения инфекционных агентов эволюционировала под влиянием сильного отбора (разд. 4.4). Нам известно множество генетических дефектов, которые снижают эффективность этой системы. Раньше такие дефекты приводили, как правило, к смерти индивида от инфекции; теперь при наличии антибиотиков многие из этих пациентов выживают и дают потомство. При крайне тяжелых случаях поражения иммунной системы можно надеяться на терапию с помощью пересадки костного мозга, при которой в организм вводятся нормально функционирующие иммунные клетки. Однако мутации могут вызывать намного более тонкие изменения в белковых молекулах, которые лишь незначительно ослабляют их функцию. Исследования молекулы гемоглобина показали, что такие мутации встречаются очень часто. Приведет ли ослабление отбора против таких вариантов к медленному повреждению всей системы? Будут ли наши потомки постепенно стано-
виться все более чувствительными к инфекции разного рода, с которой нужно будет бороться с помощью более сложного сочетания антибиотиков и иммунной терапии? И еще более важный вопрос - будет ли это повреждение иммунной системы увеличивать частоту различных типов рака, поскольку потенциально злокачественные клоны клеток удерживаются от пролиферации системами иммунного надзора.
Ослабление отбора против мультифакториальных признаков может привести к увеличению их частоты. Например, против расщелины нёба и заячьей губы в прошлом был направлен довольно сильный отбор. В настоящее время вследствие эффективного хирургического лечения такие дети без труда выживают и в будущем имеют детей. Вполне вероятно, следовательно, что частота этого признака в следующих нескольких поколениях возрастет. Точную степень этого увеличения трудно предсказать. Аналогичные рассуждения применимы к врожденным порокам сердца.
Будет ли увеличиваться число лиц со сниженным интеллектом? Как отмечалось выше, сознательное планирование семьи является одним из основных факторов, который следует принимать в расчет при любой оценке. Этот фактор, однако, может иметь как благоприятные, так и неблагоприятные последствия. В популяциях существует подгруппа со сниженной способностью планировать свое собственное будущее - группа лиц с легкой степенью умственной отсталости. Средняя величина их воспроизведения действительно превышает среднее значение для популяции. Хотя хорошо известно, что факторы внешней среды могут способствовать возникновению умственной отсталости, есть данные о том, что для групп со слабой степенью отсталости особое значение имеет генетическая изменчивость (разд. 8.2.1.2). Следовательно, постоянное, более высокое воспроизведение лиц со слабой умственной отсталостью может увеличить их частоту в популяции. Пенроуз [2157] подверг сомнению справедливость этого заключения на том основании, что в семьях с легкой степенью умственной отсталости обычно выделяется определенная
9. Практические аспекты генетики человека 179
доля лиц, страдающих более тяжелой формой отсталости, которые вообще не способны иметь детей. Это противодействие может удерживать частоту генов на низком уровне, несмотря даже на более высокое воспроизведение состоящих в браке умственно отсталых лиц. Всесторонние исследования, проведенные супругами Рид [167] в 1965 г., казалось бы, подкрепили этот довод; число неженатых и незамужних, бездетных умственно отсталых членов семьи действительно было повышено в семьях со сниженным интеллектом. Мы, однако, не можем быть уверены в том, будет ли эта компенсация достаточна в будущем; слишком многое зависит от непредсказуемых социальных условий-умственно отсталые женщины могут научиться регулярно принимать противозачаточные таблетки и в этом отношении могут быть даже более надежны, чем женщины со средним или выше среднего уровнем умственного развития.
Возможно все же, что число генов умственной отсталости будет увеличиваться, и хотя число умственно отсталых лиц может возрасти, средние способности остальной части популяции не изменятся. Интеллектуальное сходство является серьезным фактором при подборе супружеских пар, и его действие распространяется как на нормальных, так и в особенности на умственно отсталых лиц. Эта тенденция может породить ряд социальных проблем, поскольку современное общество с его возрастающими требованиями к техническому мастерству будет все меньше обеспечивать работой умственно отсталых лиц.
Благоприятная в плане отбора тенденция: сочетание генетической приспособленности с последствиями, неблагоприятными в других отношениях. До сих пор мы рассматривали преимущественно неблагоприятные тенденции, и единственным полезным направлением был искусственный отбор, осуществляемый с помощью генетического консультирования. Ниже будет рассмотрена другая благоприятная тенденция, которая, вероятно, сможет намного быстрее усовершенствовать генетическую структуру, чем большинство неблагоприятных тен-
денций вызвать ее повреждение. В тропических странах широко распространены некоторые аномалии и заболевания эритроцитов, несмотря на то что гомозиготы по этим признакам страдают тяжелыми за-
Таблица 9.9. Благоприятные и неблагоприятные факторы (без учета генной инженерии), влияющие на генетическую структуру будущих популяций людей) | |
Неблагоприятные | Возможное значение |
Увеличение частоты мутаций, обусловленное ионизирующей радиацией | Не очень существенное |
Увеличение частоты мутаций, обусловленное химическими мутагенами | Неизвестно |
Большая репродуктивность пробандов с врожденными заболеваниями | Вероятно, не очень существенное |
Увеличение частоты рецессивных заболеваний (более высокий уровень равновесия) | Несущественное в следующих нескольких столетиях |
Повреждение нормальных функций вследствие «ослабления отбора» | Может быть существенным в конечном итоге |
Благоприятные | Возможное значение |
Элиминация генетических адаптации, сопряженных с неблагоприятными в других отношениях последствиями (инфекции или недостаточное питание) | Возможно, существенное |
Уменьшение частоты мутаций (хромосомных и точковых) вследствие уменьшения возраста родителей | Существенное |
Добровольный отказ от деторождения в семьях с наследственными заболеваниями | Неизвестно; может стать очень важным в будущем |
Генетическое консультирование, включающее пренатальную диагностику | Важное, проявляющееся уже через короткое время |
180 9. Практические аспекты генетики человека
болеваниями крови типа серповидноклеточной анемии или талассемии (разд. 4.3). Гетерозиготы по соответствующим генам имеют преимущества в плане отбора по отношению к трехдневной малярии, которая для этих областей до недавних пор была эндемичным заболеванием (разд. 6.2.1.6). До тех пор пока малярия не появится снова в будущем, отбор против пораженных дефектом гомозигот будет уменьшать частоту генов.
Природа в этом случае предложила компромисс: увеличение устойчивости против малярии должно быть оплачено ценой многих случаев наследственных заболеваний. Как только малярию искоренили, этот компромисс стал ненужным, и вредный ген постепенно исчезает (разд. 6.2.1.6).
Сходный механизм может существовать для групп крови А, В и О (разд. 6.2.1.8). Возможно, что этот генетический полиморфизм возник как приспособление к многочисленным и разнообразным инфекционным агентам и что отбор зависел от их частоты. Ценой, которую следовало заплатить, была утрата зигот, обусловленная серологической несовместимостью матери и ребенка. Если бы отбор, связанный с инфекцией, исчез и остался бы только отбор по несовместимости, произошло бы постепенное и медленное уничто-
жение редких аллелей А и В и закрепление самой частой группы - 0. Сходные «компромиссы» могут также существовать для других генетических систем.
Человеческий вид в будущем. Из этих рассуждений возникает следующая картина будущей генетической структуры человека как вида: общий состав генов будет похож на тот, который существует в настоящее время. Сохранится, вероятно, тенденция к уменьшению расовых и этнических различий. Генетические дефекты, возможно, будут встречаться чаще или реже, чем в настоящее время, но они будут находиться под эффективным контролем генетического консультирования и пренатальной диагностики. Могут стать редкостью люди с аутосомными аберрациями. Вследствие терапевтического и хирургического лечения и других факторов, ведущих к ослаблению отбора, увеличится, вероятно, число заболеваний, вызываемых полигенными факторами. К сожалению, степень этого увеличения точно оценить невозможно из-за отсутствия знаний о конкретных генетических системах подверженности при этих заболеваниях. В табл. 9.9 сопоставлены благоприятные и неблагоприятные тенденции в развитии генетической структуры будущих популяций.
Приложение 1
Методы подсчета генных частот
В этой книге рассматриваются лишь основные принципы подсчета частот генов (разд. 3.2). Более подробно эти вопросы изложены в работах Рэйса и Сэнгера [166], Муранта [144] и других. Мы начнем с простейшего примера. |
Одна пара аллелей: все три генотипа имеют разное фенотипическое выражение. В этом случае можно идентифицировать каждый отдельный аллель (М или N), и частота гена подсчитывается прямо. В качестве примера можно привести изоантигены группы крови MN: |
Генные частоты p и q используют для тестирования соответствия наблюдаемых фенотипических частот их ожидаемым значениям по закону Харди-Вайнберга. Применяя следующую формулу, можно избежать вычисления ожидаемых значений |
Этот метод подсчета пригоден и в том случае, когда имеется больше двух аллелей и каждому генотипу соответствует определенный фенотип; например, для полиморфных вариантов кислых фосфатаз эритроцитов. |
Одна пара аллелей: по фенотипу можно определить только два разных генотипа. |
Проблема усложняется, если один из двух аллелей доминирует, т.е. гетерозигота фенотипически совпадает с одной из гомозигот. В этом случае по частоте рецессивных гомозигот можно судить о частоте соответствующего гена. Частота гомозигот составляет q2. Примером может служить группа крови Диего (Diego) (разд. 7.3.1). У американских индейцев и в монголоидных популяциях имеются два фенотипических класса: обнаруживающие положительную реакцию агглютинации с сывороткой анти-Di3 и необнаруживающие таковой. Семейные исследования показали, что отрицательный тип реакции является рецессивным признаком |
В этом случае не остается ни одной степени свободы для тестирования равновесия Харди-Вайнберга. Если имеется анти-Dib сыворотка, то можно идентифицировать гетерозигот и вычислить частоту гена тем же способом, что был описан выше для групп крови MN. |
Более двух аллелей: не все генотипы можно различить по фенотипу. Специальный случай групп крови АВ0 уже обсуждался в разд. 3.2.2. |
Метод подсчета, основанный на принципе максимального правдоподобия. Мы сталкиваемся с общей проблемой оценки априорно неизвестного параметра по эмпирическим данным. Согласно Фишеру, оценка должна удовлетворять следующим условиям: |
Приложение 1
а) она должна быть состоятельной. Это означает, что с увеличением числа наблюдений оценка сходится стохастически (по вероятности) к параметру; |
б) оценка должна быть достаточной. Это означает, что из имеющихся данных нельзя извлечь дополнительное знание о параметре с помощью вычисления других статистик; |
в) оценка должна быть эффективной, т. е. извлекать из данных максимально возможное количество информации. Дисперсия должна быть минимальной. |
Обычно проблема оценки лучше всего решается на основе принципа максимального правдоподобия, предложенного Фишером. Рассмотрим сначала простой пример. |
Вероятность наступления n1 событий, каждое из которых имеет вероятность р, и n — n1 событий, каждое из которых имеет вероятность 1 — р, в соответствии с биномиальным распределением равна |
Чтобы найти значение р, для которого эта вероятность максимальна, следует приравнять нулю первую производную L по р. Для удобства вместо L обычно максимизируют ее логарифм |
Следовательно, р = n1/n - результат, который интуитивно очевиден. Это означает, что n1 = пр, т. е. для биномиального распределения наиболее вероятное значение параметра есть такое, для которого ожидаемое значение совпадает с наблюдаемым. Приведем без вывода формулу для дисперсии (в случае больших выборок) этой оценки параметра р, которая получается подстановкой оценки максимального правдоподобия параметра р в выражение для |
отрицательной обратной второй производной L по p. В нашем случае |
Это выражение для s2 можно получить более удобным способом. Подстановка р = n1/n и 1 — р = (п — п1)/п в общую формулу для дисперсии биномиального распределения V=p(l — р)/п дает тот же самый результат. |
Рассмотрим теперь более общий случай [150]. Пусть χ будет случайной переменной, распределение которой зависит только от р. Тогда функцию плотности вероятности для x можно записать как f(x; р). Пусть имеются n реализиций (выборка объема и) х1, x2, .... хп переменной х. Тогда вероятность такой выборки можно записать следующим образом: |
Если в это выражение подставить конкретные наблюдаемые выборочные значения и рассматривать его как функцию от р, то получится функция правдоподобия данной выборки. Оценка максимального правдоподобия находится путем решения относительно р следующего уравнения: |
Дисперсию этой оценки получают путем вычисления второй производной и взятия отрицательной обратной величины ее математического ожидания (математическое ожидание обычно обозначается символом Е) |
Простой метод подсчета генов, представленный выше на примере групп крови MN, как раз и дает оценку максимального |
Приложение 1 183
правдоподобия. Вычисления становятся несколько сложнее, когда имеется более двух аллелей и по фенотипу нельзя идентифицировать все генотипы, как, например, для системы групп крови АВО. В этом случае многими авторами были предложены разные формулы для получения оценок максимального правдоподобия. Однако метод Бернштейна с поправками оказался практически эквивалентным. Следовательно, формулы, полученные из уравнений максимального правдоподобия, можно использовать для вычисления дисперсий оценок по Бернштейну; |
Здесь n означает объем выборки (для всех четырех групп крови вместе). |
Вычисление частот аллелей групп крови системы АВО по методу Бернштейна. Бернштейн при исследовании генетической основы системы АВО (разд. 3.2) разработал метод оценки частот аллелей групп крови этой системы. Затем он усовершенствовал свой метод, получая сначала предварительные оценки частот р', q', r', a затем поправляя их для вычисления точных генных частот р, q, r: |
где D=1—(р' + q' + r'). Было показано, что оценки, получаемые с использованием этого усовершенствованного метода Бернштейна, практически идентичны оценкам максимального правдоподобия. |
Пример: оценка генных частот с помощью подсчета генов. Рэйс и Сэнгер [166] привели следующие фенотипические частоты для жителей Лондона, Оксфорда и Кембриджа: |
Следовательно, в соответствии с уравнением (П. 1.1) частота р аллеля M и частота q аллеля N равны: |
Отсюда вытекает р2 = 0,2827; 2 pq = 0,4980; g2 = 0,2193. |
Чтобы вычислить ожидаемые генотипические частоты (E), эти цифры следует умножить на 1279 - общее число обследованных жителей |
Теперь сравним эти ожидаемые значения с наблюдаемыми |
В данном случае нет статистически значимого различия между наблюдаемыми и ожидаемыми генными частотами. |
Пример: оценка частот аллелей системы АВО [711]. Для 21104 жителей Берлина было найдено следующее распределение по группам крови: |
В соответствии с усовершенствованным |
Приложение 1
методом Бернштейна это дает следующие результаты (подробнее в разд. 3.2.2):
p = 0,287685 + 0,002411, q = 0,106555 ±0,001545, r = 0,605760 ±0,002601.
Было показано, что метод максимального правдоподобия приводит к точно таким же результатам [711]. Дисперсии по методу максимального правдоподобия получились следующими:
Vp = 0,000005811, Vq = 0,000002386, Vr = 0,000006763.
Для получения стандартных отклонений нужно извлечь квадратные корни из этих дисперсий.
Точно так же, как было показано для групп крови MN, по частоте аллелей А, В и О можно вычислить ожидаемые генотипические частоты и сравнить их с наблюдаемыми частотами по критерию хи-квадрат.
Еще более сложные проблемы возникают при анализе групп крови Rh и вообще при анализе всех систем, в которых вместе
наследуется много разных комбинаций антигенов. Для этих случаев опубликованы или упомянуты в публикациях компьютерные программы. Для системы Rh можно воспользоваться публикациями [585; 586]. Рядом авторов предложены правила вычисления частот аллелей и гаплотипов для системы HLA [554; 738; 779; 805; 962]. Находит свое применение также система ALLTYPE [789].
Однако неадекватность составления выборки не компенсируется обработкой на компьютере. Все упомянутые до сих пор методы основаны на предположении, что выбор индивидов проводился независимо, т .е. выбор какого-либо одного индивида не увеличивает и не уменьшает шанс быть выбранным для любого другого индивида в популяции. Это правило нарушается, например, при сборе данных о родственниках. Однако нельзя сказать, что выборки, содержащие родственников, всегда бесполезны для вычисления генных частот. Но включение родственников в выборку должно быть обязательно отмечено вместе со степенью их родства, и для анализа должны использоваться специальные статистические методы [211].
Приложение 2
Анализ сегрегации распространенных признаков: отсутствие смещений вследствие регистрации, доминирование [876; 877]
Если тип наследования кодоминантный, так что каждый генотип соответствует своему, отличному от других фенотипу, и если анализируемые семьи выбирались из популяции независимо от генотипов их членов, то анализ сегрегационных отношений проводится непосредственно. В этом случае число. индивидов в каждом генотипическом классе следует сравнивать с числом, ожидаемым из распределения на основе менделевского закона, с помощью критерия хи-квадрат, как показано в разд. 3.3.3 и табл. 3.7. |
При доминировании сегрегационный анализ сложнее, чем при кодоминантном наследовании. В фенотипическом браке |
АА x Аа и Аа x Аа. Оригинальный метод сегрегационного анализа был разработан Смитом [876]. |
Тип брака А x а. В этой группе представлены два генотипических брака АА x аа и Аа x аа. Первый дает только детей с генотипом Аа и с фенотипом А, а второй - детей Аа и аа в соотношении 1:1. Для иллюстрации используются данные по группам крови (табл. П.2.1, П.2.2). Ниже приводятся численности семей по крайней мере с одним рецессивным ребенком (аналог регистрации семей по «пораженным» потомкам) |
Ожидается, что в этих семьях число детей с рецессивным фенотипом подчиняется «усеченному биномиальному распределению» Например, ожидаемое соотношение двухдетных семей с 0, 1 или 2 рецессивными |
детьми должно быть равным 1:2:1. Однако класс с нулем рецессивов отсутствует в силу способа регистрации. Следовательно, с вероятностью 2/3 двухдетная семья будет иметь одного рецессивного потомка и с вероятностью 1/3 - двух. Ожидаемое число рецессивных детей в двухдетных семьях равно |
а дисперсия |
В принципе те же рассуждения можно использовать для семей с 3, 4 и большим числом детей и вычислить а3, a4 ··· и b3, b4... . В общем случае вероятность того, что семья из s детей по крайней мере с одним рецессивным ребенком имеет точно r рецессивных детей, равна |
(ср. с биномиальным распределением, разд. 3.3.2). Отсюда вытекает, что |
Ожидаемое общее число детей с рецессивным фенотипом в выборке составит |
(используя данные Смита, приведенные здесь в табл. П.2.3). Дисперсию этой величины можно вычислить из аналогичной |
186 Приложение 2
Таблица П.2.1. Фенотипический брак | |
линейной комбинации значений b v1 = 8,555. Общий вид формул следующий: | |
Наблюдаемое число рецессивов (из табл. П.2.1) равно | |
O1 = 11 χ 1 + 10 χ 2 + 2 χ 3 = 37. | |
Таблица П. 2.2. Фенотипический брак | |
типическому браку А х А (табл. П.2.2) с той лишь разницей, что в браке Аа х Аа дети с фенотипами А и а ожидаются в соотношении 3:1. Ожидаемые средние значения As и дисперсии Bs можно взять из табл. П.2.3. В 10 семьях по крайней мере с одним ребенком наблюдались 11 таких детей. Сравнивая эту величину с ожидаемым средним значением Е2 = 12,3 и дисперсией V2 = 2,069, получаем | |
Снова наблюдаемые значения превосходно соответствуют ожидаемым. | |
До сих пор мы не использовали генные частоты. Наблюдаемые численности семей по крайней мере с одним рецессивным ребенком нужно сравнить с ожидаемыми численностями таких семей, рассчитанными из общего количества семей в выборке. Для этого необходимы надежные оценки генных частот. Их можно получить, имея большую выборку случайных индивидов из популяции. Фенотипический брак Axa, например, может включать два генотипических АА х аа и Аа х аа. Их ожидаемая частота | |
Таблица П.2.3. Ожидаемые средние значения аs, дисперсии bs и величины ds для фенотипического брака A x a. Ожидаемые средние значения As, дисперсии Bs и величины Ds для фенотипического брака А х А [876] | |
Приложение 2 187
2 x ρ2 x q2 + 2 x 2pq x q2 = 2p2q2 + 4pq3. В то же время это значение является вероятностью того, что случайно выбранный брак будет иметь фенотип А х а. На самом деле семья может иметь рецессивного ребенка, только если генотипический брак будет Аа х аа. Даже в этом случае вероятность иметь по крайней мере одного рецессивного ребенка среди s детей равна 1 - (l/2)s, т. к. с вероятностью (1/2)S будут появляться только доминантные дети. |
По этой причине вероятность π того, что семья типа Аха с s детьми будет иметь по крайней мере одного рецессивного ребенка, составит |
Значения ds приведены в табл. П.2.3, и когда известны генные частоты, то легко вычислить uds. Если имеется ns семей размера s (s = l, 2, ...), то ожидаемые среднее значение и дисперсия числа семей по крайней мере с одним рецессивным ребенком составят |
Таблица П.2.4. Ожидаемые и наблюдаемые частоты семей с рецессивными детьми, фенотипический брак А х à |
Таблица П.2.5. Ожидаемые и наблюдаемые частоты семей с рецессивными детьми, фенотипический брак ÄxÄ | |
Например, генная частота q рецессивного аллеля ρ в системе Ρ равна 0,51. Следовательно, и = 0,675. Дальнейшие вычисления приведены в табл. П.2.4. | |
В принципе те же расчеты можно выполнить для А х А семей с u2 и Ds = 1 — — (3/4)s вместо u и d соответственно; значения Ds приведены в табл. П.2.5. | |
Все сравнения собраны вместе в табл. П.2.6, где приведена также сумма всех сравнений. В первых двух строках таблицы представлены значения критерия хи-квадрат для сравнения с ожидаемыми сегрегационными отношениями, а в следующих двух - наблюдаемые частоты разных типов брака сравниваются с ожидаемыми на основе закона Харди-Вайнберга, при этом используются генные частоты. Такое четкое разделение делает метод более понятным. | |
Таблица П.2.6. c2-сравнения | |
Приложение 3
Формулы и таблицы для коррекции регистрационных смещений, а также для тестирования и оценки сегрегационных отношений. Другие статистические проблемы и вычислительный пример
В приложении 2 описан метод тестирования сегрегационных отношений широко распространенных признаков (например, полиморфных вариантов). Приложение 3 содержит методы сегрегационного анализа редких признаков (в частности, моногенных заболеваний), включая коррекцию смещений, возникающих вследствие особенностей регистрации семей. Как объяснялось в разд. 3.3, сегрегационный анализ можно проводить двумя разными способами: путем тестирования эмпирических данных на соответствие заданному теоретическому сегрегационному отношению и с помощью оценки сегрегационных отношений.
В обоих случаях необходима коррекция смещений, обусловленных способом сбора данных. Следует различать два типа регистрации семей: единичный отбор (k = 0) и полный или усеченный отбор (k = 1). При единичном отборе (k = 0) каждая семья регистрируется через единственного пробанда. Примерами могут служить семейные исследования, основанные на больных в стационарах. При полном или усеченном отборе (k = 1) регистрируются все пораженные индивиды в популяции. Коррекция сегрегационных отношений необходима потому, что в выборку не попадут сибства, в которых нет пораженных детей, хотя при гетерозиготности одного (в случае доминантного или Х-сцепленного рецессивного признака) или обоих (в случае рецессивного признака) родителей это принципиально возможно.
Ниже описываются методы тестирования соответствия теоретически ожидаемых и наблюдаемых сегрегационных отношений, а также методы оценки сегрегационных отношений. В основном мы следуем Кэлину (1955) [729]. Рекомендуемый здесь метод подразумевает использование калькулятора, предпочтительно программируе-
мого, в противном случае следует иметь таблицы Кэлина. Сначала будут описаны методы сегрегационного анализа. Затем мы обсудим некоторые проблемы, возникающие вследствие генетической гетерогенности и примеси спорадических случаев. Кроме того, мы рассмотрим, как изучаются эффекты порядка рождения, и продемонстрируем соответствующие методы на примере опубликованного популяционного исследования глухонемоты в Северной Ирландии. Наконец, мы проанализируем некоторые более сложные проблемы регистрации, возникающие в связи с миграцией семей, а также в случаях, когда семьи охватывают более одного сибства.
На первый взгляд рекомендация следовать принципу «сделай сам», игнорируя существующие методы сегрегационного анализа, многие из которых уже реализованы в виде компьютерных программ (например, программа Мортона SEGRAN), может показаться старомодной. Однако исследователь, который берет на себя труд самостоятельно пройти все этапы такого анализа, будет вознагражден способностью критически оценить получаемые результаты с учетом особенностей и возможных изъянов своих данных. Те читатели, которые имеют доступ к персональному компьютеру (PC) и знакомы с алгоритмическим языком BASIC, могут легко написать программу в соответствии с описываемыми ниже методами.
Тестирование эмпирических семейных данных на соответствие заданному сегрегацио<