D. A. Dean, K. Kunsano-Kretzner, E. J. Mayer, 6 страница
Из данных табл. 20.4 можно предположить, что расстояние от локусов D20SI9 и D20S20 до локуса BFNC не превышает 5 сМ (<5 · l06 п. н.). В общем случае анализ сцепления не позволяет разграничить два локуса, если расстояние между ними меньше 1—2 сМ, Поскольку локусы D20S19 и D20S20 расположены внутри района 13.2—13.3 длинного плеча (q) хромосомы 20
Молекулярная генетика человека 459
(20q13.2-13.3), то и локус BFNC должен находиться вблизи данного района хромосомы или внутри него. К настоящему времени при помощи метода, основанного на вычислении лод-балла и использовании полиморфных маркеров, в специфических хромосомных участках было картировано более ста генов различных заболеваний.
Построение мультилокусных хромосомных карт человека
Использование многих тысяч разбросанных по всему геному полиморфных маркеров позволило определять как порядок расположения локусов, так и расстояния между ними на каждой хромосоме. Карта сцепления полиморфных участков оказывается неоценимой при локализации генов различных заболеваний. Для идентификации таких генов можно использовать зонды, специфичные в отношении последовательностей, которые фланкируют данный ген.
Идеальными для картирования полиморфных локусов являются семьи, представленные тремя поколениями, в которых живы обе прабабки и оба прадеда, а родители имеют большое число детей (>8). Исходя из генотипов бабок и дедов, можно установить генетическую фазу, в которой находятся исследуемые локусы у каждого из родителей, а наличие большого числа детей повышает вероятность того, что рекомбинация произойдет. В Центре по изучению полиморфизма человека (СЕРН, Centre d'Etude du Polymorphisme Humain) в Париже собраны данные и образцы ДНК членов 65 семей, представленных в большинстве случаев тремя поколениями и имеющих в среднем по 8,5 детей (см., например, рис. 20.17). Этот банк семей (СЕРН-семей) предоставляет информацию о генотипах
всех членов лабораториям всего мира, занимающимся картированием. В действительности он состоит из культур лимфобластозных клеточных линий большинства членов СЕРН-семей и служит готовым источником ДНК для картирования новых полиморфных локусов по мере их обнаружения.
Построение мультилокусной генетической карты (карты сцепления) хромосомы человека — непростая задача; для ее решения используют специализированную комьютерную программу, позволяющую установить порядок расположения локусов, наилучшим образом согласующийся с данными по рекомбинациям. Проблема упорядочивания локусов усложняется по мере возрастания числа локусов, которые необходимо картировать. Для N локусов существует N!/2 возможных вариантов их расположения. Так, для 10 локусов их число равно 1 814 400. И хотя некоторые комбинации заведомо нереальны, даже если основываться на визуальной проверке данных, все же число возможных вариантов остается очень большим. Обычно сначала находят наиболее вероятное расположение нескольких сцепленных локусов, а затем комбинируют эти «наилучшие» варианты и строят статистически достоверную карту сцепления всех локусов. Критерием того, расположен ли один локус рядом с другим, является значение десятичного логарифма правдоподобия (лод-балла); если он равен или превышает +3,00, то ответ будет положительным.
В общем случае построение карты проводят поэтапно. Сначала отбирают несколько полиморфных маркеров, расположенных на одной хромосоме. Потом генотипируют образцы ДНК, полученные от нескольких СЕРН-семей, по каждому полиморфному маркеру. Структура СЕРН-семей такова, что нет необходимости в
Рис. 20.17. СЕРН-семья К1331. |
460 ГЛАВА 20
определении генотипов всех образцов ДНК. Привлечение других семей не дает повышения качества карты, которое оправдывало бы дополнительную работу. Обычно используют 15, иногда — 40 семей. Для генотипирования 40 СЕРН-семей по 20 полиморфным маркерам необходимо провести примерно 10 000 анализов. Генотип каждого индивида по каждому локусу вводят в базу данных. На этом этапе происходит проверка базы данных на предмет ошибок. Компьютерная программа проводит поиск случаев несоответствия генотипов родителей и детей; эти ошибки возникают во время введения данных или генотипирования. Иногда для уточнения полученных результатов проводят повторное типирование. Ошибки могут приводить к неправильным выводам о расположении локусов и расстояниях между ними. Ошибочные данные по возможности исключаются из анализа. Для генотипированных СЕРН-семей определяют все «двухлокусные» лод-баллы и рекомбинационные индексы (θ), и исходя из этих данных конкретная компьютерная программа строит генетическую карту (карту сцепления).
Карты сцепления хромосом человека постоянно обновляются по мере идентификации дополнительных полиморфных локусов. С увеличением числа локусов повышается разрешение карты и уменьшается расстояние между локусами. К 1994 г. были определены генотипы членов СЕРН-семей примерно по 6000 полиморфным маркерам и с помощью мультилокусного картирования установлено положение примерно 1000 локусов по всему геному человека со средним расстоянием между локусами около 4 сМ. Задача широкомасштабных проектов картирования состоит в том, чтобы, используя дополнительные полиморфные маркеры, построить карту каждой хромосомы с расстоянием между локусами 1—2 сМ.
Локализация гена заболевания на карте сцепления
Для решения этой задачи проводят генотипирование членов семей с определенным генетическим заболеванием по полиморфным маркерам, которые, по данным картирования, находятся на том же плече хромосомы, что и ген заболевания. Используют те же подходы, что и при вычислении двухточечного лод-балла при анализе
сцепления. В данном случае локус гена заболевания произвольно размещают среди четырех упорядоченных локусов и вычисляют лод-балл для каждой позиции. В случае мультилокусного картирования лод-балл равен логарифму отношения 1) вероятности того, что ген заболевания занимает определенное положение на карте из четырех упорядоченных локусов, к 2) вероятности того, что ген заболевания не сцеплен ни с одним из рассматриваемых полиморфных локусов. Использование именно четырех полиморфных локусов обусловлено тем, что при большем их числе слишком сильно усложняются расчеты. Ген заболевания может располагаться до первого локуса, в разных областях между локусами или за последним локусом. Рассчитав лод-балл для каждого положения гена, которое он может занимать в различных наборах из четырех локусов, выбирают максимальное его значение, превышающее +3,00; оно дает наиболее вероятную локализацию данного гена.
Картирование с использованием радиационных гибридов
Для картирования с использованием радиационных гибридов (РГ-картирования) не нужно собирать родословные и генотипировать членов банка СЕРН-семей. В основе метода лежит работа с соматическими клетками и скрининг (с использованием ПЦР-зондов) клеточных линий, содержащих части (фрагменты) хромосом человека. PГ-картирование целой хромосомы или какой-то ее области начинается с создания гибридной (человек/грызун) клеточной линии, содержащей одну хромосому человека. Клетки такой монохромосомной гибридной клеточной линии подвергают воздействию летальных доз ионизирующей радиации (рентгеновских или гамма-лучей), в результате чего разрушаются клеточные мембраны, инактивируются ферменты, происходит фрагментация хромосом. Единицей измерения дозы ионизирующего излучения, поглощенной биологическим объектом, является рад (rad, от англ, radiation absorbed dose). Один рад равен 0,01 Дж на 1 кг ткани или 100 эргам на 1 г ткани. Обычно клетки в культуре погибают при 3000 рад. Чем больше доза, тем более сильные повреждения возникают и тем меньше размер образующихся фрагментов
Молекулярная генетикачеловека 461
ДНК, При дозе 10 000 рад фрагменты слишком малы для РГ-картирования.
Очень важным моментом при РГ-картировании является высвобождение и сохранение фрагментов ДНК человека, полученных после облучения. Чтобы решить эту задачу, проводят слияние облученных (донорских) клеток с необлученными (реципиентными) клетками грузынов. Облученные клетки, слившиеся друг с другом или оставшиеся изолированными, не способны расти в культуре вследствие радиационных повреждений. В свою очередь, реципиентные клетки, как слившиеся друг с другом, так и не слившиеся, лишены селективного маркера, который присутствует в донорских клетках и обеспечивает их рост в куль-туральной среде, используемой для слияния. Следовательно, в данной среде будут пролиферировать лишь слившиеся клетки донор—реципиент, несущие селективный маркер, при этом большинство фрагментов ДНК облученных клеток окажутся встроенными или транслоцироваиными на функциональные хромосомы реципиентных клеток. Выжившие слившиеся клетки культивируют вместе до тех пор, пока не установятся отдельные клеточные линии — так называемые радиационные гибриды {РГ)· Группу радиационных гибридов, полученных в результате одного эксперимента, называют панелью радиационных гибридов (РГ-панелью). В ней в виде фрагментов хранится большая часть хромосомной ДНК человека, полученной из монохромосомной клеточной гибридной линии.
Таблица 20,5. Данные по сохранению маркеров при РГ-картировании 1) | |||||||
РГ-панель | Наличие или отсутствие маркера | ||||||
А. | Б | В | Г | Д | Е | Ж | |
1) Номера и буквы - радиационные гибриды и ПЦР-маркеры соответственно. Знаки плюс и минус указывают наличие или отсутствие маркерных сайтов в дачном радиационном гибриде |
ДНК каждого члена РГ-панели анализируют с помощью нескольких хромосомоспецифичных ПЦР-зондов, многие из которых «узнают» полиморфные участки. Однако полиморфизм как таковой не требуется для РГ-картирования. Цель такого картирования — выяснить, присутствует ли данный участок хромосомы в клеточных линиях РГ-панели. Следовательно, для скрининга можно использовать и ПЦР-праймеры, специфичные в отношении уникальных (однокопийных) последовательностей ДНК. Мономорфные ПЦР-идентифицируемые хромосомоспецифичные участки называют ДНК-маркирующими сайтами (STS, от англ, sequence tagged sites). Все клеточные линии РГ-панели проверяют на наличие (+) или отсутствие (—) такого сайта (табл. 20.5), используя весь набор зондов, и гибриды,
ДНК которых не амплифицируется, отбраковывают. Для эффективного РГ-картирования необходима панель примерно из 100 РГ, полученных из одной монохромосомной гибридной клеточной линии.
Теоретическая основа РГ- и мейотического картирования весьма сходна. Чем ближе друг к другу на хромосоме находятся два участка, тем выше вероятность того, что оба они окажутся в одном фрагменте ДНК после облучения. Точно так же, чем ближе друг к другу находятся сайты, тем с большей вероятностью они не разойдутся при мейотическом картировании в результате рекомбинации. Основные положения, на которых базируется ΡГ-картирование, состоят в следующем: 1) индуцированный облучением разрыв между двумя сайтами не зависит от сохранения маркера; 2) сохранение фрагмента с одним маркером не зависит от сохранения любого другого фрагмента в этой же клетке.
Полученные для всех клеточных линий РГ-панели паттерны (паттерны сохранения, сигнатура) наличия (+) или отсутствия (-) каждого маркера используют для построения РГ-карты. Лод-балл рассчитывают как логарифм отношения вероятности получения конкретного паттерна сохранения двух сайтов к вероятности того, что при облучении эти сайты всегда разделяются разрывом. В отличие от мейотической рекомбинации, θ для частоты радиационных разрывов принимает значения от 0 до 1; θ = 0
462 ГЛАВА 20
означает, что два маркерных сайта никогда не разделяются при определенной дозе облучения, т. е. они тесно сцеплены. При θ = 1 маркеры всегда разделяются при определенной дозе облучения, т. е. вообще не сцеплены. Если лод-балл равен или больше +3,00, можно с уверенностью говорить о сцеплении двух маркеров. Разработаны компьютерные программы, позволяющие упорядочивать сайты и определять расстояние между ними на РГ-карте.
Расстояние между сайтами на РГ-карте измеряется в так называемых сантирэях (сР). Поскольку размер фрагментов обратно пропорционален дозе облучения, необходимо указывать дозу, при которой была получена данная РГ-панель и построена РГ-карта. Например, расстояние в 1 сР8000 означает, что при дозе 8000 рад между двумя маркерами происходит разрыв в 1% случаев.
Прямой связи между сантирэями и числом пар нуклеотидов не существует. Можно лишь сказать, что чем выше доза в радах, тем меньше физическое расстояние для конкретной величины в сантирэях. Например, расстояния в 1 сР9000, 1 сР8000, 1 сР6000 , 1 сР5000 , 1 сР3000 эквивалентны примерно 50, 53, 62, 90 и 100 т. п. н. соответственно. Мейотическое же (генетическое) картирование способно дифференцировать сайты, находящиеся на расстоянии друг от друга в лучшем случае l сМ, т. е. 1000 т. п. н. РГ-карты не только имеют более высокое разрешение, но и являются более полными, чем генетические. Кроме того, РГ-картирование проще мейотического в техническом плане, а новые сайты можно быстро включать в ранее построенную РГ-карту. К сожалению, РГ-картирование не позволяет локализовать гены тех или иных заболеваний в специфических районах хромосомы. Несмотря на это при построении мультилокусных карт хромосом человека РГ-картирование, вероятно, вытеснит картирование по сцеплению, основанное на генотипировании членов СЕРН-семей.
Физическое картирование генома человека
Генетические и РГ-карты указывают линейное расположение маркерных сайтов. Расстояния между сайтами измеряются в условных едини-
цах, которые отражают частоту рекомбинации (сМ) или вероятность сохранения двух сайтов в одном радиационном гибриде (сР). Эти единицы можно перевести (в некотором приближении) в единицы реальных физических расстояний — пары нуклеотидов, которые используются в физических картах. Физическая карта целой хромосомы или ее области дает непосредственное представление о расположении генов в ДНК, что облегчает их идентификацию и характеристику и систематическое секвенирование хромосомной ДНК.
Для построения физической карты необходимо прежде всего выделить из библиотеки геномной ДНК клоны, содержащие перекрывающиеся сегменты. Исходя из данных о перекрывающихся участках и другой информации о положении клонов, можно реконструировать непрерывный ряд клонированных сегментов какого-то района хромосомы, целой хромосомы или всего генома. Были получены упорядоченные наборы смежных (contiguous) клонов (контиги) на основе YAC-(yeast artifitial chromosome, искусственная хромосома дрожжей), В AC-(bacterial artifitial chromosome, искусственная хромосома бактерий), PAC-(bacterio-phage PI artifitial chiomosome, искусственная хромосома бактериофага Р1) и космидных библиотек ДНК человека. Отметим, что стратегия построения контигов из крупных фрагментов ДНК человека, содержащихся в YAC-, ВАС- или PAC-библиотеках, немного отличается от таковой для Р1- или космидных контигов,
Построение контигов из YAC-, ВАС-и PAC-библиотек
При построении физических карт тех или иных районов хромосом или целых хромосом из геномных библиотек, содержащих крупные вставки (YAC-, ВАС- или PAC-библиотек), наиболее приемлем метод картирования, основанный на использовании STS. STS — это короткий одно-копийный участок ДНК (примерно 100—300 п. н.), который можно выявить при помощи Π ЦР с использованием уникального набора праймеров. Для получения протяженного контига, охватывающего значительный участок хромосомы, требуется большое число STS, находящихся на расстоянии 50—100 т. п. н. друг от друга. Напри-
Молекулярная генетика человека 463
мер, для физического картирования хромосомы длиной примерно 200 миллионов пар нуклеотидов (м. п. н.) необходимо от 1500 до 3000 STS. Для построения же достаточно точной физической карты всего генома человека их нужно по меньшей мере 30 000.
Для создания STS были разработаны различные подходы. В одном из них ДНК из очищенного препарата одной хромосомы человека, изолированной при помощи проточной цитофотометрии, обрабатывают рестриктазой и клонируют в векторе, способном акцептировать небольшие (< 1000 п. н.) фрагменты ДНК. Затем секвенируют вставки из клонов, выбранных случайным образом, и отбрасывают те клоны, в которых вставки короче 100 п. н., и те, которые содержат последовательности из повторяющихся элементов ДНК человека. Наличие повторов определяют при помощи компьютерных программ, сравнивая нуклеотидную последовательность вставки с последовательностями всех известных повторов ДНК человека. Затем для каждого отобранного клона находят нуклеотидные последовательности праймеров. Каждый STS тестируют на предмет уникальности амплифицируемого фрагмента хромосомной ДНК.
С помощью ПЦР-скрининга выявляют STS в индивидуальных клонах библиотеки с крупными вставками, а затем, основываясь на распределении STS в клонах, численными методами находят вероятный набор перекрывающихся клонов и относительное положение имеющихся STS (рис. 20.18). С разработкой метода РГ-картирования появилась возможность без особого труда упорядочить STS, что облегчает идентификацию составляющих контига (рис. 20.19). Выявив перекрывающиеся клоны, определяют степень их перекрывания, размер контига и общую длину охватываемой им ДНК, с помощью эндонуклеазного картирования с использованием электрофоретической системы, разделяющей фрагменты ДНК длиннее 105 п. н. (например, импульсный электрофорез). Уже получены контиги хромосомных районов, охватываюшие от 1 до более чем 20 м. п. н., а в ряде случаев — и целые хромосомы. В конце концов будут получены контиги из крупных фрагментов ДНК, перекрывающие весь геном.
Построение контигов из космидных, P1- и λ-библиотек
Более удобными для генетических исследований и широкомасштабного секвенирования часто оказываются контиги из небольших фрагментов ДНК, чем из крупных. Для построения контигов определенных районов хромосом или целых хромосом нередко используют космид-ные библиотеки. Обычно перекрывающиеся кос-мидные клоны идентифицируют методом геномной дактилоскопии. Для этого из каждого клона экстрагируют ДН К и обрабатывают ее рестриктазой. Полученные фрагменты метят, разделяют при помощи электрофореза и визуализируют радиоавтографическими методами. Каждый клон порождает специфический набор фрагментов —уникальный отпечаток его ДНК; у перекрывающихся клонов один или несколько фрагментов совпадают.
Для концевого мечения ДНК-фрагментов -независимо от характера образующихся после эндонуклеазной обработки концов (5'-, 3'-выступающих или тупых) — можно использовать реакцию замещения, катализируемого ДНК-по-лимеразой Т4. В этом случае к препарату космидной ДНК, обработанной рестриктазой, добавляют ДНК-полимеразу и один меченый дезоксинуклеотид (рис. 20.20). Под действием 3'-экзонуклеазной активности ДНК-полимеразы происходит последовательное отщепление 3'-концевых нуклеотидов. Процесс продолжается до тех пор, пока в противоположной цепи не экспонируется нуклеотид, комплементарный меченому дезоксинуклеотиду, добавленному в реакционную смесь. Далее включается полимеразная активность ДНК-полимеразы, и к 3'-концу присоединяется свободный меченый нуклеотид. Поскольку другие нуклеотиды в реакционной смеси отсутствуют, дальнейшего роста цепи не происходит.
Для мечения эндонуклеазных фрагментов существуют и другие способы. Усеченный 3'-конец фрагмента можно удлинить (достроить) при помощи фрагмента Кленова, использующего выступающий 5'-конец в качестве матрицы; достраивание осуществляется за счет добавленных в реакционную смесь дезоксирибонуклеотидов, один из которых несет метку. Кроме того, к вы-
464 ГЛАВА 20
Рис. 20.18. STS-картирование. A. STS (с 1 по 15), обнаруженные с помощью ПЦР-скрининга В клонах а-е, обозначены знаком плюс (+). Буквами L и R указаны STS, находящихся на 5'- и 3 '-концах вставки (на ее левом и правом концах соответственно). Б. Идентифицировав перекрывающиеся участки, можно построить контиг из пяти клонов и карту расположения STS. Полученные данные не позволяют установить порядок некоторых из них (номера в скобках). Интервалы между STS представлены одинаковыми; в действительности они неизвестны. |
Рис. 20.19. Картирование с помощью упорядоченных STS (числа с 20 по 31 над горизонтальной линией). Точками указан STS-состав клонов f-j. STS упорядочены, что позволяет без труда идентифицировать перекрывающиеся клоны. |
ступающим концам рестрикционных фрагментов можно присоединять меченые линкеры.
Для выявления перекрывающихся участков необходимо проанализировать очень большое число космидных клонов, поэтому для поиска меченых рестрикционных фрагментов, общих для пары клонов, используют специальные компьютерные программы. ДНК-отпечаток каждого клона сканируют, информацию вводят в компьютер и проводят попарные сравнения. По результатам этих сравнений организуют из клонов контиги. Наличие перекрывающихся участков в клонах созданного контига подтверждается построением подробных рестрикционных карт вставок. Пробелы между контигами заполняют, выбирая зонды из ближайших концов соседних
Молекулярная генетика человека 465
Рис. 20.20. Концевое мечение двух цепочечных ДНК с помощью ДНК-полимеразы Т4. 3'-экзонуклеазная активность ДΗК-полимеразы катализирует отщепление 3'-концевых нуклеотидов фрагментов ДНК с тупыми концами (А), с выступающими 3'- концам и (Б) или с выступающими 5'-концам и (В). Отщепление происходит до тех пор, пока на противоположной цепи не экспонируется основание, комплементарное меченому дезоксирибонуклеотиду, введенному в реакционную смесь (dGTP*); затем «включается» полимеразная активность ДНК-полимеразы Е4, и к 3'-концу присоединяется свободным меченый дезоксирибонуклеотид. Метка включается в оба конца фрагментов ДНК (на рисунке это не показано). Для мечения можно использовать любой дезоксирибонуклеотид. |
контигов и проводя скрининг библиотеки, содержащей крупные вставки, для поиска недостающих участков ДНК.