Современные методы полногеномного секвенирования ДНК
Непрерывное совершенствование технологий секвенировани\ привело к тому, что проект по секвенированию человеческого генома, «Геном человека» (Human Genome Project, HGP), был реализован за один год в 2001 году после десяти лет работы (Watson J, 1990; Venter J, et al, 2001). Ожидается, что секвенирование генома (sequencing, считывание информации с ДНК) предоставит человечеству преимущества в понимании здоровья людей и позволит перейти к индивидуальному лечению. В процессе секвенирования генома (или полногеномного секвенирования, wohle genome sequencing) исследователь или клинический специалист получает информацию о всей ДНК, находящейся в 23 хромосомах клеток человека, которые содержат примерно 3 млрд. пар нуклеотидов. Эта информация включает последовательности всех генов ( 20 тыс.) и некодирующих участков (которые составляют большую часть генома человека и участвуют, в частности, в регуляции работы генов; однако функции некодирующей части генома еще только предстоит узнать). Таким образом, в результате одного исследования (секвенирования) генома возможно получить гигантский массив информации, который будет использоваться в клинической практике, как с уже имеющимися данными, так и с данными, которые учёные будут получать по мере научного прогресса в будущем.
Последние 20 лет доминирует автоматизированное секвенирование по методу Сенгера. Этот метод был использован в глобальных проектах по секвенированию генома человека, различных животных, бактерий и вирусов. Однако данный метод оказался не подходящим для быстрого рутинного секвенирования человеческих геномов в клинических целях. Поэтому появилась необходимость в изобретении новых технологий полногеномного секвенирования. Автоматизированное секвенирование по Сенгеру считается "методом первого поколения", тогда как современные методы называются "методами нового, или второго, поколения" (Next-Generation Sequencing, NGS). В основе этих технологий находятся различные стратегии, основанные на уникальных комбинациях приготовления ДНК-матриц, секвенирования, визуализации, а также выравнивания и составления последовательностей (sequences или "сиквенсов") ДНК. Основным преимуществом секвенирования нового поколения является рентабельность продукции огромного массива данных за короткое время. Индивидуальное геномное секвенирование – это быстрорастущая область технологии и медицины. Как ожидается, существенный прогресс последних лет в секвенировании в скором времени может привести к уменьшению стоимости секвенирования до 1000 долларов на индивидуальный геном. В добавление к персональному полногеномному секвенированию, достижения в изучении однонуклеотидных полиморфизмов (single-nucleotide polymorphism, SNP) позволили генотипировать большинство вариаций в индивидуальных геномах. В ближайшем будущем пациенты смогут принести информацию о собственном геноме для того, чтобы врач смог оценить риски заболеваний и скорректировать стратегию лечения.
В ходе полногеномных исследований в последние годы было идентифицировано несколько сотен риск-факторов для таких заболеваний, как рак, атеросклероз и многих других. Открытие и изучение этих факторов позволит глубже узнать природу заболеваний и создать новые стратегии лечения и предотвращения заболеваний. Огромное множество редких вариантов представлено у нескольких индивидуумов, которые возможно узнать, применяя только полногеномное секвенирование. Различия в геноме могут иметь разные эффекты на экспрессию генов. Не менее 500 маркеров заболеваний были недавно идентифицированы в полногеномных исследованиях, несколько из них связаны с мРНК и экспрессией протеинов.
Основными коммерческими технологиями ДНК-секвенирования являются платформы: «454 Sequencing» (Roche), «Solexa/Illumina» (Illumina), «SOLiD» (Applied Biosystems) и «Polonator» (Dover). Интенсивная конкуренция между так называемыми "технологиями нового, или второго, поколения" привела к снижению стоимости секвенирования млн. пар оснований ДНК.
В основе ДНК-секвенирования второго поколения лежат следующие два процесса: пространственно-разделенная полимеразная репликация отдельной молекулы ДНК на твердой матрице (микросфере или плоской подложке); циклическое химическое секвенирование. Каждая платформа отличается применяемым методом. Все платформы имеют одинаковые способы приготовления первичной ДНК библиотеки с помощью универсальных адаптеров. Эти олигонуклеотидные адаптеры комплиментарны ПЦР праймерам, используемым для амплификации библиотеки, и олигонуклеотидам, иммобилизованным на твердом носителе для клональной амплификации. Ключевыми особенностями для каждой коммерческой платформы являются последующие шаги.
Фрагменты ДНК лигируются (образование химической связи, с помощью фермента лигазы) с адаптерами и амплифицируются с помощью уникальной для каждой платформы технологии.Такие модифицированные молекулы ДНК амплифицируются на микросферах (454 и SOLiD) или на стеклянной подложке (Illumina). Далее амплифицированные нити ДНК спариваются с комплементарными ДНК нуклеотидами в циклических реакциях в индивидуальных проточных ячейках. В случае комплиментарности последовательности ДНК-матрицы возникает сигнал, который регистрируется системой детекции.
Технологии компаний Roche (454) и Life Technologies (SOLiD 5500 и Ion Torrent) используют эмульсионный ПЦР для синтеза клональных ДНК фрагментов на микросферах. Водно-масляная эмульсия, микросферы и исследуемая ДНК смешиваются в прецизионной концентрации так, чтобы каждая микрокапля эмульсии содержала одну сферу и одну молекулу ДНК. После проведения ПЦР реакции, матрицы переносятся в пико-лунки («pico-wells») или связываются со стеклянной проточной ячейкой. Illumina использует другую технологию: ДНК-кластеры создаются непосредственно в проточной ячейке с помощью так называемого «мостового ПЦР» (bridge PCR) на стеклянной подложке.
С практической стороны каждый метод обладает своими преимуществами и недостатками. Процесс эмульсионного ПЦР является сложным и трудоемким, хотя каждая из этих компаний разработала автоматизированные технологии, чтобы частично сократить трудозатраты по объему и времени. Генерация кластеров с помощью мостового ПЦР уже полностью автоматизирована. Приборы MiSeq фактически не нуждаются в участии человека в процессах от создания кластеров до анализирования данных, что является очень привлекательным с практической стороны применения. Потенциальным недостатком технологии мостового ПЦР Illumina является то, что успех генерации кластеров не известен до начала самого секвенирования. Это может приводить к дополнительным затратам в случае неудачной генерации кластеров. Но на практике процесс создания кластеров достаточно надежен, если ДНК-библиотеки имеют высокое качество, а концентрации точно выверены с помощью количественного ПЦР.
Каждая из доступных на рынке платформ использует различную «секвенирующую химию» и методы для детекции сигнала. Все платформы 454 типа используют пиросеквенирование, где индивидуальные хемилюминисцентные сигналы означают инкорпорацию основания в цепочку; интенсивность сигнала коррелирует с количеством оснований. Приборы Ion Torrent используют похожую технологию «секвенирования с помощью синтеза» (sequencing-by-synthesis, SBS), но детектируют сигналы ионов водорода (Н+), которые появляются при работе ДНК полимеразы в процессе инкорпорации нуклеотидов. В сущности, Ion Torrent-чип представляет собой очень чувствительный pH-метер. Каждый чип содержит миллионы ион-чувствительных полупроводниковых транзисторных (ion-sensitive field-effect transistor, ISFET) сенсоров, позволяющих параллельную детекцию множества секвенирующих реакций. Компания Roche заявила, что адаптирует похожую систему детекции через лицензирование технологии DNA Electronics, что сделает 454 и Ion Torrent в принципе идентичными (Roche Partners with DNA Electronics to Help Migrate 454 Platform to Electrochemical Detection, 2010). Достоинствами полупроводниковой технологии являются: сравнительно низкая цена производства приборов, чипов и реагентов; быстрый процесс секвенирования; масштабируемость системы.
Технология "секвенирования с помощью синтеза", которая используется в платформах 454 и Ion Torrent, позволяет получать более длинные последовательности ДНК. Возможности платформы Ion Torrent в настоящее время ограничены тем, что размеры фрагментов ДНК намного короче, чем у Roche 454. Однако со временем эта проблема может быть решена. Обе технологии имеют проблему секвенирования гомополимеров, для которых появляются ложные вставки и делеции нуклеотидов. В платформах Illumina и SOLiD 5500 создаются короткие последовательности ДНК, но применяются различные химические реакции для секвенирования. В аппаратах Illumina используются обратимые терминирующие красители и "секвенирования с помощью синтеза", с применением итерационных циклов включения нуклеотидов, визуализирования и расщепления терминаторов синтеза. В приборах SOLiD применяется «секвенирование лигированием» (sequencing by ligation, SBL), с итерационными циклами лигирования (Sequencing by Oligo Ligation Detection). В процессе «секвенирования лигированием» используется двойное кодирование на каждый динуклеотид, который переводится в цветовой код. В новой технологии «Exact Call Chemistry», предложенной в инструментах 5500 типа применяется тройное кодирование, обеспечивающее более точное секвенирование. Технологии Illumina SBS имеют преимущество по сравнению с SOLiD SBL в длине сиквенсов, которые составляют до 100 п.н. у HiSeq и 150 п.н. у других инструментов Illumina. SOLiD SBL имеет максимум 75 п.н., но двойное и тройное кодирование обеспечивает более точный процесс.
Первые приборы для секвенирования создавались, в первую очередь, для научных исследований. В результате были созданы такие системы, как «454 GS FLX» (Roche), «SOLiD» (Life Technologies) и «HiSeq» (Illumina). Эти платформы способны давать на выходе огромное количество последовательностей за один проход. Однако из-за подобного выхода, необходимо примерно 10 дней на один проход для каждого инструмента (SOLiD и HiSeq). Для применения в целях клинической диагностики были созданы компактные «настольные» («bench-top») инструменты такие, как «454 FLX Jr» (Roche), «MiSeq» (Illumina) и «Ion Torrent» (Life technologies). Roche и Illumina пошли по пути уменьшения размеров своих больших приборов, основанных на тех же технологиях ДНК-секвенирования. Система Ion Torrent от Life Technologies базируется на технологии совершенно другого принципа, в которой используется детекция протонов (Н+) на полупроводниковых чипах. Эти приборы имеют важные преимущества: относительно низкую стоимость технологии и быстрое время выполнения секвенирования. Приборы Ion Torrent и MiSeq могут завершить процесс в течение нескольких часов вместо 10 дней, которые требуются для исследований на больших приборов. При низкой стоимости и сокращении времени на выполнение работы возможно проводить ДНК-секвенирование непосредственно на рабочем месте в клинической лаборатории и использовать данные секвенирования в работе с пациентами. Пропускная способность компактных секвенаторов намного ниже, чем у больших инструментов. Однако для целенаправленного клинического секвенирования это не является серьёзным препятствием. Кроме того, компании-производители каждые несколько месяцев увеличивают пропускную способность инструментов, что в дальнейшем снимет вопрос низкой пропускной способности для клинического применения в будущем.
Платформы ДНК-секвенирования 3-го поколения
В настоящее время появились и активно развиваются платформы ДНК-секвенирования «третьего поколения», представленные приборами: «Helicos Heliscope» (Helicos BioScience Corporation), «PacBio RS SMRT» (Pacific Biosciences) и «MinION» (Oxford Nanopore). Третье поколение отличается от второго тем, что первичная амплификация ДНК больше не требуется. Исследуемая ДНК секвенируется непосредственно на уровне одной молекулы с использованием специально созданных полимераз. Преимуществом этого подхода является то, что удается избежать проблем, связанных с накоплением ошибок, возникающих при амплификации ДНК. Однако, важно отметить, что ни одна из технологий третьего поколения пока не получила широкого распространения.
Основные производители систем полногеномного секвенирования:
454 sequencing, http://www.my454.com/
Solexa/Illumina, http://www.illumina.com
SOLiD, http://www.appliedbiosystems.com
Polonator http://www.polonator.org/
Helicos Heliscope, http://www.helicosbio.com
Pacific Biosciences SMRT, http://www.pacificbiosciences.com
Oxford Nanopore, http://www.nanoporetech.com
Таким образом, наличие множества платформ и значительное снижение стоимости секвенирования приведут к тому, что технологии нового поколения внесут основной вклад в развитие практической медицины в будущем. Стоимость в размере 1000 долл. За секвенирование одного генома позволит распространить метод полногеномного секвенирования и войти в обычную практику клинической диагностики. Полногеномное секвенирование, как ожидается, будет основой для новой области медицины – так называемой индивидуальной, или персональной, медицины. Целью индивидуальной медицины станет интеграция клинических симптомов, индивидуальной и семейной истории болезней и последовательности ДНК пациента в медицину нового уровня, которая будет индивидуальна и уникальна.
МЕТОД БИОЧИПОВ
Прообразом современных биочипов послужил саузерн-блот. Эд Саузерн использовал меченую нуклеиновую кислоту для определения специфической последовательности среди фрагментов ДНК, зафиксированных на твердой положке. Биочипы – это миниатюрные гелевые пластинки с многочисленными правильно расположенными ячейками на стекле, в микрокаплях геля (рис. 29Б), в микрокапиллярах или своеобразные «микролаборатории» (рис. 29А).
А Б
Рисунок 29. Биочипы: «микролаборатория» (А), в микрокаплях геля (Б) [Баранов А.А. и др.].
Эффективность биочипов связана с возможностью параллельного проведения огромного количества специфических реакций и взаимодействий молекул биополимеров (ДНК, РНК, белки или клетки) друг с другом и низкомолекулярными лигандами. Удается собрать и обработать на отдельных элементах биочипа огромное количество биологической информации.
Технологически ДНК-микрочип представляет собой небольшую поверхность, на которую с большой плотностью в определённом порядке нанесены фрагменты одноцепочечной синтетической ДНК с известной последовательностью. Эти фрагменты выступают в роли зондов, с которыми гибридизуются (образуют двуцепочечные молекулы) комплементарные им цепи ДНК из исследуемого образца, обычно меченные флуоресцентным красителем. Чем больше в образце молекул ДНК с определенной последовательностью, тем большее их количество свяжется с комплементарным зондом, и тем сильнее будет оптический сигнал в точке микрочипа, куда был «посажен» соответствующий зонд. После гибридизации поверхность микрочипа сканируется, и в результате каждой последовательности ДНК ставится в соответствие тот или иной уровень сигнала, пропорциональный числу молекул ДНК с данной последовательностью, присутствующих в смеси.
В обычном ДНК микрочипе (н-р, производства Affymetrix) зонды прикрепляются к твердой поверхности — стеклянному или силиконовому чипу. Другие платформы, например, выпускаемые Illumina, используют микроскопические шарики вместо больших твердых поверхностей. Технология ДНК-микрочипов находит самые разнообразные применения в современной биологии и медицине для анализа сложных смесей ДНК — например, совокупности всех транскриптов (матричных РНК) в клетке. ДНК микрочипы используют для анализа изменения экспрессии генов, выявления однонуклеотидных полиморфизмов, генотипирования или повторного секвенирования мутантных геномов. Микрочипы отличаются по конструкции, особенностям работы, точности, эффективности и стоимости.
Исследуемая ДНК подвергается рестрикции и проходит предварительную обработку – прикрепление флуоресцентной метки к фрагментам ДНК. Далее исследуемый образец наносится на все ячейки чипа и спустя некоторое время смывается. Если в наборе есть олигонуклеотид, комплементарный закрепленному в ячейке, то между ними образуется связь. После промывки чип помещается в флуоресцентный микроскоп, где по световому сигналу определяется состав проб: носителем этой информации являются интенсивность и цвет излучения. Зная олигонуклеотиды, изначально помещенные в флуоресцирующую ячейку, можно сделать вывод о составе фрагмента исследуемой ДНК.