Молекулярная филогения
В последние годы в связи с появлением в естественнонаучной практике большого количества экспериментальных данных и теоретических методов, теория эволюции испытывает ускоренное изменение и развитие. В ее поле зрения попали кодирующие макромолекулы: ДНК, РНК и белки, составляющие костяк молекулярно-генетической организации клеток и организмов.
Методы определения аминокислотных последовательностей белков и нуклеотидных последовательностей ДНК были предложены Ф. Сенгером. После 1977 г. началось массовое секвенирование молекул ДНК. Результаты секвенирования с тех пор накапливаются в компьютерных банках данных, которые содержат сведения о нескольких миллиардах определенных последовательностей нуклеотидов и более 300 тыс. белков.
Расшифровка нуклеотидных последовательностей генов (ДНК), РНК и аминокислотных последовательностей белков создает новую ситуацию, позволяющую взглянуть на процесс эволюции с молекулярного уровня организации жизни. Действительно, в классической генетике аллели генов принято обозначать однородными буквами или индексами: А и а, А1 и А2 и т. д. Если в процессе эволюции один аллель вытесняет другого (А на а и т. д.), то кажется, что происходит утрата предыдущего аллеля (А) и распространение нового (а). В то же время в молекулярной генетике известно, что многие мутации возникают при замене лишь одного или нескольких нуклеотидов. Поэтому замена аллеля может сводиться к изменению единственного нуклеотида, а большая часть гена остается неизменной. Сходство последовательностей аллельных генов (или белков) остается максимальным. Чем больше накапливается различий, тем меньше сходство последовательностей. Чем раньше дивергировали два гена, тем больше фиксированных различий они накопят.
Таким образом, сравнение последовательностей ДНК одного и того же гена у разных таксонов позволяет строить филогенетические древа и оценивать датировку эволюционных событий. Обилие секвенированных последовательностей в банках данных делает применимость этого подхода практически неограниченной. Идея о том, что скорость накопления мутаций может быть достаточно постоянна для того, чтобы использовать ее для датировки событий эволюционной истории как своего рода «молекулярные часы», была высказана Л. Полингом и Э. Цукеркандлем в 1965 г. Позже, когда были разработаны методы определения нуклеотидных последовательностей, скорость накопления мутаций была установлена при сравнении ДНК тех видов, время расхождения которых было точно определено по ископаемым останкам. Не углубляясь в технику построения филогенетических древ по молекулярным данным можно отметить качественные особенности метода «молекулярных часов». Для оценки скорости молекулярной эволюции надо подсчитать число нуклеотидных различий N1,2 между последовательностями маркерного гена у двух таксонов S1, S2 и иметь палеонтологические или биогеографические оценки времени T1,2 дивергенции этих таксонов. Скорость эволюции маркерного гена измеряют количеством замен в год, нормированным на длину последовательности: V = N1,2 /2T1,2 L.
Зная скорость эволюции маркерного гена, можно оценить время дивергенции любых таксонов S3, S4, для которых известны последовательности ДНК этого гена: Т3,4 = N3,4/2V. Эти оценки справедливы только при равномерности скоростей фиксации нуклеотидных замен в ходе молекулярной эволюции данного гена (концепция молекулярных часов). Чтобы соответствовать этой концепции используют, как правило, третьи позиции кодонов или некодирующие участки геномов, изменения в которых в основном эволюционно нейтральны.
Молекулярные «признаки» (последовательности нуклеотидов) имеют два важных преимущества по сравнению с морфологическими: 1. их просто гораздо больше. Фактически каждый нуклеотид в хромосоме можно рассматривать как отдельный признак – и таким образом получать древа, основанные на многих сотнях и тысячах признаков, тогда как число морфологических признаков, пригодных для филогенетического (эволюционного) анализа, обычно ограничивается несколькими десятками.
2. большинство морфологических признаков непосредственно влияет на жизнеспособность организма, тогда как замены многих нуклеотидов являются нейтральными (незначимыми). Морфологическое сходство не обязательно свидетельствует о родстве – оно может развиться и у неродственных организмов под воздействием естественного отбора в сходных условиях обитания (явление конвергенции).
Достоверность любых эволюционных реконструкций, в том числе молекулярных, очень сильно зависит от объема и полноты исходных данных. Главным критерием достоверности молекулярных древ считается их устойчивость или повторяемость. Существует несколько разных алгоритмов филогенетических построений, основанных на одних и тех же исходных данных. Если применение разных алгоритмов дает одинаковый результат, это свидетельствует о его надежности.
Разработаны также специальные процедуры для оценки достоверности «узлов» (точек ветвления) получающихся древ. Кодирующие макромолекулы эволюционируют с разными скоростями. 1. наиболее консервативными обычно являются гены и белки некоторых очень глубоких и рано возникших генетических процессов, которые представлены у многих (или даже у всех) форм жизни.
2. менее консервативны гены и белки систем, которыевстречаются у определенных широких групп видов (например, глобины животных).
3. наиболее изменчивыми являются гены и белки РНК-содержащих вирусов, которые стремительно изменяются в борьбе с иммунной системой их хозяев (вирус гриппа, онкогенные ретровирусы).
Примером глобального древа, охватывающего все крупнейшие таксоны биологического мира, является древо 16S–18S-рибосомных РНК, построенное американцем К. Вуузом. Наиболее неожиданным свойством этого древа является существование в нем трех крупнейших ветвей, объединяющих эубактерий (обычные бактерии), архей (особая группа бактерий) и эукариот (высшие ядерные организмы). До этой работы считалось, что бактерии составляют единое надцарство Prokariota, отделенное от второго надцарства – Eukariota – существенной дистанцией. В древе К. Вууза все три глобальные ветви примерно равноудалены друг от друга. Поэтому архей следует считать самостоятельным надцарством. Таким образом, К. Вууз ввел три надцарства, или домена: Bacteria, Archaea, Eucaryota.
Древо К. Вууза построено на основании сиквенс-анализа генов 16S и 18S рРНК, кодируемых не только ядерными генами, но и генами клеточных органелл – митохондрий и хлоропластов. Этот факт считается самым веским аргументом в пользу симбиотической гипотезы эволюционного возникновения эукариот, согласно которой митохондрии происходят от симбиотических предковых пурпурных бактерий, а хлоропласты – от цианобактерий (синезеленых водорослей).
Первые молекулярные древа животного царства, основанные на анализе единичных генов и очень небольшом количестве видов, отличались низкой устойчивостью и потому вызывали мало доверия. Очень скоро стало ясно, что чем больше генов и групп животных вовлечено в анализ, тем устойчивее и надежнее становятся результаты.
Американский ученый М. Гудмен построил филогенетические древа для некоторых генов и белков высших приматов и человека.Ннаиболее близким к человеку стоит шимпанзе. Следует отметить, что до этих работ в таксономии высших приматов выделяли два семейства: Hominidae, включавшее только вид Homo sapiens, и Pongidae, включавшее гориллу, шимпанзе и орангутанга. Молекулярно-филогенетический анализ существенно изменил эту классификацию. М. Гудмен предложил новую таксономию высших приматов:
Класс Mammalia
Отряд Primates
Семейство Hominidae
Подсемейство Homininae
Род Gorilla (1 вид – горилла)
Род Homo (1 вид – человек)
Род Pan (2 вида: обычный шимпанзе и карликовый шимпанзе)
Подсемейство Ponginae
Род Pongo (1 вид – орангутанг)