Предполагаемый первичный код
Основание | ||||
U | C | A | G | |
Объект кодирования | Met и сигнал «Старт» | Вероятности аминокислот: Ser – 25% Pro – 25% Thr – 25% Ala – 25% | Сигнал «Стоп» | Вероятности аминокислот: Arg– 37,5% Gly – 25% Cys – 12,5% Ser – 12,5% Trp – 6,25% |
Ассортимент из трёх аминокислот уже давал Природе возможность строить простейшие белки многих типов, а присоединение к ним атомов металла, в качестве активных центров, позволяло создавать эффективные ферменты. Но по сравнению с сегодняшним набором из 20-ти аминокислот, это, конечно, был лишь очень бедный минимум. Эволюция биохимии, несомненно, была направлена к расширению ассортимента аминокислот, что требовало многих изменений и, в частности, увеличения возможностей генетического кода.
Особенности современного кода, позволяющие увидеть его предысторию, кроме совмещения метионина с сигналом „старт”, заключаются в неодинаковой информационной нагрузке на разные нуклеотиды триплета. Из таблицы B видно, что серин является единственной аминокислотой, при кодировании которой может изменяться второй нуклеотид. Первый нуклеотид изменяется в кодах аргинина, лейцина и серина. Зато третий нуклеотид изменяется (создаёт кодовые синонимы) у 18-ти аминокислот из 20-ти. Иначе говоря, с кодируемыми аминокислотами теснее всего связана вторая буква „слова”, слабее – первая, а связь с третьей буквой чётко выражена только у двух аминокислот.
Есть веские основания полагать, что свойства каждого параметра зависят от длительности его существования в ходе эволюции. Поэтому в разной информационной нагрузке нуклеотидов триплета можно увидеть развитие кода от одиночного нуклеотида к парам нуклеотидов (дуплетам) и, наконец, к триплетам. Ранее всего включился в работу второй нуклеотид триплета, затем к нему подключился первый, а третий вошёл в систему кодирования лишь на позднейших этапах эволюции. Кодовые возможности третьего нуклеотида далеко не исчерпаны, что позволяет далее наращивать ассортимент аминокислот в белках.
Если кодирование одиночными нуклеотидами показано в таблицеC, а триплетами нуклеотидов – в таблицеB, то представления о промежуточном варианте кодирования – парами нуклеотидов – приведены в таблицеD. При составлении таблицы вызвал сомнение код AG, который мог бы соответствовать серину или аргинину. Но более вероятно кодирование этих аминокислот дуплетами UC и CG, поэтому приходится думать, что код AGстал первым из кодовых синонимов, каких много в современной системе кодирования. Это удивляет потому, что возможности дуплетного кодирования гораздо скромнее, чем у триплетного, и здесь, казалось бы, не до синонимов.
Таблица D