Молекулярная эволюция: два плюс два - три

Молекулярная эволюция: два плюс два - три
Молекулярная эволюция: два плюс два - три

Два плюс два равно трем

Без него ничего бы не получилось. Тем не менее ключ к генам некоторым кажется странно кривым. С другой стороны, нельзя отрицать, что он хорошо выполняет свою работу, и не только со вчерашнего дня. Но: Как появилась на свет эта книга с четырьмя в степени трех печатей?

Image
Image

Когда Маршалл Ниренберг и Хар Гобинд Хорана предстали перед образованной аудиторией на симпозиуме в Колд-Спринг-Харбор в 1966 году, работа века была завершена. Впервые они представили публике полностью расшифрованный генетический код, включив в себя новаторскую работу начала 1960-х годов. Язык генов был понят.

Она и ее компаньоны кропотливо расшифровывали слово в слово, создавали искусственные рибонуклеиновые кислоты и переводили их в короткие белковые цепи в пробирке. AAAAAAAAAAAA производит лизин-лизин-лизин-лизин, CCCCCCCCCCCC производит пролин-пролин-пролин-пролин, GAGAGAGAGAGA производит глутамат-аргинин-глутамат-аргинин и так далее.

Вот как они выяснили, что каждое генетическое слово состоит из трех букв, или, выражаясь более технически: триплет оснований в ДНК или матричной РНК образует кодон. Соответствующий антикодон транспортной РНК отвечает за идентификацию такого кодона: на рибосоме эти тРНК переводят кодон нуклеиновой кислоты в строительный блок белка, аминокислоту - например, AGC в серин.

Image
Image

Законченная таблица кода показала: 64 кодона - столько комбинаций из трех можно составить из четырех букв нуклеиновых кислот - обозначают 20 аминокислот. Куда бы в последующие годы ни смотрела зарождающаяся профессия молекулярных биологов, все изучаемые живые существа использовали генетический код совершенно одинаково. Поразительная универсальность кода быстро стала одним из самых убедительных доказательств общего происхождения всей жизни.

Золотое правило должно было принять несколько царапин в то же время - некоторые бактерии, а также наши митохондрии имеют различный стиль перевода для одной или двух аминокислот - но единая картина все еще в значительной степени верна. Итак, суть вроде бы сказана.

Но исследователи все еще хотят получить сноски в истории науки в этой, казалось бы, исчерпанной области. Потому что тайны и удивления все еще существуют. Почему 64 кодовых слова всего для 20 различных аминокислот? Иногда четыре или даже шесть кодонов обозначают всего одну аминокислоту. Не слишком ли расточительно природа справляется с управлением информацией? Еще в 1968 году один из первооткрывателей структуры ДНК Фрэнсис Крик подозревал, что это, вероятно, несколько неоптимальное «застывшее совпадение» эволюции.

Британские биохимики Хуан-Лин Ву, Стефан Бэгби и Жан ван дер Эльсен читали комментарий старейшины к проблеме происхождения триплетного кода чуть дальше. Он предположил, что сначала был один код - всего четыре основания, т. е. четыре кодона в качестве ключа первоначально только для четырех аминокислот, - затем дублетный код, два основания с 16 возможными комбинациями кодонов и, наконец, триплетный код.

Но если бы первобытный организм в какой-то момент переключил свою рамку считывания с двух на три, размышлял Крик, это, вероятно, было бы фатальным: внезапно все гены произвели бы совершенно другие и, следовательно, бесполезные белки. Например, слова AG, CC, TT станут AGC, CTT. Поэтому Крик предположил, что даже на стадии дуплета рибосомы уже могли считывать РНК в триплетном порядке, за исключением того, что читались только два основания, от AGC до AG-, AC или -GC.

Image
Image

Всегда вперед три основания РНК, читая только два. Но какой? Средний обязательно должен быть там, утверждают британские ученые из Университета Бата, потому что он был бы решающим в одном коде. Даже в сегодняшнем коде одного среднего основания кодона достаточно, чтобы приблизительно определить химическое свойство аминокислоты. Все аминокислоты с кодоном -А-, т.е. с аденином в середине триплета, имеют преимущественно полярный химический характер.

Для дублетной стадии либо передняя, либо задняя буква РНК остается в качестве альтернативы среднему положению. «Оба действовали как кодон - и передний, и задний дублет», - неожиданный ответ трех биохимиков.

Существующий фиксированный код является компромиссом между максимально богатым словарным запасом и системой, позволяющей избежать ошибок перевода

(Жан ван дер Эльсен) Если первое основание добавить к среднему основанию - ван дер Эльсен говорит о дублете префикса - возможная комбинация, умноженная на четыре, может кодировать 16 аминокислот. Суффикс-кодон обеспечивает только восемь дополнительных комбинаций. Причина в том, что последняя базовая буква, дополняющая среднюю позицию, читается несколько небрежно. Различаются не все четыре буквы РНК, а только две пары: химически родственные C и U с одной стороны и A и G с другой. Всего 24 кодовых слова из префиксных и суффиксных кодонов. Если вычесть стоп-кодон для остановки синтеза белка, идеальное соотношение одного кодона к одной аминокислоте будет почти достигнуто при 23:20.

Чтобы объяснить, как две системы шифрования могут сосуществовать, ван дер Эльсен и его коллеги углубляются в теорию. Код был установлен не на самой рибосоме, а когда транспортные РНК были упакованы аминокислотами. Зарядка белковых строительных блоков осуществляется специальными, очень избирательными ферментами: синтетазами.

Вы обращаете пристальное внимание на антикодон транспортной РНК для каждой аминокислоты. Ван дер Эльсен полагает, что миллиарды лет назад один тип этих ферментов распознавал дуплеты префиксов, а другой распознавал бы дуплеты суффиксов. Взгляд на набор структурных данных доказывает его правоту: до сих пор существует две разновидности этих синтетаз, каждая из которых подходит к антикодону с разных сторон.

Даже в нынешнем триплетном коде британцы обнаруживают реликвии первобытных молекулярных времен. Аминокислоты пролин, валин и аланин адекватно определяются только с префиксными кодонами CC-, GU- и GC- соответственно. Однако с системой суффиксов эволюция еще больше размыла следы, но они существуют. У экзотической бактерии Thermus thermophilus второго и третьего оснований кодона достаточно для идентификации аспартата аминокислоты.

Image
Image

Разогревшись, британский разум выплевывает гипотезу о происхождении жизни. Говорят, он был горячим. Они заключают это из другой особенности архаичных микробов - у них отсутствуют синтетазы для аминокислот аспарагина и глутамина. Вероятно, их не было и у последнего общего предка всех организмов.

Аспарагин и глютамин являются наиболее чувствительными к теплу строительными блоками белка. Если четыре миллиарда лет назад они все еще отсутствовали, это предполагает довольно теплый дом для нашего одноклеточного предка: ван дер Эльсен предполагает, что он, вероятно, жил в горячих источниках или бурлящих серных прудах. Сегодняшний канон из 20 аминокислот постепенно утвердился после эмиграции в более прохладные регионы.

Генетический код, фактически являющийся воплощением преемственности в море перемен, вероятно, еще некоторое время находился в движении после перехода от двух- к трехкодовому коду. Тем не менее в итоге получилось всего 20, а не 60 аминокислот. «В настоящее время фиксированный код, вероятно, представляет собой компромисс между максимально богатым словарным запасом и системой, которая позволяет избежать ошибок перевода», - считает ван дер Эльсен.

Множество кодонов с одинаковым значением ни в коем случае не являются пустой тратой времени. Неправильные пары или мутации в первом и третьем основаниях триплета редко имеют серьезные последствия. И какие бы критические замечания ни приходили в голову искушенным комбинаторам по поводу кода, главное просто непоколебимо: он работал веками.