Генетический код
Что такое генетический код
Генетический, или биологический, код является одним из универсальных свойств живой природы, доказывающим единство ее происхождения. Генетический код — это способ кодирования последовательности аминокислот полипептида с помощью последовательности нуклеотидов нуклеиновой кислоты (информационной РНК или комплиментарного ей участка ДНК, на котором синтезируется иРНК).
Встречаются другие определения. Генетический код — это соответствие каждой аминокислоте (входящей в состав белков живого) определенной последовательности трех нуклеотидов. Генетический код — это зависимость между основаниями нуклеиновых кислот и аминокислотами белка.
В научной литературе под генетическим кодом не понимают последовательность нуклеотидов в ДНК у какого-либо организма, определяющую его индивидуальность. Неверно считать, что у одного организма или вида код один, а у другого — другой. Генетический код — это то, как кодируются аминокислоты нуклеотидами (т. е. принцип, механизм); он универсален для всего живого, одинаков для всех организмов. Поэтому некорректно говорить, например, «Генетический код человека» или «Генетический код организма», что нередко используется в околонаучной литературе и фильмах. В данных случаях обычно имеется в виду геном человека, организма и др.
Разнообразие живых организмов и особенностей их жизнедеятельности обусловлено в первую очередь разнообразием белков. Специфическое строение белка определяется порядком и количеством различных аминокислот, входящих в его состав. Последовательность аминокислот пептида зашифрована в ДНК с помощью биологического кода. С точки зрения разнообразия набора мономеров, ДНК более примитивная молекула, чем пептид. ДНК представляет собой различные варианты чередования всего четырех нуклеотидов. Это долгое время мешало исследователям рассматривать ДНК как материал наследственности.
Как кодируются аминокислоты нуклеотидами
1) Нуклеиновые кислоты (ДНК и РНК) — это полимеры, состоящие из нуклеотидов. В каждый нуклеотид может входить одно из четырех азотистых оснований: аденин (А, еn: A), гуанин (Г, G), цитозин (Ц, en: C), тимин (T, en: Т). В случае РНК тимин заменяется на урацил (У, U).
При рассмотрении генетического кода принимают во внимание только азотистые основания. Тогда цепочку ДНК можно представить в виде их линейной последовательности. Например:
...AAATGAACTTCA...
Комплиментарный данному коду участок иРНК будет таким:
...UUUACUUGAAGU...
2) Белки (полипептиды) — это полимеры, состоящие из аминокислот. В живых организмах для построения полипептидов используется 20 аминокислот (еще несколько очень редко). Для их обозначения тоже можно использовать одну букву (хотя чаще используют три — сокращение от названия аминокислоты).
Аминокислоты в полипептиде соединены между собой пептидной связью также линейно. Например, пусть имеется участок белка со следующей последовательностью аминокислот (каждая аминокислота обозначается одной буквой):
...MLFRSRWIMVPQHE...
3) Если стоит задача закодировать каждую аминокислоту с помощью нуклеотидов, то она сводится к тому, как с помощью 4 букв закодировать 20 букв. Это можно сделать, сопоставляя буквам 20-ти буквенного алфавита слова, составленные из нескольких букв 4-х буквенного алфавита.
Если одну аминокислоту кодировать одним нуклеотидом, то можно закодировать только четыре аминокислоты.
Если каждой аминокислоте сопоставлять два подряд идущих в цепи РНК нуклеотида, то можно закодировать шестнадцать аминокислот. Действительно, если имеется четыре буквы (A, U, G, C), то количество их разных парных комбинаций будет 16: (AU, UA), (AG, GA), (AC, CA), (UG, GU), (UC, CU), (GC, CG), (AA, UU, GG, CC). [Скобки используются для удобства восприятия.] Это значит, что таким кодом (двухбуквенным словом) можно закодировать только 16 разных аминокислот: каждой будет соответствовать свое слово (два подряд идущих нуклеотида).
Из математики формула, позволяющая определить количество комбинаций, выглядит так: ab = n. Здесь n — количество разных комбинаций, a — количество букв алфавита (или основание системы счисления), b — количество букв в слове (или разрядов в числе). Если подставить в эту формулу 4-х буквенный алфавит и слова, состоящие из двух букв, то получим 42 = 16.
Если в качестве кодового слова каждой аминокислоты использовать три подряд идущих нуклеотида, то можно закодировать 43 = 64 разных аминокислот, так как 64 разных комбинации можно составить из четырех букв, взятых по три (например, AUG, GAA, CAU, GGU и т. д.). Это уже больше, чем достаточно для кодирования 20 аминокислот.
Именно трехбуквенный код используется в генетическом коде. Три подряд идущих нуклеотида, кодирующих одну аминокислоту, называются триплетом (или кодоном).
Каждой аминокислоте сопоставляется определенный триплет нуклеотидов. Кроме того, поскольку комбинаций триплетов с избытком перекрывают количество аминокислот, то многие аминокислоты кодируются несколькими триплетами.
Три триплета не кодируют ни одну из аминокислот (UAA, UAG, UGA). Они обозначают конец трансляции и называются стоп-кодонами (или нонсенс-кодонами).
Триплет AUG кодирует не только аминокислоту метионин, но и инициирует трансляцию (играет роль старт-кодона).
Ниже приведены таблицы соответствия аминокислот триплетам нуклеоитидов. По первой таблице удобно определять по заданному триплету соответствующую ему аминокислоту. По второй — по заданной аминокислоте соответствующие ей триплеты.
Рассмотрим пример реализации генетического кода. Пусть имеется иРНК со следующим содержанием:
AUGGAUUCUACCUGGUUAUUGAAAAAUCAGUAG
Разобьем последовательность нуклеотидов на триплеты:
AUG-GAU-UCU-ACC-UGG-UUA-UUG-AAA-AAU-CAG-UAG
Сопоставим каждому триплету кодируемую им аминокислоту полипептида:
Метионин — Аспаргиновая кислота — Серин — Треонин — Триптофан — Лейцин — Лейцин — Лизин — Аспарагин — Глутамин
Последний триплет является стоп-кодоном.
Свойства генетического кода
Свойства генетического кода во многом являются следствием способа кодирования аминокислот.
Первое и очевидное свойство — это триплетность. Под ним понимают тот факт, что единицей кода является последовательность из трех нуклеотидов.
Важным свойством генетического кода является его неперекрываемость. Нуклеотид, входящий в один триплет, не может входить в другой. То есть последовательность AGUGAA можно прочитать только как AGU-GAA, но нельзя, например, так: AGU-GUG-GAA. Т. е. если пара GU входит в один триплет, она не может уже быть составной частью другого.
Под однозначностью генетического кода понимают то, что каждому триплету соответствует только одна аминокислота. Например, триплет AGU кодирует аминокислоту серин и больше никакую другую. Данному триплету однозначно соответствует только одна аминокислота.
С другой стороны, одной аминокислоте может соответствовать несколько триплетов. Например, тому же серину, кроме AGU, соответствует кодон AGC. Данное свойство называется вырожденностью генетического кода. Вырожденность позволяет оставлять многие мутации безвредными, так как часто замена одного нуклеотида в ДНК не приводит к изменению значения триплета. Если внимательно посмотреть на таблицу соответствия аминокислот триплетам, то можно увидеть, что, если аминокислота кодируется несколькими триплетами, то они зачастую различаются последним нуклеотидом, т. е. он может быть любым.
Также отмечают некоторые другие свойства генетического кода (непрерывность, помехоустойчивость, универсальность и др.).