ПОИСК Статьи Рисунки Таблицы Проблема генетического кода из "Молекулярная биофизика" Ген (цистрон, см. [1,2]) есть часть макромолекулы ДНК, ответственная за синтез белковой цепи. Является ли роль ДНК инструктивной или разрешающей Многочисленные данные свидетельствуют в пользу первой возможности. Синтез белка программируется молекулой ДНК, содержащей информацию о первичной структуре белковых цепей, иначе говоря, генетическую информацию. Эта информация записана в первичной структуре ДНК, т. е. в последовательности нуклеотидов. В частицах вирусов РНК-типа генетическая программа заложена в молекулах РНК. [c.553] Каково соответствие между последовательностью нуклеотидов в ДНК (и вирусной РНК) и последовательностью аминокислотных остатков в белковой цепи В этом и состоит проблема генетического кода. [c.553] Это физическая проблема. Во-первых, ставится вопрос о соответствии информационного содержания ДНК и белка, во-вторых— о количественных взаимоотношениях между нуклеотидами и аминокислотами, определяемых в конечном счете взаимодействиями молекул в матричном синтезе белка. В-третьих, возникает вопрос о физическом смысле генетического кода, т. е. о степени неслучайности этого соответствия. Характерно, что проблема генетического кода была впервые сформулирована физиком Гамовым [3], и ряд физиков принял участие в ее решении. Однако код был расшифрован биологическими и химическими методами. [c.553] Первая попытка нахождения генетического кода, принадлежавшая Гамову [3,4], была предпринята сразу же после открытия двуспиральной структуры ДНК. Гипотеза Гамова оказалась несостоятельной. Тем не менее она заслуживает внимания, так как ею был поставлен ряд важных проблем. Работа Гамова сыграла большую роль и в привлечении внимания ф11-зиков к молекулярной биологии. [c.554] Белковый текст написан 20-буквенным алфавитом, текст ДНК (или РНК)—4-буквенным. Из элементарных соображений следует, что кодовое отношение, т. е. число нуклеотидов, кодирующих одну аминокислоту, не может быть меньше трех. Количество информации, приходящейся на одну аминокислоту, равно а = log2 20 = 4,322 бит, а на один нуклеотид н = = log2 4 = 2,000 бит. Следовательно, наименьшее число нуклеотидов, приходящееся на одну аминокислоту, равно аЛн = 2,161. [c.554] Аминокислота не может кодироваться нецелым числом нуклеотидов. Значит, кодовое отношение должно быть не меньше трех. В самом деле, число размещений с повторениями из четырех по два равно 16, что меньше 20 — числа аминокислот. Число размещений с повторениями из четырех по три равно 64. Трех нуклеотидов в кодоне, т. е. в совокупности нуклеотидов, кодирующих одну аминокислоту, более чем достаточно. [c.554] Гамов предполагал, что белковая цепь синтезируется непосредственно на двойной спирали ДНК, причем каждая аминокислота располагается в выемке между четырьмя нуклеотидами. Эта выемка имеет примерно ромбическую форму. Два нуклеотида принадлежат одной цепи, два — другой. Один из нуклеотидов первой цепи образует уотсон-криковскую пару с одним нуклеотидом второй цепи. [c.554] Гамов попытался проверить правильность своего кода, сопоставив возможность сочетания ромбов с известной первичной структурой инсулина и адренокортикотропина. При этом возникли неразрешимые противоречия. Дальнейшие исследования показали, что никакие перекрывающиеся коды нельзя согласовать с опытом. Наличие перекрытий в кодонах может выражаться в корреляциях между соседними аминокислотными остатками. Иными словами, некоторые парные сочетания остатков должны быть запрещены. Анализ первичных структур белкои показал, что таких корреляций нет —любой остаток может следовать за любым, хотя разные остатки встречаются с различными частотами [4, 5]. Можно, однако, представить себе перекрывающиеся нуклеотидные коды, допускающие любую последовательность аминокислот [6]. [c.555] Допустим, что кодон содержит четыре нуклеотида, но последний нуклеотид данного кодона одновременно является пер-ьым в следующем кодоне. Кодовое отношение равно трем. Если все кодирующие квартеты начинаются, скажем, с Г или У, то они должны заканчиваться также Г и У. Общее число таких кодонов равно 64 (2-16-2). Эти кодоны распределяются по 20 аминокислотам так, что каждая из них имеет по крайней мере один квартет, начинающийся с Г, и один, начинающийся с У. Так как каждый квартет должен заканчиваться также Г или У, возможны любые последовательности аминокислот. [c.555] Отсутствие корреляций в полипептидных цепях, таким образом, нельзя считать решающим аргументом против перекрывающихся кодов. Но отсутствие корреляций делает невозможной умозрительную расшифровку кода. [c.555] Более существенный аргумент состоит в том, что не удается наблюдать мутационные замещения двух соседних аминокислотных остатков в белке. Между тем мутация нуклеотида, общего для двух соседних аминокислот, должна приводить к такому двойному замещению. Уолл привел соображения, снижающиг силу этого аргумента [6]. Однако, поскольку не было найдено ни одного экспериментального доказательства перекрывания, есть веские основания считать генетический код неперекрываю-щимся. Полная расшифровка кода это подтвердила. [c.555] Изучение мутаций показало, что код коллинеарен, т. е. кодоны в нуклеиновой кислоте и соответствующие аминокислотные остатки в белке расположены в той же линейной последовательности. Ряд доказательств этого положения приведен в монографии Ичаса [5]. Там же описаны другие попытки умозрительного нахождения кода, представляющие сегодня исторический интерес (см. также [1, 7]). [c.555] Кодовое отношение может быть найдено лишь зксперимен-тально. Это было сделано в результате генетического исследования, проведенного Криком с сотрудниками [8], изучавшими цистрон В в области г II бактериофага Т 4, паразитирующего на Е. соИ. Ранее Бензер детально проанализировал генетические свойства системы фаг Т4 — Е. oli [9]. Среди точечных мутаций г II есть мутации, состоящие в выпадении нуклеотидов (деле-ции) и в их добавлении к цепи ДНК- Такие мутации могут быть вызваны акридиновыми красителями. [c.556] Из этих результатов следует кодовое отношение, кратное трем. Естественно предположить, что оно равно именно трем. Впрочем, Уолл показал, что данные Крика и сотрудников согласуются и с предложенным им квартетным перекрываюшимся кодом [5, 6]. Однако код Уолла непригоден по другим причинам. [c.557] Дикий ш-тип. ..Тре—Лиз—Сер—Про—Сер—Лей—Аси—Ала... [c.557] Эти биологические исследования привели к решению ряда физических вопросов. Установлено кодовое отношение, еще раз доказана коллинеарность кода, доказано, что код читается, начиная с определенного нуклеотида и не имеет запятых, т. е. материальных единиц, разделяющих кодоны. Из описанных работ следовало, что кодоном является линейная последовательность трех нуклеотидов. Общее число разных кодонов равно 64. [c.557] Но отсюда следует, что кодон для Сер есть также ВСА. Противоречие можно устранить, только допустив наличие различных кодонов для Гис. [c.558] Вырождение кода доказывается и тем, что при значительных вариациях в составе ДНК различных организмов доля Г Н-Ц варьирует от 25 до 75 /о (см. стр. 90), средний состав белков меняется мало. Вместе с тем ряд фактов указывает на универсальность кода. Предположение о том, что значительная часть нуклеотидов ДНК не функциональна, трудно согласовать с однородностью состава ДНК у данного биологического вида. Напротив, эти факты находят естественное объяснение, если коц сильно вырожден. [c.558] Вернуться к основной статье