Выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

C

CUU (Leu/L)Лейцин
CUC (Leu/L)Лейцин
CUA (Leu/L)Лейцин
CUG (Leu/L)Лейцин

В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин , вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК . Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й аминокислот, входящих в состав белков.

Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодон состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот.

Отклонения от стандартного генетического кода .
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Митохондирии млекопитающих, дрозофилы , S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

История представлений о генетическом коде

Тем не менее в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.

См. также

Примечания

  1. Genetic code supports targeted insertion of two amino acids by one codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Science. 2009 Jan 9;323(5911):259-61.
  2. Кодон AUG кодирует метионин, но одновременно служит стартовым кодоном - с первого AUG-кодона мРНК как правило начинается трансляция.
  3. NCBI: «The Genetic Codes», Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell
  4. Jukes TH, Osawa S, The genetic code in mitochondria and chloroplasts. , Experientia. 1990 Dec 1;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (March 1992). «Recent evidence for evolution of the genetic code ». Microbiol. Rev. 56 (1): 229–64. PMID 1579111 .
  6. SANGER F. (1952). «The arrangement of amino acids in proteins.». Adv Protein Chem. 7 : 1-67. PMID 14933251 .
  7. М. Ичас Биологический код. - Мир, 1971.
  8. WATSON JD, CRICK FH. (April 1953). «Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.». Nature 171 : 737-738. PMID 13054692 .
  9. WATSON JD, CRICK FH. (May 1953). «Genetical implications of the structure of deoxyribonucleic acid.». Nature 171 : 964-967. PMID 13063483 .
  10. Crick FH. (April 1966). «The genetic code - yesterday, today, and tomorrow.». Cold Spring Harb Symp Quant Biol. : 1-9. PMID 5237190 .
  11. G. GAMOW (February 1954). «Possible Relation between Deoxyribonucleic Acid and Protein Structures.». Nature 173 : 318. DOI :10.1038/173318a0 . PMID 13882203 .
  12. GAMOW G, RICH A, YCAS M. (1956). «The problem of information transfer from the nucleic acids to proteins.». Adv Biol Med Phys. 4 : 23-68. PMID 13354508 .
  13. Gamow G, Ycas M. (1955). «STATISTICAL CORRELATION OF PROTEIN AND RIBONUCLEIC ACID COMPOSITION. ». Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789 .
  14. Crick FH, Griffith JS, Orgel LE. (1957). «CODES WITHOUT COMMAS. ». Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032 .
  15. Hayes B. (1998). «The Invention of the Genetic Code.» (PDF reprint). American Scientist 86 : 8-14.

Литература

  • Азимов А. Генетический код. От теории эволюции до расшифровки ДНК. - М.: Центрполиграф, 2006. - 208 с - ISBN 5-9524-2230-6 .
  • Ратнер В. А.Генетический код как система - Соросовский образовательный журнал, 2000, 6, № 3, с.17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. General nature of the genetic code for proteins - Nature, 1961 (192), pp. 1227-32

Ссылки

  • Генетический код - статья из Большой советской энциклопедии

Wikimedia Foundation . 2010 .

Лекция 5. Генетический код

Определение понятия

Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в ДНК.

Поскольку ДНК непосредственного участия в синтезе белка не принимает, то код записывается на языке РНК. В РНК вместо тимина входит урацил.

Свойства генетического кода

1. Триплетность

Каждая аминокислота кодируется последовательностью из 3-х нуклеотидов.

Определение: триплет или кодон - последовательность из трех нуклеотидов, кодирующая одну аминокислоту.

Код не может быть моноплетным, поскольку 4 (число разных нуклеотидов в ДНК) меньше 20. Код не может быть дуплетным, т.к. 16 (число сочетаний и перестановок из 4-х нуклеотидов по 2) меньше 20. Код может быть триплетным, т.к. 64 (число сочетаний и перестановок из 4-х по 3) больше 20.

2. Вырожденность.

Все аминокислоты, за исключением метионина и триптофана, кодируются более чем одним триплетом:

2 АК по 1 триплету = 2.

9 АК по 2 триплета = 18.

1 АК 3 триплета = 3.

5 АК по 4 триплета = 20.

3 АК по 6 триплетов = 18.

Всего 61 триплет кодирует 20 аминокислот.

3. Наличие межгенных знаков препинания.

Определение:

Ген - это участок ДНК, кодирующий одну полипептидную цепь или одну молекулу tPHK , r РНК или sPHK .

Гены tPHK , rPHK , sPHK белки не кодируют.

В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х триплетов, кодирующих терминирующие кодоны РНК, или стоп-сигналы. В мРНК они имеют следующий вид: UAA , UAG , UGA . Они терминируют (оканчивают) трансляцию.

Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. (См. лекцию 8) Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

4. Однозначность.

Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляции.

Исключение составляет кодон AUG . У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.

5. Компактность, или отсутствие внутригенных знаков препинания.
Внутри гена каждый нуклеотид входит в состав значащего кодона.

В 1961 г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его компактность.

Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида. Одиночная "+" или "-" мутация в начале гена портит весь ген. Двойная "+" или "-" мутация тоже портит весь ген.

Тройная "+" или "-" мутация в начале гена портит лишь его часть. Четверная "+" или "-" мутация опять портит весь ген.

Эксперимент доказывает, что код тршплетен и внутри гена нет знаков препинания. Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, кроме того, наличие знаков препинания между генами.

6. Универсальность.

Генетический код един для всех живущих на Земле существ.

В 1979 г. Беррел открыл идеальный код митохондрий человека.

Определение:

«Идеальным» называется генетический код, в котором выполняется правило вырожденности квазидублетного кода: Если в двух триплетах совпадают первые два нуклеотида, а третьи нуклеотиды относятся к одному классу (оба - пурины или оба - пиримидины), то эти триплеты кодируют одну и ту же аминокислоту.

Из этого правила в универсальном коде есть два исключения. Оба отклонения от идеального кода в универсальном касаются принципиальных моментов: начала и конца синтеза белка:

Кодон

Универсальный

код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

STOP

STOP

С UA

А G А

STOP

STOP

230 замен не меняют класс кодируемой аминокислоты. к рываемость.

В 1956 г. Георгий Гамов предложил вариант перекрываемого кода. Согласно Гамовскому коду, каждый нуклеотид, начиная с третьего в гене, входит в состав 3-х кодонов. Когда генетический код был расшифрован, оказалось, что он неперекрываем, т.е. каждый нуклеотид входит в состав лишь одного кодона.

Достоинства перекрываемого генетического кода: компактность, меньшая зависимость структуры белка от вставки или делеции нуклеотида.

Недостаток: большая зависимость структуры белка от замены нуклеотида и ограничение на соседей.

В 1976 г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D . Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D . Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

Информационная емкость ДНК

На Земле живет 6 миллиардов человек. Наследственная информация о них
заключена в 6x10 9 сперматозоидах. По разным оценкам у человека от 30 до 50
тысяч генов. У всех людей ~ 30x10 13 генов или 30x10 16 пар нуклеотидов, которые составляют 10 17 кодонов. Средняя книжная страница содержит 25x10 2 знаков. ДНК 6x10 9 сперматозоидов содержит информацию, равную по объему примерно

4x10 13 книжных страниц. Эти страницы заняли бы объем 6-и зданий НГУ. 6x10 9 сперматозоидов занимают половину наперстка. Их ДНК занимает менее четверти наперстка.

Используются те же нуклеотиды, за исключением нуклеотида, содержащего тимин , который заменён похожим нуклеотидом, содержащим урацил , который обозначается буквой ( в русскоязычной литературе). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

Тем не менее, в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.

Свойства

Таблицы соответствия кодонов мРНК и аминокислот

Генетический код, общий для большинства про- и эукариот. В таблице приведены все 64 кодона и указаны соответствующие аминокислоты. Порядок оснований - от 5" к 3" концу мРНК.

Стандартный генетический код
1-е
основание
2-е основание 3-е
основание
U C A G
U UUU (Phe/F) Фенилаланин UCU (Ser/S) Серин UAU (Tyr/Y) Тирозин UGU (Cys/C) Цистеин U
UUC UCC UAC UGC C
UUA (Leu/L) Лейцин UCA UAA Стоп (Охра ) UGA Стоп (Опал ) A
UUG UCG UAG Стоп (Янтарь ) UGG (Trp/W) Триптофан G
C CUU CCU (Pro/P) Пролин CAU (His/H) Гистидин CGU (Arg/R) Аргинин U
CUC CCC CAC CGC C
CUA CCA CAA (Gln/Q) Глутамин CGA A
CUG CCG CAG CGG G
A AUU (Ile/I) Изолейцин ACU (Thr/T) Треонин AAU (Asn/N) Аспарагин AGU (Ser/S) Серин U
AUC ACC AAC AGC C
AUA ACA AAA (Lys/K) Лизин AGA (Arg/R) Аргинин A
AUG (Met/M) Метионин ACG AAG AGG G
G GUU (Val/V) Валин GCU (Ala/A) Аланин GAU (Asp/D) Аспарагиновая кислота GGU (Gly/G) Глицин U
GUC GCC GAC GGC C
GUA GCA GAA (Glu/E) Глутаминовая кислота GGA A
GUG GCG GAG GGG G
Кодон AUG кодирует метионин и одновременно является сайтом инициации трансляции: первый кодон AUG в кодирующей области мРНК служит началом синтеза белка . Обратная таблица (указаны кодоны для каждой аминокислоты, а также стоп-кодоны)
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AUG
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
His/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
START AUG STOP UAG, UGA, UAA

Вариации стандартного генетического кода

Первый пример отклонения от стандартного генетического кода был открыт в 1979 году при исследовании генов митохондрий человека. С того времени было найдено несколько подобных вариантов , включая многообразные альтернативные митохондриальные коды, например, прочитывание стоп-кодона УГА в качестве кодона, определяющего триптофан у микоплазм . У бактерий и архей ГУГ и УУГ часто используются как стартовые кодоны. В некоторых случаях гены начинают кодировать белок со старт-кодона , который отличается от обычно используемого данным видом .

В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин , вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК. Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й из аминокислот, входящих в состав белков.

Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодоны состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот.

Отклонения от стандартного генетического кода .
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Ядерный геном инфузории Euplotes UGA Стоп Цистеин или селеноцистеин
Митохондрии млекопитающих, дрозофилы , S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

Эволюция

Считается, что триплетный код сложился достаточно рано в ходе эволюции жизни. Но существование различий в некоторых организмах, появившихся на разных эволюционных стадиях, указывает на то, что он был не всегда таким.

Согласно некоторым моделям, сначала код существовал в примитивном виде, когда малое число кодонов обозначало сравнительно небольшое число аминокислот. Более точное значение кодонов и большее число аминокислот могли быть введены позже. Сначала только первые два из трёх оснований могли быть использованы для узнавания [что зависит от структуры тРНК].

- Льюин Б. Гены. М. : 1987. C. 62.

См. также

Примечания

  1. Sanger F. (1952). “The arrangement of amino acids in proteins”. Adv. Protein Chem . 7 : 1-67. PMID .
  2. Ичас М. Биологический код. - М. : Мир, 1971.
  3. Watson J. D. , Crick F. H. (April 1953). “Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid”. Nature . 171 : 737-738. PMID . справка)
  4. Watson J. D., Crick F. H. (May 1953). “Genetical implications of the structure of deoxyribonucleic acid”. Nature . 171 : 964-967. PMID . Используется устаревший параметр |month= (справка)
  5. Crick F. H. (April 1966). “The genetic code - yesterday, today, and tomorrow”. Cold Spring Harb. Symp. Quant. Biol. : 1-9. PMID . Используется устаревший параметр |month= (справка)
  6. Gamow G. (February 1954). “Possible relation between deoxyribonucleic acid and protein structures”. Nature . 173 : 318. DOI :10.1038/173318a0 . PMID . Используется устаревший параметр |month= (справка)
  7. Gamow G., Rich A., Ycas M. (1956). “The problem of information transfer from the nucleic acids to proteins”. Adv. Bio.l Med. Phys . 4 : 23-68. PMID .
  8. Gamow G, Ycas M. (1955). “Statistical correlation of protein and ribonucleic acid composition” . Proc. Natl. Acad. Sci. U. S. A . 41 : 1011-1019. PMID .
  9. Crick F. H., Griffith J. S., Orgel L. E. (1957).

Раздел ЕГЭ: 2.6. Генетическая информация в клетке. Гены, генетический код и его свойства. Матричный характер реакций биосинтеза. Биосинтез белка и нуклеиновых кислот

На Земле живет уже более 6 млрд людей. Если не считать 25-30 млн пар однояйцевых близнецов, то генетически все люди разные. Это означает, что каждый из них уникален, обладает неповторимыми наследственными особенностями, свойствами характера, способностями, темпераментом и многими другими качествами. Чем же определяются такие различия между людьми? Конечно различиями в их генотипах , т.е. наборах генов данного организма. У каждого человека он уникален, так же как уникален генотип отдельного животного или растения. Но генетические признаки данного человека воплощаются в белках, синтезированных в его организме. Следовательно, и строение белка одного человека отличается, хотя и совсем немного, от белка другого человека. Вот почему возникает проблема пересадки органов, вот почему возникают аллергические реакции на продукты, укусы насекомых, пыльцу растений и т.д. Сказанное не означает, что у людей не встречается совершенно одинаковых белков. Белки, выполняющие одни и те же функции, могут быть одинаковыми или совсем незначительно отличаться одной-двумя аминокислотами друг от друга. Но не существует на Земле людей (за исключением однояйцевых близнецов), у которых все белки были бы одинаковы.

Информация о первичной структуре белка закодирована в виде последовательности нуклеотидов в участке молекулы ДНК — гене. Ген — это единица наследственной информации организма. Каждая молекула ДНК содержит множество генов. Совокупность всех генов организма составляет его генотип .

Кодирование наследственной информации происходит с помощью генетического кода . Код подобен всем известной азбуке Морзе, которая точками и тире кодирует информацию. Азбука Морзе универсальна для всех радистов, и различия состоят только в переводе сигналов на разные языки. Генетический код также универсален для всех организмов и отличается лишь чередованием нуклеотидов, образующих гены и кодирующих белки конкретных организмов.

Свойства генетического кода : триплетность, специфичность, универсальность, избыточность и неперекрываемость.

Итак, что же собой представляет генетический код? Изначально он состоит из троек (триплетов ) нуклеотидов ДНК, комбинирующихся в разной последовательности. Например, ААТ, ГЦА, АЦГ, ТГЦ и т.д. Каждый триплет нуклеотидов кодирует определенную аминокислоту, которая будет встроена в полипептидную цепь. Так, например, триплет ЦГТ кодирует аминокислоту аланин, а триплет ААГ — аминокислоту фенилаланин. Аминокислот 20, а возможностей для комбинаций четырех нуклеотидов в группы по три — 64. Следовательно, четырех нуклеотидов вполне достаточно, чтобы кодировать 20 аминокислот. Вот почему одна аминокислота может кодироваться несколькими триплетами. Часть триплетов вовсе не кодирует аминокислоты, а запускает или останавливает биосинтез белка.

Собственно генетическим кодом считается последовательность нуклеотидов в молекуле иРНК , ибо она снимает информацию с ДНК (процесс транскрипции ) и переводит ее в последовательность аминокислот в молекулах синтезируемых белков (процесс трансляции ). В состав иРНК входят нуклеотиды АЦГУ. Триплеты нуклеотидов иРНК называются кодонами. Уже приведенные примеры триплетов ДНК на иРНК будут выглядеть следующим образом — триплет ЦГТ на иРНК станет триплетом ГЦА, а триплет ДНК — ААГ — станет триплетом УУЦ. Именно кодонами иРНК отражается генетический код в записи. Итак, генетический код триплетен, универсален для всех организмов на земле, вырожден (каждая аминокислота шифруется более чем одним кодоном). Между генами имеются знаки препинания — это триплеты, которые называются стоп-кодонами . Они сигнализируют об окончании синтеза одной полипептидной цепи. Существуют таблицы генетического кода, которыми нужно уметь пользоваться, для расшифровки кодонов иРНК и построения цепочек белковых молекул (в скобках — комплементарные ДНК).

ГЕНЕТИЧЕСКИЙ КОД (греч, genetikos относящийся к происхождению; син.: код, биологический код, аминокислотный код, белковый код, код нуклеиновых к-т ) - система записи наследственной информации в молекулах нуклеиновых кислот животных, растений, бактерий и вирусов чередованием последовательности нуклеотидов.

Генетическая информация (рис.) из клетки в клетку, из поколения в поколение, за исключением РНК-содержащих вирусов, передается путем редупликации молекул ДНК (см. Репликация). Реализация наследственной информации ДНК в процессе жизнедеятельности клетки осуществляется через 3 типа РНК: информационную (иРНК или мРНК), рибосомную (рРНК) и транспортную (тРНК), которые с помощью фермента РНК-полимеразы синтезируются на ДНК как на матрице. При этом последовательность нуклеотидов в молекуле ДНК однозначно определяет последовательность нуклеотидов во всех трех типах РНК (см. Транскрипция). Информацию гена (см.), кодирующего белковую молекулу, несет только иРНК. Конечным продуктом реализации наследственной информации является синтез белковых молекул, специфичность которых определяется последовательностью входящих в них аминокислот (см. Трансляция).

Поскольку в составе ДНК или РНК представлено только по 4 разных азотистых основания [в ДНК - аденин (А), тимин (Т), гуанин (Г), цитозин (Ц); в РНК - аденин (А), урацил (У), цитозин (Ц), гуанин (Г)], последовательность которых определяет последовательность 20 аминокислот в составе белка, возникает проблема Г. к., т. е. проблема перевода 4-буквенного алфавита нуклеиновых к-т в 20-буквенный алфавит полипептидов.

Впервые идея матричного синтеза белковых молекул с правильным предсказанием свойств гипотетической матрицы была сформулирована Н. К. Кольцовым в 1928 г. В 1944 г. Эйвери (О. Avery) с соавт, установил, что за передачу наследственных признаков при трансформации у пневмококков ответственны молекулы ДНК. В 1948 г. Чаргафф (E. Chargaff) показал, что во всех молекулах ДНК имеет место количественное равенство соответствующих нуклеотидов (А-T, Г-Ц). В 1953 г. Ф. Крик, Дж. Уотсон и Уилкинс (М. H. F. Wilkins), исходя из этого правила и данных рентгеноструктурного анализа (см.), пришли к выводу, что молекул а ДНК представляет собой двойную спираль, состоящую из двух полинуклеотидных нитей, соединенных между собой водородными связями. Причем против А одной цепи во второй может находиться только Т, против Г - только Ц. Эта комплементарность приводит к тому, что последовательность нуклеотидов одной цепи однозначно определяет последовательность другой. Второй существенный вывод, вытекающий из этой модели,- молекула ДНК способна к самовоспроизведению.

В 1954 г. Гамов (G. Gamow) сформулировал проблему Г. к. в ее современном виде. В 1957 г. Ф. Крик высказал Гипотезу адаптера, предположив, что аминокислоты взаимодействуют с нуклеиновой к-той не непосредственно, а через посредников (теперь известных под названием тРНК). В ближайшие после этого годы все принципиальные звенья общей схемы передачи генетической информации, вначале гипотетичные, были подтверждены экспериментально. В 1957 г. были открыты иРНК [А. С. Спирин, А. Н. Белозерский с соавт.; Фолькин и Астрахан (E. Volkin, L. Astrachan)] и тРНК [Хоугленд (М. В. Hoagland)]; в 1960 г. синтезирована ДНК вне клетки с использованием в качестве матрицы существующих макромолекул ДНК (А. Корнберг) и открыт ДНК-зависимый синтез РНК [Вейсс (S. В. Weiss) с соавт.]. В 1961 г. была создана бесклеточная система, в к-рой в присутствии естественной РНК или синтетических полирибонуклеотидов осуществлялся синтез белковоподобных веществ [М. Ниренберг и Маттеи (J. H. Matthaei)]. Проблема познания Г. к. состояла из исследования общих свойств кода и собственно его расшифровки, т. е. выяснения, какие комбинации нуклеотидов (кодоны) кодируют определенные аминокислоты.

Общие свойства кода были выяснены независимо от его расшифровки и в основном до нее путем анализа молекулярных закономерностей образования мутаций (Ф. Крик и соавт., 1961; Н. В. Лучник, 1963). Они сводятся к следующему:

1. Код универсален, т. е. идентичен, по крайней мере в основном, для всех живых существ.

2. Код триплетен, т. е. каждая аминокислота кодируется тройкой нуклеотидов.

3. Код неперекрывающийся, т. е. данный нуклеотид не может входить в состав более чем одного кодона.

4. Код вырожден, т. е. одна аминокислота может кодироваться несколькими триплетами.

5. Информация о первичной структуре белка считывается с иРНК последовательно, начиная с фиксированной точки.

6. Большинство возможных триплетов имеет «смысл», т. е. кодирует аминокислоты.

7. Из трех «букв» кодона преимущественное значение имеют лишь две (облигатные), третья же (факультативная) несет значительно меньшую информацию.

Прямая расшифровка кода состояла бы в сравнении последовательности нуклеотидов в структурном гене (или синтезированной на нем иРНК) с последовательностью аминокислот в соответствующем белке. Однако такой путь пока технически невозможен. Были применены два других пути: синтез белка в бесклеточной системе с использованием в качестве матрицы искусственных полирибонуклеотидов известного состава и анализ молекулярных закономерностей образования мутаций (см.). Первый принес положительные результаты раньше и исторически сыграл в расшифровке Г. к. большую роль.

В 1961 г. М. Ниренберг и Маттеи применили в качестве матрицы гомо-полимер - синтетическую полиуридиловую к-ту (т. е. искусственную РНК состава УУУУ...) и получили полифенилаланин. Из этого следовало, что кодон фенилаланина состоит из нескольких У, т. е. в случае триплетного кода расшифровывается как УУУ. Позже наряду с гомополимерами были использованы полирибонуклеотиды, состоявшие из разных нуклеотидов. При этом был известен только состав полимеров, расположение же нуклеотидов в них было статистическим, поэтому и анализ результатов был статистическим и давал косвенные выводы. Довольно быстро удалось найти хотя бы по одному триплету для всех 20 аминокислот. Выяснилось, что присутствие органических растворителей, изменение pH или температуры, некоторые катионы и особенно антибиотики делают код неоднозначным: те же кодоны начинают стимулировать включение других аминокислот, в некоторых случаях один кодон начинал кодировать до четырех разных аминокислот. Стрептомицин влиял на считывание информации как в бесклеточных системах, так и in vivo, причем был эффективен только на стрептомицинчувствительных штаммах бактерий. У стрептомицинзависимых штаммов он «исправлял» считывание с кодонов, изменившихся в результате мутации. Подобные результаты давали основание сомневаться в правильности расшифровки Г. к. с помощью бесклеточной системы; требовалось подтверждение, и в первую очередь данными in vivo.

Основные данные о Г. к. in vivo получены при анализе аминокислотного состава белков у организмов, обработанных мутагенами (см.) с известным механизмом действия, напр, азотистой к-той, к-рая вызывает в молекуле ДНК замену Ц на У и А на Г. Полезную информацию дают также анализ мутаций, вызванных неспецифическими мутагенами, сравнение различий в первичной структуре родственных белков у разных видов, корреляция между составом ДНК и белков и т. п.

Расшифровка Г. к. на основании данных in vivo и in vitro дала совпадающие результаты. Позже были разработаны три других метода расшифровки кода в бесклеточных системах: связывание аминоацил-тРНК (т. е. тРНК с присоединенной активированной аминокислотой) тринуклеотидами известного состава (М. Ниренберг и соавт., 1965), связывание аминоацил-тРНК полинуклеотидами, начинающимися с определенного триплета (Маттеи с соавт., 1966), и использование в качестве иРНК полимеров, в которых известен не только состав, но и порядок нуклеотидов (X. Корана и соавт., 1965). Все три метода дополняют друг друга, а результаты находятся в соответствии с данными, полученными в опытах in vivo.

В 70-х гг. 20 в. появились методы особенно надежной проверки результатов расшифровки Г. к. Известно, что мутации, возникающие под действием профлавина, состоят в выпадении или вставке отдельных нуклеотидов, что приводит к сдвигу рамки считывания. У фага Т4 был вызван профлавином ряд мутаций, при которых изменился состав лизоцима. Этот состав был проанализирован и сопоставлен с теми кодонами, которые должны были получиться при сдвиге рамки считывания. Получилось полное соответствие. Дополнительно этот метод позволил установить, какие именно триплеты вырожденного кода кодируют каждую из аминокислот. В 1970 г. Адамсу (J. М. Adams) с сотрудниками удалось провести частичную расшифровку Г. к. прямым методом: у фага R17 определили последовательность оснований во фрагменте длиной в 57 нуклеотидов и сравнили с аминокислотной последовательностью белка его оболочки. Результаты полностью совпали с полученными менее прямыми методами. Т. о., код расшифрован полностью и верно.

Результаты расшифровки сведены в таблицу. В ней указан состав кодонов и РНК. Состав антикодонов тРНК комплементарен кодонам иРНК, т. е. вместо У в них находится А, вместо А - У, вместо Ц - Г и вместо Г - Ц, и соответствует кодонам структурного гена (той нити ДНК, с к-рой считывается информация) с той лишь разницей, что место тимина занимает урацил. Из 64 триплетов, которые могут быть образованы сочетанием 4 нуклеотидов, 61 имеет «смысл», т. е. кодирует аминокислоты, а 3 являются «нонсенсами» (лишенными смысла). Между составом триплетов и их смыслом имеется довольно четкая зависимость, к-рая была обнаружена еще при анализе общих свойств кода. В ряде случаев триплеты, кодирующие определенную аминокислоту (напр., пролин, аланин), характеризуются тем, что два первых нуклеотида (облигатные) у них одинаковы, а третий (факультативный) может быть любым. В других случаях (при кодировании, напр., аспарагина, глутамина) один и тот же смысл имеют два сходных триплета, у которых совпадают два первых нуклеотида, а на месте третьего стоит любой пурин или любой пиримидин.

Нонсенс-кодоны, 2 из которых имеют специальные названия, соответствующие обозначению фаговых мутантов (УАА-охра, УАГ-амбер, УГА-опал), хотя и не кодируют каких-либо аминокислот, но имеют большое значение при считывании информации, кодируя конец полипептидной цепи.

Считывание информации происходит в направлении от 5 1 -> 3 1 - к концу нуклеотидной цепи (см. Дезоксирибонуклеиновые кислоты). При этом синтез белка идет от аминокислоты со свободной аминогруппой к аминокислоте со свободной карбоксильной группой. Начало синтеза кодируется триплетами АУГ и ГУГ, которые в этом случае включают специфичную стартовую аминоацил-тРНК, а именно N-формилметио-нил-тРНК. Эти же триплеты при локализации внутри цепи кодируют соответственно метионин и валин. Неоднозначность снимается тем, что началу считывания предшествует нонсенс. Есть данные, говорящие в пользу того, что граница между участками иРНК, кодирующими разные белки, состоит более чем из двух триплетов и что в этих местах меняется вторичная структура РНК; этот вопрос находится в стадии исследования. Если нонсенс-кодон возникает внутри структурного гена, то соответствующий белок строится только до места расположения этого кодона.

Открытие и расшифровка генетического кода - выдающееся достижение молекулярной биологии - оказало влияние на все биол, науки, положив в ряде случаев начало развитию специальных крупных разделов (см. Молекулярная генетика). Эффект открытия Г. к. и связанных с ним исследований сравнивают с тем эффектом, который оказала на биол, науки теория Дарвина.

Универсальность Г. к. является прямым доказательством универсальности основных молекулярных механизмов жизни у всех представителей органического мира. Между тем большие различия в функциях генетического аппарата и его строении при переходе от прокариотов к эукариотам и от одноклеточных к многоклеточным, вероятно, связаны и с молекулярными различиями, исследование которых - одна из задач будущего. Поскольку исследования Г. к.- дело лишь последних лет, значение полученных результатов для практической медицины носит лишь Косвенный характер, позволяя пока понять природу заболеваний, механизм действия возбудителей болезней и лекарственных веществ. Однако открытие таких явлений, как трансформация (см.), трансдукция (см.), супрессия (см.), указывает на принципиальную возможность исправления патологически измененной наследственной информации или ее коррекции - так наз. генная инженерия (см.).

Таблица. ГЕНЕТИЧЕСКИЙ КОД

Первый нуклеотид кодона

Второй нуклеотид кодона

Третий, нуклеотид кодона

Фенилаланин

J Нонсенс

Триптофан

Гистидин

Глутаминовая кислота

Изолейцин

Аспарагиновая

Метионин

Аспарагин

Глутамин

* Кодирует конец цепи.

** Кодирует также начало цепи.

Библиография: Ичас М. Биологический код, пер. с англ., М., 1971; Лучник Н.Б. Биофизика цитогенетических поражений и генетический код, Л., 1968; Молекулярная генетика, пер. с англ., под ред. А. Н. Белозерского, ч. 1, М., 1964; Нуклеиновые кислоты, пер. с англ., под ред. А. Н. Белозерского, М., 1965; Уотсон Дж. Д. Молекулярная биология гена, пер. с англ., М., 1967; Физиологическая генетика, под ред. М. Е. Лобашева С. Г., Инге-Вечтомо-ва, Л., 1976, библиогр.; Desoxyribonuc-leins&ure, Schlttssel des Lebens, hrsg. v„ E. Geissler, B., 1972; The genetic code, Gold Spr. Harb. Symp. quant. Biol., v. 31, 1966; W o e s e C. R. The genetic code, N. Y. a. o., 1967.


Close