Aminoácidos codificados. Cómo el código genético afecta el carácter y el destino

Después de haber trabajado en estos temas, debería poder:

  1. Describe los conceptos siguientes y explica las relaciones entre ellos:
    • polímero, monómero;
    • carbohidratos, monosacáridos, disacáridos, polisacáridos;
    • lípidos, ácidos grasos, glicerol;
    • aminoácido, enlace peptídico, proteína;
    • catalizador, enzima, sitio activo;
    • ácido nucleico, nucleótido.
  2. Enumere 5 o 6 razones que hacen que el agua sea un componente tan importante de los sistemas vivos.
  3. Nombra las cuatro clases principales de compuestos orgánicos que se encuentran en los organismos vivos; Describe el papel de cada uno de ellos.
  4. Explique por qué las reacciones controladas por enzimas dependen de la temperatura, el pH y la presencia de coenzimas.
  5. Explicar el papel del ATP en la economía energética de la célula.
  6. Nombra los materiales de partida, los pasos principales y los productos finales de las reacciones inducidas por la luz y de las reacciones de fijación de carbono.
  7. Dé una breve descripción del esquema general de la respiración celular, a partir del cual quedaría claro qué lugar ocupan las reacciones de glucólisis, el ciclo de H. Krebs (ciclo del ácido cítrico) y la cadena de transporte de electrones.
  8. Compara la respiración y la fermentación.
  9. Describe la estructura de la molécula de ADN y explica por qué el número de residuos de adenina es igual al número de residuos de timina y el número de residuos de guanina es igual al número de residuos de citosina.
  10. Haga un breve diagrama de la síntesis de ARN a partir de ADN (transcripción) en procariotas.
  11. Describe las propiedades del código genético y explica por qué debería ser un código triplete.
  12. Con base en la cadena de ADN y la tabla de codones dadas, determine la secuencia complementaria del ARN mensajero, indique los codones del ARN de transferencia y la secuencia de aminoácidos que se forma como resultado de la traducción.
  13. Enumere las etapas de la síntesis de proteínas a nivel de ribosomas.

Algoritmo para la resolución de problemas.

Tipo 1. Autocopia del ADN.

Una de las cadenas de ADN tiene la siguiente secuencia de nucleótidos:
AGTACCGATACCGATTTACCG...
¿Qué secuencia de nucleótidos tiene la segunda cadena de la misma molécula?

Para escribir la secuencia de nucleótidos de la segunda hebra de una molécula de ADN, cuando se conoce la secuencia de la primera hebra, basta con sustituir timina por adenina, adenina por timina, guanina por citosina y citosina por guanina. Habiendo realizado este reemplazo, obtenemos la secuencia:
TATTGGGCTATGAGCTAAAATG...

Tipo 2. Codificación de proteínas.

La cadena de aminoácidos de la proteína ribonucleasa tiene el siguiente comienzo: lisina-glutamina-treonina-alanina-alanina-alanina-lisina...
¿Con qué secuencia de nucleótidos comienza el gen correspondiente a esta proteína?

Para hacer esto, use la tabla de códigos genéticos. Para cada aminoácido, encontramos su designación de código en forma del triple de nucleótidos correspondiente y lo escribimos. Disponiendo estos tripletes uno tras otro en el mismo orden que sus correspondientes aminoácidos, obtenemos la fórmula de la estructura de una sección de ARN mensajero. Como regla general, hay varios de estos trillizos, la elección se realiza de acuerdo con su decisión (pero solo se elige uno de los trillizos). En consecuencia, puede haber varias soluciones.
АААААААААЦУГЦГГЦУГЦГАAG

Con qué secuencia de aminoácidos comienza una proteína si está codificada por la siguiente secuencia de nucleótidos:
ACGGCCATGGCCGGT...

Utilizando el principio de complementariedad, encontramos la estructura de una sección de ARN mensajero formada en un segmento determinado de una molécula de ADN:
UGGGGGUACGGGGA...

Luego pasamos a la tabla del código genético y para cada triple de nucleótidos, comenzando por el primero, buscamos y escribimos el aminoácido correspondiente:
Cisteína-glicina-tirosina-arginina-prolina-...

Ivanova T.V., Kalinova G.S., Myagkova A.N. "Biología General". Moscú, "Ilustración", 2000

  • Tema 4. "Composición química de la célula". §2-§7 págs. 7-21
  • Tema 5. "Fotosíntesis". §16-17 págs. 44-48
  • Tema 6. "Respiración celular". §12-13 págs. 34-38
  • Tema 7. "Información genética". §14-15 págs. 39-44

Cada organismo vivo tiene un conjunto especial de proteínas. Ciertos compuestos de nucleótidos y su secuencia en la molécula de ADN forman el código genético. Transmite información sobre la estructura de la proteína. En genética se ha aceptado cierto concepto. Según él, un gen correspondía a una enzima (polipéptido). Hay que decir que la investigación sobre ácidos nucleicos y proteínas se ha llevado a cabo durante un período bastante largo. Más adelante en el artículo veremos más de cerca el código genético y sus propiedades. También se proporcionará una breve cronología de la investigación.

Terminología

El código genético es una forma de codificar la secuencia de proteínas de aminoácidos utilizando la secuencia de nucleótidos. Este método de generar información es característico de todos los organismos vivos. Las proteínas son sustancias orgánicas naturales de alta molecularidad. Estos compuestos también están presentes en los organismos vivos. Se componen de 20 tipos de aminoácidos, que se denominan canónicos. Los aminoácidos están dispuestos en cadena y conectados en una secuencia estrictamente establecida. Determina la estructura de la proteína y sus propiedades biológicas. También hay varias cadenas de aminoácidos en una proteína.

ADN y ARN

El ácido desoxirribonucleico es una macromolécula. Es responsable de la transmisión, almacenamiento e implementación de la información hereditaria. El ADN utiliza cuatro bases nitrogenadas. Estos incluyen adenina, guanina, citosina, timina. El ARN consta de los mismos nucleótidos, excepto que contiene timina. En cambio, hay un nucleótido que contiene uracilo (U). Las moléculas de ARN y ADN son cadenas de nucleótidos. Gracias a esta estructura, se forman secuencias: el "alfabeto genético".

Implementación de información.

La síntesis de la proteína codificada por el gen se realiza combinando ARNm en una plantilla de ADN (transcripción). También hay una transferencia del código genético a la secuencia de aminoácidos. Es decir, se produce la síntesis de una cadena polipeptídica en ARNm. Para cifrar todos los aminoácidos y la señal del final de la secuencia de proteínas, son suficientes 3 nucleótidos. Esta cadena se llama triplete.

Historia del estudio

El estudio de proteínas y ácidos nucleicos se realiza desde hace mucho tiempo. A mediados del siglo XX finalmente aparecieron las primeras ideas sobre la naturaleza del código genético. En 1953 se descubrió que algunas proteínas están formadas por secuencias de aminoácidos. Es cierto que en ese momento aún no podían determinar su número exacto y surgieron numerosas disputas al respecto. En 1953, los autores Watson y Crick publicaron dos trabajos. El primero hablaba de la estructura secundaria del ADN, el segundo hablaba de su copia permitida mediante síntesis de plantillas. Además, se hizo hincapié en el hecho de que una secuencia específica de bases es un código que transporta información hereditaria. El físico estadounidense y soviético Georgiy Gamow asumió la hipótesis de la codificación y encontró un método para comprobarla. En 1954 se publicó su trabajo, en el que proponía establecer correspondencias entre las cadenas laterales de los aminoácidos y los “agujeros” en forma de diamante y utilizarlos como mecanismo de codificación. Luego se llamó rómbico. Al explicar su trabajo, Gamow admitió que el código genético podría ser un triplete. El trabajo del físico fue uno de los primeros entre los que se consideraron cercanos a la verdad.

Clasificación

A lo largo de los años se han propuesto diversos modelos de códigos genéticos, de dos tipos: superpuestos y no superpuestos. El primero se basó en la inclusión de un nucleótido en varios codones. Incluye un código genético triangular, secuencial y mayor-menor. El segundo modelo supone dos tipos. Los códigos que no se superponen incluyen el código combinado y el código sin comas. La primera opción se basa en la codificación de un aminoácido mediante tripletes de nucleótidos, y lo principal es su composición. Según el "código sin comas", ciertos tripletes corresponden a aminoácidos, pero otros no. En este caso, se creía que si algunos tripletes significativos se ordenaban secuencialmente, otros ubicados en un marco de lectura diferente serían innecesarios. Los científicos creían que era posible seleccionar una secuencia de nucleótidos que satisficiera estos requisitos y que había exactamente 20 tripletes.

Aunque Gamow y sus coautores cuestionaron este modelo, lo consideraron el más correcto durante los siguientes cinco años. A principios de la segunda mitad del siglo XX aparecieron nuevos datos que permitieron descubrir algunas deficiencias en el “código sin comas”. Se descubrió que los codones son capaces de inducir la síntesis de proteínas in vitro. Más cerca de 1965, se comprendió el principio de los 64 trillizos. Como resultado, se descubrió la redundancia de algunos codones. En otras palabras, la secuencia de aminoácidos está codificada por varios tripletes.

Características distintivas

Las propiedades del código genético incluyen:

Variaciones

La primera desviación del código genético del estándar se descubrió en 1979 durante el estudio de los genes mitocondriales del cuerpo humano. Se identificaron más variantes similares, incluidos muchos códigos mitocondriales alternativos. Estos incluyen la decodificación del codón de parada UGA, que se utiliza para determinar el triptófano en los micoplasmas. GUG y UUG en arqueas y bacterias se utilizan a menudo como opciones iniciales. A veces los genes codifican una proteína con un codón de inicio que difiere del utilizado normalmente por la especie. Además, en algunas proteínas, el ribosoma inserta la selenocisteína y la pirrolisina, que son aminoácidos no estándar. Ella lee el codón de terminación. Esto depende de las secuencias que se encuentran en el ARNm. Actualmente, la selenocisteína se considera el aminoácido número 21 y el pirrolisano el 22 presente en las proteínas.

Características generales del código genético.

Sin embargo, todas las excepciones son raras. En los organismos vivos, el código genético generalmente tiene una serie de características comunes. Estos incluyen la composición de un codón, que incluye tres nucleótidos (los dos primeros pertenecen a los definitorios), la transferencia de codones por ARNt y ribosomas a la secuencia de aminoácidos.

El código genético es un sistema de registro de información hereditaria en moléculas de ácido nucleico, basado en una determinada alternancia de secuencias de nucleótidos en el ADN o ARN, formando codones correspondientes a los aminoácidos de una proteína.

Propiedades del código genético.

El código genético tiene varias propiedades.

    Tripletidad.

    Degeneración o redundancia.

    Sin ambigüedad.

    Polaridad.

    No superpuestos.

    Compacidad.

    Versatilidad.

Cabe señalar que algunos autores también proponen otras propiedades del código relacionadas con las características químicas de los nucleótidos incluidos en el código o la frecuencia de aparición de aminoácidos individuales en las proteínas del cuerpo, etc. Sin embargo, estas propiedades se derivan de las enumeradas anteriormente, por lo que las consideraremos allí.

A. Tripletidad. El código genético, como muchos sistemas organizados de manera compleja, tiene la unidad estructural y funcional más pequeña. Un triplete es la unidad estructural más pequeña del código genético. Consta de tres nucleótidos. Un codón es la unidad funcional más pequeña del código genético. Normalmente, los tripletes de ARNm se denominan codones. En el código genético, un codón realiza varias funciones. En primer lugar, su función principal es codificar un único aminoácido. En segundo lugar, es posible que el codón no codifique un aminoácido, pero en este caso realiza otra función (ver más abajo). Como puede verse en la definición, un triplete es un concepto que caracteriza elemental unidad estructural Código genético (tres nucleótidos). Codón – caracteriza unidad semántica elemental genoma: tres nucleótidos determinan la unión de un aminoácido a la cadena polipeptídica.

La unidad estructural elemental se descifró primero teóricamente y luego se confirmó experimentalmente su existencia. De hecho, 20 aminoácidos no pueden codificarse con uno o dos nucleótidos porque de estos últimos sólo hay 4. Tres de cada cuatro nucleótidos dan 4 3 = 64 variantes, lo que cubre con creces el número de aminoácidos disponibles en los organismos vivos (ver Tabla 1).

Las 64 combinaciones de nucleótidos presentadas en la tabla tienen dos características. En primer lugar, de las 64 variantes tripletes, solo 61 son codones y codifican algún aminoácido, se denominan codones de sentido. Tres trillizos no codifican.

Los aminoácidos a son señales de parada que indican el final de la traducción. Hay tres de esos trillizos: UAA, UAG, UGA, también se les llama “sin sentido” (codones sin sentido). Como resultado de una mutación asociada con la sustitución de un nucleótido en un triplete por otro, puede surgir un codón sin sentido a partir de un codón sentido. Este tipo de mutación se llama mutación sin sentido. Si dicha señal de parada se forma dentro del gen (en su parte de información), durante la síntesis de proteínas en este lugar el proceso se interrumpirá constantemente: solo se sintetizará la primera parte (antes de la señal de parada) de la proteína. Una persona con esta patología experimentará falta de proteínas y experimentará síntomas asociados a esta deficiencia. Por ejemplo, este tipo de mutación se identificó en el gen que codifica la cadena beta de la hemoglobina. Se sintetiza una cadena de hemoglobina inactiva acortada, que se destruye rápidamente. Como resultado, se forma una molécula de hemoglobina desprovista de cadena beta. Está claro que es poco probable que una molécula así cumpla plenamente sus funciones. Se produce una enfermedad grave que se desarrolla como anemia hemolítica (talasemia beta-cero, de la palabra griega "Thalas" - Mar Mediterráneo, donde se descubrió esta enfermedad por primera vez).

El mecanismo de acción de los codones de terminación difiere del mecanismo de acción de los codones sensoriales. Esto se debe al hecho de que para todos los codones que codifican aminoácidos se han encontrado los ARNt correspondientes. No se encontraron ARNt para codones sin sentido. En consecuencia, el ARNt no participa en el proceso de detener la síntesis de proteínas.

codónAGO (en las bacterias a veces GUG) no sólo codifican los aminoácidos metionina y valina, sino que tambiéniniciador de transmisión .

b. Degeneración o redundancia.

61 de los 64 tripletes codifican 20 aminoácidos. Este exceso de tres veces el número de tripletes sobre el número de aminoácidos sugiere que se pueden utilizar dos opciones de codificación en la transferencia de información. En primer lugar, no todos los 64 codones pueden participar en la codificación de 20 aminoácidos, sino sólo 20 y, en segundo lugar, los aminoácidos pueden estar codificados por varios codones. Las investigaciones han demostrado que la naturaleza utilizó la última opción.

Su preferencia es obvia. Si de 64 tripletes variantes sólo 20 estuvieran involucrados en la codificación de aminoácidos, entonces 44 tripletes (de 64) permanecerían no codificantes, es decir, sin sentido (codones sin sentido). Anteriormente, señalamos lo peligroso que es para la vida de una célula transformar un triplete codificante como resultado de una mutación en un codón sin sentido; esto altera significativamente el funcionamiento normal de la ARN polimerasa y, en última instancia, conduce al desarrollo de enfermedades. Actualmente, tres codones de nuestro genoma no tienen sentido, pero imaginemos ahora lo que pasaría si el número de codones sin sentido aumentara unas 15 veces. Está claro que en tal situación la transición de codones normales a codones sin sentido será inmensamente mayor.

Un código en el que un aminoácido está codificado por varios tripletes se denomina degenerado o redundante. Casi todos los aminoácidos tienen varios codones. Por tanto, el aminoácido leucina puede estar codificado por seis tripletes: UUA, UUG, TSUU, TsUC, TsUA, TsUG. La valina está codificada por cuatro tripletes, la fenilalanina por dos y sólo triptófano y metionina codificado por un codón. La propiedad que se asocia con registrar la misma información con diferentes símbolos se llama degeneración.

El número de codones designados para un aminoácido se correlaciona bien con la frecuencia de aparición del aminoácido en las proteínas.

Y lo más probable es que esto no sea accidental. Cuanto mayor sea la frecuencia de aparición de un aminoácido en una proteína, cuanto más a menudo esté representado el codón de este aminoácido en el genoma, mayor será la probabilidad de que sea dañado por factores mutagénicos. Por tanto, está claro que un codón mutado tiene mayores posibilidades de codificar el mismo aminoácido si está muy degenerado. Desde esta perspectiva, la degeneración del código genético es un mecanismo que protege al genoma humano de daños.

Cabe señalar que el término degeneración se utiliza en genética molecular en otro sentido. Por tanto, la mayor parte de la información de un codón está contenida en los dos primeros nucleótidos; la base en la tercera posición del codón resulta de poca importancia. Este fenómeno se llama “degeneración de la tercera base”. Esta última característica minimiza el efecto de las mutaciones. Por ejemplo, se sabe que la función principal de los glóbulos rojos es transportar oxígeno desde los pulmones a los tejidos y dióxido de carbono desde los tejidos a los pulmones. Esta función la realiza el pigmento respiratorio, la hemoglobina, que llena todo el citoplasma del eritrocito. Consiste en una parte proteica, la globina, que está codificada por el gen correspondiente. Además de proteínas, la molécula de hemoglobina contiene hemo, que contiene hierro. Las mutaciones en los genes de la globina dan lugar a la aparición de diferentes variantes de hemoglobina. Muy a menudo, las mutaciones están asociadas con sustitución de un nucleótido por otro y aparición de un nuevo codón en el gen, que puede codificar un nuevo aminoácido en la cadena polipeptídica de la hemoglobina. En un triplete, como resultado de una mutación, se puede reemplazar cualquier nucleótido: el primero, el segundo o el tercero. Se conocen varios cientos de mutaciones que afectan la integridad de los genes de la globina. Cerca 400 de los cuales están asociados con el reemplazo de nucleótidos individuales en un gen y el reemplazo de aminoácidos correspondiente en un polipéptido. De estos solo 100 Los reemplazos provocan inestabilidad de la hemoglobina y diversos tipos de enfermedades, desde leves hasta muy graves. 300 (aproximadamente 64%) mutaciones de sustitución no afectan la función de la hemoglobina y no conducen a patología. Una de las razones de esto es la mencionada "degeneración de la tercera base", cuando la sustitución del tercer nucleótido en un triplete que codifica serina, leucina, prolina, arginina y algunos otros aminoácidos conduce a la aparición de un codón sinónimo. codificando el mismo aminoácido. Tal mutación no se manifestará fenotípicamente. Por el contrario, cualquier sustitución del primer o segundo nucleótido en un triplete conduce en el 100% de los casos a la aparición de una nueva variante de hemoglobina. Pero incluso en este caso, es posible que no haya trastornos fenotípicos graves. La razón de esto es la sustitución de un aminoácido en la hemoglobina por otro similar al primero en propiedades fisicoquímicas. Por ejemplo, si un aminoácido con propiedades hidrófilas se sustituye por otro aminoácido, pero con las mismas propiedades.

La hemoglobina consiste en el grupo hemo de porfirina de hierro (se le unen moléculas de oxígeno y dióxido de carbono) y proteína: globina. La hemoglobina adulta (HbA) contiene dos idénticos-cadenas y dos-cadenas. Molécula-la cadena contiene 141 residuos de aminoácidos,-cadena - 146,- Y-Las cadenas se diferencian en muchos residuos de aminoácidos. La secuencia de aminoácidos de cada cadena de globina está codificada por su propio gen. Codificación genética-la cadena se encuentra en el brazo corto del cromosoma 16,-gen - en el brazo corto del cromosoma 11. Sustitución en el gen que codifica.-la cadena de hemoglobina del primer o segundo nucleótido casi siempre provoca la aparición de nuevos aminoácidos en la proteína, alteración de las funciones de la hemoglobina y graves consecuencias para el paciente. Por ejemplo, reemplazar "C" en uno de los tripletes CAU (histidina) por "Y" dará lugar a la aparición de un nuevo triplete UAU, que codifica otro aminoácido: la tirosina. Fenotípicamente, esto se manifestará en una enfermedad similar. sustitución en la posición 63-cadena del polipéptido de histidina a tirosina conducirá a la desestabilización de la hemoglobina. Se desarrolla la enfermedad metahemoglobinemia. Reemplazo, como resultado de mutación, del ácido glutámico por valina en la posición 6-La cadena es la causa de la enfermedad más grave: la anemia falciforme. No sigamos con la triste lista. Solo tengamos en cuenta que al sustituir los dos primeros nucleótidos puede aparecer un aminoácido con propiedades fisicoquímicas similares al anterior. Por tanto, la sustitución del segundo nucleótido en uno de los tripletes que codifican el ácido glutámico (GAA) enLa cadena con “U” conduce a la aparición de un nuevo triplete (GUA), que codifica valina, y reemplazando el primer nucleótido con “A” se forma el triplete AAA, que codifica el aminoácido lisina. El ácido glutámico y la lisina tienen propiedades fisicoquímicas similares: ambos son hidrófilos. La valina es un aminoácido hidrofóbico. Por lo tanto, reemplazar el ácido glutámico hidrofílico con valina hidrofóbica cambia significativamente las propiedades de la hemoglobina, lo que en última instancia conduce al desarrollo de anemia de células falciformes, mientras que reemplazar el ácido glutámico hidrofílico con lisina hidrofílica cambia la función de la hemoglobina en menor medida: los pacientes desarrollan una forma leve. de anemia. Como resultado de la sustitución de la tercera base, el nuevo triplete puede codificar los mismos aminoácidos que el anterior. Por ejemplo, si en un triplete CAC el uracilo fuera reemplazado por citosina y apareciera un triplete CAC, entonces prácticamente no se detectarían cambios fenotípicos en humanos. Esto es comprensible, porque Ambos tripletes codifican el mismo aminoácido: la histidina.

En conclusión, conviene enfatizar que la degeneración del código genético y la degeneración de la tercera base desde un punto de vista biológico general son mecanismos de protección inherentes a la evolución en la estructura única del ADN y el ARN.

v. Sin ambigüedad.

Cada triplete (salvo tonterías) codifica sólo un aminoácido. Así, en la dirección codón - aminoácido el código genético es inequívoco, en la dirección aminoácido - codón es ambiguo (degenerado).

inequívoco

Codón de aminoácido

Degenerar

Y en este caso, la necesidad de que el código genético sea inequívoco es obvia. En otra opción, al traducir un mismo codón se insertarían distintos aminoácidos en la cadena proteica y, como resultado, se formarían proteínas con distintas estructuras primarias y distintas funciones. El metabolismo celular cambiaría al modo de funcionamiento de “un gen, varios polipéptidos”. Está claro que en tal situación la función reguladora de los genes se perdería por completo.

polaridad

La lectura de información del ADN y el ARNm se produce solo en una dirección. La polaridad es importante para definir estructuras de orden superior (secundaria, terciaria, etc.). Anteriormente hablamos de cómo las estructuras de orden inferior determinan las estructuras de orden superior. La estructura terciaria y las estructuras de orden superior en las proteínas se forman tan pronto como la cadena de ARN sintetizada abandona la molécula de ADN o la cadena polipeptídica abandona el ribosoma. Mientras que el extremo libre de un ARN o polipéptido adquiere una estructura terciaria, el otro extremo de la cadena continúa sintetizándose en el ADN (si se transcribe el ARN) o en un ribosoma (si se transcribe un polipéptido).

Por tanto, el proceso unidireccional de lectura de información (durante la síntesis de ARN y proteínas) es fundamental no sólo para determinar la secuencia de nucleótidos o aminoácidos en la sustancia sintetizada, sino para la determinación estricta de secuencias secundarias, terciarias, etc. estructuras.

d. No superpuestos.

El código puede superponerse o no superponerse. La mayoría de los organismos tienen un código que no se superpone. En algunos fagos se encuentra código superpuesto.

La esencia de un código que no se superpone es que un nucleótido de un codón no puede ser simultáneamente un nucleótido de otro codón. Si el código se superpusiera, entonces la secuencia de siete nucleótidos (GCUGCUG) podría codificar no dos aminoácidos (alanina-alanina) (Fig.33, A) como en el caso de un código que no se superpone, sino tres (si hay un nucleótido en común) (Fig. 33, B) o cinco (si dos nucleótidos son comunes) (ver Fig. 33, C). En los dos últimos casos, una mutación de cualquier nucleótido provocaría una alteración en la secuencia de dos, tres, etc. aminoácidos.

Sin embargo, se ha establecido que una mutación de un nucleótido siempre altera la inclusión de un aminoácido en un polipéptido. Este es un argumento importante de que el código no se superpone.

Expliquemos esto en la Figura 34. Las líneas en negrita muestran tripletes que codifican aminoácidos en el caso de código superpuesto y no superpuesto. Los experimentos han demostrado claramente que el código genético no se superpone. Sin entrar en detalles del experimento, observamos que si reemplaza el tercer nucleótido en la secuencia de nucleótidos (ver Fig. 34)Ud. (marcado con un asterisco) a alguna otra cosa:

1. Con un código que no se superponga, la proteína controlada por esta secuencia tendría una sustitución de un (primer) aminoácido (marcado con asteriscos).

2. Con un código superpuesto en la opción A, se produciría una sustitución en dos (primero y segundo) aminoácidos (marcados con asteriscos). Según la opción B, el reemplazo afectaría a tres aminoácidos (marcados con asteriscos).

Sin embargo, numerosos experimentos han demostrado que cuando se altera un nucleótido en el ADN, la alteración en la proteína siempre afecta solo a un aminoácido, lo cual es típico de un código que no se superpone.

GZUGZUG GZUGZUG GZUGZUG

GCU GCU GCU UGC GCU GCU GCU GCU GCU GCU GCU

*** *** *** *** *** ***

Alanina - Alanina Ala - Cis - Ley Ala - Ley - Ley - Ala - Ley

A B C

Código no superpuesto Código superpuesto

Arroz. 34. Un diagrama que explica la presencia de un código no superpuesto en el genoma (explicación en el texto).

La naturaleza no superpuesta del código genético está asociada con otra propiedad: la lectura de información comienza desde un punto determinado: la señal de iniciación. Una señal de iniciación de este tipo en el ARNm es el codón que codifica la metionina AUG.

Cabe señalar que una persona todavía tiene una pequeña cantidad de genes que se desvían de la regla general y se superponen.

e. Compacidad.

No hay puntuación entre codones. En otras palabras, los tripletes no están separados entre sí, por ejemplo, por un nucleótido sin sentido. La ausencia de "signos de puntuación" en el código genético se ha demostrado mediante experimentos.

y. Versatilidad.

El código es el mismo para todos los organismos que viven en la Tierra. Se obtuvo evidencia directa de la universalidad del código genético comparando secuencias de ADN con las secuencias de proteínas correspondientes. Resultó que todos los genomas bacterianos y eucariotas utilizan los mismos conjuntos de valores de código. Hay excepciones, pero no muchas.

Las primeras excepciones a la universalidad del código genético se encontraron en las mitocondrias de algunas especies animales. Se trataba del codón terminador UGA, que se lee igual que el codón UGG, que codifica el aminoácido triptófano. También se encontraron otras desviaciones más raras de la universalidad.

Sistema de código de ADN.

El código genético del ADN consta de 64 tripletes de nucleótidos. Estos tripletes se llaman codones. Cada codón codifica uno de los 20 aminoácidos utilizados en la síntesis de proteínas. Esto da cierta redundancia en el código: la mayoría de los aminoácidos están codificados por más de un codón.
Un codón realiza dos funciones interrelacionadas: señala el comienzo de la traducción y codifica la inclusión del aminoácido metionina (Met) en la cadena polipeptídica en crecimiento. El sistema de codificación de ADN está diseñado para que el código genético pueda expresarse como codones de ARN o codones de ADN. Los codones de ARN se encuentran en el ARN (ARNm) y estos codones pueden leer información durante la síntesis de polipéptidos (un proceso llamado traducción). Pero cada molécula de ARNm adquiere una secuencia de nucleótidos en la transcripción del gen correspondiente.

Todos los aminoácidos menos dos (Met y Trp) pueden codificarse mediante de 2 a 6 codones diferentes. Sin embargo, el genoma de la mayoría de los organismos muestra que ciertos codones se ven favorecidos sobre otros. En humanos, por ejemplo, la alanina es codificada por GCC cuatro veces más que por GCG. Esto probablemente indica una mayor eficiencia de traducción del aparato de traducción (por ejemplo, el ribosoma) para algunos codones.

El código genético es casi universal. Los mismos codones se asignan a la misma sección de aminoácidos y las mismas señales de inicio y parada son abrumadoramente las mismas en animales, plantas y microorganismos. Sin embargo, se han encontrado algunas excepciones. La mayoría implica asignar uno o dos de los tres codones de parada a un aminoácido.

CÓDIGO GENÉTICO(Griego, genetikos relacionado con el origen; sin.: código, código biológico, código de aminoácidos, código de proteínas, código de ácido nucleico) - un sistema para registrar información hereditaria en las moléculas de ácidos nucleicos de animales, plantas, bacterias y virus mediante secuencias alternas de nucleótidos.

La información genética (Fig.) de una célula a otra, de una generación a otra, con la excepción de los virus de ARN, se transmite mediante la duplicación de moléculas de ADN (ver Replicación). La implementación de la información hereditaria del ADN durante la vida de una célula se realiza a través de 3 tipos de ARN: informativo (ARNm o ARNm), ribosomal (ARNr) y de transporte (ARNt), que se sintetizan utilizando la enzima ARN polimerasa en el ADN como matriz. En este caso, la secuencia de nucleótidos en una molécula de ADN determina de forma única la secuencia de nucleótidos en los tres tipos de ARN (ver Transcripción). La información del gen (ver), que codifica una molécula de proteína, se transporta únicamente por el ARNm. El producto final de la implementación de la información hereditaria es la síntesis de moléculas de proteínas, cuya especificidad está determinada por la secuencia de aminoácidos que contienen (ver Traducción).

Dado que el ADN o el ARN contienen solo 4 bases nitrogenadas diferentes [en el ADN: adenina (A), timina (T), guanina (G), citosina (C); en ARN: adenina (A), uracilo (U), citosina (C), guanina (G)], cuya secuencia determina la secuencia de 20 aminoácidos en la proteína, surge el problema de GK, es decir, el problema de traducir un alfabeto de 4 letras de ácidos nucleicos en un alfabeto de 20 letras de polipéptidos.

Por primera vez, N.K Koltsov formuló la idea de la síntesis matricial de moléculas de proteínas con la predicción correcta de las propiedades de una matriz hipotética. En 1944, O. Avery et al. La transmisión de características hereditarias durante la transformación en neumococos. En 1948, E. Chargaff demostró que en todas las moléculas de ADN existe una igualdad cuantitativa de los nucleótidos correspondientes (A-T, G-C). En 1953, F. Crick, J. Watson y Wilkins (M. H. F. Wilkins), basándose en esta regla y en los datos de difracción de rayos X (ver), llegaron a la conclusión de que las moléculas de ADN son una doble hélice que consta de dos hilos de polinucleótidos conectados entre sí. otros por puentes de hidrógeno. Además, en la segunda, sólo T puede estar frente a A de una cadena, y sólo C puede estar frente a G. Esta complementariedad lleva al hecho de que la secuencia de nucleótidos de una cadena determina de forma única la secuencia de la otra. La segunda conclusión importante que se desprende de este modelo es que la molécula de ADN es capaz de autorreproducirse.

En 1954, G. Gamow formuló el problema de las ecuaciones geométricas en su forma moderna. En 1957, F. Crick expresó la Hipótesis del Adaptador, sugiriendo que los aminoácidos interactúan con el ácido nucleico no directamente, sino a través de intermediarios (ahora conocidos como ARNt). En los años siguientes, se confirmaron experimentalmente todos los vínculos fundamentales del esquema general de transmisión de información genética, inicialmente hipotéticos. En 1957 se descubrieron los ARNm [A. S. Spirin, A. N. Belozersky y otros; Folkin y Astrachan (E. Volkin, L. Astrachan)] y ARNt [Hoagland (M.V. Hoagland)]; en 1960 se sintetizó ADN fuera de la célula utilizando macromoléculas de ADN existentes como matriz (A. Kornberg) y se descubrió la síntesis de ARN dependiente de ADN [S. B. Weiss et al.]. En 1961 se creó un sistema libre de células en el que se sintetizaban sustancias similares a proteínas en presencia de ARN natural o polirribonucleótidos sintéticos [M. Nirenberg y Matthaei (JH Matthaei)]. El problema de conocer el código consistía en estudiar las propiedades generales del código y realmente descifrarlo, es decir, descubrir qué combinaciones de nucleótidos (codones) codifican determinados aminoácidos.

Las propiedades generales del código se aclararon independientemente de su decodificación y principalmente antes de ella mediante el análisis de los patrones moleculares de formación de mutaciones (F. Krick et al., 1961; N.V. Luchnik, 1963). Se reducen a lo siguiente:

1. El código es universal, es decir, idéntico, al menos básicamente, para todos los seres vivos.

2. El código es triplete, es decir, cada aminoácido está codificado por un triplete de nucleótidos.

3. El código no se superpone, es decir, un nucleótido determinado no puede formar parte de más de un codón.

4. El código es degenerado, es decir, un aminoácido puede estar codificado por varios tripletes.

5. La información sobre la estructura primaria de la proteína se lee del ARNm de forma secuencial, comenzando desde un punto fijo.

6. La mayoría de los tripletes posibles tienen “sentido”, es decir, codifican aminoácidos.

7. De las tres “letras” de un codón, sólo dos (obligadas) tienen un significado predominante, mientras que la tercera (opcional) contiene mucha menos información.

La decodificación directa del código consistiría en comparar la secuencia de nucleótidos del gen estructural (o el ARNm sintetizado en él) con la secuencia de aminoácidos de la proteína correspondiente. Sin embargo, ese camino todavía no es técnicamente posible. Se utilizaron otras dos formas: la síntesis de proteínas en un sistema libre de células utilizando polirribonucleótidos artificiales de composición conocida como matriz y el análisis de los patrones moleculares de formación de mutaciones (ver). El primero trajo resultados positivos antes e históricamente jugó un papel importante en el desciframiento de G. k.

En 1961, M. Nirenberg y Mattei utilizaron como matriz un homopolímero: ácido poliuridílico sintético (es decir, ARN artificial de composición UUUU...) y obtuvieron polifenilalanina. De esto se deduce que el codón de fenilalanina consta de varias U, es decir, en el caso de un código triplete, se descifra como UUU. Posteriormente, junto con los homopolímeros, se utilizaron polirribonucleótidos, compuestos por diferentes nucleótidos. Al mismo tiempo, solo se conocía la composición de los polímeros, la ubicación de los nucleótidos en ellos era estadística, por lo que el análisis de los resultados fue estadístico y arrojó conclusiones indirectas. Muy rápidamente fue posible encontrar al menos un triplete para los 20 aminoácidos. Resultó que la presencia de disolventes orgánicos, cambios de pH o temperatura, algunos cationes y especialmente antibióticos hacen que el código sea ambiguo: los mismos codones comienzan a estimular la inclusión de otros aminoácidos, en algunos casos un codón comenzó a codificar hasta cuatro diferentes aminoácidos. La estreptomicina afectó la lectura de información tanto en sistemas libres de células como in vivo, y fue eficaz sólo en cepas bacterianas sensibles a la estreptomicina. En las cepas dependientes de estreptomicina, "corrigió" la lectura de los codones que habían cambiado como resultado de la mutación. Resultados similares dieron motivos para dudar de la exactitud de la decodificación de G. utilizando un sistema sin células; Se requirió confirmación, principalmente mediante datos in vivo.

Los principales datos sobre G. a in vivo se obtuvieron analizando la composición de aminoácidos de las proteínas en organismos tratados con mutágenos (ver) con un mecanismo de acción conocido, por ejemplo, el nitrógeno, que provoca la sustitución de C en la molécula de ADN. con U y A con D. También proporciona información útil el análisis de mutaciones causadas por mutágenos inespecíficos, la comparación de diferencias en la estructura primaria de proteínas relacionadas en diferentes especies, la correlación entre la composición del ADN y las proteínas, etc.

Descifrar G. a basándose en datos in vivo e in vitro arrojó resultados coincidentes. Posteriormente, se desarrollaron otros tres métodos para descifrar el código en sistemas libres de células: unión de aminoacil-ARNt (es decir, ARNt con un aminoácido activado adjunto) con trinucleótidos de composición conocida (M. Nirenberg et al., 1965), unión de aminoacil-ARNt con polinucleótidos a partir de un determinado triplete (Mattei et al., 1966), y el uso de polímeros como ARNm, en los que no sólo se conoce la composición, sino también el orden de los nucleótidos (X. Korana et al. , 1965). Los tres métodos se complementan entre sí y los resultados concuerdan con los datos obtenidos de experimentos in vivo.

En los años 70 siglo 20 Han aparecido métodos para verificar de manera particularmente confiable los resultados de la decodificación de G. k. Se sabe que las mutaciones que ocurren bajo la influencia de la proflavina consisten en la pérdida o inserción de nucleótidos individuales, lo que conduce a un cambio en el marco de lectura. En el fago T4, la proflavina provocó una serie de mutaciones en las que cambió la composición de la lisozima. Esta composición se analizó y se comparó con aquellos codones que deberían haber resultado de un cambio de marco. El resultado fue un cumplimiento total. Además, este método permitió establecer qué tripletes del código degenerado codifican cada uno de los aminoácidos. En 1970, J. M. Adams y sus colaboradores lograron descifrar parcialmente G. c mediante un método directo: en el fago R17, se determinó la secuencia de bases en un fragmento de 57 nucleótidos de longitud y se comparó con la secuencia de aminoácidos de su proteína de cubierta. . Los resultados fueron completamente consistentes con los obtenidos por métodos menos directos. Así, el código ha sido descifrado completa y correctamente.

Los resultados de la decodificación se resumen en una tabla. Indica la composición de codones y ARN. La composición de los anticodones de ARNt es complementaria a los codones de ARNm, es decir, en lugar de Y contienen A, en lugar de A - U, en lugar de C - G y en lugar de G - C, y corresponde a los codones del gen estructural (la cadena de ADN del cual se lee la información) con la única diferencia de que el uracilo reemplaza a la timina. De los 64 tripletes que pueden formarse mediante una combinación de 4 nucleótidos, 61 tienen “sentido”, es decir, codifican aminoácidos, y 3 son “sin sentido” (sin sentido). Existe una relación bastante clara entre la composición de los tripletes y su significado, que se descubrió al analizar las propiedades generales del código. En algunos casos, los tripletes que codifican un aminoácido específico (por ejemplo, prolina, alanina) se caracterizan por el hecho de que los dos primeros nucleótidos (obligados) son iguales y el tercero (opcional) puede ser cualquier cosa. En otros casos (al codificar, por ejemplo, asparagina, glutamina), dos tripletes similares tienen el mismo significado, en los que los dos primeros nucleótidos coinciden y, en lugar del tercero, hay una purina o una pirimidina.

Los codones sin sentido, 2 de los cuales tienen nombres especiales correspondientes a la designación de fagos mutantes (UAA-ocre, UAG-ámbar, UGA-ópalo), aunque no codifican ningún aminoácido, son de gran importancia a la hora de leer información, codificando el final. de la cadena polipeptídica.

La lectura de información se produce en la dirección desde 5 1 -> 3 1 - hasta el final de la cadena de nucleótidos (ver Ácidos desoxirribonucleicos). En este caso, la síntesis de proteínas procede de un aminoácido con un grupo amino libre a un aminoácido con un grupo carboxilo libre. El inicio de la síntesis está codificado por los tripletes AUG y GUG, que en este caso contienen un aminoacil-ARNt de partida específico, concretamente el N-formilmetionil-ARNt. Estos mismos tripletes, cuando se localizan dentro de la cadena, codifican metionina y valina, respectivamente. La ambigüedad desaparece por el hecho de que el comienzo de la lectura va precedido de tonterías. Existe evidencia de que el límite entre regiones de ARNm que codifican diferentes proteínas consta de más de dos tripletes y que la estructura secundaria del ARN cambia en estos lugares; este tema está bajo investigación. Si dentro de un gen estructural aparece un codón sin sentido, entonces la proteína correspondiente se construye sólo hasta la ubicación de este codón.

El descubrimiento y descifrado del código genético, un logro destacado de la biología molecular, influyó en todas las ciencias biológicas y, en algunos casos, marcó el comienzo del desarrollo de grandes secciones especiales (ver Genética molecular). El efecto del descubrimiento de G. y las investigaciones relacionadas se compara con el efecto que tuvo la teoría de Darwin en la ciencia biológica.

La universalidad de la genética es una prueba directa de la universalidad de los mecanismos moleculares básicos de la vida en todos los representantes del mundo orgánico. Mientras tanto, las grandes diferencias en las funciones del aparato genético y su estructura durante la transición de procariotas a eucariotas y de organismos unicelulares a multicelulares probablemente estén asociadas con diferencias moleculares, cuyo estudio es una de las tareas del futuro. Dado que la investigación de G. es sólo una cuestión de los últimos años, la importancia de los resultados obtenidos para la medicina práctica es sólo de naturaleza indirecta, lo que nos permite comprender la naturaleza de las enfermedades y el mecanismo de acción de los patógenos y sustancias medicinales. Sin embargo, el descubrimiento de fenómenos como la transformación (ver), la transducción (ver), la supresión (ver), indica la posibilidad fundamental de corregir la información hereditaria patológicamente alterada o su corrección, la llamada. ingeniería genética (ver).

Mesa. CÓDIGO GENÉTICO

Primer nucleótido del codón

Segundo nucleótido del codón

Tercero, codón de nucleótido

fenilalanina

J tonterías

triptófano

histidina

ácido glutámico

isoleucina

aspártico

metionina

asparagina

glutamina

* Codifica el final de la cadena.

** También codifica el inicio de la cadena.

Bibliografía: Ichas M. Código biológico, trad. Del inglés, M., 1971; Arquero N.B. Biofísica de las lesiones citogenéticas y código genético, L., 1968; Genética molecular, trad. Del inglés, ed. A. N. Belozersky, parte 1, M., 1964; Ácidos nucleicos, trans. Del inglés, ed. A. N. Belozersky, M., 1965; Watson J.D. Biología molecular del gen, trad. Del inglés, M., 1967; Genética fisiológica, ed. M. E. Lobasheva S. G., Inge-Vechtomova, L., 1976, bibliogr.; Desoxyribonuc-leins&ure, Schlttssel des Lebens, hrsg. v „ E. Geissler, B., 1972; El código genético, Gold Spr. Harb. Síntoma. cuant. Biol., v. 31, 1966; W o e s e C. R. El código genético, N. Y. a. o., 1967.

CÓDIGO GENÉTICO, un método para registrar información hereditaria en moléculas de ácido nucleico en forma de una secuencia de nucleótidos que forman estos ácidos. Una determinada secuencia de nucleótidos en el ADN y el ARN corresponde a una determinada secuencia de aminoácidos en las cadenas polipeptídicas de las proteínas. Es costumbre escribir el código utilizando letras mayúsculas del alfabeto ruso o latino. Cada nucleótido se designa con la letra con la que comienza el nombre de la base nitrogenada incluida en su molécula: A (A) - adenina, G (G) - guanina, C (C) - citosina, T (T) - timina; en el ARN, en lugar de timina, el uracilo es U (U). Cada uno está codificado por una combinación de tres nucleótidos: un triplete o codón. Brevemente, el camino de transferencia de información genética se resume en el llamado. El dogma central de la biología molecular: ADN ` ARN f proteína.

En casos especiales, la información puede transferirse del ARN al ADN, pero nunca de las proteínas a los genes.

La implementación de la información genética se lleva a cabo en dos etapas. En el núcleo celular, informativo o matriz, el ARN (transcripción) se sintetiza en el ADN. En este caso, la secuencia de nucleótidos del ADN se “reescribe” (recodifica) en la secuencia de nucleótidos del ARNm. Luego, el ARNm pasa al citoplasma, se adhiere al ribosoma y en él, como en una matriz, se sintetiza la cadena polipeptídica de la proteína (traducción). Los aminoácidos se unen a la cadena en construcción mediante ARN de transferencia en una secuencia determinada por el orden de los nucleótidos en el ARNm.

A partir de cuatro “letras” se pueden formar 64 “palabras” diferentes de tres letras (codones). De los 64 codones, 61 codifican aminoácidos específicos y tres son responsables de completar la síntesis de la cadena polipeptídica. Dado que hay 61 codones por cada 20 aminoácidos que componen las proteínas, algunos aminoácidos están codificados por más de un codón (la llamada degeneración del código). Esta redundancia aumenta la fiabilidad del código y de todo el mecanismo de biosíntesis de proteínas. Otra propiedad del código es su especificidad (inequívoco): un codón codifica sólo un aminoácido.

Además, el código no se superpone: la información se lee en una dirección secuencialmente, triplete por triplete. La propiedad más sorprendente del código es su universalidad: es el mismo en todos los seres vivos, desde las bacterias hasta los humanos (con la excepción del código genético de las mitocondrias). Los científicos ven esto como una confirmación del concepto de que todos los organismos descienden de un ancestro común.

Entre 1961 y 1965 se llevó a cabo el descifrado del código genético, es decir, la determinación del “significado” de cada codón y las reglas mediante las cuales se lee la información. y se considera uno de los logros más sorprendentes de la biología molecular.