sábado, 12 de mayo de 2012

7.1 EL CÓDIGO GENÉTICO


 7.1 EL CÓDIGO GENÉTICO

Una vez que Crick (1958) propuso la Hipótesis de la Secuencia ("existe una relación entre la ordenación lineal de nucleótidos en el ADN y la ordenación lineal de aminoácidos en los polipéptidos"), la comunidad científica la admitió y se plantearon dos preguntas:
¿Existe algún código o clave que permite pasar de la secuencia de nucleótidos en el ADN a la secuencia de aminoácidos en las proteínas?
¿Cómo se convierte la información contenida en la secuencia de ADN en una estructura química de proteína?
La primera pregunta conlleva el estudio del desciframiento del código genético y el estudio de sus características. La segunda pregunta consiste en el estudio de los procesos genéticos de la síntesis de proteínas: la transcripción y la traducción.

  • CARACTERÍSTICAS DEL CÓDIGO GENÉTICO

El CÓDIGO GENÉTICO es la relación que existe entre los tripletes de bases del RNA mensajero y los aminoácidos proteinogenésicos.
En el código genético, cada aminoácido está codificado por un codón o varios codones. En total hay 64 codones que codifican para 22 aminoácidos y 3 señales de parada de la traducción. Esto hace que el código sea redundante, lo que se denomina código degenerado, porque hay varios codones diferentes que codifican para un solo aminoácido.

Serie de codones en un segmento de ARN. Cada codón se compone de tres nucleótidos que codifican un aminoácido específico.

Codón

La información genética, en el ARNm, se escribe a partir de cuatro letras, que corresponden a las bases nitrogenadas ADN (A, C, G y U), las cuales van agrupadas de tres en tres. Cada grupo de tres se llama codón y está encargado de codificar un aminoácido o un símbolo de puntuación (Comienzo, parada).
El orgánulo celular que sintetiza las proteínas a partir de aminoácidos con la información contenida en el ARNm, leyendo los codones, es el ribosoma.
Las características del código genético fueron establecidas experimentalmente por Fancis Crick, Sydney Brenner y colaboradores en 1961. Las principales características del código genético son las siguientes:




Sydney Brenner              Francis Crick

 
El código está organizado en tripletes o codones: cada tres nucleótidos (triplete) determinan un aminoácido.
El código genético es degenerado: existen más tripletes o codones que aminoácidos, de forma que un determinado aminoácido puede estar codificado por más de un triplete.
El código genético es no solapado o sin superposiciones: un nucleótido solamente pertenece a un único triplete.
La lectura es "sin comas": el cuadro de lectura de los tripletes se realiza de forma continua "sin comas" o sin que existan espacios en blanco.
El código genético nuclear es universal: el mismo triplete en diferentes especies codifica para el mismo aminoácido. La principal excepción a la universalidad es el código genético mitocondrial.


1.- CÓDIGO ORGANIZADO EN TRIPLETES O CODONES

Si cada nucleótido determinara un aminoácido, solamente podríamos codificar cuatro aminoácidos diferentes ya que en el ADN solamente hay cuatro nucleótidos distintos. Cifra muy inferior a los 20 aminoácidos distintos que existen.
Si cada dos nucleótidos codificarán un aminoácido, el número total de dinucleótidos distintos que podríamos conseguir con los cuatro nucleótidos diferentes (A, G, T y C) serían variaciones con repetición de cuatro elementos tomados de dos en dos VR4,2 = 42 = 16. Por tanto, tendríamos solamente 16 dinucleótidos diferentes, cifra inferior al número de aminoácidos distintos que existen (20).
Si cada grupo de tres nucleótidos determina un aminoácido. Teniendo en cuenta que existen cuatro nucleótidos diferentes (A, G, T y C), el número de grupos de tres nucleótidos distintos que se pueden obtener son variaciones con repetición de cuatro elementos (los cuatro nucleótidos) tomados de tres en tres: VR4,3 = 43 = 64. Por consiguiente, existe un total de 64 tripletes diferentes, cifra más que suficiente para codificar los 20 aminoácidos distintos.


2.- El CÓDIGO GENÉTICO ES DEGENERADO

Como hemos dicho anteriormente existen 64 tripletes distintos y 20 aminoácidos diferentes, de manera que un aminoácido puede venir codificado por más de un codón. Este tipo de código se denomina degenerado. Wittmann (1962) induciendo sustituciones de bases por desaminación con nitritos, realizó sustituciones de C por U y de A por G en el ARN del virus del mosaico del tabaco (TMV), demostrando que la serina y la isoleucina estaban determinadas por más de un triplete.
Las moléculas encargadas de transportar los aminoácidos hasta el ribosoma y de reconocer los codones del ARN mensajero durante el proceso de traducción son los ARN transferentes (ARN-t). Los ARN-t tienen una estructura en forma de hoja de trébol  con varios sitios funcionales:
1.- Extremo 3': lugar de unión al aminoácido (contiene siempre la secuencia ACC).
2.-Lazo dihidrouracilo (DHU): lugar de unión a la aminoacil ARN-t sintetasa o enzimas encargadas de unir una aminoácido a su correspondiente ARN-t.
3.-Lazo de T ψ C: lugar de enlace al ribosoma.
4.-Lazo del anticodón: lugar de reconocimiento de los codones del mensajero.
Normalmente el ARN-t adopta una estructura de hoja de trébol plegada en forma de L o forma de boomerang. 


                     Estructura ARN transferente                        



 Estructura ARN transferente


 
Estructura ARN transferente

Los ARN-t suelen presentar bases nitrogenadas poco frecuentes como son la pseudouridina (ψ), metilguanosina (mG), dimetilguanosina (m2G), metilinosina (mI) y dihidrouridina (DHU, UH2).
El que realiza el reconocimiento del codón correspondiente del ARN-m es el anticodón del ARN-t y no el aminoácido. Mediante un experimento se demostró que era posible transformar el cisteinil-ARN-t mediante tratamiento con hidruro de níquel en alanil-ARN-t. Este tratamiento convierte la cisteína en alanina. De esta manera se consiguió un ARN-t específico de cisteína que en lugar de llevar unida cisteína llevaba unida alanina. Cuando se empleo este ARN-t híbrido para sintetizar proteínas se pudo comprobar que en el lugar en el que debía aparecer cisteína en la secuencia del polipéptido aparecía alanina. Por tanto, el que llevaba a cabo el reconocimiento del codón del ARN-m era el anticodón del ARN-t y no el aminoácido.
La degeneración de l código se explica teniendo en cuenta dos motivos:
1.-Algunos aminoácidos pueden ser transportados por distintas especies moleculares (tipos) de ARN transferentes (ARN-t) que contienen distintos anticodones.
2.-Algunas especies moleculares de ARN-t pueden incorporar su aminoácido específico en respuesta a varios codones, de manera que poseen un anticodón que es capaz de emparejarse con varios codones diferentes. Este emparejamiento permisivo se denomina Flexibilidad de la 3ª base del anticodón o tambaleo.
Flexibilidad de la 3º base del anticodón, tambaleo: La tercera base del anticodón, la que ocupa la posición 5' no está especialmente confinada de forma que en algunos casos puede emparejarse con distintas bases del codón. En la siguiente gráfica se observa que cuando en la posición 5' del anticodón hay una G, esta guanina puede emparejarse con un uracilo (U) de la posición 3' del codón o con una citosina (C).
 

 
Flexibilidad de la tercera base del anticodón, tambaleo


En la siguiente tabla se indican los emparejamientos codón-anticodón permitidos por la regla del tambaleo:

En la siguiente tabla se indican tres ARN-t de serina que pueden leer cada uno de ellos dos codones diferentes en el ARN-m. Estos tres ARN-t se denominan isoaceptores porque se unen (aceptan) al mismo aminoácido pero están codificados por genes distintos.




3.- El código genético es no solapado o sin superposiciones
 
Un nucleótido solamente forma parte de un triplete y, por consiguiente, no forma parte de varios tripletes, lo que indica que el código genético no presenta superposiciones. Por tanto, el código es no solapado. Wittmann (1962) induciendo mutaciones con ácido nitroso en el ARN del virus del mosaico del tabaco (TMV) pudo demostrar que las  mutaciones habitualmente producían un cambio en un solo aminoácido. El ácido nitroso produce desanimaciones que provocan sustituciones de bases, si el código fuera solapado y un nucleótido formará parte de dos o tres tripletes, la sustitución de un nucleótido daría lugar a dos o tres aminoácidos alterados en la proteína de la cápside del TMV.

Diferencias entre un código solapado y uno no solapado





Código solapado: restricciones en la secuencia de aminoácidos


Otra forma de comprobar que el código es sin superposición es que no hay ninguna restricción en la secuencia de aminoácidos de las proteínas, de manera, que un determinado aminoácido puede ir precedido o seguido de cualquiera de los 20 aminoácidos que existen. Si dos codones sucesivos compartieran dos nucleótidos, cualquier triplete solamente podría ir precedido o seguido por cuatro codones determinados. Por consiguiente, si el código fuera superpuesto, un aminoácido determinado solamente podría ir precedido o seguido de otros cuatro aminoácidos como mucho.



4.- LA LECTURA DEL CÓDIGO GENÉTICO ES "SIN COMAS"

Teniendo en cuenta que la lectura se hace de tres en tres bases, a partir de un punto de inicio la lectura se lleva a cabo sin interrupciones o espacios vacíos, es decir, la lectura es seguida "sin comas". De manera, que si añadimos un nucleótido (adición) a la secuencia, a partir de ese punto se altera el cuadro de lectura y se modifican todos los aminoácidos. Lo mismo sucede si se pierde (deleción) un nucleótido de la secuencia. A partir del nucleótido seleccionado se altera el cuadro de lectura y cambian todos los aminoácidos. Si la adición o la deleción es de tres nucleótidos o múltiplo de tres, se añade un aminoácido o más de uno a la secuencia que sigue siendo la misma a partir del la última adición o deleción. Una adición y una deleción sucesivas vuelven a restaurar el cuadro de lectura.
En la siguiente tabla se da un ejemplo con una frase que contiene solamente palabras de tres letras. A partir de la adición de una letra cambia la pauta de lectura y el significado de la frase, lo mismo sucede cuando se pierde una letra. Una adición y una deleción sucesivas recuperan el significado de la frase. Una adición de tres letras añade una palabra pero después se recupera la pauta de lectura y el sentido de la frase.



DESCIFRAMIENTO DEL CÓDIGO GENÉTICO

La asignación de un aminoácido a cada triplete o el desciframiento de la clave genética, se llevó a cabo fundamentalmente gracias al esfuerzo de tres grupos de investigación, el grupo de M. W. Nirenberg, el grupo de S. Ochoa y el equipo de H. G. Khorana. Parece lógico pensar que el desciframiento del código genético se debería haber realizado comparando las secuencia de nucleótidos de un gen y la de aminoácidos del polipéptido codificado por dicho gen. Sin embargo, en la época en la que se realizaron estos trabajos no era posible todavía obtener la secuencia de los ácidos nucleicos.



Severo Ochoa
Marshall W. Nirenberg
Har Gobind Khorana


La mayoría de los trabajos realizados por estos tres grupos de investigación consistieron en sintetizar ARN mensajeros (ARN-m) para utilizarlos posteriormente como mensajeros artificiales en un sistema a celular de traducción "in vitro". Estos sistemas a celulares de traducción "in vitro" procedían de la bacteria E. coli y contenían todo lo necesario para llevar a cabo la traducción: ribosomas, todos los ARN transferentes, aminoácidos, enzimas, etc. Sin embargo, a estos sistemas a celulares se les quitaban los ARN mensajeros de E. coli y se les añadía un ARN sintetizado artificialmente. En estos sistemas a celulares se sintetizaba un polipéptido.
Posteriormente, se comparaba la secuencia del ARN -m sintético utilizado en el experimento con la secuencia de aminoácidos del polipéptido producido.
La puesta a punto de estas técnicas requería poder sintetizar ARN-m de forma enzimática (grupo de Ochoa) o de  forma química (grupo de Khorana) y conseguir un sistema a celular estable para sintetizar proteínas (grupo de Nirenberg).
En esencia, los grupos de investigación anteriormente mencionados realizaron los siguientes tipos de experimentos:
1.- Utilización de homopolímeros.
2.- Uso de copolímeros.
3.- Empleo de polímeros de secuencia conocida.
4.- Técnica de incorporación de ARN transferente.


UTILIZACIÓN DE HOMOPOLÍMEROS

Un homopolímero es un ARN sintético que solamente contiene un tipo de ribonucleótido. Por ejemplo, el ARN sintético UUUUUUUUUUUUU.......
Gruberg-Manago y Ochoa (1955) aislaron a partir de timo de ternera un enzima denominada Polirribonucleótido fosforilasa que tenía la capacidad de sintetizar ARN a partir de ribonucleótidos difosfato y sin necesidad de molde. Este enzima iba tomando al azar los ribonuclkeñosidos del medio para originar un ARN.
Matthei y Nirenberg (1961) consiguieron sintetizar polipéptidos "in vitro" añadiendo un ARN sintético de secuencia conocida a un sistema a celular estable de traducción. Usando la Polirribonucleótido fosforilasa sintetizaron poli-uridílico (poli-U: UUUUUUUUUUUUUU...). Cuando emplearon este ARN sintético en su sistema a celular de traducción daba lugar a la formación de un polipéptido que solamente contenía el aminoácido fenilalanina (Poli-fenilalanina: phe-phe-phe-phe-..). Por tanto, el triplete UUU codificaba para fenilalanina (phe). También comprobaron que el ARN sintético Poli C (Poli-citidílico: CCCCCCCCCC....) daba lugar a un polipéptido que contenía solamente prolina (Poli-prolina: pro-pro-pro-pro-pro-...), por tanto, el codón CCC significaba prolina (pro).
Poco tiempo después, Ochoa sintetizó Poli-adenílico (Poli-A: AAAAAAAAA....) y observó que el polipéptido que aparecía solamente tenía el aminoácido lisina (Poli-lisina: lys-lys-lys-lys-....). Por consiguiente el triplete AAA codificaba para el aminoácido lisina (lys). También corroboró que el Poli-C daba lugar a Poli-prolina. El ARN Poli-guanílico no producía proteína alguna, probablemente debido a que adquiría una estructura terciaría helicoidal que impedía su traducción a proteína.


 
USO DE COPOLÍMEROS

El siguiente paso fue la utilización de copolímeros, es decir, de ARN sintéticos que contenían más de un más de un ribonucleótido distinto. Para ello emplearon la Polirribonucleótido fosforilasa y pusieron en el medio dos ribonucleótidos distintos. Por ejemplo, U y G, de manera que había 5 veces más U que G en el medio (5U:1G). Debido a que el enzima toma los ribonucleótidos difosfato del medio al azar, la probabilidad de que tome un U del medio es 5/6, mientras< que la probabilidad de que tome una G es 1/6. El ARN sintético formado presentaba una secuencia al azar de uracilos y guaninas y aparecían en él ocho tripletes diferentes con las siguientes probabilidades:

 
Cuando se analizó el polipéptido que se sintetizaba con este mensajero sintético, se observó que contenía fenilalanina (phe), cisteína (cys), valina (val), glicina (gly) y triptófano (trp). Tomando como valor 100 el del aminoácido más frecuente, cys y val presentaban un valor de 20 mientras que trp y gly mostraban un valor de 4 a 5. Se confirmaba que UUU significaba fenilalanina y se deducía que 2U y 1G (UUG, UGU y GUU) codificaban para cisteína y valina. También se deducía que 1U y 2G (UGG, GUG y GGU) codificaban para triptófano y glicina. Sin embargo, no era posible asignar un triplete concreto para cisteína y valina, o para triptófano y glicina. Parece raro, que en estos experimentos no detectaran el aminoácido leucina (leu) que esta codificado por el triplete UUG, tampoco dedujeron que el aminoácido valina estaba codificado por 1U y 2 G (GUG). Uno e los problemas, de estos experimentos radica en asignar el valor 100 al aminoácido más frecuente y comparar las proporciones de aminoácidos obtenidas de esta manera con las de los distintos tripletes del mensajero, ya que el aminoácido más frecuente puede estar codificado por más de un triplete. Otro inconveniente es que los mensajeros sintéticos producidos no presenten la frecuencia de codones esperada por azar.
Este tipo de experimentos fueron realizados por los grupos de Nirenberg y de Ochoa y no rindieron grandes resultados.


EMPLEO DE POLÍMEROS DE SECUENCIA CONOCIDA

La siguiente forma de abordar el desciframiento de la clave genética fue utilizar ARN mensajeros sintéticos de secuencia conocida obtenidos por métodos de síntesis química o enzimática. Estos métodos fueron empleados por Khorana y col. (1965).
Utilizando el Poli-UC de 116 residuos de longitud, ARN mensajero sintético en el que se repite muchas veces seguidas el dinucleótido UC (UCUCUCUCUCUCUC...) obtuvieron un polipéptido que contenía los residuos de serina y leucina en secuencia alternada (ser-leu-ser-leu-ser-leu-ser-leu-....). El Poli-UC contiene dos tripletes diferentes, UCU y CUC, por consiguiente uno de ellos codifica serina y el otro leucina, pero no se puede determinar cuál a cuál.
También se emplearon los mensajeros sintéticos Poli-AC, Poli-AG y Poli-UG que codificaban para los siguientes aminoácidos:


En 1965, Nishimura y colaboradores utilizaron el Poli-AAG, mensajero sintético en el que se repite muchas veces seguidas el trinucleótido AAG (AAGAAGAAGAAGAAG...) y encontraron la aparición de tres polipéptidos distintos en el sistema a celular de traducción, detectaron Poli-lisina (lys-lys-lys-lys-...), Poli-arginina (arg-arg-arg-arg-..) y Poli-glutamato (glu-glu-glu-glu-..). Estos resultados además de confirmar que el código genético se compone de grupos de tres bases o codones, indican que en los sistemas a celulares de traducción, la iniciación de la traducción del mensajero puede realizarse por cualquier ribonucleótido. Si comienza por la primea A, se repite AAG-AAG-AAG-.., si la traducción comienza por la segunda A, se repite AGA-AGA-AGA-AGA-..., y si la traducción comienza por la G, se repite el triplete GAA-GAA-GAA-GAA-GAA-....

 
El punto de iniciación de la lectura de los mensajeros sintéticos en su sistema a celular de traducción "in vitro",  en ausencia de triplete de iniciación (AUG), puede ser cualquier ribonucleótido.
En el ejemplo de la figura, dependiendo del punto de iniciación aparece un polipéptido distinto, cuando comienza por la primera A se sintetiza Poli-lys, en la segunda A se produce Poli-arg y en cuando se inicia en la G aparece Poli-glu.

Naturalmente, en este experimento no se sabe cuál de los tres aminoácidos corresponde a cada uno de los tres tripletes.




TÉCNICA DE INCORPORACIÓN DE ARN TRASNFERENTES

En esta técnica se utilizan ARN mensajeros sintéticos de secuencia conocida con la siguiente estructura: los grupos de Khorana y Nirenberg emplearon trinucleótidos, mientras que el equipo de Matthei utilizaba oligonucleótidos del tipo ABCCCCCCCCCCC.... (el tercer nucleótido estaba repetido 100 veces). En este último caso solamente se analiza en primer triplete, ABC.
En todos los casos, en lugar de analizar los polipéptidos sintetizados, se analiza la especificidad con que el ARN transferente (ARN-t) con o sin su aminoácido correspondiente se incorpora al ribosoma. Dicha especificidad viene determinada por la secuencia de ribonucleótidos del ARN-m sintético empleado.
Para averiguar el ARN-t que es capaz de unirse en el ribosoma al trinucleótido analizado, es necesario marcar radiactivamente uno de los ARN-t de todos los utilizados. Se lleva a cabo esta operación marcando radiactivamente cada vez un ARN-t distinto.
Con este sistema fue posible descifrar todos los tripletes que aún no habían sido descifrados.


 5.- El código genético es universal

El desciframiento del código genético se ha realizado fundamentalmente en la bacteria E. coli, por tanto, cabe preguntarse si el código genético de esta bacteria es igual que el de otros organismos tanto procarióticos como eucarióticos. Los experimentos realizados hasta la fecha indican que el código genético nuclear es universal, de manera que un determinado triplete o codón lleva información para el mismo aminoácido en diferentes especies. Hoy día existen muchos experimentos que demuestran la universalidad del código nuclear, algunos de estos experimentos son:
1.- Utilización de ARN mensajeros en diferentes sistemas a celulares. Por ejemplo ARN mensajero y ribosomas de reticulocitos de conejo con ARN transferentes de E. coli. En este sistema se sintetiza un polipéptido igual o muy semejante a la hemoglobina de conejo.
2.- Las técnicas de ingeniería genética que permiten introducir ADN de un organismo en otro de manera que el organismo receptor sintetiza las proteínas del organismo donante del ADN. Por ejemplo, la síntesis de proteínas humanas en la bacteria E. coli.
El desciframiento del código genético dio como resultado la siguiente asignación de aminoácidos a los 64 tripletes.

El código genético nos indica que aminoácido corresponde a cada triplete o codón del ARN mensajero.

3.- El triplete de iniciación suele ser AUG que codifica para Formil-metionina. También pueden actuar como tripletes de iniciación GUG (Val) y UGG (Leu) aunque con menor eficacia.
4.- Existen tres tripletes sin sentido o codones de terminación (FIN) que no codifican para ningún aminoácido: UAA (ocre), UAG (ámbar) y UGA (ópalo).
5.- La mayoría de los aminoácidos están determinados por más de un triplete, excepto la metionina (AUG) y el triptófano (UGG) que son los únicos que poseen un solo triplete.
6.- Cuando un aminoácido está codificado por varios tripletes suele variar la tercera base, por ejemplo, la glicina es GGX, la alanina es GCX, la valina es GUX, la treonina es ACX. Sin embargo, hay varias excepciones en las que también puede variar la primera base, por ejemplo, la arginina es AGPu y CGX, la leucina es CUX y UUPu y la serina es UCX y AGPi.
El código genético mitocondrial es la única excepción a la universalidad del código, de manera que en algunos organismos los aminoácidos determinados por el mismo triplete o codón son diferentes en el núcleo y en la mitocondria.

Excepciones a la Universalidad del Código


No hay comentarios:

Publicar un comentario