7.1 EL CÓDIGO GENÉTICO
Una vez que Crick (1958) propuso la Hipótesis de la Secuencia
("existe una relación entre la ordenación lineal de nucleótidos en el ADN
y la ordenación lineal de aminoácidos en los polipéptidos"), la comunidad
científica la admitió y se plantearon dos preguntas:
¿Existe algún código o clave que permite pasar de la secuencia de
nucleótidos en el ADN a la secuencia de aminoácidos en las proteínas?
¿Cómo se convierte la información contenida en la secuencia de ADN
en una estructura química de proteína?
La primera pregunta conlleva el estudio del desciframiento del
código genético y el estudio de sus características. La segunda pregunta
consiste en el estudio de los procesos genéticos de la síntesis de proteínas:
la transcripción y la traducción.
- CARACTERÍSTICAS DEL CÓDIGO GENÉTICO
El CÓDIGO GENÉTICO es la relación que existe
entre los tripletes de bases del RNA mensajero y los aminoácidos
proteinogenésicos.
En el código genético,
cada aminoácido está codificado por un codón o varios codones. En total
hay 64 codones que codifican para 22 aminoácidos y 3 señales de parada de la traducción. Esto
hace que el código sea redundante, lo que se denomina código degenerado,
porque hay varios codones diferentes que codifican para un solo aminoácido.
Serie de codones en un segmento de ARN.
Cada codón se compone de tres nucleótidos que codifican un aminoácido específico.
Codón
La información genética,
en el ARNm, se escribe a partir de cuatro letras, que
corresponden a las bases nitrogenadas
ADN (A, C, G y U), las cuales van agrupadas de tres en tres.
Cada grupo de tres se llama codón y está encargado de codificar un aminoácido o un símbolo de puntuación (Comienzo,
parada).
El orgánulo celular que
sintetiza las proteínas a partir de aminoácidos con la información contenida en el ARNm,
leyendo los codones, es el ribosoma.
Las características del código genético
fueron establecidas experimentalmente por Fancis Crick, Sydney Brenner y
colaboradores en 1961. Las principales características del código genético son
las siguientes:
Sydney Brenner Francis Crick
El código está organizado en tripletes o codones: cada tres
nucleótidos (triplete) determinan un aminoácido.
El código genético es degenerado: existen más
tripletes o codones que aminoácidos, de forma que un determinado aminoácido
puede estar codificado por más de un triplete.
El código genético es no solapado o sin superposiciones: un nucleótido
solamente pertenece a un único triplete.
La lectura es "sin comas": el cuadro de
lectura de los tripletes se realiza de forma continua "sin comas" o
sin que existan espacios en blanco.
El código genético nuclear es universal: el mismo triplete
en diferentes especies codifica para el mismo aminoácido. La principal
excepción a la universalidad es el código genético mitocondrial.
Si cada nucleótido determinara un aminoácido, solamente podríamos
codificar cuatro aminoácidos diferentes ya que en el ADN solamente hay cuatro
nucleótidos distintos. Cifra muy inferior a los 20 aminoácidos distintos que
existen.
Si cada dos nucleótidos codificarán un aminoácido, el número total
de dinucleótidos distintos que podríamos conseguir con los cuatro nucleótidos
diferentes (A, G, T y C) serían variaciones con repetición de cuatro elementos
tomados de dos en dos VR4,2 = 42 = 16. Por tanto,
tendríamos solamente 16 dinucleótidos diferentes, cifra inferior al número de
aminoácidos distintos que existen (20).
Si cada grupo de tres nucleótidos determina un aminoácido.
Teniendo en cuenta que existen cuatro nucleótidos diferentes (A, G, T y C), el
número de grupos de tres nucleótidos distintos que se pueden obtener son
variaciones con repetición de cuatro elementos (los cuatro nucleótidos) tomados
de tres en tres: VR4,3 = 43 = 64. Por consiguiente,
existe un total de 64 tripletes diferentes, cifra más que suficiente para
codificar los 20 aminoácidos distintos.
2.- El CÓDIGO GENÉTICO ES DEGENERADO
Como hemos dicho anteriormente existen 64 tripletes distintos y 20
aminoácidos diferentes, de manera que un aminoácido puede venir codificado por
más de un codón. Este tipo de código se denomina degenerado. Wittmann (1962)
induciendo sustituciones de bases por desaminación con nitritos, realizó
sustituciones de C por U y de A por G en el ARN del virus del mosaico del
tabaco (TMV), demostrando que la serina y la isoleucina estaban determinadas
por más de un triplete.
Las moléculas encargadas de transportar los aminoácidos hasta el
ribosoma y de reconocer los codones del ARN mensajero durante el proceso de
traducción son los ARN transferentes (ARN-t). Los ARN-t tienen una estructura
en forma de hoja de trébol con varios sitios funcionales:
1.- Extremo 3': lugar de unión al aminoácido (contiene siempre la
secuencia ACC).
2.-Lazo dihidrouracilo (DHU): lugar de unión a la aminoacil ARN-t
sintetasa o enzimas encargadas de unir una aminoácido a su correspondiente
ARN-t.
3.-Lazo de T ψ C: lugar de enlace al ribosoma.
4.-Lazo del anticodón: lugar de reconocimiento de los codones del
mensajero.
Normalmente el ARN-t adopta una estructura de hoja de trébol
plegada en forma de L o forma de boomerang.
Estructura
ARN transferente
Estructura
ARN transferente
Estructura ARN transferente
Los ARN-t suelen presentar bases nitrogenadas poco frecuentes como
son la pseudouridina (ψ), metilguanosina (mG), dimetilguanosina (m2G),
metilinosina (mI) y dihidrouridina (DHU, UH2).
El que realiza el reconocimiento del codón correspondiente del
ARN-m es el anticodón del ARN-t y no el aminoácido. Mediante un experimento se
demostró que era posible transformar el cisteinil-ARN-t mediante tratamiento
con hidruro de níquel en alanil-ARN-t. Este tratamiento convierte la cisteína
en alanina. De esta manera se consiguió un ARN-t específico de cisteína que en
lugar de llevar unida cisteína llevaba unida alanina. Cuando se empleo este
ARN-t híbrido para sintetizar proteínas se pudo comprobar que en el lugar en el
que debía aparecer cisteína en la secuencia del polipéptido aparecía alanina.
Por tanto, el que llevaba a cabo el reconocimiento del codón del ARN-m era el
anticodón del ARN-t y no el aminoácido.
La degeneración de l código se explica teniendo en cuenta dos
motivos:
1.-Algunos aminoácidos pueden ser transportados por distintas
especies moleculares (tipos) de ARN transferentes (ARN-t) que contienen distintos
anticodones.
2.-Algunas especies moleculares de ARN-t pueden incorporar su
aminoácido específico en respuesta a varios codones, de manera que poseen un
anticodón que es capaz de emparejarse con varios codones diferentes. Este
emparejamiento permisivo se denomina Flexibilidad de la 3ª base del
anticodón o tambaleo.
Flexibilidad de la 3º base del anticodón, tambaleo: La tercera base
del anticodón, la que ocupa la posición 5' no está especialmente confinada de
forma que en algunos casos puede emparejarse con distintas bases del codón. En
la siguiente gráfica se observa que cuando en la posición 5' del anticodón hay
una G, esta guanina puede emparejarse con un uracilo (U) de la posición 3' del
codón o con una citosina (C).
Flexibilidad de la tercera base del anticodón, tambaleo
En la siguiente
tabla se indican los emparejamientos codón-anticodón permitidos por la regla
del tambaleo:
En la siguiente
tabla se indican tres ARN-t de serina que pueden leer cada uno de ellos dos
codones diferentes en el ARN-m. Estos tres ARN-t se denominan isoaceptores
porque se unen (aceptan) al mismo aminoácido pero están codificados por genes
distintos.
Un nucleótido solamente forma parte de un triplete y, por
consiguiente, no forma parte de varios tripletes, lo que indica que el código
genético no presenta superposiciones. Por tanto, el código es no solapado.
Wittmann (1962) induciendo mutaciones con ácido nitroso en el ARN del virus del
mosaico del tabaco (TMV) pudo demostrar que las mutaciones habitualmente
producían un cambio en un solo aminoácido. El ácido nitroso produce desanimaciones
que provocan sustituciones de bases, si el código fuera solapado y un
nucleótido formará parte de dos o tres tripletes, la sustitución de un
nucleótido daría lugar a dos o tres aminoácidos alterados en la proteína de la
cápside del TMV.
Diferencias entre un código solapado y uno no
solapado
Código solapado: restricciones en la
secuencia de aminoácidos
Otra forma de
comprobar que el código es sin superposición es que no hay ninguna restricción
en la secuencia de aminoácidos de las proteínas, de manera, que un determinado
aminoácido puede ir precedido o seguido de cualquiera de los 20 aminoácidos que
existen. Si dos codones sucesivos compartieran dos nucleótidos, cualquier
triplete solamente podría ir precedido o seguido por cuatro codones
determinados. Por consiguiente, si el código fuera superpuesto, un aminoácido
determinado solamente podría ir precedido o seguido de otros cuatro aminoácidos
como mucho.
Teniendo en cuenta que la lectura se hace de tres en tres bases, a
partir de un punto de inicio la lectura se lleva a cabo sin interrupciones o
espacios vacíos, es decir, la lectura es seguida "sin comas".
De manera, que si añadimos un nucleótido (adición) a la secuencia, a partir de
ese punto se altera el cuadro de lectura y se modifican todos los aminoácidos.
Lo mismo sucede si se pierde (deleción) un nucleótido de la secuencia. A partir
del nucleótido seleccionado se altera el cuadro de lectura y cambian todos los
aminoácidos. Si la adición o la deleción es de tres nucleótidos o múltiplo de
tres, se añade un aminoácido o más de uno a la secuencia que sigue siendo la
misma a partir del la última adición o deleción. Una adición y una deleción
sucesivas vuelven a restaurar el cuadro de lectura.
En la siguiente tabla se da un ejemplo con una frase que contiene
solamente palabras de tres letras. A partir de la adición de una letra cambia
la pauta de lectura y el significado de la frase, lo mismo sucede cuando se
pierde una letra. Una adición y una deleción sucesivas recuperan el significado
de la frase. Una adición de tres letras añade una palabra pero después se
recupera la pauta de lectura y el sentido de la frase.
La asignación de un aminoácido a cada
triplete o el desciframiento de la clave genética, se llevó a cabo
fundamentalmente gracias al esfuerzo de tres grupos de investigación, el grupo
de M. W. Nirenberg, el grupo de S. Ochoa y el equipo de H. G. Khorana. Parece
lógico pensar que el desciframiento del código genético se debería haber
realizado comparando las secuencia de nucleótidos de un gen y la de aminoácidos
del polipéptido codificado por dicho gen. Sin embargo, en la época en la que se
realizaron estos trabajos no era posible todavía obtener la secuencia de los
ácidos nucleicos.
Severo Ochoa
|
Marshall W. Nirenberg
|
Har Gobind Khorana
|
La mayoría de los trabajos realizados
por estos tres grupos de investigación consistieron en sintetizar ARN
mensajeros (ARN-m) para utilizarlos posteriormente como mensajeros artificiales
en un sistema a celular de traducción "in vitro". Estos sistemas a
celulares de traducción "in vitro" procedían de la bacteria E.
coli y contenían todo lo necesario para llevar a cabo la traducción:
ribosomas, todos los ARN transferentes, aminoácidos, enzimas, etc. Sin embargo,
a estos sistemas a celulares se les quitaban los ARN mensajeros de E. coli
y se les añadía un ARN sintetizado artificialmente. En estos sistemas a
celulares se sintetizaba un polipéptido.
Posteriormente, se comparaba la
secuencia del ARN -m sintético utilizado en el experimento con la secuencia de
aminoácidos del polipéptido producido.
La puesta a punto de estas técnicas
requería poder sintetizar ARN-m de forma enzimática (grupo de Ochoa) o de
forma química (grupo de Khorana) y conseguir un sistema a celular estable para
sintetizar proteínas (grupo de Nirenberg).
En esencia, los grupos de investigación
anteriormente mencionados realizaron los siguientes tipos de experimentos:
1.- Utilización de
homopolímeros.
2.- Uso de
copolímeros.
3.- Empleo de
polímeros de secuencia conocida.
4.- Técnica de
incorporación de ARN transferente.
UTILIZACIÓN DE HOMOPOLÍMEROS
Un homopolímero es un ARN sintético que solamente contiene un tipo
de ribonucleótido. Por ejemplo, el ARN sintético UUUUUUUUUUUUU.......
Gruberg-Manago y Ochoa (1955) aislaron a partir de timo de ternera
un enzima denominada Polirribonucleótido fosforilasa que tenía la capacidad de
sintetizar ARN a partir de ribonucleótidos difosfato y sin necesidad de molde.
Este enzima iba tomando al azar los ribonuclkeñosidos del medio para originar
un ARN.
Matthei y Nirenberg (1961) consiguieron sintetizar polipéptidos
"in vitro" añadiendo un ARN sintético de secuencia conocida a un
sistema a celular estable de traducción. Usando la Polirribonucleótido
fosforilasa sintetizaron poli-uridílico (poli-U: UUUUUUUUUUUUUU...). Cuando
emplearon este ARN sintético en su sistema a celular de traducción daba lugar a
la formación de un polipéptido que solamente contenía el aminoácido
fenilalanina (Poli-fenilalanina: phe-phe-phe-phe-..). Por tanto, el triplete
UUU codificaba para fenilalanina (phe). También comprobaron que el ARN sintético
Poli C (Poli-citidílico: CCCCCCCCCC....) daba lugar a un polipéptido que
contenía solamente prolina (Poli-prolina: pro-pro-pro-pro-pro-...), por tanto,
el codón CCC significaba prolina (pro).
Poco tiempo después, Ochoa sintetizó Poli-adenílico (Poli-A:
AAAAAAAAA....) y observó que el polipéptido que aparecía solamente tenía el
aminoácido lisina (Poli-lisina: lys-lys-lys-lys-....). Por consiguiente el
triplete AAA codificaba para el aminoácido lisina (lys). También corroboró que
el Poli-C daba lugar a Poli-prolina. El ARN Poli-guanílico no producía proteína
alguna, probablemente debido a que adquiría una estructura terciaría helicoidal
que impedía su traducción a proteína.
USO DE COPOLÍMEROS
El siguiente paso fue la utilización de copolímeros, es decir, de
ARN sintéticos que contenían más de un más de un ribonucleótido distinto. Para
ello emplearon la Polirribonucleótido fosforilasa y pusieron en el medio dos ribonucleótidos
distintos. Por ejemplo, U y G, de manera que había 5 veces más U que G en el
medio (5U:1G). Debido a que el enzima toma los ribonucleótidos difosfato del
medio al azar, la probabilidad de que tome un U del medio es 5/6, mientras<
que la probabilidad de que tome una G es 1/6. El ARN sintético formado
presentaba una secuencia al azar de uracilos y guaninas y aparecían en él ocho
tripletes diferentes con las siguientes probabilidades:
Cuando se analizó el polipéptido que se sintetizaba con este
mensajero sintético, se observó que contenía fenilalanina (phe), cisteína
(cys), valina (val), glicina (gly) y triptófano (trp). Tomando como valor 100
el del aminoácido más frecuente, cys y val presentaban un valor de 20 mientras
que trp y gly mostraban un valor de 4 a 5. Se confirmaba que UUU significaba
fenilalanina y se deducía que 2U y 1G (UUG, UGU y GUU) codificaban para
cisteína y valina. También se deducía que 1U y 2G (UGG, GUG y GGU) codificaban
para triptófano y glicina. Sin embargo, no era posible asignar un triplete
concreto para cisteína y valina, o para triptófano y glicina. Parece raro, que
en estos experimentos no detectaran el aminoácido leucina (leu) que esta
codificado por el triplete UUG, tampoco dedujeron que el aminoácido valina
estaba codificado por 1U y 2 G (GUG). Uno e los problemas, de estos
experimentos radica en asignar el valor 100 al aminoácido más frecuente y comparar
las proporciones de aminoácidos obtenidas de esta manera con las de los
distintos tripletes del mensajero, ya que el aminoácido más frecuente puede
estar codificado por más de un triplete. Otro inconveniente es que los
mensajeros sintéticos producidos no presenten la frecuencia de codones esperada
por azar.
Este tipo de experimentos fueron realizados por los grupos de
Nirenberg y de Ochoa y no rindieron grandes resultados.
La siguiente forma de abordar el desciframiento de la clave
genética fue utilizar ARN mensajeros sintéticos de secuencia conocida obtenidos
por métodos de síntesis química o enzimática. Estos métodos fueron empleados
por Khorana y col. (1965).
Utilizando el Poli-UC de 116 residuos de longitud, ARN mensajero
sintético en el que se repite muchas veces seguidas el dinucleótido UC
(UCUCUCUCUCUCUC...) obtuvieron un polipéptido que contenía los residuos de
serina y leucina en secuencia alternada (ser-leu-ser-leu-ser-leu-ser-leu-....).
El Poli-UC contiene dos tripletes diferentes, UCU y CUC, por consiguiente uno
de ellos codifica serina y el otro leucina, pero no se puede determinar cuál a
cuál.
También se emplearon los mensajeros sintéticos Poli-AC, Poli-AG y
Poli-UG que codificaban para los siguientes aminoácidos:
En 1965,
Nishimura y colaboradores utilizaron el Poli-AAG, mensajero sintético en el que
se repite muchas veces seguidas el trinucleótido AAG (AAGAAGAAGAAGAAG...) y
encontraron la aparición de tres polipéptidos distintos en el sistema a celular
de traducción, detectaron Poli-lisina (lys-lys-lys-lys-...), Poli-arginina
(arg-arg-arg-arg-..) y Poli-glutamato (glu-glu-glu-glu-..). Estos resultados
además de confirmar que el código genético se compone de grupos de tres bases o
codones, indican que en los sistemas a celulares de traducción, la iniciación
de la traducción del mensajero puede realizarse por cualquier ribonucleótido.
Si comienza por la primea A, se repite AAG-AAG-AAG-.., si la traducción
comienza por la segunda A, se repite AGA-AGA-AGA-AGA-..., y si la traducción
comienza por la G, se repite el triplete GAA-GAA-GAA-GAA-GAA-....
El punto de iniciación de la lectura de los mensajeros sintéticos
en su sistema a celular de traducción "in vitro", en ausencia
de triplete de iniciación (AUG), puede ser cualquier ribonucleótido.
En el ejemplo de la figura, dependiendo del punto de iniciación
aparece un polipéptido distinto, cuando comienza por la primera A se sintetiza
Poli-lys, en la segunda A se produce Poli-arg y en cuando se inicia en la G
aparece Poli-glu.
Naturalmente, en
este experimento no se sabe cuál de los tres aminoácidos corresponde a cada uno
de los tres tripletes.
TÉCNICA DE INCORPORACIÓN DE ARN TRASNFERENTES
En esta técnica se utilizan ARN mensajeros sintéticos de secuencia
conocida con la siguiente estructura: los grupos de Khorana y Nirenberg
emplearon trinucleótidos, mientras que el equipo de Matthei utilizaba
oligonucleótidos del tipo ABCCCCCCCCCCC.... (el tercer nucleótido estaba
repetido 100 veces). En este último caso solamente se analiza en primer
triplete, ABC.
En todos los casos, en lugar de analizar los polipéptidos
sintetizados, se analiza la especificidad con que el ARN transferente (ARN-t)
con o sin su aminoácido correspondiente se incorpora al ribosoma. Dicha
especificidad viene determinada por la secuencia de ribonucleótidos del ARN-m
sintético empleado.
Para averiguar el ARN-t que es capaz de unirse en el ribosoma al
trinucleótido analizado, es necesario marcar radiactivamente uno de los ARN-t
de todos los utilizados. Se lleva a cabo esta operación marcando
radiactivamente cada vez un ARN-t distinto.
Con este sistema fue posible descifrar todos los tripletes que aún
no habían sido descifrados.
5.- El código genético es universal
El desciframiento del código genético se ha realizado
fundamentalmente en la bacteria E. coli, por tanto, cabe preguntarse si
el código genético de esta bacteria es igual que el de otros organismos tanto
procarióticos como eucarióticos. Los experimentos realizados hasta la fecha
indican que el código genético nuclear es universal, de manera que un
determinado triplete o codón lleva información para el mismo aminoácido en
diferentes especies. Hoy día existen muchos experimentos que demuestran la
universalidad del código nuclear, algunos de estos experimentos son:
1.- Utilización de ARN mensajeros en diferentes sistemas a
celulares. Por ejemplo ARN mensajero y ribosomas de reticulocitos de conejo con
ARN transferentes de E. coli. En este sistema se sintetiza un
polipéptido igual o muy semejante a la hemoglobina de conejo.
2.- Las técnicas de ingeniería genética que permiten introducir
ADN de un organismo en otro de manera que el organismo receptor sintetiza las
proteínas del organismo donante del ADN. Por ejemplo, la síntesis de proteínas
humanas en la bacteria E. coli.
El desciframiento del código genético dio como resultado la
siguiente asignación de aminoácidos a los 64 tripletes.
El código genético nos indica que aminoácido corresponde a cada triplete o codón del ARN mensajero.
3.- El triplete de iniciación suele ser AUG que
codifica para Formil-metionina. También pueden actuar como tripletes de
iniciación GUG (Val) y UGG (Leu) aunque con menor eficacia.
4.- Existen tres tripletes sin sentido o codones de terminación
(FIN) que no codifican para ningún aminoácido: UAA (ocre), UAG (ámbar) y UGA
(ópalo).
5.- La mayoría de los aminoácidos están determinados por más de un
triplete, excepto la metionina (AUG) y el triptófano (UGG) que son los únicos
que poseen un solo triplete.
6.- Cuando un aminoácido está codificado por varios tripletes
suele variar la tercera base, por ejemplo, la glicina es GGX, la alanina es
GCX, la valina es GUX, la treonina es ACX. Sin embargo, hay varias excepciones
en las que también puede variar la primera base, por ejemplo, la arginina es
AGPu y CGX, la leucina es CUX y UUPu y la serina es UCX y AGPi.
El código genético mitocondrial es la única excepción a la
universalidad del código, de manera que en algunos organismos los aminoácidos
determinados por el mismo triplete o codón son diferentes en el núcleo y en la
mitocondria.
No hay comentarios:
Publicar un comentario