Code génétique
Le code génétique permet au cours de la synthèse des protéines la correspondance entre les gènes et les protéines. Ce code est un véritable "dictionnaire cellulaire", qui permet aux ribosomes de traduire l'enchaînement des bases nucléotidiques en une séquence d'acides aminés.
On peut se représenter la séquence des bases de l'ADN comme la séquence des lettres d'un texte. La séquence prise en elle-même n'a aucun sens, si la personne qui lit ces lignes ne connaît pas le code particulier de la langue française. La même séquence de symboles serait incompréhensible pour un lecteur chinois (à moins qu'il n'ait appris le code).
En langage génétique, les mots ont tous la même longueur. Ce sont tous des triplets de nucléotides A, C, T (ou U) ou G. On les appelle codons. Il existe 43=64 combinaisons possibles de ces quatre lettres en triplets de trois. Trois codons sont généralement utilisés pour signifier la fin de la traduction. Aux 61 autres codons ne correspondent que 20 acides aminés. Le code génétique est donc "dégénéré" car en moyenne, un acide aminé est codé par trois codons (on appelle ces codons "codons synonymes"). Ainsi, en moyenne une mutation sur trois affectant une séquence d'ADN codante n'entraîne aucune modification de la protéine traduite.
Pour produire une protéine, l'ADN est traduit en ARN-messager (ARNm). Celui-ci est interprété par les ribosomes qui assemblent les acides aminés présents sur des ARN-transfert (ARNt). L'ARNt contient un "anti-codon", complémentaire d'un codon, et porte l'acide aminé correspondant au codon. Il y a donc 61 ARNt portant les acides aminés et 3 signifiant la fin du codage. Pendant la traduction, le ribosome (composé d'ARN-ribosomial) lit l'ARNm codon par codon, met en relation un codon de l'ARNm avec l'anti-codon d'un ARNt et ajoute l'acide aminé porté par celui-ci à la protéine en cours de synthèse.
L'ADN est caractérisé par les quatre bases suivantes : adénine (A), cytosine (C), guanine (G) et thymine (T). L'ARN substitue l'uracile (U) à la thymine, mais le mécanisme reste similaire : la base A est complémentaire de la base T (ou U pour l'ARN) et la base C de la base G . Un nucléoside est formé d'une base azotée couplée à un (désoxy)ribose. Un nucléotide est formé d'un nucléoside phosphorylé.
Le code génétique a 3 caractéristiques essentielles:
- il est dégénéré ;
- il est universel ;
- il n'est pas chevauchant.
| U
| C
| A
| G
| ||||||
| U
| UUU
UUC UUA UUG | UCU
UCC UCA UCG | sérine
| UAU
UAC UAA UAG | UGU
UGC UGA UGG | U | |||
| C | |||||||||
| leucine
| non-sens
| non-sens
| A | ||||||
| G | |||||||||
| C
| CUU | leucine
| CCU
CCC CCA CCG | proline
| CAU
CAC CAA CAG | histidine
| CGU
CGC CGA CGG | arginine
| U |
| C | |||||||||
| A | |||||||||
| glutamine
| G | ||||||||
| A
| AUU
AUC AUA AUG | isoleucine
| ACU
ACC ACA ACG | thréonine
| AAU
AAC AAA AAG | asparagine
| AGU
AGC AGA AGG | sérine
| U |
| C | |||||||||
| lysine
| arginine
| A | |||||||
| méthionine
| G | ||||||||
| G
| GUU
GUC GUA GUG | GCU
GCC GCA GCG | alanine
| GAU
GAC GAA GAG | acide aspartique
| GGU
GGC GGA GGG | U | ||
| C | |||||||||
| acide glumatique
| A | ||||||||
| G | |||||||||
Un ARNm et un gène se terminent toujours par un "codon non-sens" aussi appelé "codon-stop", il existe 3 codons-stop (UAG, UAA et UGA). Ceux-ci tiennent le rôle du point en bout de phrase.
| Table of contents |
|
|
L'universalité du code génétique
Principe de base
Ce système de codage entre l'ADN et les acides aminés s'est avéré être utilisé par l'immense majorité des être vivants. De l'homme à la bactérie, ce même code est utilisé. Cette universalité du code est expliquée en terme d'évolution : si le changement d'une base dans l'ADN peut entraîner des changements parfois bénéfiques dans l'être vivant, cela n'est que peu probable dans le cas d'un changement du codage. En effet, cela reviendrait à changer la position des touches d'une machine à écrire d'un dactylographe tapant à l'aveugle : le texte résultant sera fort probablement complètement illisible. Le système de codage est ainsi resté inchangé durant les milliards d'années d'évolution de la vie. On estime généralement qu'il s'est fixé ainsi très tôt dans l'histoire de la vie, probablement avant le dernier ancêtre commun à tous les êtres vivant (baptisé LUCA).Exceptions
Cette vision des choses est simpliste : si l'immense majorité des organismes vivants aujourd'hui utilisent le code génétique standard, les généticiens ont découverts quelques variantes à ce code. De plus, ces variantes se retrouvent dans les différentes lignées évolutives et consistent en des traductions différentes de quelques codons.
On pense donc aujourd'hui que la vie comptait à l'origine un nombre plus restreint d'acides aminés. Ces acides aminés ont été modifiés et ont vu leur nombres augmenter (par un phénomène similaire à la formation de la sélénocytéine et à la pyrrolysine qui dérivent de la sérine et de la lysine, respectivement, modifiées alors qu'elles sont sur leur ARN de transfert sur le ribosome.) Ces nouveaux acides aminés ont alors utilisés un sous-ensemble des ARN de transfert et leur codage associé. On remarque peut-être des traces de ce phénomène avec la glutamine, qui dans certaines bactéries, dérive du glutamate encore attaché à son ARN de transfert.