The Code génétique reference article from the French Wikipedia on 27-Jul-2004
(provided by Fixed Reference: snapshots of Wikipedia from wikipedia.org)

Code génétique

Watch videos on African life

Le code génétique permet au cours de la synthèse des protéines la correspondance entre les gènes et les protéines. Ce code est un véritable "dictionnaire cellulaire", qui permet aux ribosomes de traduire l'enchaînement des bases nucléotidiques en une séquence d'acides aminés.

On peut se représenter la séquence des bases de l'ADN comme la séquence des lettres d'un texte. La séquence prise en elle-même n'a aucun sens, si la personne qui lit ces lignes ne connaît pas le code particulier de la langue française. La même séquence de symboles serait incompréhensible pour un lecteur chinois (à moins qu'il n'ait appris le code).

En langage génétique, les mots ont tous la même longueur. Ce sont tous des triplets de nucléotides A, C, T (ou U) ou G. On les appelle codons. Il existe 43=64 combinaisons possibles de ces quatre lettres en triplets de trois. Trois codons sont généralement utilisés pour signifier la fin de la traduction. Aux 61 autres codons ne correspondent que 20 acides aminés. Le code génétique est donc "dégénéré" car en moyenne, un acide aminé est codé par trois codons (on appelle ces codons "codons synonymes"). Ainsi, en moyenne une mutation sur trois affectant une séquence d'ADN codante n'entraîne aucune modification de la protéine traduite.

Pour produire une protéine, l'ADN est traduit en ARN-messager (ARNm). Celui-ci est interprété par les ribosomes qui assemblent les acides aminés présents sur des ARN-transfert (ARNt). L'ARNt contient un "anti-codon", complémentaire d'un codon, et porte l'acide aminé correspondant au codon. Il y a donc 61 ARNt portant les acides aminés et 3 signifiant la fin du codage. Pendant la traduction, le ribosome (composé d'ARN-ribosomial) lit l'ARNm codon par codon, met en relation un codon de l'ARNm avec l'anti-codon d'un ARNt et ajoute l'acide aminé porté par celui-ci à la protéine en cours de synthèse.

L'ADN est caractérisé par les quatre bases suivantes : adénine (A), cytosine (C), guanine (G) et thymine (T). L'ARN substitue l'uracile (U) à la thymine, mais le mécanisme reste similaire : la base A est complémentaire de la base T (ou U pour l'ARN) et la base C de la base G . Un nucléoside est formé d'une base azotée couplée à un (désoxy)ribose. Un nucléotide est formé d'un nucléoside phosphorylé.

Le code génétique a 3 caractéristiques essentielles:

U
C
A
G
 
U
UUU
UUC
UUA
UUG
UCU
UCC
UCA
UCG
sérine
UAU
UAC
UAA
UAG
UGU
UGC
UGA
UGG
U
C
leucine
non-sens
non-sens
A
G
C

CUU
CUC
CUA
CUG

leucine
CCU
CCC
CCA
CCG
proline
CAU
CAC
CAA
CAG
histidine
CGU
CGC
CGA
CGG
arginine
U
C
A
glutamine
G
A
AUU
AUC
AUA
AUG
isoleucine
ACU
ACC
ACA
ACG
thréonine
AAU
AAC
AAA
AAG
asparagine
AGU
AGC
AGA
AGG
sérine
U
C
lysine
arginine
A
méthionine
G
G
GUU
GUC
GUA
GUG
GCU
GCC
GCA
GCG
alanine
GAU
GAC
GAA
GAG
acide aspartique
GGU
GGC
GGA
GGG
U
C
acide glumatique
A
G
Pour lire ce tableau, il faut savoir que la première colonne indique la première lettre du codon, la première rangée indique la seconde et la dernière colonne indique la dernière lettre du codon. Les colonnes colorées en jaune très claire indiquent la totalité du codon. À côté se trouve chaque fois l'acide aminé correspondant.

Un ARNm et un gène se terminent toujours par un "codon non-sens" aussi appelé "codon-stop", il existe 3 codons-stop (UAG, UAA et UGA). Ceux-ci tiennent le rôle du point en bout de phrase.

Table of contents
1 L'universalité du code génétique

L'universalité du code génétique

Principe de base

Ce système de codage entre l'ADN et les acides aminés s'est avéré être utilisé par l'immense majorité des être vivants. De l'homme à la bactérie, ce même code est utilisé. Cette universalité du code est expliquée en terme d'évolution : si le changement d'une base dans l'ADN peut entraîner des changements parfois bénéfiques dans l'être vivant, cela n'est que peu probable dans le cas d'un changement du codage. En effet, cela reviendrait à changer la position des touches d'une machine à écrire d'un dactylographe tapant à l'aveugle : le texte résultant sera fort probablement complètement illisible. Le système de codage est ainsi resté inchangé durant les milliards d'années d'évolution de la vie. On estime généralement qu'il s'est fixé ainsi très tôt dans l'histoire de la vie, probablement avant le dernier ancêtre commun à tous les êtres vivant (baptisé
LUCA).

Exceptions

Cette vision des choses est simpliste : si l'immense majorité des organismes vivants aujourd'hui utilisent le code génétique standard, les généticiens ont découverts quelques variantes à ce code. De plus, ces variantes se retrouvent dans les différentes lignées évolutives et consistent en des traductions différentes de quelques codons. On pense donc aujourd'hui que la vie comptait à l'origine un nombre plus restreint d'acides aminés. Ces acides aminés ont été modifiés et ont vu leur nombres augmenter (par un phénomène similaire à la formation de la sélénocytéine et à la pyrrolysine qui dérivent de la sérine et de la lysine, respectivement, modifiées alors qu'elles sont sur leur ARN de transfert sur le ribosome.) Ces nouveaux acides aminés ont alors utilisés un sous-ensemble des ARN de transfert et leur codage associé. On remarque peut-être des traces de ce phénomène avec la glutamine, qui dans certaines bactéries, dérive du glutamate encore attaché à son ARN de transfert.