Acides nucléiques — ADN et ARN — Cours PASS complet 🧬

Nucléotides, double hélice, réplication, transcription, code génétique et traduction

Matière
Biochimie structurale et moléculaire — PASS / LAS
Chapitre
Acides nucléiques — ADN et ARN
Prérequis
Chimie organique (hétérocycles, liaisons H) ; glucides (ribose, désoxyribose)
Difficulté
⭐⭐ — Logique, mais beaucoup de noms et de mécanismes à connaître
Poids au concours
Élevé — fondation de la biologie moléculaire, la génétique et la pharmacologie
Les acides nucléiques — ADN (acide désoxyribonucléique) et ARN (acide ribonucléique) — sont les supports de l’information génétique. L’ADN stocke le programme génétique, l’ARN sert d’intermédiaire pour l’exprimer en protéines. Ce chapitre couvre la structure des nucléotides, la double hélice de l’ADN, la réplication, la transcription, le code génétique et la traduction — les mécanismes fondamentaux du dogme central de la biologie moléculaire : ADN → ARN → Protéine.

1. Composition des acides nucléiques 🧪

Les acides nucléiques sont des polymères de nucléotides reliés entre eux par des liaisons phosphodiester. Chaque nucléotide est composé de trois éléments :

1. Une base azotée : molécule hétérocyclique azotée, porteuse de l’information. Deux familles :

Bases puriques (2 cycles fusionnés) : adénine (A) et guanine (G). Présentes dans l’ADN et l’ARN.

Bases pyrimidiques (1 cycle) : cytosine (C), thymine (T) (ADN uniquement) et uracile (U) (ARN uniquement). La thymine est une 5-méthyluracile.

2. Un pentose : le β-D-2′-désoxyribose dans l’ADN (absence du OH en C2′) ou le β-D-ribose dans l’ARN (OH présent en C2′). Les carbones du sucre sont numérotés 1′ à 5′ pour les distinguer des carbones des bases.

3. Un groupement phosphate : acide phosphorique lié au C5′ du pentose par une liaison ester. Il confère la charge négative aux acides nucléiques (polyélectrolytes).

1.1 Nucléoside vs nucléotide

Un nucléoside = base + pentose (liaison N-glycosidique entre le N9 des purines ou le N1 des pyrimidines et le C1′ du pentose). Un nucléotide = nucléoside + phosphate(s). Exemples : adénosine (nucléoside) → AMP → ADP → ATP (nucléotides mono-, di-, triphosphates).

BaseNucléoside (ribose)Nucléoside (désoxyribose)Nucléotide (monophosphate)
AdénineAdénosineDésoxyadénosineAMP / dAMP
GuanineGuanosineDésoxyguanosineGMP / dGMP
CytosineCytidineDésoxycytidineCMP / dCMP
ThymineDésoxythymidine— / dTMP
UracileUridineUMP / —

1.2 Rôles des nucléotides au-delà des acides nucléiques

Les nucléotides ne servent pas uniquement de monomères des acides nucléiques. L’ATP est la monnaie énergétique universelle de la cellule. Le GTP est impliqué dans la signalisation (protéines G) et la traduction (facteurs d’élongation). Les nucléotides cycliques (AMPc, GMPc) sont des seconds messagers intracellulaires. Le NAD⁺, le FAD et le CoA sont des coenzymes dérivés de nucléotides. L’UDP-glucose est un intermédiaire activé de la glycogénogenèse.


2. Liaison phosphodiester et polarité 🔗

Les nucléotides sont reliés par des liaisons phosphodiester 3’→5′ : le groupement phosphate relie le C3′ d’un nucléotide au C5′ du suivant par deux liaisons ester. La troisième fonction acide du phosphate reste libre → charge négative à pH physiologique.

Cette liaison asymétrique confère une polarité au brin : il possède une extrémité 5′ (phosphate libre) et une extrémité 3′ (OH libre). Par convention, les séquences sont écrites dans le sens 5′ → 3′. La synthèse des acides nucléiques se fait toujours dans le sens 5′ → 3′ (ajout de nucléotides sur l’extrémité 3′-OH).


3. Structure de l’ADN 🧬

3.1 Règles de Chargaff

Erwin Chargaff (1950) a observé que dans tout ADN double brin : [A] = [T] et [C] = [G]. Le rapport (A+T)/(C+G) varie d’une espèce à l’autre mais est constant au sein d’une espèce. Ces règles impliquent un appariement spécifique des bases.

3.2 La double hélice de Watson et Crick (1953)

L’ADN est formé de deux brins antiparallèles (l’un orienté 5’→3′, l’autre 3’→5′) enroulés autour d’un axe commun en double hélice droite (forme B). Caractéristiques de l’ADN-B :

— Diamètre : ~20 Å (2 nm).

— Pas de l’hélice : 34 Å (3,4 nm) = 10 paires de bases (pb) par tour.

— Distance entre deux pb : 3,4 Å.

— Deux sillons : le grand sillon (majeur) et le petit sillon (mineur), où se fixent les protéines régulatrices.

3.3 Appariement des bases (liaisons hydrogène)

Les bases s’apparient de manière complémentaire et antiparallèle :

A = T : 2 liaisons hydrogène.

G ≡ C : 3 liaisons hydrogène → appariement plus fort.

L’appariement A-T/G-C (complémentarité de Watson-Crick) est la base chimique de la réplication fidèle de l’ADN et de la transcription. Les bases sont empilées à l’intérieur de l’hélice (interactions d’empilement = stacking) tandis que le squelette sucre-phosphate est à l’extérieur.

ADN-A, ADN-B, ADN-Z : l’ADN-B est la forme physiologique standard. L’ADN-A (plus compact, 11 pb/tour) se forme en conditions de déshydratation et est la structure des duplex ARN-ADN et ARN-ARN. L’ADN-Z est une hélice gauche qui se forme dans les régions riches en alternances CG et pourrait jouer un rôle régulateur.

4. Propriétés physico-chimiques de l’ADN 🔬

4.1 Absorption UV

Les bases azotées absorbent dans l’UV à 260 nm. La concentration d’ADN se dose par spectrophotométrie à 260 nm. Le rapport A260/A280 évalue la pureté : ~1,8 pour un ADN pur (contamination protéique si < 1,8).

4.2 Dénaturation et Tm

La dénaturation de l’ADN est la séparation des deux brins (passage de double brin à simple brin) par chauffage, pH extrême ou agents dénaturants (urée, formamide). La dénaturation thermique est caractérisée par la température de fusion (Tm) : température à laquelle 50 % de l’ADN est dénaturé.

Le Tm augmente avec la teneur en G+C (3 liaisons H par paire G-C contre 2 pour A-T) et avec la longueur de la molécule. Formule empirique : Tm ≈ 69,3 + 0,41 × (%GC) (pour de l’ADN en conditions standard).

La dénaturation s’accompagne d’une augmentation de l’absorbance à 260 nm (effet hyperchrome) car les bases non empilées absorbent davantage. La renaturation (réhybridation) est possible si le refroidissement est lent → les brins complémentaires se réapparient.

4.3 Hybridation

L’hybridation est l’appariement de deux brins complémentaires (ADN-ADN, ADN-ARN ou ARN-ARN). C’est le principe de base de nombreuses techniques de biologie moléculaire : Southern blot (ADN), Northern blot (ARN), PCR, puces à ADN, FISH.


5. Réplication de l’ADN 🔄

5.1 Principe

La réplication est la duplication fidèle de l’ADN avant la division cellulaire. Elle est semi-conservative (Meselson et Stahl, 1958) : chaque molécule fille contient un brin parental et un brin néosynthétisé.

5.2 Mécanisme (chez E. coli comme modèle)

Initiation : ouverture de la double hélice au niveau de l’origine de réplication (oriC) par l’hélicase. Les protéines SSB (Single Strand Binding) stabilisent les brins séparés. La topoisomérase (gyrase) relâche les super-enroulements en amont.

Amorçage : la primase synthétise une courte amorce d’ARN (~10 nt) complémentaire du brin matrice. L’ADN polymérase ne peut pas initier de novo — elle a besoin d’une extrémité 3′-OH libre pour ajouter des nucléotides.

Élongation : l’ADN polymérase III (procaryotes) synthétise le nouveau brin dans le sens 5′ → 3′, en lisant le brin matrice dans le sens 3′ → 5′. Elle ajoute des dNTP (désoxynucléotides triphosphates) par complémentarité de bases, avec hydrolyse du pyrophosphate (PPi).

Puisque les deux brins sont antiparallèles, la réplication est asymétrique :

— Le brin avancé (leading strand) est synthétisé en continu dans le même sens que l’avancée de la fourche.

— Le brin retardé (lagging strand) est synthétisé de manière discontinue en fragments courts appelés fragments d’Okazaki (~1000 nt chez les procaryotes, ~200 nt chez les eucaryotes), chacun précédé d’une amorce d’ARN.

Maturation : les amorces d’ARN sont retirées (RNase H et ADN pol I), les lacunes sont comblées par l’ADN pol I, et les fragments sont ligaturés par la ligase.

Fidélité : l’ADN pol III possède une activité exonucléase 3′ → 5′ (relecture = proofreading) qui corrige les erreurs d’appariement. Le taux d’erreur final est d’environ 10⁻⁹ à 10⁻¹⁰ par nucléotide par réplication.

Piège QCM : l’ADN polymérase synthétise toujours dans le sens 5′ → 3′ et lit la matrice dans le sens 3′ → 5′. Elle ne peut pas synthétiser dans le sens 3′ → 5′. C’est cette contrainte qui impose la synthèse discontinue du brin retardé.

6. Les différents types d’ARN 📋

L’ARN est généralement simple brin (monocaténaire) mais peut former des structures secondaires locales (tiges-boucles, épingles à cheveux) par appariement intramoléculaire de régions complémentaires.

Type d’ARNTailleFonction% ARN cellulaire
ARNm (messager)Variable (centaines à milliers de nt)Copie du gène, lu par le ribosome → synthèse protéique~5 %
ARNt (transfert)73–93 ntApporte l’AA correspondant au codon (anticodon)~15 %
ARNr (ribosomal)~120 à ~4700 ntComposant structural et catalytique du ribosome~80 %

D’autres ARN non codants existent : snARN (small nuclear, épissage), snoARN (small nucleolar, modification des ARNr), miARN (micro-ARN, régulation post-transcriptionnelle), siARN (small interfering, interférence ARN), lncARN (long non-coding, régulation de l’expression génique).

6.1 Structure de l’ARNt

L’ARNt a une structure en feuille de trèfle (structure secondaire) qui se replie en L (structure tertiaire). Il porte un anticodon (triplet de bases complémentaire du codon de l’ARNm) et l’acide aminé correspondant fixé à son extrémité 3′ (séquence CCA universelle). La fixation de l’AA est catalysée par l’aminoacyl-ARNt synthétase (une enzyme spécifique par AA).


7. Transcription (ADN → ARN) 📝

La transcription est la synthèse d’un ARN complémentaire d’un brin d’ADN (le brin matrice ou brin antisens, lu en 3′ → 5′). L’ARN est synthétisé dans le sens 5′ → 3′ par l’ARN polymérase.

7.1 Chez les procaryotes

Une seule ARN polymérase synthétise les trois types d’ARN. L’initiation se fait au promoteur (séquence −10 = boîte de Pribnow : TATAAT, séquence −35). Le facteur sigma (σ) reconnaît le promoteur, puis se détache après l’initiation. L’élongation utilise les NTP (ribonucléotides triphosphates : ATP, GTP, CTP, UTP). La terminaison se fait par un terminateur (séquence palindromique → tige-boucle dans l’ARN, parfois avec aide du facteur Rho).

7.2 Chez les eucaryotes

Trois ARN polymérases : ARN pol I (ARNr 28S, 18S, 5,8S), ARN pol II (ARNm, snARN, miARN), ARN pol III (ARNt, ARNr 5S, snARN U6). L’initiation nécessite des facteurs généraux de transcription (TFIIA, TFIIB, TFIID avec TBP qui reconnaît la boîte TATA, etc.) qui forment le complexe de préinitiation avec l’ARN pol II sur le promoteur.


8. Maturation des ARN eucaryotes 🔧

L’ARN prémessager (pré-ARNm) subit trois modifications majeures avant son export vers le cytoplasme :

Coiffe 5′ (capping) : ajout d’un résidu 7-méthylguanosine triphosphate (m⁷GpppN) à l’extrémité 5′. Protège l’ARNm contre les exonucléases, facilite la fixation du ribosome.

Polyadénylation 3′ : ajout d’une queue de 100-250 résidus adényliques (queue poly-A) à l’extrémité 3′. Protège contre la dégradation, facilite l’export nucléaire et la traduction. La longueur de la queue poly-A diminue avec le temps → détermine la durée de vie de l’ARNm.

Épissage (splicing) : excision des introns (séquences non codantes) et ligation des exons (séquences codantes) par le spliceosome (complexe de snRNP). L’épissage alternatif permet de produire plusieurs protéines différentes à partir d’un même gène en combinant différemment les exons.

Introns et exons : chez les eucaryotes, les gènes sont morcelés (introns + exons). Chez les procaryotes, les gènes sont généralement continus (pas d’introns). C’est une différence fondamentale entre procaryotes et eucaryotes.

9. Le code génétique 🔑

Le code génétique est la correspondance entre les codons (triplets de nucléotides sur l’ARNm) et les acides aminés. Propriétés :

Universel : le même code est utilisé par presque tous les organismes (quelques exceptions : mitochondries, certains protistes).

Dégénéré (redondant) : 64 codons codent pour 20 AA + 3 codons stop → plusieurs codons codent le même AA (synonymie). La dégénérescence concerne surtout la 3e position du codon (position wobble).

Non ambigu : chaque codon code pour un seul et unique AA.

Non chevauchant : les codons sont lus séquentiellement sans chevauchement.

Sans ponctuation : il n’y a pas de séparateur entre les codons (le cadre de lecture est déterminé par le codon d’initiation AUG).

Codons spéciaux : AUG = codon d’initiation (code la méthionine, Met) et UAA, UAG, UGA = codons stop (ne codent aucun AA → terminaison de la traduction).


10. Traduction (ARN → Protéine) 🏭

La traduction est la synthèse d’une chaîne polypeptidique à partir de l’information portée par l’ARNm, réalisée par les ribosomes dans le cytoplasme.

10.1 Le ribosome

Le ribosome est un complexe ribonucléoprotéique composé de deux sous-unités : petite sous-unité (30S chez les procaryotes / 40S chez les eucaryotes) et grande sous-unité (50S / 60S). Le ribosome assemblé fait 70S (procaryotes) ou 80S (eucaryotes). Il possède trois sites de liaison pour les ARNt : site A (aminoacyl, entrée du nouvel ARNt), site P (peptidyl, ARNt portant la chaîne peptidique en cours) et site E (exit, sortie de l’ARNt déchargé).

10.2 Étapes de la traduction

Initiation : la petite sous-unité se fixe sur l’ARNm au codon AUG (aidée par les facteurs d’initiation IF/eIF et la séquence de Shine-Dalgarno chez les procaryotes ou la coiffe 5′ chez les eucaryotes). L’ARNt initiateur (Met-ARNtᵢ) se fixe au codon AUG dans le site P. La grande sous-unité rejoint le complexe.

Élongation : cycle répétitif en 3 étapes : (1) un aminoacyl-ARNt entre dans le site A (guidé par le codon, avec vérification de la complémentarité anticodon-codon), (2) la peptidyl-transférase (activité catalytique de l’ARNr = ribozyme) forme la liaison peptidique entre l’AA du site A et la chaîne du site P, (3) la translocation déplace le ribosome d’un codon vers le 3′ (site A → site P, site P → site E). Le cycle se répète pour chaque codon.

Terminaison : lorsque le ribosome atteint un codon stop (UAA, UAG, UGA), aucun ARNt ne peut se fixer. Un facteur de libération (RF) entre dans le site A, hydrolyse la liaison entre la chaîne peptidique et le dernier ARNt → libération de la protéine. Le ribosome se dissocie en sous-unités.

Dogme central : ADN → (réplication) → ADN → (transcription) → ARN → (traduction) → Protéine. Exceptions : transcription inverse (rétrovirus : ARN → ADN par la transcriptase inverse), réplication de l’ARN (certains virus à ARN).

10.3 Mutations et conséquences

Une mutation est un changement dans la séquence nucléotidique de l’ADN. Les principaux types de mutations ponctuelles :

Mutation silencieuse : le nouveau codon code le même AA (grâce à la dégénérescence du code). Pas de conséquence sur la protéine.

Mutation faux-sens (missense) : le nouveau codon code un AA différent. La gravité dépend de la nature du changement (conservatif si les propriétés chimiques de l’AA sont similaires, non conservatif sinon). Exemple : drépanocytose (Glu → Val en position 6 de la β-globine).

Mutation non-sens (nonsense) : le nouveau codon est un codon stop → protéine tronquée, généralement non fonctionnelle.

Mutation par décalage du cadre de lecture (frameshift) : insertion ou délétion d’un ou deux nucléotides → décalage de tous les codons en aval → protéine totalement altérée.

10.4 Réparation de l’ADN

Les cellules disposent de plusieurs systèmes pour corriger les lésions de l’ADN et maintenir l’intégrité du génome :

Réparation par excision de base (BER) : une ADN glycosylase reconnaît et excise la base endommagée, créant un site apurinique/apyrimidique (AP). Une endonucléase coupe le squelette, l’ADN pol comble la lacune, la ligase referme.

Réparation par excision de nucléotide (NER) : excision d’un oligonucléotide (~12-24 nt chez les procaryotes, ~24-32 nt chez les eucaryotes) contenant la lésion, puis resynthèse et ligation. C’est le système qui répare les dimères de thymine causés par les UV. Un déficit en NER cause le xeroderma pigmentosum (hypersensibilité aux UV, cancers cutanés).

Réparation des mésappariements (MMR, mismatch repair) : correction des erreurs d’appariement qui ont échappé à la relecture de l’ADN pol. Chez E. coli, le système MutS/MutL/MutH identifie le brin néosynthétisé (non méthylé) et corrige l’erreur. Un déficit en MMR chez l’humain (gènes MLH1, MSH2) prédispose au syndrome de Lynch (cancer colorectal héréditaire).


Exercices d’application ✏️

Exercice 1 — Chargaff et composition en bases

Un ADN double brin contient 30 % d’adénine. Calculer les pourcentages de T, G et C. Quel est le rapport (A+T)/(G+C) ?

Voir la correction

Règles de Chargaff : [A] = [T] et [G] = [C]. [A] = 30 % → [T] = 30 %.

[A] + [T] + [G] + [C] = 100 % → 30 + 30 + [G] + [C] = 100 → [G] + [C] = 40 % → [G] = [C] = 20 %.

Rapport (A+T)/(G+C) = 60/40 = 1,5.

Cet ADN est riche en A-T → Tm relativement bas (moins de liaisons H par paire de bases en moyenne).

Exercice 2 — Brin matrice et ARNm

Un brin codant d’ADN a la séquence 5′-ATGCCTGAA-3′. Donner la séquence du brin matrice, de l’ARNm et de la protéine correspondante.

Voir la correction

Brin matrice (complémentaire antiparallèle) : 3′-TACGGACTT-5′.

ARNm (complémentaire du brin matrice, même séquence que le brin codant avec U au lieu de T) : 5′-AUGCCUGAA-3′.

Décodage : AUG = Met, CCU = Pro, GAA = Glu.

Protéine : Met-Pro-Glu (tripeptide).

Exercice 3 — Réplication

Pourquoi la synthèse du brin retardé est-elle discontinue ? Quelle enzyme synthétise les amorces ? Quelle enzyme joint les fragments d’Okazaki ?

Voir la correction

La synthèse est discontinue car l’ADN polymérase ne peut synthétiser que dans le sens 5′ → 3′. Sur le brin retardé, le brin matrice est orienté 5′ → 3′ dans le sens de la fourche → la pol doit travailler dans le sens opposé à l’avancée de la fourche. Elle synthétise donc par petits fragments dans le sens 5′ → 3′, puis recommence plus en amont.

Les amorces sont synthétisées par la primase (ARN polymérase spécialisée). Les fragments d’Okazaki sont joints par la ligase (après retrait des amorces par la RNase H et comblement par l’ADN pol I).

Exercice 4 — Code génétique

La séquence ARNm 5′-AUGGCUUAUUGA-3′ code pour quel peptide ? Une mutation ponctuelle change le 7e nucléotide (U → C). Quel est le nouveau peptide ? De quel type de mutation s’agit-il ?

Voir la correction

Séquence originale : AUG-GCU-UAU-UGA → Met-Ala-Tyr-STOP. Tripeptide : Met-Ala-Tyr.

Mutation U→C en position 7 : AUG-GCU-CAU-UGA → Met-Ala-His-STOP. Nouveau tripeptide : Met-Ala-His.

UAU (Tyr) → CAU (His) : c’est une mutation faux-sens (missense) — le codon code pour un AA différent. La protéine est modifiée. Les conséquences biologiques dépendent de l’importance du résidu Tyr dans la fonction de la protéine.


Questions fréquentes ❓

Quelle est la différence entre ADN et ARN ?

Trois différences chimiques principales : (1) le sucre est le désoxyribose dans l’ADN (pas de OH en C2′) et le ribose dans l’ARN (OH en C2′), (2) la thymine (T) de l’ADN est remplacée par l’uracile (U) dans l’ARN, (3) l’ADN est généralement double brin (bicaténaire) tandis que l’ARN est généralement simple brin (monocaténaire). L’OH en C2′ du ribose rend l’ARN plus sensible à l’hydrolyse alcaline que l’ADN.

Pourquoi la réplication est-elle semi-conservative ?

Chaque molécule d’ADN fille contient un brin parental (conservé) et un brin nouvellement synthétisé. C’est le mécanisme le plus logique chimiquement : les deux brins parentaux servent chacun de matrice pour la synthèse du brin complémentaire. Meselson et Stahl l’ont démontré en 1958 par centrifugation en gradient de densité avec du ¹⁵N (azote lourd).

Qu’est-ce que l’épissage alternatif ?

L’épissage alternatif est un mécanisme par lequel un même pré-ARNm peut être épissé de différentes manières, incluant ou excluant certains exons. Cela produit plusieurs ARNm matures différents à partir d’un seul gène → plusieurs protéines différentes (isoformes). C’est un mécanisme majeur de diversité protéique chez les eucaryotes : le génome humain contient ~20 000 gènes mais produit plus de 100 000 protéines différentes, en grande partie grâce à l’épissage alternatif.

Pourquoi le code génétique est-il dit « dégénéré » ?

Avec 4 bases et des codons de 3 bases, il existe 4³ = 64 codons possibles, mais seulement 20 acides aminés + 3 codons stop. Plusieurs codons codent donc le même AA : c’est la dégénérescence (ou redondance). Par exemple, la leucine est codée par 6 codons différents (UUA, UUG, CUU, CUC, CUA, CUG). La dégénérescence concerne surtout la 3e position du codon (position wobble), ce qui permet une tolérance aux mutations silencieuses.

Qu’est-ce qu’un ribozyme ?

Un ribozyme est un ARN doué d’activité catalytique. L’exemple le plus important est la peptidyl-transférase du ribosome : c’est l’ARNr 23S (procaryotes) ou 28S (eucaryotes) qui catalyse la formation de la liaison peptidique, pas une protéine. Le ribosome est donc un ribozyme. D’autres exemples incluent les introns auto-épissants et la RNase P. L’existence des ribozymes soutient l’hypothèse du « monde à ARN » : dans les origines de la vie, l’ARN aurait pu servir à la fois de support d’information et de catalyseur, avant l’apparition des protéines.