Il flusso di informazioni genetiche nelle cellule dal DNA all’mRNA alle proteine è descritto dal dogma centrale, che afferma che i geni specificano la sequenza di mRNA, che a loro volta specificano la sequenza di amminoacidi che fanno parte di tutte le proteine. La decodifica di una molecola in un’altra viene eseguita da proteine e RNA specifiche. Poiché le informazioni memorizzate nel DNA sono così centrali nella funzione cellulare, ha un senso intuitivo che la cellula farebbe copie di mRNA di queste informazioni per la sintesi proteica mantenendo il DNA stesso intatto e protetto. La copia del DNA nell’RNA è relativamente semplice, con un nucleotide aggiunto al filamento di mRNA per ogni nucleotide letto nel filamento di DNA. La traduzione in proteina è un po ‘ più complessa perché tre nucleotidi di mRNA corrispondono a un amminoacido nella sequenza polipeptidica. Tuttavia, la traduzione in proteina è ancora sistematica e collineare, in modo che i nucleotidi da 1 a 3 corrispondano all’amminoacido 1, i nucleotidi da 4 a 6 corrispondano all’amminoacido 2, e così via.
Il codice genetico è degenerato e universale
Ogni amminoacido è definito da una sequenza a tre nucleotidi chiamata codone tripletta. Dato il diverso numero di “lettere” nell’mRNA e nelle proteine “alfabeti”, gli scienziati teorizzavano che i singoli amminoacidi devono essere rappresentati da combinazioni di nucleotidi. I doppietti nucleotidici non sarebbero sufficienti per specificare ogni amminoacido perché ci sono solo 16 possibili combinazioni a due nucleotidi (42). Al contrario, ci sono 64 possibili terzine nucleotidiche (43), che è molto più del numero di amminoacidi. Gli scienziati teorizzavano che gli amminoacidi erano codificati da terzine nucleotidiche e che il codice genetico era “degenerato”. In altre parole, un dato amminoacido potrebbe essere codificato da più di una tripletta nucleotidica. Questo fu successivamente confermato sperimentalmente: Francis Crick e Sydney Brenner usarono il mutageno chimico proflavin per inserire uno, due o tre nucleotidi nel gene di un virus. Quando sono stati inseriti uno o due nucleotidi, le proteine normali non sono state prodotte. Quando sono stati inseriti tre nucleotidi, la proteina è stata sintetizzata e funzionale. Ciò ha dimostrato che gli amminoacidi devono essere specificati da gruppi di tre nucleotidi. Queste terzine nucleotidiche sono chiamate codoni. L’inserimento di uno o due nucleotidi cambiò completamente il frame di lettura della tripletta, alterando così il messaggio per ogni amminoacido successivo. Sebbene l’inserimento di tre nucleotidi abbia causato l’inserimento di un amminoacido extra durante la traduzione, l’integrità del resto della proteina è stata mantenuta.
Oltre ai codoni che istruiscono l’aggiunta di uno specifico amminoacido a una catena polipeptifica, tre dei 64 codoni terminano la sintesi proteica e rilasciano il polipeptide dalla macchina di traduzione. Queste terzine sono chiamate codoni senza senso o codoni stop. Un altro codone, AUG, ha anche una funzione speciale. Oltre a specificare l’amminoacido metinina, serve anche come codone iniziale per iniziare la traduzione. Il fotogramma di lettura per la traduzione è impostato dal codone iniziale AUG vicino all’estremità 5 ‘ dell’mRNA. Dopo il codone iniziale, l’mRNA viene letto in gruppi di tre fino a quando non viene incontrato un codone di arresto.
La specifica di un singolo amminoacido da più codoni simili è chiamata “degenerazione”. Si ritiene che la degenerazione sia un meccanismo cellulare per ridurre l’impatto negativo delle mutazioni casuali. I codoni che specificano lo stesso amminoacido in genere differiscono solo per un nucleotide. Inoltre, gli amminoacidi con catene laterali chimicamente simili sono codificati da codoni simili. Ad esempio, aspartato (Asp) e glutammato (Glu), che occupano il blocco GA*, sono entrambi caricati negativamente. Questa sfumatura del codice genetico assicura che una mutazione di sostituzione a singolo nucleotide possa specificare lo stesso amminoacido ma non avere alcun effetto o specificare un amminoacido simile, impedendo che la proteina venga resa completamente non funzionale.
Il codice genetico è quasi universale. Con poche eccezioni minori, praticamente tutte le specie usano lo stesso codice genetico per la sintesi proteica. La conservazione dei codoni significa che un mRNA purificato che codifica per la proteina globina nei cavalli potrebbe essere trasferito in una cellula di tulipano, e il tulipano sintetizza la globina del cavallo. Che ci sia un solo codice genetico è una prova potente che tutta la vita sulla Terra condivide un’origine comune, soprattutto considerando che ci sono circa 1084 possibili combinazioni di 20 amminoacidi e 64 codoni tripletta.
Questo testo è stato adattato da Openstax, Biology 2e, Capitolo 15.1: Il Codice Genetico.