Il dogma centrale della biologia afferma che le informazioni codificate nel DNA vengono trasferite all’RNA messaggero (mRNA), che poi dirige la sintesi delle proteine. L’insieme di istruzioni che consentono di decodificare la sequenza di nucleotidi mRNA in amminoacidi è chiamato codice genetico. La natura universale di questo codice genetico ha stimolato i progressi della ricerca scientifica, dell’agricoltura e della medicina.
All’inizio del 1900, gli scienziati hanno scoperto che il DNA memorizza tutte le informazioni necessarie per le funzioni cellulari e che le proteine svolgono la maggior parte di queste funzioni. Tuttavia, i meccanismi di conversione delle informazioni genetiche in proteine funzionali sono rimasti sconosciuti per molti anni. Inizialmente, si credeva che un singolo gene venisse convertito direttamente nella sua proteina codificata. Due scoperte cruciali nelle cellule eucariotiche hanno sfidato questa teoria: In primo luogo, la produzione di proteine non avviene nel nucleo. In secondo luogo, il DNA non è presente al di fuori del nucleo. Questi risultati hanno innescato la ricerca di una molecola intermedia che colleghi il DNA alla produzione di proteine. Questa molecola intermedia, che si trova sia nel nucleo che nel citoplasma, e associata alla produzione di proteine, è l’RNA.
Durante la trascrizione, l’RNA viene sintetizzato nel nucleo, usando il DNA come modello. L’RNA appena sintetizzato è simile in sequenza al filamento di DNA, tranne che la timinea nel DNA viene sostituita dall’uracile nell’RNA. Negli eucarioti, questa trascrizione primaria viene ulteriormente elaborata, rimuovendo le regioni non codificanti delle proteine, tappando l’estremità 5′ e aggiungendo una coda poli-A da 3′ per creare mRNA che viene poi esportata nel citoplasma.
La traduzione avviene nei ribosomi nel citoplasma, dove le informazioni codificate nell’mRNA vengono tradotte in una catena di amminoacidi. Un insieme di tre codici nucleotidi per un aminoacido e queste terzine sono chiamati codoni. L’insieme di regole che delineano quali codoni specificano un particolare aminoacido costituiscono il codice genetico.
Le proteine sono create da 20 aminoacidi negli eucarioti. La combinazione di quattro nucleotidi in gruppi di tre fornisce 64 (43)possibili codoni. Ciò significa che è possibile che l’amminoacido individuale possa essere codificato da più di un codone. Si dice che il codice genetico sia ridondante o degenerato. Spesso, ma non sempre, i codoni che specificano gli stessi aminoacidi differiscono solo nel terzo nucleotide della tripletta. Ad esempio, i codoni GUU, GUC, GUA e GUG rappresentano tutti la valina aminoacido. Tuttavia, AUG è l’unico codone che rappresenta la methionina aminoacido. Il codone AUG è anche il codone dove inizia la sintesi proteica ed è quindi chiamato il codone di inizio. La ridondanza nel sistema riduce al minimo gli effetti nocivi delle mutazioni. Una mutazione (cioè un cambiamento) nella terza posizione del codone potrebbe non necessariamente comportare un cambiamento dell’amminoacido.
Con poche eccezioni, la maggior parte degli organismi procariotici ed eucarioti utilizzalo per la sintesi proteica. Questa universalità del codice genetico ha permesso di progredire nella ricerca scientifica, nell’agricoltura e nella medicina. Per esempio, l’insulina umana può ora essere prodotta su larga scala nei batteri. Questo viene fatto utilizzando la tecnologia del DNA ricombinante. Il DNA ricombinante è costituito da materiale genetico di specie diverse. I geni che codificano l’insulina umana vengono uniti al DNA batterico e inseriti in una cellula batterica. La cellula batterica esegue la trascrizione e la traslazione per produrre l’insulina umana codificata nel DNA ricombinante. L’insulina umana risultante viene utilizzata per trattare il diabete.