L’acido ribonucleico, o RNA, è assieme al DNA una delle molecole che ha rivestito in passato, e conserva oggi, il ruolo di polimero essenziale per la vita. Viene qui presentata una breve rassegna delle sue caratteristiche e dei tipi di RNA che si possono ritrovare in natura.
IN BREVE
Indice
STRUTTURA
La struttura chimica delle catene polinucleotidiche presenta numerose peculiarità ed una organizzazione che ha permesso loro, fin dalla prima comparsa nel contesto biotico, di assumere il ruolo di molecola informazionale in virtù delle numerose combinazioni della sequenza di basi azotate.
Composizione chimica
L’RNA, noto anche come acido ribonucleico (o “Ribonucleic acid”) è costituito, come il DNA, da catene polinucleotidiche, cioè polimeri lineari le cui unità monomeriche sono costituite da nucleotidi. Ogni nucleotide è costituito da tre componenti fondamentali: uno zucchero a 5 atomi di carbonio (pentoso), un gruppo fosfato e una base azotata. Nel caso dell’RNA lo zucchero è rappresentato dal ribosio, appartenente alla serie sterica della D-gliceraldeide e 2′ sostituito con un gruppo OH (gruppo idrossile o alcolico) a differenza del desossiribosio (lo zucchero presente nel DNA) nel quale il carbonio al 2′ dello zucchero è legato ad un semplice atomo di idrogeno. La numerazione degli atomi di carbonio dello zucchero negli acidi nucleici non è casuale: questi infatti vengono contrassegnati con ” ‘ ” per distinguerli dagli atomi di C della base azotata. La presenza del gruppo alcolico in posizione 2’ conferisce una maggiore instabilità alla molecola di RNA rispetto al DNA, caratteristica che ha sicuramente contribuito all’elezione, da parte della selezione naturale, dell’acido desossiribonucleico a molecola trasportatrice dell’informazione genetica.
Si distinguono due classi di base azotate negli acidi nucleici: le purine, strutture a doppio anello eterociclico (cioè che presentano atomi diversi dal carbonio nel ciclo) formato da 9 atomi, e le pirimidine a singolo anello eterociclico formato da 6 atomi. Le specifiche basi che si ritrovano negli acidi nucleici naturali sono due purine, Adenina (A) e Guanina (G), presenti sia nel DNA che nell’RNA, e tre tipi di pirimidine, Citosina (C), Timina (T) e Uracile (U), di cui la citosina è comune nei due acidi mentre l’Uracile sostituisce la Timina nel DNA. È curioso notare che la differenza tra Uracile e Timina sembra apparentemente insignificante, poiché consiste in un gruppo metilico (-CH₃) legato al 5′ della Timina, assente nell’Uracile, ma influisce consistentemente sulle caratteristiche generali della molecola di RNA. Quando una delle suddette basi lega il carbonio 1′ di uno zucchero si generano i nucleosidi, ai quali possono essere legati al 5′ uno, due o tre gruppi fosfato (detti fosfati alfa, beta e gamma). Quest’ultimi sono molto importanti per la sintesi delle catene poliribonucleotidiche, perché la scissione di questi legami rilascia una notevole quantità di energia, che viene poi impiegata nella polimerizzazione dei substrati nucleotidici.
Struttura primaria, secondaria e terziaria
I nucleotidi sono le unità base fondamentali delle catene polinucleotidiche di RNA (o DNA) e si organizzano in una struttura primaria costituita da uno scheletro, dato dall’alternanza di ribosio e gruppi fosfato, e dalle basi, sporgenti lateralmente da questo scheletro. Ciascuna base è legata al ribosio tramite un legame glicosidico che interessa il carbonio 1′ dello zucchero e l’N1 o l’N9 delle pirimidine e delle purine rispettivamente. Ciascun gruppo fosfato forma un legame esterico con il carbonio 5′ di uno zucchero e un secondo legame esterico con il 3′ dello zucchero successivo. Questo particolare legame, detto fosfodiesterico, conferisce una polarità all’estremità del polinucleotide: da una parte avremo un nucleotide che presenta l’estremità 5′ libera, mentre il carbonio 3′ è impegnato in un legame fosfodiesterico con il nucleotide adiacente; dall’altra parte il polimero terminerà con un nucleotide avente il 5′ impegnato in un legame fosfodiestrico, mentre il 3′ sarà libero, cioè non impegnato in legami fosfodiesterici. Per evitare confusioni, va sottolineato che la valenza delle estremità è comunque impegnata da gruppi alcolici o gruppi fosfato impegnati in un solo legame esterico. Come vedremo, questa polarità 5′-3′ delle catene polinucleotidiche, sia RNA che DNA, sarà molto importante in tutte le reazioni di sintesi e replicazione.
La struttura secondaria di un acido nucleico prevede un più elevato livello di organizzazione, perché si basa sul sistema di complementarietà delle basi; Watson e Crick si basarono, per la formulazione del loro modello della doppia elica di DNA, su studi sulla diffrazione dei raggi X condotti da Rosalind Franklin e Maurice H.F. Wilkins, rilevando alcune caratteristiche salienti: le coppie di basi sono disposte quasi perpendicolarmente rispetto all’asse della doppia elica, come a formare dei gradini di una scala a chiocciola; le basi che si affacciano da ciascuna coppia sono sempre una pirimidina e una purina: la A si appaia sempre con la T (U nell’RNA) tramite 2 legami a idrogeno e la G con la C tramite 3 legami a idrogeno, fatto che giustifica l’isodiametricità della doppia elica; le due catene polinucleotidiche sono antiparallele, cioè disposte con una polarità opposta 5′-3′ l’una rispetto all’altra. Quest’ultima caratteristica giustifica di conseguenza la generazione di un solco maggiore ed un solco minore sulla superficie del duplex (struttura secondaria ad elica tra due polinucleotidi), e espone la molecola al riconoscimento da parte di fattori proteici tramite legami a idrogeno. I due scienziati notarono anche una periodicità nell’avvolgimento dell’elica, che tuttavia risente dell’umidità circostante, determinando la sua organizzazione in strutture alternative (A, B e Z nel DNA) aventi periodicità e direzioni di avvolgimento differenti.
La struttura molecolare dell’RNA è simile a quella del DNA, sebbene la maggior parte degli RNA funzionali sono molecole a elica singola. Tuttavia, tali molecole non sono rigide e lineari, ma si ripiegano spesso su loro stesse, formando diversi tipi di strutture secondarie tra cui: tradizionali associazioni di singole eliche a formare una doppia elica (dsRNA); strutture a “stem–loop” o “stelo ed ansa”, costituite da brevi tratti in cui le basi risultano appaiate che terminano con anse prive di complementarietà tra le basi (struttura, come vedremo, presente nei RNA transfer, ma anche nei terminatori Rho-indipendenti); strutture a “pseudoknot” che consistono in vari riarrangiamenti spaziali di due o più stem-loop in una stessa molecola.
Virtualmente sono possibili infinite organizzazioni spaziali (e quindi tridimensionali) del polinucleotide a formare una complessa struttura terziaria data dall’alternanza di diverse strutture secondarie e dalla possibilità del gruppo 2′-OH del ribosio di reagire con gruppi fosfato di altri nucleotidi per generare dei “ponti” intramolecolari. In pratica, ciò non è realizzabile, in quanto esistono precisi limiti termodinamici alle diverse conformazioni (secondarie e terziarie) che la molecola di RNA può assumere. Tali vincoli vengono sfruttati da software (ormai numerosi) che predicono, in base alla struttura primaria, la tendenza della molecola ad assumere una particolare struttura di ordine superiore (in particolare, i software fanno affidamento ad algoritmi di programmazione dinamica che individuano la forma a più bassa energia secondo il modello termodinamico del “nearest neighbour”).
SINTESI
Il processo di sintesi della molecola di RNA presenta, nelle sue caratteristiche generali, un meccanismo simile a quello del DNA ma, poiché si avvale di enzimi specifici il cui substrato presenta una dinamicità, dal punto di vista molecolare, differente, se ne discosta per diverse ragioni.
Trascrizione
Le basi chimiche della reazione di sintesi dell’RNA sono simili a quelle usate dalla cellula per la replicazione del genoma: singoli ribonucleosidi trifosfato vengono prelevati dal pool intranucleare e incorporati sotto forma di ribonucleosidi monofosfato al 3′ della catena di RNA in fase di allungamento mentre questa è appaiata ad un filamento stampo di DNA. Permangono le regole di appaiamento tipiche degli acidi nucleici (Watson and Crick base-pairing), sebbene per l’RNA queste non siano sempre rispettate per l’inserimento di nucleotidi non canonici nella catena di neosintesi. Ad ogni evento di incorporazione, i fosfati beta e gamma del ribonucleoside trifosfato vengono rilasciati sotto forma di pirofosfato, mentre il fosfato in alfa partecipa alla formazione del legame fosfodiesterico reagendo con il 3′-OH del nucleotide precedentemente incorporato. Il processo di trascrizione è generalmente suddiviso in tre fasi, sottoposte a fine regolazione: inizio, allungamento e terminazione. La trascrizione ha inizio quando l’enzima RNA polimerasi, le cui modalità di reclutamento a livello della sequenza di DNA da trascrivere differiscono in eucarioti e procarioti, riconosce specifiche sequenze consenso nelle vicinanze del gene bersaglio e avvia il processo di sintesi dell’RNA, utilizzando una sola delle due eliche come stampo. La regione di DNA che viene specificamente riconosciuta dalla RNA polimerasi e da proteine accessorie per attivare la trascrizione di un gene è denominata promotore ed è implicata nella prima delle tre fasi della trascrizione, l’inizio. In questa fase, dopo il legame dell’enzima al promotore, la doppia elica del DNA deve essere denaturata a livello della regione riconosciuta, in modo da esporre il filamento di DNA stampo da utilizzare per la sintesi del trascritto. Una volta che l’RNA polimerasi è riuscita con successo a innescare il processo, inizia la fase di allungamento, nel corso della quale l’enzima scorre lungo la molecola di DNA per sintetizzare un filamento di RNA complementare a una delle due molecole di DNA. Analogamente al processo di replicazione del DNA, nella seconda fase la molecola di RNA viene sempre sintetizzata in direzione 5′-3′. Pertanto, il filamento stampo di DNA viene letto in direzione 3′-5′ e il filamento di DNA complementare allo stampo decorre in 5′-3′ e, poiché la sua sequenza risulta identica a quella della molecola di RNA di neosintesi (fatta eccezione per l’uracile al posto della timina), viene definito filamento codificante o filamento senso. Per convenzione la comunità scientifica ha stabilito che, sia nella letteratura scientifica che nelle banche dati, la sequenza nucleotidica che identifica un gene venga descritta riportando la sequenza del filamento senso. La fase finale del processo di trascrizione prende il nome di terminazione e implica il distacco della RNA polimerasi dal filamento stampo, cui fanno seguito il rilascio della molecola di RNA di nuova sintesi e il ripristino della struttura secondaria a livello della regione di DNA appena trascritta.
Bisogna ricordare che l’esemplificazione trifasica del processo si compone di numerose sottofasi di complessità crescente da procarioti ad eucarioti, soprattutto se ne consideriamo l’enzimologia. Dalla trascrizione avrà origine il trascrittoma, ossia la serie completa di molecole di RNA trascritte espresse nella cellula o in un organismo in toto.
Eccezioni all’unidirezionalità della trascrizione
Bisogna ricordare che il dogma centrale della biologia molecolare, secondo cui il flusso dell’informazione genetica procede unidirezionalmente dal DNA all’RNA, e quindi alle proteine, presenta delle eccezioni. In alcuni virus che presentano un genoma a RNA è stata rilevata la presenza di un enzima, la trascrittasi inversa, codificata dal gene virale essenziale pol. La trascrittasi inversa è una DNA polimerasi RNA-dipendente, poiché catalizza la sintesi di una molecola di DNA da un template di RNA. Nelle cellule eucariotiche, la stabilità delle sequenze telomeriche (le sequenze terminali alle estremità del cromosoma) è garantita da complessi ribonucleoproteici (complessi shelterin), sebbene i telomeri siano destinati ad accorciarsi ad ogni ciclo replicativo, particolarità che conferisce un limite al numero di duplicazioni che una cellula può effettuare. In alcuni casi il mantenimento della lunghezza dei telomeri è affidato ad un enzima, la telomerasi. Essa è una ribonucleoproteina costituita da due componenti principali: una proteina chiamata TERT (TElomerase Reverse Transcriptase) che agisce come una trascrittasi inversa, essendo capace di sintetizzare DNA da uno stampo di RNA, che va a costituire il TERC (TElomerase RNA Component). La subunità TERT va ad associarsi con il complesso shelterin e allunga, utilizzando lo stampo di RNA del TERC, l’estremità 3′ del telomero, prevenendone l’accorciamento. Nell’uomo, l’espressione della telomerasi è limitata solo alle cellule che proliferano attivamente, ma è stata registrata un’attivazione dell’enzima anche nelle cellule tumorali e un suo coinvolgimento nel processo di invecchiamento.
In altri virus (come il poliovirus) è stato, inoltre, rintracciato un altro enzima, la RNA polimerasi RNA-dipendente, capace di sintetizzare una molecola di RNA direttamente da uno stampo di RNA, e quindi implicata nel processo di diretta replicazione del genoma virale, senza l’ausilio dell’apparato enzimatico dell’ospite.
RNA CODIFICANTI E NON CODIFICANTI
Il trascrittoma, a differenza del genoma, si contraddistingue per la sua estrema variabilità, non solo se si considerano tipi cellulari distinti in un singolo organismo, ma anche a livello di un singolo tipo cellulare posto in condizioni ambientali differenti o analizzato in diversi momenti del ciclo vitale. Sulla base di una classificazione generale del trascrittoma si può operare una distinzione in RNA codificanti (mRNA), la cui sequenza viene letta dai ribosomi per produrre una particolare proteina, e RNA non codificanti (o funzionali) che esplicano la loro funzione nella cellula senza determinare la sintesi di una proteina.
mRNA
Negli anni immediatamente successivi alla scoperta del DNA, l’osservazione e la dimostrazione che l’RNA viene sintetizzato nel nucleo e successivamente esportato nel citoplasma assunse un’importanza cruciale nel delucidare la relazione tra le tre molecole principali della vita (DNA, RNA, proteine). Infatti, sula base di tale osservazione venne postulato e dimostrato che una specifica molecola di RNA fosse prodotta nel nucleo e esportata nel citoplasma dove l’informazione racchiusa sotto forma di sequenza nucleotidica nell’RNA poteva essere decodificata in modo da definire la precisa sequenza aminoacidica di una proteina. In virtù della sua capacità di trasferire un messaggio genetico, tale molecola fu chiamata RNA messaggero o mRNA. Nel corso della traduzione la sequenza codificante viene letta e decodificata dall’apparato ribosomale secondo le regole del codice genetico.
Tuttavia, questo processo di conversione della sequenza nucleotidica in sequenza aminoacidica non utilizza l’intera sequenza contenuta nell’mRNA. In particolare, sia nei procarioti che negli eucarioti la regione all’estremità 5′ non viene utilizzata a tal fine e pertanto è definita regione non tradotta al 5′ o 5′-UTR (5′ untranslated region). Tale regione rappresenta la porzione della sequenza di un mRNA localizzata tra il primo nucleotide all’estremità 5′ e il codone di inizio della traduzione (AUG). Il principale ruolo di questa regione è quello di mediare il legame dell’mRNA e il ribosoma, ma il meccanismo attraverso il quale ciò viene espletato differisce tra eucarioti e procarioti. Inoltre, negli eucarioti la regione 5′-UTR assume ulteriori funzioni, essendo implicata anche nella maturazione del messaggero nel nucleo e nel trasporto della sua forma matura nel citoplasma. Analogamente, anche la sequenza nucleotidica posizionata all’estremità 3′ della molecola di mRNA non viene di norma utilizzata per definire la sequenza aminoacidica della proteina corrispondente e viene definita 3′-UTR. Tale regione comprende la sequenza compresa tra il codone di terminazione della traduzione e l’estremità 3′ dell’mRNA. Tra le funzioni attribuite alla 3′-UTR rientrano la stabilizzazione e lo smistamento intracitoplasmatico del trascritto e il controllo dell’efficienza del processo di sintesi proteica. Nonostante queste caratteristiche salienti, vi sono differenze importanti tra procarioti e eucarioti: gli mRNA dei procarioti sono policistronici,, in quanto contengono al loro interno le sequenze codificanti in grado di specificare la sintesi di più proteine distinte. Tale modalità di decodificazione dell’informazione genetica è utilizzata molto raramente dagli eucarioti. Nei procarioti vi è contiguità spazio-temporale tra trascrizione e traduzione; di conseguenza l’mRNA procariotico non subisce modificazioni prima di essere tradotto. Ciò non si verifica negli eucarioti, dove l’mRNA è soggetto a numerosi rimaneggiamenti che ne garantiscono la stabilità nel citoplasma. Tra i più rilevanti v’è l’aggiunta di un Cap (cappuccio), all’estremità 5′ dell’RNA precursore o pre-mRNA (un RNA facente parte del gruppo degli heterogeneous nuclear RNA, RNA eterogenei nucleari o hnRNA complessati con le proteine hnRNP) del nucleotide modificato 7-metil guanosina, cui può fare seguito la metilazione del 2′-OH dei primi due nucleotidi del trascritto. Una seconda modifica è determinata dalla sintesi di una catena di poli(A) (poliadenilazione) al sito di poliadenilazione situato all’estremità 3′ del trascritto.
Gli eventi di maturazione non si limitano sicuramente ai due citati sopra, ma includono anche il processo di eliminazione delle sequenze di pre-mRNA che non vengono esportate nel citoplasma, gli introni, cui corrisponde la ritenzione selettiva (e l’eventuale riarrangiamento) delle sequenze codificanti, gli esoni.
tRNA
Francis Crick avanzò l’ipotesi, poi rivelatasi corretta, dell’esistenza di un meccanismo che permettesse ai codoni di organizzare i singoli aminoacidi: Esperimenti successivi confermarono l’esistenza di molecole adattatrici, che si rivelarono essere piccoli RNA cui fu dato il nome di tRNA (RNA transfer), ovvero RNA di trasferimento, le quali sono in grado di riconoscere mediante uno specifico anticodone, la sequenza complementare del codone presente sull’mRNA che specifica per un aminoacido. Ci si aspetterebbe di avere 61 tRNA diversi, uno per ogni codone del codice genetico (escusi i codoni nonsense) ma in realtà, per il fenomeno del vacillamento della base al 3′ di ciascun codone (fenomeno di woobling) un tRNA può riconoscere più codoni. Ciò implica un appaiamento codone-anticodone stringente per le prime due basi e più flessibile per la terza. Pertanto, in una cellula il numero di tRNA necessari alla sintesi proteica non supera 35. A questo bisogna aggiungere che il tRNA è l’unico tra gli acidi nucleici a contenere basi insolite, ossia basi diverse da quelle canoniche, derivanti da modificazioni post-trascrizionali. La presenza di basi insolite rende ancora meno specifico il riconoscimento, in quanto diventano possibili ulteriori schemi di appaiamento oltre quelli previsti dal “pairing” secondo Watson e Crick e dall’appaiamento vacillante. Ad esempio, l’inosina, che è spesso presente nella prima posizione dell’anticodone (corrispondente alla terza base del codone) può appaiarsi con le basi A, U e C, mentre la 2-tiouridina (un uracile modificato) permette alla base di appaiarsi con A, ma ne impedisce l’appaiamento con G.
Ciascuna molecola di tRNA deve presentare una sequenza di riconoscimento del codone, chiamata anticodone, regioni che permettano il riconoscimento da parte dell’amminoacil-tRNA-sintetasi (un enzima che catalizza il legame tra l’aminoacido e il tRNA) e regioni che consentano il riconoscimento da parte del ribosoma. I tRNA sono piccoli RNA lunghi circa 75-90 nucleotidi e caratterizzati da una struttura tipica. Possono essere rappresentati schematicamente in due dimensioni tramite una struttura a trifoglio, in cui vi sono steli originati dalla presenza di regioni costituite da sequenze che ripiegandosi possono appaiarsi e dare una doppia elica dentro il filamento, ed anse (strutture secondarie a stem-loop). In tale struttura si possono distinguere: uno stelo “accettore” di 7-9 bp (paia di basi) ottenuto dall’appaiamento dei nucleotidi all’estremità 5′ con quelli all’estremità 3′; all’estremità 5′ è presente un gruppo fosfato alla 3′ è presente una sequenza invariante 5′-CCA-3′, che viene di solito aggiunta post-trascrizionalmente e a cui si lega l’aminoacido trasportato; un “braccio D“, costituito da uno stelo di 3-4 pb che termina con un’ansa di 5-7 basi, spesso contenente la base modificata diidrouridina; un “braccio dell’anticodone”, costituito da uno stelo di 5 bp che termina con l’ansa dell’anticodone; un “braccio T” costituito da uno stelo di 5 bp che termina con l’ansa contenente la sequenza TΨC, dove Ψ sta per “pseudouridina” un’uridina modificata; un’ansa tra il braccio T e quello dell’anticodone che conferisce stabilità termodinamica alla molecola.
Nella cellula i tRNA assumono una forma tridimensionale a L rovesciata, data dal ripiegamento intramolecolare dei bracci T e D. Il trascritto primario del tRNA è più grande della molecola di tRNA definitiva, andando incontro a numerosi rimaneggiamenti e modifiche post-trascrizionali che comportano l’inserimento delle già citate basi non canoniche. Nei batteri il meccanismo di soppressione delle mutazioni, la soppressione intergenica, ha portato alla formazione di tRNA aventi anticodone complementare ad uno dei tre codoni di stop (UAA, UAG, UGA) che impedisce il repentino troncamento delle proteine nel cui trascritto si è verificata una mutazione nonsenso. Il codice genetico espanso ha sfruttato questi tRNA per introdurre aminoacidi modificati all’interno di catene polipeptidiche.
rRNA
Gli RNA ribosomali costituiscono, assieme al tRNA, l’altro tipo di RNA fondamentale per il corretto adempimento della sintesi proteica in una cellula. L’RNA ribosomale rappresenta la tipologia più abbondante di RNA presente nella cellula (fino all’80%) ed è la molecola predominante nei ribosomi (circa il 60% in peso), le macchine catalitiche preposte alla sintesi delle proteine in tutte le cellule viventi. In particolare, l’rRNA è complessato con proteine a formare le due subunità distinte del ribosoma, la subunità maggiore e la subunità minore. Negli eucarioti, la cellula possiede milioni di ribosomi e, per poter fornire alla cellula l’enorme quantità di rRNA necessari, i geni che codificano questi trascritti sono generalmente presenti in centinaia di copie, raggruppate in regioni del genoma denominate rDNA. In una cellula eucariotica in interfase, gli rDNA sono generalmente raggruppati in strutture all’interno del nucleo, chiamate nucleoli. La caratteristica principale degli rRNA consiste nella loro complessa struttura secondaria, riconducibile a numerose regioni di complementarietà intramolecolare tra le basi contenute nello stesso rRNA, che determinano l’ulteriore riarrangiamento in una struttura terziaria complessa. Il compito principale dell’rRNA consiste nel fornire un supporto al meccanismo di decodifica della sequenza dell’mRNA, mediando l’adesione degli elementi del complesso traduzionale.
La grandezza di un rRNA viene misurata con il coefficiente di sedimentazione, avente come unità di misura lo Svedberg. Nei batteri, archeobatteri, mitocondri e cloroplasti, la subunità minore del ribosoma contiene l’rRNA 16S (16 Svedberg), la subunità maggiore l’rRNA 23S e 5S, i cui geni codificanti sono cotrascritti. Le molecole di rRNA sono trascritte come precursori notevolmente più lunghi, che poi vanno incontro a “tagli” post-trascrizionali per produrre gli rRNA ribosomali. Ad esempio, in E. coli il trascritto del gene dell’rRNA è un precursore di 30S che, a seguito di tagli mediati da endonucleasi, viene scisso nei tre rRNA di cui sopra, nonché in un rRNA 4S. Al contrario, la subunità maggiore del ribosoma eucariotico contiene gli rRNA 28S, 5,8S e 5S derivanti da un precursore di 45S, mentre la subunità minore contiene l’rRNA 18S.
snRNA e snoRNA
Gli snRNA, o piccoli RNA nucleari, vengono comunemente descritti come una famiglia piuttosto eterogenea di trascritti di modeste dimensioni (da 60 a 350 nucleotidi) che risiedono nel nucleo della cellula eucariotica. dove svolgono la funzione di regolazione e maturazione mediante modificazione post-trascrizionale di altre molecole di RNA. Più precisamente, gli snRNA intervengono nel processo di splicing, formando complessi RNA-proteine denominati piccole ribonucleoproteine nucleari (snRNP). Essendo particolarmente ricchi in uracile, la loro nomenclatura consiste nella serie alfanumerica U1, U2, etc.
Nella cellula eucariotica il nucleolo rappresenta la sede della sintesi degli RNA ribisomali e il loro successivo assemblaggio a formare le subunità ribosomali. In anni recenti, tuttavia, è emersa la presenza di una seconda classe di trascritti funzionalmente correlati agli rRNA, gli snoRNA. Si tratta di molecole di RNA di dimenzioni ridotte implicate, come gli snRNA, nella maturazione post-trascrizionale, in questo caso a carico degli rRNA. Gli snoRNA determinano l’aggiunta di gruppi metilici (-CH₃) oppure l’isomerizzazione dell’uracile a pseudouridina. L’appaiamento specifico tra le basi di queste molecole e quelle degli rRNA bersaglio è alla base della loro funzione, poiché esso è in grado di dirigere enzimi capaci di apportare modifiche alla struttura dell’rRNA.
siRNA
I piccoli RNA interferenti, o siRNA (small interfering RNA), sono molecole di RNA a doppio filamento di dimensioni esigue (circa 20 bp) la cui scoperta ha portato alla luce un meccanismo di regolazione genica di cui era ignota l’esistenza, l’interferenza a RNA. Questo fenomeno si riferisce al fenomeno naturale di inibizione dell’espressione genica negli eucarioti che si basa su di esse (dell’interferenza a RNA fa parte il meccanismo di silenziamento operato da CRISPR in associazione con l’enzima Cas, molto discusso negli ultimi anni). Il meccanismo d’azione di questi duplex prevede l’incorporazione di questi in un complesso multiproteico definito RISC (RNA-induced silencing complex). A livello di questo complesso, gli siRNA subiscono un processo di denaturazione a seguito del quale uno dei due filamenti (detto “passeggero”) viene degradato, mentre l’altro rimane stabilmente associato a RISC e funge da “guida” per indirizzare il complesso a una molecola di acido nucleico bersaglio, sulla base della complementarietà chimica delle basi. Il complesso RNA guida-RISC è quindi in grado di inibire l’espressione di un gene bersaglio tramite il legame e la successiva degradazione di una molecola di mRNA complementare all’RNA guida. Si ritiene che l’interferenza a RNA sia un meccanismo difensivo elaborato dagli eucarioti contro le infezioni da parte di virus il cui ciclo vitale preveda l’iniezione di molecole di RNA a doppio filamento (dsRNA) nella cellula ospite. Infatti, le molecole di siRNA sono prodotte a seguito della maturazione di lunghi duplex di RNA, che rappresentano un bersaglio naturale degli siRNA da essi derivati. Oltre alla funzione di difesa, studi recenti hanno attribuito agli siRNA il ruolo di controllo degli elementi trasponibili in un genoma complesso. Sfruttando questo meccanismo naturale di difesa, l’interferenza a RNA è stata introdotta in molti laboratori di biologia molecolare come metodo sperimentale per ottenere il silenziamento di un gene di interesse tramite appaiamento e successiva degradazione ad opera di un siRNA, in modo da poterne indagare la funzione biologica.
miRNA e piRNA
I micro RNA (miRNA) furono scoperti negli anno ’90 del secolo scorso nel nematode Caenorhabditis elegans e successivamente identificati nel moscerino della frutta, nel topo domestico, nell’uomo e in molti altri organismi. Il meccanismo d’azione dei miRNA è molto simile a quello degli siRNA, ma vi sono alcune differenze rilevanti tra questi due tipi di RNA. Per prima cosa, i miRNA derivano sempre dalla maturazione di molecole di RNA di geni endogeni, facenti quindi parte del patrimonio genetico di una cellula eucariotica. Inoltre, il meccanismo adoperato dai miRNA per silenziare i geni bersaglio si basa spesso sull’inibizione della traduzione di un mRNA bersaglio. In secondo luogo, sebbene anche per i miRNA l’appaiamento specifico tra le basi miRNA-mRNA bersaglio rappresenti il meccanismo molecolare di silenziamento, tale appaiamento è spesso imperfetto; ciò non avviene nei siRNA. Infine, nella maggior parte dei casi, il meccanismo di inibizione della traduzione da parte dei miRNA si basa sul mascheramento della regione 3′-UTR dell’mRNA. L’importanza di tale meccanismo di regolazione è testimoniata dalla scoperta che molte patologie umane (quali cancro, difetti congeniti dovuti ad anomalie nel processo di sviluppo embrionale) sembrano in parte riconducibili ad anomalie nella struttura o nella funzione di un numero crescente di miRNA.
Dopo la scoperta dei miRNA, studi successivi hanno dimostrato l’esistenza di altri tipi di RNA con funzione regolativa, tra i quali merita sicuramente una menzione il piRNA (Piwi-interacting RNA). Si tratta di piccoli RNA (dai 25 ai 30 nt) derivati dalla maturazione di RNA precursori di maggiori dimensioni ed espressi nella linea germinale maschile dei mammiferi, il cui ruolo consisterebbe nel limitare il fenomeno di trasposizione di particolari elementi genetici, i retrotrasposoni, nelle cellule che formeranno i gameti. Questa funzione assume particolare rilevanza nella linea germinale, in quanto gli eventi di trasposizione possono determinare l’inserzione dell’elemento trasponibile a livello di un gene o della sua sequenza regolativa, con imprevedibili conseguenze. Poiché la maggior parte dei piRNA rappresenta sequenze antisenso rispetto a quelle dei retrotrasposoni, si ritiene che operino attraverso un meccanismo di interferenza simile a quello osservato per i siRNA, coadiuvato dall’interazione con le proteine Piwi.
lncRNA
I long non-coding RNA sono tutte quelle molecole di RNA non codificanti la cui lunghezza supera i 200 nucleotidi. Prima del completamento del Progetto Genoma Umano erano stati scoperti e descritti pochi esempi di lunghi RNA non codificanti. Una particolare attenzione era stata rivolta verso XIST nella regione XIC (X inactivation center) del cromosoma X, che nei mammiferi comporta l’inattivazione del cromosoma X negli individui di sesso femminile. L’estrema rarità di questi trascritti non codificanti portò l’intera comunità scientifica a pensare che non avessero un ruolo preponderante nella biologia degli eucarioti. Questo scenario è cambiato drasticamente verso la fine degli anni novanta del XX secolo. Ad oggi sono descritte migliaia di geni codificanti lncRNA che presentano un profilo di espressione molto complesso, rappresentato da gruppi di trascritti senso/antisenso, ovvero regioni del genoma in cui entrambi i filamenti di DNA sono sotto posti a trascrizione. Un’altra caratteristica che distingue i lcnRNA è il loro basso grado di conservazione evolutiva, che determina sequenze anche molto diverse in specie filogeneticamente vicine. Sebbene questa osservazione abbia fatto ritenere all’inizio che i lcnRNA non avessero ruoli funzionali importanti, analisi più approfondite hanno dimostrato la presenza di blocchi di sequenza evolutivamente più conservati, probabilmente determinanti le loro caratteristiche strutturali o funzionali. A distanza di decenni dalla loro scoperta, sono state ottenute evidenze sperimentali che dimostrano il loro ruolo in numerosi processi biologici, come la regolazione della trascrizione, lo splicing e l’imprinting genomico.
RNA WORLD
Fin dalla sua scoperta, il DNA è stato universalmente riconosciuto come la molecola chiave della vita, in virtù della sua capacità di replicarsi e di trasportare l’informazione genetica. Per la maggior parte del XX secolo la comunità scientifica ha considerato la vita alla stregua di un fenomeno complesso incentrato sul DNA e sulle proteine, relegando l’RNA a “status” di molecola marginale. Questa visione appare riduttiva, se si considera la complessa combinazione di eventi che hanno dato origine al nostro pianeta. Le proteine rappresentano i principali agenti funzionali e strutturali delle cellule e in qualità di enzimi controllano la sintesi dei costituenti biologici della cellula, compreso il DNA. Come i processi biologici cui il DNA è soggetto sono imprescindibili dall’intervento di enzimi, quest’ultimi non sono in grado di auto-replicarsi e la loro sintesi è legata alla trascrizione e traduzione del DNA. Da queste considerazioni emerge un paradosso: il concetto appena citato è applicabile in un contesto prebiotico? È possibile che le due tipologie di molecole (una informazionale e una catalitica) si siano originate in contemporanea intessendo fin da subito un circuito complesso di interazioni reciproche? Sicuramente la realizzazione di un simile scenario è alquanto improbabile.
Una possibile soluzione a questo paradosso può essere fornita ipotizzando l’esistenza di una singola tipologia di molecola in grado di fungere sia da depositaria dell’informazione genetica, sia da macchina catalitica. Da tali considerazioni, il premio Nobel Walter Gilbert formulò la teoria dello “RNA World“, che proponeva la presenza di forma di vita primitive basate esclusivamente sull’RNA. Secondo questa ipotesi, questa molecola potrebbe essere stata originariamente alla base della comparsa di forme di vita pre-cellulare, caratterizzate dallo sviluppo spontaneo e dalla successiva selezione naturale di sistemi prebiotici, in cui sia il trasferimento dell’informazione genetica sia l’azione catalitica fossero esercitate dall’RNA.
Sostanzialmente, l’RNA è una molecola molto simile al DNA, ed è quindi facile ipotizzare un suo eventuale ruolo nella conservazione dell’informazione genetica. Quanto all’attività catalitica, già negli anni ’70 del secolo scorso si sospettava che alcune molecole di RNA potessero agire da catalizzatori nelle reazioni implicate nella loro stessa formazione, e in effetti la scoperta dei ribozimi diede un grande sostegno alla teoria di Gilbert. I ribozimi sono molecole di RNA in grado di catalizzare reazioni chimiche come la formazione del legame peptidico e lo splicing. Altri indizi suggeriscono un ruolo ancestrale, precedente al DNA, dell’RNA. I nucleotidi che lo compongono sembrano assolvere funzioni antiche o universali (come l’ATP, l’AMP ciclico o i NTP, precursori dei dNTP). Dal mondo a RNA si sarebbe poi evoluto il sistema attuale, incentrato sul DNA e sulle proteine, sulla base sia della maggiore stabilità del DNA, sia della maggiore flessibilità delle proteine. Va comunque specificato che, sebbene le proprietà dell’RNA rendano concettualmente possibile la presenza di un mondo antico prebiotico dominato da questa molecola, la plausibilità della teoria è ancora ampiamente dibattuta.
Fonte
- How RNA folds
JMB - RNA secondary structure: physical and computational aspects
Cambridge University Press - The Structural Basis of Ribosome Activity in Peptide Bond Synthesis
Science - Transcription termination and anti‐termination in E. coli
Wiley Online library - Structure of the RNA-dependent RNA polymerase of poliovirus
Cell - The Evolution of Controlled Multitasked Gene Networks: The Role of Introns and Other Noncoding RNAs in the Development of Complex Organisms
Oxford University Press - Non‐coding RNAs: the architects of eukaryotic complexity
EMBO Press - The Hidden Genetic Program of Complex Organisms
Scientific American - Origins and Mechanisms of miRNAs and siRNAs
Cell - Endogenous siRNAs from naturally formed dsRNAs regulate transcripts in mouse oocytes
Nature - Silence from within: Endogenous siRNAs and miRNAs
Cell - A germline-specific class of small RNAs binds mammalian Piwi proteins
Nature - Human XIST yeast artificial chromosome transgenes show partial X inactivation center function in mouse embryonic stem cells
PNAS - RNA interference: potential therapeutic targets
Springer Link - CRISPR/Cas, the Immune System of Bacteria and Archaea
Science