Esiste un altro argomento che riguarda l’espressione di geni.
Non prenderemo in considerazione tutti gli organismi e tutti i vettori
di espressione esistenti, ma vedremo solo cosa devono avere in comune
i vettori d’espressione.
Tutti devono avere una parte relativa a E.coli che permetta quindi
replicazione e selezione con marcatori di selezione. in più
devono avere una parte che dipenderà dall’organismo
in cui io decido di esprimere il gene X, quindi un marcatore di
selezione e un sistema che permetta nell’organismo in questione
la replicazione autonoma se o dove è possibile.
Tutti poi hanno quella che è una cassetta di espressione,
in cui ci dev’essere un sito di clonaggio in cui io posso
clonare YFG, inoltre questa cassetta deve contenere elementi importanti,
sia in 5’ che in 3’: io voglio che questo gene sia tracritto,
che l’RNA sia stabile, dopodiché io voglio che si abbia
traduzione all’interno dell’organismo (verme, pianta,
topo o uomo). Per cui avrò in 5’ gli elementi che controllano
trascrizione e traduzione e in 3’ segnali di terminazione
della trascrizione, di poliadenilazione e, eventualmente, di splicing.
questi elementi dipenderanno dall’organismo in cui io voglio
esprimere YFG.
Promotori.
Possono essere costitutivi o inducibili. In genere i promotori costitutivi
sono quelli della via glicolitica: (enolasi ecc.), promotori inducibili
sono il classico Gal o altro. I promotori possono essere poi forti
o deboli. Ho quindi un primo controllo a livello trascrizionale,
scelgo il tipo di promotore: costitivo o inducibile. In genere si
desidare avere tanto trascritto (accumulo) ma questo non fa molto
bene alla celula (limita la crescita). Quindi scelgo un promotore
inducibile: prima faccio crescere le cellule a promotore spento,
poi, quando ho raggiunto una certa biomassa, accendo il sistema.
Controlli:
I segnali di terminazione in 3’, sono importanti: mi interessa
avere tanto messaggero stabile.
Un altro controllo è a livello traduzionale: devo avere una
buona traduzione, quindi devo metterci i giusti segnali: devo avere
una corretta lettura, sappiamo infatti che il codice è degenerato
ma in organismi diversi possiamo avere un uso preferenziale diverso
dei codoni (in Candida Albicans quando trova CUG fa una Serina,
al posto della normale Leucina: una proteina di Candida espressa
in lievito può essere non funzionale, e viceversa.)
Una volta che ho tradotto il prodotto deve essere stabile, nella
maggior parte dei casi si usano ceppi proteasi negativi (inibite
le proteasi).
Molto spesso poi la proteina va incontro a modificazioni post-traduzionali:
fosforilazione, glicosilazione, acetilazione, acilazione, formazione
di ponti disolfuro, mistirilazione, gipilazione, ecc…
Io devo essere certo che l’organismo che scelgo faccia queste
modificazioni. La maggior parte di queste modificazioni avvengono
lungo la via secretiva, i ponti di solfuro si formano a livello
di reticolo endoplasmico, che E.coli non ha. Per poter essere indirizzata
lungo la via secretiva io devo aggiungere alla mia cassetta di espressione
un ulteriore elemento che è la “leader sequence”,
per cui ci sono dei vettori che oltre alla zona 5’ (promotore)
hanno questa sequenza lunga circa da 15 a 30 aminoacidi il cui core
centrale ha caratteristiche idrofobiche, e la parte N-term. è
costituita da carichi. Questa sequenza è essenziale per la
traslocazione a livello del reticolo, dopodiché viene rimossa
(leader peptidasi). Ovviamente il promotore e la sequenza segnale
devono essere in frame.
Di leader sequences ne esistono diverse, nel caso del lievito viene
utilizzata spesso la sequenza segnale dell’(a)-factor, una
proteina fatta lungo la via secretiva prima di essere immessa nel
medium, ed è quindi caratterizzata da una leader sequenza.
Un'altra sequenza leader è la suc2 che codifica per l’invertasi.
Le sequenza che io scelgo possono essere omologhe o eterologhe,
in genere è meglio esprimere un prodotto eterologo utilizzando
elementi omologhi al sistema, perché ovviamente verrano più
facilmente riconosciuti.
Nella maggior parte dei casi indirizzo i miei prodotti lungo la
via secretiva.
Il fatto di indirizzare un prodotto verso la via secretiva favorisce
quello che è il folding, perché a livello del reticolo
ci sono chaperonine (BIP) ed altri sistemi di modifica post-traduzionale.
È importante anche la scelta dell’ospite: in funzione
dell’ospite io avrò la capacità di avere più
o meno un certo tipo di modificazione.
Modificazioni post-traduzionali:
- Glicosilazione (di tipo n o di tipo o);
- Acetilazione;
- Miristilazione (attacco di un ac.miristico, in genere avviene
in N-term);
- Fosforilazione;
- Acilazione (es. Ras con ac.palmitico attaccato e isopreni. Queste
modificazioni avvengono a livello del C-term a livello del reticolo
e dell’apparato del Golgi).
- Gipilazione (attacco di una struttura molto complessa che si chiama
Glicosil Fosfatidil Inositolo, un lipide a cui è attaccato
un ac.grasso, che viene attaccato un C-term alle proteine previa
rimozione di una sequenza idrofobica in C-term. ad opera di una
transammidasi, che taglia e attacca Questa struttura GIP. Questa
struttura serve per l’ancoraggio in membrana, e ulteriormente
modificata la troviamo poi in quelle proteine che ad esempio in
lievito costituiscono la parete cellulare ovvero le proteine associate
ai glicani che poi caratterizzano la permeabilità. Molte
proteine devono essere tagliate per essere attive, un altro esempio
è l’(a) factor).
- Formazione di ponti di solfuro (disulfide isomerasi)
- Assunzione del corretto folding.
Nel caso di E.coli c’è qualche problema con l’espressione,
perché molte di queste modificazioni non avvengono, quindi
non sempre E.coli è l’organismo migliore.
Molto spesso, se io voglio produrre, io voglio anche purificare
per ottenere il prodotto, ecco perché la via secretiva è
migliore: è più facile purificare qualchecosa dal
medium che dover rompere le cellule ecc…
Un organismo usato frequentemente per produrre grosse quntità
di proteine eterologhe è Saccorimices cerevisiae (l comune
lievito):
I vantaggi sono:
- Il fatto che avvengono modificazioni post-traduzionale.
- Sistema di targeting: posso indirizzare in diversi comparti la
proteina in questione.
Svantaggi:
- La N-glicosilazione avviene su un consenso di 3 residui: Asparagina–X–Serina/Treonina.
Questo tipo di modificazione è abbastanza conservata e avviene
a livello del reticolo (attacco del core) e a livello del Golgi
(attacco delle catene laterali). Mentre il core è abbastanza
conservata (pentasaccaride comune), quello che varia in vari organismi
sono le catene laterali. In lievito abbiamo solo mannosi, mentre
in altri organismi abbiamo strutture più complesse, quindi
è chiaro che se ci sono alcune proteine la cui funzionalità
è legata a modificazioni della parte glucidica (se mettiamo
queste proteine in lievito, questo ci mette solo mannosi senza così
ottenere una proteina corretta). In più il lievito ha un
vizietto: appena vede siti di glicosilazione gli attacca glucidi,
quindi spesso abbiamo fenomeni di iperglicosilazione. E siccome
i glucidi sono legati a fenomeni di antigeneicità (si pensi
ai gruppi sanguigni), abbiamo molto spesso dei prodotti non usabili
per applicazioni via endovena. In questo caso si utilizzaranno altri
organismi che avranno rese minori ma controllano meglio la glicosilazione,
per esempio Pichia Pastoris, un lievito sempre gemmante che cresce
su metanolo.
Gli svantaggi di Pichia è che non ha un plasmide endogeno
come 2µ, e i 2µ di Saccharomices non funzionano, per
cui è possibile trasformarlo solamente con integrazioni,
con efficienze di trasformazione inferiori. Alternativamente a Pichia
si usano alcuni funghi come gli Aspergilli, che sono organismi gras
come Cerevisiae, sono ascomiceti, anche qua però c’è
la trasformazione solo con integrazione.
- Un ulteriore problema è dato dallo Scaling Up industriale
difficile: spesso le strategie di produzione di proteine in laboratorio
non sono compatibili con le strategie di larga produzione su scala
industriale, e viceversa. Questo è un problema se la proteina
espressa ha un valore commerciale.
Riassumendo: per esprimere qualsiasi cosa
bisogna tener conto di diversi fattori: il messaggero dev’essere
stabile, il prodotto deve essere stabile, quindi o si usano ceppi
proteasi negativi o si fanno proteine di fusione. Posso anche inserire
qualche cosa che mi permetterà la purificazione del prodotto
(TAG inseriti in C-term o in N-term, x es. targeting di Histidine
ripetute: queste si legano allo zinco, quindi una volta che il prodotto
di fusione viene espresso e secreto io lo faccio passare su colonne
di zinco, la proteina di fusione viene immobilizzata e successivamente
eluita). Molto spesso dopo questo TAG vengono messi dei segnali
specifici di modo che il TAG possa essere eliminato (a me interessa
la proteina), quindi io eluisco, taglio eliminando il TAG e faccio
passare ancora sulla colonna, il TAG si lega e io recupero la proteina
purificata.