Per cercare di ottenere l’esatta localizzazione degli esoni
e degli introni possiamo allineare la sequenza genomica contenente
il gene e la sequenza dell’mRNA.
VERIFICA DELLA ESPRESSIONE DEI GENI PREDETTI
MEDIANTE CONFRONTO CON LE BANCHE DATI EMBL E EST
Per verificare che i geni predetti siano effettivamente trascritti
possiamo fare una ricerca in banca dati usando come sonda le putative
sequenze di mRNA corrispondenti ai geni predetti.
- Ritorna al sito di GenScan: http://genes.mit.edu/GENSCAN.html
- Fai ripartire le analisi selezionando questa volta Predicted
CDS and peptides.
- Utilizza le sequenze CDS predette per trovare i trascritti con
il BLAST http://www.ncbi.nlm.nih.gov/BLAST
NB: Per essere significativi i matches devono riferirsi a sequenze
di mRNA
- Seleziona tra i risultati del Blast solo quelle in cui nella
linea dell’ID sia riportato nel campo Molecule il valore
RNA.
- I matches devono mostrare un grado di identità superiore
al 99%.
Possiamo confrontare la sequenza genomica con la banca dati dbEST,
in questo modo avremo dati relativi alla espressione della proteina:
dove viene espressa, a livello di quale tessuto o organo.
- Estrai la sequenza genomica di cox4 da Genome Browser utilizzando
come parola chiave cox4 o NM_001861 comprendendo anche 1000 bp
della regione promotore.
- Prima di confrontare la sequenza con la banca dati EST bisogna
mascherare le regioni ripetute che potrebbero dare matches aspecifici.
- Utilizziamo per questo scopo il programma RepeatMasker
- Collegati al sito http://ftp.genome.washington.edu/cgi-bin/RepeatMasker
- Copia la sequenza genomica all’interno dell’apposita
finestra, seleziona il formato html in "return format"
e invia la richiesta.
- Fai partire le analisi con il BLASTn contro la banca dati EST.
- Interpreta i risultati!
- Per capire se si tratta di un frammento di trascritto relativo
ad un gene noi possiamo consultare la banca dati UniGene:
- Collegati al sito http://www.ncbi.nlm.nih.gov/UniGene
e ricerca uno degli AC individuati dall’analisi con il Blast
(BG771720)
- Altre informazioni su questo gene possono essere trovate attraverso
i vari cross-referencing, in particolare quello della banca dati
OMIM.
ESERCIZI PROPOSTI:
- Verifica la presenza di un gene all’interno di questa
sequenza genomica e studiane la sua struttura.
- Ricerca tramite Genome
Browser o Ensembl un
gene di interesse e confronta la sua struttura (sequenza proteica
codificata, posizione esoni-introni,...) con quella predetta dai
diversi metodi.