Se vogliamo conoscere, identificare e predire geni codificanti
proteine, a partire da sequenze genomiche esistono diversi programmi
di Gene Finding.
Nel nostro caso useremo una sequenza ignota ottenuta dal progetto
per il sequenziamento del genoma del pesce palla (Fugu).
GENSCAN
- GenScan è il primo programma che vedremo, permette, fornendo
una sequenza, di indicare se sono presenti gene e la loro struttura.
- Sul sito http://genes.mit.edu/GENSCAN.html
o http://genome.dkfz-heidelberg.de/cgi-bin/GENSCAN/genscan.cgi,
incolliamo la sequenza ed avviamo GenScan
- Notate che sono presenti due geni, il primo dei quale ha ben
22 esoni ed una coda di polyA, il secondo invece possiede una
zona promotore, ma non è finito (non è presente
l'esone terminatore). Osservate su quale filamento si trova e
le altre caratteristiche (leggete la legenda, mi raccomando).
Analisi proteine predette da GeneScan
Analizziamo la sequenza proteica predetta, la prima perchè
sembra codificare per una proteina completa in due modi, prima con
BLAST poi con GenomeScan:
- Come al solito andiamo sul sito di BLAST
- Scegliamo il BLAST per proteine e avviamolo con la sequenza
trovata da GeneScan
- Cosa si può dedurre dal risultato ottenuto?
- Oltre all’analisi con BLAST possiamo ricercare domini
e motivi funzionali attraverso il sistema InterPro (http://www.ebi.ac.uk/interpro/scan.html
)
GenomeScan
- Questo invece èun programma che permette di analizzare
con più precisione la struttura di un gene, l’algoritmo
di predizione si basa sulla similarità di omologhi, in
questo caso l'algoritmo sfrutta l'omologia tra la nostra sequenza
data e le proteine presenti in banca dati.
- Colleghiamoci al sito: http://genes.mit.edu/genomescan.html
- Incolla all’interno della finestra per la sequenza genomica
il clone S000194
ed nella finestra per la proteina il miglior risultato del BLAST
fatto prima (es: P80971).
- Ottengo lo stesso risultato se cambio la sequenza proteica
di confronto?
CARATTERIZZAZIONE DI IPOTETICHE PROTEINE PREDETTE
DA PROGRAMMI DI GENE FINDING
Per identificare la natura funzionale di un’ipotetica
proteina di un gene predetto confronta per similarità questa
proteina con una banca dati proteica.
ESERCIZI PROPOSTI:
- Estrai la sequenza genomica del gene cox4 (applicando
le metodiche analizzate nelle esercitazioni precedenti)
- Applica genescan alla sequenza estratta e confronta la proteina
predetta con una banca dati proteica
- Utilizza una proteina simile al peptide predetto da genscan
per applicare genomescan.
Results: genescan_cox4 genescan_RAF1 genomescan_cox4
genomescan_RAF1