ciao! ho fatto sequenziare una regione di DNA che dovrebbe essere un gene. dall'analisi con genscan ho trovato gli esoni, promotore e poliA. avrei diverse domande: il poliA trovato è di 6 bp... non è un po troppo corto?? ho preso solo la regione codificante (quindi solo gli esoni) e con expacy ho tradotto la proteina. nei frame ci sono diversi siti di inizio della trascrizione e diversi codoni di stop. come devo interpretare questi risultati?? perche cosi tanti codoni di stop ed inizio? sulla base di cosa stabilisco quali sono giusti o no? inoltre il primo esone inizia con un ATG e il 3 esone con un TAG. potrei considerare solo questi? grazie
Considera che GenScan é un predittore, quindi implicitamente é possibile che vi siano errori nella traduzione.
Fossi in te ci andrei con calma nell'analisi bioinformatica: - scaricati l'ultima pubblicazione che metta a confronto software per la predizione ab initio di gene (gene finding and review[ptyp]) e cerca di farti una idea su quali sono i pro/contro. Se magari hai a disposizione anche qualche altro tipo di informazione sulla tua sequenza (esempio conosci l'ortologo in una specie vicina), si possono applicare altri approcci, che danno risultati migliori.
- ripeti la predizione con più di un programma. Purtroppo al momento non sono molto aggiornato sul problema (anche se ho lavorato a fianco di uno dei pioneri del genere, sob ), però puoi dare una occhiata a questa lista qui: http://www.genefinding.org/software.html
- detto questo, ricordati che anche l'analisi bioinformatica é un esperimento in se. per esempio, potresti far correre le sequenze di alcuni geni già annotati (scaricale da ncbi/ensembl) da utilizzare come controllo per i parametri che stai utilizzando.
p.s.: che specie é?
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)