Ciao a tutti. Mi interessa clonare un full lenght di una proteina all'interno di un vettore di espressione. Per trovare la sequenza codificante (CDS) ho cercato il mio gene d'interesse in Pubmed-Nucleotide. Tra le tante sequenze, ho preso in considerazione quella in homo sapiens caratterizzata da codici NM_(vari numeri). (Tra l'altro, gli altri codici che significato hanno?). Alcuni geni hanno più codici NM_ perchè hanno più varianti (o isoforme che dir si voglia); infatti cercando il gene d'interesse in Pubmed-Gene si osserva che le varie isoforme vengono riportate con i rispettivi NM_.
La domanda é: se trovo 1 solo codice NM_, posso essere sicuro che il mio gene non ha varianti (e quindi quando faccio una RT-PCR devo per forza avere la sequenza CDS indicata nell'NM_ altrimenti sono in presenza di una mutazione dovuta alla PCR) oppure il tutto merita una ricerca più approfondita? Ed eventualmente dove o con quali software?
Citazione: La domanda é: se trovo 1 solo codice NM_, posso essere sicuro che il mio gene non ha varianti (e quindi quando faccio una RT-PCR devo per forza avere la sequenza CDS indicata nell'NM_ altrimenti sono in presenza di una mutazione dovuta alla PCR) oppure il tutto merita una ricerca più approfondita? Ed eventualmente dove o con quali software?
Questo no: il fatto che vi sia un solo trascritto indicato nel database vuol dire che vi é solo un trascritto conosciuto; però non puoi sapere se ve ne sono altri non conosciuti/annotati. Immagino tu debba fare dei controlli durante la clonazione, o semplicemente, se trovi un trascritto in più nell RT-PCR vuol dire che hai trovato un trascritto non presente nel database.
Le EST ti potrebbero dare una idea della possibile presenza di trascritti alternativi del gene, ma utilizzarle per fare una analisi corretta potrebbe non essere triviale.
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)