Quanto è utile/interessante questa discussione:
Autore |
Discussione |
|
Altair
Nuovo Arrivato
2 Messaggi |
Inserito il - 02 marzo 2011 : 18:31:05
|
Salve a tutti, sono un laureando in ing. informatica. Come tesi sto sviluppando un software di allineamento. Chiedo aiuto a voi per risolvere alcuni dubbi che ho sulla parte biologica. E mi scuso se alcuni quesiti sono già trattati in altre parti del forum.
In genere qual'è la lunghezza massima e media delle proteine che devono essere allineate? E' molto frequente trovarsi ad allineare proteine costituite da catene aminoacidiche superiori a 14500 residui? Ho notato che molti programmi non trattano l'inversione in un allineamento. Quanta importanza può avere?
Al momento uso, per il testing, sequenze aminoacidiche generate da me in modo casuale. Mi consigliereste 4-5 sequenze reali da allineare? (magari anche con due istruzioni per trovarle nei vari database)
Dove è possibile trovare le matrici PAM e BLOSUM nei formati adatti per clustalW? C'è qualche funzione, oltre all'allineamento, che vorreste faccia un software di allineamento?
Avrei anche altre domande e sicuramente ne avrò in futuro.
Vi ringrazio da adesso per tutto l'aiuto che potrete darmi.
|
|
|
domi84
Moderatore
Città: Glasgow
1724 Messaggi |
Inserito il - 02 marzo 2011 : 20:16:22
|
Ciao e Benvenuto sul forum!
Citazione:
In genere qual'è la lunghezza massima e media delle proteine che devono essere allineate?
Le dimensioni delle proteine sono varie, alcune sono piccolissime http://www.uniprot.org/uniprot/Q6LD34 (questa solo 33 aa) altre molto grandi http://www.ncbi.nlm.nih.gov/protein/NP_031894.1 (3800 aa) Quindi (secondo me) non ha senso dire una media...gruppi che lavorano su citochine mediamente allineano proteine piccole, altri che lavorano sulla distrofia proteine molto grandi. Devo dire che personalmente ho avuto a che fare (fin'ora) con proteine fra i 300 e gli 800 aa.
Citazione:
E' molto frequente trovarsi ad allineare proteine costituite da catene aminoacidiche superiori a 14500 residui?
Non credo proprio
Citazione:
Ho notato che molti programmi non trattano l'inversione in un allineamento. Quanta importanza può avere?
Al volo direi non molta... se hai un GENE: ATG-CTT-ATA, e questo nel corso dell'evoluzione si inverte, diventerà TAT-AAG-CAT il primo codifica per il peptide: MLI, invece il peptide dovuto a inversione TLH...che è completamente diverso, non solo l'inverso.
|
Il mio blog: http://domi84.blogspot.com/ Le foto che ho scattato... |
|
|
domi84
Moderatore
Città: Glasgow
1724 Messaggi |
Inserito il - 02 marzo 2011 : 20:36:51
|
Citazione:
Al momento uso, per il testing, sequenze aminoacidiche generate da me in modo casuale. Mi consigliereste 4-5 sequenze reali da allineare? (magari anche con due istruzioni per trovarle nei vari database)
Un modo molto semplice è andare su ensembl http://www.ensembl.org/index.html , cercare il nome di una proteina (ad es "il1"), selezionare "gene", e qui ti uscirà questa proteina in ogni bestia :D ,seleziona una bestia a piacere, clicca sul nome della proteina, clicca il codice sotto la voce "protein ID", clicca sulla sinistra "protein"
Citazione:
C'è qualche funzione, oltre all'allineamento, che vorreste faccia un software di allineamento?
sì, che mi scarica le sequenze dai database, che si interfaccia con BLAST |
Il mio blog: http://domi84.blogspot.com/ Le foto che ho scattato... |
|
|
Altair
Nuovo Arrivato
2 Messaggi |
Inserito il - 03 marzo 2011 : 17:14:44
|
grazie mille per la risposta.
Da quello che ho capito non è possibile interrogare direttamente i database. Bisognerebbe parsare le pagine web. Dipende da quali dati parti per ricercare la sequenza.
esempio il seguente url genera un link unico che porta a pagine web che hanno da qualche parte la sequenza che ci interessa. http://www.ensembl.org/Loxodonta_africana/Lucene/Details?species=Loxodonta_africana;idx=Gene;end=1;q=il2
Il formato di questo url è fisso quindi se cerco la sequenza a partire dalle variabili species= e q= (sigla proteina) poi diventa facile seguire i link che portano alle pagine web con le sequenze da parsare.
per blast credo che il discorso sia lo stesso. Con la differenza che probabilmente ci sono altri dati da configurare (io mai usato)
Colgo l'occasione per porgere un'altra domanda. Quali formati sono i più utilizzati per salvare un allineamento o un multiallineamento? Esiste un posto in cui questi formati sono descritti?
|
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
|
|
Discussione |
|
|
|
Quanto è utile/interessante questa discussione:
MolecularLab.it |
© 2003-18 MolecularLab.it |
|
|
|