Forum

Nome Utente:
Password:
Riconoscimi automaticamente
 Tutti i Forum
 MolecularLab
 Bioinformatica
 Sviluppo software di allineamento
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
I seguenti utenti stanno leggendo questo Forum Qui c'è:

Aggiungi Tag Aggiungi i tag

Quanto è utile/interessante questa discussione:

Autore Discussione  

Altair
Nuovo Arrivato



2 Messaggi

Inserito il - 02 marzo 2011 : 18:31:05  Mostra Profilo  Visita l'Homepage di Altair Invia a Altair un Messaggio Privato  Rispondi Quotando
Salve a tutti,
sono un laureando in ing. informatica. Come tesi sto sviluppando un software di allineamento.
Chiedo aiuto a voi per risolvere alcuni dubbi che ho sulla parte biologica.
E mi scuso se alcuni quesiti sono già trattati in altre parti del forum.

In genere qual'è la lunghezza massima e media delle proteine che devono essere allineate?
E' molto frequente trovarsi ad allineare proteine costituite da catene aminoacidiche superiori a 14500 residui?
Ho notato che molti programmi non trattano l'inversione in un allineamento. Quanta importanza può avere?

Al momento uso, per il testing, sequenze aminoacidiche generate da me in modo casuale.
Mi consigliereste 4-5 sequenze reali da allineare? (magari anche con due istruzioni per trovarle nei vari database)

Dove è possibile trovare le matrici PAM e BLOSUM nei formati adatti per clustalW?
C'è qualche funzione, oltre all'allineamento, che vorreste faccia un software di allineamento?

Avrei anche altre domande e sicuramente ne avrò in futuro.

Vi ringrazio da adesso per tutto l'aiuto che potrete darmi.

domi84
Moderatore

Smile3D

Città: Glasgow


1724 Messaggi

Inserito il - 02 marzo 2011 : 20:16:22  Mostra Profilo  Visita l'Homepage di domi84 Invia a domi84 un Messaggio Privato  Rispondi Quotando
Ciao e Benvenuto sul forum!
Citazione:

In genere qual'è la lunghezza massima e media delle proteine che devono essere allineate?


Le dimensioni delle proteine sono varie, alcune sono piccolissime
http://www.uniprot.org/uniprot/Q6LD34 (questa solo 33 aa)
altre molto grandi
http://www.ncbi.nlm.nih.gov/protein/NP_031894.1 (3800 aa)
Quindi (secondo me) non ha senso dire una media...gruppi che lavorano su citochine mediamente allineano proteine piccole, altri che lavorano sulla distrofia proteine molto grandi. Devo dire che personalmente ho avuto a che fare (fin'ora) con proteine fra i 300 e gli 800 aa.
Citazione:

E' molto frequente trovarsi ad allineare proteine costituite da catene aminoacidiche superiori a 14500 residui?


Non credo proprio
Citazione:

Ho notato che molti programmi non trattano l'inversione in un allineamento. Quanta importanza può avere?


Al volo direi non molta...
se hai un GENE:
ATG-CTT-ATA, e questo nel corso dell'evoluzione si inverte, diventerà TAT-AAG-CAT
il primo codifica per il peptide: MLI, invece il peptide dovuto a inversione TLH...che è completamente diverso, non solo l'inverso.

Il mio blog: http://domi84.blogspot.com/
Le foto che ho scattato...
Torna all'inizio della Pagina

domi84
Moderatore

Smile3D

Città: Glasgow


1724 Messaggi

Inserito il - 02 marzo 2011 : 20:36:51  Mostra Profilo  Visita l'Homepage di domi84 Invia a domi84 un Messaggio Privato  Rispondi Quotando
Citazione:

Al momento uso, per il testing, sequenze aminoacidiche generate da me in modo casuale.
Mi consigliereste 4-5 sequenze reali da allineare? (magari anche con due istruzioni per trovarle nei vari database)


Un modo molto semplice è andare su ensembl http://www.ensembl.org/index.html , cercare il nome di una proteina (ad es "il1"), selezionare "gene", e qui ti uscirà questa proteina in ogni bestia :D ,seleziona una bestia a piacere, clicca sul nome della proteina, clicca il codice sotto la voce "protein ID", clicca sulla sinistra "protein"
Citazione:

C'è qualche funzione, oltre all'allineamento, che vorreste faccia un software di allineamento?


sì, che mi scarica le sequenze dai database, che si interfaccia con BLAST

Il mio blog: http://domi84.blogspot.com/
Le foto che ho scattato...
Torna all'inizio della Pagina

Altair
Nuovo Arrivato



2 Messaggi

Inserito il - 03 marzo 2011 : 17:14:44  Mostra Profilo  Visita l'Homepage di Altair Invia a Altair un Messaggio Privato  Rispondi Quotando
grazie mille per la risposta.

Da quello che ho capito non è possibile interrogare direttamente i database. Bisognerebbe parsare le pagine web. Dipende da quali dati parti per ricercare la sequenza.

esempio il seguente url genera un link unico che porta a pagine web che hanno da qualche parte la sequenza che ci interessa.
http://www.ensembl.org/Loxodonta_africana/Lucene/Details?species=Loxodonta_africana;idx=Gene;end=1;q=il2

Il formato di questo url è fisso quindi se cerco la sequenza a partire dalle variabili species= e q= (sigla proteina) poi diventa facile seguire i link che portano alle pagine web con le sequenze da parsare.

per blast credo che il discorso sia lo stesso. Con la differenza che probabilmente ci sono altri dati da configurare (io mai usato)

Colgo l'occasione per porgere un'altra domanda.
Quali formati sono i più utilizzati per salvare un allineamento o un multiallineamento? Esiste un posto in cui questi formati sono descritti?

Torna all'inizio della Pagina

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 03 marzo 2011 : 17:24:23  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Citazione:
Da quello che ho capito non è possibile interrogare direttamente i database. Bisognerebbe parsare le pagine web. Dipende da quali dati parti per ricercare la sequenza.


Sì che è possibile! Esistono delle API per Ensembl

http://www.ensembl.org/info/docs/api/index.html

Stesso per Blast

http://www.ncbi.nlm.nih.gov/books/NBK7152/

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina
  Discussione  

Quanto è utile/interessante questa discussione:

 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
Vai a:
MolecularLab.it © 2003-18 MolecularLab.it Torna all'inizio della Pagina