Ciao a tutti.Vorrei un aiuto su una cosa che non capisco.In blast quando bisogna scegliere il database ce ne sono di vari tipi(non redundant, swissprot...).Qual'è la differenza?In base a cosa devoscegliere se usare l'uno l'altro?per es. ho una sequenza ,la incollo e poi??Per favore, è una sciocchezza ma non capisco come fare...
Dipende da quello che cerchi. Se cerchi un allineamento per delle strutture 3D allora userai un database dove sono contenute solo sequenze di proteine di cui è nota la struttura 3D. Qui sono spiegati i vari database e le differenze: http://www.ncbi.nlm.nih.gov/BLAST/blastcgihelp.shtml#protein_databases
si, ho letto...grazie mille...però il mio esercizio dice di individuare con blast la proteina la cui sequenza è massimamente simile alla sequenza predetta da genscan(nel punto precedente ) e di scaricarmela in formato FASTA.Mi aiuteresti a capire questo punto?In questo caso quale database va usato e perchè?
Bè...diamo un occhio assieme... Peptide Sequence Databases * nr All non-redundant GenBank CDS translations + RefSeq Proteins + PDB + SwissProt + PIR + PRF Qui ci sono le proteine delle maggiori banche dati
* refseq RefSeq protein sequences from NCBI's Reference Sequence Project. Qui solo quelle di refseq, che sono incluse anche nel precedente
* swissprot Last major release of the SWISS-PROT protein sequence database (no updates). Qui solo swissprot, che sono incluse anche nel precedente
* pat Proteins from the Patent division of GenPept. mmm...onestamente non so cosa sia
* pdb Sequences derived from the 3-dimensional structure from Brookhaven Protein Data Bank. al solito...solo pdb
* month All new or revised GenBank CDS translation+PDB+SwissProt+PIR+PRF released in the last 30 days. solo le ultime degli ultimi 30 giorni
* env_nr Protein sequences from environmental samples. campioni ambientali(!?)
Visto che non sai che proteina è io userei il primo, in quanto più ampio