Domande bioinfo che non riesco a risolvere

Forum

Registrati Discussioni Recenti Preferiti Utenti Cerca Regolamento RSS Statistiche

Utilità

I libri
consigliati:

Biologia vegetale
Autori Vari

Ologenesi
Daniele Rosa

Cacciatori di molecole. L'archeologia alla ricerca del DNA antico
Martin Jones

Altri Libri

Nome Utente:	Password:
Riconoscimi automaticamente

Tutti i Forum

MolecularLab

Bioinformatica

Domande bioinfo che non riesco a risolvere

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Risorse di Bioinformatica:

Guide tools online

Blog InsideBioinfo

Siti di Bioinformatica

Protocolli

Ultime notizie

Aggiungi i tag

Quanto � utile/interessante questa discussione:

Autore

Discussione

SaraThrash
Nuovo Arrivato

19 Messaggi

Inserito il - 03 maggio 2009 : 14:28:32

Ciao a tutti, mi sto preparando all'esame di bioinformatica e ho recuperato un vecchio test del prof, c'� qualcuno che mi aiuta a risolvere queste domande?

1) In questa ricerca BlastP abbiamo utilizzato come query la sequenza "artificiale" QWERTY ed un E-value di 1000000000. Sapreste spiegare come mai questo allineamento ha un E-value cosi alto, pur essendo query e subject identici?

Score = 19.2 bits (38), Expect = 1737
Identities = 6/6 (100%), Positives = 6/6 (100%)

Query: 1 QWERTY 6
QWERTY
sbjct: 67 QWERTY 72

2) Di seguito � riportato il pattern PROSITE per C2, un dominio di circa 116 aminoacidi localizzato tra due copie del dominio C1 ed il dominio catalitico in alcuni isozimi della protein chinasi C (PKC).
Potreste scrivere almeno una delle sequenze possibilmente rappresentate da questo pattern?

[ACG]-x(2)-L-x(2,3)-D-x(1,2)-[NGSTLIF]-[GTMR]-x-[STAP]-D-[PA]-[FY].

3) Se effettuo una ricerca BLASTP contro lo stesso database e con la stessa query, una volta con E value = 10 ed una volta con E value = 0,001, quale sar� la ricerca in cui vedr� pi� falsi positivi?Perch�?

Vi ringrazio in anticipo!

chick80
Moderatore

Citt�: Edinburgh

11491 Messaggi

Inserito il - 03 maggio 2009 : 14:34:56

Immagino tu abbia lo stesso prof dell'autore di questa domanda!

http://www.molecularlab.it/forum/topic.asp?TOPIC_ID=12723

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)

dallolio_gm
Moderatore

Prov.: Bo!
Citt�: Barcelona/Bologna

2445 Messaggi

Inserito il - 03 maggio 2009 : 14:35:26

Ah! Sembra che il tuo prof abbia gi� fatto vittime tra i membri di questo forum:
- http://www.molecularlab.it/forum/topic.asp?TOPIC_ID=12723

Per le altre domande, noi generalmente facciamo cos�: prova tu prima a dare una risposta, o a scrivere quello che pensi sia corretto... se � sbagliato, te lo correggiamo e ti spieghiamo perch�.

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)

Odile768
Nuovo Arrivato

6 Messaggi

Inserito il - 06 maggio 2009 : 12:38:00

Ragazzi...purtroppo sono anche io vittima di questa materia e mi sto preparando da un mesetto proprio x avere il tempo di arrivare al giorno dell'esame(fine giugno) con almeno tutti i concetti metabolizzati,e qui intervenite voi ad aiutarmi xk� io cn tutta la buona volont� davvero non riesco ad arrivarci,cio� cerco su internet,spulcio qui da voi ma davvero non capisco,forse xk� il mio corso � un corso base dv verranno approfonditi dei concetti solo alla specialistica,quindi x me certe questioni rimangono irrisolte!vi pongo delle domande che ho trovato,io ad alcune penso di aver risposte bene,su altre alzo le mani xk� sono cose che il prof nn ha accennato,sul libro non esistono e nemmeno su internet!
1.Il programma NEEDLE utilizza una matrice di sostituzione:
a)fornita dall'utente
b)stabilita dal programma dp il confronto delle 2 seq
c)" " " dopo aver studiatola composizione aa
d)non ha senso usare una matrice di sostituzione

2.EMBL ad oggi contiene:
a)milioni di records
b)centinaia di recods
c)miliardi di records
d)pochi records
Credo che sia la b) ma non ne sono sicura

3.Ad oggi esistono all'incirca
a)1 milione di database bioogici
b)centomila database biologici
c)diecimila database biologici
d)mille database biologici
Credo sia la d) ma ripeto non ne sono convinta

4.Che cosa hanno in comune i test unusual ratio,univariate statistics,analysis of variance?
a)vengono utilizzati x individuare l'inizio della trascrizione in una seq genomica
b)" " " geni differenzialmente espressi
c)prevedono l'uso di catene di markov
d)prevedono l'uso di catene neurali
In questo caso non ho mai sentito parlare di questi tst se non dell'ultimo

5.L'algoritmo di naive viene utilizzato per:
a)allineamento multiplo di sequenze
b)la ricerca di famiglie di proteine
c)la ricerca di pattern all'interno di stringhe
d)la normalizzazione dei segnali
Ragazzi io ho cercato ovunque ma sembra che nn esista questoalgoritmo o l'ha inventato il mio prof o non sn buona neanche a fare una ricerca su google,sta cmq il fatto che nel libro nn c'� alcun accenno!

6)La parola sintenia si riferisce a:
a)regioni cromosomiche costituite dalla successione priva di gap di 2 o pi� contig
b)" " ricche di geni
c)" " ricche si STS
d)segmenti cromosomici presenti in specie diverse con contenuto ed organizzazione simili
Credo che quellaesatta sia la d)

7)ModBase e un:
a)sito web
b)un programma x la creazione di modelli e di strutture
c)un programma x la ricerca di sequenze conservate
d)un database di modelli di strutture
Credo che la risp giusta sia la b)

8)iMol e RasMol sono:
a)programmi x la rierca di struttura 2�
b) " x la visualizzazione della struttura 2�
c) " x " " 3D di strutture
d) " basati su algoritmi euristici
Credo che la risp giusta sia la c)

9)Durante il processo di homology modelling,lo step di ricerca disimilarit� in banche dati:
a)precede lo step di allineamento
b)segue lo step di allineamento
c)� contemporaneo allo step di allineamento
d)dipende dallo step di allineamento
Credo sia la c)

10)Nell'analisi di dati d microarray,L'ANOVA � uno dei test utilizzati per:
a)la ricerca di pattern
b)l'individuazione di geni maggiormente espressi
c)l'individuazione di geni differentemente spressi
d)la determinazione dell'intensit� media dei segnali

11)I metodi di clustering guidato o supervised:
a)sono basati sull'algoritmo UPGMA
b)non necessitano di un training set
c)prevedono l'uso di un training set
d)prevedono un continuo intervento dell'operatore
Qui sono indecisa tra la a) e la c) forse avrei risposto c)

12)Gli HMM contenuti in PFAM descrivono:
a)gruppi di proteine con un'identit� almeno del 90%
b)alberi di similarit�
c)famiglie di proteine
d)alberi filogenetici
Credo sia la c)

13)La predizione dei trascritti di ENSEMBL si basa:
a)sul confronto delle seq genomiche con database di proteine e di cDNA
b)sull'uso di metodi statistici associati ai programmi come nel caso del programma GENSCAN
c)sul confronto di seq genomiche con database di EST
d)unicamente sul confronto di seq genomiche con database di proteine
QUui sono indecisa tra la a) e la c) forse avrei messo a)

14)I nodi che costituiscono ENTREZ sn:
a)isolati
b)ridondanti
c)in relazione tar loro
d)dipendenti uno dall'altro
Io non sapevo neanche che avesse dei nodi,questo la dice molto sulla mia comprensione su ENTREZ cmq avrei risp c)

15)I modelli ottenuti x Homology modelling sono spesso usati x:
a)progettare molecole ad azione farmacologica
b)identificare regioni conservate fra seq
c)raggruppare seq in famiglie
d)cercare mutazioni puntiformi
Mmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmm

Aiutatemi,non vorrei abusare troppo di questo spazio ma forse sono ancora in tempo per capire qualcosa in pi�,cm potete vedere i dubbi sono tanti...Grazie per le risposte,ve ne sarei grata a vita!

Odile768
Nuovo Arrivato

6 Messaggi

Inserito il - 08 maggio 2009 : 11:50:56

Vi prego ragazzi...chiedo ai moderatori una mano...senza l'aiuto di qualcuno che mi chiarisca questi concetti non s� cm fare!vi prego vi prego vi prego

SaraThrash
Nuovo Arrivato

19 Messaggi

Inserito il - 14 giugno 2009 : 17:07:46

Riguardo alla domanda 3 (Se effettuo una ricerca BLASTP contro lo stesso database e con la stessa query, una volta con E value = 10 ed una volta con E value = 0,001, quale sar� la ricerca in cui vedr� pi� falsi positivi?Perch�?), mi viene da pensarla cosi:

E value = probabilit� che un risultato sia un falso positivo.
Quindi la prima ricerca, con valore 10 sar� quella in cui vedr� pi� falsi positivi poich� ha un valore pi� alto della seconda.
Infatti il valore dell� E value pi� � basso pi� � buono.

Pu� essere o � tutto l'opposto?

domi84
Moderatore

Citt�: Glasgow

1724 Messaggi

Inserito il - 14 giugno 2009 : 18:35:59

Corretto!

Il mio blog: http://domi84.blogspot.com/
Le foto che ho scattato...

SaraThrash
Nuovo Arrivato

19 Messaggi

Inserito il - 15 giugno 2009 : 10:34:29

Grazie infinite!

SaraThrash
Nuovo Arrivato

19 Messaggi

Inserito il - 21 giugno 2009 : 15:39:41

Ma...quando una "hit" trovata risulta significativa???

Qual'� la differenza tra un modello markoviano e una matrice PSSM?

Discussione

Quanto � utile/interessante questa discussione:

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Vai a:

MolecularLab.it

Android e Mobile



Scarica le app! Ora anche sul tuo smartphone!

Ciao Login - Iscriviti



Visitatori: 89

Novità
Link scientifici: divisi in categoria in una directory scientifica, link utili e d'approfondimento.