Autore |
Discussione |
|
SaraThrash
Nuovo Arrivato
19 Messaggi |
Inserito il - 03 maggio 2009 : 14:28:32
|
Ciao a tutti, mi sto preparando all'esame di bioinformatica e ho recuperato un vecchio test del prof, c'è qualcuno che mi aiuta a risolvere queste domande?
1) In questa ricerca BlastP abbiamo utilizzato come query la sequenza "artificiale" QWERTY ed un E-value di 1000000000. Sapreste spiegare come mai questo allineamento ha un E-value cosi alto, pur essendo query e subject identici?
Score = 19.2 bits (38), Expect = 1737 Identities = 6/6 (100%), Positives = 6/6 (100%)
Query: 1 QWERTY 6 QWERTY sbjct: 67 QWERTY 72
2) Di seguito è riportato il pattern PROSITE per C2, un dominio di circa 116 aminoacidi localizzato tra due copie del dominio C1 ed il dominio catalitico in alcuni isozimi della protein chinasi C (PKC). Potreste scrivere almeno una delle sequenze possibilmente rappresentate da questo pattern?
[ACG]-x(2)-L-x(2,3)-D-x(1,2)-[NGSTLIF]-[GTMR]-x-[STAP]-D-[PA]-[FY].
3) Se effettuo una ricerca BLASTP contro lo stesso database e con la stessa query, una volta con E value = 10 ed una volta con E value = 0,001, quale sarà la ricerca in cui vedrò più falsi positivi?Perchè?
Vi ringrazio in anticipo!
|
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 03 maggio 2009 : 14:35:26
|
Ah! Sembra che il tuo prof abbia giá fatto vittime tra i membri di questo forum: - http://www.molecularlab.it/forum/topic.asp?TOPIC_ID=12723
Per le altre domande, noi generalmente facciamo cosí: prova tu prima a dare una risposta, o a scrivere quello che pensi sia corretto... se é sbagliato, te lo correggiamo e ti spieghiamo perché. |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
Odile768
Nuovo Arrivato
6 Messaggi |
Inserito il - 06 maggio 2009 : 12:38:00
|
Ragazzi...purtroppo sono anche io vittima di questa materia e mi sto preparando da un mesetto proprio x avere il tempo di arrivare al giorno dell'esame(fine giugno) con almeno tutti i concetti metabolizzati,e qui intervenite voi ad aiutarmi xkè io cn tutta la buona volontà davvero non riesco ad arrivarci,cioè cerco su internet,spulcio qui da voi ma davvero non capisco,forse xkè il mio corso è un corso base dv verranno approfonditi dei concetti solo alla specialistica,quindi x me certe questioni rimangono irrisolte!vi pongo delle domande che ho trovato,io ad alcune penso di aver risposte bene,su altre alzo le mani xkè sono cose che il prof nn ha accennato,sul libro non esistono e nemmeno su internet! 1.Il programma NEEDLE utilizza una matrice di sostituzione: a)fornita dall'utente b)stabilita dal programma dp il confronto delle 2 seq c)" " " dopo aver studiatola composizione aa d)non ha senso usare una matrice di sostituzione
2.EMBL ad oggi contiene: a)milioni di records b)centinaia di recods c)miliardi di records d)pochi records Credo che sia la b) ma non ne sono sicura
3.Ad oggi esistono all'incirca a)1 milione di database bioogici b)centomila database biologici c)diecimila database biologici d)mille database biologici Credo sia la d) ma ripeto non ne sono convinta
4.Che cosa hanno in comune i test unusual ratio,univariate statistics,analysis of variance? a)vengono utilizzati x individuare l'inizio della trascrizione in una seq genomica b)" " " geni differenzialmente espressi c)prevedono l'uso di catene di markov d)prevedono l'uso di catene neurali In questo caso non ho mai sentito parlare di questi tst se non dell'ultimo
5.L'algoritmo di naive viene utilizzato per: a)allineamento multiplo di sequenze b)la ricerca di famiglie di proteine c)la ricerca di pattern all'interno di stringhe d)la normalizzazione dei segnali Ragazzi io ho cercato ovunque ma sembra che nn esista questoalgoritmo o l'ha inventato il mio prof o non sn buona neanche a fare una ricerca su google,sta cmq il fatto che nel libro nn c'è alcun accenno!
6)La parola sintenia si riferisce a: a)regioni cromosomiche costituite dalla successione priva di gap di 2 o più contig b)" " ricche di geni c)" " ricche si STS d)segmenti cromosomici presenti in specie diverse con contenuto ed organizzazione simili Credo che quellaesatta sia la d)
7)ModBase e un: a)sito web b)un programma x la creazione di modelli e di strutture c)un programma x la ricerca di sequenze conservate d)un database di modelli di strutture Credo che la risp giusta sia la b)
8)iMol e RasMol sono: a)programmi x la rierca di struttura 2° b) " x la visualizzazione della struttura 2° c) " x " " 3D di strutture d) " basati su algoritmi euristici Credo che la risp giusta sia la c)
9)Durante il processo di homology modelling,lo step di ricerca disimilarità in banche dati: a)precede lo step di allineamento b)segue lo step di allineamento c)è contemporaneo allo step di allineamento d)dipende dallo step di allineamento Credo sia la c)
10)Nell'analisi di dati d microarray,L'ANOVA è uno dei test utilizzati per: a)la ricerca di pattern b)l'individuazione di geni maggiormente espressi c)l'individuazione di geni differentemente spressi d)la determinazione dell'intensità media dei segnali
11)I metodi di clustering guidato o supervised: a)sono basati sull'algoritmo UPGMA b)non necessitano di un training set c)prevedono l'uso di un training set d)prevedono un continuo intervento dell'operatore Qui sono indecisa tra la a) e la c) forse avrei risposto c)
12)Gli HMM contenuti in PFAM descrivono: a)gruppi di proteine con un'identità almeno del 90% b)alberi di similarità c)famiglie di proteine d)alberi filogenetici Credo sia la c)
13)La predizione dei trascritti di ENSEMBL si basa: a)sul confronto delle seq genomiche con database di proteine e di cDNA b)sull'uso di metodi statistici associati ai programmi come nel caso del programma GENSCAN c)sul confronto di seq genomiche con database di EST d)unicamente sul confronto di seq genomiche con database di proteine QUui sono indecisa tra la a) e la c) forse avrei messo a)
14)I nodi che costituiscono ENTREZ sn: a)isolati b)ridondanti c)in relazione tar loro d)dipendenti uno dall'altro Io non sapevo neanche che avesse dei nodi,questo la dice molto sulla mia comprensione su ENTREZ cmq avrei risp c)
15)I modelli ottenuti x Homology modelling sono spesso usati x: a)progettare molecole ad azione farmacologica b)identificare regioni conservate fra seq c)raggruppare seq in famiglie d)cercare mutazioni puntiformi Mmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmm
Aiutatemi,non vorrei abusare troppo di questo spazio ma forse sono ancora in tempo per capire qualcosa in più,cm potete vedere i dubbi sono tanti...Grazie per le risposte,ve ne sarei grata a vita! |
|
|
Odile768
Nuovo Arrivato
6 Messaggi |
Inserito il - 08 maggio 2009 : 11:50:56
|
Vi prego ragazzi...chiedo ai moderatori una mano...senza l'aiuto di qualcuno che mi chiarisca questi concetti non sò cm fare!vi prego vi prego vi prego |
|
|
SaraThrash
Nuovo Arrivato
19 Messaggi |
Inserito il - 14 giugno 2009 : 17:07:46
|
Riguardo alla domanda 3 (Se effettuo una ricerca BLASTP contro lo stesso database e con la stessa query, una volta con E value = 10 ed una volta con E value = 0,001, quale sarà la ricerca in cui vedrò più falsi positivi?Perchè?), mi viene da pensarla cosi:
E value = probabilità che un risultato sia un falso positivo. Quindi la prima ricerca, con valore 10 sarà quella in cui vedrò più falsi positivi poiché ha un valore più alto della seconda. Infatti il valore dell’ E value più è basso più è buono.
Può essere o è tutto l'opposto? |
|
|
domi84
Moderatore
Città: Glasgow
1724 Messaggi |
|
SaraThrash
Nuovo Arrivato
19 Messaggi |
Inserito il - 15 giugno 2009 : 10:34:29
|
Grazie infinite! |
|
|
SaraThrash
Nuovo Arrivato
19 Messaggi |
Inserito il - 21 giugno 2009 : 15:39:41
|
Ma...quando una "hit" trovata risulta significativa???
Qual'è la differenza tra un modello markoviano e una matrice PSSM? |
|
|
|
Discussione |
|