Autore |
Discussione |
|
Cikobiotech
Nuovo Arrivato
37 Messaggi |
Inserito il - 12 marzo 2009 : 16:20:08
|
Salve a tutti . Dovrei creare tramite spreadsheet un programma che mi permetti di sapere la frequenza assoluta e relativa di coppie di sequenze(aa ; at ;ag ;ac ecc)come fa compseq di EMBOSS.Avevo pensato a Excel essendo io in materia(purtroppo) molto ignorante e c'č anche l'idea iniziale per farlo ma mi blocco a come dare l'input di ricercare 2 sole lettere.Mi sto prodigando a usare Ubuntu e quindi se c'č un qualcosa di meglio di Excel non molto complicato sono graditi indicazioni e consigli .Grazie in anticipo per l'aiuto
|
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Cittą: Barcelona/Bologna
2445 Messaggi |
Inserito il - 12 marzo 2009 : 16:25:27
|
Andiamo con ordine. Perche' vuoi riscrivere compseq, se questo tool esiste gia', ed e' pure open source? Ricordati che non basterį scrivere il programma, dovrai anche testarlo, dimostrare che funziona, e renderlo disponibile da qualche parte (se vuoi pubblicarci dei risultati sopra).
Che cosa devi fare esattamente? |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Cittą: Barcelona/Bologna
2445 Messaggi |
Inserito il - 12 marzo 2009 : 16:42:14
|
Se vuoi un input, puoi realizzare questo programma in python abbastanza facilmente.
Per prima cosa devi pensare a come testeresti il programma. Per esempio, su una sequenza del genere: AAAAAAAA che risultato ti aspetteresti?
E su una cosi': ACACAC ??
Ti do' anche un primer per uno script in python:
sequence = 'ACGATCGATCGATGCTAGCTAGCTAGC'
dinucleotides_counts = {}
for pos in range(0, len(sequence) -1):
dinucl = sequence[pos:pos+1]
dinucleotides_counts.setdefault(dinucl, 0)
dinucleotides_counts[dinucl] += 1
print dinucleotides_count
Non ho provato questo codice e spero che non contenga nessun errore.
|
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
Cikobiotech
Nuovo Arrivato
37 Messaggi |
Inserito il - 12 marzo 2009 : 18:05:20
|
Mi serve perchč ce la chiesto il professore di bioinformatica, lui dice che dobbiamo essere consci di come sia fatto un qualsiasi software utilizzato in questo campo, da un lato ha ragione ma da un altro gli dņ torto(nel senso che ognuno ha i suoi ruoli, e sicuramente il mio non č scrivere un software , esiste una laurea apposita, penso che il mio ruolo sia semplicemente di interpretare i dati forniti da questi software e dalle ipotesi dare delle tesi). Al di lą di questo mi affascinerebbe creare da me un proggetto del genere , se so che č alla mia portata. grazie |
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Cittą: Barcelona/Bologna
2445 Messaggi |
Inserito il - 13 marzo 2009 : 10:04:46
|
Forse il tuo professore legge questo blog: - http://www.mailund.dk/index.php/2009/03/02/a-string-algorithms-challenge/
oppure, il tuo prof é l'autore del blog stesso (é per caso olandese?) :-)
Beh tutto sommato l'esercizio ci puo' stare... e' una cosa molto semplice da realizzare, con un qualsiasi linguaggio di programmazione o con dello pseudo codice. Se dovessi scrivere un programma del genere, quali step faresti? Come testeresti i risultati? |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
Cikobiotech
Nuovo Arrivato
37 Messaggi |
Inserito il - 13 marzo 2009 : 17:26:18
|
cosa intendi per step? prima di tutto incomincerei con riuscire a contare un alemento alla volta ,con excel ci riesco xD basta mettere la funzione CONTA SE , il problema successivo e fargli contare due elementi alla volta, e per giunta nella stssa cella, con le varie possibilitą di cobinazione(AA AT AG GC ecc.) cosa che non so bene come fare con excel dove ho cmq un pņ funzioni disponibili.Per testarlo utilizzerei un programma gią testato XD e confronterei i risultati. Penso che la procedura sia abbastanza esatta....credo. Volevo sapere se č fattibile con excel fare un programma del genere? |
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Cittą: Barcelona/Bologna
2445 Messaggi |
Inserito il - 13 marzo 2009 : 17:42:31
|
Onestamente, Excel non e' il programma ideale per fare quello che chiedi. Non conosci nessun linguaggio di programmazione, nemmeno a livello approssimativo?
Citazione: Per testarlo utilizzerei un programma gią testato XD e confronterei i risultati.
Non ti viene in mente nessuna idea migliore? Con quale sequenze lo testeresti, comunque? |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
chick80
Moderatore
Cittą: Edinburgh
11491 Messaggi |
Inserito il - 13 marzo 2009 : 17:52:00
|
Citazione: Volevo sapere se č fattibile con excel fare un programma del genere?
Pur non mettendo in dubbio che in teoria possa essere fattibile, in pratica fai prima ad imparare Python o Perl o qualsiasi altro linguaggio di programmazione. Excel semplicemente non č un software scritto per fare questo genere di cose.
Inoltre se lo volessi fare in Excel non lo faresti di certo con le funzioni tipo CONTASE, dovresti farlo scrivendo delle macro in VBA. Siccome da quanto ho capito non conosci VBA, conviene impararti un altro linguaggio (soprattutto perchč VBA č uno dei linguaggi pił inutili mai inventati...) |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
Cikobiotech
Nuovo Arrivato
37 Messaggi |
Inserito il - 13 marzo 2009 : 19:07:56
|
grazie per il consiglio |
|
|
Cikobiotech
Nuovo Arrivato
37 Messaggi |
Inserito il - 13 marzo 2009 : 19:13:52
|
lo testerei su una qualsiasi sequenza nota di homo sapiens , meglio se una codificante. |
|
|
|
Discussione |
|