L’idea da cui ero partito per questo articolo era cercare di configurare delle macro-aree di bioinformatica, e per ognuna di esse collezionare i software e gli strumenti on line che un buon bioinformatico non può non conoscere. Un po’ troppo ambizioso, naturalmente. Inanzitutto perchè non è facile individuare delle categorie ben chiare ove collocare questa o quella tipologia di analisi bioinformatica; in secondo luogo perchè a volare un secondo già solo su Expasy si capisce come il mondo del software biomedicale e dintorni si frammenta e s’espande enormemente, in continuazione.
A pensarci bene ad un bioinformatico scaltro serve ricordare solo tre cose seriamente:
- Google is yr friend
- RTFMF (read the fucking manual first)
- Nothing is perfect
Spero di non dover spiegare i tre punti su menzionati a nessuno. Per quanti invece sarebbe necessario, vadano a casa a chiedere delucidazioni al figlio sedicenne prima di continuare a leggere.
Cosciente di queste tre grandi verità , nell’era della bioinformatica, del web 2.0 e della postgenomica, basta adoperarsi con passione e approccio analitico, per poter padroneggiare qualunque tools ci serva di volta in volta.
Questo non toglie che sarebbe carino approcciare l’argomento dei tools che ogni bioinformatico ha in punta di dita, senza essere troppi pretenziosi. Vorrei allora chiedere a chi ha letto fin qui di indicare, a commento di questo post, quale sia lo strumento bioinformatico che usa in assoluto di più. Magari spiegando il perchè, in che settore lo si usa, e come vi facilita la vita. Non vi chiedo una vera recensione (per questo, si faccia riferimento al punto 1). La mia intenzione è quello di raccogliere brevemente qualche esperienza, per magari in futuro approfondire e scriverne ancora con maggior senno.
Inizio io:
Lo strumento bioinformatico in assoluto che uso di più è….Linux!
Why Linux? Basti pensare che con esso si ha accesso libero a centinaia di tools bioniformatici. Possibilità di operare in regime di multiuser, multitasking e accesso remoto. Migliori performance. Accesso da shell. E qui mi fermo.
Ps: io ambizioso lo sono comunque, e quindi provo a stendere un canovaccio per classificare i vari strumenti bioinformatici. Penso si potrebbero distinguere secondo queste aree standard:
- Biostatistica e biologia computazionale
- Algoritmi
- Analisi di sequenze
- Filogenetica
- Analisi di espressione genica
- Proteomica e metabolomica
- Chemioinformatica
- Bioinformatica strutturale
- Modellizzazione molecolare
- Drug design
- Database biologici
- Data managment e annotazione
Che ne dite, potrebbe andare? A voi la parola! Diteci quale è il tool che preferite.
Io ultimamente mi sono dedicato alla modellistica molecolare ed al docking.
Il principale programma utilizzato, oltre ad uno proprietario realizzato dalla compagnia presso cui lavoro, è MOE: seppur non particolarmente efficiente e preciso nei processi, risulta essere molto intuitivo nell’utilizzo.
Permette di avere visualizzazioni molto belle, veloci e precise di strutture molecolari (DNA, proteine) ed anche una serie di strumenti utili per gestire librerie di conformeri, generare strutture minimizzate, in sostanza fare meccanica molecolare.
Il contro è sicuramente il costo.. talmente elevato da poter essere usato solo in università o in grandi aziende bioinformatiche, e poi anche i diversi buggettini presenti nel software che a volte creano pasticci nella gestione delle librerie e meccaniche poco precise.
In precedenza utilizzavo strumenti rivolti invece all’analisi delle sequenze: oltre a script perl, facevo largo uso di Browser genomici Blast, ClustalW..
Tutto naturalmente dalla shell di Linux.
Come giustamente dici è difficile caratterizzare cosa sia bioinformatica. Personalmente mi occupo principalmente di calcium imaging. Forse le tecniche di imaging sono più nell’ambito “bio” che in quello “informatica”, ma sono comunque pesantemente dipendenti da tool informatici per l’acquisizione delle immagini e per la loro successiva analisi.
In questo ambito (soprattutto per l’acquisizione) Windows è sicuramente l’OS più usato. Questo IMHO è principalmente dovuto al fatto che spesso vengono usati software proprietari fatti apposta per il tale microscopio etc etc. Questo ovviamente è tanto più vero quanto più sofisticato è l’apparato (che solitamente implica il fatto che sia controllato in remoto via software…).
Per l’analisi dei dati post acquisizione in realtà si ritorna a Linux. Molti usano ImageJ (cross-platform), noi abbiamo un software sviluppato da noi, che facciamo andare sotto Linux, ma è sviluppato con Qt per essere (potenzialmente) cross-platform.
AH! il Moe! Ricordi rimossi del master in bioinformatica!
Mi ricordo che in bicocca già allora pensavano di smettere di rinnovare la licenza per il prezzo assurdo!
Però è vero che non era malaccio da usare. Abbastanza adattabile alle varie necessità .
E pensare che bastava copiare il file della licenza su un’altro pc per farlo funzionar anche altrove!
R non c’é dubbio! Sia per la statistica in generale che per la bioinformatica in particolare. Devo precisare che rispetto alle decine di packages dedicati all’analisi dei microarray il panorama dedicato alla bioinformatica ‘più tradizionale’ è molto più ristretto. In ogni caso è molto facile scrivere script a dock che si interfacciano con qualsiasi software esterno (soprattutto sotto Linux).
Aggiungo inoltre un altro software che mi è risulato molto utile di recente: Zotero. È un ‘citation manager’ (alla endnote) Open Source in continuo sviluppo fondamentale nella raccolta/organizzazione di references da inserire negli articoli destinati alle riviste scientifiche e non solo.