Autore |
Discussione |
|
krampo
Nuovo Arrivato
3 Messaggi |
Inserito il - 03 agosto 2009 : 16:54:48
|
Sono uno studente di Informatica della Ca'Foscari e sto facendo una ricerca sul database di Pathway metabolici KEGG. In particolare sono interessato alla struttura del database e al DBMS. Ho cercato informazioni a riguardo ma non sono riuscito a trovare molto. Qualcuno č a conoscenza di qualche documento a riguardo? Ringrazio in anticipo.
Stefano
|
|
|
chick80
Moderatore
Cittā: Edinburgh
11491 Messaggi |
|
dallolio_gm
Moderatore
Prov.: Bo!
Cittā: Barcelona/Bologna
2445 Messaggi |
Inserito il - 03 agosto 2009 : 19:48:04
|
Le SOAP di KEGG le ho provate e non sono granchč, permettono di fare alcune cose ma rimagono un po' macchinose. Tra l'altro, non ho ancora trovato una buona libreria per questo protocollo per python.
Il database KEGG poi ha una complicazione ulteriore, ovvero tutti i geneId utilizzati sono specifici di KEGG, mentre la maggior parte dei ricercatori preferisce usare gli id di NCBI, quindi probabilmente ti troverai a dover fare delle conversioni.
Che cosa devi fare esattamente con KEGG? Qualche tempo fa avevo iniziato a scrivere un parser per il formato KGML (quello dei pathway), al momento sono un po' troppo incasinato per completarlo, ma se ti interessa ti posso dire come funziona e quali problemi ci sono: - http://github.com/dalloliogm/kegg-kgml-parser--python-/tree/master |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
krampo
Nuovo Arrivato
3 Messaggi |
Inserito il - 04 agosto 2009 : 14:39:03
|
Devo fare una ricerca per quanto riguarda il database. Sono interessato al punto di vista stettamente informatico, quindi alla realizzazione logica e fisica del database, alla sua struttura. Cercavo dei documenti che illustrassero la realizzazione tecnica del database e del DBMS, dato che sono stati realizzati "in casa" senza l'appoggio a DBMS come Oracle o MySQL. |
|
|
chick80
Moderatore
Cittā: Edinburgh
11491 Messaggi |
|
dallolio_gm
Moderatore
Prov.: Bo!
Cittā: Barcelona/Bologna
2445 Messaggi |
Inserito il - 04 agosto 2009 : 18:21:02
|
Citazione: Messaggio inserito da krampo
Devo fare una ricerca per quanto riguarda il database. Sono interessato al punto di vista stettamente informatico, quindi alla realizzazione logica e fisica del database, alla sua struttura. Cercavo dei documenti che illustrassero la realizzazione tecnica del database e del DBMS, dato che sono stati realizzati "in casa" senza l'appoggio a DBMS come Oracle o MySQL.
Sul serio? Non mi stupirei se fosse basato solo su flat files e xml....
Io non sono mai riuscito a trovare nessun accesso a un db su KEGG e le API si basano su WSDL, come dicevamo prima... per ottenere i sorgenti di pathway e dati generalmente si usa l'accesso FTP, che contiene files XML di diverso tipo, per le pathway e per i geni: - ftp://ftp.genome.jp/pub/kegg/ |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
Gert
Nuovo Arrivato
1 Messaggi |
Inserito il - 22 agosto 2009 : 17:15:05
|
I'm currently trying to find out sort of the same thing. Have you in the mean time obtained more information?
Reading the release notes (http://www.genome.jp/kegg/docs/relnote.html), you can cleary see that KEGG GENES, LIGAND and SSDB are based on Oracle.
In addition, I found an interesting -although old- PPT in which the KEGG developers announced their interest in further conversion towards Oracle: http://www.oracle.com/technology/industries/life_sciences/presentations/lsday903_8_2_Goto_KEGG.ppt.
So far I've found no information on DB schemas.
Cheers,
Gert
PS: hope you don't mind me replying in English, it goes much faster than writing in Italian, I've no trouble understanding Italian though. |
|
|
krampo
Nuovo Arrivato
3 Messaggi |
Inserito il - 27 agosto 2009 : 18:49:40
|
Interessante, non avevo notato che quei database erano sotto Oracle. Questo mi porterebbe a pensare che lo sia anche PATHWAY. Mi riesce difficile credere, dallolio_gm, che sia tutto basato su flat file, cross-references e xml. Sono invece convinto che ci sia un DBMS sotto (Oracle?) che gestisca la ridondanza dei dati, dal quale vengano estratti i database relazionali per renderli quindi disponibili come flat file. Purtroppo, ho scritto alcune volte al KEGG, ma non ho avuto risposte soddisfacenti, solo link a informazioni generiche che giā sapevo. Come te, Gert, non ho trovato lo schema del db. |
|
|
|
Discussione |
|