Quanto è utile/interessante questa discussione:
Autore |
Discussione |
|
gianpierolandolfi
Nuovo Arrivato
84 Messaggi |
Inserito il - 28 ottobre 2009 : 21:06:39
|
Ciao a tutti...
Sto studiando i database in bioinformatico. Sono un biotecnologo. Ho i seguenti dubbi dato che gli appunti sia le slide delle materia, che gli appunti che le informazioni che ho trovato in giro non sono molto esplicative.
1)Prima di tutto che cosa è un record o un entry? Io ho letto che è l'unità fondamentale del database come dire che ne so che la cellula è l'unità fondamentale di un organismo vivente...ovvero tutto e niente. Cosa c'è dentro un record??? 2) Cos'è una schema? 3) cos'è il formato flat file? Ho letto che per ogni riga c'è un record, com'è è possibile? Forse ho capito male io..non mi sembra che abbia molto senso. E che utilità ha il formato XML? Non basta la visualizzazione normale?
grazie in anticipo. Spero che mi possiate aiutare.
|
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 28 ottobre 2009 : 21:39:32
|
Citazione: Prima di tutto che cosa è un record o un entry? Ho letto che per ogni riga c'è un record, com'è è possibile?
Un record è semplicemente una riga nel database!
Immagina ad es. un ipotetico database di sequenze di DNA. Consideralo come una grande tabella; le colonne potrebbero essere: nome del gene, lunghezza, sequenza, numero del cromosoma, posizione sul cromosoma. Ciascuna riga (corrispondente a un gene) è un'entry (o record).
Citazione: Cos'è una schema?
Lo schema (pronunciato all'inglese, come "schima") è la struttura del database. Un po' come ti ho scritto sopra, dicendoti i nomi delle colonne. Lo schema però in generale sarà più complicato, in quanto avrai più di una tabella nel database e le tabelle possono essere collegate tra loro.
Citazione: cos'è il formato flat file?
Non è esattamente un formato. In generale per flat file si intende un file di testo leggibile in chiaro. E' possibile salvare i dati di un database in questo modo, oppure in un formato binario (che non puoi leggere direttamente, vedresti solamente una serie di strani caratteri).
Citazione: E che utilità ha il formato XML? Non basta la visualizzazione normale?
Il formato XML è utilizzato perchè è un formato standard per la codifica delle informazioni in informatica. La visualizzazione dei risultati è un altro paio di maniche. Ad es. quando fai una ricerca su Pubmed, tu vedi una visualizzazione "normale", ma effettivamente quando fai una ricerca il sito effettivamente crea quella visualizzazione sul file XML. |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
gianpierolandolfi
Nuovo Arrivato
84 Messaggi |
Inserito il - 28 ottobre 2009 : 23:50:23
|
Con poche parole mi hai fatto capire molto di più grazie davvero.
Io sulle slide ho scritto che uno schema è organizzato in un modello: flat file, relazionale, gerarchico e orientato in oggetti.
Quindi il database è organizzato in schema che è formato di righe.
Quello che non capisco è la differenza tra un modello flat file e un formato XML o ASN1...(almeno il mio prof lo indica così) Che senso a, e parlo da ignorante, elaborare un nuovo formato XML se c'è già il modello flat file?
Grazie ancora buona giornata. |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 29 ottobre 2009 : 00:19:12
|
Citazione: Che senso a, e parlo da ignorante, elaborare un nuovo formato XML se c'è già il modello flat file?
Prova a fare questa domanda su un forum di informatica e scatenerai una guerra!
Diciamo che il file XML generalmente non viene usato (che io sappia almeno) per mantenere i dati in un DB, ma più che altro per comunicare i dati. In effetti per grandi quantità di dati l'XML può essere overkilling.
Diciamo che io posso salvare i dati contenuti nel DB in un flat-file tipo:
1,pippo,aaacgattag,15
2,pluto,tgctcgactacgt,4
etc etc
Poi, in seguito ad una ricerca nel DB da parte di un utente posso restituire un file XML tipo:
<results>
<total>5</total>
<gene>
<id>1</id>
<name>pippo</name>
<sequence>aaacgattag</sequence>
<chromosome>15</chromosome>
</gene>
<gene>
<id>2</id>
<name>pluto<name>
<sequence>tgctcgactacgt</sequence>
<chromosome>4</chromosome>
</gene>
etc etc
Come vedi l'XML mi dà un livello in più della sola informazione contenuta nel DB, mi indica anche cosa rappresentano le varie entries. Se ti avessi restituito i risultati come flat file non avresti saputo chi era chi (a meno di non avere una documentazione). E' un modello strutturato in modo gerarchico, molto più facile da accedere e modificare (a livello di programmazione) che un flat file. Inoltre, nel momento in cui venisse per qualsiasi motivo cambiato l'ordine delle colonne il tuo programma continuerebbe a funzionare, in quanto i tag ti indicano cosa stai leggendo. Inoltre puoi avere informazioni che non sono direttamente presenti nel DB (es. il totale dei risultati nel mio esempio).
E' vero che a volte c'è una certa tendenza ad un misuso dell'XML. A volte un flat-file è sufficiente e più veloce dell'XML. A volte no.
Un esempio di risultato di query XML su Pubmed: http://www.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=pubmed&term=cancer&reldate=60&datetype=edat&retmax=100&usehistory=y
Sono gli ID dei primi 100 articoli restituiti dalla ricerca per "cancer", pubblicati negli ultimi 60 giorni |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
gianpierolandolfi
Nuovo Arrivato
84 Messaggi |
Inserito il - 29 ottobre 2009 : 12:30:42
|
sei davvaro gentile...purtroppo continuo a non capire un paio di cose.
Tanto per chiarezza, il mio prof dice che lo schema è organizzato in un modello: flat file, gerarchico, relazione e a oggetti orientati. E'per questo che uso il termine modello quando parlo con flat file.
1)Prendiamo il flat file: http://img408.imageshack.us/i/flatfile.gif/
prima di tutto cosa vuo dire in chiaro?? Intendi un semplice file di testo?
Quindi ogni riga ha un entry, a sinistra abbiamo il campo che identifica l'entry e a destra abbiamo la descrizione.
Ovviamente per avere più informazioni su un determinato gene dovremo avere un mucchio di entry.
Ora il mio prof ha detto che quando cerco con la la query vado a cercare il campo, ma il campo è ID, AC io quando faccio la query cerco con dei nomi...
2)A questo punto andiamo sul formato XML e aggingerei anche ASN1. A quanto ho capito sono delle evoluzioni del flat file utilizzate per recupare le informazion contenute nei database in modo da rendere il recupero più semplice e completo. Giusto. E che differenza c'è tra un XML e un ASN1 da un punto di vista pratico non tecnico ovviamente.
Cmq ti ringrazio della tue risposte che mi hanno aiutato a capire un pò di più.
buona giornata.
|
|
|
gianpierolandolfi
Nuovo Arrivato
84 Messaggi |
Inserito il - 29 ottobre 2009 : 12:36:10
|
Ah ti dovrei chiedere una altra cosa,
tu mi dici che con il formato XML abbiamo più informazioni, ok, ma se il mio modello flat file contiene tutte quelle entry in teoria anche li contiene tutte le informazioni. Quello che non capisco è come fa il pc ha recupera tutte le entry che sono collegata tra di loro in qualche modo? Ovviamente prendendo una singola entry è vero che abbiamo poche informazioni e quindi XML è più completo.
Non è una critica è che sto cercando di raccapezzarmi. Come ti ho detto non ho delle slide decenti e in giro non trovo una mazza anzi se cerco mi incasino di più. grazie ancora |
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 29 ottobre 2009 : 14:06:16
|
Citazione: Messaggio inserito da gianpierolandolfi
sei davvaro gentile...purtroppo continuo a non capire un paio di cose.
Tanto per chiarezza, il mio prof dice che lo schema è organizzato in un modello: flat file, gerarchico, relazione e a oggetti orientati. E'per questo che uso il termine modello quando parlo con flat file.
ci sono un po' di imprecisioni qui... questi sono tutti modelli di organizzazione di dati.
- flat files -> organizzi i dati in semplici file di testo, come nel formato CSV o in quello che hai postato. Immagina di scrivere una tabella in un file di testo semplice, separando le colonne con una virgola o una tabulazione: quello è un flat files. Il fatto che un database abbia uno schema a flat files vuol dire che le informazioni sono salvate su files di testo semplice.
- gerarchico -> le informazioni sono organizzate gerarchicamente, con una struttura ad albero. Esempi sono GeneOntology e il database degli organismi su NCBI, in cui la specia homo fa parte dell'ordine dei primati, che fa parte dei mammiferi, i quali sono vertebrati, etc..
- relazionale -> questo è il modello piu' comune di database, come MySQL o PostGres, Sqllite etc.. in un db relazionale hai diverse tabelle, che possono essere connesse da relazioni. Per esempio, hai una tabella 'organismi' ed una 'habitats', ed una relazione fra di essi, che vuol dire che ogni organismo e' associato a uno o piu' habitat.
- a oggetti -> un oggetto è una struttura dati disegnata per immagazzinare informazioni rispetto ad un tipo di 'oggetto' specifico. Per esempio, l'oggetto "Gene" puo' avere attributi come titolo, sequenza, posizione sul cromosoma; l'oggetto "organismo" puo' avere attributi come nome, specie, habitat, etc..
Citazione: 2)A questo punto andiamo sul formato XML e aggingerei anche ASN1. A quanto ho capito sono delle evoluzioni del flat file utilizzate per recupare le informazion contenute nei database in modo da rendere il recupero più semplice e completo. Giusto. E che differenza c'è tra un XML e un ASN1 da un punto di vista pratico non tecnico ovviamente.
Un documento XML segue delle regole dichiarate all'interno del documento stesso. Per esempio, all'inizio del documento definisci che userai un campo chiamato 'nome del gene' e che questo sará di tipo stringa, e cosi' via per tutti i campi.
Il principio di XML è quello di creare un documento che contenga tutte le informazioni necessarie per comprenderlo al suo interno, senza dover fare riferimento a pagine esterne.
Questo è molto utile perchè fa in modo che qualsiasi programma sia capace di leggere un documento XML, e di farlo allo stesso modo, cosa che non accade per un flat file normale.
Cmq ti ringrazio della tue risposte che mi hanno aiutato a capire un pò di più.
buona giornata.
[/quote] |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
gianpierolandolfi
Nuovo Arrivato
84 Messaggi |
Inserito il - 29 ottobre 2009 : 17:11:58
|
ok dovrei avere capito tutto.
Grazie ad entrambi.
buona giornata |
|
|
|
Discussione |
|
|
|
Quanto è utile/interessante questa discussione:
MolecularLab.it |
© 2003-18 MolecularLab.it |
|
|
|