Quanto è utile/interessante questa discussione:
Autore |
Discussione |
|
Ra1D
Utente Junior
Prov.: Bergamo
Città: Treviglio
174 Messaggi |
Inserito il - 13 settembre 2007 : 14:03:42
|
Ciao a tutti.. sto svolgendo un progettino per un esame, in cui devo fare una classificazione supervisionata di 2 dataset proteici, usando Weka http://www.cs.waikato.ac.nz/ml/weka/ Entrambi contengono 2 proteine caratterizzate da 26 variabili numeriche e qualche migliaio di istanze. Gran parte del lavoro mi è chiaro, l'ho anche già svolto, usando diversi classificatori (random forest, bayes, etc..), preprocessing e valutando le curve ROCs dei diversi metodi. Quello che mi rimane ancora un pò oscuro è come posso abbozzare la spiegazione del perchè un metodo funzioni meglio di un altro. Credo si debba scendere nel particolare e valutare il funzionamento degli algoritmi alla base dei classificatori.
Se però qualcuno di voi ha già avuto a che fare con cose simili, magari mi sa dire qualche "trucco" del mestiere Ah, eventualmente anche un'esperienza pregressa col neural toolbox di MatLab potrebbe essermi utile Grazie grazie grazie
|
...e vicinissimo al mio sapere si accampa la tenebra della mia ignoranza... |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
|
Ra1D
Utente Junior
Prov.: Bergamo
Città: Treviglio
174 Messaggi |
Inserito il - 14 settembre 2007 : 00:35:10
|
Citazione: Messaggio inserito da chick80
Non ti so rispondere....
E con questo anche l'ultima Certezza sparisce!!!!Ora il mondo è tutto caos
Vabbè dai, mi consolo con le immagini dei weka....weki...ma c'è il plurale?....chissà se sanno di pollo.... Ok, delirio incontrollabile, vado a letto! Don't worry chick80, una soluzione la troverò, grazie lo stesso. |
...e vicinissimo al mio sapere si accampa la tenebra della mia ignoranza... |
|
|
bluevil
Nuovo Arrivato
17 Messaggi |
Inserito il - 16 settembre 2007 : 18:55:15
|
la spiegazione delle performance di un metodo risiede spesso nelle caratteristiche intrinseche del metodo stesso quindi non ti puoi esimere dal conoscere (anche soltanto i punti di forza del)l'algoritmo per spiegarne le prestazioni. Il che non sarebbe un problema se non ci fossero tool come weka che ti mettono a disposizione non so più ormai quanti classificatori(!) :-D Di solito funge così: si usa l'experimenter per testare le qualità medie di una serie di algoritmi sul dataset che ti interessa (in questo modo consenti al lettore del tuo articolo di farsi un'idea delle prestazioni che in media è possibile raggiungere con gli approcci già disponibili) e poi arrivi tu con un algoritmo che conosci per filo e per segno (magari perchè ti sei creato tu) e dici: ho ottenuto un risultato che non fa proprio schifo o, addirittura, in questo particolare contesto, riesce a surclassare il migliore dei metodi standard (nel nome di C4.5 o J48, i vari random forest, bayes, bayes tree, part in tutte le version bagged e boosted possibili). La spiegazione, a quel punto, la elabori sulla base di quello che TU hai progettato nel tuo algoritmo. Se tu non hai un algoritmo tuo ma vuoi soltanto descrivere come performano una serie di algoritmi (stai per caso rispondendo alla call del JCIB??? :-D) ti conviene dare un'occhiata alle descrizione degli algoritmi implementati in weka che viene fornita dagli stessi autori in
Data Mining, Witten & Frank 2005.
giusto per fare un esempio: C4.5 lavora molto bene con le classificazioni in cui le misurazioni siano affette da poca incertezza (quindi l'applicazione di metodi fuzzy non darebbe molto vantaggio) ed in cui la dicotomia tra le classi possa essere valutata facendo un semplice test statistico (chi-square, fisher) hth |
|
|
Ra1D
Utente Junior
Prov.: Bergamo
Città: Treviglio
174 Messaggi |
Inserito il - 17 settembre 2007 : 13:34:13
|
Grazie della risposta bluevil, come prevedevo dovrò affidarmi alla mia immaginazione, dato che non ho la minima idea di quale sia la fonte dei dati presenti nei due dataset. Ma dato che si tratta di un esame abbastanza generico, anzi di base (Bioinformatica: tecniche di base) e non devo creare un algoritmo apposito, credo sarà sufficiente fare un'analisi dei diversi metodi di classificazione che ci sono in weka usando il riferimento che mi hai dato. Ora ci butto subito un'occhiata, Ciao e grazie Simo |
...e vicinissimo al mio sapere si accampa la tenebra della mia ignoranza... |
|
|
|
Discussione |
|
|
|
Quanto è utile/interessante questa discussione:
MolecularLab.it |
© 2003-18 MolecularLab.it |
|
|
|