Forum

Nome Utente:
Password:
Riconoscimi automaticamente
 Tutti i Forum
 Laboratorio
 Bioinformatica e Biostatistica
 Classificazione supervisionata - Weka
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
I seguenti utenti stanno leggendo questo Forum Qui c'è:

Aggiungi Tag Aggiungi i tag

Quanto è utile/interessante questa discussione:

Autore Discussione  

Ra1D
Utente Junior

giro-Ra1D
Prov.: Bergamo
Città: Treviglio


174 Messaggi

Inserito il - 13 settembre 2007 : 14:03:42  Mostra Profilo  Visita l'Homepage di Ra1D Invia a Ra1D un Messaggio Privato  Rispondi Quotando
Ciao a tutti..
sto svolgendo un progettino per un esame, in cui devo fare una classificazione supervisionata di 2 dataset proteici, usando Weka
http://www.cs.waikato.ac.nz/ml/weka/
Entrambi contengono 2 proteine caratterizzate da 26 variabili numeriche e qualche migliaio di istanze.
Gran parte del lavoro mi è chiaro, l'ho anche già svolto, usando diversi classificatori (random forest, bayes, etc..), preprocessing e valutando le curve ROCs dei diversi metodi.
Quello che mi rimane ancora un pò oscuro è come posso abbozzare la spiegazione del perchè un metodo funzioni meglio di un altro. Credo si debba scendere nel particolare e valutare il funzionamento degli algoritmi alla base dei classificatori.

Se però qualcuno di voi ha già avuto a che fare con cose simili, magari mi sa dire qualche "trucco" del mestiere
Ah, eventualmente anche un'esperienza pregressa col neural toolbox di MatLab potrebbe essermi utile
Grazie grazie grazie

...e vicinissimo al mio sapere si accampa la tenebra della mia ignoranza...

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 13 settembre 2007 : 23:37:50  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Non ti so rispondere.... però ti posso dire che ho visto un sacco di weka dal vivo!

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

Ra1D
Utente Junior

giro-Ra1D

Prov.: Bergamo
Città: Treviglio


174 Messaggi

Inserito il - 14 settembre 2007 : 00:35:10  Mostra Profilo  Visita l'Homepage di Ra1D Invia a Ra1D un Messaggio Privato  Rispondi Quotando
Citazione:
Messaggio inserito da chick80

Non ti so rispondere....

E con questo anche l'ultima Certezza sparisce!!!!Ora il mondo è tutto caos

Vabbè dai, mi consolo con le immagini dei weka....weki...ma c'è il plurale?....chissà se sanno di pollo....
Ok, delirio incontrollabile, vado a letto! Don't worry chick80, una soluzione la troverò, grazie lo stesso.

...e vicinissimo al mio sapere si accampa la tenebra della mia ignoranza...
Torna all'inizio della Pagina

bluevil
Nuovo Arrivato




17 Messaggi

Inserito il - 16 settembre 2007 : 18:55:15  Mostra Profilo  Visita l'Homepage di bluevil Invia a bluevil un Messaggio Privato  Rispondi Quotando
la spiegazione delle performance di un metodo risiede spesso nelle caratteristiche intrinseche del metodo stesso quindi non ti puoi esimere dal conoscere (anche soltanto i punti di forza del)l'algoritmo per spiegarne le prestazioni. Il che non sarebbe un problema se non ci fossero tool come weka che ti mettono a disposizione non so più ormai quanti classificatori(!) :-D
Di solito funge così: si usa l'experimenter per testare le qualità medie di una serie di algoritmi sul dataset che ti interessa (in questo modo consenti al lettore del tuo articolo di farsi un'idea delle prestazioni che in media è possibile raggiungere con gli approcci già disponibili) e poi arrivi tu con un algoritmo che conosci per filo e per segno (magari perchè ti sei creato tu) e dici: ho ottenuto un risultato che non fa proprio schifo o, addirittura, in questo particolare contesto, riesce a surclassare il migliore dei metodi standard (nel nome di C4.5 o J48, i vari random forest, bayes, bayes tree, part in tutte le version bagged e boosted possibili). La spiegazione, a quel punto, la elabori sulla base di quello che TU hai progettato nel tuo algoritmo.
Se tu non hai un algoritmo tuo ma vuoi soltanto descrivere come performano una serie di algoritmi (stai per caso rispondendo alla call del JCIB??? :-D) ti conviene dare un'occhiata alle descrizione degli algoritmi implementati in weka che viene fornita dagli stessi autori in

Data Mining, Witten & Frank 2005.

giusto per fare un esempio: C4.5 lavora molto bene con le classificazioni in cui le misurazioni siano affette da poca incertezza (quindi l'applicazione di metodi fuzzy non darebbe molto vantaggio) ed in cui la dicotomia tra le classi possa essere valutata facendo un semplice test statistico (chi-square, fisher)
hth
Torna all'inizio della Pagina

Ra1D
Utente Junior

giro-Ra1D

Prov.: Bergamo
Città: Treviglio


174 Messaggi

Inserito il - 17 settembre 2007 : 13:34:13  Mostra Profilo  Visita l'Homepage di Ra1D Invia a Ra1D un Messaggio Privato  Rispondi Quotando
Grazie della risposta bluevil, come prevedevo dovrò affidarmi alla mia immaginazione, dato che non ho la minima idea di quale sia la fonte dei dati presenti nei due dataset.
Ma dato che si tratta di un esame abbastanza generico, anzi di base (Bioinformatica: tecniche di base) e non devo creare un algoritmo apposito, credo sarà sufficiente fare un'analisi dei diversi metodi di classificazione che ci sono in weka usando il riferimento che mi hai dato.
Ora ci butto subito un'occhiata,
Ciao e grazie
Simo

...e vicinissimo al mio sapere si accampa la tenebra della mia ignoranza...
Torna all'inizio della Pagina
  Discussione  

Quanto è utile/interessante questa discussione:

 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
Vai a:
MolecularLab.it © 2003-18 MolecularLab.it Torna all'inizio della Pagina