Classificazione supervisionata

Forum

Registrati Discussioni Recenti Preferiti Utenti Cerca Regolamento RSS Statistiche

Utilità

I libri
consigliati:

Ologenesi
Daniele Rosa

L'avventura della ricerca. Storia degli uomini che hanno inventato il mondo
Daniel J. Boorstin

Genetica molecolare umana
Jack J. Pasternak

Altri Libri

Nome Utente:	Password:
Riconoscimi automaticamente

Tutti i Forum

MolecularLab

Bioinformatica

Classificazione supervisionata - Weka

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Risorse di Bioinformatica:

Guide tools online

Blog InsideBioinfo

Siti di Bioinformatica

Protocolli

Ultime notizie

Aggiungi i tag

Quanto � utile/interessante questa discussione:

Autore

Discussione

Ra1D
Utente Junior

Prov.: Bergamo
Citt�: Treviglio

174 Messaggi

Inserito il - 13 settembre 2007 : 14:03:42

Ciao a tutti..
sto svolgendo un progettino per un esame, in cui devo fare una classificazione supervisionata di 2 dataset proteici, usando Weka
http://www.cs.waikato.ac.nz/ml/weka/
Entrambi contengono 2 proteine caratterizzate da 26 variabili numeriche e qualche migliaio di istanze.
Gran parte del lavoro mi � chiaro, l'ho anche gi� svolto, usando diversi classificatori (random forest, bayes, etc..), preprocessing e valutando le curve ROCs dei diversi metodi.
Quello che mi rimane ancora un p� oscuro � come posso abbozzare la spiegazione del perch� un metodo funzioni meglio di un altro. Credo si debba scendere nel particolare e valutare il funzionamento degli algoritmi alla base dei classificatori.

Se per� qualcuno di voi ha gi� avuto a che fare con cose simili, magari mi sa dire qualche "trucco" del mestiere

Ah, eventualmente anche un'esperienza pregressa col neural toolbox di MatLab potrebbe essermi utile

Grazie grazie grazie

...e vicinissimo al mio sapere si accampa la tenebra della mia ignoranza...

chick80
Moderatore

Citt�: Edinburgh

11491 Messaggi

Inserito il - 13 settembre 2007 : 23:37:50

Non ti so rispondere.... per� ti posso dire che ho visto un sacco di weka dal vivo!

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)

Ra1D
Utente Junior

Prov.: Bergamo
Citt�: Treviglio

174 Messaggi

Inserito il - 14 settembre 2007 : 00:35:10

Citazione:
Messaggio inserito da chick80

Non ti so rispondere....

E con questo anche l'ultima Certezza sparisce!!!!Ora il mondo � tutto caos

Vabb� dai, mi consolo con le immagini dei weka....weki...ma c'� il plurale?....chiss� se sanno di pollo....
Ok, delirio incontrollabile, vado a letto! Don't worry chick80, una soluzione la trover�, grazie lo stesso.

...e vicinissimo al mio sapere si accampa la tenebra della mia ignoranza...

bluevil
Nuovo Arrivato

17 Messaggi

Inserito il - 16 settembre 2007 : 18:55:15

la spiegazione delle performance di un metodo risiede spesso nelle caratteristiche intrinseche del metodo stesso quindi non ti puoi esimere dal conoscere (anche soltanto i punti di forza del)l'algoritmo per spiegarne le prestazioni. Il che non sarebbe un problema se non ci fossero tool come weka che ti mettono a disposizione non so pi� ormai quanti classificatori(!) :-D
Di solito funge cos�: si usa l'experimenter per testare le qualit� medie di una serie di algoritmi sul dataset che ti interessa (in questo modo consenti al lettore del tuo articolo di farsi un'idea delle prestazioni che in media � possibile raggiungere con gli approcci gi� disponibili) e poi arrivi tu con un algoritmo che conosci per filo e per segno (magari perch� ti sei creato tu) e dici: ho ottenuto un risultato che non fa proprio schifo o, addirittura, in questo particolare contesto, riesce a surclassare il migliore dei metodi standard (nel nome di C4.5 o J48, i vari random forest, bayes, bayes tree, part in tutte le version bagged e boosted possibili). La spiegazione, a quel punto, la elabori sulla base di quello che TU hai progettato nel tuo algoritmo.
Se tu non hai un algoritmo tuo ma vuoi soltanto descrivere come performano una serie di algoritmi (stai per caso rispondendo alla call del JCIB??? :-D) ti conviene dare un'occhiata alle descrizione degli algoritmi implementati in weka che viene fornita dagli stessi autori in

Data Mining, Witten & Frank 2005.

giusto per fare un esempio: C4.5 lavora molto bene con le classificazioni in cui le misurazioni siano affette da poca incertezza (quindi l'applicazione di metodi fuzzy non darebbe molto vantaggio) ed in cui la dicotomia tra le classi possa essere valutata facendo un semplice test statistico (chi-square, fisher)
hth

Ra1D
Utente Junior

Prov.: Bergamo
Citt�: Treviglio

174 Messaggi

Inserito il - 17 settembre 2007 : 13:34:13

Grazie della risposta bluevil, come prevedevo dovr� affidarmi alla mia immaginazione, dato che non ho la minima idea di quale sia la fonte dei dati presenti nei due dataset.
Ma dato che si tratta di un esame abbastanza generico, anzi di base (Bioinformatica: tecniche di base) e non devo creare un algoritmo apposito, credo sar� sufficiente fare un'analisi dei diversi metodi di classificazione che ci sono in weka usando il riferimento che mi hai dato.
Ora ci butto subito un'occhiata,
Ciao e grazie
Simo

...e vicinissimo al mio sapere si accampa la tenebra della mia ignoranza...

Discussione

Quanto � utile/interessante questa discussione:

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Vai a:

MolecularLab.it

Android e Mobile



Scarica le app! Ora anche sul tuo smartphone!

Ciao Login - Iscriviti



Visitatori: 169

Novità
Protocolli di laboratorio: reagenti e tecniche usate in laboratorio biomedico e molecolare.