Autore |
Discussione |
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 01 ottobre 2012 : 12:28:15
|
per l'applicazione del test esatto di fisher, premesso una frequenza minore di 10, qual è il limite di numerosità di uno dei campione per poter applicare questo nella pratica? un campione di 155 soggetti non è già troppo elevato? grazie
|
|
|
kORdA
Utente Attivo
Prov.: Milano
Città: Monza
1303 Messaggi |
Inserito il - 01 ottobre 2012 : 13:11:40
|
Un limite superiore non credo che esista, esiste solo nei tempi di calcolo a seconda dell'implementazione dell'algoritmo. Io l'ho usato per vedere l'overrepresentation di GO terms su un subset di geni (ben più di 155) contro il genoma. Sicuramente ci sarà un limite inferiore per quanto riguarda la numerosità dell'universo di riferimento. Giusto per darti un'idea su altri test statistici, la goodness of fit spesso presuppone, a seconda dei casi, almeno una trentina di punti. |
http://www.linkedin.com/in/dariocorrada |
|
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 01 ottobre 2012 : 14:00:19
|
ok grazie ultima domanda: è preferibile che le numerosità dei due campioni siano pressoché uguali oppure no? tipo io qui ho 155 soggetti in un campione e 53 nell'altro |
|
|
kORdA
Utente Attivo
Prov.: Milano
Città: Monza
1303 Messaggi |
Inserito il - 01 ottobre 2012 : 16:20:05
|
Su questo credo che ci siano esperti di statistica molto più ferrati di me in questo forum. Comunque la numerosità della popolazione dovrebbe essere molto inferiore a quella dell'universo da cui, appunto, è stata campionata. Nel mio caso avevo centinania di geni overrepresented contro le decine di migliaia del genoma di riferimento. Io avevo preso spunto da questo paper per farmi una idea
Citazione: Gusev Y. Computational methods for analysis of cellular functions and pathways collectively targeted by differentially expressed microRNA. Methods. 2008 Jan;44(1):61-72. Review. PubMed PMID: 18158134.
|
http://www.linkedin.com/in/dariocorrada |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 01 ottobre 2012 : 17:31:37
|
Il test esatto di Fisher è, come dice il nome, esatto. Non c'è un limite superiore di N per cui diventa inesatto.
Il fatto che spesso venga detto di non usarlo per N>10 (o 20 o 50 etc) è semplicemente un problema dovuto al fatto che non è pratico farlo manualmente. Oggigiorno, un computer può fare tranquillamente un test di Fisher con N>100 senza problema. |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 01 ottobre 2012 : 19:08:48
|
perfetto grazie :) |
|
|
Glubus
Utente Junior
156 Messaggi |
Inserito il - 02 ottobre 2012 : 08:02:09
|
Come regola euristica si consiglia il test esatto quando il valore ATTESO (fai attenzione: non quello osservato) in una qualche cella di una tabella 2X2 sia minore di 5 (o 10). Stefano
Citazione: Messaggio inserito da Dimo
per l'applicazione del test esatto di fisher, premesso una frequenza minore di 10, qual è il limite di numerosità di uno dei campione per poter applicare questo nella pratica? un campione di 155 soggetti non è già troppo elevato? grazie
|
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 02 ottobre 2012 : 09:14:14
|
Infatti!!! è un errore comune quello di riferirsi al dato osservato invece di quello atteso.
Citazione: Messaggio inserito da Glubus
Come regola euristica si consiglia il test esatto quando il valore ATTESO (fai attenzione: non quello osservato) in una qualche cella di una tabella 2X2 sia minore di 5 (o 10). Stefano
Citazione: Messaggio inserito da Dimo
per l'applicazione del test esatto di fisher, premesso una frequenza minore di 10, qual è il limite di numerosità di uno dei campione per poter applicare questo nella pratica? un campione di 155 soggetti non è già troppo elevato? grazie
|
|
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 02 ottobre 2012 : 16:31:23
|
sì è vera la storia del valore atteso...l'avevo dimenticata :) dunque il valore atteso è in una tabella 11.9 e in un'altra 15.8.quindi applico il chi-quadro con 1 g.d.l.
qui comunque è un po' un casotto, perché mi ritrovo dei p-value (calcolati da chi ha svolto quest'analisi prima di me) che non coincidono con quelli calcolati da me in pratica ci sono diverse categorie e ci sono due tipi di trattamento: chiamiamoli A e B si vuole vedere quanto ha influito la differenza di trattamento (in quanto a complicazioni) su ciascuna di queste categorie ora io considero sempre ciascuna singola categoria confrontandola con tutte le altre, in modo tale da creare una tabella 2x2 (credo solo su una tabella 2x2 si possa fare un test esatto di fisher o no?) il trattamento A dà un numero superiore di complicazioni rispetto al trattamento B, per tutte le categorie, meno che una dove qui si verifica il contrario (2 complicazioni per il trattamento A, 4 per il trattamento B)... lo scopo dell'analisi credo fosse quello di verificare se il trattamento B desse meno complicazioni, così ho pensato di considerare come ipotesi alternativa "greater", ma come comportarmi per la categoria che fa l'eccezione? lì avrei un p-value di 0.99 |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 02 ottobre 2012 : 18:51:09
|
Citazione: Messaggio inserito da Glubus
Come regola euristica si consiglia il test esatto quando il valore ATTESO (fai attenzione: non quello osservato) in una qualche cella di una tabella 2X2 sia minore di 5 (o 10).
Mi dai una spiegazione matematica di questa regola? Sinceramente non riesco a comprenderla se non per i sopracitati problemi di durata del calcolo. |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 02 ottobre 2012 : 18:59:44
|
Citazione: Messaggio inserito da chick80
Citazione: Messaggio inserito da Glubus
Come regola euristica si consiglia il test esatto quando il valore ATTESO (fai attenzione: non quello osservato) in una qualche cella di una tabella 2X2 sia minore di 5 (o 10).
Mi dai una spiegazione matematica di questa regola? Sinceramente non riesco a comprenderla se non per i sopracitati problemi di durata del calcolo.
in pratica allora, se non c'è una regola matematica, perché si distingue il test chi-quadro (con 1 gdl) dal test di fisher? in ogni caso la mia domanda di prima è ancora valida :) |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 02 ottobre 2012 : 21:40:39
|
Citazione: Messaggio inserito da Dimo in pratica allora, se non c'è una regola matematica, perché si distingue il test chi-quadro (con 1 gdl) dal test di fisher? in ogni caso la mia domanda di prima è ancora valida :)
Quello che sapevo io (ma posso sbagliarmi) è che il chi quadro è un'approssimazione, mentre il test di Fisher è un test esatto.
Essendo un approssimazione, il chi quadro è più facile da calcolare, ma non funziona bene per n piccoli, è per quello che per valori attesi < 10 si consiglia di usare Fisher, in quanto il chi quadro non è opportuno in queste situazioni (e non perchè Fisher non sia corretto per valori attesi > 10).
Conferme di questa cosa? |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
kORdA
Utente Attivo
Prov.: Milano
Città: Monza
1303 Messaggi |
Inserito il - 03 ottobre 2012 : 09:25:25
|
Citazione: Messaggio inserito da Dimo
io considero sempre ciascuna singola categoria confrontandola con tutte le altre, in modo tale da creare una tabella 2x2 (credo solo su una tabella 2x2 si possa fare un test esatto di fisher o no?)
Mi sembra di ricordare che esistono varianti del del test esatto di Fisher anche per tabelle di contigenza superiori a 2x2, però non mi viene in mente come si chiamano... suggerimenti? |
http://www.linkedin.com/in/dariocorrada |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 03 ottobre 2012 : 15:04:27
|
R ti calcola il test di Fisher per tabelle nxm, sempre sotto il nome di "Fisher test"
L'help di fisher.test dice:
Citazione: For 2 by 2 cases, p-values are obtained directly using the (central or non-central) hypergeometric distribution. Otherwise, computations are based on a C version of the FORTRAN subroutine FEXACT which implements the network developed by Mehta and Patel (1986) and improved by Clarkson, Fan and Joe (1993). The FORTRAN code can be obtained from <URL: http://www.netlib.org/toms/643>.
|
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 04 ottobre 2012 : 08:24:21
|
a parte le questioni tecniche sul test di fisher , non puoi affidarti ad un test statistico per decidere se un trattamento funziona o no!
|
|
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 04 ottobre 2012 : 12:22:02
|
Citazione: Messaggio inserito da TMax
a parte le questioni tecniche sul test di fisher , non puoi affidarti ad un test statistico per decidere se un trattamento funziona o no!
ma va? :) |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 04 ottobre 2012 : 12:52:07
|
e allora perchè ti preoccupi dei valori di p?? |
|
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 04 ottobre 2012 : 13:19:30
|
Citazione: Messaggio inserito da TMax
e allora perchè ti preoccupi dei valori di p??
per svolgere l'analisi in maniera corretta visto che confrontando con l'analisi di chi l'ha svolta prima di me non mi ritrovo coi risultati
cmq ho effettuato il test di mann-whitney sulle età dei pazienti dei due trattamenti. il p-value è al limite: 0.049 che si fa in questi casi: si accetta o si rifiuta? :) |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 04 ottobre 2012 : 13:47:07
|
lancia una moneta se esce Testa allora accetti se esce Croce allora rifiuti
hai 50% di probabilità di fare la scelta giusta! :)
|
|
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 04 ottobre 2012 : 14:13:48
|
Citazione: Messaggio inserito da TMax
lancia una moneta se esce Testa allora accetti se esce Croce allora rifiuti
hai 50% di probabilità di fare la scelta giusta! :)
cos'è una moneta? io ho solo pezzi di carta
chiuso OT :) |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 04 ottobre 2012 : 14:54:08
|
io, purtroppo, ero serio... cmq sia se vuoi una mano prova a chiarirci meglio il disegno dello studio almeno, io, che sono abbastanza tonto non riesco a capire quello che stai facendo prima parlavi di trattamenti e ora di un confronto tra le età dei pazienti...
boh! |
|
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 04 ottobre 2012 : 20:12:30
|
dunque l'analisi era già stata svolta prima di me e mi hanno chiesto di controllarla e modificarle per alcuni dettagli ci sono dei pazienti con delle età praticamente è stata verificata l'assenza di normalità tra le età dei pazienti con lo shapiro wilk e poi è stato applicato il test di mann whitney credo per vedere se la differenza tra le età possa aver influito sui due tipi di trattamento dopodiché è stato eseguito il test di fisher per verificare se c'era una diminuzione significativa delle complicazioni ora mi è sorto un dubbio: su campioni non normali si può utilizzare il mann whitney?
|
|
|
Glubus
Utente Junior
156 Messaggi |
Inserito il - 05 ottobre 2012 : 08:12:04
|
Scusa Dimo, ti do un consiglio: consulta uno statistico o un'esperto di statistica. Buona parte di quello che hai fatto appartiene ad una stantìa "liturgia" della analisi dei dati e rivela alcune erronee concezioni al riguardo dei test di ipotesi. Purtroppo questo è il modo di insegnare la statistica che ancora viene praticato in tante università e, acora peggio, sembra che questo tipo di analisi sia utile per poter pubblicare su una buona parte delle riviste scientifiche. Perciò non ti offendere. Su questo forum trovi anche altre persone in grado di aiutarti ad affrontare in modo più utile e rigoroso il tuo problema, a patto che tu ce lo voglia spiegare dall'inizio.
Stefano
Citazione: Messaggio inserito da Dimo
dunque l'analisi era già stata svolta prima di me e mi hanno chiesto di controllarla e modificarle per alcuni dettagli ci sono dei pazienti con delle età praticamente è stata verificata l'assenza di normalità tra le età dei pazienti con lo shapiro wilk e poi è stato applicato il test di mann whitney credo per vedere se la differenza tra le età possa aver influito sui due tipi di trattamento dopodiché è stato eseguito il test di fisher per verificare se c'era una diminuzione significativa delle complicazioni ora mi è sorto un dubbio: su campioni non normali si può utilizzare il mann whitney?
|
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 05 ottobre 2012 : 08:25:04
|
già! non posso che accodarmi all'invito di Glubus.... aspettiamo tue nuove!
Citazione: Messaggio inserito da Glubus
Scusa Dimo, ti do un consiglio: consulta uno statistico o un'esperto di statistica. Buona parte di quello che hai fatto appartiene ad una stantìa "liturgia" della analisi dei dati e rivela alcune erronee concezioni al riguardo dei test di ipotesi. Purtroppo questo è il modo di insegnare la statistica che ancora viene praticato in tante università e, acora peggio, sembra che questo tipo di analisi sia utile per poter pubblicare su una buona parte delle riviste scientifiche. Perciò non ti offendere. Su questo forum trovi anche altre persone in grado di aiutarti ad affrontare in modo più utile e rigoroso il tuo problema, a patto che tu ce lo voglia spiegare dall'inizio.
Stefano
Citazione: Messaggio inserito da Dimo
dunque l'analisi era già stata svolta prima di me e mi hanno chiesto di controllarla e modificarle per alcuni dettagli ci sono dei pazienti con delle età praticamente è stata verificata l'assenza di normalità tra le età dei pazienti con lo shapiro wilk e poi è stato applicato il test di mann whitney credo per vedere se la differenza tra le età possa aver influito sui due tipi di trattamento dopodiché è stato eseguito il test di fisher per verificare se c'era una diminuzione significativa delle complicazioni ora mi è sorto un dubbio: su campioni non normali si può utilizzare il mann whitney?
|
|
|
Dimo
Nuovo Arrivato
25 Messaggi |
Inserito il - 05 ottobre 2012 : 08:42:03
|
non ho capito su cosa mi dovrei offendere e sinceramente su cosa non sono stato chiaro :) l'analisi mira a verificare se un certo tipo di trattamento dà meno complicazioni rispetto ad un altro. preliminarmente è stato fatto il test di mann whitney sulle età dei pazienti e credo sia stato fatto per verificare se la differenza dell'età media tra i pazienti dei due gruppi (cioè dei due trattamenti) fosse così significativa da aver inciso sull'analisi del numero di complicazioni. i due gruppi sono indipendenti e disomogenei. il test di mann whitney è stato applicato dopo aver verificato l'assenza di normalità in ciascuno dei due gruppi. ho semplicemente chiesto se per l'applicazione del test di mann whitney i campioni devono avere distribuzione normale o no aiutatemi a capire in cosa non mi sono spiegato :D |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 05 ottobre 2012 : 08:55:21
|
non spieghi il disegno sperimentale non spieghi la natura delle variabili non spieghi qual'è l'outcome e la sua natura non spieghi la presenza o meno di fattori subsperimentali non formuli nessuna ipotesi....
semplicemente fai una cosa meccanica, usi dei software che fanno delle cose e che producono i famosi P value.........
|
|
|
Discussione |
|