Ciao a tutti,
sto cercando di analizzare delle tabelle di contingenza 3x3 e non sono troppo sicuro di come interpretare i risultati...
Allora, ho 3 gruppi sperimentali G1, G2 e G3.
Ho fatto un'analisi di clustering ed ho classificato ciascun osservazione di questi 3 gruppi in 3 tipi, chiamiamoli T1, T2 e T3
Ho quindi una tabella di contingenza 3 x 3 con le percentuali di ogni tipo per gruppo, ad es (dati fittizi):
| T1 | T2 | T3 |
------+---------+---------+---------+---
G1 | 30 | 30 | 40 |
------+---------+---------+---------+---
G2 | 20 | 10 | 70 |
------+---------+---------+---------+---
G3 | 25 | 35 | 40 |
Ho pensato di fare un test di Fisher ed ottengo
Fisher's Exact Test for Count Data
data: data
p-value = 6.841e-06
alternative hypothesis: two.sided
Perfetto, ora come faccio a sapere chi è diverso da chi? Direi che in questo caso "a occhio" è il gruppo 2 ad essere diverso dagli altri, ma come dirlo? Inoltre è corretto mettere le percentuali o dovrei mettere il numero di elementi in ciascun gruppo (i 3 gruppi non hanno lo stesso numero di osservazioni).
In alternativa sarebbe corretta un'analisi solo parziale? Ad es. a me interessa valutare se nel gruppo 2 ci siano effettivamente più osservazioni di tipo 3 rispetto al gruppo 3, e che il gruppo 1 e il 3 invece non sono differenti. Potrei fare dei test di fisher separati per determinare ciò? Ho provato a leggere un po' la letteratura ma non ho trovato niente di veramente convincente su come analizzare questo tipo di dati...