Quanto è utile/interessante questa discussione:
Autore |
Discussione |
|
MB
Nuovo Arrivato
58 Messaggi |
Inserito il - 28 novembre 2010 : 18:19:46
|
Salve a tutti,
sto facendo un lavoro di comparazione tra dati osservati e predetti da alcuni softwares. Per farlo nel mio lab hanno sempre usato il metodo di regressione lineare e il parametro r..non solo anche in tutti i papers che ho letto. Ovviamente nessuno si è mai preoccupato di fare o almeno di scrivere se l'applicazione del modello lineare sia stato corretto o no. Dunqeu per scrupolo mi sono messo a valutare i presupposti. In particolare ho valutato:
media dei residui prossima a zero; normalità dei residui con shapiro-wilk; omoschedasticità con Breusch-Pagan; autocorrelazione con Durbin-Watson.
Ho trovato questa scaletta su delle dispense su CRAN di Vito Ricci.
Ora..spesso capita che qualcuno di questi test venga significativo (quando non dovrebbe), nonostante valori di Rquadro o r o pearson altini.
esempio:
Osservato Predetto
1.47 0.89
3.54 1.56
3.54 1.09
4.13 1.33
9.44 -2.86
9.44 -1.27
10.03 0.58
10.03 -0.48
11.79 -0.08
11.79 -2.19
12.97 -2.54
13.86 -2.79
15.04 -0.99
18.87 -2.23
22.11 -3.06
22.70 -1.52
23.59 -2.60
29.78 -3.19
ho fatto i test ottenendo (ho riportato solo i pvalue):
* Linear model summary
R-squared [1] 0.769999
p-value [1] 0.0001857291
* T-test for the mean
[1] 1
* Shapiro-Wilk test for residual distribution
[1] 0.8205446
* Breusch-Pagan test for homoscedasticity
BP
0.01812737
* Durbin-Watson test for autocorrelation
[1] 0.004554093
Da qui vedo che c'è eteroschedasticità e autocorrelazione..ora Come mi comporto?
|
|
|
Glubus
Utente Junior
156 Messaggi |
Inserito il - 29 novembre 2010 : 12:15:21
|
scusa la sottigliezza ma visti gli osservati e gli attesi l'ultimo problemi che mi farei sarebbero quelli della normalità, della omogeneità della varianza e della non autocorrelazione
Stefano
Citazione: Messaggio inserito da MB
Salve a tutti, sto facendo un lavoro di comparazione tra dati osservati e predetti da alcuni softwares. Per farlo nel mio lab hanno sempre usato il metodo di regressione lineare e il parametro r..non solo anche in tutti i papers che ho letto. Ovviamente nessuno si è mai preoccupato di fare o almeno di scrivere se l'applicazione del modello lineare sia stato corretto o no. Dunqeu per scrupolo mi sono messo a valutare i presupposti. In particolare ho valutato:
media dei residui prossima a zero; normalità dei residui con shapiro-wilk; omoschedasticità con Breusch-Pagan; autocorrelazione con Durbin-Watson.
Ho trovato questa scaletta su delle dispense su CRAN di Vito Ricci.
Ora..spesso capita che qualcuno di questi test venga significativo (quando non dovrebbe), nonostante valori di Rquadro o r o pearson altini.
esempio:
Osservato Predetto
1.47 0.89
3.54 1.56
3.54 1.09
4.13 1.33
9.44 -2.86
9.44 -1.27
10.03 0.58
10.03 -0.48
11.79 -0.08
11.79 -2.19
12.97 -2.54
13.86 -2.79
15.04 -0.99
18.87 -2.23
22.11 -3.06
22.70 -1.52
23.59 -2.60
29.78 -3.19
ho fatto i test ottenendo (ho riportato solo i pvalue):
* Linear model summary
R-squared [1] 0.769999
p-value [1] 0.0001857291
* T-test for the mean
[1] 1
* Shapiro-Wilk test for residual distribution
[1] 0.8205446
* Breusch-Pagan test for homoscedasticity
BP
0.01812737
* Durbin-Watson test for autocorrelation
[1] 0.004554093
Da qui vedo che c'è eteroschedasticità e autocorrelazione..ora Come mi comporto?
|
|
|
MB
Nuovo Arrivato
58 Messaggi |
Inserito il - 29 novembre 2010 : 14:31:44
|
ciao Globus,
cosa ci vedi? non badare al fatto che mentre l'uno sale l'altro scende, quello è perchè non guardano direttamente lo stesso parametro. Quelli osservati usano dei reporter per osservarlo, quindi fluorescenza..è una misura indiretta e come vedi inversamente correlata. Nel primo messaggio mi sono espresso male, non voglio vedere se i predetti si avvicinano quantitativamente agli osservati, voglio solo vedere se correlano.. |
|
|
Glubus
Utente Junior
156 Messaggi |
Inserito il - 29 novembre 2010 : 15:07:38
|
ah, adesso capisco, non è osservato ed atteso in senso statistico, ... evidentemente i dati sono correlati, stai misurando anche se in modo diverso, uno stesso processo che genera i tuoi dati. Non so se misurare la correlazione serva veramente: qui mi aspetterei che la correlazione sussita altrimenti uno dei due metodi di misurazione non servirebbe a nulla. Per la correlazione non è necessario assumere normalità e tutte le belle cose necessarie per i modelli lineari. come suggerimento: qui vedo (ad occhio) un problema di non linearità nella relazione, forse una retta non è la miglio scelta per interpolare i dati. A margine: che software hai usato? (quel R^2 non mi torna)
Citazione: Messaggio inserito da MB
ciao Globus,
cosa ci vedi? non badare al fatto che mentre l'uno sale l'altro scende, quello è perchè non guardano direttamente lo stesso parametro. Quelli osservati usano dei reporter per osservarlo, quindi fluorescenza..è una misura indiretta e come vedi inversamente correlata. Nel primo messaggio mi sono espresso male, non voglio vedere se i predetti si avvicinano quantitativamente agli osservati, voglio solo vedere se correlano..
|
|
|
MB
Nuovo Arrivato
58 Messaggi |
Inserito il - 29 novembre 2010 : 15:41:11
|
si, detto meglio, tu misuri quel parametro in vivo mediante fluorescenza, ecc., ma cmq una misura indiretta e alla fine inversamente proporzionale. Han fatto poi dei software che in base a varie assunzioni predicono (in silico) lo stesso parametro. Io voglio vedere se quelle previsioni almeno correlano con i dati sperimentali.
Ho usato R e lmtest per fare quei test. C'è un errore quello non è R quadro come ho scritto è semplicemente il coefficiente di correlazione r (la radice di Rquadro, o c. di Pearson) questo è il parametro che suano per dire il mio software predice bene o male. Conta anche che gli osservati sono fluorescenze relative, ovvero il valore corrispondente al mutante fratto lo wild-type, mentre i predetti sono in scala ln (quel software predice ln(mutante/wild-type) per come è stato fatto). Tutti gli altri software non si basano su algoritmi in scala ln, così ho lasciato com'è. Dici sarebbe opportuno tenere gli osservati in scala ln e rivalutare il modello lineare?
Grazie Globus |
|
|
|
Discussione |
|
|
|
Quanto è utile/interessante questa discussione:
MolecularLab.it |
© 2003-18 MolecularLab.it |
|
|
|