Autore |
Discussione |
|
cammaratamarco
Nuovo Arrivato
15 Messaggi |
Inserito il - 10 novembre 2009 : 16:55:29
|
PREMESSA: aff sta per affected in riferimento allo stato dei soggetti, mentre snp5 e snp10 sono due dei vari snp in esame. L'esercizio prevede l'utilizzo di R.
DOMANDA: Test association between aff and snp5 and snp10, allowing for the SNPs interaction effect. Use arbitrary (not an additive) model. Do you observe significant interaction? How can you describe the model of concert action of snp5 and snp10?
RISPOSTA: Dato il codice R:
> gcontrasts(snp5) <- "genotype"
> gcontrasts(snp10) <- "genotype"
> logit(aff ~ snp5 * snp10)
Logistic regression: aff ~ snp5 * snp10
Odds ratios (1 unit change), lower and upper confidence limits, and tests:
OR Lower Upper z-test P-value
snp5A/A 0.6583495 0.44728351 0.9690143 -2.1196014 3.403967e-02
snp5B/B 1.3971228 1.07526418 1.8153233 2.50317688 1.230840e-02
snp10A/B 0.9860685 0.68953030 1.4101353 -0.0768705 9.387265e-01
snp10B/B 0.8608534 0.29134395 2.5436212 -0.2710572 7.863470e-01
snp5A/A:snp10A/B 4.4091743 2.32051700 8.3777958 4.53036148 5.888285e-06
snp5B/B:snp10A/B 1.1387038 0.66501059 1.9498132 0.47334571 6.359666e-01
snp5A/A:snp10B/B 2.2784250 0.32752451 15.849868 0.83211257 4.053454e-01
snp5B/B:snp10B/B 0.7515445 0.06730847 8.3915024 -0.2320185 8.165236e-01
It appears that SNP10 genotype is only relevant in these who are homozygous for the low-risk A allele at the SNP5; in such cases SNP 10 allele B is risk increasing. In these homozygous for SNP 5 A, we observe highly significant increase in risk for heterozygotes for SNP10 and increased (though not significantly) risk for SNP 10 BB.
Qualcuno mi aiuta ad interpretare la risposta? Inoltre come risposndo alla domanda: Can you propose (and test) other modes of interaction?
GRAZIE!!
|
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
|
cammaratamarco
Nuovo Arrivato
15 Messaggi |
Inserito il - 12 novembre 2009 : 09:55:02
|
E' proprio da quel link che ho preso l'esercizio... il mio problema non è capire come funziona la libreria ma, più semplicemente, non riesco ad interpretare la risposta data alla domanda; fatta la regressione (dicotomica?) tra lo stato di tutti i soggetti (casi + controlli) e gli SNP 5 e 10 ne esce fuori la tabella di sopra, dove la colonna OR rappresenta l'Odds ratio (che, in pochissime parole, è l'indice del rischio associato agli SNP); siccome (e devo purtroppo ammetterlo) mi sono ritrovato a fare un corso di bioinformatica obbligatorio quando le mie conoscenze in merito hanno luogo da banali rimembranze liceali (faccio ingegneria...), ho parecchie difficoltà a capire il significato della risposta data; cioè: It appears that SNP10 genotype is only relevant in these who are homozygous for the low-risk A allele at the SNP5; in such cases SNP 10 allele B is risk increasing. In these homozygous for SNP 5 A, we observe highly significant increase in risk for heterozygotes for SNP10 and increased (though not significantly) risk for SNP 10 BB.
Per di più, esiste una tecnica/modalità/modello alternativo che posso utilizzare per valutare l'interazione tra lo stato patologico dei soggetti e gli SNP? La domanda a cui dovrei rispondere dice anche di testare questa alternativa, quindi evidentemente esiste... peccato che non abbia la più pallida idea di quale sia la risposta.
Prendo spunto per fare un'altra domanda da idiota; fatta la solita regressione tra lo stato patologico e gli SNP 5 e 10 (presi separatamente) ne esce quanto segue:
> logit(aff ~ snp5)
Logistic regression: aff ~ snp5
Odds ratios (1 unit change), lower and upper confidence limits, and tests:
OR Lower Upper z-test P-value
snp5A/A 1.235176 0.940558 1.622080 1.519212 0.128709107
snp5B/B 1.403072 1.124687 1.750364 3.001367 0.002687707
> logit(aff ~ snp10)
Logistic regression: aff ~ snp10
Odds ratios (1 unit change), lower and upper confidence limits, and tests:
OR Lower Upper z-test P-value
snp10A/B 1.3376929 1.0695740 1.673023 2.5493546 0.01079225
snp10B/B 0.8350447 0.3664215 1.902999 -0.428953 0.66795715 Quindi (sempre dal link da te postato) l'autore scrive: The model of action of SNP5 can be described as recessive (while the risk for AA and AB is not significantly different, there is 1.4 (evidenziato in grassetto) times increased risk for these homozygous for BB). The SNP 10 demonstrates somewhat weird action with the risk increased in heterozygous AB individuals. However, the confidence interval for BB is large and therefore we can not claim that BB is not increasing the risk.
Quindi la mia domanda è: con quale criterio viene riconosciuto un modello additivo, dominante o recessivo?
Ovviamente ti ringrazio infinitamente per l'aiuto.
Marco |
|
|
cammaratamarco
Nuovo Arrivato
15 Messaggi |
Inserito il - 18 novembre 2009 : 13:00:22
|
Nessuno sa aiutarmi? |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 19 novembre 2009 : 09:31:39
|
ciao... allora gli OR sono misure di associazione e sono una 'stima' del rischio di... non sono una misura diretta del rischio di qualcosa spt quando sono derivati da studi caso controllo assumono valori tra 0 e infinito il valore 1 indica l'assenza di associazione tra la variabile outcome e il fattore di rischio valore inferiori a 1 indicano che il fattore è preventivo cioè riduce il rischio valori superiori a 1 indicano la variabile studiata aumenta il rischio
se gli intervalli di confidenza comprendono il valore 1 allora la stima non è statisticamente significativa..
ampi intervalli di confidenza indicano un modello instabile... ma per essere più accurati in questo giudizio bisognerebbe osservare il summary del modello con i regressori e i rispettivi errori standard
per testare i termini d'interazione dovresti a mio parere usare la funzione anova(mod) cioè fai il tuo modello e lo salvi com un oggetto di R e poi applichi la funzione anova al modello salvato ti restitutisce una tabella di anova in cui ti fa vdere il contributo in termini di variazione del log di verosimiglianza ( se ricordo giusto) dei diversi termini del modello compreso il termine generico d'interazione... se non è significativo puoi anche toglierlo dal modello finale...
boh non so se ti sono stato utile
a presto TMax |
|
|
cammaratamarco
Nuovo Arrivato
15 Messaggi |
Inserito il - 19 novembre 2009 : 12:27:24
|
Ti ringrazio, davvero apprezzabile il tuo aiuto (molto concreto), però mi sorge ancora qualche dubbio. Ho fatto il tentativo con anova e i tre modelli. Effettivamente il model of action of SNP5 can be described as recessive perchè tra i 3 p-value quello relativo al modello recessivo è l'unico minore di 0.05 (li ho evidenziati in grassetto).
Citazione:
> anova(logit(aff ~ dominant(snp5)), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: aff
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 2382 2440.4
dominant(snp5) 1 0.29609 2381 2440.1 0.5863
> anova(logit(aff ~ additive(snp5)), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: aff
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 2382 2440.4
additive(snp5) 1 2.2382 2381 2438.2 0.1346
> anova(logit(aff ~ recessive(snp5)), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: aff
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 2382 2440.4
recessive(snp5) 1 6.9711 2381 2433.4 0.008284 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Però per lo SNP10 la conclusione resta ancora priva di fondamento. Alla luce del test anova applicato sui tre modelli, qual è il modello d'interazione?
Citazione:
> anova(logit(aff ~ dominant(snp10)), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: aff
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 2383 2475.1
dominant(snp10) 2 6.7328 2381 2468.4 0.03451 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> anova(logit(aff ~ additive(snp10)), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: aff
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 2383 2475.1
additive(snp10) 1 3.7598 2382 2471.4 0.0525 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> anova(logit(aff ~ recessive(snp10)), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: aff
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 2383 2475.1
recessive(snp10) 2 6.7328 2381 2468.4 0.03451 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Come si può vedere due p-value sono minori di 0.05 e tra l'altro sono pure uguali. Perchè? Cosa posso concludere? Non vorrei sembrare rompico***ni, ma il mio problema è che nell'esercizio che sto svolgendo (e del quale devo consegnare una breve relazione) tutti gli anova applicati su tutti i modelli applicati su tutti e 5 gli SNPs del mio esercizio ritornano p-value<0.05! infatti:
Citazione: anova(logit(affected-1 ~ additive(snp1)), test = "Chisq") ritorna P(>|Chi|)=1.728e-05 anova(logit(affected-1 ~ additive(snp2)), test = "Chisq") ritorna P(>|Chi|)=0.002148 anova(logit(affected-1 ~ additive(snp3)), test = "Chisq") ritorna P(>|Chi|)=1.783e-06 anova(logit(affected-1 ~ additive(snp4)), test = "Chisq") ritorna P(>|Chi|)=3.517e-06 anova(logit(affected-1 ~ additive(snp5)), test = "Chisq") ritorna P(>|Chi|)<2.2e-16 anova(logit(affected-1 ~ dominant(snp1)), test = "Chisq") ritorna P(>|Chi|)=9.65e-05 anova(logit(affected-1 ~ dominant(snp2)), test = "Chisq") ritorna P(>|Chi|)=0.008948 anova(logit(affected-1 ~ dominant(snp3)), test = "Chisq") ritorna P(>|Chi|)=1.109e-05 anova(logit(affected-1 ~ dominant(snp4)), test = "Chisq") ritorna P(>|Chi|)=8.99e-05 anova(logit(affected-1 ~ dominant(snp5)), test = "Chisq") ritorna P(>|Chi|)<2.2e-16 anova(logit(affected-1 ~ recessive(snp1)), test = "Chisq") ritorna P(>|Chi|)=9.65e-05 anova(logit(affected-1 ~ recessive(snp2)), test = "Chisq") ritorna P(>|Chi|)=0.008948 anova(logit(affected-1 ~ recessive(snp3)), test = "Chisq") ritorna P(>|Chi|)=1.109e-05 anova(logit(affected-1 ~ recessive(snp4)), test = "Chisq") ritorna P(>|Chi|)=0.0002074 anova(logit(affected-1 ~ recessive(snp5)), test = "Chisq") ritorna P(>|Chi|)<2.2e-16
Sono parecchio confuso; per di più, a peggiorare la situazione si aggiunge il dubbio legato alla richiesta fatta all'inizio di questo topic. Vi ringrazio per l'aiuto e mi scuso per l'atteggiamento apparentemente poco simpatico (ma credetemi non voluto) che mostro.
Grazie!
|
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 19 novembre 2009 : 12:55:38
|
...non conosco la funzione dominat, additive e recessive quindi nn ho idea di cosa faccia... è mi pare specifica per il tuo campo di attività che non è il mio
all'inizio del topic c'è il risultato del modello logit(aff ~ snp5 * snp10)
dovresti fare l'anova su questo per vedere la significatività del termine d'interazione tra le due covariate snp5*snp10
dovresti avere un p value per l'snp5 uno per l'snp10 e uno per l'interazione tra i due termini
TMax
ps: non ti preoccupare i *******glio**, sono altri!
|
|
|
cammaratamarco
Nuovo Arrivato
15 Messaggi |
Inserito il - 19 novembre 2009 : 13:09:15
|
AHhhh... quindi il famoso other mode of interaction è l'anova... non lo avevo pensato!! Questo è il risultato:
Citazione:
> anova(logit(aff ~ snp5 * snp10), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: aff
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 2268 2282.4
snp5 2 10.0071 2266 2272.4 0.0067139 **
snp10 2 6.9413 2264 2265.5 0.0310967 *
snp5:snp10 4 22.5429 2260 2242.9 0.0001562 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
In effetti c'è parecchia significatività nell'interazione tra lo SNP5 e lo SNP10. Per quanto riguarda il comando dominant/recessive/additive non fanno altro che ricodificare il genotipo dato in input nel modello dominante/recessivo/additivo; quindi nel caso dello SNP5 ne esce fuori che tentando i tre modelli l'unico che presenta significatività è quello recessivo (da cui il solito model of action of SNP5 can be described as recessive). Come dicevo il problema nasce sullo SNP10 di questo esercizio già svolto ma, soprattutto, sul mio esercizio da svolgere dove TUTTO è significativo e dove per ogni SNP si può dire che il modello di interazione è dominante E recessivo E additivo. Forse, visto che tutti i p-value sono minori di 0.05, dovrei prendere il più piccolo tra i 3 p-value restituiti dai tre test? Pare ragionevole come considerazione? Secondo questa mia infondata ipotesi tutti i modelli di interazione sarebbero additivi a parte per lo SNP5 dove i tre test restituiscono sempre P(>|Chi|)<2.2e-16. Cosa ne pensi?
Ancora grazie! |
|
|
cammaratamarco
Nuovo Arrivato
15 Messaggi |
Inserito il - 20 novembre 2009 : 12:41:27
|
Nulla? Proprio adesso che sembrerebbe si stia arrivando ad una conclusione... non abbandonatemi, vi prego... |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 20 novembre 2009 : 14:13:26
|
.............miiiiiiiiiiiiiiiiiiiiiiiii che impaziente!!!! guarda che sto a lavurà! :-)
fai una cosa (vado alla cieca però)
fitta ( voce del verbo fittare... cioè... fai un modello) fitta i diversi modelli (dopo aver deciso sulla base dell'anova se includere o meno l'interazione)
fai un anova tra modelli
cioè supponi che fai il modello addittivo mod1 poi fai il modello recessivo mod2
poi fai anova(mod1, mod2) dovrebbe restituirti il chi quadro della differenza dei llogg di verosimiglianza (che poi sarebbe una misura della devianza del modello) se nn ci sono differenze allora almeno statisticamente un modello vale l'altro se invece ci sono allora scegli il modello con la devianza più piccola...
sono andato alla cieca
|
|
|
cammaratamarco
Nuovo Arrivato
15 Messaggi |
Inserito il - 20 novembre 2009 : 14:36:12
|
Ho fatto come hai detto (prendendo come esempio lo SNP4); all'inizio trovi gli anova applicati sui singoli modelli e dopo trovi gli anova per tutte le combinazioni tra i modelli (quindi domimant:additive, dominant:recessive, additive:recessive). Cosa si può concludere? Come interpreto i risultati?
Ancora GRAZIE!! (e come al solito scusa la ma impazienza)
Citazione:
> anova(logit(affected-1 ~ dominant(snp4)), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: affected - 1
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 1029 1357.3
dominant(snp4) 1 15.338 1028 1342.0 8.99e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> anova(logit(affected-1 ~ additive(snp4)), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: affected - 1
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 1029 1357.3
additive(snp4) 1 21.511 1028 1335.8 3.517e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> anova(logit(affected-1 ~ recessive(snp4)), test = "Chisq")
Analysis of Deviance Table
Model: binomial, link: logit
Response: affected - 1
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 1029 1357.3
recessive(snp4) 1 13.763 1028 1343.6 0.0002074 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> anova(logit(affected-1 ~ dominant(snp4)), logit(affected-1 ~ additive(snp4)), test = "Chisq")
Analysis of Deviance Table
Model 1: affected - 1 ~ dominant(snp4)
Model 2: affected - 1 ~ additive(snp4)
Resid. Df Resid. Dev Df Deviance P(>|Chi|)
1 1028 1342.0
2 1028 1335.8 0 6.1738
> anova(logit(affected-1 ~ dominant(snp4)), logit(affected-1 ~ recessive(snp4)), test = "Chisq")
Analysis of Deviance Table
Model 1: affected - 1 ~ dominant(snp4)
Model 2: affected - 1 ~ recessive(snp4)
Resid. Df Resid. Dev Df Deviance P(>|Chi|)
1 1028 1342.0
2 1028 1343.6 0 -1.5746
> anova(logit(affected-1 ~ additive(snp4)), logit(affected-1 ~ recessive(snp4)), test = "Chisq")
Analysis of Deviance Table
Model 1: affected - 1 ~ additive(snp4)
Model 2: affected - 1 ~ recessive(snp4)
Resid. Df Resid. Dev Df Deviance P(>|Chi|)
1 1028 1335.8
2 1028 1343.6 0 -7.7483
|
|
|
cammaratamarco
Nuovo Arrivato
15 Messaggi |
Inserito il - 23 novembre 2009 : 13:09:12
|
Ultimo aiutino?? Chi mi aiuta ad interpretare gli ultimi anova?
GRAZIE! |
|
|
cammaratamarco
Nuovo Arrivato
15 Messaggi |
Inserito il - 24 novembre 2009 : 14:18:51
|
Tranquilli, è l'ultima volta che insisto; purtroppo dopo 14 giorni è arrivato il giorno della consegna del mio lavoro; comunque, se qualcuno entro mezzanotte vuole aiutarmi lo ringrazio infinitamente.
Marco |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 24 novembre 2009 : 16:19:29
|
mah... se guardi le devianze residue (quando confronti tra loro i modelli) le differenze sono proprio minuscole, cosi verrebbe da dire che tutti i modelli sono uguali quindi scegli quello che ha più senso dal punto di vista biologico
mi spiace ma più di cosi non so come aiutarti!!
TMax |
|
|
|
Discussione |
|