Forum

Nome Utente:
Password:
Riconoscimi automaticamente
 Tutti i Forum
 MolecularLab
 Bioinformatica
 Interpretazione di un esercizio svolto sugli SNP
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
I seguenti utenti stanno leggendo questo Forum Qui c'è:

Aggiungi Tag Aggiungi i tag

Quanto è utile/interessante questa discussione:

Autore Discussione  

cammaratamarco
Nuovo Arrivato



15 Messaggi

Inserito il - 10 novembre 2009 : 16:55:29  Mostra Profilo  Visita l'Homepage di cammaratamarco Invia a cammaratamarco un Messaggio Privato  Rispondi Quotando
PREMESSA:
aff sta per affected in riferimento allo stato dei soggetti, mentre snp5 e snp10 sono due dei vari snp in esame. L'esercizio prevede l'utilizzo di R.

DOMANDA:
Test association between aff and snp5 and snp10, allowing for the SNPs interaction effect. Use arbitrary (not an additive) model. Do you observe significant interaction? How can you describe the model of concert action of snp5 and snp10?

RISPOSTA:
Dato il codice R:

> gcontrasts(snp5) <- "genotype"
> gcontrasts(snp10) <- "genotype"
> logit(aff ~ snp5 * snp10)
Logistic regression: aff ~ snp5 * snp10

Odds ratios (1 unit change), lower and upper confidence limits, and tests:

                        OR      Lower     Upper     z-test      P-value
snp5A/A          0.6583495 0.44728351 0.9690143 -2.1196014 3.403967e-02
snp5B/B          1.3971228 1.07526418 1.8153233 2.50317688 1.230840e-02
snp10A/B         0.9860685 0.68953030 1.4101353 -0.0768705 9.387265e-01
snp10B/B         0.8608534 0.29134395 2.5436212 -0.2710572 7.863470e-01
snp5A/A:snp10A/B 4.4091743 2.32051700 8.3777958 4.53036148 5.888285e-06
snp5B/B:snp10A/B 1.1387038 0.66501059 1.9498132 0.47334571 6.359666e-01
snp5A/A:snp10B/B 2.2784250 0.32752451 15.849868 0.83211257 4.053454e-01
snp5B/B:snp10B/B 0.7515445 0.06730847 8.3915024 -0.2320185 8.165236e-01

It appears that SNP10 genotype is only relevant in these who are homozygous for the low-risk A allele at the SNP5; in such cases SNP 10 allele B is risk increasing. In these homozygous for SNP 5 A, we observe highly significant increase in risk for heterozygotes for SNP10 and increased (though not significantly) risk for SNP 10 BB.


Qualcuno mi aiuta ad interpretare la risposta? Inoltre come risposndo alla domanda: Can you propose (and test) other modes of interaction?


GRAZIE!!

dallolio_gm
Moderatore


Prov.: Bo!
Città: Barcelona/Bologna


2445 Messaggi

Inserito il - 10 novembre 2009 : 19:14:57  Mostra Profilo  Visita l'Homepage di dallolio_gm  Clicca per vedere l'indirizzo MSN di dallolio_gm Invia a dallolio_gm un Messaggio Privato  Rispondi Quotando
Non conosco la libreria che hai postato (DGCgenetics), ma prova a dare una occhiata a questo documento:
- http://mga.bionet.nsc.ru/~yurii/courses/ge03-2007/ge03d1.pdf

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)
Torna all'inizio della Pagina

cammaratamarco
Nuovo Arrivato



15 Messaggi

Inserito il - 12 novembre 2009 : 09:55:02  Mostra Profilo  Visita l'Homepage di cammaratamarco Invia a cammaratamarco un Messaggio Privato  Rispondi Quotando
E' proprio da quel link che ho preso l'esercizio... il mio problema non è capire come funziona la libreria ma, più semplicemente, non riesco ad interpretare la risposta data alla domanda; fatta la regressione (dicotomica?) tra lo stato di tutti i soggetti (casi + controlli) e gli SNP 5 e 10 ne esce fuori la tabella di sopra, dove la colonna OR rappresenta l'Odds ratio (che, in pochissime parole, è l'indice del rischio associato agli SNP); siccome (e devo purtroppo ammetterlo) mi sono ritrovato a fare un corso di bioinformatica obbligatorio quando le mie conoscenze in merito hanno luogo da banali rimembranze liceali (faccio ingegneria...), ho parecchie difficoltà a capire il significato della risposta data; cioè:
It appears that SNP10 genotype is only relevant in these who are homozygous for the low-risk A allele at the SNP5; in such cases SNP 10 allele B is risk increasing. In these homozygous for SNP 5 A, we observe highly significant increase in risk for heterozygotes for SNP10 and increased (though not significantly) risk for SNP 10 BB.

Per di più, esiste una tecnica/modalità/modello alternativo che posso utilizzare per valutare l'interazione tra lo stato patologico dei soggetti e gli SNP? La domanda a cui dovrei rispondere dice anche di testare questa alternativa, quindi evidentemente esiste... peccato che non abbia la più pallida idea di quale sia la risposta.

Prendo spunto per fare un'altra domanda da idiota; fatta la solita regressione tra lo stato patologico e gli SNP 5 e 10 (presi separatamente) ne esce quanto segue:
> logit(aff ~ snp5)
Logistic regression: aff ~ snp5
Odds ratios (1 unit change), lower and upper confidence limits, and tests:
              OR    Lower    Upper   z-test     P-value
snp5A/A 1.235176 0.940558 1.622080 1.519212 0.128709107
snp5B/B 1.403072 1.124687 1.750364 3.001367 0.002687707
> logit(aff ~ snp10)
Logistic regression: aff ~ snp10
Odds ratios (1 unit change), lower and upper confidence limits, and tests:
                OR     Lower    Upper    z-test    P-value
snp10A/B 1.3376929 1.0695740 1.673023 2.5493546 0.01079225
snp10B/B 0.8350447 0.3664215 1.902999 -0.428953 0.66795715 

Quindi (sempre dal link da te postato) l'autore scrive:
The model of action of SNP5 can be described as recessive (while the risk for AA and AB is not significantly different, there is 1.4 (evidenziato in grassetto) times increased risk for these homozygous for BB). The SNP 10 demonstrates somewhat weird action with the risk increased in heterozygous AB individuals. However, the confidence interval for BB is large and therefore we can not claim that BB is not increasing the risk.

Quindi la mia domanda è: con quale criterio viene riconosciuto un modello additivo, dominante o recessivo?

Ovviamente ti ringrazio infinitamente per l'aiuto.

Marco
Torna all'inizio della Pagina

cammaratamarco
Nuovo Arrivato



15 Messaggi

Inserito il - 18 novembre 2009 : 13:00:22  Mostra Profilo  Visita l'Homepage di cammaratamarco Invia a cammaratamarco un Messaggio Privato  Rispondi Quotando
Nessuno sa aiutarmi?
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 19 novembre 2009 : 09:31:39  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
ciao...
allora
gli OR sono misure di associazione e sono una 'stima' del rischio di...
non sono una misura diretta del rischio di qualcosa spt quando sono derivati da studi caso controllo
assumono valori tra 0 e infinito
il valore 1 indica l'assenza di associazione tra la variabile outcome e il fattore di rischio
valore inferiori a 1 indicano che il fattore è preventivo cioè riduce il rischio
valori superiori a 1 indicano la variabile studiata aumenta il rischio

se gli intervalli di confidenza comprendono il valore 1 allora la stima non è statisticamente significativa..

ampi intervalli di confidenza indicano un modello instabile... ma per essere più accurati in questo giudizio bisognerebbe osservare il summary del modello con i regressori e i rispettivi errori standard

per testare i termini d'interazione dovresti a mio parere usare la funzione anova(mod)
cioè fai il tuo modello e lo salvi com un oggetto di R e poi applichi la funzione anova al modello salvato
ti restitutisce una tabella di anova in cui ti fa vdere il contributo in termini di variazione del log di verosimiglianza ( se ricordo giusto) dei diversi termini del modello compreso il termine generico d'interazione... se non è significativo puoi anche toglierlo dal modello finale...

boh non so se ti sono stato utile

a presto
TMax
Torna all'inizio della Pagina

cammaratamarco
Nuovo Arrivato



15 Messaggi

Inserito il - 19 novembre 2009 : 12:27:24  Mostra Profilo  Visita l'Homepage di cammaratamarco Invia a cammaratamarco un Messaggio Privato  Rispondi Quotando
Ti ringrazio, davvero apprezzabile il tuo aiuto (molto concreto), però mi sorge ancora qualche dubbio. Ho fatto il tentativo con anova e i tre modelli. Effettivamente il model of action of SNP5 can be described as recessive perchè tra i 3 p-value quello relativo al modello recessivo è l'unico minore di 0.05 (li ho evidenziati in grassetto).
Citazione:
> anova(logit(aff ~ dominant(snp5)), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: aff

Terms added sequentially (first to last)


               Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL                            2382     2440.4          
dominant(snp5)  1  0.29609      2381     2440.1    0.5863
> anova(logit(aff ~ additive(snp5)), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: aff

Terms added sequentially (first to last)


               Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL                            2382     2440.4          
additive(snp5)  1   2.2382      2381     2438.2    0.1346
> anova(logit(aff ~ recessive(snp5)), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: aff

Terms added sequentially (first to last)


                Df Deviance Resid. Df Resid. Dev P(>|Chi|)   
NULL                             2382     2440.4             
recessive(snp5)  1   6.9711      2381     2433.4  0.008284 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 



Però per lo SNP10 la conclusione resta ancora priva di fondamento. Alla luce del test anova applicato sui tre modelli, qual è il modello d'interazione?
Citazione:
> anova(logit(aff ~ dominant(snp10)), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: aff

Terms added sequentially (first to last)


                Df Deviance Resid. Df Resid. Dev P(>|Chi|)  
NULL                             2383     2475.1            
dominant(snp10)  2   6.7328      2381     2468.4   0.03451 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
> anova(logit(aff ~ additive(snp10)), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: aff

Terms added sequentially (first to last)


                Df Deviance Resid. Df Resid. Dev P(>|Chi|)  
NULL                             2383     2475.1            
additive(snp10)  1   3.7598      2382     2471.4    0.0525 .
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
> anova(logit(aff ~ recessive(snp10)), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: aff

Terms added sequentially (first to last)


                 Df Deviance Resid. Df Resid. Dev P(>|Chi|)  
NULL                              2383     2475.1            
recessive(snp10)  2   6.7328      2381     2468.4   0.03451 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 



Come si può vedere due p-value sono minori di 0.05 e tra l'altro sono pure uguali. Perchè? Cosa posso concludere? Non vorrei sembrare rompico***ni, ma il mio problema è che nell'esercizio che sto svolgendo (e del quale devo consegnare una breve relazione) tutti gli anova applicati su tutti i modelli applicati su tutti e 5 gli SNPs del mio esercizio ritornano p-value<0.05! infatti:
Citazione:
anova(logit(affected-1 ~ additive(snp1)), test = "Chisq") ritorna P(>|Chi|)=1.728e-05
anova(logit(affected-1 ~ additive(snp2)), test = "Chisq") ritorna P(>|Chi|)=0.002148
anova(logit(affected-1 ~ additive(snp3)), test = "Chisq") ritorna P(>|Chi|)=1.783e-06
anova(logit(affected-1 ~ additive(snp4)), test = "Chisq") ritorna P(>|Chi|)=3.517e-06
anova(logit(affected-1 ~ additive(snp5)), test = "Chisq") ritorna P(>|Chi|)<2.2e-16
anova(logit(affected-1 ~ dominant(snp1)), test = "Chisq") ritorna P(>|Chi|)=9.65e-05
anova(logit(affected-1 ~ dominant(snp2)), test = "Chisq") ritorna P(>|Chi|)=0.008948
anova(logit(affected-1 ~ dominant(snp3)), test = "Chisq") ritorna P(>|Chi|)=1.109e-05
anova(logit(affected-1 ~ dominant(snp4)), test = "Chisq") ritorna P(>|Chi|)=8.99e-05
anova(logit(affected-1 ~ dominant(snp5)), test = "Chisq") ritorna P(>|Chi|)<2.2e-16
anova(logit(affected-1 ~ recessive(snp1)), test = "Chisq") ritorna P(>|Chi|)=9.65e-05
anova(logit(affected-1 ~ recessive(snp2)), test = "Chisq") ritorna P(>|Chi|)=0.008948
anova(logit(affected-1 ~ recessive(snp3)), test = "Chisq") ritorna P(>|Chi|)=1.109e-05
anova(logit(affected-1 ~ recessive(snp4)), test = "Chisq") ritorna P(>|Chi|)=0.0002074
anova(logit(affected-1 ~ recessive(snp5)), test = "Chisq") ritorna P(>|Chi|)<2.2e-16




Sono parecchio confuso; per di più, a peggiorare la situazione si aggiunge il dubbio legato alla richiesta fatta all'inizio di questo topic. Vi ringrazio per l'aiuto e mi scuso per l'atteggiamento apparentemente poco simpatico (ma credetemi non voluto) che mostro.

Grazie!

Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 19 novembre 2009 : 12:55:38  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
...non conosco la funzione dominat, additive e recessive quindi nn ho idea di cosa faccia...
è mi pare specifica per il tuo campo di attività che non è il mio

all'inizio del topic c'è il risultato del modello
logit(aff ~ snp5 * snp10)

dovresti fare l'anova su questo per vedere la significatività del termine d'interazione tra le due covariate
snp5*snp10

dovresti avere un p value per l'snp5 uno per l'snp10 e uno per l'interazione tra i due termini

TMax

ps: non ti preoccupare i *******glio**, sono altri!
Torna all'inizio della Pagina

cammaratamarco
Nuovo Arrivato



15 Messaggi

Inserito il - 19 novembre 2009 : 13:09:15  Mostra Profilo  Visita l'Homepage di cammaratamarco Invia a cammaratamarco un Messaggio Privato  Rispondi Quotando
AHhhh... quindi il famoso other mode of interaction è l'anova... non lo avevo pensato!! Questo è il risultato:
Citazione:
> anova(logit(aff ~ snp5 * snp10), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: aff

Terms added sequentially (first to last)


           Df Deviance Resid. Df Resid. Dev P(>|Chi|)    
NULL                        2268     2282.4              
snp5        2  10.0071      2266     2272.4 0.0067139 ** 
snp10       2   6.9413      2264     2265.5 0.0310967 *  
snp5:snp10  4  22.5429      2260     2242.9 0.0001562 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 



In effetti c'è parecchia significatività nell'interazione tra lo SNP5 e lo SNP10.
Per quanto riguarda il comando dominant/recessive/additive non fanno altro che ricodificare il genotipo dato in input nel modello dominante/recessivo/additivo; quindi nel caso dello SNP5 ne esce fuori che tentando i tre modelli l'unico che presenta significatività è quello recessivo (da cui il solito model of action of SNP5 can be described as recessive). Come dicevo il problema nasce sullo SNP10 di questo esercizio già svolto ma, soprattutto, sul mio esercizio da svolgere dove TUTTO è significativo e dove per ogni SNP si può dire che il modello di interazione è dominante E recessivo E additivo. Forse, visto che tutti i p-value sono minori di 0.05, dovrei prendere il più piccolo tra i 3 p-value restituiti dai tre test? Pare ragionevole come considerazione? Secondo questa mia infondata ipotesi tutti i modelli di interazione sarebbero additivi a parte per lo SNP5 dove i tre test restituiscono sempre P(>|Chi|)<2.2e-16. Cosa ne pensi?

Ancora grazie!
Torna all'inizio della Pagina

cammaratamarco
Nuovo Arrivato



15 Messaggi

Inserito il - 20 novembre 2009 : 12:41:27  Mostra Profilo  Visita l'Homepage di cammaratamarco Invia a cammaratamarco un Messaggio Privato  Rispondi Quotando
Nulla? Proprio adesso che sembrerebbe si stia arrivando ad una conclusione... non abbandonatemi, vi prego...
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 20 novembre 2009 : 14:13:26  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
.............miiiiiiiiiiiiiiiiiiiiiiiii che impaziente!!!!
guarda che sto a lavurà! :-)


fai una cosa (vado alla cieca però)

fitta ( voce del verbo fittare... cioè... fai un modello)
fitta i diversi modelli (dopo aver deciso sulla base dell'anova se includere o meno l'interazione)

fai un anova tra modelli

cioè supponi che fai il modello addittivo
mod1
poi fai il modello recessivo
mod2

poi fai anova(mod1, mod2)
dovrebbe restituirti il chi quadro della differenza dei llogg di verosimiglianza (che poi sarebbe una misura della devianza del modello)
se nn ci sono differenze allora almeno statisticamente un modello vale l'altro
se invece ci sono allora scegli il modello con la devianza più piccola...

sono andato alla cieca
Torna all'inizio della Pagina

cammaratamarco
Nuovo Arrivato



15 Messaggi

Inserito il - 20 novembre 2009 : 14:36:12  Mostra Profilo  Visita l'Homepage di cammaratamarco Invia a cammaratamarco un Messaggio Privato  Rispondi Quotando
Ho fatto come hai detto (prendendo come esempio lo SNP4); all'inizio trovi gli anova applicati sui singoli modelli e dopo trovi gli anova per tutte le combinazioni tra i modelli (quindi domimant:additive, dominant:recessive, additive:recessive). Cosa si può concludere? Come interpreto i risultati?

Ancora GRAZIE!!
(e come al solito scusa la ma impazienza)

Citazione:
> anova(logit(affected-1 ~ dominant(snp4)), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: affected - 1

Terms added sequentially (first to last)


               Df Deviance Resid. Df Resid. Dev P(>|Chi|)    
NULL                            1029     1357.3              
dominant(snp4)  1   15.338      1028     1342.0  8.99e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
> anova(logit(affected-1 ~ additive(snp4)), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: affected - 1

Terms added sequentially (first to last)


               Df Deviance Resid. Df Resid. Dev P(>|Chi|)    
NULL                            1029     1357.3              
additive(snp4)  1   21.511      1028     1335.8 3.517e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
> anova(logit(affected-1 ~ recessive(snp4)), test = "Chisq")
Analysis of Deviance Table

Model: binomial, link: logit

Response: affected - 1

Terms added sequentially (first to last)


                Df Deviance Resid. Df Resid. Dev P(>|Chi|)    
NULL                             1029     1357.3              
recessive(snp4)  1   13.763      1028     1343.6 0.0002074 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
> anova(logit(affected-1 ~ dominant(snp4)), logit(affected-1 ~ additive(snp4)), test = "Chisq")
Analysis of Deviance Table

Model 1: affected - 1 ~ dominant(snp4)
Model 2: affected - 1 ~ additive(snp4)
  Resid. Df Resid. Dev Df Deviance P(>|Chi|)
1      1028     1342.0                      
2      1028     1335.8  0   6.1738          
> anova(logit(affected-1 ~ dominant(snp4)), logit(affected-1 ~ recessive(snp4)), test = "Chisq")
Analysis of Deviance Table

Model 1: affected - 1 ~ dominant(snp4)
Model 2: affected - 1 ~ recessive(snp4)
  Resid. Df Resid. Dev Df Deviance P(>|Chi|)
1      1028     1342.0                      
2      1028     1343.6  0  -1.5746          
> anova(logit(affected-1 ~ additive(snp4)), logit(affected-1 ~ recessive(snp4)), test = "Chisq")
Analysis of Deviance Table

Model 1: affected - 1 ~ additive(snp4)
Model 2: affected - 1 ~ recessive(snp4)
  Resid. Df Resid. Dev Df Deviance P(>|Chi|)
1      1028     1335.8                      
2      1028     1343.6  0  -7.7483          

Torna all'inizio della Pagina

cammaratamarco
Nuovo Arrivato



15 Messaggi

Inserito il - 23 novembre 2009 : 13:09:12  Mostra Profilo  Visita l'Homepage di cammaratamarco Invia a cammaratamarco un Messaggio Privato  Rispondi Quotando
Ultimo aiutino?? Chi mi aiuta ad interpretare gli ultimi anova?

GRAZIE!
Torna all'inizio della Pagina

cammaratamarco
Nuovo Arrivato



15 Messaggi

Inserito il - 24 novembre 2009 : 14:18:51  Mostra Profilo  Visita l'Homepage di cammaratamarco Invia a cammaratamarco un Messaggio Privato  Rispondi Quotando
Tranquilli, è l'ultima volta che insisto; purtroppo dopo 14 giorni è arrivato il giorno della consegna del mio lavoro; comunque, se qualcuno entro mezzanotte vuole aiutarmi lo ringrazio infinitamente.

Marco
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 24 novembre 2009 : 16:19:29  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
mah... se guardi le devianze residue (quando confronti tra loro i modelli) le differenze sono proprio minuscole, cosi verrebbe da dire che tutti i modelli sono uguali quindi scegli quello che ha più senso dal punto di vista biologico

mi spiace ma più di cosi non so come aiutarti!!


TMax
Torna all'inizio della Pagina
  Discussione  

Quanto è utile/interessante questa discussione:

 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
Vai a:
MolecularLab.it © 2003-18 MolecularLab.it Torna all'inizio della Pagina