Autore |
Discussione |
|
domi84
Moderatore
Città: Glasgow
1724 Messaggi |
Inserito il - 23 dicembre 2008 : 10:19:57
|
Ho due valori e calcolo la media e la dev. standard e li voglio mettere su un grafico. Quando metto la media e la deviazione standard sul grafico, la scala del grafico si setta sul valore di media, ma non di deviazione standard, che può uscire fuori dal grafico. Come si può risolvere? E' un bug?
Allego anche un immagine...
Immagine:
21,59 KB
|
Il mio blog: http://domi84.blogspot.com/ Le foto che ho scattato... |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 23 dicembre 2008 : 16:00:10
|
risolvi a monte il problema evita di fare un grafico di questo genere...tra gli statistici non è molto popolare ... ha poco senso!! cosi come ad esempio le torte che dovrebbero essere vietate per legge :-))
ciao e buon natale |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 23 dicembre 2008 : 16:35:25
|
Però è il grafico standard nei giornali di ambito biologico
Ha perfettamente senso indicando il numero di osservazioni. |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 23 dicembre 2008 : 17:04:22
|
se si trattasse di errore standard avrebbe senso l'indicazione del numero di osservazioni per la dev.std. no Il fatto che sia uno dei grafici standard nei giornali di ambito biologico la dice lunga sullo stato in cui versa la metodologia della ricerca :-) auguri! |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 23 dicembre 2008 : 17:47:45
|
ah ops... non avevo letto bene il messaggio... pensavo si trattasse di errore standard... :)
ritiro quanto detto (anche se comunque se dai n l'errore standard lo sai) |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
domi84
Moderatore
Città: Glasgow
1724 Messaggi |
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 24 dicembre 2008 : 09:35:44
|
Di solito nelle pubblicazioni scientifiche viene messo l'errore standard.
Ti do la mia spiegazione anche se forse non sarà statisticamente corretta.... TMax correggimi se sbaglio
La deviazione standard e l'errore standard sono entrambi misure della variabilità del tuo campione. E' importante usarli per dire quanto il tuo campione sia "sparso".
Ad es. un campione con valori: 0,10,20 avrà una media di 10
Ma la stessa media la puoi avere con 9.9, 10.0, 10.1
Quello che cambia è che il secondo campione è molto più "riproducibile" del primo.
Ora, ci sono molti modi di dire quanto dispersi sono i dati del tuo campione. Puoi indicare l'intervallo di dispersione (max-min), che però non è il max (pun intended) perchè ad es. è lo stesso in queste 2 distribuzioni:
10.0, 10.0, 10.0, 10.0, 9.0
e
9.0, 9.5, 9.8, 9.0, 10.0
E' chiaro che nella prima hai avuto un outlier, magari per qualche problema tecnico, nella seconda invece hai molta più variabilità.
---
Un metodo migliore è guardare quella che si chiama devianza e che è calcolata come somma di (x - xm)^2 dove xm è la media. Insomma, prendi ciascun valore, vedi quanto è lontano dalla media e ne fai il quadrato. Tanto più è alta la devianza tanto più è sparso il campione.
---
Dalla devianza puoi trovare la varianza indicata con sigma^2 e uguale alla devianza/n. Per un campione di dimensioni ridotte si deve in realtà usare la correzione di Student che mette al denominatore i gradi di libertà: quindi per un campione ridotto la varianza (ora indicata con s^2 invece di sigma^2) è uguale alla devianza/n-1.
Su una popolazione molto grande n ~= n-1 quindi i due valori non sono molto differenti.
---
Dalla varianza puoi trovare la deviazione std. o scarto quadratico medio, indicato con sigma o con s (a seconda di che varianza si usa).
sigma=radice quadrata di sigma^2 s = radice di s^2
Nelle pubblicazioni biologiche generalmente la dev. std è indicata con SD.
---
L'errore std altro non è che la dev. std. diviso la radice quadrata del numero di campioni. Viene generalmente indicato con SEM.
Quindi, tecnicamente dare SD o SEM è uguale a patto che lo specifichi e che dai il numero di osservazioni (sapere SD e n è come sapere SEM).
La differenza, come puoi leggere qui: Error bars in experimental biology. è dovuta al fatto che la SD è una misura prettamente descrittiva (cioè, ti dice quanto sia sparso il tuo campione), mentre il SEM (o gli intervalli di confidenza) sono inferenziali, cioè ti permettono di dire dove starà la media vera della popolazione facendo un numero sufficientemente alto di esperimenti. (e di confrontare le barre tra di loro "a occhio" con buona confidenza, cosa che non puoi fare con la SD... ma non dirlo a uno statistico).
Ovviamente quindi è meglio dare il SEM e evitare ai lettori di doverselo calcolare da SD e n, però non sono d'accordo sul fatto che sia in assoluto sbagliato fare le barre di errore con la SD. |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
domi84
Moderatore
Città: Glasgow
1724 Messaggi |
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 25 dicembre 2008 : 15:35:36
|
Hai provato con openoffice 3? |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 25 dicembre 2008 : 21:58:03
|
Caro Chick80.. mi tocca correggerti!! ..
hai scritto: "La deviazione standard e l'errore standard sono entrambi misure della variabilità del tuo campione. E' importante usarli per dire quanto il tuo campione sia "sparso".
Sicuro???
errore standard e deviazione standard al di là dei metodi di calcolo..fanno riferimento a due concetti completamente differenti!
L'errore standard non è assolutamente una misura della variabilità di un campione! Al contrario è una misura della precisione della stima di un parametro di popolazione! la deviazione standard SI in L'errore standard di una media è la misura della variabilità delle medie campionarie, fa riferimento alle distribuzioni campionarie che per effetto del teorema del limite centrale tendono ad apporssimare una distribuione gaussiana!
Se sono noti ad esempio i parametri ( media e dev.stand) di una popolazione, se si immagina di eseguire un numero grande di campioni della stessa dimensione n da suddetta popolazione si otterranno per ogni campione differenti valori di medie che possono essere descritti mediante una curva che approssima una distribuzione gaussiana... la media delle medie campionarie coincide con la media della popolazione, mentre la variabilita' delle medie campionarie, dipende dalla numerosità del campione e dalla deviazione standard della popolazione ( sigma)!
Siccome di solito non si conosce la deviazione standardad dell'intera popolazione e tanto meno si possono fare un numero molto grande di campioni, allora E' possibile calcolare la variabilità delle medie campionarie utilizzando la deviazione standard di un singolo campione come 'stima' della deviazione standard della popolazione
Da qui deriva la formula che errore standard = deviazione standard del campione / radq(numerosita' del campione)
Dall'errore standard si calcolano gli intervalli di confidenza che in genere sono posti con un livello di probabilita' pari al 95% usando la formula
1.96*es ...si somma e sottrae questo valore al valore della media campionaria per avere una stima intervallare della media di popolazione!
In sostanza l'errore standard e' un indicatore che serve per fare inferenza statistica!! ( infatti tutti i test statistici usano l'es nella loro struttura) La dev standard serve solo a descrivere la varibilita' del campione!!
Metodi grafici utili per descrivere la varibilita' di un campione sono i boxplot ...altri metodi sono poco utili!
Auguroni!!! |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 26 dicembre 2008 : 15:14:35
|
mi è stato giustamente fatto osservare che le Maiuscole non sono proprio il massimo delle netiquette... mi scuso!.. mi si era incollato il caps lock! :-) non sono riuscito a modificare il messaggio... quindi tutto ciò che è scritto Maiuscolo va letto in minuscolo! :-)
ciao e grazie per la comprensione! TMax |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 26 dicembre 2008 : 16:16:47
|
@dallolio: Hai provato con openoffice 3?
Sì sembra essere un bug di OO3.
@TMax: Citazione: errore standard e deviazione standard al di là dei metodi di calcolo..fanno riferimento a due concetti completamente differenti!
L'errore standard di una media è la misura della variabilità delle medie campionarie, fa riferimento alle distribuzioni campionarie che per effetto del teorema del limite centrale tendono ad apporssimare una distribuione gaussiana!
Vero, ma siccome lo ricavi dalla SD che è un indice di dispersione anche il SEM sarà influenzato dalla dispersione dei dati, quindi ne sarà un indice. Forse non sarà teoricamente giusto, ma matematicamente non fa una piega... a parità di n il SEM sarà più alto tanto più sono dispersi i campioni perchè la SD sarà più alta.
E per quanto riguarda i grafici... i boxplot non sono così usati in biologia, li vedi decisamente poco. Personalmente non lo vedo come un grosso problema, dipende da cosa stai analizzando. I sistemi biologici sono estremamente eterogenei e variabili, non è detto che dare più informazioni sia necessariamente utile, se queste informazioni non sono rilevanti. Certo, a tutti piacerebbe avere 5000 replicati di ogni esperimento... ma scendendo con i piedi per terra, a volte ne hai 3 o 4 di replicati e su quelli ti devi basare... |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 26 dicembre 2008 : 20:51:29
|
ascolta, non si ricava l'errore standard dalla deviazione standard ..quello è solo un accrocchio matematico che si può usare quando la varianza della popolazione non è nota e quando la dimensione campionaria è inferiore a 30!.. al di là di questo..resta il fatto che è un errore grossolano confondere concettualmente i due indici..e non mi riferisco a quanto hai scritto tu!! ma a quello che siamo obbligati a leggere su strafichissime riviste scientifiche da parte di ricercatori che 'schifano' lo studio della biostatistica ...( tanto basta mettere 4 dati in excel che ci vò) e confondono sistematicamente i due indici, per non dire di tutta una serie di cazzate che riescono a scrivere con 4 osservazioni in croce!
il fatto che non si usino i boxplot in biologia, indica solo che chi scrive articoli scientifici in campo biomedico ha una scarsa se non ridicola conoscenza della biostatistica...
il fatto che insisti con l'affermare che non c'è nulla di strano nel fare un grafico che riporta una mezza barra come indice della deviazione standard è prova che ti sfugge il reale significato della deviazione standard e come essa va interpretata...in caso contrario saresti il primo a non fare quella specie di grafico!
l'eterogenità dei sistemi biologici e la loro grande variabilità dovrebbe essere di stimolo per chi fa il ricercatore a studiarsi un pò di più la biostatistica che è l'unico strumento deputato a misurare e controllare la variabilità dei fenomeni...
TMax |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 27 dicembre 2008 : 21:47:39
|
Guarda, secondo me l'unico problema è che gli statistici vedono l'aspetto teorico della cosa, i biologi quello pratico.
Mi è capitato di vedere correttissime analisi statistiche di fenomeni biologici che però non tenevano conto della biologia del sistema. Ok, il test statistico mi può dire una certa cosa... ma se non ha ad es. un riscontro fisiologico non ha senso.
Poi, non so che riviste biologiche tu legga, ma ti assicuro che in moltissime pubblicazioni di alto livello c'è molto di più di "metto 4 dati in excel"... |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 27 dicembre 2008 : 23:53:05
|
io non parlo degli statistici ma dei biostatistici che sono cosa diversa... una delle prime cose che comunque s'insegna è quella di considerare dapprima la significatività biologica di un fenomeno e in seconda battuta quella statistica. Non solo, è in atto da anni un tentativo da parte dei biostatistici di scardinare l'uso e abuso che se ne fa del concetto di significatività statistica e del famoso valore p... ma sai chi si oppone a ciò? ... proprio i biologi che essendo 'pratici' sono più che altro dei praticoni ed è fin troppo facile esultare quando si ottengono valori di p inferiori a 0.05... piuttosto che ragionare correttamente sul disegno dello studio e sul vero significato dei risultati.
Sono anni che faccio questo mestiere e ne ho visti di tutti i colori.., (sono arrivato al punto di avere una pessima considerazione della comunità scientifica), non è questione di teoria o pratica , s'incontrano illustrissimi scienziati che non hanno la più pallida idea di cosa sia la deviazione standard...e non gliene può fregar de meno.. tranne però fare speculazioni scientifiche enfatizzando quando ci sono le famose significatività statistiche, e se gli si fa notare che il metodo adottato è sbagliato, ti rispondono con frasi del tipo:' ma questo non è uno studio statistico', che la statistica e teorica e lui invece sta in laboratorio quindi ha una visione giusta delle cose, e tutta una serie di cavolate del genere.... ti assicuro che è penoso!
TMax
|
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 28 dicembre 2008 : 00:20:45
|
OK, su questo ti do pienamente ragione. Sono il primo a dire che chi dice che "se p non e < 0.05 allora vuol dire che non hai differenze" non ha capito niente. Come mi irrita tantissimo vedere presentazioni in cui si mostrano grafici e non si spiega o almeno scrive che test statistico è stato usato per confrontare i dati.
Sono d'accordissimo che la statistica sia necessaria per analizzare i dati biologici, il mio punto è che bisogna valutare situazione per situazione. In alcuni casi il valore aggiunto di sapere quali sono i quartili dei tuoi dati potrebbe non esserci... tutto qui.
Ed allo stesso modo non si può far di tutta l'erba un fascio dicendo che i biologi non sanno nulla di statistica.
|
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
Ely86
Nuovo Arrivato
Città: milano
100 Messaggi |
Inserito il - 05 ottobre 2009 : 15:06:15
|
Ciao a tutti!Io ho calcolato la devizione standar e gli errori totlai cioè la sd+errore di pesata+errori vari fatti in lab e ho fatto il grafico ma non sono sicura..per barre d'errore devo usare i valori della devizione o la somma di tutti gli errori fatti?e poi se la barra è ampia che significa come posso commentare?[
Allegato: Cartel1.xls 18,88 KB |
|
|
|
Discussione |
|