Ho un questionario, con domande chiuse a crocette, risposte a 3/4 modalità. Mi è stato chiesto di calcolare gli intervalli di confidenza per le proporzioni. Ho già visto in giro report con cose di questo tipo, con variabili es. Fumo:"fumatore""non fumatore" "ex fumatore". Come si calcolano?...ma soprattutto cosa ci sta sotto a livello statistico?non capisco nè la possibile distribuzione, nè se dipende dal tipo di campionamento...grazie!!
Questa è un'approssimazione che si basa sul teorema del limite centrale e approssima la distribuzione dei dati ad una distribuzione normale. La formula è da usare con cautela per proporzioni che si avvicinano a 0 (o a 1) e per numero di osservazioni ridotte.
Esistono poi altri modi di calcolare più correttamente queste proporzioni, che trovi nella pagina che ho linkato in alto.