Come Calcolare gli Intervalli di Confidenza
Guida passo dopo passo al calcolo degli intervalli di confidenza. Scopri quando usare gli intervalli z o t, come scegliere il livello di confidenza e come interpretare i risultati.
Cos'è un Intervallo di Confidenza?
Un intervallo di confidenza è un intervallo di valori che, con un certo livello di confidenza, contiene il vero valore del parametro della popolazione. Ad esempio, un intervallo di confidenza al 95% per la media della popolazione significa che se ripetessimo il campionamento molte volte, il 95% degli intervalli calcolati conterrebbe la vera media. L'intervallo si esprime come: stima puntuale +/- margine di errore. Un intervallo più stretto indica una stima più precisa, ma richiede un campione più grande o una variabilità minore nei dati.
Intervallo di Confidenza con la Distribuzione z
Quando la dimensione del campione è grande (n >= 30) o la deviazione standard della popolazione è nota, si usa la distribuzione z. La formula è: IC = x_barra +/- z* x (sigma / sqrt(n)), dove x_barra è la media campionaria, z* è il valore critico (1,96 per il 95%, 2,576 per il 99%), sigma è la deviazione standard e n è la dimensione del campione. Ad esempio, con media campionaria 50, sigma = 10 e n = 100, l'IC al 95% è: 50 +/- 1,96 x (10/10) = 50 +/- 1,96, ovvero da 48,04 a 51,96.
Intervallo di Confidenza con la Distribuzione t
Quando la dimensione del campione è piccola (n < 30) e la deviazione standard della popolazione è sconosciuta (che è la situazione più comune), si usa la distribuzione t di Student. La formula è: IC = x_barra +/- t* x (s / sqrt(n)), dove s è la deviazione standard campionaria e t* è il valore critico dalla distribuzione t con n-1 gradi di libertà. La distribuzione t ha code più pesanti della z, producendo intervalli più ampi che compensano l'incertezza aggiuntiva dovuta alla stima di sigma dal campione. Con campioni grandi, la t si avvicina alla z.
Interpretazione e Significato Pratico
Un errore comune è dire che "c'è una probabilità del 95% che il parametro sia nell'intervallo". In realtà, il parametro è fisso; è l'intervallo che varia tra campioni. L'interpretazione corretta è: "Se ripetessimo il campionamento molte volte, il 95% degli intervalli costruiti conterrebbe il vero parametro." Un intervallo di confidenza al 95% più stretto è più informativo. La dimensione del campione necessaria per ottenere un certo margine di errore si calcola come: n = (z* x sigma / E)², dove E è il margine di errore desiderato.