Comprendre l'ecart type - Guide complet

Decouvrez ce qu'est l'ecart type, comment le calculer etape par etape et pourquoi il est important. Couvre l'ecart type de population et d'echantillon.

Qu'est-ce que l'ecart type ?

L'ecart type est une mesure statistique qui quantifie la dispersion d'un ensemble de donnees par rapport a sa moyenne. Un faible ecart type indique que les valeurs sont groupees pres de la moyenne, tandis qu'un ecart type eleve indique que les valeurs sont etalees sur une plage plus large. Par exemple, les ensembles {8, 9, 10, 11, 12} et {2, 6, 10, 14, 18} ont tous les deux une moyenne de 10, mais le second est beaucoup plus disperse. L'ecart type capture cette difference numeriquement. Il est mesure dans les memes unites que les donnees originales, ce qui le rend plus intuitif que la variance (qui est en unites au carre), et c'est la mesure de dispersion la plus largement utilisee en statistiques, sciences et ingenierie.

Ecart type de population vs d'echantillon

Il existe deux versions de l'ecart type. L'ecart type de population (sigma) utilise N au denominateur et est utilise lorsque vous avez des donnees de l'ensemble de la population. L'ecart type d'echantillon (s) utilise N-1 au denominateur (la correction de Bessel) et est utilise lorsque vous travaillez avec un echantillon tire d'une population plus large. La correction N-1 compense le fait qu'un echantillon tend a sous-estimer la vraie variabilite de la population. Pour les grands echantillons, la difference est negligeable, mais pour les petits echantillons, elle est importante. En pratique, vous utiliserez presque toujours l'ecart type d'echantillon car les donnees de population complete sont rares.

Calcul etape par etape

Pour calculer l'ecart type : 1) Trouvez la moyenne de l'ensemble de donnees. 2) Soustrayez la moyenne de chaque valeur pour obtenir les ecarts. 3) Mettez au carre chaque ecart. 4) Calculez la moyenne des ecarts au carre (divisez par N pour la population ou N-1 pour l'echantillon). Ce resultat est la variance. 5) Prenez la racine carree de la variance pour obtenir l'ecart type. Exemple : pour les donnees {4, 8, 6, 5, 3}, la moyenne est 5,2. Les ecarts sont {-1,2, 2,8, 0,8, -0,2, -2,2}. Les ecarts au carre sont {1,44, 7,84, 0,64, 0,04, 4,84}. La somme est 14,8. La variance d'echantillon est 14,8 / 4 = 3,7. L'ecart type d'echantillon est sqrt(3,7) = environ 1,92.

Variance et sa relation avec l'ecart type

La variance est le carre de l'ecart type, soit la moyenne des ecarts au carre par rapport a la moyenne. Bien que mathematiquement plus facile a manipuler (les variances s'additionnent pour des variables independantes), la variance est exprimee en unites au carre, ce qui la rend moins intuitive. Si vous mesurez des tailles en centimetres, la variance est en centimetres carres, tandis que l'ecart type est en centimetres. La variance est preferee dans les calculs theoriques et les demonstrations statistiques, tandis que l'ecart type est prefere pour l'interpretation et la presentation des donnees. Leur relation est simple : variance = ecart type au carre, et ecart type = racine carree de la variance.

La regle empirique (68-95-99,7)

Pour les distributions normales (en forme de cloche), la regle empirique fournit des reperes puissants. Environ 68 % des donnees tombent dans un ecart type de la moyenne (mu +/- sigma). Environ 95 % tombent dans deux ecarts types (mu +/- 2 sigma). Environ 99,7 % tombent dans trois ecarts types (mu +/- 3 sigma). Cela signifie que les valeurs au-dela de 3 sigma sont extremement rares dans les donnees normalement distribuees. Cette regle est le fondement du controle qualite (les limites de controle a 3 sigma), de la gestion des risques financiers et de la detection des valeurs aberrantes. Si une mesure depasse 3 ecarts types de la moyenne, elle merite une investigation approfondie.

Applications dans le monde reel

L'ecart type est omniprésent dans les applications du monde reel. En finance, il mesure la volatilite d'un investissement : un ecart type plus eleve signifie un risque plus eleve. En controle qualite de fabrication, il surveille la coherence des processus : si l'ecart type des dimensions d'une piece depasse la tolerance, le processus doit etre ajuste. En medecine, il aide a definir les plages « normales » pour les resultats d'analyse sanguine. Dans les tests standardises, les scores sont souvent convertis en scores z (nombre d'ecarts types au-dessus ou en dessous de la moyenne) pour permettre la comparaison entre differents tests. En meteorologie, l'ecart type des temperatures revele la variabilite climatique d'une region.

L'ecart type vs autres mesures de dispersion

L'ecart type n'est pas la seule mesure de dispersion. L'etendue (valeur maximale moins valeur minimale) est la plus simple mais la plus sensible aux valeurs extremes. L'ecart interquartile (EIQ ou IQR), qui est la difference entre le 75e et le 25e percentile, est resistant aux valeurs aberrantes et est souvent utilise dans les diagrammes en boite. L'ecart absolu moyen (MAD) utilise les valeurs absolues au lieu des carres et est moins sensible aux valeurs extremes. L'ecart type est prefere lorsque les donnees sont approximativement normales car il a des proprietes mathematiques puissantes (la regle 68-95-99,7, la theorie des tests d'hypothese, les intervalles de confiance). L'EIQ est prefere pour les donnees asymetriques ou contenant des valeurs aberrantes.

Pieges courants

Le piege le plus courant est d'utiliser la mauvaise formule (population vs echantillon). Utilisez N pour la population complete et N-1 pour un echantillon. Un autre piege est d'interpreter l'ecart type sans contexte : un ecart type de 10 est grand si la moyenne est 50 mais petit si la moyenne est 10 000. Le coefficient de variation (ecart type / moyenne x 100 %) permet des comparaisons entre des ensembles de donnees avec des moyennes differentes. Attention aussi a l'hypothese de normalite : la regle 68-95-99,7 ne s'applique qu'aux distributions normales. Pour des distributions tres asymetriques, l'ecart type peut etre trompeur, et la mediane avec l'ecart interquartile peuvent etre plus informatifs.

Calculatrices Associées