Guide des tests d'hypothese
Apprenez comment fonctionnent les tests d'hypothese etape par etape. Couvre les hypotheses nulle et alternative, les statistiques de test, les valeurs p et les seuils de significativite.
Qu'est-ce qu'un test d'hypothese ?
Un test d'hypothese est une procedure statistique qui utilise les donnees d'un echantillon pour evaluer une affirmation sur une population. Il commence par formuler deux hypotheses mutuellement exclusives : l'hypothese nulle (H0, qui represente le statu quo ou l'absence d'effet) et l'hypothese alternative (H1, qui represente l'affirmation que l'on cherche a prouver). Par exemple, H0 : le nouveau medicament n'a aucun effet, H1 : le nouveau medicament reduit les symptomes. Le test collecte des preuves contre H0 et decide s'il y a suffisamment de preuves pour la rejeter en faveur de H1.
La valeur p
La valeur p est la probabilite d'observer un resultat aussi extreme ou plus extreme que celui obtenu, en supposant que l'hypothese nulle est vraie. Une valeur p de 0,03 signifie qu'il n'y a que 3 % de chances d'observer un tel resultat si H0 est vraie. Plus la valeur p est petite, plus les preuves contre H0 sont fortes. Conventionnellement, si p est inferieur au seuil de significativite alpha (generalement 0,05), on rejette H0. Si p est superieur ou egal a alpha, on ne rejette pas H0 (ce qui ne signifie pas que H0 est vraie, mais qu'on n'a pas assez de preuves pour la rejeter).
Erreurs de type I et de type II
Une erreur de type I (faux positif) se produit lorsque vous rejetez H0 alors qu'elle est vraie. La probabilite de cette erreur est alpha, le seuil de significativite. Une erreur de type II (faux negatif) se produit lorsque vous ne rejetez pas H0 alors qu'elle est fausse. La probabilite de cette erreur est beta. La puissance du test (1 - beta) est la probabilite de detecter correctement un effet reel. Augmenter la taille de l'echantillon augmente la puissance. Il existe un compromis entre les deux types d'erreur : reduire alpha augmente beta, et vice versa. Le choix de alpha depend du cout relatif de chaque type d'erreur.
Types de tests courants
Le test z compare une moyenne d'echantillon a une moyenne connue lorsque l'ecart-type de la population est connu et l'echantillon est grand. Le test t fait la meme chose mais lorsque l'ecart-type est inconnu ou l'echantillon est petit. Le test t pour deux echantillons compare les moyennes de deux groupes. Le test du chi-carre teste l'association entre des variables categorielles. L'ANOVA (analyse de variance) compare les moyennes de trois groupes ou plus. Le test bilateral verifie si la valeur differe dans les deux directions, tandis que le test unilateral verifie une seule direction (superieur ou inferieur).
Bonnes pratiques et pieges
La significativite statistique ne signifie pas la significativite pratique : un echantillon tres grand peut rendre n'importe quelle difference minuscule « statistiquement significative ». Toujours rapporter la taille de l'effet en plus de la valeur p. Le p-hacking (tester de nombreuses hypotheses jusqu'a en trouver une significative) produit des faux positifs. Definissez vos hypotheses et votre plan d'analyse avant de collecter les donnees. La correction de Bonferroni ajuste le seuil alpha lors de tests multiples. Ne confondez jamais « absence de preuves » avec « preuves d'absence » : ne pas rejeter H0 ne prouve pas que H0 est vraie.