Test de Student sur deux échantillons

La calculateur pour réaliser le test de Student pour la signification de la différence entre les moyennes de deux échantillons indépendants

Le calculateur ci-dessous met en oeuvre le test statistique le plus connu, nommé, test de Student sur des échantillons indépendants, ou Test de Student sur deux échantillons, d'après William Sealy Gosset. "Student" était son nom de plume.

Le test porte sur l’hypothèse nulle que les moyennes de deux populations sont égales. En d'autres termes, la différence que nous trouvons entre les moyennes de deux échantillons ne doit pas être significativement différente de zéro.

Une fois de plus, le test ne fonctionne que si certaines hypothèses sont respectées. Elles sont :

  • Les deux échantillons sont indépendants et choisis aléatoirement dans les populations sources.
  • L'échelle de mesure des deux échantillons a les propriétés d'une échelle d’intervalle égale.
  • Les populations sources peuvent être raisonnablement supposées comme ayant une distribution normale.
  • Et, pour cette mise en oeuvre particulière du test, la variance de chaque population est la même.

Le calculateur affiche le niveau de confiance pour les tests unilatéraux et bilatéraux. Par exemple, vous obtenez le résultat de 96 %. Ceci signifie essentiellement que vous avez 96 % de confiance que la différence obtenue montre quelque chose qui ne soit pas de la pure chance. La chance que vous obteniez la différence obtenue et que les moyennes de deux échantillons soient les même n'est que de 4 %. Ceci est le niveau de signification que vous calculez. Maintenant, en fonction de votre niveau de signification choisi, vous pouvez réfuter ou ne pas parvenir à réfuter votre hypothèse nulle.

Pour estimer le niveau de confiance, nous avons besoin de calculer la valeur t puis de chercher l'inverse de la fonction de répartition de Student avec (N_a-1)+(N_b-1) degrés de liberté. N_a est la taille de l'échantillon A et N_b est la taille de l'échantillon B.

Pour trouver la valeur t, vous commencez par calculer la moyenne M_x et la somme du carré des écarts, ou la somme des carrés SS=\sum{(X_i-M_x)^2 pour chaque échantillon.

Ensuite, vous pouvez estimer la variance de la population source comme
\{s^{2}_p\}=\frac{SS_a+SS_b}{(N_a-1)+(N_b-1)}
Cette estimation est appelée variance groupée est c'est une méthode pour estimer la variance de plusieurs populations différentes lorsque les moyennes de chaque population peuvent être différentes, mais il est assumé que la variance de chaque population est la même.

Ensuite, vous estimez la déviation standard de la distribution de l'échantillon avec les différences échantillon-moyenne ("l'erreur standard" de M_X_a-M_X_b) comme
est.\sigma_{M-M}=\sqrt{\frac{\{s^{2}_p\}}{N_a}+\frac{\{s^{2}_p\}}{N_a}}.

Finalement, vous calculez t comme
t=\frac{M_X_a-M_X_b}{est.\sigma_{M-M}}

Si vous voulez en savoir plus, vous pouvez lire de très bonnes explications ici, à partir du chapitre 9.

PLANETCALC, Test de Student sur deux échantillons

Test de Student sur deux échantillons

Chiffres après la virgule décimale : 1
Moyenne de l'échantillon A
 
Moyenne de l'échantillon B
 
Valeur t
 
Hypothèse non directionnelle
 
Niveau de confiance pour un test bilatéral de signification
 
Hypothèse directionnelle
 
Niveau de confiance pour un test unilatéral de signification
 

URL copiée dans le presse-papiers
PLANETCALC, Test de Student sur deux échantillons

commentaires