introduction

standard

indépendants

apparriés

formulaire

décision

Accueil info

Test de comparaison de deux moyennes provenant de 2 échantillons tirés de 2 populations indépendantes

 

Principe:

Un expérimentateur désire comparer les moyennes (m1 et m2) de deux échantillons composés d'individus distincts: les individus de l'échantillon 1 ne sont pas les mêmes que ceux de l'écahntillon 2! Les deux échantillons sont indépendants.

Les deux échantillons proviennent-ils d'une seule population de moyenne Mx ou bien ou bien les deux échantillons proviennent-ils de deux populations distinctes de moyennes M1 et M2?

les hypothèses:

Hypothèse nulle H0:

H0: M1 = M2 = Mx
les moyennes des échantillons appartiennent à une seule population de référence de moyenne Mx

Hypothèse alternative H1:

H1: M1 plus grand que M2 .
les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 supérieure à la moyenne M2 de la population2

ou encore

H1: M1 plus petit que M2 .
les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 inférieure à la moyenne M2 de la population2

ou encore

H1: M1 différent de M2 .
les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 différente de la moyenne M2 de la population2

Calculer la valeur observée:

Cas 1: la variance des populations 1 et 2 (VAR1 et VAR2) sont connues:

La réduction de ma moyenne de l'échantillon peut se faire par le cacul d'une valeur de Z observé dont la formule est la suivante:

Où m1 et m2 sont les moyennes des 2 échantillons; VAR1 et VAR2 sont les variances des 2 populations 1 et 2; n1 et n2 sont les tailles respectives des échantillons 1 et 2.

Trouvez dans les tables de Z, la ou les valeurs seuil en tenant compte de alpha et de H1.

AH0 (et donc RH1)
Les échantillons de moyenne m1 et m2 appartiennent à une seule population de référence dont la moyenne est Mx
RH0 (et donc AH1)
Les échantillons de moyenne m1 et m2 n'appartiennent pas à la même population de référence dont la moyenne est Mx mais appartiennent à 2 populations distinctes dont les moyennes respectives M1 et M2 sont telles que M1 est plus grande OU plus petite OU différente par rapport à M2.

Cas 2: la variance de la population de référence est inconnue:

Dans ce cas, il n'est plus possible de calculer directement une valeur de z observée car il nous manque les valeurs de variances des populations de référence VAR1 et VAR2.

Pour pouvoir comparer les moyennes des 2 échantillons, l'expérimentateur va devoir remplacer les variances des deux populations indépendantes par les variances estimées des 2 échantillons, var1 et var2.

Test sur l'homogénéité des variances des échantillons comparés:

Une question préalable doit être posée: La variabilité des 2 échantillons est-elle comparable, homogène? En d'autre terme, il faut vérifier l'égalité des variances des 2 population étudiées, c'est-à-dire l'homoscédasticité.

En effet, comme l'expérimentateur ne connait rien des variances théoriques des 2 populations, il va devoir adapter la formule de Z observé et en faire une formule de t observé (voir point suivant).

Dans cette formule, il remplacera VAR1 et VAR2 par une seule variance appelée "variance résiduelle" sr2 obtenue à partir des variances des deux échantillons var1 et var2.

Réalisation du test:

H0: VAR1 = VAR2 =VARx Les variances des populations comparées sont homogènes
H1: VAR1 diffèrent de VAR2 différent de VARx Les variances des populations comparées sont hétérogènes
Pour réaliser ce test, l'expériementateur va mettre en rapport la plus grande des 2 variances d'échantillon sur la plus petite. Ce rapport est une valeur appelée F observée que l'on peut comparer avec une valeur F des tables de Fisher.

 

Fobservé = var1 / var2

si var 1plus grande que var2

 

L'expérimentateur va ensuite comparer cette valeur à une valeur théorique des tables de F de Fisher-Snedecor. L'hypothèse alternative H1induit la réalisation d'un test bidirectionnel. En général, ce test s'effectue avec une erreur de type I (alpha) de 5%.

 

F tables;(n1-1) dl; (n2-1)dl; 0,975

 

 

Il existe plusieurs tables de F de Fisher. L'expérimentateur doit sélectionner la table où (1-alpha/2) est 0,975.

Les premiers degrés de liberté (n1-1)dl correspondent à ceux de l'échantillon dont la variance est la plus grande. Ils permettre de rentrer en tête de colonne dans la table.

Les seconds (n2-1)dl correspondent à ceux de l'échantillon dont la variance est la plus petite. Ils permettent de rentrer en tête de colonne dans la table.

AH0 si F observé est plus petit que Ftables

Les variances des populations d'où sont issues les écahntillons sont considérées comme homogènes et l'expérimentateur peut alors envisager de comparer les moyennes des populations d'où sont issus les échantillons.

RH0 si F observé est plus grand que Ftables

Les variances des populations d'où sont issues les écahntillons sont considérées comme hétérogènes.

Il est alors IMPOSSIBLE de comparer par la suite les moyennes pour des échantillons dont les variances ne sont pas identiques. Le test s'arrête donc là!

Test de comparaison des moyennes des populations d'où proviennent les 2 échantillons:

CONDITION: Ce test d'hypothèses portant sur les moyennes n'est possible QUE SI l'homogèité des variances des populations à été confirmée par le test détaillé au point précédant.

Les hypothèses H0 et H1 sont celles décrites plus haut.

L'expérimentateur va ensuite calculer une valeur de t observé:

Où m1 et m2 sont les moyennes des 2 échantillons; sr2 est la variance résiduelle ; n1 et n2 sont les tailles respectives des échantillons 1 et 2, var1 et var2 sont la variances respectives des deux échantillons 1 et 2.

 

Ensuite, il reste à trouver dans les tables de t de Student (l'aspect de la courbe est aussi une courbe de Gauss), la ou les valeurs seuil en tenant compte de alpha et de H1. La valeur de t de Student nécessite aussi la détermination d'un certain nombre de degrés de liberté. Pour trouver la ou les valeurs seuil, il fat donc rechercher:

tseuil;(n-1) degrés de liberté

Où "seuil" représente H1 (seuil peut être (1-alpha) ou alpha ou (1-alpha/2) ou (alpha/2); n est la taille de l'échantillon

AH0 (et donc RH1)
L'échantillon de moyenne mx appartient à la population de référence dont la moyenne est M1
RH0 (et donc AH1)
L'échantillon de moyenne mx n'appartient pas à la population de référence dont la moyenne est M1mais à une population dont la moyenne M2 est plus grande OU plus petite OU différente par rapport à la population de référence dont la moyenne est M1.