Test de comparaison de deux moyennes provenant de 2 échantillons
tirés de 2 populations indépendantes
|

Principe:
Un expérimentateur désire comparer les moyennes (m1 et
m2) de deux échantillons composés d'individus distincts:
les individus de l'échantillon 1 ne sont pas les mêmes
que ceux de l'écahntillon 2! Les deux échantillons sont
indépendants.
Les deux échantillons proviennent-ils d'une seule population
de moyenne Mx ou bien ou bien les deux échantillons proviennent-ils
de deux populations distinctes de moyennes M1 et M2?
les hypothèses:
Hypothèse nulle H0:
H0: M1 = M2 = Mx |
les moyennes des échantillons appartiennent
à une seule population de référence de moyenne
Mx
|
Hypothèse alternative H1:
H1: M1 plus grand que M2 . |
les moyennes des échantillons appartiennent
à 2 populations distinctes. La population 1 a une moyenne
M1 supérieure à la moyenne M2 de la population2
|
ou encore
H1: M1 plus petit que M2 . |
les moyennes des échantillons appartiennent
à 2 populations distinctes. La population 1 a une moyenne
M1 inférieure à la moyenne M2 de la population2
|
ou encore
H1: M1 différent de M2 . |
les moyennes des échantillons appartiennent
à 2 populations distinctes. La population 1 a une moyenne
M1 différente de la moyenne M2 de la population2
|
Calculer la valeur observée:
Cas 1: la variance des populations 1 et 2 (VAR1 et VAR2) sont connues:
La réduction de ma moyenne de l'échantillon peut se faire
par le cacul d'une valeur de Z observé dont la formule est la
suivante:

Où m1 et m2 sont les moyennes des 2 échantillons;
VAR1 et VAR2 sont les variances des 2 populations 1 et 2; n1 et n2 sont
les tailles respectives des échantillons 1 et 2.
Trouvez dans les tables de Z, la ou les valeurs seuil
en tenant compte de alpha et de H1.
AH0 (et donc RH1)
|
Les échantillons de moyenne m1 et m2 appartiennent
à une seule population de référence dont la
moyenne est Mx |
RH0 (et donc AH1)
|
Les échantillons de moyenne m1 et m2 n'appartiennent
pas à la même population de référence
dont la moyenne est Mx mais appartiennent à 2 populations
distinctes dont les moyennes respectives M1 et M2 sont telles que
M1 est plus grande OU plus petite OU différente par rapport
à M2. |
Cas 2: la variance de la population de référence est
inconnue:
Dans ce cas, il n'est plus possible de calculer directement une valeur
de z observée car il nous manque les valeurs de variances des
populations de référence VAR1 et VAR2.
Pour pouvoir comparer les moyennes des 2 échantillons, l'expérimentateur
va devoir remplacer les variances des deux populations indépendantes
par les variances estimées des 2 échantillons, var1 et
var2.
Test sur l'homogénéité
des variances des échantillons comparés:
Une question préalable doit être posée: La
variabilité des 2 échantillons est-elle comparable, homogène?
En d'autre terme, il faut vérifier l'égalité des
variances des 2 population étudiées, c'est-à-dire
l'homoscédasticité.
En effet, comme l'expérimentateur ne connait rien des variances
théoriques des 2 populations, il va devoir adapter la formule
de Z observé et en faire une formule de t observé (voir
point suivant).
Dans cette formule, il remplacera VAR1 et VAR2 par une seule variance
appelée "variance résiduelle" sr2
obtenue à partir des variances des deux échantillons var1
et var2.
Réalisation du test:
H0: VAR1 = VAR2 =VARx |
Les variances des populations comparées sont
homogènes |
H1: VAR1 diffèrent de VAR2 différent
de VARx |
Les variances des populations comparées sont
hétérogènes |
|
Pour réaliser ce test, l'expériementateur
va mettre en rapport la plus grande des 2 variances d'échantillon
sur la plus petite. Ce rapport est une valeur appelée F observée
que l'on peut comparer avec une valeur F des tables de Fisher. |
|
Fobservé = var1 / var2
si var 1plus grande que var2
|
|
L'expérimentateur va ensuite comparer cette
valeur à une valeur théorique des tables de F de Fisher-Snedecor.
L'hypothèse alternative H1induit la réalisation d'un
test bidirectionnel. En général, ce test s'effectue
avec une erreur de type I (alpha) de 5%. |
F tables;(n1-1) dl; (n2-1)dl; 0,975
|
Il existe plusieurs tables de F de Fisher. L'expérimentateur
doit sélectionner la table où (1-alpha/2) est 0,975.
Les premiers degrés de liberté (n1-1)dl correspondent
à ceux de l'échantillon dont la variance est la
plus grande. Ils permettre de rentrer en tête de colonne
dans la table.
Les seconds (n2-1)dl correspondent à ceux de l'échantillon
dont la variance est la plus petite. Ils permettent de rentrer
en tête de colonne dans la table.
|
|
AH0 si F observé est plus
petit que Ftables |
Les variances des populations d'où sont issues les écahntillons
sont considérées comme homogènes et l'expérimentateur
peut alors envisager de comparer les moyennes des populations
d'où sont issus les échantillons.
|
RH0 si F observé est plus grand que Ftables
|
Les variances des populations d'où sont issues les écahntillons
sont considérées comme hétérogènes.
Il est alors IMPOSSIBLE de comparer par la suite les moyennes
pour des échantillons dont les variances ne sont pas identiques.
Le test s'arrête donc là!
|
Test de comparaison des moyennes des populations
d'où proviennent les 2 échantillons:
CONDITION: Ce test d'hypothèses
portant sur les moyennes n'est possible QUE SI l'homogèité
des variances des populations à été confirmée
par le test détaillé au point
précédant. |
Les hypothèses H0 et H1 sont celles décrites
plus haut.
L'expérimentateur va ensuite calculer une valeur de t observé:

Où m1 et m2 sont les moyennes des 2 échantillons;
sr2 est la variance résiduelle ; n1 et
n2 sont les tailles respectives des échantillons 1 et 2, var1
et var2 sont la variances respectives des deux échantillons 1
et 2.
Ensuite, il reste à trouver dans les tables de
t de Student (l'aspect de la courbe est aussi une courbe de Gauss),
la ou les valeurs seuil en tenant compte de alpha et de H1. La valeur
de t de Student nécessite aussi la détermination d'un
certain nombre de degrés de liberté. Pour trouver la ou
les valeurs seuil, il fat donc rechercher:
tseuil;(n-1) degrés de liberté
Où "seuil" représente H1
(seuil peut être (1-alpha) ou alpha ou (1-alpha/2) ou (alpha/2);
n est la taille de l'échantillon
AH0 (et donc RH1)
|
L'échantillon de moyenne mx appartient à
la population de référence dont la moyenne est M1 |
RH0 (et donc AH1)
|
L'échantillon de moyenne mx n'appartient pas
à la population de référence dont la moyenne
est M1mais à une population dont la moyenne M2 est plus grande
OU plus petite OU différente par rapport à la population
de référence dont la moyenne est M1. |