Test du chi carre dans Excel

Le test du chi carré est un test non paramétrique qui compare deux variables ou plus à partir de données sélectionnées au hasard. Il aide à trouver la relation entre deux ou plusieurs variables. Dans Excel, nous calculons la valeur p du chi carré. Étant donné qu’Excel n’a pas de fonction intégrée, des formules mathématiques sont utilisées pour effectuer le test du chi carré.

Il existe deux types de tests du chi carré qui sont répertoriés comme suit :

■ Test d’ajustement du chi carré

■ Test du chi carré pour l’indépendance

1 – Test de qualité d’ajustement du chi carré

Le test d’ajustement aide à déterminer si les données de l’échantillon correspondent ou non à la population. En d’autres termes, il montre à quel point les données de l’échantillon correspondent à un ensemble d’observations.

Le symbole du test du chi carré est « x 2 » (c’est-à-dire « x » élevé à la puissance 2). « x 2 » est la somme du (nombre observé–nombre attendu) 2 /nombre attendu.

La formule du test d’ajustement du chi carré est donnée comme suit :

Où,

■ « x 2 » est la statistique du chi carré

■ « O i » est la fréquence observée

■ « E i » est la fréquence attendue

■ “i” est la “i ème ” position dans le tableau de contingence

■ “k” est la catégorie

■ Degrés de liberté (df)=k-1

 

Les utilisations du test d’ajustement

Le test est utilisé dans les situations suivantes :

■ Pour évaluer la solvabilité des emprunteurs en fonction de leur tranche d’âge et de leurs antécédents de dettes

■ Établir une relation entre la performance des commerciaux et la formation reçue par eux

■ Pour comparer les rendements d’une seule action avec les rendements des actions de l’ensemble du secteur

■ Évaluer l’impact d’une campagne télévisée sur une catégorie de téléspectateurs

2 – Test du chi carré pour l’indépendance

Il permet de déterminer si les variables sont indépendantes les unes des autres ou non. Deux variables aléatoires sont dites indépendantes si distribution de probabilité d’une variable n’est pas affectée par l’autre.

La formule du test du chi carré pour l’indépendance est donnée comme suit :

Où,

■ « x 2 » est la statistique du chi carré

■ « O ij » est la fréquence observée dans la i ème ligne et la j ème colonne

■ « E ij » est la fréquence attendue dans la i ème ligne et la j ème colonne

■ “r” est le nombre de lignes

■ “c” est le nombre de colonnes

■ Degrés de liberté (df)=(r-1)(c-1)

La formule de calcul de la fréquence attendue dans la i ème ligne et la j ème colonne est donnée comme suit :

Comment interpréter le test du chi carré ?

Le « x 2 » du test d’ajustement détermine dans quelle mesure les données de l’échantillon correspondent aux caractéristiques de l’ensemble de la population. Si les données de l’échantillon ne correspondent pas aux propriétés attendues de la population, cet échantillon n’est pas utilisé pour tirer des conclusions relatives à l’ensemble de la population.
Le « x 2 » dans le test du chi carré pour l’indépendance détermine la probabilité que la différence entre les fréquences réelles et attendues puisse être expliquée par le hasard. Cette différence peut ou non être causée par une erreur d’échantillonnage.

La valeur p, calculée dans un test du chi carré, représente une zone dans la queue d’une courbe de distribution de probabilité. Une p-value est un nombre compris entre zéro et un. Elle est exprimée en décimales.
Par exemple, une valeur de p de 0,0254 implique une probabilité de 2,54 % que les résultats aient pu se produire par hasard. Plus la valeur de p est petite, plus les résultats sont importants (significatifs). Un résultat significatif est celui où l’hypothèse nulle est rejetée.

Les utilisations du test du chi carré pour l’indépendance

Le test est utilisé dans les situations suivantes :

■ Il y a deux variables catégorielles et la relation entre elles doit être déterminée.

■ Il existe des tableaux croisés (tableaux à double entrée) et la relation entre différentes variables catégorielles doit être étudiée.

■ Il existe des variables non quantifiables. Par exemple, il faut déterminer la raison des variations des plans de santé selon les groupes d’âge.

3 Les caractéristiques du test du chi carré

Les caractéristiques du test du chi carré sont répertoriées comme suit :

■ Il évalue si les fréquences observées varient de manière significative par rapport aux fréquences attendues sous un ensemble donné d’hypothèses.

■ Il détermine dans quelle mesure une distribution supposée correspond aux données.

■ Il utilise les tableaux de contingence (ou tableaux croisés) pour résumer la relation entre diverses variables catégorielles.

■ Il prend en charge les mesures de niveau nominal.

4 Effectuer le test du chi carré dans Excel 

Un gérant de restaurant souhaite trouver le rapport entre la qualité du service et le salaire des clients qui attendent d’être servis.

Elle organise la tâche de la manière suivante :

■ Un échantillon aléatoire de 100 clients est considéré.

■ Chaque client est invité à évaluer le service du restaurant comme « excellent », « bon » et « médiocre ».

Elle construit l’hypothèse suivante :

■ Hypothèse nulle (H 0 )–La qualité du service ne dépend pas du salaire des clients en attente d’être servis.

■ Hypothèse alternative (H 1 )–La qualité de service dépend du salaire des clients en attente d’être servis.

Le responsable divise les clients en trois catégories en fonction de leurs salaires : « faible », « moyen » et « élevé ». Le niveau de signification (α) est de 0,05.

Les résultats sont présentés sous la forme de neuf points de données indiqués dans le tableau suivant.

Calculons la somme de toutes les lignes et colonnes. Nous appliquons la formule SOMME suivante pour additionner les nombres de la quatrième ligne.

“=SOMME(B4:D4)”

Appuyez sur la touche “Entrée” et la somme apparaît dans la cellule E4. La sortie est 26.

De même, nous appliquons la Formule SOMME au reste lignes et colonnes. Il y a 27 répondants avec un salaire moyen et 51 répondants qui ont évalué la qualité du service comme « bonne ».

Nous appliquons la formule « (r-1)(c-1) » pour calculer les degrés de liberté (df).

df=(3-1)(3-1)=2*2=4

Nous appliquons la formule suivante pour calculer la fréquence attendue pour la colonne B et la ligne 4.

“(=B7*E4/B9)”

Le calcul est illustré dans l’image suivante.

Le nombre attendu de clients qui ont un salaire “faible” mais qui évaluent le service de restauration comme “excellent” est de 8,32.

Dans les calculs suivants, E 11 est la fréquence attendue de la première ligne et de la première colonne. E 12 est la fréquence attendue de la première ligne et de la deuxième colonne.

■ E11 =(26*32)/100=8.32, E12 = 7.02 , E13 = 10.66

■ E 21 = 16,32, E 22 = 13,77, E 23 = 20,91

■ E 31 = 7,36, E 32 = 6,21, E 33 = 9,43

De même, nous calculons les fréquences attendues pour l’ensemble du tableau, comme indiqué dans l’image suivante.

Calculons les points de données du chi carré en utilisant la formule suivante.

Points chi carré=(observé-attendu)^2/attendu

Nous appliquons la formule “=(B4-B14)^2/B14” pour calculer le premier point chi carré.

Nous copions et collons la formule dans les cellules restantes. Ceci est fait pour remplir les valeurs dans l’ensemble du tableau, comme illustré dans l’image suivante.

Calculons la valeur calculée du chi carré en additionnant toutes les valeurs données dans le tableau suivant.

La valeur calculée du chi carré est de 18,65823.

Pour calculer la valeur critique, nous utilisons soit le tableau des valeurs critiques du chi carré, soit la formule CHISQ. La formule ” LOI.KHIDEUX.INVERSE.DROITE ” contient arguments  – la probabilité et le degrés de liberté.

La probabilité est de 0,05, ce qui est une valeur significative. Le df est égal à 4.

La valeur critique du chi carré est de 9,487729037.

Trouvons la valeur p du chi carré à l’aide de la formule suivante.

“= TEST.KHIDEUX (plage_réelle,plage_attendue)”

Nous appliquons la formule “= TEST.KHIDEUX (B4:D6,B14:D16)”.

La valeur p du chi carré est = 0,00091723.

La valeur calculée du chi carré est significative lorsqu’elle est égale ou supérieure à la valeur critique du chi carré (valeur tabulée). L’hypothèse nulle (H 0 ) est rejetée si la valeur calculée du chi carré est supérieure à la valeur critique du chi carré.

Ici x 2 (calculé)>x 2 (tabulé) soit 18.65>9.48. Par conséquent, nous rejetons l’hypothèse nulle et acceptons l’hypothèse alternative.

La valeur p peut également déterminer si l’hypothèse nulle doit être acceptée ou rejetée. Pour cela, la p-value est comparée à alpha (α) de la manière suivante :

■ Si p-value <= α, l’hypothèse nulle est rejetée.

■ Si p-value > α, l’hypothèse nulle est acceptée.

Dans cet exemple, p-value<α ou 0,0009172<0,05. Donc, nous rejetons H 0 et acceptons H 1 .

Nous concluons que la qualité du service est dépendante du salaire des clients en attente d’être servis.

Points clés à retenir :

■ Le test du chi carré est un test non paramétrique qui compare deux variables ou plus à partir de données sélectionnées au hasard.

■ Le test de qualité d’ajustement du chi carré permet de déterminer si les données de l’échantillon correspondent ou non à la population.

■ Le test d’indépendance du chi carré permet de déterminer si les variables sont indépendantes les unes des autres ou non.

■ Deux variables aléatoires sont dites indépendantes si la distribution de probabilité d’une variable n’est pas affectée par l’autre.

■ Le symbole du test du chi carré est « x 2 » (c’est-à-dire « x » élevé à la puissance 2).

■ Si la valeur calculée du chi carré est supérieure à la valeur critique du chi carré, l’hypothèse nulle (H 0 ) est rejetée.

■ Si la valeur p du chi carré est inférieure ou égale au niveau de signification (α), l’hypothèse nulle est rejetée.

S’abonner
Notifier de
1 Commentaire
le plus ancien
le plus récent le plus populaire
Inline Feedbacks
Voir tous les commentaires

je voudrai savoir comment faire une Application du tri par insertion sur les données du chi carré à l’aide de l’implémentation Array?

Initiation à Excel

Fonctions Excel

Excel VBA

Macros VBA Utiles

Plus d'outils

Sur Facebook

Sur YouTube

1
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x