ANOVA DANS EXCEL

ANOVA (Analysis Of Variance) est un ensemble de modèles statistiques utilisés pour évaluer les différences entre les moyennes de deux groupes indépendants en séparant la variabilité en facteurs systématiques et aléatoires. Cela aide à déterminer l’effet de la variable indépendante sur la variable dépendante.

C’est un test statistique intégré dans Excel utilisé pour analyser les variances. Par exemple, nous comparons généralement les alternatives disponibles lors de l’achat d’un nouvel article, ce qui nous aide finalement à choisir la meilleure parmi toutes les options disponibles. L’utilisation du test ANOVA dans Excel peut nous aider à tester les différents ensembles de données les uns par rapport aux autres pour identifier les meilleurs du lot. Il est utile pour déterminer l’impact de différents facteurs sur le mouvement des fluctuations des stocks. En conséquence, des statisticiens, des économistes ou des analystes effectuent avec son aide une analyse approfondie de l’indice de sécurité dans diverses conditions de marché. De plus, le test ANOVA permet de déterminer la signification ou le caractère aléatoire des résultats d’une expérience. 

1 Exigences en matière de données

Vos données doivent répondre aux exigences suivantes :

■ Les échantillons de données doivent être prélevés sur la population normalement distribuée.

■ Les échantillons doivent être sélectionnés au hasard pour s’assurer que les observations d’un échantillon ne dépendent pas des observations d’autres échantillons. Essentiellement, les échantillons doivent être indépendants.

■ La variable dépendante doit être continue.

■ La variance des données appartenant à différents groupes doit être la même.

■ La variable indépendante doit contenir trois niveaux ou plus.

 

2 Types de tests Anova

Il existe trois types de tests ANOVA :

– ANOVA à sens unique

L’analyse ANOVA unidirectionnelle de la variance est communément appelée test à un facteur par rapport au sujet dépendant et à la variable indépendante. Les statisticiens l’utilisent en comparant les moyennes de groupes indépendants les uns des autres à l’aide de la formule du coefficient d’analyse de variance. Une seule variable indépendante avec au moins deux niveaux. L’analyse de variance unidirectionnelle est assez similaire au test t.

– ANOVA bidirectionnelle

La condition préalable à la réalisation d’un test anova bidirectionnel   est la présence de deux variables indépendantes ; on peut l’exécuter de deux manières :

L’ANOVA bidirectionnelle avec réplication ou analyse de variance par mesures répétées   est effectuée lorsque les deux groupes indépendants avec des variables dépendantes effectuent des tâches différentes.

L’ANOVA bidirectionnelle sans réplication est effectuée lorsqu’un seul groupe doit être testé deux fois, comme on teste un joueur avant et après un match de football.

De plus, il faut remplir les conditions suivantes pour ses candidatures :

– ANOVA N-Way (MANOVA)

Il s’applique à plusieurs variables indépendantes qui affectent la variable dépendante. Elle est plus efficace que l’analyse de variance car on peut l’utiliser pour observer simultanément plusieurs variables dépendantes.

3 Formule ANOVA à un facteur

La méthode de calcul implique la comparaison des moyennes de groupes indépendants à l’aide de la distribution F. En d’autres termes, c’est la comparaison entre la variance du groupe et la variance au sein du groupe.

Examinons la formule ANOVA à un facteur :

F-statistics ou F-ratio :

F = MSB/MSE

Dans cette formule,

■ F = coefficient d’ANOVA

■ MSB = Somme moyenne des carrés entre les groupes

■ MSE = Somme moyenne des carrés au sein des groupes

■ Carrés moyens entre les groupes, MSB = SSB / (k – 1)

■ Carrés moyens des erreurs, MSE = SSE / (N – k)

■ Degrés de liberté totaux, N – 1= df3 

■ Degrés de liberté d’erreurs, N – k = df2 ici, N est le nombre total d’observations dans k groupes.

■ Degrés de liberté entre groupes, k – 1= df1, où k est le nombre de groupes.

Si la valeur de F est proche de 1, alors il existe une variance insignifiante entre les moyennes des deux groupes de données observées.

Le test formule une hypothèse nulle et une hypothèse alternative. L’hypothèse nulle stipule que toutes les moyennes de population sont égales, tandis que l’hypothèse alternative stipule qu’au moins une moyenne de population sera différente des autres.

La comparaison des statistiques F calculées à la valeur F critique obtenue à partir du tableau F fournira des informations prolifiques. Le résultat est significatif si la statistique F est supérieure à la valeur F. Un résultat significatif indique la différence des moyennes. Si la statistique F est de 1 ou proche de 1, alors les deux variances sont égales et indiquent que l’hypothèse nulle est vraie.

4 Exemple de données

Pour cet exemple, j’ai des données de 3 groupes masculins différents pour leur performance au test de saut vertical. Chaque groupe différent est dans une colonne différente et chaque cellule représente la hauteur d’un participant différent qu’ils ont sauté (en cm).

Et comme vous pouvez le voir, j’ai 15 participants dans chaque groupe.

Ce que je veux faire maintenant, c’est effectuer une ANOVA unidirectionnelle pour déterminer s’il existe une différence significative entre les mesures de taille moyenne de mes 3 groupes.

Pour effectuer une ANOVA unidirectionnelle dans Excel, suivez les étapes suivantes.

  • Étape 1 :Cliquez sur Utilitaire d’analyse sous l’onglet Données

  • Étape 2 :Dans la fenêtre Utilitaire d’analyse, sélectionnez la première option, Analyse de variance : un facteur.

La première chose que vous devez faire est de sélectionner la plage d’entrée ; ce sont essentiellement les données que nous voulons exécuter dans l’analyse. Vous pouvez mettre en surbrillance les étiquettes de la première ligne si vous le souhaitez (plus d’informations à ce sujet).

  • Étape 3 : Modifier les options de la fenêtres Analyse de variance : un facteur.

Dans la fenêtre suivante pour Plage d’entrée, sélectionnez les groupes.

Ensuite, vous devez sélectionner la manière dont les données sont regroupées (en colonnes ou en lignes). Dans mon exemple, je sélectionnerai l’option par colonnes car les données de chaque groupe se trouvent dans une colonne distincte. Si vos données ont été saisies en lignes au lieu de colonnes, vous pouvez sélectionner l’option Lignes.

Si vous avez mis en surbrillance les étiquettes de votre première ligne lors de la sélection de la plage d’entrée, cochez cette option.

L’option suivante consiste à spécifier votre niveau alpha.

Il s’agit essentiellement de votre seuil de signification. Habituellement, cela est fixé à 0,05, ce qui signifie que si la valeur P est ≤0,05, vous rejetterez l’hypothèse nulle et accepterez l’hypothèse alternative.

Nous allons laisser cet ensemble à 0,05 pour cet exemple

Enfin, vous devez sélectionner les options de sortie.

Il y a 3 choix ici :

Plage de sortie – Vous permet de mettre en surbrillance une région dans la feuille où vous souhaitez que les résultats soient saisis

Nouvelle feuille de calcul par – Placer les résultats sur une nouvelle feuille de calcul et vous pouvez donner un nom à cette feuille

Nouveau classeur – Placez les résultats dans un fichier Excel complètement séparé

Pour mon exemple, je vais sélectionner la deuxième option et appeler la feuille Résultats.

Enfin, sélectionnez OK pour exécuter le test ANOVA unidirectionnel.

Interprétation des résultats

Nous allons maintenant interpréter les résultats de l’ANOVA unidirectionnelle donnés par Excel.

Le premier tableau présente un résumé des données de l’analyse.

RAPPORT DETAILLE

Ici vous trouverez :

Nombre d’échantillons – Le nombre de points de données dans chaque groupe.

Somme – La valeur totale si tous les points de données ont été additionnés

Moyenne – La valeur moyenne dans chaque groupe

Variance – La moyenne des différences au carré par rapport à la moyenne ; c’est simplement une mesure de l’écart entre les nombres dans un ensemble de données

Analyse de variance

Voilà donc un aperçu du tableau récapitulatif des résultats ANOVA ci-dessous.

Les résultats ici sont divisés en trois lignes :

– Entre les groupes – Les résultats lorsque l’entre les groupes est classé comme source de variation

– Au l’interieur des groupes – Les résultats lorsque la source de variation se trouve au sein des groupes

– Total – La somme pour le SS et df pour les 2 premières lignes

Chaque colonne du tableau représente une sortie différente. Je vais maintenant expliquer brièvement ce que sont chacun :

Somme des carrés (SS) – Quantifie la variabilité soit entre les groupes, soit au sein des groupes

Degrés de liberté (df) – Le dl entre les groupes est calculé en soustrayant 1 du nombre de groupes dans l’analyse (par exemple 3-1) ; le dl au sein des groupes est calculé en soustrayant le nombre de groupes dans l’analyse du nombre total d’observations (par exemple 45-3)

Carré moyen (MS) – La variation moyenne entre ou au sein des groupes, selon la ligne que vous regardez. Il est calculé en divisant le SS par le df

Statistique F (F) – La statistique de test dans le test ANOVA à un facteur

Valeur P – La valeur P pour le test ANOVA unidirectionnel

F critique – La valeur critique F ; ceci est calculé sur la base des valeurs F et df

Avant d’interpréter la valeur P pour le test ANOVA unidirectionnel, permettez-moi de décrire mes hypothèses nulles et alternatives.

Hypothèse nulle

Il n’y a pas de différence entre les moyennes de mes 3 groupes

Hypothèse alternative

Il y a une différence entre les moyennes de mes 3 groupes

Alors, rappelez-vous avant quand vous avez spécifié votre valeur alpha ?

Dans cet exemple, l’alpha était de 0,05. Cela signifie que lorsque P ≤ 0,05, nous rejetterons l’hypothèse nulle et accepterons l’hypothèse alternative. Ou, lorsque P > 0,05, nous accepterons l’hypothèse nulle et rejetterons l’hypothèse nulle.

Ainsi, puisque ma valeur P est supérieure à ma valeur alpha de 0,05, nous ne parviendrons pas à rejeter l’hypothèse nulle.

Il n’y a donc pas de différence entre les moyennes de mes 3 groupes. En d’autres termes, chaque groupe a réalisé en moyenne plus ou moins la même chose au test de saut vertical.

Tests post-hoc

Maintenant, si votre résultat ANOVA à un facteur était significatif (P≤α), alors le test ne peut que vous dire qu’il y a une différence entre les moyennes du groupe. Il est très important de comprendre que le test ne vous dira pas où se situent ces différences. Ainsi, vous ne saurez pas quel groupe spécifique est différent des autres. Pour étudier plus avant des résultats significatifs, vous devrez effectuer des tests post-hoc.

4 Qu’est-ce qu’ANCOVA ?

ANCOVA signifie Analysis of Covariance, qui peut être compris comme un processus étendu du test Anova. Ancova utilise une combinaison d’ANOVA et de régression. Par exemple, si toutes les variables indépendantes agissent comme des covariables, l’ANCOVA se transforme en analyse de régression ; il illustre donc un hybride d’analyse Anova et de régression. Le test prend en compte et contrôle l’effet des covariables, améliorant ainsi l’exactitude d’une expérience. Les covariables sont certaines caractéristiques des participants au test qui ne sont pas pertinentes pour l’étude. Mais cela peut potentiellement affecter la variable de réponse (résultat).

Prenons un exemple anova vs ancova. L’ANCOVA pourrait par exemple être utilisée dans une étude visant à tester les effets d’un traitement utilisant un médicament spécifique sur une maladie spécifique chez des participants d’âges différents. Ici, le facteur ou la variable indépendante catégorielle est le traitement, l’âge agit comme une variable indépendante continue et le changement de l’état de la maladie après le traitement est la variable dépendante ou la variable de réponse. Dans le même temps, l’ANOVA pourrait être utilisée si l’âge n’est pas signifié comme une variable indépendante métrique ou continue. Dans ce cas, l’accent est mis sur le traitement (facteur ou variable indépendante catégorielle) et sur l’évolution de l’état de la maladie après le traitement (variable dépendante ou réponse).

Les méthodes statistiques telles que l’analyse de régression et la MANOVA sont souvent comparées à l’ANOVA et à l’ANCOVA. MANOVA est similaire à l’ANOVA mais contient plus d’une variable de réponse continue, contrairement à l’ANOVA avec une variable de réponse. Dans la régression par rapport à l’ANOVA, le facteur de régression peut être des variables prédictives continues, tandis que l’ANOVA utilise des variables prédictives catégorielles pour analyser le résultat.

Tableau comparatif

Détails ANOVA ANCOVA
Représente Analyse de la variance Analyse de covariance
Signification C’est une méthode statistique pour tester la variance ou les différences entre les moyennes de trois groupes ou plus. Il évalue la moyenne d’une variable dépendante sur la base d’une variable indépendante catégorielle tout en considérant et en contrôlant les effets des covariables.
Les usages Peut mélanger des modèles linéaires et non linéaires Un modèle linéaire est utilisé seul
Implique Variables indépendantes catégorielles Variables indépendantes catégorielles et métriques
Covariable Néglige l’influence des covariables Prend en compte et contrôle l’effet des covariables

 

Principales différences entre la régression et l’ANOVA

■ La régression s’applique principalement aux variables fixes ou indépendantes, et l’ANOVA s’applique aux variables aléatoires.

■ La régression est utilisée sous deux formes : la régression linéaire et la régression multiple. D’autres formes de régression sont également présentes en théorie. Ces types sont utilisés dans la pratique. D’autre part, il existe trois types populaires d’ANOVA : à effet aléatoire, à effet fixe et à effet mixte.

■ La régression est utilisée pour faire des estimations ou des prédictions pour la variable dépendante à l’aide d’une ou de plusieurs variables indépendantes. L’ANOVA est utilisée pour trouver une moyenne commune entre les variables de différents groupes.

■ Dans le cas de la régression, le terme d’erreur est un, mais dans le cas de l’ANOVA, le nombre du terme d’erreur est supérieur à un.

Tableau comparatif

Base Régression ANOVA
Définition La régression est une méthode statistique très efficace pour établir la relation entre des ensembles de variables. L’ANOVA est la forme abrégée d’analyse de variance. Il est appliqué à des groupes non apparentés pour savoir s’ils ont une moyenne commune
Nature de la variable La régression est appliquée aux variables indépendantes ou aux variables fixes. L’ANOVA est appliquée à des variables de nature aléatoire
Les types La régression est principalement utilisée sous deux formes. Il s’agit de la régression linéaire et de la régression multiple ; ce dernier cas se produit lorsque le nombre de variables indépendantes est supérieur à un. Les trois types populaires d’ANOVA sont l’effet aléatoire, l’effet fixe et l’effet mixte.
Exemples Une entreprise de peinture utilise des solvants et des monomères comme matière première, qui est un dérivé du brut ; nous pouvons effectuer une analyse de régression entre le prix de cette matière première et le prix du brut Brent. Supposons que deux équipes de recherche distinctes étudient différents produits sans rapport les uns avec les autres. L’ANOVA aidera à trouver laquelle fournit les meilleurs résultats.
Variables utilisées La régression est appliquée à deux ensembles de variables, l’un d’eux est la variable dépendante et l’autre est la variable indépendante. Le nombre de variables indépendantes dans la régression peut être un ou plusieurs. L’ANOVA est appliquée à des variables différentes, qui ne sont pas nécessairement liées les unes aux autres.
Utilisation du test La régression est principalement utilisée par les praticiens ou les experts du secteur afin de faire des estimations ou des prédictions pour la variable dépendante. L’ANOVA est utilisée pour trouver une moyenne commune entre les variables de différents groupes.
les erreurs Les prédictions faites par l’analyse de régression ne sont pas toujours souhaitables ; c’est à cause du terme d’erreur dans une régression, ce terme d’erreur est également appelé résidu. Dans le cas d’une régression, le numéro du terme d’erreur est un. Le nombre d’erreurs dans le cas de l’ANOVA, contrairement à la régression, est supérieur à une.

Les régressions et l’ANOVA sont de puissants outils statistiques appliqués à plusieurs variables. Par exemple, on peut utiliser la régression pour faire des prédictions sur la variable dépendante à l’aide de variables indépendantes avec certaines relations. De plus, il est utile de valider une hypothèse, que l’hypothèse émise soit correcte ou non.

La régression est utilisée sur des variables fixes ou indépendantes et effectuée avec une seule variable indépendante ou plusieurs variables indépendantes. L’ANOVA est utilisée pour trouver un point commun entre des variables de différents groupes non liés. Il n’est pas utilisé pour faire une prédiction ou une estimation mais pour comprendre les relations entre l’ensemble de variables.

S’abonner
Notifier de
0 Commentaires
Inline Feedbacks
Voir tous les commentaires

Initiation à Excel

Fonctions Excel

Excel VBA

Macros VBA Utiles

Plus d'outils

Sur Facebook

Sur YouTube

0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x