Le test T dans Excel

Un test T est la mesure statistique finale pour déterminer les différences entre deux moyennes qui peuvent ou non être liées. Le test utilise des échantillons sélectionnés au hasard dans les deux catégories ou groupes. C’est une méthode statistique dans laquelle les échantillons sont choisis au hasard, et il n’y a pas de distribution normale parfaite.

Le type de test T à effectuer est décidé selon que les échantillons à analyser appartiennent à la même catégorie ou à des catégories distinctes. L’inférence obtenue dans le processus indique la probabilité que les différences moyennes se soient produites par hasard. Le test est utile pour comparer l’âge de la population, la durée des cultures de deux espèces différentes, les notes des élèves, etc.

Points clés à retenir :

■ Un test T est une méthode statistique de comparaison des moyennes ou des proportions de deux échantillons provenant du même groupe ou de catégories différentes.

■ Il vise les tests d’hypothèses, qui sont utilisés pour tester une hypothèse relative à une population donnée.

■ C’est la différence entre les moyennes de la population et une valeur hypothétique.

■ Les variances à un échantillon, à deux échantillons, appariées, égales et inégales sont les types de tests T que les utilisateurs peuvent utiliser pour les comparaisons moyennes.

2 Le test T expliqué

Un test T étudie un ensemble de données recueillies auprès de deux groupes similaires ou différents pour déterminer la probabilité de la différence dans le résultat par rapport à ce qui est habituellement obtenu. La précision du test dépend de divers facteurs, y compris les modèles de distribution utilisés et les variantes influençant les échantillons collectés. En fonction des paramètres, le test est effectué et une valeur T est obtenue en tant qu’inférence statistique de la probabilité que le résultat habituel soit déterminé par le hasard.

Par exemple, si l’on souhaite savoir si la moyenne de la longueur des pétales d’une fleur appartenant à deux espèces différentes est la même, un test T peut être effectué. L’utilisateur peut sélectionner au hasard des pétales de deux autres espèces de cette fleur et arriver à une conclusion standard. L’interprétation finale du test T peut être obtenue de l’une des deux manières suivantes :

■ Une hypothèse nulle signifie que la différence entre les moyennes est nulle et où les deux moyennes sont indiquées comme égales.

■ Une autre hypothèse implique que la différence entre les moyennes est différente de zéro. Cette hypothèse rejette l’hypothèse nulle, indiquant que l’ensemble de données est assez précis et non par hasard.

Ce test T, cependant, n’est valide et ne doit être effectué que lorsque la moyenne ou la moyenne de seulement deux catégories ou groupes doit être comparée. Dès que le nombre de comparaisons à effectuer est supérieur à deux, il est déconseillé de le faire.

Hypothèses

Le test s’exécute sur un ensemble d’hypothèses, qui sont les suivantes :

■ L’échelle de mesure utilisée pour un tel tests d’hypothèses suit un ensemble de motifs continus ou ordinaux. Les paramètres pris en compte et les variantes influençant les échantillons et entourant les groupes sont basés sur la considération standard.

■ Les tests sont entièrement basés sur un échantillonnage aléatoire. Comme aucune individualité n’est maintenue dans les échantillons, la fiabilité est souvent remise en question. 

■ Lorsque les données sont tracées par rapport à la distribution du test T, elles doivent suivre une distribution normale et produire un graphique en cloche.

■ Pour plus de clarté courbe en cloche, la taille de l’échantillon doit être plus grand.

■ L’écart doit être tel que l’écarts types des échantillons sont presque égaux.

3 Les types de test T

Certains des types de tests T largement utilisés sont les suivants :

– Test T à un échantillon

Lors de l’exécution de ce test, la moyenne ou la moyenne d’un groupe est comparée à la moyenne définie, qui est soit la valeur théorique, soit la moyenne de la population. Par exemple, un enseignant souhaite déterminer la taille moyenne des élèves de la classe 5 et la comparer à une valeur définie de plus de 45 kg.

L’enseignant sélectionne d’abord au hasard un groupe d’élèves et enregistre les poids individuels pour y parvenir. Ensuite, elle découvre le poids moyen de ce groupe et vérifie s’il correspond à la valeur standard définie de 45+. La formule utilisée pour obtenir les résultats du test t à un échantillon est :

Où,

■ T = statistique t

■ m = moyenne du groupe

■ µ= valeur moyenne théorique de la population

■ s = écart type du groupe

■ n = taille de l’échantillon

Test T indépendant à deux échantillons

Il s’agit du test effectué lorsque des échantillons de deux groupes, espèces ou populations différents sont étudiés et comparés. Il est également connu sous le nom de test T indépendant. Par exemple, si une enseignante veut comparer la taille des élèves de sexe masculin et des élèves de sexe féminin de la classe 5, elle utilisera le test indépendant à deux échantillons.

La formule du test T utilisée pour calculer ceci est :

Où,

■ mA – mB = moyenne d’échantillons provenant de deux groupes ou populations différents

■ nA – nB = tailles d’échantillon respectives

■ s2 = écart type ou variance commune de deux échantillons

– Test T d’échantillon apparié

Ce test d’hypothèse est effectué lorsque deux groupes appartiennent à la même population ou au même groupe. Les groupes sont étudiés soit à deux moments différents, soit dans deux conditions variées. La formule utilisée pour obtenir la valeur t est :

Où,

■ T = statistique t

■ m = moyenne du groupe

■= valeur moyenne théorique de la population

■ s = écart type du groupe

■ n = taille de l’échantillon

– Test T à variance égale

Ce test est effectué lorsque la taille de l’échantillon dans chaque groupe ou population est la même ou que la variance des deux ensembles de données est similaire. Il est également appelé test T groupé. La formule appliquée ici est la suivante :

Où,

■ Moyenne1 et moyenne2 = valeur moyenne de chaque ensemble d’échantillons

■ var1 et var2 = variance de chaque ensemble d’échantillons

■ n1 et n2 = nombre d’enregistrements dans chaque ensemble

– Test T de variance inégale

Le test de variance inégale est utilisé lorsque la variance et le nombre d’échantillons dans chaque groupe sont différents. Il est souvent appelé test de Welch et la formule est la suivante :

Où,

■ moyenne1 et moyenne2 = valeur moyenne de chaque ensemble d’échantillons

■ var1 et var2 = variance de chaque ensemble d’échantillons

■ n1 et n2 = nombre d’enregistrements dans chaque ensemble

4 Le test dans Excel

Un test t dans Excel peut être effectué en utilisant la Boîte à outils d’analyse de données ou la fonction TTEST d’Excel. La fonction TTEST a été remplacée par la fonction T.TEST dans Excel 2010.

Les fonctions TEST.STUDENT ou T.TEST sont classées dans les fonctions statistiques d’Excel.

Syntaxe de la fonction T.TEST d’Excel

La syntaxe de la fonction T.TEST est illustrée dans l’image suivante :

=T.TEST(Matrice1 ;Matrice2 ;Uni/bilatéral;Type)

La fonction TTEST accepte les arguments suivants :

Matrice1 : Il s’agit du premier ensemble de données sur lequel le test t Excel doit être effectué.

Matrice2 : Il s’agit du deuxième ensemble de données sur lequel le test t Excel doit être effectué.

Uni/bilatéral : Ceci spécifie le type de distribution à utiliser. Cet argument peut prendre l’une des valeurs suivantes :

 Ceci implique une distribution unilatérale. Un test t unilatéral est effectué lorsque l’on veut étudier la direction spécifique (uniquement la direction positive ou uniquement la direction négative) de la différence entre les deux moyennes.

 Ceci implique une distribution bilatérale. Un test t bilatéral est effectué lorsque l’on veut savoir si les deux moyennes de la population sont différentes l’une de l’autre ou non.

Type : C’est le type de T .Cet argument peut prendre l’une des valeurs suivantes :

 Cela implique qu’un test t pour échantillons appariés doit être effectué.

 Cela implique qu’un test t de variance égale à deux échantillons doit être effectué. Il faut effectuer ce test lorsqu’il y a deux échantillons indépendants ayant les mêmes variances de population (égales). La caractéristique de la même variance est connue sous le nom d’homoscédasticité.

 Cela implique qu’un test t de variance inégale à deux échantillons (ou le test t de Welch) doit être effectué. Il faut effectuer ce test lorsqu’il y a deux échantillons indépendants ayant des variances inégales ou inconnues. La caractéristique des variances inégales est connue sous le nom d’hétéroscédasticité.

Tous les arguments précédents sont obligatoirement requis lors de la réalisation d’un test t dans Excel.

La fonction T.TEST d’Excel est simple et facile à utiliser. Prenons quelques exemples pour comprendre le fonctionnement de la fonction T.TEST dans Excel.

Exemple n ° 1 – Test T d’échantillon apparié utilisant une distribution unilatérale

L’image suivante montre les dépenses engagées (en INR) par une organisation dans deux pays, l’Inde et les États-Unis. Effectuez un test t d’échantillon apparié dans Excel en utilisant une distribution unilatérale.

Les étapes pour effectuer un test t apparié avec une distribution unilatérale sont répertoriées comme suit :

Étape 1 : Entrez la formule suivante dans la cellule B25.

=T.TEST(A4:A24;B4:B24;1;1)

La même chose est montrée dans l’image suivante.

Étape 2 : Appuyez sur la touche “Entrée”. La sortie dans la cellule B25 est 0,177639611, comme illustré dans l’image suivante.

Uni/bilatéral Explication : La plage A4:A24 (saisie à l’étape 1 de la formule) est le premier tableau sur lequel le test t Excel doit être effectué. De même, la plage B4:B24 est le deuxième tableau sur lequel le test t doit être effectué.

De plus, nous avons entré les arguments « Uni/bilatéral » et « type » comme 1. En effet, un test t unilatéral et apparié doit être effectué.

Interprétation : Accepter ou rejeter l’hypothèse nulle, effectuez les tâches suivantes :

■ Calculez la valeur de la table t en vous référant à la table de distribution t unilatérale, à un certain niveau de signification (alpha) avec le degrés de liberté (df). Comparez la valeur du tableau t avec la valeur t calculée ( 0,177639611). Si la valeur t calculée est supérieure à la valeur de la table t, rejetez l’hypothèse nulle.

■ Calculez la valeur p en fonction de la valeur de la table t. Comparez les valeur p avec le niveau de signification. Étant donné que le niveau de signification (alpha) n’est pas spécifié dans la question, considérez-le comme 0,05 ou 5 %. Si la valeur de p est inférieure au seuil de signification, rejetez l’hypothèse nulle.

L’acceptation ou le rejet de l’hypothèse nulle doit être effectué en utilisant une combinaison des valeurs p et t (obtenues dans les pointeurs précédents a et b). De plus, rejeter une hypothèse nulle implique d’accepter l’hypothèse alternative.

Le signe négatif (le cas échéant) peut être ignoré lors de la comparaison des valeurs t.

NOTE

L’hypothèse nulle d’un test t Excel pour échantillon apparié suppose que la différence moyenne des observations appariées est nulle. En d’autres termes, la moyenne des observations appariées est égale.

L’hypothèse alternative d’un test t pour échantillon apparié suppose que la différence moyenne des observations appariées n’est pas égale à zéro. Par exemple, la différence entre les observations appariées pour la ligne 4 est (18-19) ou (cellule A4-cellule B4).

Le rejet de l’hypothèse nulle implique que la différence moyenne des observations appariées existe. En d’autres termes, cette différence moyenne n’est pas égale à zéro.

Exemple n° 2 – Test T à variance égale à deux échantillons utilisant une distribution unilatérale

Une organisation a introduit une nouvelle saveur de boisson sur le marché. Pour tester l’efficacité de cette saveur, deux échantillons (composés de 21 personnes dans chaque échantillon) sont créés.

Les différentes personnes qui ont goûté la nouvelle saveur sont listées dans la colonne « nouveau ». Les différentes personnes ayant goûté à l’ancienne saveur sont listées dans la colonne « ancienne ». Considérez les groupes « nouveaux » et « anciens » comme des échantillons indépendants.

L’écarts de population des deux échantillons, “nouveau” et “ancien”, sont égaux. Calculez le test t de variance égale à deux échantillons dans Excel en utilisant une distribution unilatérale.

Les étapes pour effectuer le test t de variance égale à deux échantillons à l’aide d’une distribution unilatérale sont répertoriées comme suit :

Étape 1 : Entrez la formule suivante dans la cellule B52.

“=TTEST(A31:A51,B31:B51,1,2)”

La même chose est montrée dans l’image suivante.

Étape 2 : Appuyez sur la touche “Entrée”. La sortie dans la cellule B52 est 0,454691996.

Explication : Le premier tableau (dans la formule entrée à l’étape 1) est A31:A51 et le deuxième tableau est B31:B51. L’argument 1 indique qu’un test unilatéral doit être effectué. L’argument 2 implique qu’un test t de variance égale à deux échantillons doit être effectué.

Interprétation : Pour accepter ou rejeter l’hypothèse nulle, comparez la valeur t calculée avec la valeur de la table t. Dans le même temps, comparez la valeur de p avec le niveau de signification standard (0,05).

L’hypothèse nulle du test t de variance égale à deux échantillons dans Excel indique que la différence entre les moyennes des deux échantillons est nulle. Autrement dit, les moyennes des deux échantillons sont égales. L’hypothèse alternative stipule que les moyennes des deux échantillons ne sont pas égales.

NOTE

Si l’on utilise l’utilitaire d’analyse, comparer la statistique t des résultats obtenus avec la valeur unilatérale t-critique. Si la statistique t est supérieure à la valeur unilatérale critique t, rejetez l’hypothèse nulle. De même, comparez la valeur p unilatérale avec le niveau de signification. Si la première (p valeur unilatérale) est inférieure à la seconde (niveau de signification), rejetez l’hypothèse nulle.

Le rejet d’une hypothèse nulle implique qu’il existe une différence entre les deux moyennes d’échantillon. De plus, cette différence ne s’explique pas uniquement par le hasard.

Lors de l’utilisation du Data Analysis Toolpak(utilitaire d’analyse) , si l’on ne sait pas quelles valeurs t (d’un test unilatéral ou bilatéral) doivent être comparées, comparez toujours la statistique t avec la valeur t-critique bilatérale .

Exemple #3–Test T de variance inégale à deux échantillons utilisant une distribution unilatérale

Un chercheur veut étudier l’impact d’un nouveau médicament sur les compétences de conduite automobile d’une personne. Au total, 21 personnes ont reçu le médicament avant de passer un examen de conduite.

La colonne A de l’image suivante montre le score attribué à chaque conducteur. La colonne B montre le niveau de drogue (en pourcentage) donné à chaque conducteur.

Les variances de population des deux échantillons sont inégales. Effectuez le test de variance inégale à deux échantillons en utilisant une distribution unilatérale.

Les étapes pour effectuer le test de variance inégale à deux échantillons à l’aide d’une distribution unilatérale sont répertoriées comme suit :

Étape 1 : Entrez la formule suivante dans la cellule B78.

=T.TEST(A57:A77;B57:B77;1;3)

La même chose est montrée dans l’image suivante.

Étape 2 : Appuyez sur la touche “Entrée”. La sortie est 0,364848284, comme illustré dans l’image suivante.

Explication : La plage A57:A77 représente le premier tableau (dans la formule entrée à l’étape 1). La plage B57:B77 représente le deuxième tableau sur lequel le test t Excel doit être effectué.

Puisqu’un test unilatéral doit être effectué, nous entrons 1 dans l’argument “queues”. Le 3 dans l’argument “type” implique que le test t de variance inégale à deux échantillons doit être effectué.

Interprétation : Comparez la valeur t-calculée avec la valeur t-table. Si le premier est supérieur au second au niveau de signification donné, rejetez l’hypothèse nulle. De même, si la valeur de p est inférieure au seuil de signification, rejetez l’hypothèse nulle et acceptez l’hypothèse alternative.

NOTE

L’hypothèse nulle pour le test t de variance inégale à deux échantillons indique que la moyenne des deux échantillons est la même (ou égale). L’hypothèse alternative stipule que la moyenne des deux échantillons n’est pas la même (ou inégale).

5 Les erreurs renvoyées par la fonction T.TEST d’Excel

La fonction T.TEST peut renvoyer les types d’erreurs suivants :

Erreur « #N/A » : Ceci s’affiche si les deux matrices fournies sont de longueurs différentes et qu’un test t apparié doit être effectué.

Erreur “#NOM?”  : ceci s’affiche si l’un des arguments “uni/bilatéral” ou “type” est fourni en tant que valeur de texte.

Erreur « #Nombre ! »: ceci s’affiche pour l’une des raisons suivantes :

– Si l’argument “uni/bilatéral” est autre que les nombres 1 ou 2

– Si l’argument “type” est autre que les chiffres 1, 2 ou 3

L’erreur « #NOMBRE ! » est illustrée dans l’image suivante. Il faut noter que l’argument “uni/bilatéral” dans la formule T.TEST a été saisi à 5. De plus, les deux tableaux fournis sont de tailles différentes.

Si les tableaux avaient été égaux en longueur et que les arguments “uni/bilatéral” et “type” étaient restés 5 et 1 respectivement, l’erreur “#NOMBRE !”  aurait toujours été affichée.

6 Différences entre le test Z et le test T

Le test Z est l’hypothèse statistique utilisée pour déterminer si les moyennes des deux échantillons calculés sont différentes si l’écart type est disponible et que l’échantillon est grand. En revanche, le test T détermine la différence entre les moyennes de différents ensembles de données dans le cas où l’écart type ou la variance est inconnu.

Les tests Z et les tests T sont les deux méthodes statistiques qui impliquent l’analyse de données, qui ont des applications dans les sciences, les affaires et de nombreuses autres disciplines. Le test T est un test d’hypothèse univarié basé sur des statistiques T, dans lequel la moyenne, c’est-à-dire la moyenne, est connue et la variance de la population, c’est-à-dire l’écart type, est approximée à partir de l’échantillon. D’autre part, le test Z est également un test univarié basé sur un distribution normale standard.

Principales différences

■ L’une des conditions essentielles pour effectuer un test T est que l’écart type de la population ou la variance est inconnu. A l’inverse, la formule de variance de la population, doit être supposée connue ou connue dans le cas d’un test Z.

■ Le test t, comme mentionné précédemment, est basé sur la distribution t. Au contraire, le test Z suppose que la distribution des moyennes d’échantillon sera normale. La distribution normale et la distribution T de l’étudiant semblent identiques, car les deux sont en forme de cloche et symétrique. Cependant, ils diffèrent dans l’un des cas avec moins d’espace au centre et plus dans leurs uni/bilatéral dans la distribution T.

■ Le test Z est utilisé comme indiqué dans le tableau ci-dessus lorsque la taille de l’échantillon est grande, ce qui est n > 30, et le test t est approprié lorsque la taille de l’échantillon n’est pas grande, ce qui est petit, c’est-à-dire que n < 30.

 

Base Test Z Test T
1`1 Le test Z est une sorte de test d’hypothèse qui vérifie si les moyennes des 2 ensembles de données sont différentes l’une de l’autre lorsque l’écart type ou la variance est donné. Le test t peut être considéré comme une sorte de test paramétrique qui est appliqué à une identité, comment les moyennes de 2 ensembles de données diffèrent l’une de l’autre lorsque l’écart type ou la variance n’est pas donné.
Écart démographique La variance de la population ou l’écart type est connu ici. La variance de la population ou l’écart type est inconnu ici.
Taille de l’échantillon La taille de l’échantillon est grande. Ici, la taille de l’échantillon est petite.
Hypothèses clés ·         Tous les points de données sont indépendants.

·         Distribution normale pour Z, avec une moyenne nulle et une variance = 1.

·         Tous les points de données ne sont pas dépendants.

·         Les valeurs des échantillons doivent être enregistrées et prises avec précision.

Basé sur (un type de distribution) Basé sur Distribution normale. Basé sur la distribution Student-t.

 

7 Différence entre ANOVA et test T

La principale différence entre l’ANOVA et le test T est que l’ANOVA est appliquée pour tester les moyennes de plus de deux groupes. En revanche, un test t n’est utilisé que lorsque le chercheur compare ou analyse deux groupes de données ou échantillons de population. De plus, dans l’ANOVA, la variable dépendante doit être continue et la variable indépendante doit être catégorielle et avoir au moins trois niveaux ou catégories. Dans le test t, les variables dépendantes doivent être continues et la variable indépendante doit être catégorielle et avoir deux niveaux. Voici quelques-uns des points importants expliquant l’ANOVA par rapport au test t.

Principales différences

■ Dans l’ANOVA et le test t, la principale différence est que l’ANOVA est appliquée pour tester les moyennes de plus de deux groupes, alors que le test t compare ou analyse les moyennes de deux groupes. Il explique quand utiliser l’ANOVA et le test t et quelle est la différence entre l’ANOVA et le test t.

■ Dans l’ANOVA unidirectionnelle par rapport au test t, la variable indépendante de l’ANOVA unidirectionnelle doit être catégorielle et comporter au moins trois niveaux ou catégories. Dans le test t, la variable indépendante doit être catégorique et avoir deux niveaux.

■ Les deux méthodes partagent des similitudes, car les deux sont des méthodes statistiques utilisées pour tester des hypothèses et comparer les valeurs moyennes des échantillons, etc.

Détails ANOVA Test T
Signification Il s’agit d’une méthode statistique qui compare les moyennes de plus de deux échantillons. Il s’agit d’un test statistique utilisé pour comparer les moyennes de deux échantillons.
Les types Les deux types sont l’ANOVA unidirectionnelle et bidirectionnelle. Les types courants incluent le test t à un échantillon, le test t à deux échantillons et le test t apparié.
Base La variance entre l’ensemble de données, le groupe ou l’échantillon, ainsi que la variance à l’intérieur de l’ensemble de données, du groupe ou de l’échantillon, sont calculées. Calculez les différences moyennes, l’écart type et le nombre de valeurs de données.
Population Il peut accueillir une population considérable. La population échantillonnée doit être inférieure à 30 personnes.
Le test produit La valeur statistique du test est F. La valeur statistique du test est t.
La valeur indique Plus la valeur F est élevée, il existe une variation significative entre les moyennes de l’échantillon ou du groupe, et une valeur F faible indique une faible variabilité. Si le score t ou la valeur t est faible, les groupes ou échantillons sont similaires, tandis que si le score t est grand, les groupes ou échantillons sont différents.
les erreurs Plus de risques d’erreur par rapport au test t. Des erreurs sont possibles.

 

S’abonner
Notifier de
0 Commentaires
Inline Feedbacks
Voir tous les commentaires

Initiation à Excel

Fonctions Excel

Excel VBA

Macros VBA Utiles

Plus d'outils

Sur Facebook

Sur YouTube

0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x