Échelles de mesure dans Excel

Il y a une différence dans la façon dont le poids et le sexe sont mesurés et rapportés dans la figure 1.2 qui est fondamentale pour toutes les analyses statistiques – et comment vous apportez les outils d’Excel pour les chiffres. La

différence concerne les échelles de mesure.

Catégorie Balances
Dans les figures 1.2 et 1.3, la variable Sexe est mesurée à l’aide d’une échelle de catégories, souvent appelée échelle nominale. Des valeurs différentes dans une variable de catégorie représentent simplement différents groupes, et il n’y a rien d’intrinsèque aux catégories qui fait n’importe quoi mais les identifie. Si vous jetez les connotations psychologiques et culturelles que nous empilons sur les étiquettes, il n’y a rien sur Homme et Femme qui vous amènerait à en placer un à gauche et l’autre à droite dans le tableau croisé dynamique de la Figure 1.3, comme vous le feriez mettre juin à gauche de juillet.

Un autre exemple: Supposons que vous voulez tracer les ventes annuelles des voitures Ford, General Motors et Toyota. Il n’y a pas d’ordre nécessairement impliqué par les noms eux-mêmes: ce ne sont que des catégories. Cela se reflète dans la manière dont Excel peut représenter ces données (voir Figure 1.4).

Figure 1.4. Les diagrammes Colonne d’Excel affichent toujours les catégories sur l’axe horizontal et les valeurs numériques sur l’axe vertical.

Notez ces deux aspects des catégories de constructeurs automobiles dans la figure 1.4:

• Les catégories adjacentes sont équidistantes les unes des autres. Aucune information supplémentaire n’est fournie ou implicite par la distance de GM de Toyota, ou de Toyota de Ford.

• Le graphique n’indique aucune information dans l’ordre dans lequel les fabricants apparaissent sur l’axe horizontal. Il n’y a aucune suggestion que GM a moins de «voiture» que Toyota, ou Toyota moins que Ford. Vous pouvez les classer par ordre alphabétique si vous voulez, ou dans l’ordre du nombre de véhicules produits, mais il n’y a rien d’intrinsèque à l’échelle des noms des fabricants qui suggère un ordre de classement.

Remarque
Le nom Ford est bien sûr une valeur, mais Excel préfère l’appeler une catégorie et de réserver le terme valeur pour les valeurs numériques uniquement. C’est l’une des nombreuses bizarreries de la terminologie dans Excel.
En revanche, l’axe vertical dans le graphique montré dans la figure 1.4 est ce que Excel appelle un axe de valeur. Il représente des valeurs numériques. Remarquez sur la figure 1.4 qu’une position sur l’axe des valeurs verticales véhicule une information quantitative réelle: plus il y a de véhicules, plus la colonne est grande. Les axes vertical et horizontal dans les tableaux à colonnes d’Excel diffèrent de plusieurs façons, mais le plus important est que l’axe vertical représente des quantités numériques, tandis que l’axe horizontal indique simplement l’existence de catégories.

En général, les tableaux Excel placent les noms de groupes, de catégories, de produits ou de toute désignation similaire sur un axe de catégorie et la valeur numérique de chaque catégorie sur l’axe des valeurs. Mais la catégorie axe n’est pas toujours l’axe horizontal (voir la figure 1.5).

Figure 1.5. Contrairement aux diagrammes à colonnes, les diagrammes à barres d’Excel affichent toujours les catégories sur l’axe vertical et les valeurs numériques sur l’axe horizontal.


Le diagramme à barres fournit précisément les mêmes informations que le graphique à colonnes. Il fait simplement pivoter cette information de 90 degrés, en plaçant les catégories sur l’axe vertical et les valeurs numériques sur l’axe horizontal.
Je ne suis pas en train d’insister sur la question des échelles de mesure juste pour faire un point sur les graphiques Excel. Lorsque vous faites une analyse statistique, vous basez votre choix de technique en grande partie sur le type de question que vous posez. À son tour, la façon dont vous posez votre question dépend en partie de l’échelle de mesure que vous utilisez pour la variable qui vous intéresse.

Par exemple, si vous essayez d’enquêter sur l’espérance de vie chez les hommes et les femmes, il est assez élémentaire de poser des questions telles que: «Quelle est la durée de vie moyenne des hommes? Des femmes? “Vous examinez deux variables: le sexe et l’âge. L’un d’eux est une variable de catégorie, et l’autre est une variable numérique. (Comme vous le verrez dans les chapitres suivants, si vous généraliser à partir d’un échantillon d’hommes et des femmes à une population, le fait que vous travaillez avec une variable de catégorie et une variable numérique pourrait vous orienter vers ce que l’on appelle un test t).


Échelles numériques

Bien qu’il n’y ait qu’un seul type d’échelle de catégories, il existe trois types d’échelles numériques: ordinal, intervalle et ratio. Vous pouvez utiliser l’axe des valeurs de n’importe quel graphique Excel pour représenter n’importe quel type d’échelle numérique, et vous vous retrouvez souvent à analyser une variable numérique, quel que soit le type, en termes d’une autre variable. Brièvement, les types d’échelle numérique sont les suivants:

• Les échelles ordinales sont souvent des classements, et vous indiquent qui a terminé premier, deuxième, troisième, et ainsi de suite. Ces classements vous disent qui est sorti en avant, mais pas à quelle distance, et souvent vous ne vous en souciez pas. Supposons que dans une course de qualification, Jane a couru 100 mètres en 10,54 secondes, Mary en 10,83 secondes et Ellen en 10,84 secondes. Parce que c’est une course préliminaire, vous pourriez vous soucier seulement de leur ordre de finition, et non de la vitesse à laquelle chaque femme a couru. Par conséquent, vous pouvez convertir les mesures de temps en ordre de fin (1, 2 et 3), puis rejeter les minutages eux-mêmes. Les échelles ordinales sont parfois utilisées dans une branche de statistiques appelée non paramétrique mais sont rarement utilisées dans les analyses paramétriques discutées dans ce cours.

  • Les échelles d’intervalles indiquent des différences dans les mesures telles que la température et le temps écoulé. Si la haute température Fahrenheit le 1er juillet est de 100 degrés, 101 degrés le 2 juillet et 102 degrés le 3 juillet, vous savez que chaque jour est d’un degré plus chaud que le jour précédent. Ainsi, une échelle d’intervalle transmet plus d’informations qu’une échelle ordinale.
  • échelle ordinale, que dans la course de qualification Jane a couru plus vite que Mary et Mary ont couru plus vite que Ellen, mais les classements par eux-mêmes ne vous disent pas combien plus vite. Il faut du temps écoulé, une échelle d’intervalle, pour vous le dire.• Les échelles de rapport sont semblables aux échelles d’intervalle, mais elles ont un point zéro vrai, un où il y a une absence complète d’une certaine quantité. L’échelle de température Celsius a un point zéro, mais n’indique pas une absence totale de chaleur, juste que l’eau y gèle. Par conséquent, 10 degrés Celsius n’est pas deux fois plus chaud que 5 degrés Celsius, donc Celsius n’est pas une échelle de rapport. Les degrés kelvin ont un vrai point zéro, celui où il n’y a pas de mouvement moléculaire et donc pas de chaleur. Kelvin est
    une échelle de rapport, et 100 degrés Kelvin est deux fois plus chaud que 50 degrés Kelvin. Autre rapport familier les échelles sont la taille et le poids.

    Indiquer une valeur d’intervalle à partir d’une valeur de texte

    Excel a une portée étonnamment large, et pas seulement dans l’analyse statistique. Cependant, autant de compétences qu’il a été intégré, il ne peut pas tout à fait lire dans vos pensées. Il ne sait pas, par exemple, si les 1, 2 et 3 que vous venez d’entrer dans les cellules d’une feuille de calcul représentent le nombre de cuillères à café d’huile d’olive que vous utilisez dans trois recettes différentes ou 1ère, 2ème et 3ème place dans un primaire politique. En premier
    cas, vous vouliez indiquer des mesures liquides sur une échelle d’intervalle. Dans le second cas, vous vouliez entrer les trois premières places dans une échelle ordinale. Mais ils se ressemblent tous les deux à Excel.

    Remarque
    C’est un cas dans lequel vous devez vous fier à votre propre connaissance des échelles numériques car Excel ne peut pas dire si vous avez l’intention d’un nombre comme une valeur sur une échelle ordinale ou d’intervalle. Les échelles ordinales et d’intervalle ont des caractéristiques différentes – d’une part, les échelles ordinales ne suivent pas une distribution normale, une «courbe en cloche». Une variable ordinale a une instance de la valeur 1, une
    instance de 2, une instance de 3, et ainsi de suite, donc sa distribution est plate au lieu de courbe. Cependant, Excel ne peut pas faire la différence entre une variable ordinale et une variable d’intervalle, vous devez donc prendre le contrôle si vous voulez éviter d’utiliser une technique statistique incorrecte pour une échelle de mesure donnée.

    Le texte est une question différente. Vous pouvez utiliser les lettres A, B et C pour nommer trois groupes différents et, dans ce cas, vous utilisez des valeurs de texte sur une échelle de catégorie nominale. Vous pouvez également utiliser des nombres:
    1, 2 et 3 pour représenter les trois mêmes groupes. Mais si vous utilisez un nombre comme valeur nominale, c’est une bonne idée de le stocker dans la feuille de calcul en tant que valeur textuelle. Par exemple, une façon de stocker le nombre 2 en tant que valeur de texte dans une cellule de feuille de calcul consiste à le précéder d’une apostrophe: ‘2. (Vous verrez l’apostrophe dans la boîte de formule mais pas dans la cellule.)

Sur un graphique, Excel a des règles de décision compliquées qu’il utilise pour déterminer si un nombre est seulement un nombre. (Les versions récentes d’Excel ont des outils supplémentaires pour vous aider à participer au processus de prise de décision, comme vous le verrez plus loin dans ce chapitre.) Certaines de ces règles concernent le type de graphique que vous demandez. Par exemple, si vous demandez un graphique linéaire, Excel traite les nombres sur l’axe horizontal comme s’il s’agissait de valeurs nominales, sauf si vous prenez des mesures pour modifier le traitement. Mais si vous demandez plutôt un graphique XY en utilisant les mêmes données, Excel traite les nombres sur l’axe horizontal comme des valeurs sur une échelle d’intervalle. Vous en verrez plus à ce sujet dans la section suivante.

Donc, aussi inquiétant que cela puisse paraître, un nombre dans Excel peut être traité comme un nombre dans un contexte et pas dans un autre. Les règles d’Excel sont assez raisonnables, cependant, et si vous leur donnez un peu de réflexion lorsque vous voyez leurs résultats, vous verrez qu’ils ont du sens.
Si les règles d’Excel ne vous conviennent pas dans un cas particulier, vous pouvez fournir une assistance. La Figure 1.6 montre un exemple.

Figure 1.6. Vous n’avez pas de données pour tous les mois de l’année.
 

Supposons que vous gériez une entreprise qui fonctionne uniquement lorsque les écoles publiques sont en session, et que vous collectez des revenus pendant tous les mois sauf en juin, juillet et août. La figure 1.6 montre qu’Excel interprète les dates comme des catégories, mais seulement si elles sont saisies en tant que texte, comme dans A2: A10 de la figure. Notez ces deux aspects de la feuille de travail et du graphique de la figure 1.6:
• Les dates sont entrées dans les cellules de la feuille de calcul A2: A10 comme valeurs de texte. Une façon de dire est de regarder dans la boîte de formule, juste à la droite du symbole fx, où vous voyez la valeur du texte Janvier.
• Parce que ce sont des valeurs de texte, Excel n’a aucun moyen de savoir que vous voulez dire qu’ils représentent des dates, et donc il les traite comme des catégories simples – tout comme pour GM, Ford et Toyota. Excel trace les dates en tant que texte en conséquence, avec des distances égales entre elles: le mois de mai est aussi éloigné d’avril que de septembre.
Comparez la figure 1.6 avec la figure 1.7, où les dates sont de vraies valeurs numériques, pas simplement du texte:
• Vous pouvez voir dans la boîte de formule que c’est une date réelle, pas seulement le nom d’un mois, dans la cellule A2, et la même chose est vraie pour les valeurs dans les cellules A3: A10.
• Le graphique Excel répond automatiquement au type de valeurs que vous avez fourni dans la feuille de calcul. Le programme reconnaît que les chiffres saisis représentent des intervalles mensuels et, bien qu’il n’y ait pas de données de juin à août, le tableau laisse la place où les données apparaîtraient si elles étaient disponibles. Parce que l’axe horizontal représente maintenant une échelle numérique, et non des catégories simples, il reflète fidèlement le fait que dans le calendrier, le mois de mai est quatre fois plus éloigné de septembre que d’avril.

Remarque
Une valeur de date dans Excel est juste une valeur numérique: le nombre de jours qui se sont écoulés entre la date en question et le 1er janvier 1900. Excel suppose que lorsque vous entrez une valeur telle que 1/1/18, trois nombres séparés par deux barres obliques, vous l’envisagez comme une date. Excel le traite comme un nombre mais applique un format de date tel que mm / aa ou mm / jj / aaaa à ce nombre. Vous pouvez le démontrer par vous-même en entrant une date légitime (pas quelque chose comme 34/56/78) dans une cellule de feuille de calcul, puis en définissant le format numérique de la cellule sur Nombre avec zéro décimale.
Figure 1.7. L’axe horizontal représente les mois manquants.

S’abonner
Notifier de
0 Commentaires
Inline Feedbacks
Voir tous les commentaires

Initiation à Excel

Fonctions Excel

Excel VBA

Macros VBA Utiles

Plus d'outils

Sur Facebook

Sur YouTube

0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x
()
x