Histogramme et Graphique dans Excel
Pour tout le travail que Microsoft a fait en convertissant l’outil d’histogramme du complément Analyse de données en un type de graphique intégré, Excel ne propose toujours pas de manière totalement satisfaisante de créer un histogramme.
Plusieurs méthodes existent, et je vais les démontrer dans cette section, mais chacune nécessite que vous fassiez quelque chose que vous ne devriez vraiment pas avoir à faire.
Cela dit, l’une des méthodes fondamentales d’affichage graphique des données est la distribution de fréquences, ou histogramme. Une distribution de fréquence affiche les valeurs observées le long de son axe de catégorie (qui est souvent l’axe horizontal ou des x) et le nombre d’occurrences de chaque valeur observée le long de son axe de valeur (souvent l’axe vertical ou des y). C’est la disposition que la section précédente a discutée, en utilisant le graphique Colonne traditionnel comme méthode d’affichage.
Utilisation d’un tableau croisé dynamique pour compter les enregistrements
Nous n’avons pas encore examiné comment vous obtenez les données dans la forme tabulaire montrée plus récemment dans la plage A1: B4 de la figure 5.4. Lorsque vous préparez une analyse statistique, les données vous parviennent généralement par enregistrement, non regroupées comme indiqué dans les colonnes A et B des figures 5.1 à 5.4. La méthode standard – qui n’est pas la seule – pour organiser et résumer des enregistrements individuels dans Excel est au moyen d’un tableau croisé dynamique. La figure 5.5 montre le processus.
Figure 5.5. Le tableau croisé dynamique compte les enregistrements de chaque catégorie.
À la figure 5.5, le trimestre de l’exercice au cours duquel chaque lecteur électronique a été vendu figure dans la colonne B. Un tableau croisé dynamique qui résume le nombre d’articles vendus chaque trimestre se situe dans l’intervalle D1: E5.
La statistique récapitulative du tableau croisé dynamique est Nombre et non que la Somme défini par défaut.
Tout va bien jusqu’ici, mais si vous essayez maintenant de former un histogramme en utilisant les données du tableau croisé dynamique, vous êtes bloqués. Si vous essayez de créer un graphique standard à l’aide des données d’un tableau croisé dynamique, Excel insiste pour renvoyer un graphique pivot plutôt qu’un graphique Excel traditionnel.
Le tableau croisé dynamique de la figure 5.5 montre le compte pour chaque trimestre de vente, mais remarquez que les colonnes sont équidistantes. C’est le cas même si vous formatez l’axe horizontal pour que son type soit Date au lieu de Texte. Dans la plupart des cas, cela n’a pas d’importance : vous n’avez peut-être pas de quartier dont les données sont entièrement manquantes. Mais dans de nombreux cas, cela fera une différence significative sur la façon dont le graphique affiche les données.
Donc, si vous essayez de créer un graphique standard en utilisant un tableau croisé dynamique comme source de données, vous obtenez un graphique pivotant dont l’axe des catégories ne se comporte pas comme le fait l’axe des catégories dans un graphique standard.
Remarque
La même chose se produit si vous commencez par appeler un graphique pivot plutôt qu’un graphique standard à partir du tableau croisé dynamique. Dans les deux cas, Excel vous remet un tableau croisé dynamique. Ses colonnes sont équidistantes et la modification du type d’axe horizontal en Date n’a aucun effet. Les diagrammes croisés dynamiques ne présentent pas le même comportement que les diagrammes standard, même dans les zones auxquelles vous pourriez vous attendre.
Pourquoi le traitement des catégories manquantes est-il un gros problème ? Supposons que vous travaillez avec une distribution faussée, comme les prix du logement. La distribution des prix des maisons a généralement un biais positif, avec la plupart des dossiers regroupés dans la queue gauche de la distribution et de moins en moins étirer plus loin, vous obtenez dans la queue droite. Il y aura donc beaucoup de points de prix manquants dans la queue droite, et si le graphique ne les prend pas en compte et les montre comme manquants, alors le graphique pourrait même faire apparaître cela comme s’il s’agissait d’une distribution normale et symétrique. La figure 5.6 montre une solution possible à ce problème.
Figure 5.6. Vous pouvez travailler avec les résultats de la table pivot en les copiant dans la feuille de calcul.
La figure 5.6 montre le nombre de ventes de chaque trimestre, à la fois dans le tableau croisé dynamique de D1: E5 et dans la plage de travail normale D7: E9. Vous pouvez copier les résultats du tableau croisé dynamique et les coller dans la zone de feuille de calcul, ou vous pouvez définir des liens à partir des cellules de feuille de calcul dans le tableau croisé dynamique. Par exemple, la cellule E7 contient cette formule:
= E2
Une fois que vous avez les données dans des cellules de feuille de calcul normales, qu’elles soient copiées ou liées au tableau croisé dynamique, vous pouvez l’utiliser comme source pour un diagramme à colonnes, comme illustré à la Figure 5.6. Étant donné que le graphique Colonne est basé sur des cellules de feuille de calcul plutôt que sur le contenu du tableau croisé dynamique, la définition de l’axe horizontal du graphique sur un axe Date permet à Excel de placer correctement les colonnes du graphique.
Pour obtenir le graphique illustré à la figure 5.6, procédez comme suit:
1. Sélectionnez la plage E7: E9. Cette fourchette contient le nombre d’enregistrements pour chacun des trois trimestres civils, tel que ramassé à partir du tableau croisé dynamique.
2. Cliquez sur l’onglet Insertion du ruban, puis sur le bouton Insérer une colonne ou un diagramme à barres dans le groupe Graphes.
3. Cliquez sur le graphique Colonne le plus à gauche dans le menu. Un graphique Colonne apparaît.
4. Cliquez sur l’onglet Conception, puis sur le bouton Sélectionner les données dans le groupe Données.
5. Cliquez sur le bouton Modifier dans la section Horizontal (Catégorie) Étiquettes d’axe de la boîte de dialogue. Traînez la gamme D7: D9 sur la feuille de travail pour récupérer les étiquettes de chacun des trois quartiers de calendrier.
6. Cliquez deux fois sur OK pour revenir à la feuille de calcul.
7. Ouvrez le graphique en cliquant dessus, puis cliquez sur l’axe horizontal pour le sélectionner. Cliquez avec le bouton droit sur l’axe horizontal (sélectionné) et choisissez Format Axe.
8. Ouvrez les Options d’axe dans le volet Format Axe et cliquez sur le bouton d’option Axe de Date sous Type d’axe.
9. Cliquez sur le bouton Fermer du volet Format Axis pour retourner la feuille de calcul.
Utilisation du filtre avancé et FREQUENCE ()
Comme je l’ai suggéré plus tôt, il existe d’autres moyens que le tableau croisé dynamique pour obtenir le nombre d’enregistrements dans chaque trimestre, en préparation de l’histogramme de la colonne. Lorsque vous avez les données montrées dans D7: E9 de la Figure 5.6, tout le travail est fait et tout ce que vous devez faire est de créer le graphique et de le modifier.
Par exemple, vous pouvez utiliser la fonction Advanced Data Filter d’Excel pour renvoyer les quarts uniques répertoriés dans la colonne B de la figure 5.6. Pour ce faire, procédez comme suit:
1. Cliquez sur l’onglet Données du ruban.
2. Cliquez sur Avancé dans le groupe Trier et filtrer.
3. Cliquez dans la zone d’édition List Range. Sélectionnez les données répertoriées dans la colonne B, y compris l’étiquette dans la cellule B1.
4. Cliquez sur le bouton d’option Copier dans un autre emplacement.
5. Entrez une adresse de cellule dans la zone Copier vers.
6. Remplissez la case à cocher Enregistrements uniques uniquement.
7. Cliquez sur OK.
Vous devriez maintenant avoir une liste des catégories auxquelles vos données appartiennent. Dans ce cas, la liste comprend les valeurs 1, 2 et 4, car il y a au moins un enregistrement pour chacun de ces trois trimestres et aucun enregistrement pour le trimestre 3. Si vous choisissez de démarrer la liste des valeurs uniques dans la cellule D1 , votre feuille de calcul devrait ressembler à la plage A1: D4 de la Figure 5.7.
Figure 5.7. Utilisez les valeurs uniques de Quartier de vente avec la fonction FREQUENCE ().
La tâche suivante consiste à compter le nombre d’enregistrements appartenant à chacun des trois quartiers de calendrier uniques. Avec vos données présentées comme dans la Figure 5.7, sélectionnez la plage E2: E4 et tableau-entrez cette formule:
= FRÉQUENCE (B2: B46, D2: D4)
Rappelez-vous que pour entrer dans une matrice, vous devez d’abord sélectionner la plage de cellules que la formule doit occuper. Ici, c’est E2: E4. Tapez ensuite la formule elle-même et terminez en maintenant les touches Ctrl et Alt enfoncées tout en appuyant sur Entrée. Entrez une étiquette, telle que Ventes, dans la cellule E1. Les arguments de la formule FREQUENCE () sont le tableau de données B2: B46 et le tableau bin, D2: D4.
Votre feuille de travail devrait maintenant ressembler beaucoup à celle de la figure 5.8, à l’exception du graphique lui-même.
Figure 5.8. Vous obtenez le même endroit en utilisant le filtre avancé et la fonction FREQUENCE () comme en construisant un tableau croisé dynamique et en copiant son contenu dans la feuille de calcul.
Pour obtenir l’histogramme via un diagramme à colonnes, suivez la liste des neuf étapes à la fin de la section intitulée «Utilisation d’un tableau croisé dynamique pour compter les enregistrements».
Que vous utilisiez un tableau croisé dynamique ou la fonction FREQUENCE () pour compter les enregistrements dans chaque catégorie, vous devez convertir les données brutes indiquées dans la colonne B de la Figure 5.8 en données récapitulatives présentées dans la plage D2: E4. Excel n’a pas de graphique traditionnel qui va regrouper les données correctement et ensuite les afficher, que ce soit dans les colonnes, dans les barres, dans une ligne ou dans les zones.
Je décris quelques solutions raisonnables dans les sections suivantes, y compris le type d’histogramme des graphiques statistiques.