Regroupement avec des tableaux croisés dynamiques dans Excel

Une autre approche pour construire la distribution de fréquence consiste à utiliser un tableau croisé dynamique. Un outil connexe, le tableau croisé dynamique, est basé sur l’analyse fournie par le tableau croisé dynamique. Je préfère cette

méthode à l’utilisation d’une formule matricielle qui utilise FREQUENCE (). Avec un tableau croisé dynamique, une fois le fondement initial est fait, je peux utiliser le même tableau croisé dynamique pour faire des analyses qui vont au-delà de la distribution de fréquence de base. Mais si tout ce que je veux c’est un compte de groupe rapide, FREQUENCE () est généralement le moyen le plus rapide.

Encore une fois, il y a plus sur les tableaux croisés dynamiques dans les chapitres 2 et suivants, mais cette section vous montre comment les utiliser pour établir la distribution de fréquence.

Construire le tableau croisé dynamique  vous oblige à spécifier des classes, tout comme l’utilisation de FREQUENCE () fait, mais cela arrive un peu plus loin.

Remarque
Un rappel: Lorsque vous utilisez la méthode FREQUENCE () décrite dans la section précédente, un en-tête en haut de la colonne de données brutes peut être utile mais n’est pas requis. Lorsque vous utilisez la méthode de table croisée dynamique décrite dans cette section, l’en-tête est requis.

Commencez avec vos données d’échantillon dans A1: A101 de la figure 1.16, comme avant. Sélectionnez l’une des cellules dans cette plage, puis procédez comme suit:

1. Cliquez sur l’onglet Insérer. Cliquez sur le bouton Graphique croisé dynamique dans le groupe Graphes. (Avant Excel 2013, cliquez sur la liste déroulante Tableau croisé dynamique dans le groupe Tables et choisissez Graphique croisé dynamique dans la liste déroulante.) Lorsque vous choisissez un graphique pivotant, vous obtenez automatiquement un tableau croisé dynamique. La boîte de dialogue de la Figure 1.19 apparaît.

2. Cliquez sur le bouton d’option Feuille de calcul existante. Cliquez dans la zone d’édition Plage de positions. Ensuite, pour éviter d’écraser des données importantes, cliquez sur une cellule vide de la feuille de calcul contenant d’autres cellules vides à sa droite et en dessous.
3. Cliquez sur OK. La feuille de calcul apparaît maintenant comme le montre la Figure 1.20.
Figure 1.19. Si vous commencez par sélectionner une seule cellule dans la plage contenant vos données d’entrée, Excel propose automatiquement la plage de cellules adjacentes contenant des données.


Figure 1.20. Avec un seul champ, vous l’utilisez normalement pour les champs Axis (catégories) et Valeurs récapitulatives


4. Cliquez sur le champ Poids dans la liste Champs de tableau croisé dynamique et faites-le glisser dans l’Axe (Catégories) zone.
5. Cliquez à nouveau sur le champ Poids et faites-le glisser dans la zone Valeurs. Malgré le sigma grec majuscule, qui est un symbole de sommation, les valeurs  dans un tableau croisé dynamique peuvent montrer des moyennes, des comptes, des écarts-types, et une variété de statistiques autres que la somme. Toutefois, Somme est la statistique par défaut pour un champ qui contient uniquement des valeurs numériques.

6. Le tableau croisé dynamique et le graphique croisé dynamique sont tous deux remplis comme indiqué à la Figure 1.21. Cliquez avec le bouton droit sur n’importe quelle cellule contenant une étiquette de ligne, telle que C2. Choisissez Groupe dans le menu contextuel. La boîte de dialogue Groupement illustrée à la Figure 1.22 apparaît.

Figure 1.21. Le champ Poids ne contient que des valeurs numériques, de sorte que le tableau pivotant par défaut est Sum en tant que statistique récapitulative.


 
Figure 1.22. Cette étape établit les groupes auxquels la fonction FREQUENCE () se réfère en tant que groupes.

7. Dans la boîte de dialogue Groupement, définissez la valeur Starting At sur 81 et entrez 10 dans la zone By. Cliquez sur
D’ACCORD.
8. Cliquez avec le bouton droit sur une cellule dans le tableau croisé dynamique sous l’en-tête Somme du poids. Choisissez Paramètres de zone de valeur dans le menu contextuel. Sélectionnez Nombre dans la zone de liste Résumer le champ de valeur par, puis cliquez sur OK.
9. Le tableau croisé dynamique et le graphique se reconfigurent pour apparaître comme dans la Figure 1.23. Pour supprimer les boutons de champ dans les coins supérieur et inférieur gauche du graphique pivot, sélectionnez le graphique, cliquez sur l’onglet Analyser, cliquez sur le bouton Boutons de champ et sélectionnez Masquer tout.

Figure 1.23. La distribution de fréquence de cet échantillon présente un léger décalage vers la droite mais est raisonnablement proche d’une courbe normale.

Construire des distributions de fréquence simulées
Il peut être utile de voir comment une distribution de fréquence prend une forme particulière à mesure que le nombre d’enregistrements sous-jacents augmente. Le classeur pour le chapitre 1 a une feuille de calcul nommée Figure 1.24 qui échantillonne les enregistrements au hasard d’une population de valeurs qui suit une distribution normale.

La figure suivante, ainsi que la feuille de calcul sur laquelle elle est basée, montre comment une distribution de fréquence se rapproche de plus en plus de la distribution de la population à mesure que le nombre d’enregistrements échantillonnés augmente.

Figure 1.24. Cette distribution de fréquence est basée sur une population d’enregistrements qui suivent une distribution normale.
 
Commencez par cliquer sur le bouton intitulé Effacer les enregistrements dans la colonne A. Tous les numéros seront supprimés de la colonne A, ne laissant que la valeur de l’en-tête dans la cellule A1. Le tableau croisé dynamique et le tableau croisé dynamique seront mis à jour en conséquence. Bien que les tableaux croisés dynamiques et les tableaux croisés dynamiques ne répondent pas immédiatement aux modifications de leurs sources de données sous-jacentes, le code VBA qui s’exécute lorsque vous cliquez sur le bouton appelle le rafraîchissement du tableau croisé dynamique.

Déterminez le nombre d’enregistrements que vous souhaitez ajouter, puis entrez ce nombre dans la cellule D1. Vous pouvez toujours le changer à un autre numéro.

Cliquez sur le bouton intitulé Ajouter des enregistrements au graphique. Lorsque vous procédez ainsi, plusieurs événements ont lieu, tous entraînés par des procédures Visual Basic stockées dans le classeur:

• Un échantillon est extrait de la distribution normale sous-jacente. L’échantillon a autant d’enregistrements que spécifié dans la cellule D1. (La population sous-jacente, normalement distribuée, est stockée dans une feuille de calcul distincte, nommée Valeurs normales aléatoires, vous pouvez afficher la feuille de calcul en cliquant avec le bouton droit sur un onglet de feuille de calcul et en sélectionnant Afficher dans le menu contextuel.

• L’échantillon d’enregistrements est ajouté à la colonne A. S’il n’y avait aucun enregistrement dans la colonne A, le nouvel échantillon est écrit à partir de la cellule A2. S’il y avait déjà, disons, 100 enregistrements dans la colonne A, le nouvel échantillon commencerait dans la cellule A102.

• Le tableau croisé dynamique et le graphique pivot sont mis à jour (ou, en termes Excel, actualisés). Lorsque vous cliquez plusieurs fois sur le bouton Ajouter des enregistrements au graphique, de plus en plus d’enregistrements sont utilisés dans le graphique. Plus le nombre d’enregistrements est élevé, plus le tableau ressemble au sous-jacent
distribution normale.

En effet, c’est ce qui se passe dans une expérience lorsque vous augmentez la taille de l’échantillon. Les échantillons plus gros ressemblent plus étroitement à la population à partir de laquelle vous les dessinez que les échantillons plus petits. Cette plus grande ressemblance ne se limite pas à la forme de la distribution: elle inclut la valeur moyenne et les mesures de la variation des valeurs autour de la moyenne. Toutes choses étant égales par ailleurs, vous préféreriez un échantillon plus grand à un échantillon plus petit, car il représentera probablement la population de plus près.

Mais cet effet crée un problème de coûts-avantages. En règle générale, plus l’échantillon est grand, plus les résultats expérimentaux sont précis et plus l’expérience est coûteuse.

Beaucoup de questions sont en jeu ici (et ce livre les discute), mais à un certain point, l’exactitude incrémentale de l’ajout, disons, de 10 autres sujets expérimentaux ne justifie plus la dépense supplémentaire de les ajouter. L’un des conseils que fournit l’analyse statistique est de vous dire quand vous atteignez le point où les rendements commencent à diminuer.

Avec le matériel de ce chapitre – les échelles de mesure, la nature des axes sur les diagrammes Excel et les distributions de fréquences – le chapitre 2 passe aux débuts de l’analyse statistique pratique, la mesure de la tendance centrale.

S’abonner
Notifier de
0 Commentaires
Inline Feedbacks
Voir tous les commentaires

Initiation à Excel

Fonctions Excel

Excel VBA

Macros VBA Utiles

Plus d'outils

Sur Facebook

Sur YouTube

0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x
()
x