Suppression d’enregistrements dans Power BI

Vous n’aurez peut-être pas toujours besoin de toutes les données que vous avez chargées dans une requête Power BI Desktop. Il peut y avoir plusieurs raisons possibles à cela :

  • Vous examinez les données pour la première fois et vous n’avez besoin que d’un échantillon pour avoir une idée de ce à quoi ressemblent les données.
  • Les données contiennent des enregistrements dont vous n’avez manifestement pas besoin et que vous pouvez facilement identifier dès le départ.
  • Vous testez le nettoyage des données et vous voulez un jeu de données plus petit pour vraiment accélérer le développement d’un processus complexe d’extraction et de transformation des données.
  • Vous souhaitez analyser un ensemble de données réduit pour extrapoler des thèses et des inférences, et enregistrer l’analyse sur un ensemble de données complet pour plus tard, ou même utiliser un ensemble d’outils plus performants tels que SQL Server Integration Services.

Pour vous permettre de réduire la taille du jeu de données, Power BI Desktop propose deux approches de base prêtes à l’emploi :

  • Conserver certaines lignes
  • Supprimer certaines lignes

Inévitablement, la technique que vous adopterez dépendra des circonstances. S’il est plus facile de spécifier les lignes à échantillonner par inclusion, l’approche de conservation de certaines lignes est la meilleure option à adopter. A l’inverse, si vous souhaitez procéder par exclusion, alors la technique de suppression de certaines lignes est préférable. Examinons chacun de ces éléments à tour de rôle.

Garder les rangées

Cette approche vous permet de spécifier les lignes que vous souhaitez continuer à utiliser. Il repose sur l’application de l’un des trois choix suivants :

  • Conservez les n premiers enregistrements.
  • Conservez les n derniers enregistrements.
  • Conserver une plage d’enregistrements spécifiée, c’est-à-dire conserver n enregistrements tous les y enregistrements.

La plupart de ces techniques sont très similaires, alors commençons par imaginer que vous souhaitez conserver les 50 premiers enregistrements dans l’exemple de fichier C:\PowerBiDesktopSamples\Example1.pbix.

  1. Dans le ruban Accueil de l’éditeur de requête Power BI, cliquez sur le bouton Conserver Bouton Lignes. Le menu apparaîtra.
  2. Sélectionnez Conserver les premières lignes. La boîte de dialogue Conserver les premières lignes s’affiche.
  3. Entrez 50 dans la case « Nombre de lignes », comme illustré à la Figure .

La boîte de dialogue Conserver les premières lignes

  1. Cliquez sur OK. Tous sauf les 50 premiers enregistrements sont supprimés et conservés en premier

Les lignes sont ajoutées à la liste Étapes appliquées.

Pour conserver les n lignes du bas, la technique est quasiment identique. Suivez les étapes de l’exemple précédent, mais sélectionnez Conserver les lignes du bas à l’étape 2. Dans ce cas, la liste Étapes appliquées affiche Conserver les dernières lignes.

Pour conserver une plage d’enregistrements, vous devez spécifier un enregistrement de départ et le nombre de registres à conserver à partir de ce moment-là. Par exemple, supposons que vous souhaitiez perdre les 10 premiers enregistrements mais conserver les 25 suivants. Voici comment procéder :

  1. Dans le ruban Accueil, cliquez sur le bouton Conserver les lignes.
  2. Sélectionnez Conserver la plage de lignes. La boîte de dialogue Conserver la plage de lignes apparaît.
  3. Entrez 11 dans la case « Première ligne ».
  4. Entrez 25 dans la case « Nombre de lignes », comme illustré à la Figure .

La boîte de dialogue Conserver la plage de lignes

  1. Cliquez sur OK. Tous sauf les enregistrements 1 à 10 et 36 jusqu’à la fin sont supprimés, et La plage de lignes conservée est ajoutée à la liste des étapes appliquées.

Vous avez peut-être remarqué que cette boîte de dialogue, comme beaucoup d’autres, contient un menu contextuel à gauche des champs dans lesquels vous saisissez des valeurs. ce menu contextuel permet de paramétrer la valeur. les paramètres sont expliqués dans les prochains articles.

 

Suppression de lignes

La suppression de lignes est un processus presque identique à celui que vous venez d’utiliser pour conserver des lignes. Comme la suppression des n lignes supérieures ou inférieures est très similaire, je ne vais pas les détailler. Tout ce que vous avez à faire est de cliquer sur le bouton Supprimer les lignes dans le ruban Accueil et les traiter comme si vous gardiez des rangées. La liste des étapes appliquées affichera les lignes supérieures supprimées ou les lignes inférieures supprimées dans ce cas, et les lignes seront supprimées au lieu d’être conservées dans l’ensemble de données, bien sûr.

L’approche de suppression de lignes a une option très utile qui peut être appliquée comme technique d’échantillonnage. Il vous permet de supprimer un ou plusieurs enregistrements tous les quelques enregistrements pour produire un sous-ensemble des données source. Pour ce faire, vous devez procéder comme suit :

  1. Cliquez sur le bouton Supprimer les lignes dans le ruban Accueil de la fenêtre Requête. Le menu apparaîtra.
  2. Sélectionnez Supprimer les lignes alternatives. La boîte de dialogue Supprimer les lignes alternatives apparaît.
  3. Entrez 10 comme première ligne à supprimer.
  4. Entrez 2 comme Nombre de lignes à supprimer.
  5. Entrez 10 comme Nombre de lignes à conserver. La boîte de dialogue ressemblera à la Figure .

La boîte de dialogue Supprimer les lignes alternatives

  1. Cliquez sur OK. Tous sauf les enregistrements correspondant au modèle que vous avez entré dans la boîte de dialogue sont supprimés. Les lignes alternatives supprimées sont ensuite ajoutées à la liste des étapes appliquées

Notez que si vous êtes vraiment déterminé à extraire un échantillon que vous considérez comme représentatif des données clés, vous pouvez toujours filtrer les données avant de les subdiviser pour exclure toute valeur aberrante. Le filtrage des données est expliqué plus loin dans ce chapitre.

Suppression des lignes vides

Si vos données source contiennent des lignes complètement vides (vides), vous pouvez les supprimer comme suit :

  1. Cliquez sur le bouton Supprimer les lignes dans le ruban Accueil de la fenêtre Requête. Le menu apparaîtra.
  2. Sélectionnez Supprimer les lignes vides.

Cela entraîne la suppression de lignes vides. Les lignes vides supprimées sont ensuite ajoutées à la

Liste des étapes appliquées.

Suppression des enregistrements en double

Une source de données externe peut ne pas être aussi parfaite que vous pourriez l’espérer. L’une des caractéristiques les plus ennuyeuses des données de mauvaise qualité est la présence de doublons. Celles-ci sont insidieuses car elles faussent les résultats et ne sont pas toujours visibles. Si vous soupçonnez que la table de données contient des doublons stricts (c’est-à-dire que chaque champ est identique dans deux enregistrements ou plus), vous pouvez supprimer les doublons comme ceci :

  1. Cliquez sur Supprimer les doublons dans le menu contextuel du tableau (celui-ci se trouve en haut à gauche de la grille du tableau). Tous les enregistrements en double sont supprimés et les doublons supprimés sont ajoutés à la liste des étapes appliquées.

Notez que je dois souligner que cette approche ne supprimera que les enregistrements complètement identiques où chaque élément de chaque colonne est strictement identique dans les lignes en double. Si deux enregistrements n’ont qu’un seul caractère ou un nombre différent mais que tout le reste est identique, ils ne sont pas considérés comme des doublons par l’éditeur de requête de bureau Power Bi. alternativement, si vous souhaitez isoler et examiner les enregistrements en double, vous pouvez afficher uniquement les enregistrements complètement identiques en sélectionnant Conserver les doublons dans le menu contextuel de la table.

Donc, si vous soupçonnez ou êtes sûr que la table de données avec laquelle vous traitez contient des doublons, quelles sont les solutions pratiques ? Cela peut être une véritable énigme, mais il existe quelques techniques de base que vous pouvez appliquer :

  • Supprimez toutes les colonnes que vous êtes sûr de ne pas utiliser plus tard dans le processus de traitement des données. De cette façon, Power BI Desktop ne sera invité qu’à comparer les données essentielles entre des enregistrements potentiellement en double.
  • Regroupez les données sur les colonnes principales (ceci est expliqué plus loin dans ce chapitre).

Notez que comme vous l’avez vu, Power Bi Desktop Query peut vous aider à vous concentrer sur les éléments essentiels d’un jeu de données en quelques clics. le cas échéant, vous devez veiller à ne pas supprimer de données précieuses (et par conséquent fausser votre analyse) lorsque vous excluez des données de la requête.

S’abonner
Notifier de
0 Commentaires
Inline Feedbacks
Voir tous les commentaires

Initiation à Excel

Fonctions Excel

Excel VBA

Macros VBA Utiles

Plus d'outils

Sur Facebook

Sur YouTube

0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x