Presque toutes les étapes de transformation que nous avons appliquées jusqu’à présent ont été des éléments individuels qui peuvent être appliqués à presque n’importe quelle table de données. Cependant, lorsque vous effectuez même un simple processus de chargement et de transformation de données, vous souhaiterez probablement pour passer par plusieurs transformations afin de façonner, nettoyer et filtrer les données pour obtenir le résultat souhaité. C’est là que l’approche Power BI Desktop est si malléable, car vous pouvez appliquer la plupart des étapes de transformation de données à presque n’importe quelle table de données. L’art consiste à les placer dans une séquence qui peut ensuite être réutilisée à chaque fois que les données changent pour retraiter les nouvelles données sources et fournir une sortie à jour.
La clé pour apprécier et gérer ce processus est de bien se familiariser avec la liste des étapes appliquées dans le volet Paramètres de la requête. Cette liste contient les détails de chaque étape que vous avez appliquée, dans l’ordre dans lequel vous l’avez appliquée. Chaque étape conserve le nom que Power BI Desktop lui a donné lors de sa création, et chacune peut être modifiée dans ce qui suit façons:
- renommé
- Supprimé
- Déménagé (dans certains cas)
La nouvelle encore meilleure est que, dans de nombreux cas, les étapes peuvent être modifiées. De cette façon, vous n’êtes pas coincé avec les choix que vous avez faits au départ, mais vous avez la possibilité de peaufiner et d’améliorer les étapes individuelles d’un processus. Cela peut vous éviter d’avoir à reconstruire une séquence entière d’étapes dans une routine ETL simplement en remplaçant un élément dans le processus ETL.
Afin d’expérimenter les différentes façons dont vous pouvez modifier les requêtes, vous allez avoir besoin de quelques données initiales. Donc, pour commencer, je vous suggère de créer une requête qui charge les données du fichier source Excel suivant : C:\PowerBiDesktopSamples\ CarSalesDataForQueries.xlsx. À partir de ce fichier source, sélectionnez les tables suivantes :
- Clients
- Couleurs
- Des pays
- Factures
- Lignes de facturation
- Stocker
Une fois que vous avez chargé les données, passez à la fenêtre de l’éditeur de requête.
Modification d’une étape
La manière dont vous modifiez une étape dépend de la manière dont la transformation d’origine a été appliquée. Cela devient une seconde naturel après un peu de pratique et impliquera toujours de cliquer d’abord sur l’étape que vous souhaitez modifier, puis d’appliquer une modification différente. Si vous appelez une option du ruban, telle que la modification du type de données, vous modifiez le type de données en appliquant simplement un autre type de données directement à partir du ruban. Si vous avez utilisé une option qui affichait une boîte de dialogue (telle que le fractionnement d’une colonne, entre autres), vous pouvez cliquer avec le bouton droit sur l’étape dans la liste Étapes appliquées et sélectionner Modifier les paramètres dans le menu contextuel. Alternativement, et si vous préférez, vous pouvez cliquer sur l’icône “engrenage” qui s’affiche à droite de la plupart (mais pas de toutes) des étapes pour afficher une boîte de dialogue dans laquelle vous pouvez ajuster les paramètres des étapes. Cette boîte de dialogue affichera toutes les options et tous les paramètres que vous avez initialement appliqués ; dans celui-ci, vous pouvez apporter toutes les modifications que vous jugez nécessaires.
Une dernière possibilité qui facilite la modification des paramètres d’un processus consiste à modifier la formule qui apparaît dans la barre de formule chaque fois que vous cliquez sur une étape. Cela implique cependant de comprendre toutes les complexités de chaque élément du code qui sous-tend le processus de transformation des données. Je donnerai un bref aperçu de la modification du code au chapitre 12.
Astuce si vous pouvez vous forcer à organiser le processus que vous écrivez avec le bureau Power Bi, alors un peu de prévoyance et de planification peut récolter des dividendes importants. Par exemple, certaines tâches, telles que la définition des types de données, peuvent être effectuées en une seule opération. ça signifie que vous n’avez qu’à chercher à un seul endroit un ensemble similaire de transformations de données. pas seulement cela, mais si vous avez besoin de modifier un type de données pour une colonne à un stade ultérieur, je vous suggère de cliquer sur l’étape Type modifié avant d’apporter d’autres modifications. de cette façon, vous étendez l’étape d’origine, plutôt que de créer d’autres étapes, ce qui peut rendre le processus plus déroutant et inutilement volumineux.
Renommer une étape
Power BI Desktop nomme les étapes en utilisant le nom de la transformation qui a été appliquée. Cela signifie que si une autre étape similaire est appliquée ultérieurement, Power BI Desktop utilise le même nom avec un incrément numérique. Comme cela n’est pas toujours compréhensible lors de l’examen une séquence d’étapes de transformation, vous préférerez peut-être donner des noms plus conviviaux aux étapes individuelles. Cela se fait comme suit:
- Sélectionnez la requête (ou la table source ou la feuille de calcul, si vous préférez). J’utiliserai la requête Clients dans cet exemple.
- Cliquez avec le bouton droit sur l’étape que vous souhaitez renommer, Type modifié, par exemple.
- Sélectionnez Renommer dans le menu contextuel.
- Tapez le nouveau nom. Je vais utiliser NewDataTypes.
- Appuyez sur Entrée.
L’étape est renommée et le nouveau nom apparaît dans la liste Étapes appliquées du volet Paramètres de la requête. De cette façon, vous pouvez vous assurer que lorsque vous revenez à un processus de transformation de données des jours, des semaines ou des mois plus tard, vous êtes en mesure de comprendre plus intuitivement le processus que vous avez défini, ainsi que la raison pour laquelle vous avez façonné les données comme vous l’avez fait.
Supprimer une étape ou une série d’étapes
Supprimer une étape est trop facile, mais cela peut avoir de graves conséquences. En effet, un processus ETL est souvent une série d’événements extrêmement étroitement couplés, où chaque événement dépend intimement du précédent. Ainsi, la suppression d’une étape peut faire échouer toutes les étapes suivantes. Savoir quels événements vous pouvez supprimer sans conséquences dramatiques dépendra des types de processus que vous développez ainsi que de votre expérience avec Power BI Desktop. Dans tous les cas, voici ce que vous devez faire si vous devez supprimer une étape :
- Placez le pointeur sur l’étape de processus que vous souhaitez supprimer.
- Cliquez sur l’icône croix (×) qui apparaît.
- Sélectionnez Supprimer. La boîte de dialogue Supprimer l’étape peut apparaître, comme illustré dans Illustration .
La boîte de dialogue Supprimer l’étape
- Confirmez en cliquant sur le bouton Supprimer. L’étape est supprimée.
Si, et c’est fort possible, la suppression de cette étape cause des problèmes pour le reste du processus, vous verrez que la table de données est remplacée par un message d’erreur. Ce message varie en fonction du type d’erreur rencontré par Power BI Desktop.
Lors de la description de cette technique, j’ai pris soin de préciser que vous pourriez voir la boîte de dialogue Supprimer l’étape. Si vous supprimez la dernière étape d’une séquence d’étapes, vous ne la verrez probablement pas, car il ne devrait pas y avoir de conséquences potentiellement horribles ; au pire, vous devrez recréer l’étape. Si vous supprimez une étape au milieu
d’un processus, vous voudrez peut-être y réfléchir sérieusement avant de causer un grand nombre de problèmes. Par conséquent, il vous est demandé de confirmer la suppression dans ces cas.
Notez que si vous réalisez à ce stade que vous venez de détruire des heures de travail, puis (après avoir inspiré profondément) cliquez sur le menu Fichier dans la fenêtre du bureau Power Bi (le triangle orienté vers le bas en haut à gauche) et sélectionnez Fermer, puis fermez le bureau Power Bi sans enregistrer. ne comptez pas sur l’utilisation d’une fonction d’annulation comme vous le pouvez dans d’autres applications de bureau. Pour abaisser votre tension artérielle, vous préférerez peut-être enregistrer une copie d’un fichier contenant un processus complexe de transformation de données avant de supprimer des étapes. Vous pouvez également faire des copies de l’ensemble du processus de transformation des données sous forme de code « M », comme vous l’apprendrez au chapitre suivant.
Une autre technique consiste à cliquer avec le bouton droit sur l’étape que vous souhaitez supprimer et à sélectionner
Effacer. Vous devrez peut-être encore confirmer la suppression.
Si vous réalisez qu’une erreur dans une étape du processus a invalidé tout votre travail jusqu’à la fin du processus, plutôt que de supprimer plusieurs éléments un par un, cliquez sur Supprimer jusqu’à la fin dans le menu contextuel à l’étape 2 de l’exercice précédent.
Modification d’une étape existante
Power BI Desktop n’essaie pas de vous enfermer dans une séquence rigide d’événements lorsque vous créez une série d’étapes appliquées pour créer et transformer un flux de données. Cela devient vraiment évident lorsque vous découvrez que vous devez modifier une étape d’un processus.
Supposons, par exemple, que vous découvriez que vous avez chargé une mauvaise feuille de calcul Excel lorsque vous avez sélectionné les données initiales d’Excel. Vous ne voulez pas répéter le processus lorsque vous pouvez simplement remplacer un nom de feuille de calcul par un autre.
- Sélectionnez la requête que vous souhaitez modifier (Clients dans cet exemple).
- Cliquez sur l’étape à modifier (dans ce cas ce sera Navigation).
- Cliquez sur l’icône d’engrenage (ou rouage) à droite du nom de l’étape. La boîte de dialogue appropriée apparaîtra. Dans ce cas, ce sera la boîte de dialogue Navigation que vous pouvez voir dans la Figure .
La boîte de dialogue de navigation affichée pour la modification d’étape
- Cliquez sur la table ou la feuille de calcul que vous souhaitez utiliser à la place de l’ensemble de données actuel (LatestClients dans cet exemple).
- Cliquez sur OK.
L’éditeur de requête remplacera un jeu de données source par un autre. Il peut également ajouter des étapes supplémentaires pour s’assurer que les données sont adaptées pour être utilisées dans la requête.
Comme vous l’avez vu dans les dix chapitres précédents, Power BI Desktop offre une vaste gamme de possibilités d’ingestion et de modification de données. Je ne peux donc pas décrire ici toutes les options possibles en ce qui concerne la modification d’une étape appliquée. Néanmoins, le principe est simple :
- Si l’éditeur de requête peut modifier une étape, l’icône d’engrenage s’affichera à droite du nom de l’étape.
- Cliquez sur l’icône de modification (l’engrenage) pour afficher la boîte de dialogue qui a été utilisée pour créer l’étape (ou qui peut être utilisée pour modifier l’étape même si l’étape a été créée automatiquement par Power BI Desktop).
Certaines étapes n’affichent pas l’icône de modification. En effet, l’étape ne peut pas être modifiée, seulement supprimée (au moins, à l’aide de l’interface de l’éditeur de requête). À titre d’exemple, ajoutez l’étape suivante :
- Sélectionnez la requête que vous souhaitez modifier (Clients dans cet exemple).
- Cliquez sur la dernière étape.
- Cliquez avec le bouton droit sur la colonne Adresse2 et sélectionnez Supprimer.
Une nouvelle étape apparaîtra dans la liste des étapes appliquées, nommée Colonnes supprimées. Cette étape n’a pas l’icône de modification. Donc, pour le moment, vous pouvez le supprimer, mais pas le modifier – du moins, sans utiliser l’interface utilisateur graphique. Vous pouvez cependant modifier le code d’une étape comme vous l’apprendrez dans les articles futur.
Remarque La modification d’étapes existantes n’est pas une “solution miracle”. c’est parce qu’une série des transformations de données peuvent dépendre fortement d’une logique sur mesure qui a été développée pour une structure de données spécifique. il s’ensuit, par exemple, que vous ne pouvez remplacer une source de données que par une autre ayant une structure pratiquement identique. cependant, la modification d’une étape peut vous éviter d’avoir à réécrire une séquence de flux de données entière dans de nombreux cas.
Ajout d’une étape
Vous pouvez ajouter une étape n’importe où dans la séquence. Tout ce que vous avez à faire est de cliquer sur l’étape qui précède la nouvelle étape que vous souhaitez insérer avant de cliquer sur l’icône dans l’un des rubans correspondant à la nouvelle étape. Comme c’est le cas lorsque vous supprimez une étape, Power BI Desktop affichera une alerte vous avertissant que cette action pourrait entraîner des problèmes avec le processus à partir de cette nouvelle étape.
Modification du séquencement des étapes du processus
Il est possible, techniquement, de reséquencer les étapes d’un processus. Cependant, d’après mon expérience, ce n’est pas toujours pratique, car la modification de l’ordre des étapes d’un processus peut causer autant de dégâts que la suppression d’une étape. Néanmoins, vous pouvez toujours essayer comme ceci:
- Cliquez avec le bouton droit sur l’étape que vous souhaitez remettre en séquence.
- Sélectionnez Monter ou Descendre dans le menu contextuel.
Je reste pessimiste sur le fait que cela puisse faire des miracles, mais il est bon de savoir que c’est là.
Astuce, rappelez-vous qu’avant de modifier l’ordre dans lequel le processus est appliqué, cliquer sur n’importe quelle étape du processus entraîne l’actualisation du tableau dans la fenêtre du bureau Power Bi pour vous montrer l’état des données jusqu’à l’étape sélectionnée incluse. il s’agit d’un guide visuel très clair du processus et de la manière dont le processus etL est effectué.
Une approche du séquençage
Compte tenu de la gamme d’options de transformation de données disponibles, vous vous demandez peut-être comment aborder au mieux un nouveau projet ETL à l’aide de Power BI Desktop. Je me rends compte que tous les projets sont différents, mais en tant que guide approximatif, je suggère d’essayer de commander votre projet comme ceci :
- Chargez les données dans Power BI Desktop.
- Faites la promotion ou ajoutez des en-têtes de colonne compréhensibles. Par exemple, vous ne voulez vraiment pas regarder l’étape 47 d’un processus et vous demander ce qu’est Column29, alors qu’il pourrait lire (par exemple) ClientName.
- Supprimez toutes les colonnes dont vous n’avez pas besoin. Plus le jeu de données est petit, plus le traitement est rapide. De plus, vous trouverez il est plus facile de se concentrer sur les données et de les comprendre si vous ne regardez que les informations dont vous avez vraiment besoin. Toutes les colonnes qui ont été supprimées peuvent être renvoyées dans l’ensemble de données simplement en supprimant ou en modifiant l’étape qui les a supprimées.
- Modifiez les types de données pour chaque colonne du tableau. Les types de données corrects sont fondamentaux pour de nombreuses étapes de transformation et sont essentiels pour le filtrage, il est donc préférable de les trier dès le début.
- Filtrez tous les enregistrements dont vous n’avez pas besoin. Encore une fois, plus le jeu de données est petit, plus le traitement est rapide. Cela inclut la déduplication.
- Analysez tous les éléments JSON ou XML complexes.
- Effectuez tout nettoyage de données nécessaire.
- Effectuez toutes les transformations nécessaires.
- Effectuez les fractionnements de colonnes nécessaires ou ajoutez des colonnes personnalisées.
- Ajoutez toutes les colonnes dérivées.
- Ajoutez des calculs ou des transformations logiques de données.
- Gérez tous les enregistrements d’erreur générés par le processus ETL.
Encore une fois, je dois souligner qu’il ne s’agit pas d’un guide définitif. J’espère cependant qu’il vous aidera à voir “le bois pour les arbres” lorsque vous créez des processus de chargement et de transformation de données à l’aide de Power BI Desktop.
Enregistrements d’erreurs
Certaines opérations de transformation de données entraîneront des erreurs. Cela peut être une réalité lors du mélange de données sources. Par exemple, vous pourriez avoir quelques lignes dans un grand ensemble de données où une colonne de date contient quelques enregistrements qui sont des textes ou des nombres. Si vous convertissez la colonne en un type de données de date, toutes les valeurs qui ne peuvent pas être converties apparaîtront comme des valeurs d’erreur.
Suppression des erreurs
En supposant que vous n’ayez pas besoin des enregistrements que Power BI Desktop a signalés comme contenant une erreur, vous pouvez supprimer tous ces enregistrements en une seule opération :
- Cliquez dans la colonne contenant les erreurs ; ou si vous souhaitez supprimer les erreurs de plusieurs colonnes à la fois, Ctrl-cliquez sur les titres des colonnes qui contiennent les erreurs.
- Cliquez sur Supprimer les erreurs dans le ruban Accueil. Tous les enregistrements avec des erreurs signalées dans les colonnes sélectionnées sont supprimés. Les erreurs supprimées sont ajoutées à la liste des étapes appliquées.
Vous devez être très prudent ici pour ne pas supprimer des données valides. Vous seul pouvez juger, une fois que vous avez examiné les données, si une erreur dans une colonne signifie que les données peuvent être supprimées en toute sécurité. Dans tous les autres cas, vous feriez mieux d’envisager de nettoyer les données ou simplement de laisser en place les enregistrements contenant des erreurs. La gamme et la variété des erreurs potentielles sont aussi vastes que les données elles-mêmes.