Power BI Desktop vous donne toujours le choix de charger les données directement dans son modèle de données ou de faire un détour constructif via Power BI Desktop Query. Le chemin que vous suivez dépend entièrement de vous et dépend clairement de chaque ensemble de circonstances. Néanmoins, vous voudrez peut-être tenir compte des principes de base suivants lorsque vous êtes confronté à un nouveau défi de tableau de bord utilisant des données inconnues :
- Êtes-vous convaincu que les données sont prêtes à être utilisées ? Autrement dit, est-ce propre et bien structuré ? Si tel est le cas, vous pouvez essayer de le charger directement dans le modèle de données Power BI Desktop.
- Êtes-vous confronté à de multiples sources de données qui doivent être combinées et moulées dans une structure cohérente ? Si tel est le cas, vous devez vraiment transformer les données à l’aide de l’éditeur de requête Power BI Desktop.
- Les données proviennent-elles d’un entrepôt de données d’entreprise ? Cela peut être conservé dans une base de données relationnelle, un cube SQL Server Analysis Services ou même un entrepôt de données tabulaires en mémoire. Comme ces sources de données sont presque toujours le résultat de plusieurs centaines, voire de milliers d’heures de travail pour nettoyer, préparer et structurer les données, vous pouvez probablement les charger directement dans le modèle de données.
- Les données doivent-elles être pré-agrégées et filtrées ? Pensez à l’éditeur de requête Power BI Desktop.
- Êtes-vous susceptible de devoir modifier les noms des champs pour rendre les données plus faciles à gérer ? Il pourrait être plus simple de charger les données directement dans le modèle de données et de les y modifier.
- Êtes-vous confronté à de nombreuses tables de recherche qui doivent être ajoutées à un
table de données “de base” ? Alors l’éditeur de requête Power BI Desktop est votre ami.
- Les données contiennent-elles de nombreux éléments superflus ou erronés ?
Utilisez ensuite l’éditeur de requête Power BI Desktop pour les supprimer dans un premier temps.
- Les données doivent-elles être rationalisées et standardisées pour en faciliter la manipulation ? Dans ce cas, le chemin vers le succès passe par l’éditeur de requête Power BI Desktop.
- La source de données est-elle énorme ? Si tel est le cas, vous pouvez gagner du temps en modifiant et en filtrant d’abord les données dans l’éditeur de requête. En effet, l’éditeur de requête ne charge qu’un échantillon des données que vous pouvez modifier. L’ensemble de données complet ne sera chargé que lorsque vous confirmerez toutes vos modifications et fermerez l’éditeur de requête.
Ces types de questions ne sont que des lignes directrices approximatives. Pourtant, ils peuvent vous aider à vous orienter dans la bonne direction lorsque vous travaillez avec Power BI Desktop. Inévitablement, plus vous travaillerez avec cette application, plus vous développerez les réflexes et l’intuition qui vous aideront à prendre les bonnes décisions. N’oubliez pas, cependant, que Power BI Desktop est là pour vous aider et que même un jeu de données chargé directement est basé sur une requête. Ainsi, vous pouvez toujours charger des données, puis décider de modifier la structure de la requête ultérieurement si nécessaire. Alternativement, la modification des données dans une fenêtre de requête peut être une excellente occasion d’examiner de plus près vos données avant de les charger dans le modèle de données, et cela n’ajoute que quelques clics.
N’hésitez donc pas à adopter une façon de travailler qui vous convient. Power BI Desktop s’adaptera à votre style facilement et de manière presque invisible, vous permettant de passer des données aux tableaux de bord de manière si fluide que cela deviendra probablement une seconde nature. Le reste de ce chapitre vous guidera à travers certaines des techniques de base que vous devez connaître pour nettoyer et façonner vos données. Cependant, avant d’entrer dans tous les détails, examinons rapidement et de haut niveau l’éditeur de requêtes Power BI Desktop et la façon dont il est présenté.
L’éditeur de requête Power BI Desktop
Toutes vos transformations de données auront lieu dans l’éditeur de requête Power BI Desktop. Il s’agit d’une fenêtre distincte de celle dans laquelle vous créez vos tableaux de bord, et sa disposition est légèrement différente.
L’éditeur de requête Power BI Desktop se compose de six éléments principaux :
- Les quatre rubans : Accueil, Transformer, Ajouter une colonne et Afficher. D’autres rubans sont disponibles lors de l’exécution de types spécifiques de transformations de données.
- Le volet Liste des requêtes contenant toutes les requêtes qui ont été ajoutées à un fichier Power BI Desktop.
- La fenêtre Données, où vous pouvez voir un échantillon des données pour une requête sélectionnée.
- Le volet Paramètres de la requête qui contient la liste des étapes utilisées pour transformer les données.
- La barre de formule au-dessus des données qui affiche le code (écrit dans le langage « M » de Power BI que vous verrez plus en détail au chapitre 12) qui effectue l’étape de transformation sélectionnée.
- La barre d’état (en bas de la fenêtre) qui indique des informations utiles, comme le nombre de flux et colonnes dans une table de requête, et la date à laquelle le jeu de données a été téléchargé.
Les légendes de ces éléments sont illustrées à la Figure .
IMAGE
Illustration . L’éditeur de requête Power BI Desktop, expliqué
La liste des étapes appliquées
La transformation des données est par nature un processus séquentiel. Ainsi, la fenêtre Requête stocke chaque modification que vous apportez lorsque vous nettoyez et façonnez les données source. Les différents éléments qui composent un processus de transformation de données sont répertoriés dans la liste Étapes appliquées du volet Paramètres de la requête dans l’éditeur de requête.
L’éditeur de requête Power BI Desktop ne numérote pas les étapes d’un processus de transformation de données, mais il mémorise certainement chacune d’entre elles. Ils commencent en haut de la liste des étapes appliquées (presque toujours avec l’étape source) et peuvent s’étendre à des dizaines d’étapes individuelles qui retracent l’évolution de vos données jusqu’à ce que vous les chargez dans le modèle de données. Vous pouvez, si vous le souhaitez, considérer l’éditeur de requête comme une sorte d'”enregistreur de macros”.
De plus, lorsque vous cliquez sur chaque étape dans la liste Étapes appliquées, les données de la fenêtre Données changent pour refléter les résultats de chaque transformation, vous donnant une trace complète et visible de toutes les modifications que vous avez appliquées à l’ensemble de données.
La liste des étapes appliquées donne un nom distinct à l’étape pour chaque option de modification de données que vous couvrez dans ce chapitre et le suivant. Comme il peut être important de comprendre exactement ce que chaque fonction réalise réellement, j’attirerai toujours votre attention sur le nom standard que Power BI Desktop Query applique.
Les rubans de l’éditeur de requête Power BI Desktop
L’éditeur de requête Power BI Desktop utilise (dans la version de février 2020, au moins) quatre rubans principaux. Ils sont fondamentaux pour ce que vous apprenez au cours de ce chapitre. Ils sont les suivants :
- Le ruban Accueil
- Le ruban Transformer
- Le ruban Ajouter une colonne
- Le ruban Afficher
Je ne suggère pas une seconde que vous ayez besoin de mémoriser ce que font tous les boutons de ces rubans. J’espère que vous pourrez utiliser les brèves descriptions suivantes des boutons du ruban de l’éditeur de requête pour vous faire une idée de l’incroyable puissance de Power BI Desktop dans le domaine de la transformation des données. Ainsi, si vous disposez d’un jeu de données initial qui ne correspond pas tout à fait à vos besoins, vous pouvez consulter les ressources proposées par Power BI Desktop et la manière dont elles peuvent vous aider. Une fois que vous avez trouvé la fonction qui fait ce que vous recherchez, vous pouvez passer à la section correspondante pour obtenir tous les détails sur la façon de l’appliquer.
Le ruban d’accueil
Étant donné que nous utiliserons intensivement le ruban d’accueil de l’éditeur de requête Power BI Desktop pour transformer les données, il est important d’avoir une idée de ce qu’il peut faire. J’explique les différentes options dans la Figure 7-5 et dans le Tableau 7-1.
IMAGE
Illustration . Le ruban d’accueil de l’éditeur de requête
Option
Fermer et appliquer
nouvelle source
Sources récentes
entrer des données
la source de données
Réglages
faire en sorte
paramètres
actualiser l’aperçu actualise les données d’aperçu.
Propriétés
éditeur avancé
faire en sorte
Choisissez les colonnes
supprimer des colonnes
Conserver les lignes
supprimer des lignes Trier
Fractionner la colonne par groupe
Type de données
utilise la première ligne
remplacer les valeurs
fusionner les requêtes
ajouter des requêtes
Combiner des fichiers |
Description
Termine les étapes de traitement ; enregistre et ferme la requête.
Vous permet de découvrir et d’ajouter une nouvelle source de données à l’ensemble de requêtes existant.
Répertorie toutes les sources de données récentes que vous avez utilisées.
Vous permet d’ajouter vos propres données spécifiques dans un tableau personnalisé.
vous permet de gérer et de modifier les paramètres des sources de données auxquelles vous êtes déjà connecté.
Vous permet d’afficher et de modifier tous les paramètres définis pour ce fichier de bureau Power Bi. ceux-ci sont expliqués au chapitre 11.
affiche les propriétés de requête principales.
affiche l’éditeur de langage “m”. cela est expliqué au chapitre 12.
Vous permet de supprimer, de dupliquer ou de référencer une requête.
Permet de sélectionner les colonnes à conserver parmi toutes les colonnes disponibles dans les données source.
Permet de supprimer une ou plusieurs colonnes.
Conserve le nombre de lignes spécifié en haut du tableau.
supprime un nombre spécifié de lignes du haut de la table de données. Trier Trie le tableau en utilisant la colonne sélectionnée comme clé de tri.
Divise une colonne en une ou plusieurs colonnes à un délimiteur spécifié ou après un nombre spécifié de caractères.
regroupe la table à l’aide d’un ensemble de colonnes spécifié et agrège toutes les colonnes numériques pour ce regroupement.
applique le type de données choisi à la colonne.
utilise la première ligne comme titre de colonne.
Effectue une opération de recherche et de remplacement sur les données d’une ou plusieurs colonnes. cela n’affecte que les données complètes d’une colonne.
Joint une deuxième table de requête aux résultats de la requête actuelle et agrège ou ajoute des données de la seconde à la première. cela est expliqué au chapitre 9.
ajoute les données d’une autre requête à la requête actuelle dans le fichier de bureau Power Bi actuel. cela est expliqué au chapitre 12.
ajoute les données d’une série de fichiers texte structurés de manière similaire dans une seule table. cela est expliqué au chapitre 10. |
Le ruban de transformation
Le ruban Transformer, comme son nom l’indique, contient une multitude de fonctions qui peuvent vous aider à transformer vos données. Les différentes options qu’il contient sont expliquées dans la Figure et le Tableau ci-dessous.
Tableau . Options du ruban de transformation de l’éditeur de requête
Option
par groupe
utiliser la première ligne comme en-têtes
transposer
lignes inversées
Compter les lignes
Type de données
détecter le type de données
Renommer
remplacer les valeurs
Remplir
Pivot Colonne
annuler le pivot des colonnes
mouvement
Convertir en liste
Fractionner la colonne
Format
fusionner les colonnes
extrait
analyser
Statistiques
Standard
Scientifique
trigonométrie
arrondir
informations
Date
temps
durée
développer
agrégat
extraire des valeurs
Scénarios |
Description
regroupe le tableau à l’aide d’un ensemble de colonnes spécifié ; agrège toutes les colonnes numériques pour ce regroupement.
utilise la première ligne comme titre de colonne.
transforme les colonnes en lignes et les lignes en colonnes.
affiche les données source dans l’ordre inverse, montrant les dernières lignes en haut de la fenêtre.
Compte les lignes du tableau et remplace les données par le nombre de lignes. applique le type de données choisi à la colonne.
détecte le type de données correct à appliquer à plusieurs colonnes. rename renomme une colonne.
Effectue une opération de recherche et de remplacement dans une colonne, en remplaçant une valeur spécifiée par une autre valeur.
Copie les données des cellules du dessus ou du dessous dans les cellules vides de la colonne.
Crée un nouvel ensemble de colonnes en utilisant les données de la colonne sélectionnée comme titres de colonne.
prend les valeurs dans un ensemble de colonnes et désarticule les données, en créant de nouvelles colonnes en utilisant les en-têtes de colonne comme éléments descriptifs.
déplace une colonne.
Convertit le contenu d’une colonne en liste. cela peut être utilisé, par exemple, comme paramètres de requête. Vous apprendrez cela au chapitre 11.
Divise une colonne en une ou plusieurs colonnes à un délimiteur spécifié ou après un nombre spécifié de caractères.
modifie le format du texte des données d’une colonne (majuscules, minuscules, majuscules) ou supprime les espaces de fin.
prend les données de plusieurs colonnes et les place dans une seule colonne, en ajoutant un caractère de séparation facultatif.
remplace les données d’une colonne à l’aide d’un sous-ensemble défini des données actuelles. Vous pouvez spécifier un nombre de caractères à conserver à partir du début ou de la fin de la colonne, définir une plage de caractères commençant à un caractère spécifié ou même répertorier le nombre de caractères dans la colonne.
Crée un document XmL ou JSon à partir du contenu d’un élément dans une colonne.
renvoie la somme, la moyenne, le maximum, le minimum, la médiane, l’écart type, le nombre ou le nombre de valeurs distinctes pour toutes les valeurs de la colonne.
Effectue un calcul mathématique de base (additionner, soustraire, diviser, multiplier, diviser par un nombre entier ou renvoyer le reste) à l’aide d’une valeur que vous spécifiez appliquée à chaque cellule de la colonne.
Effectue un calcul scientifique de base (carré, cube, puissance de n, racine carrée, exposant, logarithme ou factoriel) pour chaque cellule de la colonne.
Effectue un calcul trigonométrique de base (Sinus, Cosinus, tangente, arcSinus, arcCosinus ou arctangente) à l’aide d’une valeur que vous spécifiez appliquée à chaque cellule de la colonne.
arrondit les valeurs de la colonne à l’entier suivant (vers le haut ou vers le bas) ou à un facteur spécifié.
remplace la valeur dans la colonne par une information simple : est impair, est pair ou positif/négatif.
isole un élément (jour, mois, année, etc.) d’une valeur de date dans une colonne.
isole un élément (heure, minute, seconde, etc.) d’une valeur de date/heure ou d’heure dans une colonne.
Calcule la durée à partir d’une valeur pouvant être interprétée comme une durée en jours, heures, minutes, etc.
ajoute les données (structurées de manière identique) d’une autre requête à la requête en cours.
Calcule la somme ou le produit des colonnes numériques d’une autre requête et ajoute le résultat à la requête en cours.
extrait les valeurs du contenu d’une colonne sous la forme d’une seule valeur de texte.
exécute des scripts à partir de langages tels que “r” ou python. |
Le ruban de transformation
Le ruban Transformer, comme son nom l’indique, contient une multitude de fonctions qui peuvent vous aider à transformer vos données. Les différentes options qu’il contient sont expliquées dans la Figure 7-6 et le Tableau 7-2.
IMAGE 6
Illustration 7-6. Le ruban de transformation de l’éditeur de requête
Tableau 7-2. Options du ruban de transformation de l’éditeur de requête
Option | Description |
Groupe par | regroupe le tableau à l’aide d’un ensemble de colonnes spécifié ; agrège toutes les colonnes numériques pour ce regroupement. |
utiliser la première ligne comme en-têtes | utilise la première ligne comme titre de colonne |
transposer | transforme les colonnes en lignes et les lignes en colonnes. |
lignes inversées | affiche les données source dans l’ordre inverse, montrant les dernières lignes en haut de la fenêtre. |
Compter les lignes | Compte les lignes du tableau et remplace les données par le nombre de lignes. |
Type de données | applique le type de données choisi à la colonne. |
détecter le type de données | détecte le type de données correct à appliquer à plusieurs colonnes. |
Renommer | renomme une colonne. |
remplacer les valeurs | Effectue une opération de recherche et de remplacement dans une colonne, en remplaçant une valeur spécifiée par une autre valeur. |
Remplir | Copie les données des cellules du dessus ou du dessous dans les cellules vides de la colonne. |
Pivot Colonne | Crée un nouvel ensemble de colonnes en utilisant les données de la colonne sélectionnée comme titres de colonne. |
annuler le pivot des colonnes | prend les valeurs dans un ensemble de colonnes et désarticule les données, en créant de nouvelles colonnes en utilisant les en-têtes de colonne comme éléments descriptifs. |
mouvement | déplace une colonne. |
Convertir en liste | Convertit le contenu d’une colonne en liste. cela peut être utilisé, par exemple, comme paramètres de requête. Vous apprendrez cela au chapitre 11. |
Fractionner la colonne | Fractionne une colonne en une ou plusieurs colonnes à un délimiteur spécifié ou après un nombre spécifié de caractères. |
Format | modifie le format du texte des données d’une colonne (majuscules, minuscules, majuscules) ou supprime les espaces de fin. |
fusionner les colonnes | prend les données de plusieurs colonnes et les place dans une seule colonne, en ajoutant un caractère de séparation facultatif. |
extrait | remplace les données d’une colonne à l’aide d’un sous-ensemble défini des données actuelles. Vous pouvez spécifier un nombre de caractères à conserver à partir du début ou de la fin de la colonne, définir une plage de caractères commençant à un caractère spécifié ou même répertorier le nombre de caractères dans la colonne. |
analyser | Crée un document XmL ou JSon à partir du contenu d’un élément dans une colonne. |
Statistiques | renvoie la somme, la moyenne, le maximum, le minimum, la médiane, l’écart type, le nombre ou le nombre de valeurs distinctes pour toutes les valeurs de la colonne. |
Standard | Effectue un calcul mathématique de base (additionner, soustraire, diviser, multiplier, diviser par un nombre entier ou renvoyer le reste) à l’aide d’une valeur que vous spécifiez appliquée à chaque cellule de la colonne. |
Scientifique | Effectue un calcul scientifique de base (carré, cube, puissance de n, racine carrée, exposant, logarithme ou factoriel) pour chaque cellule de la colonne. |
trigonométrie | Effectue un calcul trigonométrique de base (Sinus, Cosinus, tangente, arcSinus, arcCosinus ou arctangente) à l’aide d’une valeur que vous spécifiez appliquée à chaque cellule de la colonne. |
arrondir | arrondit les valeurs de la colonne à l’entier suivant (vers le haut ou vers le bas) ou à un facteur spécifié. |
renseignements | remplace la valeur dans la colonne par une information simple : est impair, est pair ou positif/négatif. |
Date | isole un élément (jour, mois, année, etc.) d’une valeur de date dans une colonne. |
temps | isole un élément (heure, minute, seconde, etc.) d’une valeur de date/heure ou d’heure dans une colonne. |
durée | Calcule la durée à partir d’une valeur pouvant être interprétée comme une durée en jours, heures, minutes, etc. |
développer | ajoute les données (structurées de manière identique) d’une autre requête à la requête en cours. |
agrégat | Calcule la somme ou le produit des colonnes numériques d’une autre requête et ajoute le résultat à la requête en cours. |
extraire des valeurs | extrait les valeurs du contenu d’une colonne sous la forme d’une seule valeur de texte. |
Scénarios | exécute des scripts à partir de langages tels que “r” ou python. |
Le ruban Ajouter une colonne
Le ruban Ajouter une colonne fait bien plus que simplement ajouter des colonnes. Il contient également des fonctions permettant de décomposer les colonnes en plusieurs colonnes et d’ajouter des colonnes contenant des dates et des calculs basés sur des colonnes existantes. Les différentes options qu’il contient sont expliquées dans la Figure et le Tableau .
IMAGE
Illustration . Le ruban Ajouter une colonne de l’éditeur de requête
Tableau . Éditeur de requête Ajouter des options de ruban de colonne
Option | Description |
Colonne À partir d’exemples | Vous permet d’utiliser une ou plusieurs colonnes comme exemples pour créer une nouvelle colonne. |
Colonne personnalisée | ajoute une nouvelle colonne à l’aide d’une formule pour créer le contenu de la colonne. |
invoquer la fonction personnalisée | applique une fonction de langage “m” à chaque ligne. |
Colonne conditionnelle | ajoute une nouvelle colonne qui ajoute conditionnellement les valeurs de la colonne sélectionnée. |
indice Colonne | ajoute un numéro séquentiel dans une nouvelle colonne pour identifier de manière unique chaque ligne. |
Colonne en double | Crée une copie de la colonne actuelle. |
Format | modifie le format du texte des données dans une nouvelle colonne (majuscule, minuscule, majuscule) ou supprime les espaces de fin. |
fusionner les colonnes | prend les données de plusieurs colonnes et les place dans une seule colonne, en ajoutant un caractère de séparation facultatif. |
extrait | Crée une nouvelle colonne à l’aide d’un sous-ensemble défini des données actuelles. Vous pouvez spécifier un nombre de caractères à conserver à partir du début ou de la fin de la colonne, définir une plage de caractères commençant à un caractère spécifié ou même répertorier le nombre de caractères dans la colonne. |
analyser | Crée une nouvelle colonne basée sur le XmL ou JSon dans une colonne. |
Statistiques | Crée une nouvelle colonne qui renvoie la somme, la moyenne, le maximum, le minimum, la médiane, l’écart type, le nombre ou le nombre de valeurs distinctes pour toutes les valeurs de la colonne. |
Standard | Crée une nouvelle colonne qui renvoie un calcul mathématique de base (additionner, soustraire, diviser, multiplier, diviser par un entier ou renvoyer le reste) à l’aide d’une valeur que vous spécifiez appliquée à chaque cellule de la colonne. |
Scientifique | Crée une nouvelle colonne qui renvoie un calcul scientifique de base (carré, cube, puissance de n, racine carrée, exposant, logarithme ou factoriel) pour chaque cellule de la colonne. |
trigonométrie | Crée une nouvelle colonne qui renvoie un calcul trigonométrique de base (Sinus, Cosinus, tangente, arcSinus, arcCosinus ou arctangente) à l’aide d’une valeur que vous spécifiez appliquée à chaque cellule de la colonne. |
Arrondir | arrondit les valeurs dans une nouvelle colonne soit à l’entier suivant (vers le haut ou vers le bas) soit à un facteur spécifié. |
renseignements | remplace la valeur dans la colonne par une information simple : est impair, est pair ou positif/négatif. |
Date | isole un élément (jour, mois, année, etc.) d’une valeur de date dans une nouvelle colonne. |
Temps | isole un élément (heure, minute, seconde, etc.) d’une valeur de date/heure ou d’heure dans une nouvelle colonne. |
Durée | Calcule la durée à partir d’une valeur pouvant être interprétée comme une durée en jours, heures, minutes et secondes dans une nouvelle colonne. |
Le ruban d’affichage
Le ruban Afficher vous permet de modifier certains paramètres de l’éditeur de requête et de voir le code de transformation de données sous-jacent. Les différentes options qu’il contient sont expliquées dans le chapitre suivant.