Créer un outil personnalisé d’évaluation de la qualité des données, Excel VBA

Créer un outil personnalisé d’évaluation de la qualité des données, Excel VBA

Créer un outil personnalisé d’évaluation de la qualité des données à l’aide de VBA dans Excel implique la conception d’un outil capable d’évaluer la qualité des données présentes dans une feuille de calcul en fonction de critères spécifiques, tels que les valeurs manquantes, les doublons, les valeurs aberrantes ou les données invalides. Voici une explication détaillée des différentes étapes pour développer un tel outil :
Étape 1 : Configuration de la feuille de calcul
Avant d’écrire le code VBA, il est essentiel de configurer correctement la feuille de calcul. Cette étape consiste à préparer les données à évaluer et à ajouter des cellules auxiliaires pour afficher les résultats de l’évaluation de la qualité des données.
1. Préparer vos données :
Supposons que vous ayez un jeu de données avec plusieurs colonnes, telles que Nom, Âge, Email, Numéro de téléphone, etc. Assurez-vous que vos données sont structurées avec des en-têtes dans la première ligne (par exemple, A1 = « Nom », B1 = « Âge », etc.), et que les données commencent à partir de la deuxième ligne.

2. Créer des colonnes pour l’évaluation de la qualité des données :
Vous pouvez ajouter quelques colonnes supplémentaires pour stocker les résultats du contrôle de la qualité des données, comme :

  • Une colonne pour les valeurs manquantes.
  • Une colonne pour les doublons.
  • Une colonne pour les entrées invalides (par exemple, emails ou numéros de téléphone incorrects).

Par exemple, dans les colonnes adjacentes aux données :

  • La colonne D peut indiquer si une valeur est manquante (OUI/ NON).
  • La colonne E peut afficher un message concernant les doublons.
  • La colonne F peut indiquer si l’email est valide (OUI/ NON).

3. Ajouter un bouton pour déclencher le code VBA :
Vous pouvez insérer un bouton (depuis l’onglet « Développeur ») qui exécutera la macro VBA lorsqu’il sera cliqué. Placez-le près du haut de la feuille pour un accès facile.

Étape 2 : Écriture du code VBA
Voici un code VBA détaillé qui aborde différents aspects de la qualité des données, tels que les valeurs manquantes, les doublons et la validation des emails. Le code sera conçu pour vérifier les colonnes « A » à « C » (Nom, Âge, et Email).

Sub EvaluateurQualiteDonnees()
    Dim ws As Worksheet
    Dim lastRow As Long
    Dim i As Long
    Dim colNom As Range, colAge As Range, colEmail As Range
    Dim cellNom As Range, cellAge As Range, cellEmail As Range
    Dim emailValide As Boolean
    ' Définir la feuille de calcul où se trouvent les données
    Set ws = ThisWorkbook.Sheets("Feuille1")
    ' Trouver la dernière ligne avec des données dans la colonne A
    lastRow = ws.Cells(ws.Rows.Count, "A").End(xlUp).Row
    ' Définir les colonnes à vérifier (Nom, Âge, Email)
    Set colNom = ws.Range("A2:A" & lastRow)
    Set colAge = ws.Range("B2:B" & lastRow)
    Set colEmail = ws.Range("C2:C" & lastRow)
    ' Parcourir les lignes et vérifier les problèmes de qualité des données
    For i = 2 To lastRow
        ' Vérification des valeurs manquantes pour le Nom, l'Âge, et l'Email
        If IsEmpty(ws.Cells(i, 1).Value) Then
            ws.Cells(i, 4).Value = "Manquant"
        Else
            ws.Cells(i, 4).Value = "Présent"
        End If
        If IsEmpty(ws.Cells(i, 2).Value) Then
            ws.Cells(i, 5).Value = "Manquant"
        Else
            ws.Cells(i, 5).Value = "Présent"
        End If
        If IsEmpty(ws.Cells(i, 3).Value) Then
            ws.Cells(i, 6).Value = "Manquant"
        Else
            ws.Cells(i, 6).Value = "Présent"
        End If
        ' Vérification des doublons dans la colonne "Nom"
        For Each cellNom In colNom
            If Application.WorksheetFunction.CountIf(colNom, cellNom.Value) > 1 Then
                ws.Cells(i, 7).Value = "Doublon"
            Else
                ws.Cells(i, 7).Value = "Unique"
            End If
        Next cellNom
        ' Validation de l'email en utilisant une vérification simple (contient "@" et ".")
        Set cellEmail = ws.Cells(i, 3)
        emailValide = False
        If InStr(1, cellEmail.Value, "@") > 0 And InStr(1, cellEmail.Value, ".") > 0 Then
            emailValide = True
        End If
        If emailValide Then
            ws.Cells(i, 8).Value = "Valide"
        Else
            ws.Cells(i, 8).Value = "Invalide"
        End If
    Next i
End Sub

Explication du Code
1. Configuration de la feuille et des colonnes :
Nous commençons par définir la feuille de travail et la plage de lignes à vérifier. La variable lastRow détermine combien de lignes sont à parcourir. Le code fonctionne avec les colonnes A (Nom), B (Âge), et C (Email), mais vous pouvez l’adapter pour d’autres colonnes.

2. Vérification des valeurs manquantes :
Pour chaque colonne, nous vérifions si la cellule est vide à l’aide de la fonction IsEmpty. Si la cellule est vide, nous affichons « Manquant » dans les colonnes D, E, et F. Sinon, nous affichons « Présent ».

3. Vérification des doublons :
Nous vérifions les doublons dans la colonne des Noms à l’aide de la fonction CountIf, qui compte le nombre de fois qu’une valeur apparaît dans la plage. Si une valeur apparaît plus d’une fois, elle est marquée comme « Doublon ». Ce processus peut être répété pour d’autres colonnes si nécessaire.

4. Validation de l’email :
Nous utilisons une méthode simple pour vérifier si l’email contient « @ » et « . » pour déterminer s’il est valide. Vous pouvez enrichir cette validation en utilisant des expressions régulières ou des bibliothèques tierces, mais cette vérification de base est suffisante pour de nombreux jeux de données.

Étape 3 : Exécution du Code
Pour exécuter le code :
1. Ouvrez votre fichier Excel et accédez à l’onglet « Développeur ».
2. Cliquez sur « Insérer », puis sélectionnez le contrôle « Bouton » (forme).
3. Dessinez le bouton sur la feuille de calcul.
4. Dans la fenêtre « Attribuer une macro », sélectionnez EvaluateurQualiteDonnees et cliquez sur « OK ».
5. Maintenant, lorsque vous cliquerez sur le bouton, la macro s’exécutera et vérifiera la qualité des données (valeurs manquantes, doublons et validation des emails).
Étape 4 : Exemple de Sortie
Après l’exécution du code, votre feuille de données pourrait ressembler à ceci :

Nom Âge Email Manquant (Nom) Manquant (Âge) Manquant (Email) Doublon Validité Email
John Doe 25 john.doe@mail.com Présent Présent Présent Unique Valide
Jane Smith jane.smith@mail.com Manquant Présent Présent Unique Valide
John Doe 30 john.doe2@mail.com Présent Présent Présent Doublon Valide
Bob White 22 bob.white@mail.com Présent Présent Présent Unique Valide
Alice Lee 24 alice.lee@mail Présent Présent Invalide Unique Invalide
  • Manquant (Nom, Âge, Email) : Indique si une valeur est manquante dans la ligne.
  • Doublon : Affiche si un nom est dupliqué dans l’ensemble des données.
  • Validité Email : Indique si le format de l’email est valide.

Conclusion
Cet outil fournit un moyen personnalisé d’évaluer la qualité des données dans Excel à l’aide de VBA. Vous pouvez ajouter davantage de vérifications en fonction de vos besoins spécifiques, comme la validation des plages de valeurs, la détection des valeurs aberrantes ou la vérification de la cohérence des données entre plusieurs colonnes. La flexibilité de VBA permet de créer un outil d’évaluation de la qualité des données adapté à vos besoins.

Facebook
Twitter
LinkedIn
WhatsApp
Email
Print
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x