Modèle de caractères
Le test analytique des modèles de caractères permet de déterminer si des éléments tels que les numéros de téléphone ou les codes postaux sont dans le modèle attendu. Le test d'analyse des modèles de caractères utilise le langage Regexp (expression régulière) et doit respecter la syntaxe Regexp de Python.
Ce test analytique peut être utilisé pour trouver des modèles de caractères qui peuvent aider à valider l'intégrité des données. Par exemple, la validation de numéros de téléphone, d'adresses électroniques ou de codes postaux par rapport aux modèles attendus peut aider à détecter de possibles erreurs dans les données.
Champs utilisés pour l'analyse
Les champs suivants sont obligatoires pour cette analyse :
-
Champs de référence – Champs uniques utilisés pour créer un identifiant de transaction unique, comme le champ ID de l’écriture pour l’ensemble de données du grand livre général. Ces colonnes ne font pas partie du résultat, mais elles sont utilisées pour trouver les transactions qui font partie du résultat. Ce champ est déjà défini dans le test et ne peut pas être modifié.
-
Champs principaux – Un ou plusieurs champs avec des valeurs de chaîne qui sont utilisés pour exécuter le test. Si plusieurs champs sont sélectionnés, le test recherche le même modèle de caractère pour chaque test.
Paramètres
Les paramètres suivants doivent être définis pour exécuter ce test :
-
Inclure ou exclure le modèle – Sélectionnez s'il faut repérer les champs qui suivent le modèle indiqué ou qui ne le suivent pas.
-
Modèle de caractères – Précisez le motif d’expression régulière de Python à utiliser pour analyser les champs sélectionnés.
Configurations de test
La configuration suivante est proposée pour ce test :
Modèle de caractères – Modèle de caractères défini par l'utilisateur sur la base d'un modèle d’expression régulière de Python.
Spécifications techniques
Lorsque vous exécutez le test analytique Modèle de caractères, il faut réaliser les étapes suivantes :
-
Si nécessaire, placez des filtres sur les données afin qu'un sous-ensemble soit utilisé pour l'analyse. Si aucun filtre n'est placé, l'analyse sera effectuée sur l'ensemble du fichier de données. Cette étape peut également être réalisée à la dernière étape, et non à la première. Notez qu’il n’est pas encore possible de définir des filtres et que ce le sera dans les versions ultérieures du test.
-
Vérifiez que les champs de référence nécessaires ont été sélectionnés. Si les champs n'ont pas été sélectionnés, créez un champ de référence unique. Cette étape est réalisée seulement si des champs spécifiques ont été sélectionnés. Si tous les champs sont accessibles, cette étape n'est pas nécessaire.
-
Vérifiez qu'un ou plusieurs champs de caractères ont été sélectionnés pour l'analyse. Si plusieurs champs ont été sélectionnés, la même expression régulière est utilisée pour chacun d'entre eux.
-
Vérifiez que l'utilisateur a indiqué s'il recherche des lignes qui suivent le modèle ou qui ne le suivent pas.
-
Obtenez l'expression régulière. Elle doit être formatée sous la forme d'une expression régulière utilisable en Python. Voir objet – Opérations d'expression régulière pour en savoir plus.
-
Selon que l'utilisateur a choisi de déterminer les valeurs qui suivent ou ne suivent pas le modèle, les valeurs qui répondent aux critères sont extraites sur la base de l'expression rationnelle fournie.
-
S'il y a plusieurs champs et que l'utilisateur a choisi de détecter les valeurs qui ne suivent pas le modèle, la ligne de transaction est extraite si au moins une des colonnes n'est pas vraie.
-
S'il y a plusieurs champs et que l'utilisateur a choisi de déterminer les valeurs qui suivent le modèle, la ligne de transaction est extraite seulement si tous les champs suivent le modèle.
-
-
Extrayez les champs de résultats sélectionnés par l'utilisateur. Tous les champs sont extraits par défaut. Notez que la sélection des champs de résultats n'est pas possible actuellement et le sera dans les versions ultérieures du test.