Zeichenmuster

Mit der Analyse für Zeichenmuster wird festgestellt, ob Elemente wie Telefonnummern oder Postleitzahlen dem erwarteten Muster entsprechen. Die Analyse für Zeichenmuster verwendet die Regexp-Sprache und muss der Python Regexp-Syntax entsprechen.

Mit dieser Analyse lassen sich Zeichenmuster erkennen, die zur Überprüfung der Datenintegrität beitragen können. So kann zum Beispiel die Überprüfung von Telefonnummern, E-Mail-Adressen oder Postleitzahlen anhand erwarteter Muster dabei helfen, potenzielle Fehler in den Daten zu identifizieren.

Für die Analyse verwendete Felder

Die folgenden Felder sind für diese Analyse erforderlich:

  • Referenzfeld(er) - Eindeutige(s) Feld(er), das/die zur Erstellung einer eindeutigen Transaktions-ID verwendet wird/werden, wie z. B. das Feld Eintrags-ID für den Hauptbuch-Datensatz. Diese Spalten sind nicht Teil des Ergebnisses, sondern dienen der Identifizierung der Transaktionen, die Teil des Ergebnisses sind. Dieses Feld wurde bereits im Test definiert und kann nicht geändert werden.

  • Kernfeld(er) - Ein oder mehrere Felder mit String-Werten, die zur Durchführung des Tests verwendet werden. Wenn mehrere Felder ausgewählt sind, wird bei jedem Test nach demselben Zeichenmuster gesucht.

Parameter

Zur Durchführung dieses Tests müssen die folgenden Parameter eingestellt werden:

  • Muster einschließen oder ausschließen - Wählen Sie aus, ob Felder identifiziert werden sollen, die dem angegebenen Muster entsprechen oder nicht.

  • Zeichenmuster - Geben Sie das richtige Python-Regex-Muster an, das zur Analyse der ausgewählten Felder verwendet werden soll.

Test-Konfigurationen

Die folgende Konfiguration ist für diesen Test verfügbar:

Zeichenmuster - Benutzerdefiniertes Zeichenmuster auf der Grundlage eines Python-Regex-Musters.

Technische Spezifikationen

Wenn Sie die Analyse Zeichenmuster ausführen, werden die folgenden Schritte zur Durchführung des Tests durchgeführt:

  1. Legen Sie bei Bedarf Filter über die Daten, damit eine Teilmenge für die Analyse verwendet wird. Wenn kein Filter gesetzt ist, wird die Analyse für die gesamte Datei durchgeführt. Dieser Schritt kann auch als letzter statt als erster Schritt durchgeführt werden. Beachten Sie, dass die Möglichkeit, Filter zu setzen, derzeit nicht verfügbar ist und erst in späteren Versionen des Tests verfügbar sein wird.

  2. Überprüfen Sie, ob die erforderlichen Referenzfelder ausgewählt wurden. Wenn keine Felder ausgewählt wurden, erstellen Sie ein eindeutiges Referenzfeld. Dieser Schritt wird nur ausgeführt, wenn bestimmte Felder ausgewählt wurden. Wenn alle Felder vorhanden sind, ist dieser Schritt nicht erforderlich.

  3. Bestätigen Sie, dass ein oder mehrere Zeichenfelder für die Analyse ausgewählt wurden. Wenn mehrere Felder ausgewählt wurden, wird für jedes Feld die gleiche Regexp verwendet.

  4. Überprüfen Sie, ob der Benutzer angegeben hat, ob er nach Zeilen sucht, die dem Muster folgen oder nicht.

  5. Ermitteln Sie Regexp. Dies sollte als regulärer Ausdruck formatiert werden, der in Python verwendet werden kann. Siehe re — Operationen mit regulären Ausdrücken, um mehr zu erfahren.

  6. Je nachdem, ob der Benutzer ausgewählt hat, Werte zu identifizieren, die dem Muster entsprechen oder nicht, werden die Werte, die den Kriterien entsprechen, auf der Grundlage der angegebenen Regexp extrahiert.

    1. Wenn es mehrere Felder gibt und der Benutzer ausgewählt hat, Werte zu identifizieren, die nicht dem Muster entsprechen, dann wird die Transaktionszeile extrahiert, wenn mindestens eine der Spalten nicht wahr ist.

    2. Wenn es mehrere Felder gibt und der Benutzer ausgewählt hat, Werte zu identifizieren, die nicht dem Muster entsprechen, wird die Transaktionszeile nur extrahiert, wenn alle Felder dem Muster entsprechen.

  7. Extrahieren Sie die vom Benutzer ausgewählten Ergebnisfelder. Alle Felder werden standardmäßig extrahiert. Beachten Sie, dass die Möglichkeit, Ergebnisfelder auszuwählen, derzeit nicht verfügbar ist und erst in späteren Versionen des Tests verfügbar sein wird.