Relatieve groottefactor

Deze analyse identificeert afwijkingen waarbij de grootste hoeveelheid voor een subset in een bepaalde sleutel buiten de norm voor die subset valt. Een sleutel is een specifiek veld of combinatie van velden die worden gebruikt om gegevens te groeperen in subsets voor analyse.

Deze analytische test kan worden gebruikt om te identificeren:

  • Uitschieters of ongebruikelijke patronen

  • Transacties die aanzienlijk afwijken van de norm

Voor analyse gebruikte velden

De volgende velden worden gebruikt voor deze analyse:

  • Referentieveld(en) - Uniek(e) veld(en) die worden gebruikt om een unieke transactie-ID te maken, zoals het veld Entry ID voor de grootboekdataset. Deze kolommen maken geen deel uit van het resultaat, maar worden gebruikt om de transacties te identificeren die deel uitmaken van het resultaat. Dit veld is al gedefinieerd in de test en kan niet worden gewijzigd.

  • Numeriek veld - Het veld dat gebruikt wordt om de relatieve grootte factor (RSF) te berekenen.

  • Een of meer velden - Een of meer velden die worden gebruikt om de subsets te maken waarop de RSF wordt gegenereerd.

Parameters

De volgende parameters moeten worden ingesteld om deze test uit te voeren:

  • RSF Factor - Voer het veelvoud in tussen het grootste en het op één na grootste bedrag in de subset. Als de RSF-factor bijvoorbeeld is ingesteld op twee, dan moet de grootste hoeveelheid twee keer zo groot zijn als de op één na grootste om te worden geselecteerd.

  • Kleine bedragen negeren - Selecteer of kleine bedragen moeten worden uitgesloten.

  • Klein bedrag - Als je hebt geselecteerd om kleine bedragen te negeren, voer dan de waarde in die wordt beschouwd als de minimumwaarde die moet worden meegenomen in de test. Als je bijvoorbeeld $100 invoert, dan worden alle transacties van minder dan $100 uitgesloten van de analyse.

  • Positieve of negatieve waarden - Selecteer of de test op positieve of negatieve waarden moet worden uitgevoerd.

Testconfiguratie

De enige configuratie die voor deze test beschikbaar is, is Relatieve grootteklassefactor. Deze analyse identificeert afwijkingen waarbij de grootste hoeveelheid voor een subset in een bepaalde sleutel buiten de norm voor die subset valt.

Technische specificaties

Let op: Deze technische specificaties zijn gebaseerd op de selectie van positieve getallen. Voor negatieve getallen wordt het kleinste getal beschouwd als het grootste getal voor de volgende stappen.

Wanneer je de Zoekwoorden analytische test uitvoert, worden de volgende stappen uitgevoerd om de test uit te voeren:

  1. Plaats indien nodig filters op de gegevens zodat een subset wordt gebruikt voor de analyse. Als er geen filter is geplaatst, wordt de analyse uitgevoerd op het volledige gegevensbestand. Deze stap kan ook als laatste stap worden uitgevoerd in plaats van als eerste.

    Let op: Filters zijn momenteel nog niet beschikbaar en zullen in een latere versie worden toegevoegd.

  2. Valideer dat een bedragveld is geselecteerd.

  3. Valideer een of meer velden (behalve het bedrag) die zullen worden gebruikt voor het maken van de subsets.

  4. Vat het bestand samen op basis van de velden die zijn geselecteerd voor de subset, deze velden moeten op volgorde van selectie staan, de samenvatting moet het aantal records per subset bevatten. Voer de selectie alleen uit op negatieve of positieve waarden op basis van de vlag die aangeeft op welk type waarden de analyse moet worden uitgevoerd.

  5. Extraheer alle records waarin het aantal records groter is dan 1 (dit sluit alle subsets uit waarin er slechts één transactie is, voor deze analyse heb je twee of meer transacties per subset nodig).

  6. Koppel het bestand dat in stap 6 is gemaakt terug met het originele bestand door de geselecteerde subsetvelden. Het originele bestand moet ook worden gefilterd op het veld bedrag, afhankelijk van de positieve of negatieve vlag. Als de vlag positief is, moet het filter bedrag > 0 zijn en als de vlag negatief is, moet het bedrag < 0 zijn. Deze stap is het maken van een bestand met alle transacties die deel zullen uitmaken van de RSF-analyse.

  7. Extraheer de top twee overgangen voor elke subset in stap 7. Neem alleen de subsetveld(en), het bedragveld en de recordsleutel op.

  8. Extraheer uit stap 8 de toprecord op bedrag voor elke subset.

  9. Hernoem het bedragveld in stap 8 in Largest Amt.

  10. Haal uit stap 7 alle transacties behalve die in stap 6 (bovenste records). Dit geeft een lijst met transacties die de transactie met de hoogste waarde uitsluit.

  11. Haal uit stap 11 de transactie met de grootste waarde per unieke subset, dit geeft de op één na grootste transactie voor de subsets.

  12. Vanaf stap 11 hernoem je het veld Bedrag naar Tweede grootste bedrag.

  13. Bereken vanaf stap 9 de gemiddelde waarde voor elke unieke sleutel. Dit gemiddelde zal de grootste hoeveelheid uitsluiten voor de unieke subset die in stap 9 werd geëxtraheerd.

  14. Hernoem het veld Gemiddelde waarde in stap 14 in Gemiddelde X Grootste.

  15. Combineer de transacties uit stap 9 (hoogste waarden) en stap 12 (op één na hoogste waarden) samen.

  16. Combineer de transacties uit stap 16 (Topwaarde en Tweede grootste waarde) met stap 15 de Gemiddelde X Grootste. Het resultaat zou nu de subsetkolommen, kolom Grootste bedrag, kolom Tweede grootste bedrag, kolom Gemiddelde X grootste en kolom Aantal moeten bevatten.

  17. Maak de kolom Relatieve Groottefactor op basis van Grootste Bedrag / Tweede Grootste Bedrag, gebruik over het algemeen 4 decimalen voor weergave.

  18. Extraheer alle transacties die gelijk zijn aan of groter zijn dan de RSF-factorparameter. Als de parameter is dat kleine bedragen moeten worden genegeerd, sluit dan ook alle transacties uit waarbij de grootste Bedrag-waarde kleiner is dan de kleine Bedrag-waarde die in de parameters is opgenomen.

  19. Extraheer de RSF-gerelateerde transacties.

  20. Voeg het originele bronbestand samen met de RSF-bestandstest. De join zou alleen worden gematcht en de match zou worden gebaseerd op de velden die zijn geselecteerd voor de subset, samen met het bedragveld dat overeenkomt met het veld met het grootste bedrag.