Περίληψη : | Το επίκεντρο αυτής της εργασίας είναι η ανίχνευση εγκληματικών τραπεζικών λογαριασμών που ακολουθούν το μοντέλο συναλλαγής κυκλικής απάτης, ένα μοντέλο ενδιαφέροντος για τα συστήματα που καταπολεμούν το ξέπλυμα χρήματος. Δεδομένου ότι οι δικτυακές σχέσεις ενδέχεται να εκφράζουν αποδοτικότερα τις περίπλοκες δομές ενός περιβάλλοντος συναλλαγών, και το ξέπλυμα χρήματος συνεπάγεται σχέσεις ταμειακών ροών μεταξύ οντοτήτων (δικτυακές δομές), η ανάλυση γράφων έχει αναδειχθεί ως ένα ολοένα και σημαντικότερο εργαλείο των συστημάτων που καταπολεμούν το ξέπλυμα χρήματος. Ένας γράφος μπορεί να δημιουργηθεί με τους τραπεζικούς λογαριασμούς να αναπαρίστανται ως κόμβοι, τις συναλλαγές μεταξύ δύο λογαριασμών ως ακμές και τα ποσά συναλλαγής ως βάρη των ακμών. Χρησιμοποιώντας αυτή την προσέγγιση και έναν προσομοιωτή δεδομένων προσαρμοσμένο για εργασίες σχετικές με καταπολέμηση ξεπλύματος χρήματος, ονομαζόμενος AMLSim, θα παραχθεί ένα συνθετικό σύνολο δεδομένων προκειμένου να εισαχθεί σε ένα σύστημα διαχείρισης βάσεων δεδομένων για γράφους που επιτρέπει queries και οπτικοποίηση. Στη συνέχεια, λειτουργώντας σε χαρακτηριστικά που εξάγονται απευθείας από το γράφο, θα χρησιμοποιηθεί μοντέλο προβλέψεων για την ταξινόμηση των λογαριασμών (κόμβων) ως δόλιους, με στόχο χαμηλά ποσοστά ψευδώς θετικών ταξινομήσεων. Επιπροσθέτως, από το γράφο θα δημιουργηθούν δικτυακά embeddings (διανύσματα που αντιπροσωπεύουν χαρακτηριστικά κόμβων) έτσι ώστε να προσδιοριστεί εάν τα δικτυακά embeddings επηρεάζουν την απόδοση του μοντέλου όταν ενσωματώνονται μαζί με τα άλλα χαρακτηριστικά του γράφου. The focus of this thesis is on detecting fraudulent bank accounts which follow the cycle fraud transaction model, a model of interest for AML (Anti-money laundering) systems. Since network relationships may capture more complex dynamics in a transactional environment and money laundering involves cash flow relationships between entities (network structures), graph analytics have emerged as an increasingly important tool for AML analysis. A graph can be formulated where a single account is represented as a node, a single transaction between two accounts is represented as an edge and the edge’s weight represents the transaction amount. Using this approach and a data simulator tailored for AML tasks called AMLSim, a synthetic dataset will be generated in order to populate a graph database management system for querying and visualization. Then, operating on features extracted directly from the graph, predictive modeling will be employed in order to classify accounts (nodes) as fraudulent, aiming at low false positive rates. In addition, network embeddings (attribute vectors representing node characteristics) will be generated from the graph so as to determine whether network embeddings impact model performance when incorporated alongside other graph features.
|
---|