PYXIDA Institutional Repository
and Digital Library
Collections :

Title :Segmentation of population (Clustering Analysis): case study analysis on banking data
Alternative Title :Τμηματοποίηση πληθυσμού σε συστάδες (Clustering Analysis) : η περίπτωση βάσης πελατών στον τραπεζικό κλάδο
Creator :Αργυροπούλου, Ευαγγελία
Contributor :Psarakis, Stelios (Επιβλέπων καθηγητής)
Athens University of Economics and Business, Department of Statistics (Degree granting institution)
Type :Text
Extent :57p.
Language :en
Abstract :Segmentation is a process of identifying sub-groups of people or organizations within a population sharing one or more characteristics that cause them to have similar product and/or service needs.The scope of this thesis is to group customers from banking data into different segments. Code was constructed to receive as input a table, where each row represented a customer. Options referring to the parameters are set as global variables and could be set from the beginning of the execution. Parameters related to k-means options, variable preparation, selection and reduction etc. Parameters could be adjusted and rerun the code, without losing information. Finally, after variable selection and segmetation analysis execution with the use of K-means algorithm, we proceed to profiling execution and evaluation of solution.
Σκοπός της εργασίας είναι να κατασκευαστεί κώδικας που αναλύει τραπεζικά δεδομένα, να εντοπισθούν όσο το δυνατόν καλύτερα clusters, με ομοιογένεια των παρατηρήσεων (πελατών) μέσα στο cluster (within each cluster) και μέγιστη διαφορά των χαρακτηριστικών μεταξύ των clusters (between the clusters).Στο πλαίσιο της διπλωματικής εργασίας κατασκευάστηκε κώδικας, ο οποίος αποτελεί ένα ολοκληρωμένο εργαλείο που δέχεται στην είσοδο έναν πίνακα, όπου κάθε γραμμή περιγράφει την εικόνα κάθε πελάτη. Κώδικας παραμετροποιήσιμος από το χρήστη, δίνει τη δυνατότητα εύκολης επανεκτέλεσής με αλλαγές των ρυθμίσεων. Αλλαγές επιτρέπονται καθ’ όλη τη διάρκεια της διαδικασίας (προετοιμασία μεταβλητών , επιλογή μεταβλητών για το segmentation), και εισάγονται στην αρχικοποίηση της διαδικασίας. Η κεντροποίηση της εισαγωγής των παραμέτρων εξυπηρετεί στην πολλαπλή επανεκτέλεση του κώδικα και τον τρόπο μείωσης των μεταβλητών χωρίς να χάνεται πληροφορία (variable reduction μέσω variable clustering / PROC VARCLUS). Στην συνέχεια, τρέξιμο του segmentation (με χρήση του αλγορίθμου K-means) και αξιολόγηση της λύσης ως προς το σύνολο των δεδομένων.
Subject :Segmentation
Clustering analysis
K-means algorithm
Banking systems
Date :2017
Licence :

File: Argyropoulou_2017.pdf

Type: application/pdf