PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Behavioral analysis using retail data for customer segmentation
Creator :Maniatis, Filippos
Μανιάτης, Φίλιππος
Contributor :Karlis, Dimitrios (Επιβλέπων καθηγητής)
Vassalos, Vasilios (Εξεταστής)
Zois, Georgios (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Type :Text
Notes :Company Supervisor: Stavros Lagousis
Extent :52p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9460
Abstract :On this thesis we experiment on the use of a clustering algorithm for customer segmentation in order to produce meaningful cluster analysis that will be used for business decision making. The analysis explores the application of k-means algorithm paired with Principal Component Analysis for dimensionality reduction on real sales data from one of the largest coffee store chains in Greece. What is more, metrics for wellness of fit of the algorithm and choosing the optimal number of clusters prior to clustering are also used and explained. After clustering, a Decision Tree classifier is used for interpretation of the clustering results and a Random Forest classifier is employed in order to extract the importance of the features that take part in the clustering process. Finally, we analyze the clusters in order to gain useful insights concerning customer behavior.
Σκοπός της διπλωματικής αυτής εργασίας είναι η χρήση μεθόδων και τεχνικών clustering, με σκοπό την δημιουργία cluster, που θα οδηγήσουν στην ορθότερη λήψη αποφάσεων. Σε αυτή τη διπλωματική εξερευνούμε τη χρήση του αλγορίθμου k-means σε συνδιασμό με Principal Component Analysis με σκοπό το dimensionality reduction σε δεδομένα πωλήσεων μιας εκ των μεγαλυτέρων αλυσίδας στο χώρο της εστίασης. Επιπρόσθετα, θα αναλύσουμε μεθόδους αξιολόγησης του παραγόμενου από τον αλγόριθμο αποτελέσματος, καθώς και τον υπολογισμοό του βέλτιστου αριθμού clusters πριν από το clustering. Μετά το clustering, εξηγούμε τη χρήση Decision Tree και Random Forest classifier με σκοπό την εύρεση των σημαντικότερων χαρακτηριστικών που επηρέασαν πιο πολύ το clustering. Τέλος, γίνεται ανάλυση των cluster και εξερεύνηση της διαφορετικότητας αυτών με τη χρήση γραφημάτων, αποκομίζοντας χρήσιμα συμπεράσματα για την συμπεριφορά των καταναλωτών της αλυσίδας.
Subject :Συμπεριφορά καταναλωτή
Clustering
Cluster
Behavioral analysis
Date Available :2022-05-09 19:32:58
Date Issued :2022
Date Submitted :2022-05-09 19:32:58
Access Rights :Free access
Licence :

File: Maniatis_2021.pdf

Type: application/pdf