Λογότυπο αποθετηρίου
 

Evaluating lineups and predicting the impact of new players

Μικρογραφία εικόνας

Ημερομηνία

2025-07-29

Συγγραφείς

Papageorgiou, Theodoros
Παπαγεωργίου, Θεόδωρος

Τίτλος Εφημερίδας

Περιοδικό ISSN

Τίτλος τόμου

Εκδότης

Επιβλέποντα

Διαθέσιμο από

Περίληψη

Η παρούσα διπλωματική εργασία δημιουργεί ερευνά την αξιολόγηση των συνθέσεων των ομάδων της EuroLeague και την πρόβλεψη του αντίκτυπου της προσθήκης νέων παικτών, χρησιμοποιώντας play-by-play δεδομένα από το 2016 έως το 2024. Πρώτα, εξήχθησαν όλες οι πεντάδες που έπαιξαν τουλάχιστον 15 λεπτά, με αποτέλεσμα να προκύψουν 2146 συνδυασμοί. Υπολογίστηκαν βασικά στατιστικά στοιχεία των πεντάδων, όπως η αποτελεσματικότητα των σουτ, τα λάθη, οι ασίστ, τα ριμπάουντ, ο ρυθμός και οι αμυντικές μετρήσεις. Οι μετρήσεις της απόδοσης των παικτών σταθεροποιήθηκαν χρησιμοποιώντας μια εμπειρική μέθοδο Bayes shrinkage για την επεξεργασία των περιορισμένων δεδομένων. Στη συνέχεια, εφαρμόστηκε clustering για τον προσδιορισμό των στυλ των σχηματισμών. Χρησιμοποιώντας k-means, προέκυψαν τρεις κύριες ομάδες: η μία επικεντρώθηκε στην ισχυρή άμυνα και τα λάθη, η άλλη στα ριμπάουντ με ασθενέστερη άμυνα και η τρίτη στην γρήγορη και αποτελεσματική επίτευξη πόντων. Τα μοντέλα PAM και Gaussian Mixture επιβεβαίωσαν παρόμοια μοτίβα, αν και ο διαχωρισμός ήταν αρκετά ήπιος. Τέλος, δημιουργήθηκαν προγνωστικά μοντέλα για την εκτίμηση της απόδοσης της σύνθεσης (Net Rating) με βάση τα χαρακτηριστικά των παικτών. Τα μοντέλα περιελάμβαναν OLS, Ridge, Lasso και Random Forest και έδειξαν μεγάλη αλλα παρόμοια ακρίβεια. Χρησιμοποιόντας ένα απο αυτά έγιναν προσομοιώσεις για την ανταλλαγών παικτών με την ενημέρωση των χαρακτηριστικών της αντίστοιχης σύνθεσης. Τα αποτελέσματα δείχνουν ότι, ακόμη και χωρίς δεδομένα παρακολούθησης, οι συνθέσεις της EuroLeague μπορούν να αναλυθούν και να προβλεφθούν αποτελεσματικά, προσφέροντας πρακτικές πληροφορίες για προπονητές και αναλυτές.
This thesis builds a statistical framework to evaluate EuroLeague basketball lineups and predict the impact of adding new players, using play-by-play data from 2016–2024. First, all five-player lineups that played at least 15 minutes were extracted, resulting in 2146 combinations. Key lineup statistics, such as shooting efficiency, turnovers, assists, rebounding, pace, and defensive metrics, were calculated. Player performance measures were stabilized using an empirical Bayes shrinkage method to handle the noise in these limited data. Next, clustering was applied to identify lineup styles. Using k-means, three main clusters emerged: one focused on strong defense and turnovers, another on rebounding with weaker defense, and a third on fast, efficient scoring. PAM and Gaussian Mixture Models confirmed similar patterns, even tough there is large overlap in the clusters. Finally, predictive models were built to estimate lineup performance (Net Rating) based on player characteristics. Models used are OLS, Ridge, Lasso, and Random Forest, achieving similar, but high, accuracy. A simulation tool was also developed to test player swaps by updating lineup features. The results show that, even without tracking data, EuroLeague lineups can be analyzed and predicted effectively, offering practical insights for coaches and analysts.

Περιγραφή

Λέξεις-κλειδιά

Lineup evaluation, Player impact prediction, Clustering analysis, Ομαδοποίηση συνθέσεων, Πρόβλεψη απόδοσης παικτών, Αξιολόγηση συνθέσεων

Παραπομπή

Άδεια Creative Commons