Τίτλος Statistical analysis for the player evaluation in team sports
Εναλλακτικός τίτλος Στατιστική ανάλυση για τις επιδόσεις των αθλητών
Δημιουργός Ζαφειρόπουλος, Χαράλαμπος Ι., Zafeiropoulos, Charalampos I.
Συντελεστής Ntzoufras, I.
Athens University of Economics and Business, Department of Statistics
Τύπος Text
Φυσική περιγραφή 103p.
Γλώσσα en
Περίληψη Statistics knows great development in sports from mid 90s and after. Numerous models and indices have been created in order to estimate one match’s outcome or the competitive balance of a round-robin tournament. Most of them differ either in the response variable or at the type of the model and the distribution of the response variable. In recent years, statistics also blooms in the field of Training. Statistical models have been constructed to estimate the most desirable level of training load. Professional athletes are also used as sample subjects from many researchers because of their physical condition. Coaches and managers also take into consideration statistics in order to make the best possible additions in their roster or prepare the best possible team for the upcoming season. Similarly, common people also care about statistics in sports either for betting or to verify their favorite team’s chances of winning the trophy of major league. In season 2015-2016 Leicester made history when the team was crowned Premier league champion for the first time. This success happened two years after their promotion from English Championship. My aim is to estimate the most important contribution of Leicester’s player via statistical models.Player performance is the main field of sports that my thesis focuses. Most known models and metrics have plus-minus form and they use the number of goals as response variable with big variety of explanatory variables. My approach follows the same direction. However, as explanatory variables I chose only the number of minutes that each player spend in the pitch. My proposal is Poisson generalized linear model. Poisson distribution seems to explain the nature of my response variable goals. As link function I used the logarithm because goals’ values meet the requirements of logarithm.First Player performance estimation took place through descriptives and model for each player. Estimations for the attacking performance were different for each methods. On the other hand, estimations for the defensive ability were alike in both methods. Plots also shown that, Ulloa was more profitable for his team than Okazaki who is main opponent for the position of Vardy’s partner. Mahrez also had decent attacking and defensive ability. As for Teams, Leicester and Tottenham were 2 out 3 best attacking and defensive teams. ManchesterVICity was the best attacking team and Manchester United was the best defensive team. Leicester also shows bigger variance than the other teams due to the fact that its’ player was also included in the model. Championship table confirmed my results about teams.Last I divide each game into shift according to events such as substitutions and red cards. Each player that played on each shift, had as count the number of minutes of the shift divided by 90. I presented a model for all players. I faced the problem of multi-collinearity which led to some extreme results but the model fitted with the saturated. Results shown, that the starting team was more effective in defense with the exception of defenders. However, substitutions seem to be more productive. Last, the results about Teams’ brought the same conclusion with the previous models.
Η Στατιστική των αθλημάτων γνώρισε μεγάλη ανάπτυξη από τα μέσα της δεκαετίας του 90 και μετά. Πολλές έρευνες έχουν πραγματοποιηθεί με στόχο να εκτιμηθούν οι παράγοντες που επηρεάζουν την έκβαση ενός αγώνα. Πολλοί δείκτες έχουν δημιουργηθεί για να εκτιμήσουν το επίπεδο ανταγωνιστικότητας ενός πρωταθλήματος. Μοντέλα έχουν δημιουργηθεί αναφορικά με το επίπεδο πίεση στην προπόνηση των ομάδων. Επίσης πολλές έρευνες έχουν πραγματοποιηθεί σε δείγματα αθλητών λόγω της πολύ καλής φυσικής τους κατάστασης. Προπονητές και τεχνικοί διευθυντές λαμβάνουν υπόψη αυτές τις μετρήσεις για την απόκτηση παιχτών που θα ανεβάσουν το επίπεδο της ομάδας αλλά και για την καλύτερη δυνατή προετοιμασία για την αγωνιστική χρονιά. Ομοίως πολλοί άνθρωποι λαμβάνουν υπόψη αυτές τις έρευνες κυρίως για λόγους στοιχήματος αλλά και για να εκτιμήσουν την πορεία της αγαπημένης τους ομάδας στο πρωτάθλημα που αγωνίζεται. Την αγωνιστική χρονιά 2015-2016 η Λεστερ πραγματοποίησε μια από τις μεγαλύτερες εκπλήξεις της σύγχρονης ιστορίας, καθώς ανακηρύχθηκε πρωταθλήτρια Αγγλίας για πρώτη φορά στην ιστορία της. Αυτή η επιτυχία μοιάζει ακόμα μεγαλύτερη αν αναλογιστεί κανείς πως 2 χρόνια πριν είχε ανέβει στην πρώτη κατηγορία. Ο στόχος της εργασίας είναι να εκτιμήσουμε την επίδραση των πιο σημαντικών παιχτών μέσω ενός μοντέλου.Η απόδοση των παικτών είναι ένα πεδίο των αθλημάτων όπου η στατιστική γνωρίζει μεγάλη άνθιση. Οι πιο γνωστοί δείκτες έχουν την τάση να εξισώσουν τα θετικά και τα αρνητικά για να εκτιμούν την απόδοση ενός παίχτη. Τα περισσότερα μοντέλα τείνουν να χρησιμοποιούν τα γκολ σαν εξαρτημένη μεταβλητή για να εκτιμήσουν την απόδοση ενός παίκτη χρησιμοποιώντας μια μεγάλη ποικιλία ανεξάρτητων μεταβλητών. Αντίστοιχη ήταν και η προσέγγιση που ακολουθήσαμε. Παρόλα αυτά σαν ανεξάρτητη μεταβλητή χρησιμοποίησα μόνο τους χρόνους που κάθε παίχτης έπαιξε στο εκάστοτε αγώνα, Θεωρήσαμε πως τα Poisson γενικευμένα γραμμικά μοντέλα ήταν τα κατάλληλα για να κάνουν την εκτίμηση. Η Poisson κατανομή επιλέχθηκε γιατί έδειχνε να συνάδει με την φύση της εξαρτημένης μεταβλητής. Σαν συνάρτηση σύνδεσης επιλέχθηκε ο λογάριθμος. Οι τιμές της εξαρτημένης μεταβλητής τηρούν τις προϋποθέσεις του λογαρίθμου. Αρχικά η εκτίμηση της απόδοσης τωνVIIIπαιχτών πραγματοποιήθηκε μέσω της περιγραφικής ανάλυσης και μέσω μοντέλων για κάθε παίχτη. Οι εκτιμήσεις για τις επιθετικές επιδόσεις ήταν διαφορετικές σε κάθε μέθοδο. Ενώ στην εκτίμηση της αμυντικής επίδρασης η κατάταξη των παικτών ήταν σχεδόν παρόμοια. Ο Ulloa ήταν πιο παραγωγικός από τον βασικό του ανταγωνιστή, για την θέση του συμπαίκτη του Vardy, Okazaki. Ο Mahrez επίσης ήταν το ίδιο καλός και σε επίθεση και σε άμυνα. Όσον αφορά τις ομάδες η Leicester και η Tottenham ήταν δύο από τις 3 καλύτερες ομάδες σε επίθεση και άμυνα. Η Manchester City είναι η πιο παραγωγική ομάδα ενώ η Manchester United καλή αμυντικά ομάδα. Ο βαθμολογικός πίνακας επιβεβαίωσε τα αποτελέσματά μου.Στην συνέχεια τα δεδομένα χωρίστηκαν σε περιόδους ανάλογα με γεγονότα όπως τις αλλαγές και τις κόκκινες κάρτες. Κάθε παίκτης που έπαιξε στην περίοδο είχε σαν συντελεστή τον αριθμό των λεπτών που έπαιξε διαιρεμένο με 90. Μετά παρουσίασα ένα μοντέλο για όλους τους παίκτες. Το μοντέλο παρουσίασε το πρόβλημα της πολυσυγγραμικότητας το οποίο οδήγησε σε αρκετά ακραία αποτελέσματα. Τα αποτελέσματα έδειξαν πως ,με εξαίρεση τους αμυντικούς, η αρχική ομάδα ήταν πολύ αποτελεσματική στην άμυνα. Παρόλα αυτά, οι αλλαγές ήταν πιο παραγωγικές στην επίθεση. Τέλος, τα συμπεράσματα για τις ομάδες ήταν ίδια με τα προηγούμενα μοντέλα.
Λέξη κλειδί Sports statistics
Player performance analysis
Ημερομηνία 30-09-2017
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/