Abstract : | Ο κύριος σκοπός αυτής της διπλωματικής είναι να προβλέψουμε ποδοσφαιρικούς αγώνες χρησιμοποιώντας μηχανικές τεχνικές μάθησης. Ο κύριος στόχος μας είναι να δημιουργήσουμε ένα μοντέλο που θα είναι ικανό να προβλέψει το αποτέλεσμα καθώς και το ακριβές σκορ ενός ποδοσφαιρικού αγώνα με βάση τη μηχανική μάθηση. Επιλέξαμε να αναλύσουμε δύο μεγάλα πρωταθλήματα, το Αγγλικό πρωτάθλημα (Premier League) και το γερμανικό πρωτάθλημα (Bundesliga). Η προσέγγιση που ακολουθήσαμε για την αντιμετώπιση αυτού του προβλήματος ήταν πρώτον να αποκτήσουμε ένα καλά καθορισμένο σύνολο δεδομένων που περιέχει πολλά σημεία δεδομένων για τους αγώνες που συνέβησαν στο παρελθόν σε αυτά τα δύο πρωταθλήματα. Σε συνέχεια αυτού αποκτήσαμε τα στατιστικά στοιχεία αυτών των αγώνων και τα χρησιμοποιήσαμε για την κατασκευή χρήσιμων χαρακτηριστικών που μπορούμε να χρησιμοποιήσουμε στα μοντέλα μας. Ακολουθήσαμε την ίδια προσέγγιση για την κατασκευή χαρακτηριστικών με μερικές μικρές αλλαγές για τις δύο περιπτώσεις του προβληματος μας (αποτέλεσμα, σκορ) αλλά έπρεπε να δημιουργήσουμε το σύνολο δεδομένων λίγο διαφορετικά για αυτά τα δύο προβλήματα λόγω του γεγονότος ότι προσπαθούμε να πετύχουμε ένα διαφορετικό στόχο κάθε φορά. Επιπλέον, ακολουθήσαμε τεχνικές καθαρισμού και απεικόνισης των δεδομένων μας με τέτοιο τρόπο ώστε να μπορούμε να έχουμε την καλύτερη είσοδο για τα μοντέλα μας. Επιπλέον, επιλέξαμε διάφορους αλγόριθμους μηχανικής μάθησης για την ταξινόμηση και για την παλινδρόμηση του προβλήματος και παράλληλα χρησιμοποίησαμε διαφορετικές τεχνικές για να ανακαλύψουμε τις υπερ παραμέτρους τους. Τελικά επιλέξαμε το καλύτερο μοντέλο με βάση τα αποτελέσματα της πρόβλεψης. Εκτός από αυτό δημιουργήσαμε μια εφαρμογή, ώστε να μπορούμε να χρησιμοποιήσουμε τα τελικά μοντέλα για να προβλέψουμε τα αποτελέσματα και τα σκορ των διαφορετικών αγώνων σε αυτά τα δύο πρωταθλήματα. The main purpose of this Thesis is to predict football matches using machine learning techniques. Our main target is to create a model which will be capable to predict the outcome as well as the exact score of a football match based on machine learning. We chose to analyze two major leagues, the English League (Premier League) and the German League (Bundesliga). The approach that we followed to tackle this problem was firstly to obtain a well defined dataset which contains multiple data points for the matches that occured in the past in those two leagues. In continuation to that we obtained the statistics of those matches and we used them to construct useful features that we can use in our models. We followed the same feature construction approach with some minor changes for the two cases of our problem (outcome, score) but we had to construct the dataset a bit differently for those two problems due to the fact that we try to achieve a different objective each time. Furthermore we followed techniques to clean and depict our data in such a manner so we can have the best input for our models. In addition to that we chose several machine learning algorithms for the classification and for the regression part of the problem and in parallel weused different techniques to tune their hyperparameters. Finally we chose the best model based on the prediction results. In addition to that we created a web application so we can use the final models to predict the outcomes and the scores of different matches in those two Leagues.
|
---|