Συλλογές
Τίτλος Discrete time Markov decision processes: theory and applications
Εναλλακτικός τίτλος Μαρκοβιανά μοντέλα αποφάσεων διακριτού χρόνου: θεωρία και εφαρμογές
Δημιουργός Μπούττνερ, Δημήτριος, Bouttner, Dimitrios
Συντελεστής Βακερούδης, Σταύρος
Athens University of Economics and Business, Department of Statistics
Zazanis, Michael
Kyriakidis, Epaminondas
Τύπος Text
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9577
Περίληψη In this project the basic theory of Markov Decision Processes (MDP's) is presented. It is explained how these models are defined and in which problems they are needed. Three basic algorithms for optimizing systems that can be modeled as MDP's are discussed: The Policy Iteration, Value Iteration and Linear Programming algorithms. The basic theoretical background, such as the convergence of the algorithms, is explained in detail. The convergence is proved under certain conditions that are met in most realistic problems. Finally, numerical examples of real world applications are solved and the results and the performance of the algorithms is commented.
Στην παρούσα εργασία παρουσιάζεται η βασική θεωρία των Μαρκοβιανών Μοντέλων Αποφάσεων. Εξηγείται πως ορίζονται τα μοντέλα και σε ποια προβλήματα χρειάζονται. Μελετώνται τριες βασικοί αλγόριθμοι για τη βελτιστοποίηση συστημάτων που μπορούν να μοντελοποιηθούν ως Μαρκοβιανές διαδικασίες διακριτού χρόνου: Ο αλγόριθμος Policy Iteration, ο Value Iteration και ο αλγόριθμος που βασίζεται στο γραμμικό προγραμματισμό. Η βασική θεωρία, όπως για παράδειγμα αυτή που αποδεικνύει τη σύγκιση των αλγορίθμων, εξηγείται με λεπτομέρια. Η σύγκλιση των αλγορίθμων αποδεικνύεται στην παρούσα κάτω από περιοριμούς οι οποίοι ικανοποιούνται στα περισσότερα πρακτικά προβλήματα. Τέλος, λύνονται αριθμητικά προβλήματα βελτιστοποίησης που προκύπτουν από ρεαλιστικές εφαρμογές και σχολιάζεται η απόδοση των αλγορίθμων.
Λέξη κλειδί Μαρκοβιανά μοντέλα αποφάσεων
Discrete time
Markov Decision Processes (MDPs)
Διακριτός χρόνος
Διαθέσιμο από 2022-07-13 15:22:55
Ημερομηνία έκδοσης 2022
Ημερομηνία κατάθεσης 2022-07-13 15:22:55
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/