Βιβλιοθήκη ΟΠΑ - Ψηφιακό Αποθετήριο

ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη

Όνομα χρήστη
Κωδικός πρόσβασης

Συλλογές :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας / School of Informatics Τμήμα Πληροφορικής / Department of Informatics Μεταπτυχιακές Εργασίες / Postgraduate dissertations

Τίτλος :	Optimizing carbon emissions of a maritime fleet using deep reinforcement learning

Εναλλακτικός τίτλος :	Βελτιστοποιώντας την εκπομπή ρύπων διοξειδίου του άνθρακα ενός ναυτιλιακού στόλου με χρήση βαθιάς μάθησης με επιβράβευση

Δημιουργός :	Pappas, Ioannis-Nikolaos Παππάς, Ιωάννης-Νικόλαος

Συντελεστής :	Zois, Georgios (Επιβλέπων καθηγητής) Koutsopoulos, Iordanis (Εξεταστής) Vassalos, Vasilios (Εξεταστής) Athens University of Economics and Business, Department of Informatics (Degree granting institution)

Τύπος :	Text

Φυσική περιγραφή :	45p.

Γλώσσα :	en

Αναγνωριστικό :	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9114

Περίληψη :	One of the most urgent discussion matters for the contemporary human societyis that of climate change. The present-day response of humankind towards phe-nomenons such as global warming, sea-level rise and mass loss in ice glaciers world-wide, will greatly shape the way of living for future generations. The human activityof goods transportation contributes significantly to the global temperature increasethrough greenhouse gas emissions from transportation means such as aeroplanes,ships and trucks. In an effort to address this issue, the International MaritimeOrganization has created appropriate legislation regarding the annual acceptablegreenhouse gas emissions of vessels introducing quantities that monitor the opera-tion of a fleet such as the carbon intensity indicator. The current thesis tries toinvestigate the problem of maritime fleet management with a focus on minimizingthe total gas emissions produced while serving cargo transportation contracts. Thisproblem can be mathematically formulated as a combinatorial optimization prob-lem where we are trying to determine an optimal mapping between available cargotransportation contracts and fleet vessels operating at specific speed levels. Thismapping is created with the goal to minimise the total cost induced by producingemissions above the permissible carbon intensity indicator thresholds. Our inten-tion is to create an automated mechanism that gradually learns an effective strategyregarding this mapping driven by tools of a domain of artificial intelligence calleddeep reinforcement learning. This automated mechanism, also called an agent, isessentially a deep neural network. The parameter values of this neural networkshape the decision making strategy or policy of the agent. The agent participates inmultiple simulations taking place in an artificial environment with resembling func-tional features to the real world maritime industry. Each simulation has a year longduration and for each day of the year the agent is responsible for making decisionsregarding the operation of its fleet. Each decision taken by the agent is evaluatedbased on each outcome, with a corresponding reward or penalty signal. This evalu-ation is reintroduced to the agent as a cost signal needed to update the parametersof the agent’s neural network accordingly. This procedure enhances the knowledgeof the agent with regards to the different states that the environment can take.Essentially, having participated into a variety of different simulations, we want theagent to formulate an effective strategy of fleet management with the objective ofminimizing environmental damaging carbon emissions. Ένα από τα πλέον επιτακτικά θέματα συζήτησης της σύγχρονης ανθρώπινης κοινωνίας είναι αυτό της κλιματικής αλλαγής. Η σημερινή απάντηση της ανθρωπότητας σε φαινόμενα όπως η υπερθέρμανση του πλανήτη, η αύξηση της θαλάσσιας στάθμης και η απώλεια μάζας των παγετώνων παγκοσμίως θα διαμορφώσουν σε μεγάλο βαθμό το τρόπο ζωής των μελλοντικών γενεών. Η ανθρώπινη δραστηριότητα της μεταφοράς αγαθών συμβάλλει σημαντικά στην αύξηση της θερμοκρασίας σε παγκόσμια κλίμακα μέσω της εκπομπής αερίων του θερμοκηπίου από μέσα μεταφοράς όπως τα αεροπλάνα, τα πλοία και τα φορτηγά. Σε μια προσπάθεια αντιμετώπισης του εν λόγω φαινομένου, ο Διεθνής ΟργανισμόςΝαυτιλίαςδημιούργησεμιασειράαπόνομοθετικέςρυθμίσειςσχετικάμεταετήσιαεπιτρεπόμενα επίπεδα εκπομπής αερίων του θερμοκηπίου από καράβια, εισάγοντας ποσότητεςπουεπιβλέπουντηνλειτουργίατουστόλουόπωςοδείκτηςέντασηςάνθρακα. Ηπαρούσαδιπλωματικήεργασίαπροσπαθείναεξερευνήσειτοπρόβληματηςδιαχείρισηςενόςναυτιλιακού στόλου, εστιάζοντας στην ελαχιστοποίηση των συνολικών εκπομπών ρύπων κατά την εξυπηρέτηση συμβολαίων μεταφοράς φορτίου. Το συγκεκριμένο πρόβλημα μπορεί να θεμελιωθεί μαθηματικά ως ένα πρόβλημα συνδυαστικής βελτιστοποίησης κατά το οποίο προσπαθούμε να προσδιορίσουμε μια βέλτιστη απεικόνιση μεταξύ διαθέσιμων συμβολαίων μεταφοράς φορτίου και καραβιών στόλου που λειτουργούν σε συγκεκριμένες στάθμες ταχυτήτων. Αυτή η απεικόνιση δημιουργείται με στόχο να ελαχιστοποιήσει το συνολικό κόστος που προκύπτει όταν οι παραγόμενες εκπομπές ρύπων ξεπερνούν τα επιτρεπτά όρια του δείκτη έντασης άνθρακα. Στόχος μας είναι να δημιουργήσουμε ένα ναυτοματοποιημένο μηχανισμό που θα μαθαίνει σταδιακά μια αποτελεσματική στρατηγική σχετικά με την εν λόγω αντιστοίχηση και ο οποίος θα αποτελείται από εργαλεία ενός κλάδου της τεχνητής νοημοσύνης που ονομάζεται βαθιά μάθηση με επιβράβευση. Αυτόςοαυτοματοποιημένοςμηχανισμόςπουονομάζεταιαλλιώςκαιπράκτορας,είναιουσιαστικά ένα βαθύ νευρωνικό δίκτυο. Οι τιμές των παραμέτρων αυτού του νευρωνικού δικτύου σχηματοποιούν τη στρατηγική λήψης αποφάσεων ή αλλιώς τακτική του πράκτορα. Ο πράκτορας συμμετέχει σε πολλαπλές προσομοιώσεις που λαμβάνουν χώρα σε ένα τεχνητό περιβάλλον με λειτουργικά χαρακτηριστικά που μοιάζουν με την πραγματική ναυτιλιακή βιομηχανία. Κάθε προσομοίωση έχει διάρκεια ενός έτους και για κάθε μέρα του χρόνου, ο πράκτορας είναι υπεύθυνος να λαμβάνει αποφάσεις σχετικές με την λειτουργία του στόλου. Κάθε απόφαση του πράκτορα αξιολογείται με βάση την κατάληξη της από ένα αντίστοιχο σήμα επιβράβευσης ή ποινής. Αυτή η αξιολόγηση επαναπροωθείται στο πράκτορα με τη μορφή ενός σήματος κόστους μέσω του οποίου ενημερώνονται κατάλληλα οι παράμετροι του νευρωνικού δικτύου του πράκτορα. Αυτή η διαδικασία ενισχύει τη γνώση του πράκτορα σχετικά με τις διάφορες καταστάσεις στις οποίες μπορεί να επέλθει το περιβάλλον. Ουσιαστικά, έχοντας συμμετάσχει σε μια πληθώρα διαφορετικών προσομοιώσεων, θέλουμε ο πράκτορας να μπορεί να διαμορφώσει μια αποτελεσματική στρατηγική αναφορικά με τη διαχείριση του στόλου, με σκοπό να ελαχιστοποιήσει τις περιβαλλοντικά επιβλαβείς εκπομπές ρύπων

Περίληψη :

One of the most urgent discussion matters for the contemporary human societyis that of climate change. The present-day response of humankind towards phe-nomenons such as global warming, sea-level rise and mass loss in ice glaciers world-wide, will greatly shape the way of living for future generations. The human activityof goods transportation contributes significantly to the global temperature increasethrough greenhouse gas emissions from transportation means such as aeroplanes,ships and trucks. In an effort to address this issue, the International MaritimeOrganization has created appropriate legislation regarding the annual acceptablegreenhouse gas emissions of vessels introducing quantities that monitor the opera-tion of a fleet such as the carbon intensity indicator. The current thesis tries toinvestigate the problem of maritime fleet management with a focus on minimizingthe total gas emissions produced while serving cargo transportation contracts. Thisproblem can be mathematically formulated as a combinatorial optimization prob-lem where we are trying to determine an optimal mapping between available cargotransportation contracts and fleet vessels operating at specific speed levels. Thismapping is created with the goal to minimise the total cost induced by producingemissions above the permissible carbon intensity indicator thresholds. Our inten-tion is to create an automated mechanism that gradually learns an effective strategyregarding this mapping driven by tools of a domain of artificial intelligence calleddeep reinforcement learning. This automated mechanism, also called an agent, isessentially a deep neural network. The parameter values of this neural networkshape the decision making strategy or policy of the agent. The agent participates inmultiple simulations taking place in an artificial environment with resembling func-tional features to the real world maritime industry. Each simulation has a year longduration and for each day of the year the agent is responsible for making decisionsregarding the operation of its fleet. Each decision taken by the agent is evaluatedbased on each outcome, with a corresponding reward or penalty signal. This evalu-ation is reintroduced to the agent as a cost signal needed to update the parametersof the agent’s neural network accordingly. This procedure enhances the knowledgeof the agent with regards to the different states that the environment can take.Essentially, having participated into a variety of different simulations, we want theagent to formulate an effective strategy of fleet management with the objective ofminimizing environmental damaging carbon emissions.
Ένα από τα πλέον επιτακτικά θέματα συζήτησης της σύγχρονης ανθρώπινης κοινωνίας είναι αυτό της κλιματικής αλλαγής. Η σημερινή απάντηση της ανθρωπότητας σε φαινόμενα όπως η υπερθέρμανση του πλανήτη, η αύξηση της θαλάσσιας στάθμης και η απώλεια μάζας των παγετώνων παγκοσμίως θα διαμορφώσουν σε μεγάλο βαθμό το τρόπο ζωής των μελλοντικών γενεών. Η ανθρώπινη δραστηριότητα της μεταφοράς αγαθών συμβάλλει σημαντικά στην αύξηση της θερμοκρασίας σε παγκόσμια κλίμακα μέσω της εκπομπής αερίων του θερμοκηπίου από μέσα μεταφοράς όπως τα αεροπλάνα, τα πλοία και τα φορτηγά. Σε μια προσπάθεια αντιμετώπισης του εν λόγω φαινομένου, ο Διεθνής ΟργανισμόςΝαυτιλίαςδημιούργησεμιασειράαπόνομοθετικέςρυθμίσειςσχετικάμεταετήσιαεπιτρεπόμενα επίπεδα εκπομπής αερίων του θερμοκηπίου από καράβια, εισάγοντας ποσότητεςπουεπιβλέπουντηνλειτουργίατουστόλουόπωςοδείκτηςέντασηςάνθρακα. Ηπαρούσαδιπλωματικήεργασίαπροσπαθείναεξερευνήσειτοπρόβληματηςδιαχείρισηςενόςναυτιλιακού στόλου, εστιάζοντας στην ελαχιστοποίηση των συνολικών εκπομπών ρύπων κατά την εξυπηρέτηση συμβολαίων μεταφοράς φορτίου. Το συγκεκριμένο πρόβλημα μπορεί να θεμελιωθεί μαθηματικά ως ένα πρόβλημα συνδυαστικής βελτιστοποίησης κατά το οποίο προσπαθούμε να προσδιορίσουμε μια βέλτιστη απεικόνιση μεταξύ διαθέσιμων συμβολαίων μεταφοράς φορτίου και καραβιών στόλου που λειτουργούν σε συγκεκριμένες στάθμες ταχυτήτων. Αυτή η απεικόνιση δημιουργείται με στόχο να ελαχιστοποιήσει το συνολικό κόστος που προκύπτει όταν οι παραγόμενες εκπομπές ρύπων ξεπερνούν τα επιτρεπτά όρια του δείκτη έντασης άνθρακα. Στόχος μας είναι να δημιουργήσουμε ένα ναυτοματοποιημένο μηχανισμό που θα μαθαίνει σταδιακά μια αποτελεσματική στρατηγική σχετικά με την εν λόγω αντιστοίχηση και ο οποίος θα αποτελείται από εργαλεία ενός κλάδου της τεχνητής νοημοσύνης που ονομάζεται βαθιά μάθηση με επιβράβευση. Αυτόςοαυτοματοποιημένοςμηχανισμόςπουονομάζεταιαλλιώςκαιπράκτορας,είναιουσιαστικά ένα βαθύ νευρωνικό δίκτυο. Οι τιμές των παραμέτρων αυτού του νευρωνικού δικτύου σχηματοποιούν τη στρατηγική λήψης αποφάσεων ή αλλιώς τακτική του πράκτορα. Ο πράκτορας συμμετέχει σε πολλαπλές προσομοιώσεις που λαμβάνουν χώρα σε ένα τεχνητό περιβάλλον με λειτουργικά χαρακτηριστικά που μοιάζουν με την πραγματική ναυτιλιακή βιομηχανία. Κάθε προσομοίωση έχει διάρκεια ενός έτους και για κάθε μέρα του χρόνου, ο πράκτορας είναι υπεύθυνος να λαμβάνει αποφάσεις σχετικές με την λειτουργία του στόλου. Κάθε απόφαση του πράκτορα αξιολογείται με βάση την κατάληξη της από ένα αντίστοιχο σήμα επιβράβευσης ή ποινής. Αυτή η αξιολόγηση επαναπροωθείται στο πράκτορα με τη μορφή ενός σήματος κόστους μέσω του οποίου ενημερώνονται κατάλληλα οι παράμετροι του νευρωνικού δικτύου του πράκτορα. Αυτή η διαδικασία ενισχύει τη γνώση του πράκτορα σχετικά με τις διάφορες καταστάσεις στις οποίες μπορεί να επέλθει το περιβάλλον. Ουσιαστικά, έχοντας συμμετάσχει σε μια πληθώρα διαφορετικών προσομοιώσεων, θέλουμε ο πράκτορας να μπορεί να διαμορφώσει μια αποτελεσματική στρατηγική αναφορικά με τη διαχείριση του στόλου, με σκοπό να ελαχιστοποιήσει τις περιβαλλοντικά επιβλαβείς εκπομπές ρύπων

Λέξη κλειδί :	Συνδυαστική βελτιστοποίηση Δείκτης έντασης διοξειδίου Μάθηση με επιβράβευση Combinatorial optimization Carbon intensity indicator Reinforcement learning

Διαθέσιμο από :	2022-01-29 13:22:01

Ημερομηνία έκδοσης :	12/03/2021

Ημερομηνία κατάθεσης :	2022-01-29 13:22:01

Δικαιώματα χρήσης :	Free access

Άδεια χρήσης :

Αρχείο: Pappas_2021.pdf

Τύπος: application/pdf

Pappas_2021.zip

Είσοδος