Συλλογές
Τίτλος Computational analysis of Greek Parliamentary Minutes of the period 1946-1947
Εναλλακτικός τίτλος Υπολογιστική ανάλυση των Πρακτικών του Ελληνικού Κοινοβουλίου της περιόδου 1946-1947
Δημιουργός Μπαρμπούνης, Επαμεινώνδας-Κωνσταντίνος, Barmpounis, Epameinondas-Konstantinos
Συντελεστής Athens University of Economics and Business, Department of Informatics
Louridas, Panagiotis
Androutsopoulos, Ion
Pavlopoulos, Ioannis
Τύπος Text
Φυσική περιγραφή 43p.
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=10013
Περίληψη The purpose of this postgraduate work is to study the correspondence of the MPs of the Hellenic Parliament in the words of the Rhetoricians in the Greek Parliament during the years 1946 and 1947. The contributions of this work are threefold. The first objective regards the creation of a machine-readable corpus of texts, made up of the Minutes themselves. The second objective refers to the recording of the orators' names who, with their words and the issues they approached, caused the acceptance of the House. The third and final objective is the recording of the very issues that seem to be accepted (usually with enthusiasm), by the MPs. In a period as tense and unstable as that of the first post-war years, the integration of these issues into the historical time approached, helps in the broader understanding of the society of the period. Then, the names of the MPs can potentially help us understand the views of the various parties of the period. For the first goal, Parliament’s Minutes were used in PDF format, which were massively scraped from the Internet using a simple program. OCR was used to obtain the text. Natural Language Processing (NLP) techniques were used for the second and third goals.
Σκοπός της παρούσας μεταπτυχιακής εργασίας είναι να μελετηθεί η αποδοχή του κοινού της Βουλής των Ελλήνων στα λεχθέντα των από του βουλευτικού βήματος ρητόρων κατά τη διάρκεια των ετών 1946 και 1947. Οι στόχοι είναι πολλαπλοί. Αρχικά επιδιώκεται η δημιουργία ενός μηχαναγνώσιμου corpus κειμένων που θα αποτελείται από τα ίδια τα πρακτικά. Δεύτερον η καταγραφή των ονομάτων των ρητόρων που με τα λόγια τους και με τα θέματα που προσέγγισαν προκάλεσαν την αποδοχή της Βουλής. Τελικά η καταγραφή των ίδιων των θεμάτων που φαίνεται να αποδέχεται (συνήθως με ενθουσιασμό), το κοινό. Σε μια τόσο τεταμένη και ασταθή περίοδο όσο αυτή των πρώτων μεταπολεμικών χρόνων, η ένταξη των θεμάτων αυτών στον ιστορικό χρόνο που προσεγγίζεται, βοηθά στην ευρύτερη κατανόηση της κοινωνίας της περιόδου. Ύστερα τα ονόματα των βουλευτών βοηθούν στην κατανόηση των θέσεων των διάφορων κομμάτων της περιόδου. Για τον πρώτο στόχο χρησιμοποιήθηκαν πρακτικά της Βουλής που υπάρχουν στο διαδίκτυο σε μορφή PDF, και τα οποία μεταφορτώθηκαν μαζικά από την ιστοσελίδα της Βιβλιοθήκης της Βουλής με χρήση κώδικα (scraper). Σε αυτά εφαρμόστηκε OCR για την εξαγωγή του κειμένου. Για τον δεύτερο και τον τρίτο στόχο αξιοποιήθηκαν τεχνικές Επεξεργασίας Φυσικής Γλώσσας.
Λέξη κλειδί Αναγνώριση χειρόγραφου κειμένου
Πρακτικά Ελληνικού Κοινοβουλίου
Οπτική αναγνώριση χαρακτήρων
Επεξεργασία φυσικής γλώσσας
Γλωσσική τεχνολογία
Natural Language Processing (NLP)
Hellenic Parliament Minutes
Optical Character Recognition (OCR)
Handwritten Text Recognition (HTR)
Language technology
Διαθέσιμο από 2023-02-05 21:10:35
Ημερομηνία έκδοσης 13-12-2022
Ημερομηνία κατάθεσης 2023-02-05 21:10:35
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/