Λογότυπο αποθετηρίου
 

Ανάλυση μεθόδων βαθιάς μάθησης για την παραγωγή υψηλής ποιότητας αναπαραστάσεων λέξεων της ελληνικής γλώσσας

dc.contributor.degreegrantinginstitutionΟικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Λογιστικής και Χρηματοοικονομικήςel
dc.contributor.opponentΑνδρουτσόπουλος, Ίωνel
dc.contributor.opponentΓκρίτζαλης, Δημήτριοςel
dc.contributor.thesisadvisorΒαζιργιάννης, Μιχαήλel
dc.creatorΛιουδάκης, Μιχαήλel
dc.date.accessioned2019-09-23*
dc.date.available2025-03-26T19:51:36Z
dc.date.issued2019-08-02*
dc.date.issuedoriginal02-08-2019*
dc.date.submitted2019-09-23 10:53:06
dc.description.abstractΗ Επεξεργασία Φυσικής Γλώσσας (ΕΦΓ) είναι ένας πολύ ενεργός κλάδος έρευνας της Τεχνητής Νοημοσύνης, η οποία τα τελευταία χρόνια έχει εξελιχθεί παράλληλα με την ανάπτυξη των νευρωνικών δικτύων και της βαθιάς μάθησης. Πολλές εφαρμογές της ΕΦΓ χρειάζονται ενθέσεις λέξεων για να πετύχουν τα καλύτερα δυνατά αποτελέσματα. Ωστόσο παρά την τεράστια πρόοδο των ενθέσεων λέξεων για την Αγγλική γλώσσα, υπάρχουν μόνο λίγες δημοσιευμένες εργασίες για τις ενθέσεις λέξεων της Ελληνικής γλώσσας. Η παρούσα διπλωματική στοχεύει στην παραγωγή υψηλής ποιότητας αναπαραστάσεων λέξεων για την Ελληνική γλώσσα. Επιπρόσθετα, προτείνεται μια νέα μέθοδος για την παραγωγή ενθέσεων λέξεων. Η μέθοδος Continuous Bag-of-Skip-grams (CBOS) συνδυάζει τις δύο πιο δημοφιλείς προσεγγίσεις για την εκμάθηση αναπαράστασης λέξεων: Continuous Bag-of-Words (CBOW) και Skip-gram. Αυτές οι μέθοδοι μαζί με την position-dependent CBOW συγκρίνονται μέσω της μετρικής word analogy σε τρεις διαφορετικές πηγές δεδομένων: το κείμενο της Αγγλικής Wikipedia, το κείμενο της Ελληνικής Wikipedia, και το περιεχόμενο του Ελληνικού Παγκόσμιου Ιστού. Συγκρίνοντας αυτές τις μεθόδους μεταξύ διαφορετικών σετ δεδομένων, γίνεται φανερό πως η μέθοδος CBOS πετυχαίνει επίδοση τελευταίας τεχνολογίας.el
dc.description.abstractNatural Language Processing (NLP) is a very active research subfield of Artificial Intelligence, which the last few years has evolved along with the development of neural networks and deep learning. Many NLP applications need word representations in order to achieve the best possible results. Even though there is continuous progress on word embeddings for the English language, there are only a few published works for Greek language word embeddings. The present aims to produce high-quality word representations for the Greek language. Furthermore, a new method for producing word embeddings is proposed. The Continuous Bag-of-Skip-grams (CBOS) method combines the two most popular approaches for learning word representations: Continuous Bag-of-Words (CBOW) and Continuous Skip-gram. These methods in addition to position-dependent CBOW, are compared through word analogy task on three different sources of data: English Wikipedia corpus, Greek Wikipedia corpus, and Greek Web Content corpus. By comparing these methods across different datasets, it is evident that the CBOS method achieves state-of-the-art performance.en
dc.embargo.expire2019-09-23 10:53:06
dc.embargo.ruleOpen access
dc.format.extent42σ.
dc.identifierhttp://www.pyxida.aueb.gr/index.php?op=view_object&object_id=7314
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/8709
dc.identifier.urihttps://doi.org/10.26219/heal.aueb.4554
dc.languageel
dc.rightsCC BY: Attribution alone 4.0
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectΑναπαραστάσεις λέξεωνel
dc.subjectΕπεξεργασία φυσικής γλώσσαςel
dc.subjectΒαθιά μάθησηel
dc.subjectΤεχνητή νοημοσύνηel
dc.subjectWord representationsen
dc.subjectNatural Language Processing (NLP)en
dc.subjectDeep learningen
dc.subjectContinuous Bag-of-Wordsen
dc.subjectContinuous Skip-gramen
dc.subjectArtificial Intelligence (AI)en
dc.titleΑνάλυση μεθόδων βαθιάς μάθησης για την παραγωγή υψηλής ποιότητας αναπαραστάσεων λέξεων της ελληνικής γλώσσαςel
dc.title.alternativeDeep learning methods analysis for producing high-quality word representations for the Greek languageen
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Lioudakis_2019.pdf
Μέγεθος:
1.27 MB
Μορφότυπο:
Adobe Portable Document Format