Λογότυπο αποθετηρίου
 

Retrieval augmented generation on regulatory documents

dc.aueb.departmentDepartment of Informatics
dc.contributor.thesisadvisorAndroutsopoulos, Ionen
dc.contributor.thesisadvisorChlapanis, Odysseasen
dc.creatorChasandras, Ioannisen
dc.creatorΧασάνδρας, Ιωάννηςel
dc.date.accessioned2025-11-19T12:46:58Z
dc.date.available2025-11-19T12:46:58Z
dc.date.issued2025-06-20
dc.description.abstractThis thesis investigates the application of Retrieval Augmented Generation (RAG) in regulatory procedures through the emerging field of Regulatory NLP. Based on real-world regulatory documents, the study evaluates the performance of commercial retrieval models and introduces advanced, hybrid retrieval techniques tailored for legal compliance tasks. Given the critical need for precision and completeness in the legal domain, new algorithms that utilize Large Language Models (LLMs) are developed to enhance regulatory question-answering. The work also includes an adversarial evaluation of RePASs, a metric focused on legal obligations. Through participation in the RIRAG-2025 shared task, the thesis demonstrates both the promise and current limitations of AI systems in regulatory settings, emphasizing the need for further exploration in this field.en
dc.description.abstractΗ παρούσα πτυχιαϰή εργασία εξερευνά την εφαρμογή της τεχνολογίας Retrieval Augmented Generation (RAG) σε διαδιϰασίες που αφορούν ϰανονισμούς στο ανερχόμενο πεδίο της Επεξεργασίας Φυσιϰής Γλώσσας για Ρυϑμιστιϰά ϰείμενα (Regulatory NLP). Βασιζόμενη σε πραγματιϰά έγγραφα ϰανονισμών, η μελέτη αυτή αξιολογεί την επίδοση εμποριϰών μοντέλων ανάϰτησης πληροφοριών ϰαι εισάγει προηγμένες, υβριδιϰές τεχνιϰές ανάϰτησης πληροφοριών ειδιϰά προσαρμοσμένες για εργασίες νομιϰής συμμόρφωσης. ∆εδομένης της ϰρίσιμης ανάγϰης για αϰρίβεια ϰαι πληρότητα στο νομιϰό πεδίο, νέοι αλγόριϑμοι αναπτύχϑηϰαν οι οποίοι αξιοποιούν μεγάλα γλωσσιϰά μοντέλα (LLMs) για την ενίσχυση των απαντήσεων σε ρυϑμιστιϰές ερωτήσεις. Η εργασία περιλαμβάνει την αξιολόγηση του RePASs, μίας μετριϰής που επιϰεντρώνεται σε νομιϰές υποχρεώσεις. Μέσω της συμμετοχής στον σχετιϰό διεϑνή διαγωνισμό RIRAG 2025, η συγϰεϰριμένη πτυχιαϰή εργασία αναδειϰνύει τόσο τις υποσχέσεις όσο ϰαι τους περιορισμούς των συστημάτων Τεχνητής Νοημοσύνης σε ρυϑμιστιϰά περιβάλλοντα, τονίζοντας την ανάγϰη για περαιτέρω έρευνα στο εν λόγω πεδίο.el
dc.embargo.ruleOpen access
dc.format.extentpages 55en
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/12292
dc.identifier.urihttps://doi.org/10.26219/heal.aueb.9496
dc.languageen
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectRetrieval Augmented Generation (RAG)en
dc.subjectNatural Language Processing (NLP)en
dc.subjectLarge Language Models (LLMs)en
dc.subjectRegulatory documentsen
dc.subjectArtificial Intelligence (AI)en
dc.subjectΜεγάλα γλωσσικά μοντέλαel
dc.subjectΕπεξεργασία φυσικής γλώσσαςel
dc.subjectΝομικά κείμεναel
dc.subjectΑνάκτηση πληροφοριώνel
dc.subjectΤεχνητή Νοημοσύνη (ΤΝ)el
dc.titleRetrieval augmented generation on regulatory documentsen
dc.title.alternativeRetrieval Augmented Generation on Regulatory Documentsen
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Δεν υπάρχει διαθέσιμη μικρογραφία
Ονομα:
Chasandras_2025.pdf
Μέγεθος:
1 MB
Μορφότυπο:
Adobe Portable Document Format