Λογότυπο αποθετηρίου
 

Improvements to the Online Cost-aware Teacher-Student (OCaTS) framework

dc.aueb.departmentDepartment of Informatics
dc.aueb.programMSc in Computer Science
dc.contributor.opponentToumpis, Stavrosen
dc.contributor.opponentStamoulis, Georgiosen
dc.contributor.thesisadvisorAndroutsopoulos, Ionen
dc.creatorΝτανάς, Κωνσταντίνοςel
dc.creatorNtanas, Konstantinosen
dc.date.accessioned2025-07-30T16:01:34Z
dc.date.available2025-07-30T16:01:34Z
dc.date.issued2025-06-18
dc.description.abstractΟι ραγδαίες εξελίξεις στην Επεξεργασία Φυσικής Γλώσσας (Natural Language Processing - NLP) έχουν οδηγήσει στη δημιουργία ισχυρών Μεγάλων Γλωσσικών Μοντέλων (Large Language Models - LLMs). Ωστόσο, η χρήση τους από μικρές και μεσαίες επιχειρήσεις παραμένει περιορισμένη λόγω του υψηλού λειτουργικού κόστους που σχετίζεται με τις συχνές κλήσεις. Για την αντιμετώπιση του προβλήματος, αναπτύχθηκε το εργαλείο OCaTS (Cost-Aware Teacher-Student), το οποίο αξιοποιεί ένα μοντέλο-μαθητή ώστε να μειώσει την εξάρτηση από δαπανηρές ερωτήσεις προς τα LLMs. Το αρχικό μοντέλο όμως είχε περιορισμούς: βασιζόταν σε έναν μόνο δάσκαλο και απαιτούσε προκαθορισμένες τιμές κόστους. Η βελτιωμένη εκδοχή του OCaTS εισάγει μια ιεραρχική αρχιτεκτονική με πολλαπλούς δασκάλους. Τα ερωτήματα προωθούνται, ανάλογα με την πολυπλοκότητά τους, σε διαφορετικά μοντέλα-δασκάλους, επιτυγχάνοντας καλύτερη ισορροπία μεταξύ κόστους και απόδοσης. Το σύστημα επεκτείνει τη μετρική της μειωμένης ακρίβειας (discounted accuracy) ώστε να υποστηρίζει πολλαπλούς δασκάλους και εισάγει δύο νέες μετρικές: Mass και Area, οι οποίες λειτουργούν χωρίς προκαθορισμένες τιμές κόστους. Η νέα προσέγγιση μειώνει αισθητά τα λειτουργικά έξοδα, διατηρώντας υψηλή απόδοση στα καθήκοντα. Καθιστά έτσι τις λύσεις που βασίζονται σε LLMs πιο προσιτές και βιώσιμες για τις μικρές και μεσαίες επιχειρήσεις, διευκολύνοντας την υιοθέτηση προηγμένων τεχνολογιών γλώσσας σε πρακτικά περιβάλλοντα.el
dc.description.abstractRapid advancements in Natural Language Processing (NLP) have enabled the creation of powerful Large Language Models (LLMs), but their adoption by small and medium-sized enterprises (SMEs) remains limited due to the high operational costs associated with frequent inference calls. To mitigate this, the Cost-Aware Teacher-Student (OCaTS) framework was introduced, using a student model to reduce reliance on expensive LLM queries. However, it was constrained by a single-teacher setup and required prior knowledge of cost parameters. An improved version of OCaTS introduces a multi-teacher hierarchical architecture, where queries are escalated based on complexity to different teacher models, optimizing the trade-off between cost and performance. The framework extends the discounted accuracy metric to support multiple teachers and proposes two new evaluation metrics, Mass and Area, that work without needing predefined cost values. Validated through extensive testing with both known and unknown cost settings, the enhanced framework significantly reduces operational costs while maintaining strong task performance, making LLM-based solutions more practical for SMEs.en
dc.embargo.ruleOpen access
dc.format.extentpages 74el
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/12076
dc.identifier.urihttps://doi.org/10.26219/heal.aueb.9363
dc.languageen
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectNatural Language Processing (NLP)en
dc.subjectLarge Language Models (LLMs)en
dc.subjectKnowledge distillationen
dc.subjectΕπεξεργασία φυσικής γλώσσαςel
dc.subjectΜεγάλα γλωσσικά μοντέλαel
dc.subjectΜεταφορά γνώσηςel
dc.titleImprovements to the Online Cost-aware Teacher-Student (OCaTS) frameworken
dc.title.alternativeΒελτιώσεις στο πλαίσιο εκπαιδευτή-μαθητή με επίγνωση κόστους σε πραγματικό χρόνο (OCaTS)el
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Ntanas_2025.pdf
Μέγεθος:
15.45 MB
Μορφότυπο:
Adobe Portable Document Format