Improvements to the Online Cost-aware Teacher-Student (OCaTS) framework
dc.aueb.department | Department of Informatics | |
dc.aueb.program | MSc in Computer Science | |
dc.contributor.opponent | Toumpis, Stavros | en |
dc.contributor.opponent | Stamoulis, Georgios | en |
dc.contributor.thesisadvisor | Androutsopoulos, Ion | en |
dc.creator | Ντανάς, Κωνσταντίνος | el |
dc.creator | Ntanas, Konstantinos | en |
dc.date.accessioned | 2025-07-30T16:01:34Z | |
dc.date.available | 2025-07-30T16:01:34Z | |
dc.date.issued | 2025-06-18 | |
dc.description.abstract | Οι ραγδαίες εξελίξεις στην Επεξεργασία Φυσικής Γλώσσας (Natural Language Processing - NLP) έχουν οδηγήσει στη δημιουργία ισχυρών Μεγάλων Γλωσσικών Μοντέλων (Large Language Models - LLMs). Ωστόσο, η χρήση τους από μικρές και μεσαίες επιχειρήσεις παραμένει περιορισμένη λόγω του υψηλού λειτουργικού κόστους που σχετίζεται με τις συχνές κλήσεις. Για την αντιμετώπιση του προβλήματος, αναπτύχθηκε το εργαλείο OCaTS (Cost-Aware Teacher-Student), το οποίο αξιοποιεί ένα μοντέλο-μαθητή ώστε να μειώσει την εξάρτηση από δαπανηρές ερωτήσεις προς τα LLMs. Το αρχικό μοντέλο όμως είχε περιορισμούς: βασιζόταν σε έναν μόνο δάσκαλο και απαιτούσε προκαθορισμένες τιμές κόστους. Η βελτιωμένη εκδοχή του OCaTS εισάγει μια ιεραρχική αρχιτεκτονική με πολλαπλούς δασκάλους. Τα ερωτήματα προωθούνται, ανάλογα με την πολυπλοκότητά τους, σε διαφορετικά μοντέλα-δασκάλους, επιτυγχάνοντας καλύτερη ισορροπία μεταξύ κόστους και απόδοσης. Το σύστημα επεκτείνει τη μετρική της μειωμένης ακρίβειας (discounted accuracy) ώστε να υποστηρίζει πολλαπλούς δασκάλους και εισάγει δύο νέες μετρικές: Mass και Area, οι οποίες λειτουργούν χωρίς προκαθορισμένες τιμές κόστους. Η νέα προσέγγιση μειώνει αισθητά τα λειτουργικά έξοδα, διατηρώντας υψηλή απόδοση στα καθήκοντα. Καθιστά έτσι τις λύσεις που βασίζονται σε LLMs πιο προσιτές και βιώσιμες για τις μικρές και μεσαίες επιχειρήσεις, διευκολύνοντας την υιοθέτηση προηγμένων τεχνολογιών γλώσσας σε πρακτικά περιβάλλοντα. | el |
dc.description.abstract | Rapid advancements in Natural Language Processing (NLP) have enabled the creation of powerful Large Language Models (LLMs), but their adoption by small and medium-sized enterprises (SMEs) remains limited due to the high operational costs associated with frequent inference calls. To mitigate this, the Cost-Aware Teacher-Student (OCaTS) framework was introduced, using a student model to reduce reliance on expensive LLM queries. However, it was constrained by a single-teacher setup and required prior knowledge of cost parameters. An improved version of OCaTS introduces a multi-teacher hierarchical architecture, where queries are escalated based on complexity to different teacher models, optimizing the trade-off between cost and performance. The framework extends the discounted accuracy metric to support multiple teachers and proposes two new evaluation metrics, Mass and Area, that work without needing predefined cost values. Validated through extensive testing with both known and unknown cost settings, the enhanced framework significantly reduces operational costs while maintaining strong task performance, making LLM-based solutions more practical for SMEs. | en |
dc.embargo.rule | Open access | |
dc.format.extent | pages 74 | el |
dc.identifier.uri | https://pyxida.aueb.gr/handle/123456789/12076 | |
dc.identifier.uri | https://doi.org/10.26219/heal.aueb.9363 | |
dc.language | en | |
dc.rights | Attribution 4.0 International | en |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Natural Language Processing (NLP) | en |
dc.subject | Large Language Models (LLMs) | en |
dc.subject | Knowledge distillation | en |
dc.subject | Επεξεργασία φυσικής γλώσσας | el |
dc.subject | Μεγάλα γλωσσικά μοντέλα | el |
dc.subject | Μεταφορά γνώσης | el |
dc.title | Improvements to the Online Cost-aware Teacher-Student (OCaTS) framework | en |
dc.title.alternative | Βελτιώσεις στο πλαίσιο εκπαιδευτή-μαθητή με επίγνωση κόστους σε πραγματικό χρόνο (OCaTS) | el |
dc.type | Text |
Αρχεία
Πρωτότυπος φάκελος/πακέτο
1 - 1 από 1