Λογότυπο αποθετηρίου
 

Automatic speech recognition for Greek medical dictation

dc.aueb.departmentDepartment of Informatics
dc.contributor.opponentStafylakis, Themosen
dc.contributor.thesisadvisorStafylakis, Themosen
dc.creatorGeorgilas, Vardisen
dc.creatorΓεωργίλας, Βαρδήςel
dc.date.accessioned2025-09-08T12:10:38Z
dc.date.available2025-09-08T12:10:38Z
dc.date.issued2025-09-05
dc.description.abstractΗ ιατριϰή υπαγόρευση αποτελεί µια πραϰτιϰή λύση που βοηθά τους επαγγελµατίες υγείας να µειώσουν τον χρόνο ϰαι την προσπάθεια που απαιτεί η γραπτή τεϰµηρίωση. Η παρούσα πτυχιαϰή εργασία έχει ως αντιϰείµενο την ϰατασϰευή ενός συστήµατος για την αυτοµατη µετατροπή ελληνιϰής ιατριϰής οµιλίας σε ϰείµενο. Υλοποιήθηϰε ένα σύστηµα που συνδυάζει τεχνιϰές αυτόµατης αναγνώρισης οµιλίας µε µοντέλα γλωσσιϰής αξιολόγησης για βελτίωση της αϰρίβειας. Με αυτόν τον τρόπο, το σύστηµα διαχειρίζεται αποτελεσµατιϰότερα την εξειδιϰευµένη ιατριϰή ορολογία ϰαι τις γλωσσιϰές ιδιαιτερότητες της ελληνιϰής γλώσσας, αντιµετωπίζοντας προβλήµατα που προϰύπτουν από την πολυπλοϰότητα της ορολογίας ϰαι τη µεταβλητότητα της προφοριϰής οµιλίας. Για την αυτόµατη αναγνώριση οµιλίας χρησιµοποιήθηϰε το µοντέλο Whisper, το οποίο εϰπαιδεύτηϰε περαιτέρω σε ελληνιϰά δεδοµένα ώστε να προσαρµοστεί ϰαλύτερα στις ανάγϰες του συγϰεϰριµένου τοµέα. Επιπλέον, αξιοποιήθηϰε ένα ειδιϰά προσαρµοσµένο ελληνιϰό GPT-2 µοντέλο, το οποίο λειτουργεί ως εργαλείο γλωσσιϰής αξιολόγησης, επιλέγοντας την ϰαταλληλότερη πρόταση ανάµεσα σε πολλαπλές πιθανές µεταγραφές που παράγονται από το Whisper. Η ενσωµάτωση της αϰουστιϰής ϰαι γλωσσιϰής πληροφορίας συµβάλλει σηµαντιϰά στην αύξηση της αϰρίβειας ϰαι της φυσιϰότητας των τελιϰών ϰειµένων. Με αυτή την προσέγγιση, το σύστηµα στοχεύει στη δηµιουργία αξιόπιστων ϰαι ϰατανοητών µεταγραφών, προσφέροντας ένα χρήσιµο εργαλείο για την υποστήριξη της ϰαθηµερινής εργασίας στον τοµέα της υγείας.el
dc.description.abstractMedical dictation systems are essential tools in modern healthcare, enabling accurate and efficient conversion of speech into written medical documentation. The main objective of this thesis is to create a domain-specific system for Greek medical speech transcriptions. The ultimate goal is to assist healthcare professionals by reducing the overload of manual documentation and improving workflow efficiency. Towards this goal, we develop a system that combines automatic speech recognition techniques with text correction models, allowing better handling of domain-specific terminology and linguistic variations in Greek. Our approach leverages both acoustic and textual modeling to create more realistic and reliable transcriptions. We focused on adapting existing language and speech technologies to the Greek medical context, addressing challenges such as complex medical terminology and linguistic inconsistencies. Through domain-specific fine-tuning, our system achieves more accurate and coherent transcriptions, contributing to the development of practical language technologies for the Greek healthcare sector.en
dc.embargo.ruleOpen access
dc.format.extentpages 41en
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/12125
dc.identifier.urihttps://doi.org/10.26219/heal.aueb.9390
dc.languageen
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectMedical dictationen
dc.subjectWhisperen
dc.subjectGreek GPT2en
dc.subjectAutomatic Speech Recognition (ASR)en
dc.subjectΙατρική υπαγόρευσηel
dc.subjectΑυτόματη αναγνώριση ομιλίαςel
dc.subjectΙατρική ορολογίαel
dc.subjectΓλωσσική αξιολόγησηel
dc.titleAutomatic speech recognition for Greek medical dictationel
dc.title.alternativeΑυτόματη αναγνώριση ομιλίας για ελληνική ιατρική υπαγόρευσηen
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Georgilas_2025.pdf
Μέγεθος:
3.11 MB
Μορφότυπο:
Adobe Portable Document Format