Μεταπτυχιακές Εργασίες
Μόνιμο URI για αυτήν τη συλλογήhttps://pyxida.aueb.gr/handle/123456789/7
Περιήγηση
Πλοήγηση Μεταπτυχιακές Εργασίες ανά Συγγραφέα "Antoniozas, Panagiotis"
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Τώρα δείχνει 1 - 1 από 1
- Αποτελέσματα ανά σελίδα
- Επιλογές ταξινόμησης
Τεκμήριο Key information retrieval and borderless table location in scanned legal documents(13-03-2024) Αντώνιοζας, Παναγιώτης; Antoniozas, Panagiotis; Athens University of Economics and Business, Department of Informatics; Malakasiotis, Prodromos; Vassalos, Vasilios; Androutsopoulos, IonΗ σημασία της ανάκτησης σημαντικών στοιχείων (key information retrieval) και ο εντοπισμός αντικειμένων (object detection) σε νομικά έγγραφα αυξάνεται με την πάροδο των χρόνων, καθώς τα μοντέλα τεχνητής νοημοσύνης (AI) γίνονται ολοένα και πιο ικανά να λύσουν τέτοιου είδους προβλήματα. Μπορεί ο εντοπισμός αντικειμένων και η ανάκτηση σημαντικών στοιχείων να είναι δυο διαδικασίες που μοιάζουν μεταξύ τους, αλλά η τελευταία περιλαμβάνει μια πιο περιεκτική ανάλυση του περιεχομένου και της δομής των εγγράφων, περνώντας πέρα από τον απλό εντοπισμό αντικειμένων μέσα σε αυτά. Αυτή η εργασία επικεντρώνεται ειδικά στον συνδυασμό τεχνολογίας και νομικής επιστήμης, με στόχο να εξετάσει πώς η βαθιά μάθηση (deep learning) μπορεί να επαναπροσδιορίσει τις σταθερές που υπάρχουν για χρόνια στην επεξεργασία νομικών εγγράφων. Επιπρόσθετα προτείνει ολοκληρωμένες μεθοδολογίες για την επίλυση τέτοιου είδους προβλημάτων εντοπισμού, ενώ παράλληλα παρέχει υπηρεσίες στην Cognitiv+. Η μελέτη αυτή διαιρείται σε δύο μέρη. Το πρώτο μέρος επικεντρώνεται στο πρόβλημα ανάκτησης σημαντικών στοιχείων και έχει ως στόχο τον εντοπισμό δύο κρίσιμων στοιχείων που υπάρχουν στα τιμολόγια: την ημερομηνία έκδοσης και το συνολικό ποσό ενός τιμολογίου. Για τον σκοπό αυτό χρησιμοποιούνται δύο διαφορετικές προσεγγίσεις. Η πρώτη χρησιμοποιεί τελευταίας τεχνολογίας έτοιμα προς χρήση μοντέλα ερωταπαντήσεων όπως το GPT-4 Vision, το IDEFICS, καθώς και το μικρότερο Layoutlm-invoices, μια παραλλαγή του γνωστού LayoutLM απο την Impira. Η δεύτερη προσέγγιση περιλαμβάνει την επισημείωση (annotation) των τιμολογίων και την εκπαίδευση της πιο πρόσφατης έκδοσης του μοντέλου LayoutLM-base για κατηγοριοποίηση ακολουθιών (sequence classification). Το δεύτερο μέρος της έρευνας εστιάζει στον εντοπισμό αντικειμένων και πιο συγκεκριμένα τον εντοπισμό πινάκων χωρίς όρια (borderless tables) που είναι μια συνήθης μορφή σε οικονομικούς απολογισμούς. Επίσης προαιρετικός στόχος αποτελεί και η εξαγωγή των δεδομένων και της δομής από αυτούς τους πίνακες. Για την επίλυση αυτού του προβλήματος, ακολουθούνται δύο διαφορετικές προσεγγίσεις. Η πρώτη χρησιμοποιεί παραλλαγές από γνωστά για την αποτελεσματικότητα τους έτοιμα προς χρήση μοντέλα ανίχνευσης αντικειμένων (object detection models), που είναι ήδη εκπαιδευμένα σε δεδομένα σχετικά παρόμοια με αυτά που έχουμε στην διάθεση μας, όπως το DETR και το YOLOv8. H δεύτερη προσέγγιση περιλαμβάνει την εκπαίδευση ενός μοντέλου YOLOv8 μετά από την διαδικασία επισημείωσης των δεδομένων. Το πιο αποτελεσματικό μοντέλο από τα παραπάνω θα χρησιμοποιηθεί στη συνέχεια για την εξαγωγή πινάκων από τα σαρωμένα αρχεία (scanned documents), τροφοδοτώντας τους εντοπισμένους πίνακες στην Img2Table, που είναι μια βιβλιοθήκη της Python η οποία μπορεί να εξάγει την δομή και την πληροφορία των πινάκων στην επιθυμητή μορφή. Γενικότερα, αυτή η εργασία παρέχει λεπτομερείς πληροφορίες για τα δεδομένα, τη μεθοδολογία που ακολουθήθηκε, τα βήματα επισημείωσης των δεδομένων και τα αποτελέσματα κάθε μοντέλου, μαζί με πιθανούς λόγους επιτυχίας ή αποτυχίας τους. Τέλος, προτάσσονται επιπλέον πιθανές βελτιώσεις ή εναλλακτικές μέθοδοι που μπορούσαν να εξεταστούν.