PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Data augmentation techniques for legal text analytics
Alternative Title :Τεχνικές αύξησης δεδομένων σε νομικά κείμενα
Creator :Papadaki, Maria
Contributor :Androutsopoulos, Ion (Επιβλέπων καθηγητής)
Vassalos, Vasilios (Εξεταστής)
Titsias, Mixail (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Type :Text
Extent :33 p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=5324
Abstract :This master thesis involves the implementation and evaluation of the domain-agnostic data augmentation techniques that operate in the input feature space. More concretely, in the context of contract element extraction (Chalkidis et al., 2017a, 2017b), this thesis explores the effectiveness of three domain-agnostic data augmentation methods, namely: adding Gaussian noise, applying interpolation or extrapolation at the word representation level (word embeddings).
Αυτή η μεταπτυχιακή εργασία περιλαμβάνει την εφαρμογή και αξιολόγηση των τεχνικών αύξησης δεδομένων που λειτουργούν στο χώρο που δημιουργείται από τα διανύσματα εισόδου. Πιο συγκεκριμένα, στα πλαίσια της εξόρυξης στοιχείων από νομικά συμβόλαια (Chalkidis et al., 2017a, 2017b), αυτή η εργασία εξετάζει την αποτελεσματικότητα τριών μεθόδων αύξησης δεδομένων, δηλαδή: της προσθήκης Gaussian θορύβου και της εφαρμογής interpolation ή extrapolation στο επίπεδο των word embeddings.
Subject :Data augmentation
Legal texts
Αύξηση δεδομένων
Νομικά κείμενα
Date Available :2017-12-19 14:58:25
Date Issued :2017
Date Submitted :2017-12-19 14:58:25
Access Rights :Free access
Licence :

File: Papadaki_2017.pdf

Type: application/pdf