Συλλογές
Τίτλος Toxicity detection: reading between the lines
Εναλλακτικός τίτλος Ανίχνευση τοξικότητας: διαβάζοντας ανάμεσα από τις γραμμές
Δημιουργός Γλυνάτση, Κατερίνα, Glynatsi, Katerina
Συντελεστής Athens University of Economics and Business, Department of Informatics
Λουρίδας, Παναγιώτης
Ανδρουτσόπουλος, Ίων
Παυλόπουλος, Ιωάννης
Τύπος Text
Φυσική περιγραφή 54p.
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=8186
Περίληψη For the past few years, online speech is gradually being dominated by offensive language. One form of offensiveness is the use of toxicity. Toxic speech causes harm to individuals and groups of people. To understand, detect and battle toxicity, first, it needs to be understood and defined. The definition and detection of toxicity occupy a great part of this paper. Detecting machines (Perspective & Bert) have been suggested through machine learning, with promising results. Their success rate lies mostly with the detection of toxicity which is deemed as superficial. Negative results appear when toxicity stops being obvious. The many practices of human language can not easily be picked up by AI. Hence, the need for this research was born. The thesis revolves around the location of “deep toxicity”. Three main questions are set to unravel the contents of deep, hidden toxicity:: i) Can toxicity be categorized with strict definitions? ii) Can toxicity be detected when taken out of context or is it bound to its surrounding content? iii) Is there a catholic agreement on what can be identified as superficial or as deep toxicity? The toxicity detection field is fairly new and each published research is considered to be a breakthrough. All results are taken into consideration when one is performing experiments and the findings can be used to support new papers in progress. This paper suggests new ways to dichotomized toxicity, factors to consider when creating an AI system for toxicity detection, and a controversial truth.
Τα τελευταία χρόνια, ο ηλεκτρονικός λόγος κυριαρχείται σταδιακά από την προσβλητική γλώσσα. Μια μορφή προσβλητικότητας είναι η χρήση της τοξικότητας. Ο τοξικός λόγος προκαλεί βλάβη σε άτομα και ομάδες ατόμων. Για την κατανόηση, ανίχνευση και καταπολέμηση της τοξικότητας, πρώτα πρέπει να γίνει να κατανοηθεί και να οριστεί. Ο ορισμός και η ανίχνευση της τοξικότητας απασχολούν ένα μεγάλος μέλος της εργασίας. Μηχανήματα για την ανίχνευση τοξικότητας (Perspective & Bert) έχουν προταθεί μέσω της μηχανικής μάθησης με υποσχόμενα αποτελέσματα. Η επιτυχία τους έγκειται περισσότερο με την ανίχνευση τοξικότητας, η οποία έχει θεωρηθεί ως επιφανειακή. Αρνητικά αποτελέσματα εμφανίζονται όταν η τοξικότητα παύει να είναι φανερή. Τεχνητή νοημοσύνη δεν μπορεί εύκολα να συλλάβει πολλές πρακτικές της ανθρώπινης γλώσσας. Επομένως, η ανάγκη για αυτήν την έρευνα γεννήθηκε.Η διπλωματική περιβάλλεται γύρω από την ανίχνευση της «κρυμμένης τοξικότητας». Τρία βασικά ερωτήματα προσλαμβάνονται για την αποκάλυψη των περιεχομένων της κρυμμένης τοξικότητας: i) Μπορεί η τοξικότητα να κατηγοριοποιηθεί με αυστηρούς όρους; ii) Μπορεί η τοξικότητα να ανιχνευτεί όταν έχει απομονωθεί από το περιεχόμενο της, ή είναι αιχμάλωτη του περιεχομένου που την περιβάλλει; iii) Υπάρχει μια καθολική συμφωνία σχετικά με το τι μπορεί να κατηγοριοποιηθεί ως επιφανειακά τοξικό ή κρυφά τοξικό;Το πεδίο της ανίχνευσης τοξικότητας είναι νέο και κάθε νέο-δημοσιευμένη έρευνα θεωρείται ρηξικέλευθη. Όλα τα αποτελέσματα λαμβάνονται υπόψη όταν ένας/μια πραγματοποιεί πειράματα και τα ευρήματα μπορούν να χρησιμοποιηθούν για να υποστηριχθούν νέες εν πρόοδο εργασίες. Αυτή η εργασία προτείνει νέους τρόπους κατηγοριοποίησης της τοξικότητας, παράγοντες που πρέπει να θεωρηθούν στην δημιουργία συστημάτων τεχνητής νοημοσύνης για την ανίχνευση τοξικότητας και μια αμφιλεγόμενη αλήθεια.
Λέξη κλειδί Objective toxicity
Subjective toxicity
Κατηγοριοποίηση τοξικότητας
Λεκτικό περιεχόμενο
Υποκειμενική τοξικότητα
Αντικειμενική τοξικότητα
Τοξικά σπάνς
Ανίχνευση τοξικότητας
Toxic spans
Toxicity detection
Context
Toxicity categorization
Ημερομηνία έκδοσης 30-11-2020
Ημερομηνία κατάθεσης 14-12-2020
Ημερομηνία αποδοχής 14-12-2020
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/