Abstract : | ΄Ενα από τα σημαντικότερα ζητήματα στη μουσική βιομηχανία είναι η σωστη διαχείριση διενέξεων για θέματα πνευματικών δικαιωμάτων. Η λανθασμένη συσχέτιση των τραγουδιών με μουσικές συνθέσεις αποτελεί αποτελεί ένα διαχρονικό πρόβλημα της μουσικής βιομηχανίας. Τόσο οι ηχογραφήσεις όσο και άλλοι παράγοντες της μουσικής βιομηχανίας μπορούν να αναπαρασταθούν ως ένας γράφος συσχέτισης μεγάλης κλίμακας. Με βάση αυτόν, αυτή η διπλωματική εργασία επικεντρώνεται στην πρόβλεψη των κόμβων-ηχογραφήσεων οι οποίοι θα γίνουν αντικείμενα τέτοιων διενέξεων, με βάση μόνο κάποια δομικά χαρακτηριστικά του γράφου. Μέθοδοι βαθειάς μάθησης με χρήση γράφων χρησιμοποιούνται στην προσέγγιση του προβλήματος, σε τρία επίπεδα πολυπλοκότητας, με το κάθε ένα να χρειάζεται περισσότερους υπολογιστικούς πόρους από το προηγούμενο. Για τα πρώτα δυο επίπεδα χρησιμοποιούνται αυτοσχέδια χαρακτηριστικά εκπαιδευσης, ενώ το τρίτο εκμεταλλεύεται τη μέθοδο αλγευρικής αναπαράστασης των κόμβων (node embeddings) για την αλγοριθμική παραγωγή χαρακτηριστικών. Με βάση την αποτελεσματικότητα των τελευταίων, θα γίνει μια σύντομη κριτική στις δημοφιλείς μεθόδους παραγωγής embeddings και σε τυχόν ζητήματα στη φύση των αλγορίθμων που τα παράγουν. The handling of conflict in copyrights management is a crucial issue in the music industry. Erroneous association of recordings with related compositions constitutes one of the main reasons for such conflict. Recordings and various other musical entities can be represented as nodes in a large-scale relational graph. The aim of this thesis is the development of a system for predicting which recording nodes are most likely to be subject to such conflict, based only on information inferred from the structure of the graph. Graph basedDeep learning methods will be applied in tackling this problem at three levels of computational complexity, each requiring incrementally more computational resources. Manual feature engineering and machine learning techniques like oversampling and model ensemble will be used for the first two complexity levels, and algorithmic feature engineering through node embeddings will be attempted for the third. Based on the embedding performance, a short discussion will be made on the current mainstream embedding approaches and their potential shortcomings
|
---|