PYXIDA Institutional Repository
and Digital Library
Collections :

Title :Ανάλυση των social media και πρόβλεψη του bitcoin
Creator :Ρουμπή, Βασιλική
Contributor :Λεκάκος, Γεώργιος (Επιβλέπων καθηγητής)
Κορφιάτης, Νικόλαος (Εξεταστής)
Ζαχαριάδης, Εμμανουήλ (Εξεταστής)
Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Διοικητικής Επιστήμης και Τεχνολογίας (Degree granting institution)
Type :Text
Extent :58σ.
Language :el
Identifier :
Abstract :Ο σκοπός της διπλωματικής εργασίας είναι η έρευνα για την ύπαρξη πιθανήςσυσχέτισης των κρυπτονομισμάτων με τα social media. Ένα αρκετά δημοφιλές μέσοκοινωνικής δικτύωσης, το Twitter, χρησιμοποιείται συχνά για την έκφραση γνωμών καισυναισθημάτων. Σε περιόδους μεγάλων μεταβολών της τιμής των κρυπτονομισμάτων, τοTwitter έχει υπάρξει μέσο έκφρασης δυσαρέσκειας ή αισιοδοξίας, και άλλες φορές οι ίδιες οιαναρτήσεις από χρήστες ιδιαίτερα γνωστούς στο κοινό του Twitter έχουν προκαλέσει τιςμεταβολές αυτές.Συγκεκριμένα, στην εργασία πραγματοποιείται ανάπτυξη μεθοδολογίας καιαλγορίθμων για την ανάλυση ευαισθησίας σε δεδομένα από το Twitter (tweets) και τονέλεγχο συσχέτισής τους με ημερήσιες μεταβολές στην τιμή του Bitcoin. Για την έρευνα αυτήχρησιμοποιήθηκαν δεδομένα από περίοδο στην οποία υπήρξαν σημαντικές μεταβολές στηντιμή του όπου τα συναισθήματα των επενδυτών εκφράζονταν με μεγαλύτερη ένταση.Για την ανάπτυξη των αλγορίθμων, όπως και τη λήψη των δεδομένων,χρησιμοποιήθηκε η γλώσσα προγραμματισμού Python και βιβλιοθήκες υποστήριξηςεφαρμογής μεθόδων και αλγορίθμων για Machine Learning. Για τη λήψη των δεδομένων τουTwitter χρησιμοποιήθηκε το Twitter API v2, και για τις τιμές του Bitcoin το CryptoCompareAPI.Ως προς τη μεθοδολογία και την υλοποίηση του βασικού αλγορίθμου,πραγματοποιήθηκε με μία lexicon-based προσέγγιση για την ανάλυση ευαισθησίας καιχρησιμοποιήθηκε το μοντέλο Valence Aware Dictionary and sEntiment Reasoner (VADER),το οποίο είναι ένα λεξικό προσαρμοσμένο σε δεδομένα που προέρχονται από κοινωνικά μέσαδικτύωσης. Με την εφαρμογή αυτού του μοντέλου, τα tweets κατηγοριοποιήθηκαν ανάλογαμε το βαθμό θετικότητάς τους σε θετικά, αρνητικά και ουδέτερα, και χρησιμοποιήθηκαν στησυνέχεια στον αλγόριθμο για την πρόβλεψη της μεταβολής. Για τον υπολογισμό τηςπρόβλεψης χρησιμοποιήθηκαν και συγκρίθηκαν τα μοντέλα Logistic Regression, SupportVector Machines και Naïve Bayes χρησιμοποιώντας ως μεταβλητές την ημερήσιαβαθμολογία θετικότητας και τον όγκο των tweets για τις μέρες που προηγήθηκαν τηςμεταβολής. Τα αποτελέσματα των μετρήσεων έδειξαν πως μεγαλύτερη συσχέτιση υπάρχει μετον όγκο των tweets των προηγούμενων από την μεταβολή ημερών, παρά με το συναίσθημα.
The purpose of the dissertation is to investigate the possible correlation betweencryptocurrencies and social media. A fairly popular social networking site, Twitter, is oftenused from people in order to express opinions and feelings. In times of great change in theprice of cryptocurrencies, Twitter has been a means of expressing dissatisfaction or optimism,and other times the tweets posted by popular users have caused these changes.Specifically, in this dissertation, you will find a methodology and algorithms for analyzingthe sensitivity of data from Twitter (tweets) and calculating their correlation with dailychanges in the price of Bitcoin. For the purposes of this research, data from a period in whichthere were significant changes in its price were used and the main reason behind that is thatthe feelings and sentiments of investors at these times were expressed with higher intensity.Python programming language and application support algorithms for Machine Learningmethods and algorithms were used to develop the algorithms as well as to obtain the data. TheTwitter API v2 was used to download Twitter data, and the CryptoCompare API was used forBitcoin prices.In terms of methodology and implementation of the basic algorithm, a lexicon-based approachfor sensitivity analysis was performed using the Valence Aware Dictionary and Science Reasoner (VADER) model, which is a dictionary sensitive to data from social media . Byapplying this model, tweets were categorized according to their degree of positivity intopositive, negative, and neutral, and then used in the algorithm to predict the change. Themodels used for forecasting are Logistic Regression, Support Vector Machines and NaïveBayes. The variables used as data for the forecasting are the daily positivity rating and thevolume of the tweets for the days preceding the change. The results showed that the directionof Bitcoin’s price movement is more related to the volume of the tweets rather than thesentiment that could be present in them.
Subject :Ανάλυση ευαισθησίας
Εξόρυξη γνώμης
Κοινωνικά δίκτυα
Sensitivity analysis
Opinion mining
Date Available :2022-05-25 18:41:14
Date Issued :05/25/2022
Date Submitted :2022-05-25 18:41:14
Access Rights :Free access
Licence :

File: Roumpi_2022.pdf

Type: application/pdf