Συλλογές
Τίτλος Textual analysis in finance: the cases of mergers and initial public offerings
Εναλλακτικός τίτλος Ανάλυση κειμένου στα χρηματοοικονομικά: η περίπτωση των συγχωνεύσεων και των αρχικών δημοσίων εγγραφών
Δημιουργός Κατσαφάδος, Απόστολος, Katsafados, Apostolos G.
Συντελεστής Δράκος, Κωνσταντίνος
Γεωργούτσος, Δημήτριος
Σπύρου, Σπύρος
Τσεκρέκος, Ανδριανός
Athens University of Economics and Business, Department of Accounting and Finance
Επίσκοπος, Αθανάσιος
Ανδρουτσόπουλος, Ίων (Ιωάννης)
Λελεδάκης, Γεώργιος
Τύπος Text
Φυσική περιγραφή 254σ.
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=8717
Περίληψη This thesis is divided into seven chapters. Their common feature is that they all revolve around the use of textual analysis, and by extension its application in the finance sector. The first chapter provides the introduction of this thesis and points out why the focus on textual analysis is important. Next, in the second chapter, a relatively brief but thorough review of the literature is presented to crystalize the bases, the constants, and the trends of the research activity in this area. The reason is that in such a case the position of this thesis in relation to the literature, the contribution to it, as well as the empirical findings can better be understood.The third chapter uses textual analysis to identify merger participants, either bidders or targets, in the U.S. banking sector. Based on Loughran and McDonald’s lists of positive and negative words, we compute the sentiment of the bank’s annual reports (10-Ks). In our empirical analysis, we use logistic regression to gauge the probability of a bank participating in a merger event. First, we show that a greater amount of positive words in a bank’s 10-K is linked with a greater possibility of becoming a bidder. Second, we find that a higher frequency of negative words in a bank’s 10-K is associated with a higher possibility of becoming a target. Our inferences remain robust even if we include various bank-specific control variables in our logistic regressions models. The fourth chapter examines the issue of the previous chapter from a different perspective. Unlike the usage of econometric methodologies to explore the significance of the coefficients under an explanatory framework, here our aim is prediction by using machine learning models, including ideas from deep learning models. More specifically, we endeavor to examine whether there is any predictive ability of textual information from annual reports (10-Ks) when predicting bank mergers. We prove that textual data enhance the predictive accuracy of the models both for bidders and targets. By and large, the combination of both textual features and financial variables as input in the models achieves the highest scores. On the one side, the findings for targets indicate that random forest (RF) is the best among others in terms of out-of-sample accuracy. In that case, we use textual features with both unigrams and bigrams using term frequency-inverse document frequency (TF-IDF) weighting scheme along with financial variables. On the other side, deep learning models perform the highest accuracy score at bidder prediction task. In particular, we use the centroid of word embeddings combined with the financial variables. Notably, our finance-specific word embeddings perform better than the generic ones. Again TF-IDF weighting scheme seems to improve the overall predictive outcome. Our findings show that textual disclosure manages to mitigate the opacity of the banks. The fifth chapter tries to get insights into the predictive power of textual data derived from the prospectuses (S-1 filings) in predicting IPO underpricing. In particular, we use several machine learning models to proceed to our prediction tasks. First of all, our research differentiates from prior literature as it predicts not only if an IPO will be underpriced or not, under a binary classification framework, but also it foresees the magnitude of underpricing. At both of these tasks, we find that textual features can efficiently complement financial variables. In reality, machine learning models that use both textual features and financial variables as inputs achieve greater performance compared to models employing a single type of input. Also, we explore methodological ways with which financial variables can be effectively combined with the numerous textual features. Overall, our findings offer empirical evidence on how textual information is able to reduce the ex-ante valuation uncertainty of IPO firms.The sixth chapter adds to the literature that attempts to explain the IPO underpricing, especially based on the tone of the IPO prospectus. We prove that a higher fraction of uncertain text in S-1 filings as an internal source of uncertainty is related to higher underpricing. However, the main merit of our study is that we focus on the policy uncertainty index as a source of external uncertainty, in addition to the textual sentiment. We surprisingly find that higher policy uncertainty prior to the filing date of S-1 is connected with a lower underpricing. Interestingly, we show that high policy uncertainty influences the firm’s decision to go public. In fact, policy uncertainty is negatively linked to IPO volume. We further document that only firms with good quality continue going public despite the high policy uncertainty, thus experiencing a lower underpricing. The seventh chapter provides the main inferences of this thesis as well as offers several suggestions for future research.
Η παρούσα διδακτορική διατριβή χωρίζεται σε επτά κεφάλαια. Το κοινό συνδετικό στοιχείο σε όλα αυτά τα κεφάλαια είναι ότι περιστρέφονται γύρω από τη χρήση ανάλυσης κειμένου, και κατ’ επέκταση την εφαρμογή αυτής στο χρηματοοικονομικό κλάδο. Το πρώτο κεφάλαιο παρέχει την εισαγωγή της διατριβής και επισημαίνει γιατί είναι σημαντική η εστίαση στην ανάλυση κειμένου. Ύστερα, στο δεύτερο κεφάλαιο παρουσιάζεται μια σχετικά συνοπτική αλλά ουσιαστική επισκόπηση της βιβλιογραφίας, προκειμένου να αποκρυσταλλωθούν οι βάσεις, οι σταθερές, και οι τάσεις στην ερευνητική δραστηριότητα αυτής της περιοχής. Ο λόγος είναι ότι με αυτόν τον τρόπο αναδεικνύεται η σύνδεση της διατριβής με τη βιβλιογραφία, η συνεισφορά της σε αυτή, καθώς και τα εμπειρικά ευρήματα μπορούν πλέον να κατανοηθούν καλύτερα.Το τρίτο κεφάλαιο χρησιμοποιεί την ανάλυση κειμένου για να προσδιορίσει τις τράπεζες που συμμετέχουν σε μία συγχώνευση, είτε ως στόχος είτε ως αγοραστής, στον αμερικανικό τραπεζικό κλάδο. Με βάση τις θετικές και αρνητικές λέξεις των Loughran and McDonald, εμείς υπολογίζουμε το συναίσθημα των ετήσιων τραπεζικών δελτίων (10-Κs). Στην εμπειρική μας ανάλυση, χρησιμοποιούμε λογιστικές παλινδρομήσεις προκειμένου να εκτιμήσουμε την πιθανότητα μια τράπεζα να συμμετέχει σε μία συγχώνευση. Πρώτον, δείχνουμε ότι μεγαλύτερη συχνότητα από θετικές λέξεις μέσα στο 10-K της τράπεζας συνδέεται με μεγαλύτερη πιθανότητα να εξαγοράσει. Δεύτερον, βρίσκουμε ότι υψηλότερη συχνότητα από αρνητικές λέξεις μέσα στο 10-Κ της τράπεζας συσχετίζεται με υψηλότερη πιθανότητα να εξαγοραστεί. Τα εμπειρικά μας συμπεράσματα παραμένουν σταθερά ακόμα και έπειτα από την είσοδο ποικίλων εξειδικευμένων τραπεζικών μεταβλητών μέσα στα μοντέλα των λογιστικών παλινδρομήσεων. Το τέταρτο κεφάλαιο εξετάζει το θέμα του προηγούμενου κεφαλαίου από μια διαφορετική οπτική γωνία. Αντίθετα με την χρήση οικονομετρικών μεθοδολογιών για εξεύρεση στατιστικής σημαντικότητας συντελεστών κάτω από μια επεξηγηματική προσέγγιση, εδώ ο στόχος είναι η πρόβλεψη με τη χρήση τεχνικών μηχανικής μάθησης, συμπεριλαμβανομένων τεχνικών βαθιάς μάθησης. Πιο συγκεκριμένα, επιχειρείται να διερευνηθεί εάν οι πληροφορίες κειμένου από ετήσια δελτία έχουν προβλεπτική ικανότητα όταν προβλέπουμε τραπεζικές συγχωνεύσεις. Εμείς αποδεικνύουμε ότι τα δεδομένα κειμένου ενισχύουν την ακρίβεια των προβλέψεων των μοντέλων είτε για τις τράπεζες που αποτελούν στόχο είτε έχουν το ρόλο του αγοραστή. Γενικά ο συνδυασμός κειμενικών και οικονομικών μεταβλητών ως εισροή στα μοντέλα επιτυγχάνει καλύτερη προβλεπτική ικανότητα. Από την μία πλευρά, τα ευρήματα για τους στόχους υποδηλώνουν ότι τα τυχαία δάση (random forest) είναι το καλύτερο σε όρους πρόβλεψης εκτός δείγματος εκπαίδευσης (out-of-sample). Σε αυτή την περίπτωση, χρησιμοποιούμε χαρακτηριστικά κειμένου με μονογράμματα και διγράμματα σταθμισμένα με το ειδικό βάρος term frequency-inverse document frequency (TF-IDF), μαζί με οικονομικές μεταβλητές. Από την άλλη πλευρά, μοντέλα βαθιά μάθησης αποδίδουν πιο αποτελεσματικά όταν προβλέπουμε στόχους σε μια συγχώνευση. Πιο συγκεκριμένα, χρησιμοποιούμε το κεντροειδές των αναπαραστάσεων λέξεων μαζί με οικονομικές μεταβλητές. Αξιοσημείωτο είναι ότι οι εξειδικευμένες μας στα χρηματοοικονομικά αναπαραστάσεις λέξεων παράγουν καλύτερα αποτελέσματα σε σύγκριση με τα γενικά. Για άλλη μια φορά, η στάθμιση με TF-IDF φαίνεται να βελτιώνει το γενικότερο αποτέλεσμα της πρόβλεψης. Τα ευρήματά μας δείχνουν ότι η πληροφορία κειμένου καταφέρνει να μετριάσει την αδιαφάνεια των τραπεζών.Το πέμπτο κεφάλαιο επιχειρεί να διερευνήσει την προβλεπτική ικανότητα κειμενικών δεδομένων προερχόμενα από τα αρχικά ενημερωτικά δελτία (S-1) αναφορικά με την πρόβλεψη της υποτιμολόγησης στις αρχικές δημόσιες εγγραφές (ΑΔΕ). Πιο συγκεκριμένα, χρησιμοποιούμε μοντέλα μηχανικής μάθησης για να προχωρήσουμε στις προβλέψεις μας. Πρωτίστως η έρευνά μας διαφοροποιείται από την πρότερη βιβλιογραφία καθώς προβλέπουμε όχι μόνο αν μια ΑΔΕ θα είναι υποτιμολογημένη ή υπερτιμολογημένη υπό το πρίσμα δυαδικής ταξινόμησης, αλλά επιπλέον προβλέπουμε και το μέγεθος της ενδεχόμενης υποτίμησης. Και στις δύο αυτές περιπτώσεις, βρίσκουμε ότι τα χαρακτηριστικά του κειμένου μπορούν να συμπληρώσουν τις οικονομικές μεταβλητές με αποτελεσματικότητα. Στην πραγματικότητα, τα μοντέλα μηχανικής μάθησης που χρησιμοποιούν συνδυασμό κειμενικών και οικονομικών μεταβλητών κατορθώνουν υψηλότερη απόδοση σε σύγκριση με αυτά που λαμβάνουν ένα τύπο πληροφόρησης ως εισροή. Επίσης, διερευνούμε μεθοδολογικούς τρόπους με τους οποίους μπορεί να υπάρξει αποτελεσματική σύζευξη των οικονομικών μεταβλητών με την πληθώρα από τις κειμενικές μεταβλητές. Συνολικά, τα αποτελέσματά μας παρέχουν εμπειρικές αποδείξεις στο πώς πληροφορίες από κείμενα καταφέρνουν να μειώσουν την εκ των προτέρων αβεβαιότητα κατά την αξιολόγηση των ΑΔΕ. Το έκτο κεφάλαιο προσπαθεί να ερμηνεύσει την υποτιμολόγηση στις ΑΔΕ, συγκεκριμένα με βάση τον τόνο των ενημερωτικών δελτίων. Εμείς αποδεικνύουμε ότι όσο πιο αβέβαιο κείμενο υπάρχει μέσα στο S-1 αρχείο ως μια εσωτερική πηγή αβεβαιότητας σχετίζεται με πιο υψηλή υποτιμολόγηση. Όμως, η βασική συμβολή της έρευνάς μας είναι ότι επικεντρώνεται στην αβεβαιότητα πολιτικής ως μια εξωτερική πηγή αβεβαιότητας, επιπρόσθετα με την χρήση του συναισθήματος κειμένου. Περιέργως βρίσκουμε ότι η υψηλότερη αβεβαιότητα πολιτικής πριν την ημερομηνία έκδοσης του S-1 συνδέεται με λιγότερη υποτιμολόγηση. Με ενδιαφέρον, δείχνουμε ότι η υψηλή αβεβαιότητα πολιτικής επηρεάζει την απόφαση της εταιρείας να προχωρήσει με την ΑΔΕ. Στην πραγματικότητα, η αβεβαιότητα πολιτικής συνδέεται αρνητικά με τον όγκο των ΑΔΕ. Εμείς περαιτέρω τεκμηριώνουμε ότι μόνο οι εταιρείες με καλή ποιότητα συνεχίζουν να προχωρούν προς την ΑΔΕ παρά την υψηλή αβεβαιότητα πολιτικής, που κατά συνέπεια σημαίνει ότι απολαμβάνουν μικρότερη υποτίμηση. Το έβδομο κεφάλαιο παρέχει τα βασικά συμπεράσματα της διατριβής καθώς και προσφέρει προτάσεις για μελλοντική έρευνα.
Λέξη κλειδί Ανάλυση κειμένου
Τραπεζικές συγχωνεύσεις
Αρχικές δημόσιες εγγραφές
Textual analysis
Bank mergers
Initial public offerings
Διαθέσιμο από 2021-07-13 13:41:13
Ημερομηνία έκδοσης 2021
Ημερομηνία κατάθεσης 2021-07-13 13:41:13
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/