

Βασικά
56
www.traders-mag.gr12.2015
προσθέσουμε σε αυτό και την ανάγκη ξαφνικής προσαρμογής
της αγοράς, τότε είναι σχεδόν βέβαιη η απότομη αύξηση της
αστάθειας μετά την ανακοίνωση της είδησης. Ανάλογα με τον
τύπο του χρηματιστηριακού αγαθού, η αστάθεια αυτή, μπορεί να
απορροφηθεί μέσα σε διάρκεια λίγων λεπτών έως και μετά από
μερικές ώρες. Όπως είναι αναμενόμενο οι ανακοινώσεις ειδήσεων
έχουν μεγαλύτερο αντίκτυπο στις κατηγορίες χρηματιστηριακών
αγαθών που συσχετίζονται με αυτές. Για παράδειγμα, οι εταιρικές
ανακοινώσεις αναμένεται να επηρεάσουν σημαντικά τις τιμές των
αντίστοιχων μετοχών των εταιριών.
Αλγοριθμικά υπολογισμένο συναίσθημα
Ο υπολογισμός συναισθήματος ενός άρθρου, σε ένα πλήρως
αλγοριθμικό περιβάλλον, είναι μια πολύπλοκη διαδικασία που
περιλαμβάνει πολλά βήματα και που μπορεί να επιτευχθεί με τη
χρήση πολλών διαφορετικών μεθόδων. Μια από τις πιο κοινές
προσεγγίσεις είναι η μεθοδολογία “bag-of-words”. Η διαδικασία
περιλαμβάνει την εξαγωγή μιας βάσης δεδομένων λεξιλογίου
του εγγράφου, την καταμέτρηση της συχνότητας των λέξεων και
τη δημιουργία ενός υψηλής διάστασης διανύσματος μοναδικών
λέξεων. Περαιτέρω επεξεργασία μπορεί να εφαρμοστεί για να
αφαιρεθούν λέξεις από το συντακτικό της γλώσσας που δε
συμβάλλουν στον προσδιορισμό συναισθήματος όπως είναι οι
αντωνυμίες και τα επίθετα. Η προ-επεξεργασία μπορεί επίσης
να περιλαμβάνει κανονικοποίηση του λεξικολογικού διανύσματος
προς αποφυγή της στρέβλωσης του αποτελέσματος λόγω
ύπαρξης ηψίσυχνων λέξεων. Σημαντική είναι και η διαδικασία
καθαρισμού εκφράσεων και δεδομένων δίχως νόημα. Ένα
επιπλέον σημαντικό στάδιο της προ-επεξεργασίας αποτελεί και
το word stemming, μια τεχνική που προσπαθεί να εξάγει τις ρίζες
των λέξεων. Στον αλγοριθμικό πυρήνα εξόρυξης συναισθήματος
μπορεί να χρησιμοποιηθεί μιαποικιλία μεθοδολογιών, των οποίων
η πολυπλοκότητα μπορεί να κυμαίνεται από έναν ταξινομητή
Naive Bayes ή ένα μοντέλο λογαριθμικής παλινδρόμησης (logistic
regression), ως μια σύνθετη δομή Τεχνητής Νοημοσύνης όπως
αυτή ενός νευρωνικού δικτύου υψηλού βάθους (Deep Belief
Network). Τέλος, οι λέξεις στο διάνυσμα λεξιλογίου μπορούν να
αναλυθούν μεμονωμέναήσυνδυαστικάως n-grams.Ανεξαρτήτως
της μεθοδολογίας που επιλέγεται ωστόσο, το τελικό αποτέλεσμα
είναι ένα μετρικό που ταλαντεύεται μεταξύ ενός ελάχιστου και
ενός μέγιστου και εκφράζει την πολικότητα του εγγράφου. Ο
Πίνακας 2 παρουσιάζει τους τρεις τύπους πιθανών καμπυλών
συναισθήματος, τη διακριτή την συνεχή και την στοχαστική.
Μετά την ανάλυση ενός άρθρου και προκειμένου να
χρησιμοποιηθούν τα αποτελέσματα ιδίως σε αλγοριθμικές
χρηματιστηριακές συναλλαγές, προχωράμε στον ορισμό των
εμπλεκομένων οντοτήτων. Αυτό σημαίνει ότι ο υπολογιστής θα
πρέπει να είναι σε θέση να καταλάβει ποιο χρηματιστηριακό αγαθό
μπορεί να επηρεάζεται άμεσα ή έμμεσα από το περιεχόμενο και
το συναίσθημα ενός ειδησεογραφικού άρθρου. Ως προς αυτό, οι
αλγόριθμοι NLPείναι σε θέση ναφιλτράρουν και νααπομονώσουν
τα ονόματα εταιριών και να επισυνάψουν επίσημους κωδικούς
χρηματιστηριακών αγαθών στο ειδησεογραφικό άρθρο.
Αλγοριθμικές συναλλαγές, μαύρα κουτιά και
συνεχείς χρονοσειρές συναισθήματος
Με τον όρο αλγοριθμικές συναλλαγές αναφερόμαστε
ουσιαστικάστηνμηχανικήεκτέλεσηεπενδυτικώναποφάσεων.
Καμπύλη ρυθμού Κέρδους & Ζημιάς χρησιμοποιώντας το μαύρο
κουτί συναισθήματος.
Πηγή: Thomson Reuters
Δ3)
Καμπύλη λόγου κέρδους, Ζημιάς στρατηγικής
Καμπύλη Κέρδους & Ζημιάς χρησιμοποιώντας το μαύρο κουτί
συναισθήματος.
Πηγή: Thomson Reuters
Δ2)
Καμπύλη Κέρδους & Ζημίας στρατηγικής