Wenn KI zwischen den Zeilen liest

Das RISC hat erprobt, ob KI komplexe Fragen beantworten kann. Die Aufgabe: Beeinflusst Twitter die Aktienkurse?

Credit: Pixabay.com/geralt, C00
Credit: Pixabay.com/geralt, C00

Konkret wurde untersucht, ob es einen Zusammenhang zwischen Twitter-Nachrichten und Aktienkursen gibt. Dabei wurden sogenannte „Deep-Neural-Networks“ eingesetzt, welche tiefliegende strukturelle Zusammenhänge erkennen und erlernen. Das Ergebnis vorab: es besteht eine, wenn auch nur schwache Korrelation. Trotzdem zeigt dieses Projekt eines: Mit Hilfe von Deep-Learning-Methoden ist es möglich, Emotionen aus Texten herauszurechnen.

Zwei Forscher der RISC Software GmbH untersuchten die Prämisse, ob positive Emotionen in Tweets über aktiennotierte Unternehmen mit deren Aktienkursentwicklung in Zusammenhang stehen. Um die Emotionen aus den Kurznachrichten herauslesen zu können, griffen sie auf die Verwendung von neuronalen Netzen zurück, die sie vorher mit frei verfügbaren Trainingsdaten trainierten.

Dabei mussten sie die Nachrichten maschinell in einzelne Bausteine zerlegen, aufbereiten und einer sog. Sentimentanalyse („Sentiment“, zu Deutsch „Stimmungsanalyse“) unterziehen. Diese anspruchsvolle Vorgehensweise ist neuester Stand der Technik und aufgrund von aktuellen Entwicklungen im Bereich der künstlichen Intelligenz möglich.

Intelligente Twitter Analyse – nur ein Anfang
Die Forscher stellten in ihrem Projekt fest, dass es während ihres Beobachtungszeitraumes von vier Monaten eine nachweisbare Korrelation zwischen Aktienkursen und Emotionen in den Tweets gab. Dieses Beispiel soll zeigen, wie viel Informationen zwischen Zeilen stecken, und dass es möglich ist, diese maschinell zu erfassen und zu verarbeiten.

Neben der Analyse von Zusammenhängen zwischen Tweets und Kursentwicklungen können auch andere Texte analysiert und mit Daten in Zusammenhang gebracht werden. Man könnte nicht nur Emotionen, sondern auch andere Parameter herausfinden. So gibt es viele verschiedene Anwendungsbereiche in der Industrie, Medizin, im Marketing, wie zum Beispiel die Analyse von Freitexten bei Wartungsberichten und Materialprüfungsergebnissen, medizinische Befunde, Rezensionen und Produktbewertungen, qualitative und quantitative Umfragen und vieles mehr.

Neuronale Netze – das bessere Gehirn?
Mit künstlicher Intelligenz bezeichnet man die Fähigkeit von Maschinen kognitive Leistungen zu erbringen, die bis dato nur der Mensch erbringen konnte, wie zum Beispiel Objekte auf Bildern zu erkennen und diese zu klassifizieren. Künstliche neuronale Netze sind ein künstliches Abbild des menschlichen Gehirns und arbeiten in gleicher Weise, indem sie Informationen von Neuron zu Neuron verarbeiten und weitergeben.

Künstliche neuronale Netze funktionieren schematisch gesehen wie menschliche neuronale Netze bzw. Gehirne: die einzelnen Neuronen oder Knotenpunkte verarbeiten Informationen und geben diese untereinander und schichtenweise weiter. So werden die Informationen beginnend von der sog. Eingabeschicht über eine oder mehrere Zwischenschichten bis hin zur Ausgabeschicht verarbeitet, Jeder Output eines Knotenpunktes wird zum Input für den darauffolgenden Knotenpunkt. Für die Sentimentanalyse erwies sich eine 5-schichtige Verarbeitung als ausreichend.

Trainingsdaten sind das A und O
Um zuverlässige Ergebnisse aus solchen neuronalen Netzwerken zu bekommen, ist es wichtig die Netze mit entsprechenden Trainingsdaten zu trainieren. Dabei ist sowohl die Qualität als auch die Quantität für das Resultat ausschlaggebend. Denn nur bei korrekten Daten in einer hohen Anzahl kann das neuronale Netz die richtigen Schlüsse ziehen.

Im Fall der Textanalyse wird auf Natural Language Processing (NLP) zurückgegriffen. Die Methode erlaubt die maschinelle Verarbeitung von natürlicher Sprache und übersetzt sozusagen von Mensch auf Computer. Dabei ist es wichtig, dass Textbedeutungen ganzheitlich erfasst werden - also zum Beispiel die Zusammenhänge in langen Sätzen - und deren Sinn extrahiert wird. Neben künstlicher Intelligenz und Machine Learning spielt auch Big Data eine große Rolle, da hier große Datenmengen verarbeitet werden müssen.

Vergleich von verschiedenen neuronalen Netzen
Es wurden auch Vergleiche zwischen verschiedenen neuronalen Netzwerken gezogen. Dafür wurden drei unterschiedliche Netztypen mit den gleichen Trainingsdaten trainiert und die Ergebnisse miteinander verglichen: Feed-Forward-Neural Network (DNN), Convolutional Neural Network (CNN) und Recurrent Neural Network (RNN).

Ein Feed-Forward-Netzwerk ist ein künstliches neuronales Netzwerk, in dem sich die Informationen nur in eine Richtung vorwärts von den Eingabeknoten zu den Ausgabeknoten bewegen. Im Netzwerk gibt es keine Zyklen oder Schleifen. Das Convolutional Neural Network hingegen ist ein von biologischen Prozessen inspiriertes Netzwerk, welches Informationen mittels speziellen Filtern sozusagen faltet

Ein Recurrent Neural Network unterscheidet sich darin, dass Knotenpunkte auch untereinander in derselben oder einer vorangegangenen Schicht verbunden sind, also Rückkopplungen bilden. Sie sind daher besonders für das Verarbeiten von Sequenzen geeignet wie es zum Beispiel in Spracherkennung erforderlich ist. Letztendlich stellte sich das RNN als ideales neuronales Netz für den Einsatz Natural Language Processing heraus.

Know-how Träger in Oberösterreich
Maschinelles Lernen, unter anderem auf Basis sogenannter künstlicher neuronaler Netze, ist Teilgebiet der KI und schon seit den 50er Jahren bekannt. Deep Learning ist wiederum ein Teilgebiet des Maschinellen Lernens. Aufgrund der gesteigerten Rechenleistung und der Menge an verfügbaren hochwertigen Daten gibt es derzeit eine Renaissance der KI – diese wird insbesondere durch Erfolge, zum Beispiel in der Bilderkennung oder in der Spracherkennung weiter befeuert.

Die RISC Software GmbH als Teil des Forschungsstandortes OÖ, gestaltet wesentlich die KI-Strategie des Landes OÖ mit. Das Ziel ist Oberösterreich als internationale sichtbare Kompetenzregion für Künstliche Intelligenz zu etablieren, sowie neue hochwertige Arbeitsplätze zu schaffen, unter anderem. durch die Gründung und Ansiedlung von neuen Hightech-Unternehmen, die wiederum weitere Arbeitsplätze nach sich ziehen. Weiters ist die RISC Software GmbH Projektpartner im Medical Cognitive Computing Center (MC3) des Landes Oberösterreich, welches geschaffen wurde um eine optimale PatientInnenversorgung durch den Einsatz von neuartigen Methoden im Bereich der Künstlichen Intelligenz zu erforschen und umzusetzen.