Bilanz, Gewinn- und Verlustrechnung, Anhang, ... Ein Jahresabschluss beinhaltet viele Zahlen. Dazu kommen aber auch noch viele Texte, mit welchen das Management Auskunft über verschiedenste Themen gibt. Das Problem ist, dass dies tatsächlich sehr viel zu lesen ist. Es stellt sich die Frage, inwiefern hier eine Textanalyse in RStudio hilft. Hier ein Versuch mit den Jahresabschlüssen der Siemens AG. Zur Textanalyse habe ich jeweils die zwei Kapitel "Overall assessment of the economic position" und "Strategic Risk" der Abschlüsse 2011 bis 2018 genommen und will schauen, ob der jeweilige Sentiment-Score zu den berichteten Zahlen passt.
Im Schaubild ist der Sentiment-Score für die beiden Texte mit den jeweiligen Methoden abgebildet. Hervorgehoben sind die Durchschnittswerte des Scores jeweils für den Text über die Wirtschaft (blau) und den Text über die strategischen Risiken (grün). Während der Score zu Economy jeweils positiv ist, sind die grünen Linien teils auch unter dem Nullwert; klar, wird hier ja ein Risiko beschrieben. Eine Gemeinsamkeit zwischen beiden Durchschnittslinien ist mit einem Korrelationskoeffizienten von 0.15 bei einem p-Wert von 0.7 nicht gegeben.
Die Finanzen der Siemens AG entwickeln sich wie folgt - zur Untersuchung habe ich den Umsatz und das Ergebnis ausgewählt:
Wohlgemerkt schauen wir uns hier einen Zeitraum ohne Krise an. Um Zusammenhänge zu entdecken, erstellen wir nun eine Korrelationsmatrix. In dieser steht blau für einen positiven und rot für einen negativen Zusammenhang, während Größe und Farbintensität die Größe des Korrelationskoeffizienten angeben. Hier gibt es erstmal keine signifikante Korrelation bei p=0.1. Bei p=0.2 bekommen wir aber folgendes Ergebnis:
Wir sehen zwei für uns interessante Korrelationen
1) Revenue & Strategy_SentHE mit einem Korrelationskoeffizienten von -0.8 (p=0.010)
2) Revenue & Strategy_SentMean mit einem Korrelationskoeffizienten von -0.79 (p=0.012)
Als Schaubild ergibt sich folgender Verlauf:
Ein schlüssiger Zusammenhang ergibt sich nicht sofort. Aber kann man den Sentiment-Score vielleicht als Indikator für die zukünftige Performance benutzen? Eine Analyse mit einer lagged Variablen um +1 Jahr (des Sentiment Scores) ergibt eine Korrelation von -0.59 (p=0.12), also keine Verbesserung.
Es lässt sich also festhalten, dass die Textanalyse eines Jahresabschlusses zwar bestimmten Mehrwert bringen mag. Ob man damit aber zum Beispiel zukünftige Entwicklungen voraussehen kann oder die vergangene Performance besser erklären kann, ergibt sich nicht aus diesem Versuch. Vielleicht ginge das mit einem anderen Textausschnitt oder anderen Performance-Zahlen. Oder man liest einfach den Text und macht sich so sein Bild vom jeweiligen Unternehmen.