Big Data: Wenn nur noch eine denkende Maschine den Überblick behält

Big Data bietet für Unternehmen eine riesige Chance: Sie können ihre Kunden besser verstehen, neue Märkte entdecken und sich Vorteile gegenüber der Konkurrenz erarbeiten. Notwendig sind dafür allerdings geeignete Analysewerkzeuge, die aus der reinen Menge an Daten wertvolle Informationen extrahieren können. Eine Möglichkeit bietet hier der Bereich der Künstlichen Intelligenz, also denkende Maschinen.

Denkende Maschinen sind in der Science Fiction schon lange bekannt, nun aber werden sie Realität. Bild: MGM
Denkende Maschinen sind in der Science Fiction schon lange bekannt, nun aber werden sie Realität. Bild: MGM

Der Traum von einer künstlichen Intelligenz geht bis in die Epoche der Aufklärung zurück, doch erst mit der Entwicklung der ersten Computer schien eine Realisierung zumindest entfernt denkbar. Kein Wunder, dass in diese Zeit auch viele Science-Fiction-Werke fallen, die sich mit künstlicher Intelligenz befassen. Ob nun bei Perry Rhodan, Arther C. Clarke’s Space Odyssee oder später bei Star Trek: HAL 9000, Data & Co konnten zwar selbstständig agieren, waren aber lediglich Fantasiefiguren.

In der Realität ging die Evolution der Künstlichen Intelligenz dagegen eher schleppend voran. Frühe Experimente wie ELIZA, bei dem ein Computerprogramm den Dialog zwischen einem Psychiater und seinem Patienten simulierte oder das System MYCIN, mit dem Mediziner Unterstützung bei Diagnose- und Therapieentscheidungen von Blutinfektionskrankheiten erhalten sollten, waren zwar erste kleine Erfolge, doch von einem Durchbruch war Mitte der 70er Jahre noch lange nichts zu sehen. Genau genommen dauerte es bis 1997, bis es einen weiteren großen Evolutionssprung in Sachen KI gab. Mit dem Großrechner „Deep Blue“ gelang es IBM nach zwölf Jahren Entwicklungsarbeit erstmals Computer-Chips so miteinander zu verknüpfen, dass daraus ein System mit einer für damalige Verhältnisse enormen Rechenleistung wurde, die vor allem auf das Schachspielen ausgerichtet war. Deep Blue konnte bis zu 200 Millionen Stellungen pro Sekunde berechnen und war sogar in der Lage den Schachgroßmeister Garri Kasparow zu schlagen.

Aber war das schon KI? Damals war die Leistung so beeindruckend, dass man das annahm. Immerhin lag der Leistung eine komplizierte Software zugrunde, die nicht nur alle theoretisch möglichen Züge vorausberechnen, sondern diese auch noch nach einem Wertesystem einstufen konnte, das von mehreren Schachgroßmeistern optimiert wurde. Trotzdem kam Deep Blue nicht über seine Programmierung hinaus und war kein selbstlernendes System.

Das änderte sich mit Watson, einem hochentwickelten Computerprogramm, ebenfalls von IBM. Die Zielsetzung war es, erstmals eine semantische Suchmaschine zu entwickeln, die Antworten auf Fragen geben konnte. Um zu beweisen, dass dies auch gelungen war, schickte man es in die populäre TV-Sendung Jeopardy. Hier musste es sich passende Fragen für vorgegebene Antworten überlegen und dabei gegen zwei Kandidaten antreten, die zuvor bei der Show Rekordsummen erspielt hatten. Watson gewann das Duell und gilt seitdem als erste Maschine, die natürliche Sprache verarbeiten und beantworten kann.

Anwendungsbeispiele für Watson

Nun ist die Teilnahme an Quizshows zwar gut für die Publicity, doch ein wirklich nützlicher Anwendungsfall ist das noch nicht. Mit diesem ersten Erfolgwar aber der Weg zur Kommerzialisierung des KI-Systems geebnet. Für IBM war es nun an der Zeit, praktische Anwendungsbereiche zu finden, in denen es real existierende Probleme gab, für die es Lösungen brauchte. Im Grunde gibt es zahlreiche Bereiche, in denen ein solches System gute Dienste leisten könnte, denn überall steigt das Datenaufkommen und damit auch die Analyseaufgaben.

Ein großer und wichtiger Bereich ist der Medizin-Sektor. Hier gibt es ein enormes Expertenwissen und dazu eine kaum zu überblickende Menge an statistischen Daten, die für die Erstellung einer Diagnose und für die Therapie herangezogen werden können. Alle fünf Jahre verdoppelt sich diese Datenmenge allein im Gesundheitsbereich auch noch, so dass das Handling immer schwieriger wird. Dazu kommt noch der Umstand, dass die meisten Daten unstrukturiert vorliegen und von Ärzten und medizinischem Personal in natürlicher Sprache aufgezeichnet wurden. Mit Watson können diese Daten nun auch in der täglichen Praxis genutzt werden. Das Computerprogramm verwendet die natürliche Sprache zur Bildung von Hypothesen und verwendet evidenzbasiertes Lernen, um Ärzten bei ihren Entscheidungen für Diagnosen und Behandlungen Unterstützung anzubieten.

Die Interaktion könnte dabei so ablaufen, als wäre das Computerprogramm ein virtueller Assistent. Man könnte ihm Fragen stellen und ihn mit Informationen über die auftretenden Symptome und Beschwerden füttern. In einem vernetzten System könnte das Programm dann auch auf die Krankenakte eines Patienten zugreifen und beispielsweise nach genetisch bedingten Auffälligkeiten in der Familie suchen. Auch frühere Krankheiten, Behandlungen und Medikationen würden mit einbezogen, ebenso wie aktuelle medizinische Erkenntnisse, die eventuell noch nicht mal den Weg in eine medizinische Fachzeitschrift gefunden haben. Als Ergebnis bekommt der Arzt dann eine Liste mit möglichen Diagnosen, bei denen ein Wert jeweils angibt, wie wahrscheinlich die einzelne Hypothese ist. Watson wäre nicht nur der verlängerte Arm des Arztes, er wäre gleichzeitig auch so etwas wie das von Star Trek bekannte medizinische Notfallprogramm – nur das entsprechende Hologramm fehlt noch. Er könnte einspringen, wenn die medizinische Versorgung mit Spezialisten nicht ausreicht und selbst den Spezialisten bei der Überprüfung schwieriger Diagnosen wertvolle Dienste leisten. Darüber hinaus hätte der Arzt auch wieder mehr Zeit für seine Patienten.

Aber nicht nur in der Medizin könnte ein solches System seine kognitiven Fähigkeiten einbringen.

Bankenkrise wäre verhinderbar gewesen

Ein spekulativ aufgeblähter Immobilienmarkt in den USA sorgte im Jahr 2007 für den Anfang der wohl größten weltweiten Banken- und Finanzkrise aller Zeiten. Große Banken gerieten in Schieflage oder mussten sogar Insolvenz anmelden. Der Höhepunkt war mit dem Zusammenbruch der Großbank Lehman Brothers im September 2008 erreicht. Bei der Analyse der Hintergründe wurde klar, dass sich die Krisensituation eigentlich seit Jahren angekündigt hatte, nur fehlte es an den entsprechenden Verknüpfungen von Daten und Zusammenhängen.

Denn auch die Finanzbranche ist ein sehr komplexes Konstrukt mit vielen komplizierten Verknüpfungen allein auf den nationalen Märkten. Nimmt man dann noch die internationalen Verflechtungen hinzu, so ist ein Überblick fast unmöglich. In Krisensituationen entsteht dann schnell ein Dominoeffekt: Eine Bank fällt wie ein Dominostein um und reißt etliche weitere weltweit mit sich.

Um solche Szenarien künftig vermeiden zu können, wäre ein kognitives und lernendes System sehr gut geeignet. Ob es dazu aber kommen wird, ist ungewiss. Was Watson heute schon machen kann/darf sind Analysen für Investments für institutionelle und private Anleger. Auch das ist ein wichtiges Feld, denn die Beratungsleistung der Banken ist noch zu sehr auf Zufall ausgelegt und nicht genügend mit Daten, Statistiken und Analysen aktueller Ereignisse unterfüttert. Auch hier ist die Menge an Daten einfach zu groß und der Auswertungsaufwand insgesamt zu hoch, als dass dies von Einzelpersonen geleistet werden könnte.

Big Data: Jede Menge Futter

Die Menschheit erzeugt heute gigantische Datenmengen, die unter dem Schlagwort Big Data auch immer mehr in den Vordergrund rücken. 90 Prozent der Daten wurden dabei in den letzten beiden Jahren geschaffen und 80 Prozent davon sind nicht maschinenlesbar. Aktuell gehen Berechnungen davon aus, dass sich die Datenmenge alle zwei Jahre verdoppelt. Zunehmende Dynamiken in vielen Teilbereichen könnten das Wachstum aber auch noch beschleunigen. Zwei große Bereiche wurden mit Healthcare und Finance oben schon besprochen, aber es gibt noch viele weitere Bereiche, in denen die Auswertung von Daten eine große Rolle spielt oder spielen könnte.

E-Commerce gehört beispielsweise dazu. Analysewerkzeuge wie Google Analytics liefern den Betreibern heute wichtige Informationen über ihre E-Shops und das sogar in Echtzeit. Doch deren Auswertung hinkt zeitlich deutlich hinterher. Hier könnte Watson die zeitnahe Analyse von Webstatistiken übernehmen und valide Empfehlungen für Optimierungen und Anpassungen für Werbe-Kampagnen liefern. Darin enthalten sein könnten auch aktuelle Marktforschungsergebnisse, die Veränderungen im Kundenverhalten aufzeigen und entsprechende Maßnahmen empfehlen.

Auch das virtuelle Einkaufserlebnis der Konsumenten könnte durch die Echtzeitverarbeitung der Daten deutlich verändert werden. Intelligente Systeme auf der Basis von Watson wären in der Lage zu erraten, für welche Produkte sich ein Webshopbesucher als nächstes interessieren könnte. Aufwändige Produktsuchen würden damit überflüssig werden und die Kunden wären schneller zufrieden mit den angezeigten Produkten. Aber auch über die Grenzen des einzelnen Shops hinaus könnte so etwas hilfreich sein. Schon heute ist das Retargeting ein wichtiges Instrument im E-Commerce, um Webshopbesucher ihr eigenes Interesse an bestimmten Produkten immer wieder vor Augen zu führen. Dazu werden die betrachteten Produkte eines Kunden aufgezeichnet und ihm anschließend über verschiedene Werbeeinblendungen auf anderen Webseiten wieder angezeigt. Technisch funktioniert dies über Cookies und Adserver, die miteinander kommunizieren.

Der Haken am Retargeting: Wenn ein Kunde sich ein Produkt angesehen, es aber nicht gekauft hat, dann kann das auch daran liegen, dass es nicht das gewünschte Produkt war oder er es aus anderen Gründen nicht kaufen wollte. Viel smarter wäre es daher, dem Kunden nicht das anzuzeigen, was er nicht gekauft hat, sondern ihm andere Produkte anzuzeigen, die zu seinem Suchverhalten passen und mit hoher Wahrscheinlichkeit sein Interesse wecken. So würde die Werbung gleichzeitig auch einen echten Mehrwert bekommen. Gleichzeitig könnte das dafür sorgen, dass sich Webshopkunden nicht mehr verfolgt, sondern verstanden fühlen. Aber die Neuausrichtung des Retargetings ist nur eine Idee.

„Hier spricht Watson, wie kann ich Ihnen helfen?“

Sowohl im B2C- als auch im B2B-Bereich machen die Kosten für Interaktionen mit den Kunden einen sehr hohen Anteil an den gesamten Kosten eines Unternehmens aus. Durch den Aufstieg der sozialen Netzwerke kommen gestiegene Erwartungen der Konsumenten hinzu, die erfüllt werden wollen. Lange Warteschleifen am Telefon oder zu spätes Beantworten von Serviceanfragen beispielsweise über Facebook oder Twitter werden immer weniger toleriert. Das ist für die Unternehmen ein nicht zu unterschätzendes Problem, denn es geht um Kundenzufriedenheit, Markenbildung und- treue. Serviceorientierte Unternehmen haben bereits ihre Ressourcen aufgestockt, doch gerade in Spitzenzeiten kommen sie dennoch nicht gegen den Kundenansturm an.

Auch hier können KI-Systeme wie Watson helfen. Sie analysieren die Serviceanfragen, kategorisieren sie, identifizieren Probleme, geben Hinweise und Vorschläge zur Problemlösung. Das spart einem Serviceteam nicht nur viel Zeit, sondern sorgt auch für zufriedenere Kunden, weil deren Probleme gelöst werden. Denn daran kranken viele Servicekanäle: „Tut mir leid, da können wir Ihnen nicht helfen, das Problem ist hier nicht bekannt“.

Watson besitzt aber mittlerweile ein Feature, mit dem sich die Zahl der Serviceanfragen schon im Ansatz verringern lässt. Das „Ask Watson“ genannte Feature bietet beispielsweise den Besuchern einer Website seine Dienste an und beantwortet die Fragen der Konsumenten, noch bevor sie sich durch aufgeblähte FAQ-Seiten oder gar Foren quälen müssen, um die benötigte Antwort dann doch nicht oder nur nach langer Suche zu finden.

Mitdenkende Shitstorm-Prophylaxe

Wie wichtig die Unterstützung im Servicebereich eines Unternehmens durch einen kognitiven Assistenten sein kann, verdeutlicht ein Kommunikationsproblem beim Telekommunikationsanbieter O2/Telefonica, das durch die Aktion „Wir sind Einzelfall“ bekannt wurde. Im Grunde hatte der Entwickler Matthias Bauer als Initiator lediglich Probleme mit den Datenverbindungen für sein Smartphone. Ein Anruf beim Service seines Mobilfunkanbieters O2 half nicht, denn den Mitarbeitern war das Problem offensichtlich nicht bekannt. Nachdem sich das Problem in mehreren Großstädten wiederholte und er immer noch keine befriedigende Antwort vom Service bekam, schaltete er eine Website, über die er weitere „Einzelfälle“ sammelte. Bereits am ersten Tag meldeten sich 180 weitere Kunden mit den gleichen Problemen, nach nicht mal einer Woche waren es 5.000. Erst als diese Daten an O2 geschickt wurden, erkannte man dort das Problem (an) und versprach Lösungen in Form von Netzausbau.

Dieses Beispiel zeigt sehr schön, dass es Bereiche mit hochdynamischen Entwicklungen gibt, die nicht kalkulierbar sind, so lange sie nur durch theoretische Annahmen und Prognosen bewertet werden. Hier fehlte bei der Steuerung der Netzinfrastruktur der Abgleich mit realen Daten, der durch eine Verknüpfung aller Serviceanfragen hätte gelingen können. Oder anders herum: Es gab genügend Daten, die das Problem viel früher hätten aufzeigen können, nur waren sie nicht mit einander verbunden und konnten so nicht richtig analysiert werden. An die Servicedatenbank angeschlossene KI-Systeme können solche Zusammenhänge sehr leicht herstellen.

Es gibt sicher noch viele weitere Beispiele, bei denen eine fehlende Verknüpfung von bestehenden Daten unangenehme und vor allem vermeidbare Folgen hatte. In den meisten Fällen dürfte das aber nicht bekannt werden. Für Unternehmen kommt es jetzt darauf an, die vielen bestehenden Daten sinnvoll zu verknüpfen und vielfältige Potenziale auch zum Nutzen der Konsumenten abzurufen. Für den einen oder anderen mag Big Data und eine Verknüpfung der Informationen beängstigend sein, doch man muss sich einfach klar machen, dass diese Daten eh schon vorhanden sind. Es geht nun um eine datenschutzkonforme und im Sinne des Kunden eingesetzte Auswertung der bislang unstrukturierten Daten.

Alle Informationen zu den kommerziellen Anwendungen von Watson hat IBM auf einer Übersichtsseite zusammengafasst. Die Preise für die unterschiedlichen Angebote können Unternehmen direkt bei IBM erfragen. Den aktuellen Stand von Watson gibt diese Infografik sehr schön wieder (anklicken für volle Größe):

Foto: ibmphoto24 (CC BY 2.0)
Foto: ibmphoto24 (CC BY 2.0)

Falk ist Freier Journalist und Blogger und berät zudem Unternehmen bei ihrer digitalen Kommunikation, der Content Strategie und der Distribution von Inhalten im Social Web. Online zu finden ist er auf seinem privaten Blog, bei Twitter und Google+.