AI ist in aller Munde und jeder will darüber sprechen oder zumindest mal mitreden. Aber so richtig verstanden, was es mit dieser „AI“ auf sich hat und was die Grundvoraussetzungen sind damit AI zum Einsatz kommt – das haben leider die wenigsten.
Das hat was mit Daten zu tun
Im Politiker- und Presse-Jargon hört man nur noch “Daten sind das neue Öl” – wie jetzt? Soll ich jetzt meinen Verbrennungsmotor demnächst mit Daten tanken? Was genau bedeutet der Kram schon wieder und warum brauche ich überhaupt Daten für AI?
Fangen wir einfach an. AI gibt es so schon mal gar nicht. AI oder künstliche Intelligenz ist ein breites Feld und lässt sich sehr grob unterteilen in mehr oder minder einfache Statistik (laaaaangweilig), unterstütztes Lernen (viele markierte Fotos mit Kategorie „Katze“) und das super duper angesagte „deep learning“ (Haufen Fotos, sieh zu ob Du eine Katze findest). Die “alte” Vorgehensweise im Bereich AI (die der Minsky verzapft hat) probierte über Regeln einem Computer beizubringen, was die “Realität” ist (hat vier Beine, ist klein, kann wuschelig sein, oder nicht, hat Schnurrhaare → Katze).
Wie gut das funktioniert kann sich jeder überlegen, der sich 50-Katzen-Bilder anguckt und daraus probiert Regeln zu formulieren um daraus eindeutig eine Katze zu beschreiben. Diese sogenannten “Experten-Systeme” waren eher so lala schlau.
Die Sache mit dem „deep learning“
Besser wurde das Ganze, als man die Rechenleistung und Daten (Öl?) hatte um hunderttausende Bilder von armen Studenten klassifizieren zu lassen (tolle Beschreibung für „der arme Student musste das Bild in den Ordner ‚Katze‘ schieben“). Die Hälfte dieser klassifizierten Bilder wurden dann einem Algorithmus zum Training gegeben („hier, lern das jetzt!“). Nach dem Training wurde der Algorithmus mit der anderen Hälfte der Bilder und mit anderen Bildern konfrontiert und die nächste Horde Studenten musste kontrollieren, ob die Katze richtig erkannt wurde. Diese Ja-/Nein-Antworten wurden dem Algorithmus wieder zurück gefüttert und das ganze wiederholte man so lange, bis der Computer das mit der Katze kapiert hat.
Das „deep learning“ ist der Part, der uns Menschen am unheimlichsten ist. Dafür füttert man einen Algorithmus nicht mit hunderttausenden sondern Millionen (und wenn‘s geht noch mehr) Daten und der Algorithmus probiert selber herauszufinden, woran es eine Katze auf dem Bild erkennt. Auch hier gibt es wieder die Ja-/Nein-Schleife (und noch mehr arme Studenten).
Soviel zu AI in 5 Minuten. Bei AI geht es also vereinfacht gesagt um nichts anderes als um Muster (Pixelhaufen in Bildern) zu finden und diese einem Konzept (Katze) zuordnen zu können. Das Ganze mag bei Fotos und Bilderkennung ja noch einigermaßen “einfach” sein. Aber was soll daran jetzt toll sein oder was bringt mir das, wenn ein Computer Katzen auf Bildern erkennen kann? Und wie tanke ich jetzt mein Auto mit den Daten??
AI in echt
Beim Thema AI werden immer gerne komplizierte Szenarien genutzt. Die Bild-erkennung wird irgendwann sooo gut, dass man nicht mal mehr unerkannt aufs Klo gehen kann! Ok, aber will wirklich echt jemand wissen, dass ich auf Klo gehe? So richtig spannend ist das ja jetzt für mich auch nicht, denn ich bin ja live dabei. Also, was hab ich nun davon? Ziehen wir mal ein etwas realistischeres, wenn auch nerdigeres Beispiel heran.
Inzwischen sollten die meisten Konsumenten ja mitbekommen haben, dass es so etwas wie Sprach-Assistenten (z.B. Siri, Cortana, Alexa und Google Assistant – immer noch dämlich, dass ihr euch nicht einigen könnt, dem Ding einen Namen zu geben!!!) gibt.
Diese Dinger sollen uns ja angeblich das Leben erleichtern. Außerdem soll das ja AI “in echt” sein. So können diese Assistenten einem tatsächlich tollen Antworten liefern (Erdumfang? check. Wer ist Frau Merkel? check. Wie hat der HSV gespielt? Reden wir nicht drüber.). Aber was passiert, wenn ich diese Assistenten mit einer “echten” Frage konfrontiere?
Alex: kaufe Taschentücher
Alexa (oder ihr anderer bevorzugter Assistentenname – außer bei Google, weil die keinen Namen vergeben konnten): kaufe Taschentücher!
An diesem Beispiel wollen wir mal AI “in echt” untersuchen und vor allem durch die einzelnen Anbieter und deren Datenbestände gehen um endlich zu verstehen, was es mit den Daten und dem Öl auf sich hat. Ignorieren wir zunächst diesen ganzen technischen Quatsch mit Sprache zu Text, dann daraus verstehen was der Mensch meint und so weiter. Wir fangen “danach” an.
Taschentücher? Was ist denn das? Der Konsument möchte offensichtlich ein Produkt kaufen, aber er gibt uns ein generisches “Konzept” (Taschentücher) und keinen Produktnamen. Ach Du Schreck, und nun? Nun kommt das mit der AI. Was sind Taschentücher? Jetzt nicht die Minsky’sche Definition im Sinne von: Zellstoff, meist weiß und weich, manchmal quadratisch, bla bla bla. Sondern im Kontext Kaufen? Vereinfacht gesagt kommt es auf den Markt und natürlich den Konsumenten an. Simplifizieren wir weiter.
Daten, Daten, Daten
Der Konsument lebt in Deutschland (Daten!!). Was sind die dominanten Taschentuch-Marken in Deutschland? Softis und Tempo (Daten!!). Gibt es sonst noch Marken? Ja, gefühlt hunderte andere Produkte, die auch als Taschentücher klassifiziert sind (Daten!!). Also sind wir im ersten Schritt bei Softis, Tempo und noch hundert anderen. Sind die hundert anderen (longtail) irgendwie unterscheidbar? Ja, es gibt unterschiedlichste Eigenschaften (günstig, Eigenmarken, besonders weich, mit bunten Bildern, etc, etc, etc,). Mist!
Was ist die Erwartungshaltung von uns als Konsument? Wenn ich ein Tempo-Typ bin und ich bekomme Softis geliefert oder vorgeschlagen, werd ich im besten Fall nicht glücklich sein – im schlimmsten Fall definiere ich den Assistenten als “dumm” und “nutzlos” und nutze ihn immer weniger bis gar nicht mehr. Also mussdie AI das mit den Taschentüchern hinbekommen!
„Die AI MUSS das mit den Taschentüchern hinbekommen!“
A, B oder C – Du musst dich entscheiden. 3 Felder sind frei
Wir sind bei Softis, Tempo oder “mir doch egal” (longtail mit hunderten Varianten). Wie kriege ich diese Frage gelöst? Oder, anders gefragt: wer könnte heute schon diese Frage so gut wie möglich lösen?
Wie im Titel ja schon ketzerisch angedeutet, wird beim Thema AI eigentlich nur noch über die noch-Dominanz der amerikanischen Tech-Konzerne gesprochen respektive wie lange diese noch (oder schon nicht mehr) ihre “Vormacht-Stellung” gegenüber den chinesischen Tech-Titanen behaupten können. In Europa philosophieren wir derweil noch darüber, ob wir das mit dieser AI überhaupt wollen. Und, wenn ja, wie wir dann denn überhaupt wollen. Aber zurück zu unseren Taschentüchern. Wer weiß denn heute schon eine gute Antwort? Fangen wir bei den GAFA’s an.
Apple
Was ist ein Taschentuch? Im Apple Store gibt es keine Taschentücher und wenn doch, würden sie 29€ kosten. So oder so ähnlich dürfte es um das Wissen zu unserer kritischen Taschentuch-Frage bei Apple ausschauen, oder?
Was weiß Apple über mich? Es weiß, wo ich war (iOS-GPS-Daten). Hilft das bei Taschentüchern? Hm, vielleicht. Wecken wir mal den inneren AI-Spezialisten. Es ist Frühling (weiß ich das? check), es ist Pollenflug angesagt (weiß ich das? check), der Nutzer geht in eine Apotheke / Drogerie / Supermarkt (weiß ich das? check). Geht der Nutzer bei starkem Pollenflug mehr oder weniger in Apotheken / Drogerien / Supermärkte (weiß ich das? check). Sagen wir mal: mehr. Was heißt das jetzt in Bezug auf Taschentücher? Nix. Wir wissen nur, dass der Nutzer bei Pollenflug mehr einkaufen geht. Warum, wissen wir nicht. Kleiner Nachtritt in Sachen Präzision: ob Apple das mit den Apotheken und Drogerien wirklich hinbekommt, dürfte noch fraglich sein. Apple Maps liegt immer noch gefühlte Dekaden hinter Google Maps.
Ich hab auf meinem iPhone nach Taschentüchern gesucht! Haha!! Apple weiß es! Nicht wirklich. Zwar könnte man als Konsument Safari auf dem iPhone nutzen. Aber die default-Suchmaschine ist? Google. Könnte Apple über Safari eingegebene Suchbegriffe trotzdem erfahren? Ja. Wenn ich dann auf Tempo klicke, wüsste es Apple dann? Ja.
In der Theorie
Ich habe von meinem letzten Einkauf bei der Online-Apotheke eine Mail bekommen und da hatte ich Tempo eingekauft. Apple hat doch Zugriff auf meine Mails, also weiß Apple das. Puh, also in der Theorie ja.
Sprechen wir nicht darüber, dass Online-Apotheken-Einkäufe noch in der absoluten Minderzahl sind (lohnt sich der Aufwand für Apple) und dass die meisten auf dem iPhone abgerufenen eMail-Konten keine Apple-eigenen Konten sind (das Parsen von eMails will man lieber auf dem Server und nicht auf dem iPhone machen). Aber: in der Theorie wäre das eine Möglichkeit. HAHA! Ich habe per ApplePay letztens meine Taschentücher gekauft. Apple weiß es! Leider nein. Zunächst mal Glückwunsch: Sie leben in der Zukunft und kaufen auch bei “modernen” Händlern ein, aber Apple erhält bei der Zahlungs-abwicklung nur einen Betrag und den Händler.
Ob der Einkauf für 0,49€ per ApplePay (LOL in Deutschland !!! Ich lach mich weg), bei der Apotheke (ok, jetzt ist‘s vorbei mit dem Realismus) oder dem Supermarkt (echt jetzt?) allerdings für Taschentücher oder Gummi-bärchen war, das weiß Apple nicht. Denn die Einzelposten der Rechnung werden nicht an Apple übertragen. Aber hey. Netter Versuch.
Fazit: Apple hätte vielleicht eine Chance über den Umweg „Suche“ oder (unwahrscheinlicher) „eMails“ herauszufinden, was für den Nutzer Taschentücher bedeuten.
Facebook
Wie aus den inzwischen unzähligen Datenskandalen um Facebook und Co.(Instagram, Messenger, WhatsApp) bekannt sein dürfte, weiß Facebook ja wesentlich mehr über mich als mir lieb ist. Also, Facebook: „Was bedeuten Taschentücher für mich?“ Habe ich Tempo oder Softis bei Facebook geliked? Es gibt Menschen, die tun sowas. Wenn Ja – Bingo. Folge ich Tempo oder Softis bei Instagram? Wenn Ja, dann Ja. Wenn nicht? Hm. Werden wir wieder kreativ.
Habe ich beim Facebook-Messenger, bei Facebook-Kommentaren oder Instagram-Kommentaren jemals das Wort „Softis“ (im Kontext von Taschentüchern oder Tempo) genutzt? Bedeutet die Nutzung von Tempo als Wortersatz von Taschentuch auch, dass ich ein Tempo-Nutzer bin (Wahrscheinlichkeit dürfte hoch sein)? Wenn ja, dann ja. WhatsApp ist diesem Text-Mining gegenüber bisher “noch” immun, da die Unterhaltungen hier Ende-zu-Ende verschlüsselt sind und Facebook auf diese Weise die Nachrichtentexte zu unserem Taschentuch-„Zweck“ und anderen Dingen nicht analysieren kann.
Tempo- oder Softis-Fraktion?
Was noch? Können Sympathiebekundungen auf Facebook, wenn einer meiner “Freunde” jammert wie schlimm der Heuschnupfen doch wieder ist, ein Indikator dafür sein, dass ich eher ein Softis- oder Tempo-Typ bin statt longtail (unter der Annahme: Allergiker würden eher Markenprodukte nutzen). Oder bei eigenen “Jammer-Posts” über Heuschnupfen oder bei Bildern mit roter (irritierter) Nase und leicht geschwollenen Augen, die zeitlich und örtlich mit höherem Pollenflug zusammen passen könnten?
Wenn jedoch mein restliches soziales Profil (Facebook ist schließlich hinter Google der zweitgrößte Online-Vermarkter) darauf hinweist, dass ich generell eher preissensitiv bin, dann spräche das gegen Markenprodukte und doch für longtail-preissensitive Produkte. Apropos Bilder. Gibt es irgendwo Bilder, auf denen eine Taschentuchpackung zu sehen ist? Und, wenn ja, lässt sich diese Packung identifizieren? Falls dem so ist, kann Facebook die Taschentuchfrage beantworten.
So langsam aber sicher dürfte einem dämmern, warum das mit den Daten so wichtig wird. Und falls jemand tatsächlich meint, dass Facebook keinen Aufwand betreiben wird, “nur” um herauszufinden ob ich Tempo- oder Softis-Taschentücher kaufe, sollte sich eines fragen: Wie viel Geld wird Facebook den Unternehmen hinter Tempo (dem schwedischen Konzern Essity) oder Softis (dem italienischen Konzern Sofidel) an Geld für Werbung wohl aus der Taschen ziehen können, wenn sie den Unternehmen mit an Sicherheit grenzender Wahr-scheinlichkeit sagen können, dass ich der jeweils anderen “Taschentuch-Fraktion” angehöre?
„So langsam aber sicher dürfte einem dämmern, warum die Sache mit den Daten so wichtig wird.“
Fazit: Facebook kann gegebenenfalls mit enormer Sicherheit (bei likes / follows, Textmining) meine Taschentuch-Frage beantworten oder aber wenigstens mit einiger Wahrscheinlichkeit eine Präferenz erkennen.
Amazon
Habe ich jemals bei Amazon Taschentücher eingekauft? Wenn ja, dann weiß Amazon natürlich, wie sie die Taschentuch-Frage zu beantworten hat. Wenn nein, wird es dünn. Amazon hat im Gegensatz zu Apple kein mobiles Betriebssystem und auch keinen Zugriff auf einen Browser. Auch Rückschlüsse über das Parsen von eMails kann Amazon nicht ziehen.
Aber es gibt noch Amazon Pay! Wenn also eine Online-Apotheke tatsächlich Amazon Pay einsetzen würde und ich dort Taschentücher gekauft hätte, was dann? Es kommt drauf an. Üblicherweise gilt für Online-Zahlungsdienstleister wie Amazon Pay das gleiche wie für Offline-Zahlungsdienstleister wie ApplePay (oder die sich dahinter versteckende Kreditkarte). Amazon Pay würde den Betrag, allerdings nicht die Einzelposten des Einkaufs sehen. Analog gilt das ebenso, wenn man den Taschentuch-Kauf per Amazon-Kredikarte getätigt hätte. Man erkennt so langsam, warum Amazon in den USA Whole-Foods gekauft hat und Gerüchten zufolge schon seit Jahren bestimmte Supermarkt-Ketten in Europa umkreist.
Wenn Amazon jemals erfolgreich den Online-Supermarkt etablieren möchte (im Sinne von Lebensmitteln / Produkten des täglichen Bedarfs), muss Amazon zwingend an die Daten des Konsumverhaltens im Supermarkt kommen.
Der Weg über Amazon PrimeNow und Amazon Fresh ist nett, aber da fängt man halt bei null an („Was meinst du mit Taschentüchern?“). Aus den Vorlieben von Elektronik- oder Bücher-Käufen auf meine Taschentuch-Vorliebe zu schließen, ist nicht wirklich realistisch.
Fazit: Amazon kann entweder sehr genau (vorherige Einkäufe) oder gar nicht erkennen, was ich als Konsument mit Taschentüchern meine.
Google
Google hat von allen US-Tech-Unternehmen vermutlich die beste Möglichkeit die Frage nach den Taschentüchern zu beantworten. Analog zu Apple hat Google ein deutlich präziseres Bild zu meinem Standort zur Verfügung (warum Google Maps die heimliche Wunderwaffe von Google ist, demnächst in einem anderen Artikel hier). Durch die Kombination von Browser (Chrome), Google Maps und Android könnte Google sogar folgendes erschließen:
Angenommen ich suche als Konsument auf meinem Android gerade nach Taschentüchern, kann Google daraus schlussfolgern, dass es sich um erhöhten Pollenflug handelt und ich kurz darauf für 5-10 Minuten in einer Apotheke verschwinde. Außerdem besteht eine gewisse Wahrscheinlichkeit, dass ich gerade Taschentücher gekauft habe (ähnliches gilt in Kombination übrigens auch für iPhone Nutzer – Android ist hier nicht der Faktor).
Allerdings weiß Google dann immer noch nicht, welche Taschentücher. Das hilft genauso wenig der Einsatz von Google Pay (ähem Realismus), weil hier das gleiche gilt wie bei allen Zahlungsanbietern (Betrag nicht Einzelposten). Aber Google verfügt nicht nur über die dominante Suchmaschine und weiß daher ob ich nach Taschentüchern suche (“Taschentücher in meiner Nähe” vs “Tempo Taschentücher kaufen in Berlin Mitte”), woraus erneut Rückschlüsse gezogen werden können.
Denn hinzu kommt, dass jedes halbwegs bewanderte Online-Unternehmen natürlich die Tracker von Google Analytics einsetzt. Sprich: Selbst wenn ich “nur” nach Taschentüchern suche und auf der Google-Ergebnisseite “nur” auf den Link der Online Apotheke klicke, hat letztere mit Sicherheit die komplette Seite mit Google Analytics “vertaggt”. So kann Google bis auf den Warenkorb hinunter sehen welcher Artikel dort gelandet ist. Des Weiteren setzt Google auf allen GMail-Konten natürlich Text-Mining ein um eMails zu parsen. Im Gegensatz zu Apple passiert das bereits auf den Mail-Servern und ebenfalls im Gegensatz zu Apple lohnt sich der Aufwand für Google als weltweit größte Online-Werbungsplattform genauso wie er sich für Facebook lohnt.
Google Photos und Google Shopping tun ein Übriges. Eine Schwäche hat aber selbst ein Unternehmen wie Google. Im longtail-Bereich kann auch Google nur Annahmen treffen. Wenn ich also statt Tempo oder Softis auf die Eigenmarke einer gewissen Drogerie-Kette “stehe”, dann hat Google nur eine Möglichkeit an diese Erkenntnis zu kommen. Nämlich, wenn ich entweder dort online einkaufe (Tracking / eMail) oder aber die Algorithmen von Google mich aufgrund meiner Merkmale in eine so klitzekleine Kundengruppe einordnen kann, dass meine Peers auch exakt den gleichen “Taschentuch-Geschmack” haben.
Fazit: Wenn ein Unternehmen mit höchster Wahrscheinlichkeit die Taschentuch-Frage richtig beantworten kann, dann ist es Google.
Fazit
Soweit so gut. Ich hoffe, nun ist die Frage nach den Daten und dem Öl ein wenig klarer – und, nein, nix mit tanken. Wenn man sich nun vor Augen hält welches europäische Unternehmen auch nur einen Bruchteil der Daten der GAFAs im Zugriff hat, der kann sich ausmalen wie ein europäischer Sprachassistent die Frage nach den Taschentüchern beantworten würde (“Ein Taschentuch ist ein ….” – am besten vorgestellt mit einem näselnden, französisch-deutschem Akzent). Ohne diese Massen an Daten (mit all ihren Konsequenzen / Implikationen) sind die einfachsten Fragen trotz AI einfach nicht zu beantworten (ob man das wirklich braucht oder will ist eine andere, typisch europäisch-philosophische Fragestellung).
Ach ja, was war noch mal mit China? Ok im Schnelldurchgang die BATs. Baidu, siehe Google, Alibaba und Tencent haben bei ihren jeweiligen Zahlungsanbietern den Vorteil, dass sie echte Daten von Einkäufen in der realen Welt erhalten (also im Supermarkt). Zusätzlich erhalten diese die Einzelposten des Einkaufs, weil sie den Händlern z.T. die “Kassensysteme” zur Verfügung stellen. Und dann kann man in China ja auch einfach per WeChat eine Packung Taschentücher kaufen und sich nach Hause liefern lassen. Diese wird dann per AliPay oder WeChat Pay bezahlen. Online-to–offline findet in China in Dimensionen statt, die mit dem westlichen Begriff „omni-channel“ nicht abgebildet werden können.
P.S. Dieser Artikel ist Mitten in der Nacht (zwischen 4- und 6-Uhr morgens) erstellt worden, weil mein Heuschnupfen mich nicht hat schlafen lassen. Ohne die fünf Tempo-Taschentücher (was sonst?) wäre es mir nicht möglich gewesen diesen Content zu erstellen. So, Google, indizier‘ das! :)