VoiceBank-Forschungsprojekt: Conversational Qualitative Banking

Ein Gastbeitrag von Steffen Blümm von adorsys

Finanzen sind ein wichtiger Teil unseres täglichen Lebens. Es geht sowohl um unseren täglichen Bedarf an Wohnen, Essen, Freizeit, wie um Bildungsbudget für unsere Kinder, Investitionen und Altersvorsorge. Finanzen sind also eigentlich zu bedeutend, als dass wir sie ausschließlich am Computer oder Smartphone handhaben können. Sprachassistenten-basierte Devices machen Banking über Smartphone und computer-basiertes Online-Banking hinaus verfügbar, und ermöglichen somit einer größeren Gruppe von Nutzern ihre Finanzen flexibel handzuhaben. 

Bei der adorsys haben wird Ende 2016 ein Forschungsprojekt gestartet, welches sich mit Voice-Banking beschäftigt und welchem wir später den Namen VoiceBank gaben. Das Ziel war nicht nur klassische Online-Banking-Informationen über Sprache zugänglich zu machen. Uns war von Anfang an bewusst, dass wir nicht nur die Informationsarchitektur neu denken mussten, sondern auch die Services für und an sich.

Weiterhin war uns bewusst, dass wir noch viel stärker im Spannungsfeld zwischen Komfort und Datenschutz agieren als mit herkömmlichen Technologien. Um Prozesse zu vereinfachen müssen wir mehr über das Leben unserer Nutzer lernen, um sie besser unterstützen zu können. Hierfür müssen wir uns mit umsichtiger Interaktion eine Vertrauensbasis schaffen.

Ubiquitous Computing oder Ambient Computing

Ubiquitous Computing (UbiComp) beschreibt die Interaktion mit Computern in einer Art, in der die Services und Recheneinheiten im Hintergrund allgegenwärtig sind. Sie treten nicht mehr in den Vordergrund in Form von dezidierten Geräten wie Smartphone oder Computer, sondern integrieren sich in den Raum. Daher spricht man auch von Ambient Computing. Die Interaktion wird also nicht mehr durch unnatürliche Abstraktionen erschwert, sondern fügt sich transparent in die Umgebung ein.

„In the twenty-first century the technology revolution will move into the everyday, the small and the invisible.” (M. D. Weiser)

Vom Computer, über Smartphone und Smart-Watch, bis hin zum Smartspeaker und Smart-Home — in der Form haben wir eine immer stärkere Anpassung an das Bestehende und die Technologie integriert sich immer unauffälliger. War der Unterschied vom klassischen Mobiltelefon zum Smartphone noch verhältnismäßig groß (Touchscreen vs. Tastatur), sind die Unterschiede zwischen Smart-Watches und herkömmlichen Uhren geringer. Sprachgesteuerte smarte Lautsprecher gehen so weit, dass sich die sichtbare Nutzerschnittstelle am Gerät auf eine Statusanzeige reduziert. Ein intuitives Interaktionsdesign vorausgesetzt, treten wir in den Bereich des Ubiquitous Computing ein. Sicherlich, Spracherkennung muss noch sicherer, komfortabler und natürlicher werden. Dann jedoch sind für viele Menschen die Hürden für die Interaktion minimal.

Inclusive Design — Zugänglichkeit für einen größeren Kundenkreis

Technology mit graphischen Interfaces hat es erlaubt die Usability von Services stark zu erhöhen. Allerdings stellt sie nach wie vor viele Anforderungen: der Nutzer muss gut sehen, oft mit beiden Händen interagieren, sowie lesen und oft auch schreiben können. Wir können hier von physischen Anforderungen (Accessibility), wie von entwicklungsspezifischen und kulturellen Anforderungen an den Nutzer sprechen.

In Bezug auf die physischen Anforderungen können potenzielle Nutzer permanente, temporäre oder situative Einschränkungen erfahren. So kann ein Nutzer zum Beispiel temporär mit seinen Händen die Interaktion nicht frei steuern, da er sich den Arm gebrochen hat. Ein anderer kann dies nur situativ nicht, da er ein Kleinkind auf dem Arm hält, oder mit dem Auto unterwegs ist.

Hinzu kommt, dass nicht jeder lesen und schreiben kann. Es kommt ebenfalls vor, dass unsere Kenntnis einer Sprache es uns erlaubt in der mündlichen Kommunikation zu einem gewissen Grad sprechen und verstehen zu können, aber das Lesen und Schreiben werden nicht ausreichend beherrscht. Dies trifft insbesondere zu, wenn wir an Sprachen denken, in denen sich die Schrift grundlegend von derjenigen der Heimatkultur unterscheidet — zum Beispiel Japanisch. In diesem Fall können sprachgesteuerte Bedienschnittstellen Interaktionen vereinfachen oder ermöglichen.

Weiterhin wird Menschen, welche mit Technologie unerfahren sind, wie beispielsweise älteren Menschen, der Zugang zu digitalen Services erleichtert. Sowohl in Stuttgart wie auch in anderen Ländern wurden mit sprachgesteuerten Assistenten (Roboter und virtuelle Assistenten) in Verbindung mit älteren Menschen gute Erfahrungen gesammelt. Leider ist es oft einfacher Ageism zu zelebrieren, wie mit einem Prototyp hinauszutreten und Konzepte zu evaluieren.

Inclusive Design bedeutet also weniger Menschen auszugrenzen, indem man mehrere Modalitäten und somit Interaktionsmöglichkeiten anbietet, welche sich besser in die Lebensumstände und Situationen der Nutzer integrieren lassen. Sprachgesteuerte, multimodale Geräte können hierbei eine wichtige Rolle spielen.

Multimodalität

Benutzerschnittstellen mit unterschiedlichen Modalitäten ermöglichen die Verarbeitung von unterschiedlichen Daten mit unterschiedlicher kognitiver Last (cognitive load). Bestimmte Daten lassen sich visuell effektiver erfassen und verarbeiten, andere auditive. Multimodale Benutzerschnittstellen wie Alexa, Siri oder Google Assistent auf Geräten mit Bildschirmunterstützung können eine ausgeglichene Interaktion bieten. Durch die Kombination von visueller und auditiver Ausgabe, sowie sprach- und gestengesteuerter Eingabe lassen sich Informationen optimiert an den Nutzer übermitteln.

Wir müssen uns besser überlegen, welche Informationen für den Nutzer in welchen Situationen relevant sind und wie wir die Darbietung optimieren können. Responsive Design erlaubt es Oberflächen zu skalieren. Aber anstelle Techniken zu verwenden, um Informationen auf Oberflächen angepasst zu positionieren, wollen wir nur für den Nutzer relevante Informationen bereitstellen. Je mehr personenbezogene Daten wir vom Nutzer haben, desto mehr müssen wir das Spannungsfeld zwischen Komfort und Datenschutz beachten. Relevanz ist die beste Wegbeschreibung, um hier vertrauenswürdig unterwegs zu sein.

Qualitative Banking

Wenn wir uns heute Banking-Experiences ansehen, dann scheinen sie auf ein sehr schmales mentales Model ausgerichtet. Für Menschen, die gerne Zahlenkolonnen studieren, sind diese sicherlich interessant. Die Banking Experience aus den 80iger Jahren des letzten Jahrhunderts im vergangenen Jahrtausend wird digital dargeboten.

Conversational Qualitative Banking — das VoiceBank-Forschungsprojekt

Anstatt den Kontoauszug auf Papier durchzugehen, können wir ihn digital abrufen. Sicherlich, es gibt auch Use-Cases hierfür, aber ist das die primäre Erfahrung, die wir in der Interaktion mit unserer Bank und unseren Finanzen möchten?

Dieser quantitativen Erfahrung können wir eine qualitative, auf Relevanz basierte gegenüberstellen: Um zu erfahren, ob mein Gehalt schon eingegangen ist, brauche ich keine Liste an Zahlungsbewegungen, und ich benötige nicht einmal den Geldbetrag. Ein einfaches Ja oder Nein ist ausreichend. Um zu wissen, ob sich mein Aktienfond gut entwickelte, brauche ich keine absoluten Zahlen, vielleicht brauche ich noch nicht einmal relative Zahlen. Auch hier könnte eine einfache, qualitative Antwort ausreichen.

Capital One stellte bei der Auswertung des Nutzungsverhaltens mit ihrem Alexa-basierten Bankingassistenten fest, dass viele Nutzer nach qualitativen Informationen fragten. Kunden fragten, ob alles in Ordnung sei; ob die Entwicklungen auf dem Girokonto oder Aktienportfolio positiv seien. Die wenigstens Menschen wollen immer die genauen Zahlen studieren, sie wollen einfach ein gutes Gefühl haben.

Voice-Banking profitiert in mehreren Dimensionen von qualitativen Ansätzen. Qualitatives Banking ermöglicht es uns Nutzern relevante Informationen zur Verfügung zu stellen, ohne persönliche Daten preisgeben zu müssen. Der Sprachassistent muss mir nicht sagen, wie hoch mein Gehalt ist, sondern nur, dass es eingegangen ist. Er muss mir nicht sagen, wie viel Geld ich auf meinem Konto habe, sondern nur, dass keine auffälligen oder unerwarteten Buchungen gefunden wurden. Für Einzelheiten kann ich mir später, in einem ruhigen Moment, immer noch an meinen Computer setzen und Buchungslisten studieren.

Nicht übermittelte Daten können die Privatsphäre des Nutzers auch nicht kompromittieren.

Ein weiterer Vorteil von Conversational Banking ist Geschwindigkeit. Sprachsteuerung kann dazu beitragen Prozesse zu beschleunigen. Bei US Bank kann der Kunde über Spracheingabe eine Transaktion mit einem Satz durchführen. Sicherlich, hierzu müssen die Systeme (APIs und Integrationen) verfügbar sein, aber eine Überweisung kann schneller durchführen, als sich ein Computer zum Online-Banking-Portal verbunden, oder der Nutzer die App auf dem Smartphone gefunden hat. Für die Kunden der US Bank macht die Sprachsteuerung auch den Funktionsumfang des Service intuitiver verfügbar. Funktionalitäten werden von mehr Nutzern gefunden als bei der Navigation über Menüverzweigungen in GUI-basierenden Nutzerschnittstellen.

Das VoiceBank-Projekt

Wie schon erwähnt haben wir uns bei diesem Forschungsprojekt vorgenommen, Prozesse neu zu denken. Wir haben uns überlegt, an welchen Stellen wir unseren Nutzern mit qualitativen Informationen weiterhelfen können. Auf diese Weise wahren wir Vertraulichkeit, ungeachtet der Situation, in der sich der Kunde befindet und unabhängig vom Plattformprovider (Amazon, Google oder Apple). Weiterhin nutzen wir Konzepte, wie sie im Banking noch nicht vertreten sind, wohl aber bei modernen Zahlungsdienstleistern: Überweisungskontakte.

Diese können vom Nutzer angelegt werden, oder das System lernt sie. Darüber hinaus sollte das System auch über die Möglichkeit verfügen auf vertrauliche Weise mit dem Nutzer zu kommunizieren – indem es beispielsweise flüstert, die Modalität (nur visueller Output) oder den Kanal (Push-Notification auf das Smartphone des Kunden) wechselt. US Bank hat ein ähnliches Konzept bei ihrem Sprachassistenten umgesetzt.

„Nutzerkontakte können vom Nutzer angelegt werden, oder das System lernt sie.

Mit Hilfe unseres CUI Prototyping Tools konnten wir in offenen Usability-Tests Probanden diese Aufgabe einfach stellen — den Banking-Assistenten aufzufordern vertraulich mit ihnen zu kommunizieren. Hierbei war es uns praktisch möglich direkt vom Nutzer zu erfahren, was er sich darunter vorstellt.

Ein weiterer Punkt, welchen wir genau betrachteten, war die Authentifizierung. Wie können wir den Nutzer authentifizieren? Stimmerkennung halten wir nicht für sicher genug, es gibt zu viele Möglichkeiten sich nichtsdestotrotz Zugang zu erschleichen. Eine PIN, welche der Nutzer sagen muss, war uns ebenfalls zu unsicher. Wir können nicht immer sicherstellen, dass uns niemand zuhört.

Aber wir waren uns sicher, dass alle Nutzer unseres Conversational Bankingassistenten auch ein Smartphone nutzen. Insofern haben wir beschlossen ein System aufzusetzen, in dem der Bankingassistent eine Push-Nachricht an die dazugehörige App auf dem Smartphone sendet, damit der Nutzer sich darüber mit Fingerabdruck oder Gesichtserkennung authentifizieren kann. Nach erfolgter Authentifizierung gibt die App die Session frei. Qualitative Informationen könnte man also abrufen, ohne sich authentifizieren zu müssen. Für tiefergehende Informationen muss der Nutzer kurz zu seinem Smartphone greifen. Falls er eine Überweisung tätigen möchte, benötigt er dies sowieso. In diesem Fall kann der Nutzer dem Assistenten die TAN einfach mitteilen, da diese nur einmal gültig ist und somit die Sicherheit nicht kompromittiert wird.

Der Picture-Passcode ist ein weiteres Verfahren, um sich zu autorisieren. Dieses haben wir kürzlich konzipiert und getestet. Hierbei handelt es sich um ein visuelles Passwort, welches auch in Situationen zu Einsatz einsetzbar ist, in denen ein Smartphone nicht verwendet werden kann. Wir haben es im Kontext Autofahren anhand eines Prototyps getestet. Allerdings ist es auch vorstellbar es in anderen Situationen zu evaluieren, in denen kontaktlosen Zahlen erwünscht ist.

Conversational Qualitative Banking — das VoiceBank-Forschungsprojekt

Nichtsdestotrotz, moderne Banking-Experiences zeichnen sich nicht nur durch überlegte, in verschiedenen Situationen nutzbare Nutzerschnittstellen aus. Der gesamte Service muss stabil und zuverlässig funktionieren. Die Herausforderungen steigen mit der Anzahl der Fremdservices, welche man einbinden muss und welche mehr Gewinn für den Nutzer bringen. Für moderne Banking-Experiences sind dies sehr viele.

Durch die Verfügbarkeit von Multibanking-Lösungen wie dem Open Banking Gateway der adorsys, können auf PSD2-basierte Zugriffe auf Kontodaten schnell angebunden werden. Mit der ModelBank können so neue Bankingerlebnisse verhältnismäßig einfach konzipiert und später mit dem Open Banking Gateway in Betrieb genommen werden. Dies erlaubt mehr Aufmerksamkeit auf die Prozesse und auf die Experience legen zu können.

Conversational Banking

Conversational Banking kann für den Nutzer viele Prozesse beschleunigen und das Abrufen von Finanzinformationen in vielen Situationen erleichtern. Insbesondere, wenn neben Multimodalität und Inclusive Design auch die qualitative Dimension von Informationen berücksichtigt wird. Qualitatives Banking kann dem Kunden oft genug Informationen bereitstellen ohne datenschutztechnisch Implikationen nach sich zu ziehen. Die Möglichkeiten für ein neues Banking-Erlebnis sind vielseitig. Wir können damit wirkliche Erleichterungen in das Leben unserer Kunden bringen.

Bei adorsys machen wir komplexe Technologien intuitiv zugänglich. In unseren interdisziplinären Projektteams findet immer ein reger und regelmäßiger Austausch zwischen Designern und Entwicklern statt, um für den Endnutzer ein positives Erlebnis zu gestalten. Besuchen Sie unsere Website, damit wir auch für Ihre Nutzergruppe das optimale Softwareprodukt unter UX/UI-Berücksichtigung konzeptionieren und entwickeln.


Zum Nachlesen und -hören

http://www.vs.inf.ethz.ch/publ/papers/UbicompLogin.pdf

https://www.ics.uci.edu/~corps/phaseii/Weiser-Computer21stCentury-SciAm.pdf

https://ubiquity.acm.org/article.cfm?id=985617

Richard Weeks, Head of Conversational Experiences at US Bank, Voicebot Podcast Ep 165

Autor
Steffen Blümm ist ein Experience Architect, Hybrid Designer und Creative Technologist. Bei der adorsys betreut er als Principle Knowledge Architect die Bereiche Conversational User Interfaces (CUI) und Research. In dieser Funktion ist er auch Lehrbeauftragter an verschiedenen Hochschulen für die... mehr

Der beste Newsletter ever.

Wir versorgen dich wöchentlich mit News, ausgewählten Artikeln und Kommentaren zu aktuellen Themen, die die Finanz-Branche bewegen. Jetzt anmelden!