Moneycab: Herr Schleier, schon seit Jahren werden Sprachtechnologien als "the next hot thing" gehandelt. Künstliche Intelligenz, Sprachsteuerung von Suchmaschinen und von Anwendungen in der Virtuellen Realität scheinen nun einen zusätzlichen Schub gebracht zu haben. Wo stehen wir heute, welches sind die wichtigsten Anwendungsgebiete?
Jürg Schleier: Wir stehen am Anfang einer Entwicklung, die unseren Umgang mit elektronischen Geräten massiv verändert. Die Spracherkennung wird auf unser zukünftiges Leben einen ähnlichen gravierenden Einfluss haben, wie die Einführung der ersten Handys in der Mitte der Neunziger Jahre. Das zeigen auch die diversen Artikel mit der Überschrift «Mobile First war gestern - heute gilt Voice First», die in letzter Zeit erschienen sind.
Die wichtigsten Einsatzbereiche sehe ich in den Bereichen Voice-Interfaces, Speech-2-Text und Voice-Biometrie. Grundsätzlich kann gesagt werden, dass ein Grossteil der Computer- oder Mobile-Texteingaben, die bisher über die Tastatur erfolgten in der Zukunft über Spracheingabe erfolgen werden. Das gilt im Besonderen für Mobiles, wo jede Eingabe, die über drei Worte hinausgeht sowieso mühsam ist. Und jeglichen Kundenkommunikation, die einfach und strukturiert abläuft eignet sich für die Automation oder Halb-Automation mittels Speech-2-Text-Erkennung.
Nebst der Fähigkeit, das gesprochene Wort in Text zu wandeln und strukturiert zu verarbeiten (digitale Sprachanalyse), gewinnt der Aspekt der Sicherheit (biometrische Stimmerkennung) zunehmend an Bedeutung. Wie sicher ist diese Art der Identifikation, wo wird sie heute schon eingesetzt?
Die Voice-Biometrie ist mindestens so sicher wie ein Schweizer Pass. Fälschung sind theoretisch möglich, aber der technische Aufwand für eine gute Fälschung ist sehr gross und die meisten Betrugsversuche, sind einfach erkennbar. Das wichtigste Argument für die Voice-Biometrie ist die Benutzerfreundlichkeit. Die für die Kunden mühsamen (und unsicheren) Sicherheitsfragen für die Verifikation können durch eine Prüfung der Stimme im Hintergrund ersetzt werden und das Gespräch mit dem Kunden kann sich von Beginn weg auf das Kundenanliegen konzentrieren. Einige Schweizer Retailbanken haben mit entsprechenden Pilotprojekten mit Spitch begonnen. Das erste Kunden-Feedback ist sehr positiv.
Sie haben gerade mit Avaloq für deren Bankenlösung ein Sprachinterface entwickelt. Wo kommt die neue Lösung zum Einsatz und was bedeutet das für die Bankkunden?
Zusammen mit Avaloq haben wir einen ersten einfachen Prototypen entwickelt, der aufzeigt, wie der Kunde einer Avaloq-Bank ganz einfach per Stimme über das Telefon seinen Kontostand abfragen kann. Für die Implementierung und die Integration in Avaloq haben wir ca. zwei Wochen benötigt. Zusammen mit Avaloq denken wir aber noch über weitere Use-cases nach. Die automatische Erstellung von Kundenberater-Gesprächs-Protokollen und die voicebiometrische Erkennung des Avaloq-Bankkunden gehört mit dazu.
Die offensichtlichen Kosteneinsparungen durch Sprachtechnologien in Call Center und im Kundendienst mal beiseite gelassen, welche neuen Geschäftsbereiche können sich zum Beispiel Banken und Versicherungen mit den neuen Sprachtechnologien erschliessen?
Da gibt es eine ganze Reihe von sinnvollen Anwendungsmöglichkeiten: «Voice-User-Interfaces» für Chatbots ist eine Anfrage, die wir häufig hören. Viele Unternehmen haben damit begonnen, Ihren Kunden «Chatbot» Dialoglösungen anzubieten. In den meisten Fällen sind diese Chatbots aber auf dem Handy nur sehr umständlich zu bedienen und ein (Spitch-)Sprach-Interface kann die Bedienerfreundlichkeit und die Akzeptanz des Chatbot durch den Kunden massiv erhöhen.
Die automatische Messung der Kundenzufriedenheit (NPS) ...
Den vollständigen Artikel lesen ...