“Siri versuch es noch einmal” – haben AI-Assistenten jetzt ihren Durchbruch?

Der Protagonist meines Science-Fiction-Romans „Das Register“ besitzt eine virtuelle Assistentin, die ihm in jeder Lebenslage hilft – sie steht immer bereit, ist Ansprechpartnerin für Termine und Recherche, beantwortet E-Mails. Einen Monat, nachdem ich die Arbeit an dem Buch begonnen hatte, erschien Amazon Alexa und ich erwog, die virtuelle Assistentin aus meinem Manuskript zu streichen. Wie sollte ich etwas als Science-Fiction verkaufen, das sogar meine Eltern im Wohnzimmer stehen hatten?

Im Nachhinein waren meine Befürchtungen unbegründet. Siri, Alexa und der Google-Assistent waren und sind so begriffsstutzig, dass es wehtut, und zwar aus zwei Gründen:

  1. Begrenztes Sprachverständnis: Selbst scheinbar einfache Anfragen („Schalte die Wohnzimmerlampe ein“) werden häufig fehlgedeutet und führen dann entweder ins Leere oder, was meist schlimmer ist, zu einem „Ich habe folgendes bei Wikipedia gefunden.“

  2. Schlecht integriert: App-Entwickler müssen jede Funktion, die Siri und der Google Assistent unterstützen sollen, manuell verknüpfen – ein Aufwand, den viele nicht eingehen.

Siri ist das einzige Apple-Produkt ohne Fangemeinde und die von Google und Amazon verschleuderten Smart Speaker verstauben in den Wohnzimmern. Allenfalls dienen sie dem Zweck, für den Jeff Bezos sie ursprünglich erfunden hatte: als Aufnehmer von Bestellungen 1. Ändert sich das jetzt?

Das erste, echte Siri-Upgrade

In dem KI-Wettrüsten, das sich die Big-Tech-Konzerne zurzeit liefern, war lange unklar, wie Apple sich positionieren würde. Zwar verdichteten sich die Gerüchte, dass Siri das erste große Update seit Jahren bekommen würde 2, aber als die Nachricht eines Deals mit OpenAI durchsickerte, brachte das viele Analysten aus dem Takt. Hatte Apple den Plan eines eigenen KI-Modells verworfen? Würde OpenAI auf die lokalen Informationen eines iPhones zugreifen, und wie sollte das gehen?

In Wahrheit folgt Apple (mal wieder) dem Leitsatz guter Strategien: erarbeite dir eine wertvolle und einzigartige Position, an die dir niemand folgen kann. Selten war das so klar wie diesmal. Ja, Siri wird in Zukunft auch auf ChatGPT zugreifen können3, aber Apple verspricht vor allem, „die Leistung generativer Modelle mit persönlichem Kontext zu verbinden“. Und Holy Moly, dieses Versprechen halten sie ein! Folgende Anwendungsfälle sollen in Zukunft mit Siri möglich sein:

  • „Finde Fotos von Maya beim Skateboarding im Batik-Outfit“ → Siri durchsucht die Fotos
  • „Spiel den Podcast, den Jamie empfohlen hat“ → Siri findet heraus, ob Jamie den Podcast in einer Nachricht oder einer E-Mail erwähnt hat, findet die Folge und spielt sie ab
  • „Wann kommt Mamas Flug an?“ → Siri findet die Fluginfos und vergleicht sie mit Echtzeitdaten
  • „Ruf ihn an“, wenn man gerade die Erinnerung erhalten hat, Opa zum Geburtstag zu gratulieren

An dieser Stelle ein Disclaimer: bis jetzt haben wir ausschließlich retuschierte Videos von Labor-Demos gesehen. „Vor 6 Jahren sollte Google Assistant auch alle meine Termine verwalten“, ätzte ein User auf X . Und auch Apple hat eine Tradition von Siri-Werbefilmchen, die mit der Realität wenig zu tun hatten.

Auf der anderen Seite sind die von Apple präsentierten Features seit langem in der Mache und beruhen auf einem Best-of der aktuellen Machine-Learning-Technologien.

  1. Ferret-UI: Ein von Apple entwickeltes Sprachmodell erkennt, was auf dem Smartphone-Screen dargestellt wird und kann die entsprechenden Buttons bedienen.
  2. Semantic Index: Eine von Apple entwickelte Vektor-Datenbank enthält alle persönlichen Informationen, die das Betriebssystem zu packen bekommt – von Telefonanrufen über Fotos bis zu allen E-Mails.
  3. Foundation Models: Apple hat mehrere Sprach- und Bildermodelle entwickelt, die teils auf dem Gerät laufen (und dort 3 GB Memory benötigen), teils in der Cloud.

Was heißt das für App-U

Die Vorstellung, dass die neuen Möglichkeiten Generativer KI ein Goldenes Zeitalter für AI-Assistenten einläuten, ist nicht neu. Google bastelt an ganz ähnlichen Konzepten wie Apple, Gerüchten zufolge an einem exklusiven Assistenten für das Google Pixel („Pixie“). Gadgets wie das Rabbit R1 gehen noch einen Schritt weiter und bieten die gängigen Dienste ausschließlich über einen Chatbot an. Das Fundament dieser Konzepte ist die These, dass Apps ein Problem sind, dass es zu lösen gilt. Ich habe meine Zweifel an dieser Behauptung.

Der Schriftsteller Umberto Eco verglich das gedruckte Buch einmal mit Erfindungen wie Löffel, Hammer, Rad oder Schere und konstatierte: „Sind diese Dinge erst einmal erfunden, lässt sich Besseres nicht mehr machen.“ Ich glaube, einen ähnlichen Bezug könnte man zur Kombination aus Smartphone und Apps schlagen. Smartphones sind „ein nahezu perfektes Gerät für die Aufgabe, die wir von ihm verlangen“ und das liegt vor allem an ihrer Bedienung. Sie beruht darauf, dass wir eben nicht formulieren müssen, was wir gerade vorhaben. Tippen ist leichter als sprechen.

Meistens jedenfalls. Es gibt natürlich auch umständliche, verschachtelte Apps, mit unzähligen Menüs und Formularen, die wir im schlimmsten Falle immer wieder aufs Neue bedienen müssen. Siri kann uns gerne von diesen Apps befreien. Was bedeutet das für die Unternehmen dahinter?

Es gibt zwei Kategorien von Apps, in denen persönliche Assistenten keine Gefahr für das Geschäftsmodell darstellen:

  1. Interface als Mittel zum Zweck: Die App ist ein Anhängsel für eine Dienstleistung außerhalb der App (z. B. Smart Home Apps), kein Wettbewerbsvorteil. Das sieht man dem Design meist auch an.
  2. Interface ist das Produkt: Soziale Netzwerke, Spiele, Content-Plattformen, komplexe Produktivititäts-Apps. Siri kann nicht für mich TikTok-Videos gucken.
    In der Gefahrenzone sind Apps, die sich vor allem über ihre User-Experience definieren. Wenn Nutzer sich für einen Essenslieferanten oder einen Fahrdienst-Vermittler entscheiden, weil dessen App so gut funktioniert, dann kann Siri und Gemini genau dieses Alleinstellungsmerkmal eliminieren. Auch Apps, die über ihre Oberfläche verkaufen – und zwar nicht nur Dinge, nach denen Nutzer gesucht haben – verlieren wichtigen Real Estate.

Ich kann mir nicht vorstellen, dass AI-Assistenten die Apps, die wir jetzt gerne und häufig benutzen, ersetzt. Es wäre jedenfalls echte Science-Fiction.


  1. „Jeff wrote his own narrative about a device he called the Amazon Puck. It would sit on your countertop and could respond to voice commands like, ‘Puck. Please order a gallon of milk.’ Puck would then place the order with Amazon.“ – Aus: Working Backwards – Insights, Stories, and Secrets from Inside Amazon (Colin Bryar, Bill Carr, 2021) ↩︎

  2. Die Gerüchte, dass Apple genau nicht an einem ChatGPT-Klon arbeiten würde, sondern Siris Kernkompetenzen besser machen würde, überwogen: Apple Will Revamp Siri to Catch Up to Its Chatbot Competitors - The New York Times ↩︎

  3. Der einzige Mehrwert darin, dass man als User nicht zur ChatGPT-App wechseln muss. Dafür muss man allerdings jedes Mal „ChatGPT“ antippen. ↩︎