Digitaler Sprachassistent

“OK Google, brauche ich heute einen Schirm?”, “Hey Siri, wo ist die nächste gute Pizzeria?” – was vor einigen Jahren noch belächelt wurde, ist heute bei vielen Menschen Routine: die Sprachsuche. Heute zählt diese zu den aktuell am schnellsten wachsenden Arten der Suche. Laut LSA insider haben 60 Prozent der Mobilgeräte-Nutzer im letzten Jahr mit der Nutzung von Sprachassistenten begonnen. Google gibt an, dass bereits 20 Prozent der Suchen auf Android-Geräten und in der mobilen App Sprachsuchen sind, Tendenz steigend. Der Trend zeichnet sich klar ab: Sich via Sprachsuche über Entertainment informieren, nach Informationen über lokale Unternehmen suchen, einfache Transaktionen durchführen und mit anderen Menschen oder Bots kommunizieren, steht heute an der Tagesordnung.

Ein hart umkämpfter Markt

Auch wenn die Sprachsuche gewiss noch in den Kinderschuhen steckt und gerade erst laufen lernt, ist der Wettbewerb um die absolute Vorherrschaft nicht nur eröffnet, sondern bereits seit ein paar Jahren in vollem Gange. Waren es früher die großen Telekommunikationsunternehmen, wie T-Online oder AOL, die die Besucherströme zu den Online-Diensten lenkten, so beeinflussen heute die Gerätebetreiber und ihre Betriebssysteme die Steuerung der Besucherströme maßgeblich.

Google Now 2.0

Wenn es um das Thema Suche geht, hat der Suchmaschinenriese Google natürlich einen enormen Wettbewerbsvorteil. Anhand von Chrome, Google Maps, Android Auto, Drive, Gmail und vielen weiteren Technologien versucht Google, genau zu verstehen, was und wie Nutzer nach Informationen suchen. Google Maps ist mittlerweile quasi Standard für die Standortermittlung geworden und die genaue Bestimmung der Standortdaten bildet für die Kontexterfassung bei der Sprachsuche einen wichtigen Grundpfeiler, sodass Google einen Großteil dieser Datenhoheit abdeckt. Kein Wunder also, dass Google natürlich auch beim Thema digitale Sprachassistenten ganz vorne mitmischt. Im Juni 2012 wurde der Sprachassistent Google Now als Bestandteil der Androidversion 4.1 “Jelly Bean” präsentiert. Mit dem Aktivierungswort “OK Google” lassen sich dann Sprachbefehle ins Smartphone, Auto oder den Android-TV-Fernseher rufen. Im Oktober 2016 stellte Google dann “Google Now 2.0” vor – den Google Assistenten – und damit seine Version, wie googlen in Zukunft funktionieren soll. Mit dem Google Assistenten möchte Google einen Schritt weitergehen, denn der neue Assistent soll in der Lage sein, seinen Nutzer kennenzulernen. Fragt man beispielsweise nach seiner Lieblingsmusik, weiß der Google Assistent, welche Musik gemeint ist und spielt diese mit der des Nutzers bevorzugten App ab. Fragen und Antworten werden darüber hinaus gespeichert, um später wieder Bezug darauf nehmen zu können. Der Dienst ist vorerst jedoch nur auf den Pixel-Smartphones zu finden. 2017 will Google dann auch anderen Herstellern die Integration des Dienstes in den eigenen Geräten erlauben.

apple siri

Apple's Sprachassistent Siri

Apple hat sein Sprachassistenten namens Siri im Oktober 2011 in das iPhone 4s integriert. Mittlerweile ist Siri auf allen nachfolgenden iPhones, MacBooks und auf Apple Car Play zu finden. Apple nutzt hierbei Bing für die Websuche und Yelp sowie Tripadvisor für Ergebnisse zu lokalen Unternehmen. Siri hilft seinen Nutzern unter anderem in den Bereichen Audio- und Video-Kommunikation, Messaging, Bezahl-Service, Bildersuche, Fitness und Mobilitätsbuchungen.

Microsoft Sprachassistenten Cortana

Microsoft Sprachassistent Cortana

Microsoft stellte seinen Sprachassistenten Cortana im April 2014 im Rahmen der Microsoft-Konferenz Build vor. Mit der Developer Preview vom Windows Phone 8.1 war den Nutzern in den USA die Beta-Version des Sprachassistenten zugänglich. Seit Windows 10 ist Cortana darüber hinaus auf dem Desktop- und Tablet-Betriebssystem sowie bei Windows 10 Mobile verfügbar. Bei der Websuche greift Cortana ebenfalls auf Bing zurück. Über den Sprachbefehl “Hey Cortana” kann Cortana Erinnerungen ausgeben, Pakete, Sportmannschaften, Interessen und Flüge nachverfolgen, SMS und E-Mails senden, den Kalender verwalten, Listen erstellen, sowie plaudern und Spiele spielen.

Amazon's Sprachassistent Echo

Seit November 2016 ist das Audio-Gerät samt Sprachassistent Amazon Echo auf dem deutschen Markt erhältlich. Amazon Echo reagiert auf die Aktivierungsworte “Alexa”, “Echo” oder “Computer” und nutzt ebenfalls Bing für die Websuche sowie Yelp für die Suche nach lokalen Anbietern. Amazon Echo beantwortet seinem Nutzer Fragen, liest Hörbücher, liefert Nachrichten, Verkehrs- und Wetterinformationen, gibt Informationen über Sportergebnisse, Spielpläne und vieles mehr. Amazon Echo lernt stetig dazu und wird über die Cloud automatisch um neue Funktionen und Skills aktualisiert.

Sprachassistent Facebook M

Facebook's Sprachassistent M

Auch Facebook ist gerade dabei, seinen digitalen Assistenten Facebook M aufzubauen. Facebook M ist direkt im Facebook Messenger zu finden und funktionierte in der Testphase 2015 im Vergleich zu seinen Konkurrenten nicht über die Spracheingabe, sondern schriftlich. Doch das sollte für Facebook sicherlich kein Problem darstellen und innerhalb kürzester Zeit integriert werden können. Denn Facebook verfügt dank der Telefonie-Funktion des Facebook Messengers sicherlich über tiefgehende Informationen. Ein weiterer Unterschied gegenüber der Konkurrenz ist, dass Facebook M aus einem selbstlernenden Algorithmus besteht und gleichzeitig von realen Menschen unterstützt wird, sobald der Algorithmus an seine Grenzen stößt. Aktuell ist noch nicht bekannt, auf welcher Datenbasis der Algorithmus an Informationen gelangt. Ziel ist es jedoch zu vermeiden, dass Facebook Nutzer, um an Informationen zu gelangen, den Facebook Messenger verlassen müssen. Facebook M soll dabei mehr als “nur” reine Informationen liefern und darüber hinaus beispielsweise konkrete Reservierungen oder Bestellungen tätigen können.

Digitale Sprachassistenten im Trend

Wie und warum wird die Sprachsuche genutzt?

Wie zu Beginn schon erwähnt, handelt es sich laut Google bereits bei 20 Prozent der Suchen um Sprachsuchen, Tendenz steigend. Doch warum ist die Sprachsuche so beliebt, wie wird diese genutzt und welche Sprachassistenten erfreuen sich der größten Beliebtheit?

Wer nutzt digitale Sprachassistenten?

Laut Bitkom heißt das Motto ganz klar “Sprechen statt tippen”. Demnach hat eine repräsentative Umfrage im Auftrag des Digitalverbands Bitkom herausgefunden, dass bereits jeder zweite Smartphone-Nutzer sein Gerät per Stimme bedient. Die Sprachsteuerung ist dabei vor allem bei jungen Nutzern beliebt: Bei den 14- bis 29-Jährigen nutzen bereits 54 Prozent die Sprachassistenten, unter den 30- bis 49-Jährigen sind es 54 Prozent und bei den 50- bis 64-Jährigen auch mehr als die Hälfte, 52 Prozent. Selbst in der älteren Generation (Nutzer ab 65 Jahre) gibt jeder Vierte Fragen oder Befehle per Stimme, statt über das Display, in das Smartphone ein.

Wozu wird die Sprachsuche genutzt?

nutzung sprachassistent

Dass die Sprachsuche sich immer häufigerer Nutzung erfreut, ist kein Geheimnis mehr. Doch wozu wird die Sprachsuche verwendet? Sprachbefehle wie  “Mama anrufen” scheinen besonders beliebt zu sein, denn 56 Prozent nutzen Siri, Google Now, Cortana und Co, um Kontakte anzurufen. Auch die Frage nach dem Weg ist ein beliebter Sprachbefehl. 51 Prozent bedienen mittels Sprachassistenten die Navigationssoftware. Ebenfalls die Hälfte der Nutzer suchen über Sprachbefehl nach Informationen oder verfassen Nachrichten. 33 Prozent verwalten ihre Termine mit Hilfe von Siri und CO oder nutzen diese als Wiedergabesteuerung von Entertainmentinhalten, wie beispielsweise Musik, Filme und Spiele. Außerdem wird der Sprachassistent gerne zur Steuerung von Smart Home Anwendungen (29 Prozent), um Produkte zu bestellen (14 Prozent), Statusinformationen abzufragen (12 Prozent) und zum mobilen bezahlen (4 Prozent) verwendet.

Welcher Sprachassistent wird verwendet?

Sprachassistent Nutzung in Deutschland

Hochgerechnet haben bereits 28,3 Millionen Deutsche mindestens einmal einen Sprachassistenten benutzt, das entspricht 47 Prozent aller Internetnutzer. Am beliebtesten scheint hierbei Google Now zu sein, 17 Millionen haben Ihr Smartphone oder Tablet bereits mit “OK Google” angesprochen. Knapp 11 Millionen haben Siri schon mal nach dem Wetter oder der nächsten Pizzeria gefragt. Microsofts Cortana haben schon 6,8 Millionen zur Hilfe gezogen. Das Küken unter den Sprachassistenten Amazons Echo haben immerhin schon 0,8 Millionen Deutsche benutzt.

Warum werden Sprachassistenten genutzt?

Wie fühlt es sich wohl an, wenn Google Now dich auf direktem Wege in den nächsten Stau lenkt? Oder Siri den gewünschten Song nicht versteht? Wenn Cortana deine ganze Frage nicht kapiert? Oder Amazon Echo dir die falschen Schuhe bestellt? Vielleicht ist der ein oder andere zunächst noch belustigt, doch das belustigt sein schlägt schnell in genervt oder gar verärgert sein um, was letztlich meist dazu führt, dass wieder zu Browser und Tastatur gegriffen wird. Dass 20 Prozent aller Suchen Sprachsuchen sind, liegt letztlich unter anderem an der stark sinkenden Fehlerquote. Denn diese ist in den letzten zwei Jahren radikal gesunken. Lag die Fehlerquote 2014 noch bei 20 bis 25 Prozent, war sie 2016 nur noch bei 8 Prozent – Tendenz stark sinkend. Jetzt, da die Sprachsuche immer besser funktioniert, spielt vor allem auch der Aspekt der Bequemlichkeit eine wichtige Rolle. Denn gegenüber der konventionellen Vorgehensweise sind über die Sprachsuche deutlich weniger Einzelschritte nötig. Möchte ich beispielsweise einem Freund über Paypal Geld überweisen, sind viele Schritte nötig: Browser öffnen, Paypal aufrufen, anmelden, im Menü nach der richtigen Option suchen, gewünschten Betrag eingeben, Empfänger eintragen, überweisen. Alternativ kann man auch einfach sagen “OK Google, überweise Sarah 20 Euro.” Ebenso kommt die Multi-Tasking-Funktion zum Tragen. Die Sprachsuche ermöglicht es seinen Nutzern, mehrere Dinge gleichzeitig zu tun. So schaut man beispielsweise fern und diktiert eine SMS, oder fügt während des Kochens Milch der Einkaufsliste hinzu. Ein weiterer Grund für die rasche Verbreitung ist ebenso die Tatsache, dass die Geräte mobil und vernetzbar sind: ob Uhren, Autos, Armbänder, Smartphones oder Haushaltsgeräte und seinen Nutzern so den Alltag erleichtern.

Sprachsuche für Unternehmen

Das eigene Unternehmen für das Thema Sprachsuche rüsten

Doch was bedeutet das für lokale Unternehmen? Wie können sich diese rüsten, um auch über die Sprachsuche gefunden zu werden?

Verbindungen der Suchsysteme

Verbindungen der Suchsysteme untersuchen

Zum einen gilt es für Unternehmen, die vielfältigen Verbindungen der Suchsysteme zu untersuchen. Hierbei ist für Unternehmen besonders wichtig, sowohl auf Yelp vertreten zu sein, als auch die eigene Website für Bing zu optimieren. Denn es besteht eine einheitliche Nutzung von Bing für die Websuche und Yelp für lokale Unternehmen durch die Systeme Apple Siri, Microsoft Cortana und Amazon Echo. D.h. besitzen Sie eine Pizzeria und sind nicht auf Yelp eingetragen, werden Sie über die Sprachsuche via Siri, Cortana und Echo von potenziellen Kunden nicht gefunden. Um auch über Google Now gefunden zu werden, sollten Sie ebenfalls einen Google My Business-Eintrag haben, als auch Ihre Webseite für Google optimieren. Ebenso gilt es für Unternehmen, die ihre Produkte online verkaufen, auf Amazon vertreten zu sein. Denn betreibt man nicht den Bestseller für eine Kategorie auf Amazon und stellt keinen Echo-Skill zur Verfügung, ist man im Amazon-Suchsystem nicht zu finden. Fragt man beispielsweise Amazon Echo nach einer Empfehlung für einen Staubsauger, wird der Top-Seller unter den Staubsaugern angeboten. Darauf folgt lediglich ein weiterer Vorschlag, das zweitbeste Angebot. Die Gewinner sind demnach ganz klar die Top-Anbieter der jeweiligen Kategorie.

Suchanfragen für Benutzerpfade

Analyse der Benutzerpfade der Bedarfsgruppe

Ebenso ist es wichtig festzustellen, welche Benutzerpfade die eigene Bedarfsgruppe geht, relevante Suchsysteme zu definieren, und für die rentabelsten Suchfragen zu optimieren. Dabei empfiehlt es sich, nicht nur an die Angebots-Suchbegriffe der Nutzer zu denken, sondern ebenso an deren Absicht. Denn durch das Denken in Absichten ist man in der Lage, einen Großteil der sprachlichen Formen seiner Bedarfsgruppe abzudecken. Hierbei sollte man sich folgende Fragen stellen:

  • Welche Suchsysteme nutzt meine Bedarfsgruppe?
  • Welche Fragen stellen sie sich?
  • Welche Begriffe werden dafür verwendet?
  • Welche Absicht haben sie?
Unternehmensprofile in Suchsysteme

Unternehmensprofile in den wichtigsten Suchsystemen

Einheitliche und konsistente Unternehmensprofile (Firmenname, Adresse, Telefonnummer, Kategorie) in unterschiedlichen Suchsystemen, Verzeichnissen und Apps sind ebenfalls profitable Maßnahmen für Unternehmen. Denn wie bereits erwähnt, ist die Sprachsuche eng an Verzeichnisse gekoppelt: Ist ein Unternehmen nicht auf Yelp eingetragen, wird es über Siri nicht gefunden. Gleiches gilt für einen Google My Business-Eintrag in Kombination mit Google Now. Für all die Unternehmen, die über die Sprachsuche gefunden werden möchten, ist ein Firmenprofil in den wichtigsten Suchsystemen unumgänglich.

Optimierung auf gesprochene Suchanfragen

Optimierung der Inhalte auf gesprochene Suchanfragen

Ebenso genügt es nicht mehr, die eigenen Inhalte nur auf bestimmte Keywords zu optimieren. Viel wichtiger ist es, mit diesen eine komplette Frage zu beantworten. Denn auf der Suche nach einer Pizzeria in Berlin, wird kaum ein Nutzer sein Smartphone fragen “Pizzeria Berlin”, sondern viel mehr “Wo ist eine Pizzeria in meiner Nähe?”. Und genau dementsprechend gilt es die bestene Inhalte hinsichtlich der W-Fragen (Wer, wie, was, wo, warum) zu optimieren.

mobile website

Mobile Websites

Zu guter Letzt muss Ihre Website, um über die Sprachsuche mit dem Smartphone gefunden zu werden, natürlich mobil optimiert sein. Denn nur mobile Website werden über die Sprachsuche berücksichtigt. Ob Ihre Website mobil ist, können Sie hier prüfen.

erste Suchposition

Erster Platz wird wichtiger denn je

Wie heißt es so schön: “Wer zuerst kommt, mahlt zuerst” – und das gilt bei der Sprachsuche mehr denn je. Denn die Antwort auf eine Frage besteht meist aus nur einem Ergebnis – und zwar dem besten. Deshalb ist der erste Platz wichtiger denn je – ganz gleich, ob auf der Suche nach Kontaktlinsen oder der Pizzeria in der Nähe. Wie bereits erwähnt, wird beispielsweise bei Amazon Echo nur der Top-Seller der jeweiligen Kategorie angezeigt, plus maximal ein weiteres Angebot. Gleiches gilt auch für die Suche nach lokalen Unternehmen. Zwar werden beispielsweise 15 Restaurants in deiner Nähe gefunden, jedoch nur eins oder zwei direkt auf dem Bildschirm angezeigt. Zur Übersicht der restlichen 13 gelangt man erst durch einen weiteren Klick.

Neue Zielgruppen erschließen

Neue Zielgruppen erschließen

Das Optimieren der eigenen Website für Bing und Google, sowie das Listing in relevanten Suchportalen sind grundlegende Dinge, die Unternehmen, die über die Sprachsuche gefunden werden wollen, tun müssen. Dann bietet die Sprachsuche Unternehmen ebenso die Chance neue Zielgruppen zu erschließen. Blinde, Analphabete oder auch Menschen, denen wichtige Körperteile wie Arme oder Beine fehlen, haben nun einen deutlich besseren Zugang zu den Weiten des Internets und den damit verbundenen Möglichkeiten und Diensten.

Optimierung der Sprachsuche

Noch ist nicht alles perfekt - die Herausforderungen

Da die Sprachsuche sprichwörtlich noch in den Kinderschuhen steckt, stehen Google, Apple und Co natürlich noch vor einigen Herausforderungen, die es in der kommenden Zeit zu bewältigen gilt. Auch wenn viele Funktionalitäten schon gegeben sind, muss noch an einigen Stellschrauben gedreht und optimiert werden:
  • Anknüpfen einer Suchanfrage an die vorangegangene; “Wie wird das Wetter heute in Berlin?” … “und in München?”
  • Das automatische Einbinden des Kontextes in die Suchabfrage, ohne diesen explizit zu erwähnen (Ort, Zeit, geöffnete Apps, etc.)
  • Der Umgang mit Dialekten und umgangssprachlichen Wörtern

Eine weitere wichtige Voraussetzung für den Erfolg ist die gelungene Integration von Drittanbietern. Denn je nach Suchsystem und integrierten Drittanbietern kann die Intensität der Transaktion stark variieren: “Wo kann ich Pasta bestellen?” vs. “Bestelle mir Spaghetti Carbonara!”. Doch letztlich liegt es an den Suchsystemen, den Drittanbietern und letztlich auch an den Benutzern selbst, die Chance zu nutzen und das Beste daraus zu machen. Für die Anbieter des Suchsystems beziehungsweise den digitalen Assistenten bedeutet das, gute Schnittstellen für Drittanbieter bereitzustellen. Drittanbieter hingegen müssen die Suchanfragen der Benutzer möglichst präzise voraussehen und entsprechende Lösungen dazu liefern. Doch auch die Benutzer selbst sind gefragt, denn nur mit konstruktivem Feedback kann der Verbesserungsprozess beschleunigt, Fehler behoben und das Projekt Sprachsuche einen entscheidenden Schritt vorangebracht werden.