Heimkino-Kommandeur: TV und Konsole gehorchen aufs Wort
Berlin (dpa/tmn) - Ob Siri beim iPhone oder Android-Sprachassistent: Smartphones gehorchen aufs Wort. Doch damit nicht genug. Nun schallen auch Sprachbefehle zum Dirigieren von Fernseher und Co durch Deutschlands Wohnzimmer.
Den Griff zur Fernbedienung sollen sich TV-Zuschauer künftig ganz sparen können. Immer mehr Hersteller arbeiten mit Hochdruck daran, dass der Fernseher Stimmbefehle empfängt, erkennt und umsetzt. Das trifft auch auf andere Gerätegattungen wie Spielkonsolen zu. Die Technologie der Sprachsteuerung hat sich in den letzten zwei Jahren deutlich verbessert, sagt Andreas Nolde von der Zeitschrift „Chip“.
Der Einsatz einer neuen Art neuronaler Netze habe zu einer Reduktion der Fehlerrate um 30 Prozent geführt, erklärt Prof. Dietrich Klakow, Experte für Sprachsignalverarbeitung an der Universität des Saarlandes.
Bei Fernsehern gibt es zwei Bereiche, in denen sich der Nutzer zum sprachgewaltigen Heimkino-Kommandeur aufschwingen kann. Dazu gehören zum einen Grundfunktionen wie Lautstärkeregelung sowie Wechsel von Sender oder Signalquelle. Zum anderen geht es um die Navigation durch Dienste, Inhalte und Apps.
„Ist die Sprachfunktion aktiviert, kommt es für den Sprechenden darauf an, klar zu artikulieren, was er möchte“, sagt Jürgen Sewczyk, Vorstandsmitglied der Deutschen TV-Plattform. So sei es etwa ein wesentlicher Unterschied, ob man „ProSieben“ oder „Sender ProSieben“ sagt. Im ersten Fall bekomme man alle Videos und Webseiten mit ProSieben-Bezug aus dem Netz angezeigt. Im zweiten Szenario schaltet der Fernseher den TV-Sender um.
Damit die TV-Sprachsteuerung gut funktioniert, empfiehlt Prof. Klakow, nicht übertrieben akzentuiert, sondern möglichst normal zu sprechen. Mit einem Akzent oder Umgebungsgeräuschen kann es immer noch Probleme geben. Und natürlich kann man den Geräten meist nicht erzählen, was man will. „Das hängt von der Anwendung ab“, sagt der Experte. „Bei einer Spielekonsole kann man natürlich nur das Vokabular verwenden, das dafür relevant ist.“ Im Zweifel muss man die Befehle im Handbuch nachlesen.
„Die Lautstärke der gesprochenen Steuerungsbefehle ist weniger entscheidend - besonders bei Smart-TVs, die das Mikrofon in die TV-Fernbedienung eingebaut haben“, erklärt Jürgen Sewczyk, der bei der TV-Plattform die Arbeitsgruppe Smart-TV leitet. Da verschiedene Sprachsteuerungssysteme existieren, gebe es keinen Kanon an Befehlen. Die bestimmt allein der Hersteller. Praktisch sei aber die Lernfähigkeit mancher Systeme. Je mehr Menschen Smartphone, TV, Spielkonsole, Navi oder beliebige andere Geräte per Sprache steuern, desto besser wird die Technik. „Die dabei gesammelten Daten können verwendet werden, um das akustische Modell, also wie ein bestimmter Laut ausgesprochen wird, das Vokabular und die Grammatik zu verbessern“, erläutert Prof. Klakow.
Jürgen Sewczyk ist überzeugt, dass man die TV-Sprachsteuerung nicht isoliert von den Erkennungssystemen anderer „smarter“ Geräte wie Tablets, Computer, Laptops und Smartphones betrachten kann. Die Fortschritte bei Hard- und Software und die zunehmende Akzeptanz und Erfahrung der Nutzer strahlten auf die Unterhaltungselektronik ab: „Die Zukunft gehört in jeden Fall lernfähigen, robusten Systemen zur Sprachsteuerung mit großer Sprachenvielfalt und frei wählbaren Begriffen.“
Momentan bieten viele TV-Hersteller Apps zur Bedienung der Geräte per Smartphone oder Tablet. Diese setzen derzeit jedoch meist nur die Oberfläche der TV-Fernbedienung grafisch um. „Neuere Steuerungsapps nutzen die ohnehin in diesen Geräten verfügbare Sprachsteuerung auch für die Steuerung beziehungsweise Navigation des Smart-TVs“, erklärt Sewczyk. „Das erspart dann dem Hersteller, extra Mikrofone in sein Smart-TV-Gerät oder die Fernbedienung einzubauen.“
Bleibt noch das Thema Datenschutz. Denn einige Features von Sprachsteuerungen sind nur mit Internetverbindung nutzbar. „Was generell für Smart-TVs gilt, gilt auch für die Sprachsteuerung“, sagt Sewczyk. Es würden allenfalls anonymisierte allgemeine Daten erhoben, etwa zur Häufigkeit der Nutzung und gegebenenfalls die IP-Adresse des Geräts. Und wenn bei einer Sprachsteuerung anonymisiert Art und Anzahl der Begriffe oder Aussprachemuster erfasst werden sollten, dann nur, um den Dienst zu verbessern. Eine Identifizierung des Sprechenden anhand seiner Stimme gebe es derzeit aber nicht - auch nicht zu Zwecken der Personalisierung.