Datenkraken im Wohnzimmer
Hintergrund Sprachassistenten wie Alexa lauschen, ob wir Fragen an sie haben. Wie aber lässt sich sicherstellen, dass die Privatsphäre gewahrt bleibt?
München Alles ist eins, alles ist verbunden: Kaffeemaschine, Lichtschalter, Heizung, Türschloss – und all das mit dem Internet. Im Haus von morgen genügt ein Sprachbefehl der Bewohner, um das Badewasser einzulassen, eine Geste, um den Fernseher zu bedienen. Unsere Gewohnheiten, Wünsche und Befehle aber sind wertvolle Informationen für Konzerne wie Amazon und Google. Diese verwerten die Daten und verdienen damit Milliarden. Mit ihren Sprachassistenten Alexa und Co. kommen sie uns dabei so nah wie nie.
Rund die Hälfte der Sprachassistenten, die bereits heute in den Haushalten stehen, stammen von Amazon und Google. Und sie werden immer beliebter: Die Gesamtzahl der Geräte weltweit soll von derzeit rund 100 Millionen auf mehr als 300 Millionen bis zum Jahr 2022 zunehmen, berichtet der Technologiemarkt-Beobachter Canalys. Nahezu drei Viertel von ihnen wird mit Amazons oder Googles Technik ausgestattet sein, schätzen die Branchenexperten.
Datenschützern bereiten diese Zahlen Sorgen. Denn sobald die Alltagsassistenten per Stichwort (etwa „Alexa“oder „Okay Google“) aktiviert werden, übertragen sie ungefilterte Aufnahmen inklusive Hintergrundgeräuschen in ihre jeweilige Cloud. Das sind zentralisierte, oft weit entfernte Rechnerparks mit riesigen Speicherkapazitäten. Was dort mit den Daten passiert, bekommen die Nutzer nicht mehr mit. „Niemand möchte, dass alle Dinge, vor Ort passieren, eins zu eins irgendwohin übertragen und dort gespeichert werden“, warnt Thomas Bendig, Forschungskoordinator am Fraunhofer-Verbund für Informationsund Kommunikationstechnologie in Berlin. Es sei unbedingt notwendig, dass solche Informationen beim Nutzer blieben.
Aber was sagen Unternehmen wie Amazon selbst zu dem Problem? Und was machen sie überhaupt mit den Daten, die aus unseren Häusern stammen? In der Cloud würden die Daten auch genutzt, um die Algorithmen, also die Rechenprozesse zu verbessern, „damit Alexa noch besser verstehen und reagieren kann“, teilt Amazon mit. Der Kunde könnte dies aber ablehnen: „Wir erlauben unseren Kunden, der Datenverwertung für Trainingszwecke in den Alexa-Einstellungen zu widerspre- chen.“An Dritte würden keine Sprachdaten weitergegeben. Wirklich?
Im Dezember kam es nach einem Bericht des Magazins c’t zu einer Panne: In auf Anfrage zugesandten Dateien fand ein Kunde ihm völlig fremde Aufzeichnungen. Der Konzern sprach von einem „unglücklichen Fall“infolge „eines menschlichen Fehlers“.
Dabei gäbe es längst einige Möglichkeiten, das Material der Nutzer auch vor Ort zu belassen. Eine Methode heißt Edge Computing – Rechenleistung am Rande (Edge) der Cloud. Die Daten werden dabei dezentral nah am Nutzer gesammelt und verarbeitet. „Das kann zum Beispiel der ganz normale InternetRouter übernehmen, den wir im Haus stehen haben“, erklärt Andreas Seitz, wissenschaftlicher Mitardie beiter am Lehrstuhl für angewandte Softwaretechnik der TU München. Möglich sei aber auch, dass solche Prozesse direkt auf der Hardware ablaufen, auf der die Sprachassistenten installiert sind.
Eine Firma, die diesen Weg geht, ist das Start-up Snips mit Sitz in Paris und New York. Snips stellt Sprachassistenz-Systeme für Geschäftskunden her, die diese in ihre Geräte einbauen können. Die Privatsphäre der Nutzer habe dabei oberste Priorität, betonen die Verantwortlichen. „Es fühlt sich einfach falsch an, dass ein Konzern Zugriff auf ein Mikrofon hat, das in der eigenen Wohnung steht“, meint Snips-Mitgründer Rand Hindi.
Die Speicher- und Rechenleistung, die zum maschinellen Verständnis der Sprachbefehle notwendig ist, liegt bei Snips deshalb nicht auf weit entfernten Serverfarmen, sondern auf den Geräten selbst. Stimme und Hintergrundgeräusche bleiben so an Ort und Stelle – ohne dass jemand ungewollt darauf zugreifen kann.
Andreas Seitz von der TU München glaubt zwar nicht, dass Edge Computing die Cloud bald ersetzen wird. Gerade bei künstlicher Intelligenz oder maschinellem Lernen benötige man riesige Rechenleistungen. „Diese Dinge in einem Edge durchzuführen, ist unrealistisch“, sagt er. Informationen filtern, bündeln und nur das Nötigste an die Cloud senden – das können EdgeGeräte aber leisten. Für die Privatsphäre wäre das schon ein Fortschritt. Matthias Arnold, dpa