Moderne Spracherkennung
Die moderne Spracherkennung ermöglicht es, dass wir mit den digitalen Geräten reden können, als wären sie Menschen. Bisher war die Interaktion im digitalen Alltag beschränkt auf Tastatur und Maus oder Touchscreen. Die Kommunikation musste also bislang immer über die Finger geschehen. Doch die moderne Spracherkennung macht es möglich, dass diese Interaktion mit den Computern, den Smartphones und dem Internet auf eine uns Menschen vertrautere und schnelle Methode ausgeweitet wird: die gesprochene Sprache.
Verschiedene Anbieter nutzen diese Technologie bereits, am bekanntesten sind die digitalen Assistenten Siri von Apple, Alexa von Amazon, Google Home und Cortana von Windows 10. Welche Gefahren und welche Chancen birgt diese neue Entwicklung? Wir wollen vier Aspekte vorstellen und zur Diskussion stellen – zwei positive, aber auch zwei negative Punkte.
Gefahr Nr. 1: Abhörung, Datenschutz, Privatssphäre
Die Frage, die sich jeder beim Thema der modernen Spracherkennung stellt, ist folgende:
„Ist jedes Gerät nun eine Wanze, die ständig mithört?“
Diese Bedenken kannten auch die Unternehmen, bevor und während sie ihre Geräte herstellten. Die intelligenten „Smart Home“-Systeme wie Google Home und Amazon Echo (kleine Computer in Größe von Getränkedosen mit Mikrofonen, Lautsprechern und Internetverbindung) stehen in der Wohnung und warten auf ein Befehlswort. Erklingt das Befehlswort, startet die Spracherkennung, der eingebaute kleine Computer stellt eine Internetverbindung her und die durch den Nutzer gestellte Frage wird verarbeitet und beantwortet. Die „Sprachfetzen“nach dem Befehlswort werden über das Internet an den Diensteanbieter übermittelt und dort auch gespeichert. Diese Speicherung soll vor allem die Erkennung der ganz individuellen Sprache des Nutzers verbessern und ist der größte Angriffspunkt für daten- schutzrechtliche Bedenken. Wo werden diese „Sprachfetzen“gespeichert, wer hat Zugriff darauf, werden sie weiterverarbeitet und wie lange werden sie gespeichert? Erst eine dauerhaft befriedigende Antwort auf diese Fragen wird den Datenschutzaspekt der modernen Spracherkennung absichern. Grundsätzlich sind die Unternehmen an Datenschutzgesetze gebunden und die Nutzer müssen sich darauf verlassen, dass diese eingehalten werden. Doch die Spracherkennung ist eine Technologie, die missbraucht werden kann. Ob Atomkraft, Ottomotor oder Spracherkennung – in dieser Hinsicht gleichen sich alle Technologien: eine 100prozentige Sicherheit gibt es nicht.
Gefahr Nr. 2: Der Mensch verdummt
Spielt man das Szenario durch, dass sich die Spracherkennung und die digitale Sprachassistenz mittelfristig durchsetzen wird und die Datenschutzbedenken beigelegt werden können, offenbart sich die potenzielle Gefahr einer Gesellschaft, insbesondere einer neuen Generation, die sich voll und ganz an ihre digitalen Sekretäre gewöhnt und angepasst hat, sich vollends auf sie verlässt. Das Erledigen von Schulhausaufgaben ist passé, da das reine Vorlesen einer Aufgabe ausreicht, um das Smartphone oder den Smart Home Assistenten die Antworten recherchieren zu lassen.
Doch nicht nur in der Schule führt diese Form eines digitalen imaginären Freundes, der schnelle Antworten auf fast alle Fragen hat, zu einer Änderung des Umgangs mit „gelerntem Wissen“. Die Aneignung von auswendig gelernten Fakten wird obsolet und der Mensch gerät in eine „Verdummungsspirale“. Man muss einfach nicht mehr so viel selbst wissen, wenn alles Wissen ständig abgefragt werden kann. Natürlich ist diese Sicht sehr eindimensional und überzeichnet, doch die Gefahr, die dem Szenario zugrunde liegt, ist real und sollte Beachtung finden. Zwar ist die ständige Verfügbarkeit von Information über das Internet auch ohne Spracherkennung möglich, doch nun kann das gespeicherte Wissen noch schneller und einfacher abgefragt werden.
Chance Nr. 1: Die Tastatur kommt ins Museum
Für viele Menschen ist das Tippen an der Tastatur ein langwieriges Unterfangen, die Zehn-FingerTechnik beherrschen nur wenige. Bis die eigenen Gedanken handschriftlich auf ein Blatt Papier gebracht sind, das dauert schon lange genug. Doch den Worten über die Tastatur in die digitale Welt zu verhelfen, ist für viele Nutzer, ob jung oder alt, etwas, das keinen Spaß macht und einfach länger dauert. Das menschliche Gehirn kann so viel schneller denken als die Finger tippen oder schreiben könnten. Es gibt aber einen natürlichen Weg der Kommunikation, der uns angeboren ist, den wir perfekt beherrschen und der in Schnelligkeit bisher unschlagbar ist: das Sprechen.
Bei der Eingabe von E-Mails, Geschäftsbriefen, privaten WhatsApp-Nachrichten oder SMS sind große mechanische oder kleine berührungsempfindliche Tastaturen bisher unumgänglich gewesen. Die Spracherkennung übernimmt nun zunehmend die Aufgabe der Übertragungen der Worte, die man im Kopf hat, auf das Blatt Papier oder auf den Bildschirm. Sie sprechen ganz einfach vor sich hin und die Spracherkennung „hört zu und schreibt mit“, ganz so, als hätte man seinen Sekretär.
Diese Änderung wird vor allem den Menschen eine große Hilfe sein, die körperliche Einschränkungen beim Tippen auf einer Tastatur haben. Ob Arthose, Multiple Sklerose oder Parkinson, bei vielen Krankheiten ist die Spracherkennung ein unvorstellbar hilfreiches Werkzeug der Neuzeit.
Chance Nr. 2: Jeder hat einen persönlichen Assistenten
Zukünftig wird die Spracherkennung durch künstliche Intelligenzen verstärkt werden. Dadurch wird nicht mehr nur das Eintragen von Erinnerungen in den Kalender oder das Vervollständigen der Einkaufsliste per Spracherkennung möglich sein. Sondern auch komplexe Aufgaben und Anfragen können durch die digitalen Butler erledigt werden. So kann bei einem kleinen Defekt der digitale Butler nach einer Reparaturanleitung gefragt werden, woraufhin er die Schritte zur Reparatur mit Ton und Bild unterstützt.
Aber auch die Arbeit in der Küche kann auf neue Ebenen gehoben werden: Fünf-Sterne-Menüs auf den eigenen Kochplatten werden mit einer individuellen Anleitung eines digitalen Assistenten möglich, indem der Nutzer im ständigen Dialog mit dem digitalen Butler steht. Der Nutzer teilt dem digitalen Butler mit, was alles im Kühlschrank vorhanden ist, woraufhin ein Menü aus den vorhandenen Lebensmitteln automatisch recherchiert wird. Der Assistent gibt in der Küche Anleitungen, wann was getan werden muss und der Mensch gibt fast wie in einem Gespräch Antworten oder Rückfragen – das Kochen wird durch das interaktive Rezept begleitet.