Texte im Internet vorlesen lassen
Das Vorlesen von Texten ist eine sehr nützliche, aber relativ unbekannte Funktion, die in manche Browser integriert ist und vor allem bei längeren Texten eine große Hilfe sein kann. Das Vorlesen wird durch künstliche Intelligenz ermöglicht und ist ein weiteres Beispiel dafür, wie die sogenannte „KI“unseren Alltag erleichtern kann.
Vorlesefunktion bei Firefox und Edge
Die Vorlesefunktion findet man in den beiden Browsern Mozilla Firefox und Microsoft Edge. Beim Firefox ist die Funktion allerdings etwas versteckt und in die sogenannte „Leseansicht“integriert. Die Leseansicht-Funktion von Firefox entfernt störende Elemente wie Schaltflächen, Werbung, Hintergrundbilder und Videos. Zusätzlich können Sie über die Einstellungen der Leseansicht das Layout und Farbschema einer Webseite an Ihre persönlichen Vorstellungen anpassen. In diesen Einstellungen
findet man auch die Schaltfläche „Anhören“, mit der man den Text laut vorlesen lassen kann. Die Lesenansicht wird nicht auf allen Internetseiten angeboten, sondern nur auf solchen, die über genügend fortlaufenden Text verfügen. Man sieht dann in der dünnen Adresszeile des Firefox ganz rechts ein Symbol, das ein Blatt Papier darstellt. Klickt man darauf, so wird die Leseansicht aktiviert und man kann anschließend am linken Rand über das Symbol eines Kopfhörers das Vorlesen starten. Zudem können Sie Vorlese-Geschwindigkeit einstellen sowie zwischen männlicher und weiblicher Stimme wählen.
Beim Edge-Browser von Microsoft befindet sich die VorleseFunktion direkt in der Adresszeile des Browsers und wird dort am rechten Rand mit einem „A“gekennzeichnet. Beim Edge stehen besonders viele verschiedene Stimmen zur Auswahl und die vorgelesenen Texte klingen sehr flüssig und natürlich. Auch der Edge hat eine Leseansicht, die hier etwas umständlich mit „Plastischer Reader“benannt ist. Innerhalb dieser Leseansicht lässt sich ebenfalls die Vorlesefunktion aktivieren. Dies hat den Vorteil, dass auch wirklich nur der Haupttext auf der Seite vorgelesen wird. Verwendet man die Vorlesefunktion ohne die Leseansicht, so kann es passieren, dass auch die Menüs vorgelesen werden, die nicht zum eigentlich interessanten Inhalt der Seite gehören.
Wie funktioniert es?
Falls Sie an den technischen Hintergründen interessiert sind, so lesen Sie im Folgenden, wie das Vorlesen funktioniert. Die Technologie, die hier angewendet wird, nennt sich „Text-to-Speech“und läuft in mehreren Schritten ab:
1. Textanalyse:
Zunächst analysiert die Künstliche Intelligenz (KI) den Text, indem sie die Wörter, Sätze, Satzzeichen sowie die Struktur erfasst.
2. Linguistische Verarbeitung:
Die KI verwendet linguistische Modelle und Algorithmen, um den Text in phonetische Einheiten (Klänge) zu zerlegen. Dies dient dazu, die korrekte Aussprache der Wörter und Sätze zu bestimmen.
3. Sprachsynthese:
Gespeicherte Sprachdaten werden verwendet, um die entsprechenden Klänge und Betonungen für jedes Wort zu erzeugen. Diese Modelle wurden durch maschinelles Lernen trainiert, um menschliche Sprache möglichst authentisch nachzubilden.
4. Stimmenauswahl:
Viele Text-to-Speech-Systeme bieten eine Auswahl verschiedener künstlicher Stimmen an, aus denen Nutzer diejenige auswählen können, die ihnen am besten gefällt. Diese Stimmen können unterschiedliche Geschlechter, Alter, oder sogar Akzente haben.
5. Audioproduktion:
Basierend auf den generierten phonetischen Einheiten, akustischen Modellen und der ausgewählten Stimme erzeugt die KI schließlich eine Audiodatei, in der der Text vorgelesen wird.
Solche „Text-to-Speech-Technologien“haben in den letzten Jahren große Fortschritte gemacht und sind immer natürlicher und realistischer geworden. Sie werden in einer Vielzahl von Anwendungen eingesetzt, darunter Barrierefreiheit für Menschen mit Sehbehinderung, Podcasts, Hörbücher, Navigationssysteme, digitale Assistenten, E-Learning-Plattformen und eben, wie in unserem Beispiel, im Browser.