Česká banka pozná klienta po hlase
Lidský hlas je stejně jedinečný, jako otisk prstu. Speciální software dokáže rozpoznat, kdo mluví. „Algoritmus, který dnes používáme, je schopen rozlišit tisíc různých charakteristik hlasu. Systém pozná, když vám vypadne zub, má to nepatrný vliv na hlas,“říká Břetislav Beránek, ředitel pro bezpečnostní systémy americké firmy Nuance.
Před šestatřiceti lety se narodil v Československu, ale když mu byly dva roky, přestěhoval se s rodiči do Kanady.
Jaké jsou největší výhody hlasové biometrie proti jiným metodám ověření?
Když to srovnáme s PIN nebo heslem, je to pro klienty lehčí, nemusejí si nic pamatovat. Jenom mluví. A na rozdíl od ověření pomocí otisku prstu či obličejem nejste připoután k jednomu zařízení, funguje to odkudkoliv. U otisku prstu navíc neexistuje žádná detekce podvodného přístupu, s pomocí škodlivého kódu útočník může ovládnout celý telefon a uživatel se to nedozví.
V případě hlasové biometrie se zase útočník může dostat na server, kde jsou nahrávky...
Teoreticky je všechno možné, ale samotný vzorek hackerům nijak nepomůže. Systém detekuje, zda mluví s živým člověkem, nebo s nahrávkou sestříhanou z nahraných vzorků. Navíc bezpečnostní opatření v podnikovém prostředí jsou mnohem větší než na zařízení. Ve firmách na tom obvykle pracují celé týmy. Na konferencích se často zmiňuje, že až 98 procent zařízení s operačním systémem Android má v sobě nějaký škodlivý kód, malware.
Jak to přesně funguje?
Vzorek se vytvoří během běžného rozhovoru s operátorem na lince. Zavoláte do banky, například chcete udělat nějakou změnu, hovor se nahraje, zpracuje a vytvoří se vzorek. Když zavoláte podruhé, už je možné vás podle vzorku identifikovat.
Jak dlouhý ten text musí být, abyste mohli vzorek použít?
Teoreticky nám stačí sekunda nahrávky, ale pak nebude ten vzorek zcela kvalitní. Ideálně je to 30 až 60 sekund, jak je to i v České spořitelně. Nesmí to být čtený text, protože tam musejí být i různé modulace. Hlasová biometrie se odlišuje od prostého rozpoznání textu. My potřebujeme vědět, jak to říkáte. Je jedno, o čem text je, operátoři mohou lidi rozmluvit i běžnými konverzačními dotazy.
Kdyby třeba člověk mluvil cizím jazykem, dokážete správně rozpoznat jeho hlas?
Stačí mít nahraný vzorek jen v jednom jazyce. Testoval jsem to i na češtině – kterou nemluvím tak plynule jako anglicky nebo francouzsky – ale přesto mě hlasová biometrie rozpozná. Fyzické charakteristiky jsou stejné, tvar a velikost hrtanu, i všechny orgány, kudy hlas jde. Charakteristiky týkající se chování mohou být trochu odlišné, ale jsme schopni rozpoznat, jaké rozdíly jsou přirozené a jaké jsou nepřirozené. Když jste ve velkém stresu, možná budete mluvit rychleji, to je přirozená změna chování a algoritmus si s tím poradí.
Když se někdo pokusí napodobit můj hlas – třeba imitátor – jaká je pravděpodobnost, že uspěje?
Imitátoři mohou změnit behaviorální charakteristiky, začnou mluvit stejně jako vy, ale fyzické charakteristiky nejsou schopni změnit. Hlasová biometrie s tím proto nemá problém. A to jsme dělali těch testů celou řadu, zkoušel to například i Kevin Spacey. Pro lidské ucho to možná zní stejně, ale algoritmy jsou schopny rozpoznat, že charakteristiky jsou úplně jiné.