O escândalo que não foi
Oescândalo da semana é a descoberta de que funcionários de empresas terceirizadas escutavam mensagens e áudio que usuários enviavam uns aos outros pelo Messenger, do Facebook. A notícia foi dada pela Bloomberg, cujos repórteres afirmaram que estes ouvintes se sentiam desconfortáveis com o processo. São tão recorrentes estas histórias de violação de privacidade das gigantes do Vale do Silício que, ora, por vezes é até difícil distinguir onde há de fato escândalo e onde não o há. E, neste caso, pode estar havendo exagero.
Também esta semana, discretamente, a Microsoft listou em suas novas regras de privacidade que trechos de conversas via Skype transcritas podem ser ouvidos por funcionários. Já foi lá e falou que acontece antes que alguém o descobrisse. A primeira destas histórias surgiu no princípio de julho, quando jornalistas da TV belga VRT ouviu ele próprio conversas registradas pelo Google Home, a caixa de som inteligente.
O Messenger do Facebook transcreve áudios em texto para quem o pede, e apenas para quem quer este serviço. O Skype é capaz até de legendar diálogos em duas línguas diferentes, fazendo uma tradução em tempo real inacreditável anos atrás. E estas caixas de som são mesmo capazes de automatizar boa parte da casa. Tudo por comandos de voz. O Brasil, aliás, já é o segundo país no mundo em uso do Google Assistente por voz. É prático.
Só que inteligência artificial não surge no vácuo. Estes softwares precisam aprender a compreender. Se nos irritamos por eles não entenderem o que falamos, o que ocorre com relativa frequência, é porque a tecnologia está em desenvolvimento. Sotaques, dialetos, problemas motores de fala, são tantas as maneiras distintas que uma mesma palavra ou frase pode ser pronunciada de inúmeras maneiras. Quando o software não compreende, ele registra que falhou ali. Mas aquela mesma pronúncia pode ser comum a uma comunidade grande de pessoas. Aí, só tem um jeito de resolver. Um ser humano tem de ouvir e escrever para o sistema o que foi dito.
O preço das benesses de usar tecnologia muito nova é que estaremos também treinando esta tecnologia. No Vale do Silício, porém, os executivos fazem um mau trabalho na hora de explicar estes processos. Ai, com sua má fama no trato da privacidade, só pioram a situação. E mesmo casos que parecem similares podem ser distintos.
Os terceirizados de língua belga e holandesa que ajudavam na compreensão os sistemas do Google recebiam frases inteiras. Em alguns casos, os jornalistas da VRT, por conta do contexto dos pedidos, foram capazes de identificar pessoas, seja por seu endereço ou busca por famílias com aqueles nomes específicos. Ouviram conversas em alguns casos pessoais de gente que puderam contactar. É uma situação evidentemente desconfortável que configura violação de privacidade.
Nem no caso da Microsoft, nem no do Facebook, os áudios parecem ter sido identificáveis. O Face, em particular, afirma que tomava o cuidado de enviar apenas trechos e nunca mensagens inteiras aos tradutores – e, de qualquer forma, já suspendeu a prática.
É inevitável que a falta de transparência das gigantes do Vale em alguns momentos se volte contra elas. Como agora. Mas este processo de educação digital é importante para todos nós. Quem opta por utilizar algo que seja muito complexo e muito novo está colaborando para o teste e desenvolvimento daquele produto. Interfaces de voz farão cada vez mais parte do cotidiano.
E tem horas neste período inicial nas quais, sim, será preciso que um ser humano ouça o que foi dito à máquina. Quem não quer ser ouvido só tem uma escolha: não usar. Ao menos por enquanto.
Quem opta por utilizar algo complexo e novo colabora para o teste do produto