Fotos de seus filhos têm alimentado a tecnologia de vigilância nos EUA
nova york | the new york times Em 2005, Dominique Allman Papa entrou no site de compartilhamento de fotos Flickr. Carregou imagens, muitas dos filhos, Chloe e Jasper. Então ela praticamente esqueceu que o Flickr existia.
Recentemente, Chloe Papa teve notícias: os rostos das crianças Papa —sorrindo com os pais, fantasiadas para o Halloween— foram sugados para o MegaFace, banco de dados de reconhecimento facial sem precedentes.
Com quase 700 mil pessoas, ele foi baixado por dezenas de empresas para treinar e testar nova geração de algoritmos de identificação facial, usados para rastrear manifestantes, vigiar terroristas, detectar apostadores problemáticos e espionar o público em geral. A idade média das pessoas no banco de dados, dizem seus criadores, é 16 anos.
“É horrível e desconfortável”, disse Papa, 19. “Gostaria que tivessem me perguntado se eu queria fazer parte disso.”
Por lei, a maioria dos americanos no banco de dados não precisa ter permissão solicitada —mas os Papas deveriam.
Residentes de Illinois são protegidos pela Lei de Privacidade da Informação Biométrica, que impõe sanções financeiras pelo uso de impressão digital de um cidadão de Illinois ou pela digitalização facial sem consentimento.
As empresas que usaram o banco de dados —como Google, Amazon, Mitsubishi Electric, Tencent e SenseTime— poderão pagar por isso.
No início do reconhecimento facial, foram desenvolvidos algoritmos com consentimento dos sujeitos. Na década de 1990, voluntários eram fotografados por vários ângulos.
Mais tarde, os pesquisadores acessaram câmeras de vigilância de cafés, campi universitários e espaços públicos e copiaram fotos online.
Em junho de 2014, o Yahoo divulgou o que chamou de “a maior coleção pública de multimídia já lançada”, com 100 milhões de fotos e vídeos. Obteve as imagens —todas com Creative Commons ou licenças de uso comercial— do Flickr.
Os criadores da base queriam nivelar o aprendizado mecânico. “Queríamos capacitar a comunidade de pesquisa, fornecendo-lhe banco de dados robusto”, disse David Ayman Shamma, diretor de pesquisa do Yahoo até 2016 e que atuou no projeto Flickr. Os usuários não foram notificados do uso das fotos.
Shamma e equipe dizem que não distribuíam fotos dos usuários, mas, sim, links para as fotos. Dessa forma, se um usuário excluísse as imagens ou as tornasse privadas, elas não seriam mais acessíveis.
Mas essa salvaguarda era falha. O NY Times constatou as fotos de um usuário do Flickr poderiam ser acessadas mesmo após virarem privadas.
Além disso, pesquisadores que acessaram o banco de dados baixaram versões das imagens e as redistribuíram, entre eles está uma equipe da Universidade de Washington.
Em 2015, dois professores de ciência da computação da escola —Ira Kemelmacher-Shlizerman e Steve Seitz— e os alunos usaram o Flickr para criar o MegaFace. Com mais de 4 milhões de fotos de cerca de 672 mil pessoas, era uma promessa para testar algoritmos de reconhecimento facial.
O destaque é que o MegaFace incluía crianças, como Chloe e Jasper Papa. Os sistemas de reconhecimento facial tendem a ter mau desempenho com jovens, e o Flickr representava uma chance de ouro.
Em artigo acadêmico, Kemelmacher-Shlizerman e o estudante Aaron Nech estimaram a idade média dos sujeitos do MegaFace em 16,1 anos; 41% dos rostos pareciam ser de mulheres e 59% de homens.
Em 2015 e 2016, a Universidade de Washington realizou o “Desafio MegaFace”, convidando grupos que atuam com tecnologia de reconhecimento facial a usar o conjunto de dados para testar algoritmos, para “pesquisas não comerciais e com fins educacionais”. Mais de cem organizações partici
“Gostaria que tivessem me perguntado se eu queria fazer parte disso
Chloe Papa, 19
que teve fotos do Flickr, sem autorização, usadas em testes de reconhecimento facial
param, incluindo Google, Tencent, SenseTime e NtechLab. No total, mais de 300 grupos de pesquisa acessaram a base.
Algumas das empresas foram criticadas pela forma como clientes implementaram seus algoritmos: a tecnologia do SenseTime foi usada para monitorar a população uigur da China, enquanto o NtechLab serviu para denunciar atores pornográficos e identificar estranhos no metrô na Rússia.
A diretora de marketing do SenseTime, June Jin, disse que a empresa usou o MegaFace para fins acadêmicos. “Virou treino e teste de reconhecimento facial.” A NtechLab, Nikolay Grunin, diz que excluiu o MegaFace após o concurso. O Google se recusou a comentar. Já a Universidade de Washington não autorizou pesquisadores a falarem do caso.
A criação do MegaFace foi financiada em parte pela Samsung, pelo Faculty Research Award, do Google, e pela National Science Foundation/Intel.
O MegaFace segue disponível para download. O NY Times conseguiu o acesso em um minuto. A base não contém nomes de pessoas, mas os dados não são anônimos. O jornal conseguiu conectar muitas fotos do banco de dados às pessoas que as tiraram.
Residentes de Illinois, como os Papa, cujas impressões faciais são usadas sem sua permissão, têm direito a US$ 1.000 (R$ 4.125,70) por uso, ou US$ 5.000 (R$ 20.628,50) se o uso for “imprudente”. Segundo o jornal, de 6.000 a 13 mil pessoas de Illinois estão na base do MegaFace. Especialistas avaliam que o total da indenização pode superar US$ 1 bilhão (R$ 4,1 bilhões) e formar a base de uma ação coletiva.