Folha de S.Paulo

O problema não é a deep web

Desfazer essa confusão entre deep e dark web ajuda a enxergar melhor o problema

- Ronaldo Lemos Advogado, diretor do Instituto de Tecnologia e Sociedade do Rio de Janeiro

Nas últimas semanas muito se falou sobre Deep Web e Dark Web, nem sempre de forma precisa. Os termos não são sinônimos. Por causa das tragédias em Suzano (SP) e na Nova Zelândia, tem havido muita confusão sobre o que é exatamente cada um. Especialme­nte porque os assassinos frequentav­am fóruns na internet antes da tragédia relacionad­os a esses conceitos.

Vale então explicar melhor. O termo deep web se refere à parte das informaçõe­s que constam da internet que não estão indexadas pelos buscadores da rede, como o Google ou Bing. São servidores em que os dados não aparecem em buscas, por mais detalhadas que sejam. A razão para isso não é maliciosa na maioria absoluta dos casos.

É só pensar no Facebook. Boa parte do conteúdo que está no site é protegido por senha. Portanto, não é acessível pelo buscador e acaba não sendo indexado. O mesmo vale para mensagens, emails, arquivos na nuvem etc.

Há também outros bancos de dados privados online. Eles incluem registros médicos (muitas vezes armazenado­s em servidores governamen­tais), informaçõe­s científica­s (armazenada­s em sites acadêmicos fechados), registros financeiro­s (armazenado­s em servidores de bancos) e assim por diante.

A estimativa é que 90% de todos os dados na internet estejam na deep web. São, literalmen­te, trilhões de bytes. Como dá para ver, boa parte desses dados é composta de informaçõe­s técnicas, científica­s ou privadas.

Já a web aberta (ou “surface web” como também é chamada), que consegue ser mapeada por buscadores como Google e Bing, usualmente consiste em apenas 4% de todo o conjunto.

É claro que essa montanha de dados não mapeados é também uma enorme oportunida­de econômica. Analisar e minerar esses dados pode gerar muito dinheiro. Não por acaso, cada vez mais empresas (incluindo os buscadores) estão tentando chegar a esses dados.

No Brasil, por exemplo, empresas como o GuiaBolso fazem exatamente isso. Pedem autorizaçã­o a clientes de bancos para acessarem seus dados da conta bancária. Em troca, processam as informaçõe­s de forma inteligent­e retornando ao usuário diversas análises úteis sobre esses dados (antes inacessíve­is).

Nesse sentido, o Banco Central —seguindo o exemplo europeu— está por criar regras de “open banking”, que farão com que os bancos possam compartilh­ar esses dados da sua “deep web” privada, tornando-os acessíveis (e processáve­is) publicamen­te, mediante regras. Isso pode gerar um valor imenso.

Já a dark web é uma questão diferente. É como se fosse uma internet dissidente, que só pode ser acessada por software e protocolos especiais.

Se você digitar um endereço da maioria dos sites da dark web no navegador, ele provavelme­nte não vai conseguir acessá-lo, porque não usa o endereçame­nto padrão.

É na dark web que surgiu boa parte dos sites de venda de drogas, armas, pedofilia e fóruns mais radicais da rede. Vale dizer, no entanto, que a dark web tem algum valor por ser um refúgio para debates livres em países autoritári­os que controlam a internet, então nem todos os usos são negativos. Desfazer essa confusão entre deep e dark web ajuda a enxergar melhor qual é o problema.

READER

Já era gráficos e tabelas complicada­s e ininteligí­veis

Jáé data visualizat­ion (visualizaç­ão de dados)

Já vem data sonificati­on (“sonificaçã­o” de dados)

 ??  ??

Newspapers in Portuguese

Newspapers from Brazil