Quando a tecnologia é tão esperta que até parece inteligente
Q “uando as pessoas te perguntam as horas não precisam saber como funciona o relógio.” Ouvi este ligeiro raspanete reiteradamente de um antigo diretor, mas, por teimosia ou estupidez (se é que estas não são duas faces da mesma moeda), nunca consegui respeitar em pleno a sugestão (ou ordem...) que visava – designadamente – reduzir o tempo das nossas reuniões. Isto porque entendo que em todas as áreas da atividade humana o contexto é essencial para tentar compreendê-la. Resultado: tendo a dar respostas longas a questões aparentemente simples – como, aliás, se nota por esta longa introdução...
Vem isto a propósito da forma como, pelo que observo, o público em geral (mesmo o aparentemente mais info-incluído, mas não especialista) interpreta os resultados quase mágicos da Inteligência Artificial generativa, que quase todos os dias apresentam novas aplicações e/ou resultados ainda mais espetaculares. Produtos que, à primeira vista, desafiam uma simples explicação. Afinal (como um colega jornalista me perguntava na redação há pouco tempo, após usar o serviço online TurboScribe), “como é possível a IA ouvir em segundos uma hora de entrevista e passá-la a texto de forma quase perfeita?”
O espanto é natural, desde logo, porque vai ao encontro da máxima do escritor, pensador e futurista Arthur C. Clarke de que qualquer tecnologia, se suficientemente avançada, parece magia. Mas ao mesmo tempo encerra o muito humano equívoco de pensarmos que estes sistemas funcionam como seres vivos: que “ouvem”; ou “compreendem”; ou “passam a texto”...
Na realidade estes modelos apenas comparam frequências a uma velocidade gigantesca permitida pelos modernos processadores. Literalmente.
De resto, não fazem a mínima ideia do que estão a fazer.
Ao contrário do que possa parecer, por trás da IA não existe qualquer raciocínio, nenhum processo lógico (racional) verdadeiro. Não é assim que o sistema foi desenhado. Os sistemas fazem contas, estatísticas, comparações entre o que lhe pedimos e as bases de dados que têm disponíveis – e quanto maiores forem, melhores os resultados – para gerar as suas respostas.
Isso mesmo foi tema da conversa que tive com o especialista francês Bertrand Meyer, que esteve em Lisboa para um dos mais importantes encontros de engenharia de software (o resultado desse encontro foi publicado no DN de domingo). “A IA não tem nada a ver com inteligência”, disse-me, no sentido em que não há ali raciocínio, apenas estatística, álgebra, processos matemáticos inventados há mais de 150 anos, só que processados a uma velocidade incrível, acedendo aos biliões de dados disponibilizados pela internet.
No processo da transcrição automática (seja o referido TurboScribe, seja o que vem integrado no Word, da Microsoft – incluindo na versão gratuita desta app –, o do Google, ou outro qualquer) o que o sistema faz é “pegar” nas frequências áudio e compará-las com as que tem à disposição – tanto de outros utilizadores do mesmo serviço ou de pessoas anónimas da web. Se estatisticamente as cristas e cavas das ondas elétricas da gravação equivalem a certas palavras, são estas que ele “escreve”. Depois, existe um segundo filtro, de “contexto”: o sistema “sabe” que habitualmente (mais uma vez, estatisticamente) a certa palavra segue-se outra, como “bom”... “dia”; “boa”... “tarde” ou “noite”, etc., etc., o que evita alguns erros.
Claro que tudo isto para funcionar tem de ser circunscrito a uma língua específica, aliás, à variante regional específica da língua. E quanto maior a base de dados que o sistema tem disponível para comparação, melhor ele funciona – daí, por exemplo, funcionar melhor para português do Brasil do que para português de Portugal. Há simplesmente mais gente a falar (e a usar) essa variante da língua. Quanto ao inglês, hoje os sistemas são quase perfeitos neste idioma, desde que não os tentemos pôr a “trabalhar” sobre variantes como o oeste de Inglaterra, o norte da Escócia ou o quase tão incompreensível sotaque de António Guterres...
(Neste último caso, fiz o teste há cerca de um ano, com um dos melhores tradutores automáticos do mercado, que foi incapaz de “compreender” uma palavra do atual secretário-geral da ONU, mas funcionou na perfeição com qualquer pessoa a falar inglês escorreito.)
Tudo o que foi dito acima em termos de funcionamento aplica-se relativamente à IA generativa para texto, em que os sistemas vão buscar partes já escritas a várias fontes e no fundo fazem um “baralha e volta a dar” que é original no sentido em que nunca ninguém escreveu algo exatamente assim, mas não tem verdadeiramente qualquer ideia original por trás. Também quanto à imagem (foto ou vídeo) o mesmo se aplica... Mas voltaremos a estes assuntos nmais tarde.
Ou seja, ao contrário do que pode dar a entender, apesar de a IA parecer “ouvir”, “ler” e “escrever”, na realidade apenas está a fazer contas e comparação de material existente. É espetacular, é súper prático e até muda as nossas vidas para sempre. Mas não são novas inteligências, nem nunca poderão sê-lo.
Afinal, se não percebermos de que forma “funciona o relógio” para que este nos possa “dizer as horas” corremos o risco de vivermos todo o tempo enganados.