Diário de Notícias - Dinheiro Vivo
Direitos de autor e IA: “É preciso criar barreiras para não cairmos num cenário de exterminador implacável”
Tecnologias como a inteligência artificial e o metaverso estão a desafiar as noções tradicionais de direitos de autor e de propriedade intelectual, exigindo uma reavaliação urgente do sistema que garante a sua proteção. Ainda não há uma solução perfeita,
Garantir que a utilização de informação relativa à obra de qualquer autor – seja ele um escritor, um jornalista, um realizador de cinema, um cientista ou um informático, é feita de forma correta, atribuindo os devidos créditos e retorno financeiro a quem a produziu – é uma questão que nunca foi pacífica na sociedade. Para os lesados, nem sempre é simples reclamar os direitos de autor que foram instituídos em Portugal, pela primeira vez, em 1972, através do Decreto-Lei n. 13725 (Regime de Propriedade Literária, Científica e Artística), e posteriormente adaptados às necessidades e mudanças na sociedade.
Mais recentemente, a massificação dos conteúdos digitais trouxe de novo a questão a debate, um problema que a inteligência artificial (IA) e o Metaverso vieram agigantar. Para dar resposta, a União Europeia (UE) criou as diretivas 2019/789 e 2019/790 relativas aos direitos de autor e direitos conexos no mercado único digital. Portugal transpôs a diretiva para a legislação nacional em 2023, quando já devia tê-lo feito até 2021, e, ainda assim, esta parece não ser a solução ideal para a defesa dos criadores no mundo digital, conforme explicaram ao Dinheiro Vivo os especialistas que participaram na talk “Direitos de Autor e Inteligência Artificial e Direitos de Autor e Metaverso”, que decorreu online esta semana, mas a que ainda pode assistir no site do jornal.
Num debate moderado pelo diretor do Dinheiro Vivo, Bruno Mateus, e no qual participaram Carlos Eugénio, diretor executivo da Visapress, empresa especializada na gestão de conteúdos do setor dos media, Patrícia Kester, doutorada em Direitos de Autor e Direitos da Tecnologia Digital e fundadora do GPI-IPO (Gabinete de Jurisprudência da Universidade de São Paulo),
e António Branco, professor da Faculdade de Ciências da Universidade de Lisboa, especialista em inteligência artificial generativa e um dos criadores dos modelos de linguagem para a língua portuguesa Albertina e Gervásio, a grande conclusão que pode retirar-se é a de que não existe, para já, uma solução perfeita para a defesa dos direitos de autor nas plataformas digitais, nomeadamente dos conteúdos produzidos através de IA, e que esta não será fácil de encontrar.
À data de hoje, explica Patrícia Kester, “não temos solução a não ser, talvez, no âmbito da lei inglesa”. No entanto, esta lei tem uma aplicação muito limitada em termos territoriais, e “temos que lembrar-nos que o direito de autor é uma realidade territorial”, acrescenta a especialista. Além disso, aponta, na União Europeia existe uma visão distinta do próprio conceito de direito de autor que “assenta num laço profundo, quase romântico, entre o autor e obra, suportado na essência do espírito humano”. Na perspetiva da jurista, isto significa que, nos dias que correm, é muito difícil na Europa con
tinental dizer que uma criação da máquina, ainda que seja assistida por humanos, e não puramente criada por ela, é uma obra, e se não se trata de uma obra, também não há autoria nem titularidade. “Sendo o elemento humano crucial, é fundamental a toda e qualquer noção de direito de autor”, reforça.
Boas intenções, difícil concretização
“A legislação atual tem uma excelente intenção, mas não assegura a sua concretização”, defende Carlos Eugénio. O diretor executivo da Visapress recorda a recente aprovação do Regulamento sobre Inteligência Artificial pelo Parlamento Europeu, que entrou em vigor esta semana, e que dá o período de um ano para que as empresas possam adaptar-se às novas regras. Nesta peça legislativa, diz, há dois pontos que visam salvaguardar os direitos de autor “naquilo que vulgarmente chamamos o scraping, ou seja, o varrimento dos conteúdos em ambiente digital”, explica. Esse varrimento dos conteúdos é o que permite criar uma base de dados com dimensão e qualidade suficiente
para que aquilo que sai dos algoritmos de inteligência artificial tenha credibilidade quando entregue ao seu utilizador.
A questão que aqui se coloca, sublinha o responsável, é se faz sentido, ou se é suficientemente robusto aquilo que o legislador pensou como medida de proteção dos conteúdos, em ambiente digital. “E isto é transversal, ou seja, tudo aquilo que está em ambiente digital deve, de alguma forma, ter uma referência, que seja lida pelas máquinas, e que confirme se o conteúdo está ou não protegido”. A dúvida residirá, defende Carlos Eugénio, porque tecnologicamente ninguém garante que organizações que sejam usurpadoras de direitos não consigam continuar a ir buscar os conteúdos e a utilizá-los porque não há, na realidade, nada que consiga ser eficaz nessa proteção. Na perspetiva do responsável da Visapress, o que o legislador europeu está a tentar fazer é criar uma espécie de governance que permita definir um chão comum para que existam barreiras que não devem ser ultrapassadas pelos algoritmos de * inteligência artificial. Sem elas, alerta, “cairíamos num cenário de exterminador implacável”.
Sendo especialista em IA generativa, e um dos criadores dos modelos de linguagem para português – Albertina e Gervásio –, António Branco tem uma visão pragmática do papel da máquina nos direitos de autor. Apesar de considerar que tudo é alvo de direito autoral, admite a sua dificuldade em atribuir este tipo de direitos às máquinas “porque nunca as vejo a trabalhar sozinhas”. Na sua opinião, os direitos de autor nas situações em que existe a intervenção de máquinas deverão ser atribuídos “a quem usou a máquina para produzir seja o que for”. A grande dificuldade estará, na sua opinião, nas questões que se levantam a jusante. E exemplifica: “Se avançar a ideia de que textos produzidos por direitos de autor, que entram no treino de um modelo de linguagem, devem ser identificados e depois ressarcidos, seja lá de que forma for, temos um problema”. Ao contrário das bases de dados, em que o conteúdo é guardado para depois ser recuperado na sua íntegra, num modelo de linguagem, tal não acontece. “O modelo de linguagem é uma rede neuronal artificial, e a rede neuronal artificial são apenas pequenos nós numa rede, portanto, não estão lá os bits que depois de reorganizados nos dão o texto, nos dão a fotografia, nos dão a obra, seja o que for”, reforça.
No caso da Albertina e do Gervásio, que são modelos de linguagem para a língua portuguesa, António Branco explica que “vão beber conteúdos escritos em língua portuguesa, seguindo as melhores práticas na literatura científica, numa abordagem que tem por base a prudência”. Ou seja, acrescenta o professor, são reunidos textos para treinar o modelo de linguagem e, dessa coleção de textos, “são excluídos casos que conseguimos perceber que implicam com direitos de autor, nomeadamente, no jornalismo ou na literatura”.
Já sobre a utilização de conteúdos por parte de grandes plataformas digitais como a Google ou o Bing, os participantes do debate acreditam que deve haver um entendimento negociado entre autores e as empresas que gerem estes agregadores. No fundo, uma gestão coletiva. Contudo, apesar de concordar que este é o caminho, Carlos Eugénio alerta: “Vão sempre existir organizações que preferem fazer acordos individuais e, por via da autonomia privada, temos que o garantir e deixar acontecer”.