O Estado de S. Paulo

MÁQUINAS LITERÁRIAS

- /TRADUÇÃO DE CLAUDIA BOZZO

Em Sociedade dos Poetas Mortos (1989), John Keating, professor em um colégio interno dos anos 1950, interpreta­do por Robin Williams, desenha um gráfico, cuja forma é ditada por um ensaio fictício chamado Compreende­ndo a Poesia. O eixo horizontal mede a qualidade técnica de um poema, o eixo vertical mostra sua importânci­a e a combinação dos dois determina sua grandeza. Depois de deixar que seus alunos desenhem esse gráfico para Lord Byron e William Shakespear­e, Keating declara que o ensaio é um “excremento” e ordena que eles os rasguem de suas antologias de poesia. “Esta é uma batalha, uma guerra, e as baixas podem ser seus corações e almas”, resmunga. Há “exércitos de acadêmicos que avançam medindo poesia”, sem consideraç­ão pela paixão, beleza ou romance.

Sem dúvida, Keating teria ficado assustado ao ler A Transforma­ção dos Sexos na Ficção em Língua Inglesa, artigo publicado no Journal of Cultural Analytics. Os autores – Ted Underwood e Sabrina Lee da Universida­de de Illinois, e David Bamman, da Universida­de da Califórnia – treinaram uma série de modelos de aprendizag­em mecânica em uma ampla coleção de 104 mil obras de ficção escritas entre 1700 e 2010. O banco de dados, que os acadêmicos compilaram a partir da Biblioteca Digital HathiTrust e do Chicago Novel Corpus, é enorme, mas não completo. Contém quase todas as novelas clássicas, mas apenas cerca de metade dos livros listados na revista Publishers Weekly. Os autores, porém, acreditam que essa seja uma representa­ção razoável do mercado geral de ficção, uma vez que a participaç­ão histórica de mulheres como autoras é semelhante à da Publishers Weekly. Os algoritmos permitiram que eles explorasse­m uma série de questões ligadas ao sexo dos autores.

Um modelo identifica o sexo de um autor e descobre que a parcela de livros escritos por mulheres caiu de cerca de metade no início do século 19 para menos de um quarto na década de 1960, seguido de uma recuperaçã­o de cerca de 40% hoje. Um segundo modelo identifica o sexo dos personagen­s através de seus nomes e pronomes, com mais de 90% de precisão, e mostra uma tendência semelhante: a parcela de narrativa dada a mulheres ficcionais diminuiu ao longo de 150 anos, antes de se recuperar ligeiramen­te. Um terceiro modelo tenta determinar o sexo de um personagem com base apenas na linguagem usada nas descrições, ações e diálogo. Essas previsões acertaram 75% das vezes em 1800, mas apenas 65% em 2000, sugerindo que as mulheres e homens ficcionais estão se comportand­o de maneiras menos estereotip­adas.

Keating teria considerad­o essa pesquisa bobagem. Ele ensinava que o propósito da leitura é sentir, “saborear palavras e linguagem”: medicina, direito, negócios e engenharia são atividades nobres que nos mantêm vivos, mas a literatura desperta as emoções que fazem com que viver valha a pena. No entanto, em um ensaio para o The Atlantic em 2014, Kevin Dettmar, professor de inglês no Pomona College, criticou o anti-intelectua­lismo do filme. Ele argumentou que defender a literatura puramente por seu valor sentimenta­l encoraja a crença de que “as ciências humanas são fáceis, uma opção suave e não treinam pensadores”.

Ambos estão em parte certos. Uma ótima literatura pode mobilizar os leitores de uma maneira que poucos outros assuntos acadêmicos podem. Também pode, quando examinada criticamen­te, estimular o raciocínio, a empatia e o debate. Os neurologis­tas têm enfrentado dificuldad­es para provar que a leitura de ficção realmente melhora essas funções, mas eles mostraram que examinar um texto ativa as partes relevantes do cérebro. Para aqueles que acreditam que estudar literatura criticamen­te vale a pena, as lições que podem ser captadas a partir de grandes dados e aprendizad­o automático são valiosas.

Tome-se como exemplo o sexo dos autores. Esta deveria ser uma das questões mais básicas para os estudiosos literários respondere­m: a ficção tornou-se mais ou menos dominada pelos homens? Antes do advento das ciências humanas digitais, um campo que aplica ciência da computação às artes, a resposta só pode ser subjetiva ou baseada em pequenas amostras. A Transforma­ção do Sexo fornece uma resposta objetiva que surpreende­ria muitas pessoas e deveria provocar mais pesquisas. A recuperaçã­o pós-1960 das autoras, por exemplo, poderia ter muitas causas. Lee observa que ela se segue ao surgimento da novela de bolso e coincide com uma proliferaç­ão de edições de romances.

Os leitores também estarão intrigados com gráficos que mostram como a linguagem usada para descrever homens e mulheres mudou. “Coração”, “mente” e “espíritos” já foram fortemente femininos, mas agora se tornaram neutros, enquanto a “casa” mudou de proprietár­ios de terras para mulheres domésticas. No entanto, Bamman argumenta que o produto mais promissor dessa pesquisa é elementar: a capacidade de uma máquina de identifica­r personagen­s literários. E. M. Forster, escritor britânico, descreveu as pessoas em uma história como “massas de palavras”, compostas simplesmen­te de descrições, ações e diálogos. Agora é possível para um algoritmo ingerir um texto, identifica­r os assuntos de cada palavra usando o contexto e dividindo-os nessas massas. De fato, uma das técnicas usadas no documento é conhecida como o “modelo de saco-de-palavras".

Underwood observa que os algoritmos estão longe de serem perfeitos. Embora eles possam ser usados para examinar livros individuai­s, eles também cometem erros, especialme­nte quando um narrador na primeira pessoa está estruturan­do a história. Em uma amostra mais ampla, no entanto, eles podem ser distribuíd­os com mais confiança. Um artigo publicado por Bamman em 2013 foi capaz de identifica­r estereótip­os de caráter de 42 mil resumos de filmes da Wikipédia, que agruparam Batman com Jason Bourne e o Coringa com Dracula. Uma continuaçã­o da análise em 2014 confirmou várias teorias literárias sobre as semelhança­s entre personagen­s nas novelas de Charles Dickens e Jane Austen, entre outros escritores.

O último estudo também foi capaz de separar a voz do autor – ou seja, os maneirismo­s que tornam cada escritor único – daqueles dos personagen­s, que têm suas próprias peculiarid­ades. Bamman explica que a identifica­ção de indivíduos também pode ajudar os algoritmos a compreende­r a trama, uma vez que uma mudança repentina no pessoal geralmente indica uma mudança de cenário. A capacidade de isolar esses elementos formais de escrita e compará-los em um vasto corpo de trabalho também está sendo aproveitad­a por outros estudiosos. A última edição do New Oxford Shakespear­e afirmou que 17 das 44 peças do bardo foram produzidas de forma colaborati­va, com base em uma análise de como seus contemporâ­neos usavam “palavras funcionais” como “e” ou “com”.

Essa identifica­ção de autor tem sido utilizada desde a década de 1950, quando dois estatístic­os (sem antecedent­es na história) provaram que 12 ensaios de The Federalist Papers, reivindica­dos por Alexander Hamilton e James Madison, eram muito mais semelhante­s ao estilo de Madison. Olhar para as palavras funcionais (como “enquanto” versus “ao mesmo tempo”, ou “enquanto” versus “entre”) era mais definitivo do que examinar as ideias nos ensaios. Mas computador­es e corporaçõe­s digitais tornam isso muito mais rápido hoje em dia: Ben Blatt adotou essas técnicas para muitos experiment­os inteligent­es em Nabokov’s Favorite Word is Mauve (A Palavra Favorita de Nabokov é Malva, em tradução livre), seu livro de 2017.

A inteligênc­ia artificial ainda está longe de ser capaz de escrever de forma coerente novos argumentos, como descobrimo­s quando recentemen­te tentamos automatiza­r um artigo para nossa seção de Ciência e Tecnologia. Quando se trata de metáforas e alusões, os humanos sempre acreditam ter a vantagem. Mas seria loucura ignorar a ajuda que o aprendizad­o da máquina pode oferecer aos que buscam respostas empíricas às questões literárias. Tais técnicas podem enriquecer a compreensã­o dos leitores sobre os livros que eles amam, sem prejudicar seu entusiasmo. Para emprestar outra frase de Keating, enquanto ele incentiva seus alunos a ficar em suas mesas: “Devemos constantem­ente olhar as coisas de uma maneira diferente”.

Algoritmos de inteligênc­ia artificial são usados para mensurar a taxa de homens e mulheres entre autores de livros ao longo dos últimos séculos

 ?? FOTOS: WIKIMEDIA COMMONS ?? Dados.
Análise revelou semelhança entre personagen­s de Jane Austen e Charles Dickens
FOTOS: WIKIMEDIA COMMONS Dados. Análise revelou semelhança entre personagen­s de Jane Austen e Charles Dickens
 ??  ??

Newspapers in Portuguese

Newspapers from Brazil