Um dos exemplos mais presentes no nosso quotidiano da aplicação de Cadeias de Markov é o algoritmo que regula o motor de busca da Google, o PageRank.
vogais e consoantes. A 23 de janeiro de 1913, Markov resumiu as suas descobertas num discurso à Academia Imperial de Ciências, em São Petersburgo, numa análise que em nada alterou a interpretação literária do poema, mas que abriu uma nova direção no campo das teorias de probabilidades.
Eliminou toda a pontuação e espaços em branco, colocando os carateres numa sequência longa e ininterrupta, e veri cou que uma vogal era seguida por uma consoante em 87% das vezes, enquanto uma consoante era seguida por uma vogal 66% das vezes. Contou ainda 1104 pares de vogais e 3827 pares de consoantes; os 15 069 pares restantes consistiam de uma vogal e uma consoante, numa ordem ou noutra. Isso serviu a Markov para demonstrar que as probabilidades não eram aleatórias, mas sim dependentes da letra anterior.
Mais de 100 anos depois, e com as Cadeias de Markov estabelecidas como uma das mais poderosas ferramentas de modelação do mundo real, Carolina Vasconcelos desenvolveu na sua tese de mestrado uma nova metodologia estatística para refinar o processo. “Propõe uma nova generalização do modelo de Cadeias de Markov Multivariadas que permite também introduzir variáveis exógenas ao processo e considerar o seu efeito sobre as probabilidades de transição entre estados”, explica. Ou seja, incorporar uma ou mais variáveis exteriores ao universo do objeto de estudo, mas que o podem condicionar (como ilustrado na entrada do texto).
Para testar, fez uma aplicação para modelar o retorno previsto no mercado de ações em diferentes contextos de taxas de juro. “Modelámos os retornos de mercado quando as taxas de juro tinham um valor máximo e um valor mínimo. E assim conseguimos ver as diferenças nas probabilidades em ambientes diferentes, numa economia em expansão ou numa economia em recessão”, refere.
A metodologia, garante o professor, “é aplicável a várias situações”. A escolha das variáveis exógenas depende “do investigador e do problema que tem à sua frente para analisar”. “Ignorar o efeito de variáveis exógenas significa que não detetaríamos as mudanças das probabilidades de acordo com aos valores das co-variáveis. Nesse cenário, ter-se-ia uma visão limitada do processo estudado. Assim, esta abordagem permite entender como uma variável específica influencia um processo específico”, acrescenta a aluna, que também introduziu “inferência estatística sobre os parâmetros” (atribuir um valor estatístico e um grau de incerteza a cada probabilidade) e, no final, deixou outro contributo, que foi “o desenvolvimento e implementação destas metodologias num software open source, o R”, muito utilizado na estatística. “Toda a gente pode ver o código por detrás das funções e pode utilizar aquilo que desenvolvemos de forma gratuita, sem licenciamento”, adianta Carolina, revelando que “já foram feitos mais de 1100 downloads”.
As possíveis aplicações são, como já vimos “muito transversais” e contribuirão para que o futuro seja um “lugar” cada vez menos rodeado de incertezas, algo com que nem sequer Alexei Markov terá sonhado quando andou a contar vogais e consoantes no poema de Pushkin.