Quarta-feira, 06 de Julho, 2016

 

Bayes faz Bovespa cair

É sempre no final do dia. Sempre na hora daquele jornal sobre o mercado financeiro, seja em televisão, seja nas rádios, o locutor sempre faz aquela pergunta ao analista: "mas por que a Bovespa caiu hoje?". E a enrolação sempre vem à tona, com declarações sobre "pressões internacionais ao dolar", "mercado nervoso", "banco central americano soltou um relatório", etc. Enfim, enrolação de fofoqueiro.

Para saber quem derrubou ou derrubará um índice de ações, devemos perguntar ao pastor. Sim, o pastor nos dirá quem foi a causa da queda na bolsa de valores. Não qualquer pastor, óbvio, mas um que pastor presbiteriano nascido na Inglaterra e que viveu entre 1701 e 1761. Seu nome? Thomas Bayes.

Thomas Bayes

Bayes além de pastor era matemático, e um matemático revolucionário. Escreveu apenas um livro sobre "fluxões", era como se chamava as derivadas e integrais desenvolvidas por Isaac Newton. Após a morte de Bayes, um amigo encontrou um livro de Bayes perdido em suas coisas, que ele nunca tinha publicado, sobre a ideia de estudar probabilidade para provar a existência de Deus.

Seu livro foi apresentado à Real Sociedade de Ciências do Reino Unido que o publicou. Mas o livro só teria sucesso após 1774 quando o grande matemático Pierre-Simon Laplace criou o jargão "inferência bayesiana" e utilizou os estudos de Thomas Bayes para resolver os problemas mais complicados do século XVIII, todos sobre Probabilidades.

Dentro da Teoria de Probabilidade e mais especificamente, dentro da Estatística, existem duas linhas de estudo:

  • "Frequencistas": Estudam as distribuições da frequência esperada de um evento, com base em experimentos com muitos dados.
  • "Bayesianistas": Medem a plausibilidade de um evento, dado que o conhecimento é incompleto.

O que Laplace fez, foi interpretar os estudos de Bayes conforme a clássica equação resultante de sua linha de raciocínio:

Sem entrar muito em detalhes matemáticos, a equação diz que a probabilidade da ocorrência do evento "A" dado que se sabe sua fonte "B" é a chance de "A" ter vindo de "B", ponderada pela chance de "B" ser a fonte geradora de "A". Essa é uma definição nada matemática, nada estatística, mas apenas para que o leitor tenha conhecimento do significado de Bayes.

Significa dizer, que se tivermos fontes geradoras de sinais, geradoras de dados, geradoras de fofocas, sabendo-se a resposta agora neste exato momento, é possível determinar com bom grau de acerto de onde veio esse resultado. Se temos dois locais B1 e B2 que provêm o resultado A, podemos determinar qual o local mais provável para a aparição de A.

Quer ver um exemplo com moedas?

Suponha que temos uma moeda honesta (B1 é a fonte) e outra desonesta (B2 é a outra fonte). Suponha agora, leitor, que lhe deram a moeda sem dizer se ela é honesta ou não. Você joga a moeda e deu ... "cara". Que moeda é essa, B1 ou B2? Esse é o caso de Bayes. Uma moeda honesta tem 50% de chance de ter resultado "cara". Vamos supor que a moeda desonesta tenha 70% de chance de sair "cara". O que Bayes faz foi ponderar essas probabilidades individuais pela soma das probabilidades. Então para se tomar decisão, teremos os dois cálculos simples:

  • Se a moeda for honesta

  • Se a moeda for desonesta

E então, qual decisão você tomaria? Claro, a moeda tem mais chance de ser desonesta do que honesta, ela tem a probabilidade de 58,3% de ser viciada. Mas não satisfeito, o leitor joga novamente a moeda. Agora, em dois lançamentos consecutivos, como os experimentos são independentes, as probabilidades são multiplicadas. Então agora, a probabilidade de sair "cara" na moeda honesta em dois lançamentos consecutivos é 50% x 50% = 25%. Já para a moeda desonesta, a chance de sair "cara" em dois lançamentos é maior, ou seja, 70% x 70% = 49%.

Novamente, com dois resultados "caras" o leitor já começa a desconfiar de que está com a moeda viciada. Mas qual a certeza disso?

  • Se for honesta

  • Se for desonesta

E agora, nossa certeza tem um número. A decisão de que a moeda deverá ser viciada aumentou para 66,2% de chance. Tomaríamos a decisão de que a moeda é desonesta.

Esse é o princípio de Bayes, nossa ignorância diminui a medida que fazemos mais pergunta sobre o evento, ou realizamos mais experimentos. Ao contrário do que se pensa, realizar um experimento com baixa probabilidade de sucesso e outro com alta probabilidade, se realizamos cada vez mais testes, a certeza não diminui, mas corre em favor da probabilidade.

Claro que a medida que mais fontes (B1, B2, B3, ...) fazem parte do experimento, o cálculo se torna mais complexo e somente com programação somos capazes de resolver o problema. No caso da moeda, podemos colocar o computador para disputar entre essas jogadas das moedas, qual decisão a ser tomada, escolhendo geradores viciados e honestos. Por exemplo, o gráfico a seguir foi obtido de uma programação onde 10 moedas eram lançadas durante 10 rodadas. É possível perceber que Bayes convergiu na probabilidade de "cara" ser da moeda desonesta em apenas 3 rodadas (linha vermelha). E sem informarmos o computador, com teste "cego", a moeda era de fato desonesta.

Em alguns casos, o cálculo da probabilidade precisa de mais testes para tomarmos a decisão correta, como visto a seguir. Mas com apenas duas fontes, a resposta é quase 100% exata.

Mas e no caso das ações da Bovespa? Como não ficar no "chutômetro" ou na "fofoca" para dizer quem causou a queda no índice?

Tomamos os dados dessa última terça-feira (5 de Julho) adquiridos a cada 15 minutos das ações da Petrobras (Petr4) e da Vale (Vale5).

Então, calculamos o retorno das duas ações e também do Ibovespa para o mesmo período. Para cada período de 15 minutos, calculamos quantos retornos negativos existiam no intervalo de duas horas anteriores.

Para cada novo dado, o mais antigo era descartado, sempre analizando número de quedas para um máximo 8 dados coletados ( a cada duas horas, como os dados são tomados a cada 15 minutos, temos no máximo 8 dados pelo período de duas horas).

O gráfico ao lado mostra o resultado para o dia, mostrando 6 quedas dentro 8 possíveis no Ibovespa nas primeiras duas horas. Depois, descartando o primeiro ponto e considerando o próximo, tivemos novamente 6 para 8 possíveis e assim até o fim do dia.

Para as ações, faz-se o mesmo, mas calcula-se a probabilidade de quedas utilizando a distribuição binomial. Essa é uma distribuição típica para dicotomia, ou seja, para eventos do tipo "falso" e "verdade".

Quedas no retorno do Ibovespa a cada 2 horas

 

 

Teorema de Bayes para as quedas no Ibovespa

Então, simulamos por computador como se cada conjunto com 8 dados (2 horas) estivesse chegando ao analisador digital de decisão bayesiana.

A cada novo dado, o analisador estimava pelo teorema de Bayes qual das duas ações tinha mais chance de estar influenciando negativamente o Ibovespa (índice da Bovespa).

A linha azul ao lado apresenta as probabilidades bayesiana sobre as responsabilidades da Petrobras.

A linha tracejada em vermelho apresenta as probabilidades bayesiana para a Vale.

Podemos perceber que naquele dia, durante o dia todo, o teorema de Bayes mostrou que a Petrobras estava sendo responsável pela forte queda no Ibovespa.

Ao final do dia, nos últimos dados, o analisador começou a ficar com dúvidas e a curva se modificou.

Ao final do dia o analisador bate o martelo que a ação responsável pelo fechamento negativo no Ibovespa, com algo em torno de 60% de chance, foi a VALE5 (ação da Vale).

Muitas outras aplicações poderão ser encontradas na internet. Para se ter uma ideia da importância da inferência bayesiana, ao se colocar somente o nome "bayes" no google, a métrica nos retorna 6 milhões de textos em apenas 0,3 segundos de busca. No século XIX uma primeira estimativa sobre o volume de Júpiter e Saturno foram calculados usando Bayes. Nessas últimas décadas a Nasa afirmou que esses cálculos tinham apenas 1% de erro!

As aplicações são muito utilizadas na genética.

Uma vez com o sequenciamento em mãos, os genetecistas buscam agora entender qual a modificação num organismo quando se troca um gene de lugar. Eles estão utilizando teorema de Bayes para identificar as probabilidades da alteração num corpo ter ocorrido para o gene A, ou B ou muitos outros.

No caso do mercado financeiro, não apenas Petrorbras ou Vale fazem parte do índice. Na verdade existem outras com grandes pesos nos cálculos, ou com volumes tão fortemente negociados quanto dessas duas empresas. No entanto, como escrito antes, quando se passa de duas fontes para três fontes a compreensão e complexidade da programação aumentam.

E para 20 ações? É plenamente possível, mas a complexidade no cálculo de Bayes torna um grande desafio, pois a probabilidade da fonte escolhida não é fixa em 50% como no caso da moeda, mas ela altera a cada 15 minutos.

Isso tudo demonstra que Bayes continua vivo e está em todas as partes. Tudo que imaginamos é pedir informação aos outros para diminuir nossa ignorância. Sem saber, em nosso dia-a-dia estamos aplicando Bayes.

Afinal, será mesmo que o pastor Thomas Bayes encontrou a fórmula de Deus? Pense nisso leitor!

 

Gostou do texto?

FAÇA UM DONATIVO PARA O SITE

(R$ 2,00 ; R$ 5,00 ; R$ 10,00 )