Sábado, 21 de Outubro, 2017

 

Dados de Temer não passam na "Lei Matemática"

 

Pode parecer estranho, mas por que o número 1 teria preferência em relação aos demais?

Mas foi isso que o físico Frank Benford descobriu em 1938. Na realidade no ano de 1881 um astrônomo (Simon Newcomb) já tinha percebido que as tabelas de logaritmo tinham mais frequência nos primeiros dígitos que começavam com o número 1. E como todos sabemos que a probabilidade de escolha de números aleatórios entre 1 e 9 é a mesma e uniforme, ninguém deu muita atenção.

Mas olhe para o retrato de Frank Benford a seguir.

Olhar compenetrado, físico respeitado e que trabalhava arduamente. E para provar que a aparição de mais números 1 do que os demais não era apenas um erro de observação, Benford testou com dados de todos os tipos na época. E descobriu que o número 1 tem 30,1% mais chance de aparecer em dígitos de quaisquer medidas, sejam elas constantes físicas, matemáticas, resultados de economia, tamanho de populações, dados de geografia, história, etc.

Já escrevemos sobre essa lei aqui (leia o texto anterior "A melhor lei contra fraude"). Sua fórmula é simples e no final do texto antigo deixamos uma planilha do Excel pronta para testar a lei. Sua formulação matemática é esta a seguir.

A fórmula diz que a probabilidade do dígito "d" aparecer em qualquer medida é o logaritmo na base 10 de 1+1/d. E pronto, acabou. Ao desenvolver essa fórmula encontramos a seguinte tabela de probabilidades para os dígitos entre 1 e 9.

Um ótimo texto pode ser encontrado no wikipedia (Benford's law) para que todos entendam que a fórmula é séria e já foi exaustivamente testada em diversos setores. E por que ela ganhou importância? É apenas uma "brincadeira" matemática!

Não é.

A partir dos anos 90 um pesquisador na área de controladoria e consultoria sobre fraudes, descobriu que a lei Benford serviria para averiguação sobre manipulação de dados e fraudes em vendas, processos, lucros, dividendos, seguros, etc. E passou a usar apenas uma tabela e planilha para verificar fraudes. Acertou em cheio!

Toda vez que dados de um grande banco de dados não se encaixam na distribuição da lei Benford é porque de alguma forma ocorreu algum tipo de manipulação para inventar dados e aparentar normalidade. Ou ainda, muitas vezes não é fraude, mas também uma mudança na estratégia de coleta de dados. Ou ainda, pode ser apenas uma mudança na estratégia de cálculo.

O fato é que a lei de Benford consegue detectar qualquer tipo de mudança que altere o padrão dos dados. O leitor verá como é interessante, ao tomarmos os dados do Ibovespa. Tomando os dados dos últimos 115 dias e calculamos seu retorno diário, após o fechamento do pregão.

Como esse retorno poderá ser positivo ou negativo, usamos a função de valor absoluto para termos em mãos apenas os dígitos, independentes de seu sinal. Isso porque Benford se preocupa com o dígito e não com seu valor. E quando fizemos isso, conseguimos para os dados atuais do Ibovespa o seguinte gráfico.

Cravado em cima!

O eixo das abscissas (ou horizontal) marca os primeiros dígitos que aparecem no retorno. Por exemplo, se o retorno do Ibovespa foi 0,341, o primeiro dígito é 3. Se o retorno foi 0,128 o primeiro dígito é 1. E assim por diante, a função fica sendo apenas contar quantas vezes apareceu o número 1 em primeiro lugar, depois o número 2 em primeiro lugar, o número 3 em primeiro lugar e assim por diante.

Mas para não parecer apenas visual o resultado, deve-se fazer algum teste estatístico. Por exemplo, usamos o teste recomendado por quem usa a lei Benford. O teste de Qui-quadrado é o mais usado e também está programado no Excel. O resultado para esse exemplo?

O teste de Quiquadrado nos aponta que existe 82% de chance dos dados do retorno obedecerem a lei Benford. Ou seja, ao nível de 5% de rejeição, um nível bastante utilizado no mercado financeiro, o teste "sobrou".

E então chegamos ao seguinte ponto. Se o governo que aí está, sob a batuta de uma porção de gente traiçoeira, gente que já é réu, que ainda vai se tornar réu, gente que dá tapa na cara da população todos os dias, é possível confiar nas estatísticas que se apresentam? Sim, porque se não confiamos na pessoa de Temer, se não confiamos em seu governo, não há porque confiar em seus dados.

Uma notícia chamou a atenção ainda no primeiro semestre em diversos sites de revistas. Por exemplo a revista Carta Capital alegou que o IBGE estava favorecendo Temer (entenda-se manipulando dados) ao "corrigir" distorções de medida do PIB.

Certamente muitos vão dizer que essa é uma "revista de esquerda" e bla bla bla bla.... Vamos deixar esse "mimimi" de lado e tomar os próprios dados do IBGE, a série histórica oficial que é pública e está no site do IBGE.

Tomamos a variação do PIB desde 1981, trimestre a trimestre. Como o leitor poderá ver ao lado, a série não passou no teste.

A probabilidade da variação do PIB respeitar a lei Benford é 0,0000007225. Ou seja, a variação do PIB não está seguindo a lei Benford.

Mas vamos com calma. O PIB teve sua medida alterada diversas vezes, em todos os governos. Em 2014 ocorreu alteração mudando medidas de 2010.

No governo Lula teve alterações e no governo Fernando Henrique também. A série só se comporta de maneira normal e honesta até dezembro de 1998.

Ou seja, de 1981 a 1998 a série tinha um comportamente que respeitava a lei Benford, sem indícios de manipulação ou alteração de cálculo.

Assim sendo, é injusto acusar Temer no que se refere ao PIB. A série já foi tanto manipulada no passado que somente daqui muitos anos, se ninguém mexer mais, é que poderemos ver normalidade em relação a lei Benford.

Mas a história não termina por aí.

A reportagem entrevistou funcionários antigos de carreira do IBGE que alegaram haver sim, manipulação no que se refere a normalização dos dados.

A reportagem apontou que a possível manipulação se daria ao nível de dados de serviços e vendas.

Resolvemos testar então em outro conjunto de dados. Tomamos os dados da Produção Industrial Mensal.

Esses dados estão disponíveis tanto no IBGE, quanto no IPEADATA ou em diversos sites econômicos.

Variação do PIB não passa na lei Benford

 

Variação do PIB até 1998 passa na lei Benford

 

 

Produção Industrial Mensal até março/2015

 

 

 

Produção Industrial Mensal após março/2015

 

Ao jogar a Produção Insutrial Mensal medida pelo IBGE de 2003 até o mês de março de 2015, verificamos ao lado que a série passa no teste para a lei Benford.

Desse ponto de vista, ao nível de 95% de confiança a série de dados não pode ser suspeita de fraude ou manipulação segundo a concepção da lei Benford.

Vemos que o chamado "p-nível" ou "p-valor" para o teste de Quiquadrado é superior aos 5% de limitação inferior (6,005%).

Graficamente e visualmente também é fácil nos convencer de que a série se comporta bem e dentro dos padrões de normalidade para a lei Benford.

Mas então, o que acontece quando a Produção Industrial Mensal sob a tutela de Temer, começa a entrar na série histórica dos dados do IBGE após março de 2015?

Vale à pena lembrar que os dados foram sempre adquiridos desde 2003. E colocando agora os dados após março de 2015, ou seja, até agosto de 2017, a série deixa de passar na lei Benford.

Sim, após março de 2015 a série tem indícios de mudanças, segundo os critérios de fraude definidos pela lei Benford e não passa no teste.

As alterações nos dados ou cálculos podem ser institucionais, claras, bem definidas e públicas, como também podem ser grosseiras e na surdina dos acontecimentos.

Algumas alterações sempre são feitas pelo IBGE e mesmo revisões são constantes. Mas revisões que fazem o PIB se alterar de negativo para positivo, é um perigoso indício de politicagem suja e barata.

A reportagem indica que uma simples mudança no setor de serviços poderia alterar o PIB e, de recessão, o Brasil poderia indicar para o mercado que estaria saindo da recessão.

E isso realmente ocorreu. Vamos aceitar momentâneamente que é apenas uma coincidência.

Mesmo assim, por apenas uma coincidência, na concepção da lei Benford, isso de forma alguma poderia alterar o padrão da série em relação aos acontecimentos e surgimentos normais dos dígitos.

Novamente ressaltamos que essa lei Benford é usada para capturar fraudes no setor de seguros na Europa. Para quem ainda acha que é apenas uma "fórmula de brincadeira" o artigo em pdf que disponibilizamos aqui ("Benford Law") foi escrito pelo mais prestigiado instituto de Matemática e Engenharia do Reino Unido, o Imperial College de Londres.

Nesse artigo e em outros, o desenvolvimento matemático e a explicação sob o ponto de vista da teoria das probabilidades comprovam a seriedade da lei de Benford.

Séries que não passam na lei de Benford, são séries obscuras e precisam serem explicadas pelos gestores. Nas fórmulas matemáticas não existem malas ou propinas, as respostas ou são corretas, ou não são.

Não existem trocas de fórmulas para favorecer parecer em Teorema Matemático!