Você está na página 1de 27

Eleições 2022

República Federativa do Brasil


Documento sob confidencialidade - divulgação proibida

Análise de conformidade
29 de outubro de 2022

ANÁLISE DE VULNERABILIDADE
DO PRIMEIRO TURNO DAS
ELEIÇÕS PRESIDENCIAIS DO
BRAZIL DE 2022
RELATÓRIO
INTRODUÇÃO

O presente documento tem como objetivo relatar , a partir da perspetiva de um método


consolidado de Ciência Forense baseado em um processo observacional de análise
estatística, os dados da primeira rodada de contagem de eleições brasileiras de 2022. O
método observacional usado é a Lei de Benford.

Os dados observados estão disponíveis no Tribunal superior Eleitoral Brasileiro


(Tribunal superior Eleitoral - TSE).

LEI DE NEWCOMB-BENFORD
A Lei de Benford, também chamada de lei do primeiro dígito, ou Lei de Newcomb-Benford,
e a lei de números irregulares, refere-se à distribuição de dígitos em várias fontes de casos
reais. Em vez da homogeneidade esperada, a lei afirma em muitas coleções de números
que ocorrem naturalmente que o primeiro dígito significativo é provavelmente pequeno.
Sem homogeneidade, essa distribuição mostra que o dígito 1 tem probabilidade de
aparecer 30% em um conjunto de dados estatísticos, enquanto valores maiores têm menos
probabilidade de aparecer.

Frank Benford mostrou que esse resultado se aplica a uma ampla variedade de conjuntos
de dados, incluindo contas de eletricidade, endereços, preços de ações, preços de
participações privadas, números populacionais, taxas de morte, comprimentos de rios,
constantes físicas e matemáticas, pelo poder de leis (que são muito comuns na natureza).
Todas essas instruções são calculadas ou definidas em uma escala logarítmica.

homem --- 30.1 17.6 12.5 9.7 7.9 6.7 5.8 5.1 4.6
2a posição 12 11.4 10.9 10.4 10 9.7 9.3 9 8.8 8.5
Posição MB 10.2 10.1 10.1 10.1 10 10 9.9 9.9 9.9 9.8
APLICAÇÕES LEGAIS DA NEWCOMB-BENFORD

 Evidência judicial
 Análise de dados eleitorais
 Dados macroeconômicos
 Análise de Fraude de Imposto de
 Análise de dados do genoma
 Detecção de fraudes científicas

Seguindo a Lei de Benford, ou olhando para o no I


POR MALCOLM W. BROWNE AGO. 4, 1996

DR. THEODORE P. HILL pede aos seus alunos de matemática no Instituto


de Tecnologia da Geórgia que vão para casa e joguem uma moeda 200 vezes
e gravem os resultados, ou simplesmente finjam virar uma moeda e
falsifiquem 200 resultados. No dia seguinte, ele passa aos olhos nos dados da
lição de casa e, para o espanto dos alunos, ele facilmente aponta quase todos
aqueles que falsificaram suas jogadas.

"A verdade é que" ele disse em uma entrevista, a maioria das pessoas
não conhece as chances reais de um exercício como esse, para que não
possam falsificar dados de forma convincente."

Há mais para isso do que um truque de sala de aula.

O Dr. Hill é um em um número crescente de estatísticos, contadores e


matemáticos que estão convencidos de que um teorema matemático
surpreendente conhecido como Lei de Benford é uma ferramenta poderosa e
relativamente simples para apontar suspeitas de fraudes, fraudadores,
evasores de impostos, contadores desleixados e até mesmo bugs de
computador.

(Lei de Benford no New York Times)


[httos://www.nvtimes.com/1998/08/04/science/following-benford-s-law-or-looking-out-for-no-Lhtml]
Lei de Benford no Brasil

Escrito no site do Tribunal de Contas da União (TCU):

"Vários estudos têm sido conduzidos, adotando a hipótese que a fabricação de


dados são identificados por desvio de dígitos em relação à distribuição de Benford."

"Walter Mebane, um estatístico americano na Universidade de Michigan,


estudou dados eleitorais de vários países, incluindo os Estados Unidos, a Rússia e
o México."

"O pesquisador analisou os dados das eleições iranianas em 2009 e encontrou


anomalias que indicaram fortemente a ocorrência de fraude na vitória do político
Ahmadinejad (Mebane, 2009)."

Aplicações da Lei de Benford à auditoria de obras públicas | Portal TCU

InovaTCU Noticias

inova TCU contato

Aplicações da Lei de Benford auditoria de obras publicas

As analises de preços nas auditorias de obras públicas par vexes ocupam semanas de trabalho do auditor, pais,
em muitos casos, as planilhas orçamentárias são extensas e de difícil análise. A Lei Newcomb-Benford e uma
ferramenta de mineração de dados, alternativa a Curva ABC, que permite uma seleção possivelmente mais
precisa dos serviços das planilhas Para análise de preço.

/inovatcuinaticiasiaplicacaes-da-lei-de-benford-a-auditaria-de-abras-publicas.htm
-

Walter Mebane, um estatístico americano da Universidade de Michigan, estudou dados eleitorais de vários
parses, incluindo os Estados Unidos, Rússia e Mexico. Em 2006, ele descobriu que a contagem dos votos
tendia a seguir a Lei de Benford no segundo digito (Mebane, 2006). 0 pesquisador analisou os dados das
eleições iranianas em 2009 e encontrou anomalias que indicavam fortemente a ocorrência de fraude na vitória
do político Ahmadinejad (Mebane, 2009). Mebane verificou que, nas cidades com poucos votos inválidos, as
números de Ahmadinejad passavam longe da distribuição de Benford e que o candidate, nessas situações,
possuía uma grande vantagem nos votos.

Considerando o mais alto órgão nacional de auditoria reconhece e propaga o uso


da Lógica Benford em auditorias públicas, inclusive a nível eleitoral, começamos a
analisar os dados da primeira rodada da eleição presidencial brasileira de 2022. Essa
técnica nos permite tirar conclusões muito rápidas sobre a consistência dos conjuntos
numéricos.
LEI DE NEWCOMB-BENFORD NAS ELEIÇÕES BRASILEIRAS

A análise dos dados da primeira rodada da eleição presidencial brasileira de 2022 revelou
inconsistências nos conjuntos estatísticos. Este fato não afirma em si mesmo que houve
intervenção ou adulteração de dados externos. Isso só pode ser confirmado após uma investigação
meticulosa e detalhada do ponto de vista da defesa dos interesses nacionais de
soberania nacional. Houve, sem dúvida, prova do acesso externo ao sistema de operação
eleitoral nas últimas eleições. O tema foi reencaminhado em vários meios de comunicação
social e o próprio operador do sistema eleitoral reconheceu este fato, incluindo a transmissão
de documentos às autoridades policiais. Mas as indicações numéricas de 2022 -
independentemente deste fato, e antes de considerar se havia vulnerabilidades externas nas
últimas eleições - corroboram a necessidade de medidas de proteção como medida de Veja os
gráficos agrupamento da zona eleitoral abaixo.

Como exemplo, esta é uma visão panorâmica da análise de dados agrupada por zonas
eleitorais. É possível verificar se há muitos conjuntos numéricos, em diferentes leituras
e formatos, que apresentam não conformidades aparentes com os parâmetros NBL, que
serão o objeto de análise mais profunda específica.
Foram utilizados dados puros para análise, obtidos do TSE (Superiora Eleitoral Court)
data repository. thttps://www.tse.jus.bdeleicoesieleicoes-2022/divulgacao-dos-resultados-das-eleicoes-20221

Os dados foram corretamente descompactados e inseridos nos bancos de dados


apropriados - em operações de verificação paralelas e redundantes - para preservar a
originalidade dos dados nas tabelas importadas. A análise principal foi restrita e
concentrada no cargo de presidente, alcançando os candidatos com os 4 votos mais altos,
e também comparando os votos "Branco" e "Nulo".

A aplicação da regra do 1o dígito para a NBL requer números que atendam a todas as
séries numéricas que alcancem os dígitos 1 a 9, no caso de zonas e cidades Eleitorais.
Ambos servem para aproveitar a regra NBL (Newcomb-Benford Law). No entanto, o
estudo realizado por cidades, se realizado com um universo muito restrito, pode gerar
distorções.

A distância da população entre a maior e a menor zona eleitoral do Brasil tem um intervalo
menor do que a distância da população entre o menor e o maior município brasileiro.

A primeira parte do estudo utiliza a regra NBL de 1o dígito, na qual foram avaliadas as
2,637 zonas Eleitorais no Brasil e no exterior. A presença de distorção é observada,
onde o desvio médio excede as possíveis margens de erro.

Como uma visão geral planimétrica inicial, alguns gráficos são apresentados em sequência.
Estes são os dados que serão objeto de estudo adicional (1):

(1) esta tabela contém as UMIs - Unidades informativas mínimas - utilizadas para o presente estudo. Ele
será repetido várias vezes durante o texto. Ele é gerado em português, porque reflete imagens
capturadas diretamente do processamento de dados primário. Suas colunas são as seguintes, com
seus respetivos significados em inglês: Dígito/quantidade votos / NBL1 St / %1o dígito/ NBL padrão /
variação / NBL por zonas / Total
DIGITO CA VOWS NSW % 1a longe do PADRAO Nil NBL POR ZONAS - PE
1 504.494 VARIACAO 3 1 3 0 , 1 % j 40,016
2 L003.556 4 5 , 6 % 4 2
IMIKK3 17,4,4 1! 0 iGITOPADRAO NBL
35,0%
3 650.745 19 ,6% 12,5% 24,7%
30,0%
4 816.827 1 8 E M, 8 % 9,7% 52,3%
25,0%
5 573.275 11 11:11 9,0% 7,9% 20,0%
 0 0,0% 6,7%
15,0%
 0 0,0% 5,8%
10,0%
 0 0,0% 5,1%
5,0%

9 9.425 1 0,8% 4,6% 0,0%

Total 6eral 3.558.322 122 100,0% 100,0%

Os casos acima (RJ, CE e PE) foram demarcados porque mostraram alta incidência de
"zero" nas células onde deveria haver um valor positivo. Eles estão aqui colocados como
anomalias detectadas nos exemplos de nível de Estado. No entanto, seu estudo isolado
não pode ser dissociado do estudo global com dados agregados.
Da mesma forma que os dados isolados em nível de estado de DF, AC, BA e CE, os
Estados também mostram identificação de anomalias nos registros de grupos
detectados.
Considerando o curto período de tempo entre a expedição dos resultados definitivos e
a análise, é evidente a necessidade de desdobrar esses focos referenciados como um
ponto de observação particularizado.

Se fosse o caso de uma auditoria de documento específica [o principal objetivo da Lei


de Benford, ou seja, selecionar focos indicativos e realizar uma auditoria de documento],
estas seriam a primeira rodada de possíveis focos de auditorias de documento
específico. Isso não é possível no atual modelo eleitoral brasileiro, considerando a
inexistência de uma coleção documental que poderia alucidar as dúvidas apontadas
pelo exame de Benford nesses focos.

Apresentamos abaixo todas as tabelas de dados referentes aos votos obtidos pelos 4
candidatos mais votados, com as tabulações referentes a votos em branco e inutilizados,
na seguinte ordem:

a) Quantitativo nacional;

b) Quantitativo regional.

Um total de 36 visualizações gráficas de dados referentes à análise LNB no 1o


dígito é apresentado abaixo.

Primeiro, os dados nacionais agregados pelo primeiro dígito:


REGRA DO 2º DÍGITO

Outra técnica da Lei de Benford utilizada, trabalha com o 2º dígito. O renomado pesquisador
Walter Mebane, da Universidade de Michigan, utilizou essa técnica para avaliar as eleições
iranianas de 2009. Foram encontradas fortes anomalias que indicavam a vitória do político
Ahmadinejad. Nesta série, os dados foram trabalhados por zona eleitoral considerando os votos
que atingiram mais de 10 votos, de forma a beneficiar apenas o 2º dígito.
As proporções históricas para o segundo dígito são as mostradas acima.

Nos gráficos abaixo, é possível observar as aparentes distorções que ocorrem nos totais
agregados por Zonas Eleitorais dos estados brasileiros, posteriormente agrupados por região
geográfica. Conforme mostrado nos gráficos, um valor agregado de dados cuja análise foca no
segundo dígito pode apresentar aparentes distorções. Essas distorções devem ser objeto de
estudos específicos, que serão vistos em séries de dados posteriores.

Segue-se um grupo de exemplos em que existem regiões pelo agrupamento do segundo dígito.
Há também evidências de anomalias na distribuição de dados:
Em relação à análise do último dígito, temos uma linha reta, com a inversão dos parâmetros, ao
invés de uma curva descendente com os valores ideais da Lei de Benford. Há muitos dados e
gráficos de todo o dado universal eleitoral de todo o país Como exemplo e elemento indicativo,
trazemos alguns gráficos descritos abaixo:
Nestes três grupos numéricos apresentados, há um fenômeno muito interessante do ponto de
vista analítico. Onde deveria haver uma linha, há uma curva.

Há outro caso com comportamento semelhante (mas invertido) derivado dos dados do segundo
dígito:

Neste exemplo, ocorre o inverso. Onde deveria haver uma “curva descendente”, existe uma
“quase reta”, ou uma curva levemente ascendente. Este tipo de situação (curvas onde deveriam
haver retas, ou retas onde deveriam haver curvas, ou curvas ascendentes versus curvas
descendentes) materializa o sinal de maior preocupação com a integridade dos conjuntos de
dados. Isto constitui um forte elemento indicativo.

Esse tipo de inversão é exatamente o que aconteceu na polêmica eleição venezuelana de 2004.
Ocorreu a inversão de eixos, o que pode significar que alguns dos conjuntos de números não são
produtos de distribuição natural, mas de geradores de números aleatórios. A hipótese é
explicada no vídeo-documentário "El Poder de la Matemática", disponível no Youtube.
[https://www.youtube.com/watch?v=IZNiFCvlbP8&t=303s]

O vídeo é descrito da seguinte forma: "Documentário de 25 de maio de 2013 mostrando o caso


Enron e o Referendo de Revogação Presidencial de 2004 na Venezuela, no qual o uso da
matemática, especificamente a Lei de Benford, foi usado para detectar fraudes. Aqui estão
algumas capturas de tela tiradas diretamente de este documentário:
Nos 7 min e 44 segundos do vídeo é apresentada a situação em que ocorre a inversão entre
retas/curvas (destacadas em amarelo). Observa-se que entre os 4 gráficos de grupos numéricos
onde deveria haver um comportamento aderente aos padrões de Benford, isso ocorre apenas em
3 grupos. Um deles não segue os padrões de Benford, mas sim os padrões de distribuição
equitativa de dígitos. Isso tende a ser uma anomalia de padrão pela visão NBL

Essa inversão de comportamento entre curvas e retas) foi identificada em pelo menos 4
situações nas eleições presidenciais brasileiras do primeiro turno de 2022.

CONCLUSÃO

1) A sexta coluna de cada tabela contém a variação percentual que ocorreu entre o parâmetro
considerado "ideal" para o NBL e os dados reais encontrados. Em várias células esta variação
teve uma quantidade significativa.

ii) Obtendo a variação média de cada tabela temos o seguinte cenário;

ii.a) 30 vezes em 30 cenários - essa diferença ultrapassou a marca de variação de 10%

fora do parâmetro NBL ideal

ii.b) Em 18 ocasiões esta discrepância média ultrapassa os 20%;

iI.c) Em 7 ocasiões supera a média de 30%. 1 deles excede 40% e outro excede 50%

iii) O comparativo dos itens “i”, “ii” e “iii” considera 30 tabelas [5 regiões compostas pelos 4
candidatos mais votados, mais votos em branco e nulos) referentes à análise do 1º dígito,

iv) Existem outros tipos de variações que não reivindicam os padrões considerados adequados,
considerando a análise do segundo e do último dígito, bem como existem situações específicas
de agravamento mais intenso (como os casos de células "zero" nos estados mencionado). No
entanto, esses dados são localizados e precisam ser examinados no contexto do conjunto de
dados nacional

v) Os registros encontrados nos conjuntos de dados geram a inversão entre “curvas


descendentes”, “retas”, “curvas ascendentes”, o que também ocorreu no caso Venezuela de
2004 citado no corpo do texto.
Considerando os dados analisados, bem como o perfil probatório da Lei de Benford (e não
probatório), o procedimento mais correto a ser adotado na sequência deve ser uma auditoria
profunda e detalhada, com análise e comparação dos DOCUMENTOS FÍSICOS com as evidências
gráficas identificadas, em para poder elidir ou confirmar as anomalias detectadas.

Ex positis (isto posto), e considerando a rapidez e escassez de tempo, conclui-se que (tal como no
passado) existe um potencial de risco de invasão indevida e a realização de adulteração artificial
de dados que justifique as discrepâncias encontradas sem que esta seja afirmação constitui, ao
no momento presente, uma evidência definitiva. Este fato constitui elemento probatório e pode
ensejar a adoção de medidas EMERGENTES e URGENTES quanto à preservação da
SOBERANIA NACIONAL da Nação brasileira em face de eventuais interesses internacionais.
É preciso garantir a total independência dos resultados do segundo turno, diante de qualquer
ameaça internacional, conforme registrado. Tais medidas consistem na atuação conjunta e
cooperativa dos órgãos federativos, cada um dentro de sua área de atuação.

Obs: Este documento é um trabalho em andamento e será ampliado nos próximos dias. A forma
acelerada como o estudo foi produzido e relatado pode levar a eventuais imprecisões ortográficas
e de redação, e está em revisão imediatamente após sua conclusão.

Você também pode gostar