Escolar Documentos
Profissional Documentos
Cultura Documentos
Análise de conformidade
29 de outubro de 2022
ANÁLISE DE VULNERABILIDADE
DO PRIMEIRO TURNO DAS
ELEIÇÕS PRESIDENCIAIS DO
BRAZIL DE 2022
RELATÓRIO
INTRODUÇÃO
LEI DE NEWCOMB-BENFORD
A Lei de Benford, também chamada de lei do primeiro dígito, ou Lei de Newcomb-Benford,
e a lei de números irregulares, refere-se à distribuição de dígitos em várias fontes de casos
reais. Em vez da homogeneidade esperada, a lei afirma em muitas coleções de números
que ocorrem naturalmente que o primeiro dígito significativo é provavelmente pequeno.
Sem homogeneidade, essa distribuição mostra que o dígito 1 tem probabilidade de
aparecer 30% em um conjunto de dados estatísticos, enquanto valores maiores têm menos
probabilidade de aparecer.
Frank Benford mostrou que esse resultado se aplica a uma ampla variedade de conjuntos
de dados, incluindo contas de eletricidade, endereços, preços de ações, preços de
participações privadas, números populacionais, taxas de morte, comprimentos de rios,
constantes físicas e matemáticas, pelo poder de leis (que são muito comuns na natureza).
Todas essas instruções são calculadas ou definidas em uma escala logarítmica.
homem --- 30.1 17.6 12.5 9.7 7.9 6.7 5.8 5.1 4.6
2a posição 12 11.4 10.9 10.4 10 9.7 9.3 9 8.8 8.5
Posição MB 10.2 10.1 10.1 10.1 10 10 9.9 9.9 9.9 9.8
APLICAÇÕES LEGAIS DA NEWCOMB-BENFORD
Evidência judicial
Análise de dados eleitorais
Dados macroeconômicos
Análise de Fraude de Imposto de
Análise de dados do genoma
Detecção de fraudes científicas
"A verdade é que" ele disse em uma entrevista, a maioria das pessoas
não conhece as chances reais de um exercício como esse, para que não
possam falsificar dados de forma convincente."
InovaTCU Noticias
As analises de preços nas auditorias de obras públicas par vexes ocupam semanas de trabalho do auditor, pais,
em muitos casos, as planilhas orçamentárias são extensas e de difícil análise. A Lei Newcomb-Benford e uma
ferramenta de mineração de dados, alternativa a Curva ABC, que permite uma seleção possivelmente mais
precisa dos serviços das planilhas Para análise de preço.
/inovatcuinaticiasiaplicacaes-da-lei-de-benford-a-auditaria-de-abras-publicas.htm
-
Walter Mebane, um estatístico americano da Universidade de Michigan, estudou dados eleitorais de vários
parses, incluindo os Estados Unidos, Rússia e Mexico. Em 2006, ele descobriu que a contagem dos votos
tendia a seguir a Lei de Benford no segundo digito (Mebane, 2006). 0 pesquisador analisou os dados das
eleições iranianas em 2009 e encontrou anomalias que indicavam fortemente a ocorrência de fraude na vitória
do político Ahmadinejad (Mebane, 2009). Mebane verificou que, nas cidades com poucos votos inválidos, as
números de Ahmadinejad passavam longe da distribuição de Benford e que o candidate, nessas situações,
possuía uma grande vantagem nos votos.
A análise dos dados da primeira rodada da eleição presidencial brasileira de 2022 revelou
inconsistências nos conjuntos estatísticos. Este fato não afirma em si mesmo que houve
intervenção ou adulteração de dados externos. Isso só pode ser confirmado após uma investigação
meticulosa e detalhada do ponto de vista da defesa dos interesses nacionais de
soberania nacional. Houve, sem dúvida, prova do acesso externo ao sistema de operação
eleitoral nas últimas eleições. O tema foi reencaminhado em vários meios de comunicação
social e o próprio operador do sistema eleitoral reconheceu este fato, incluindo a transmissão
de documentos às autoridades policiais. Mas as indicações numéricas de 2022 -
independentemente deste fato, e antes de considerar se havia vulnerabilidades externas nas
últimas eleições - corroboram a necessidade de medidas de proteção como medida de Veja os
gráficos agrupamento da zona eleitoral abaixo.
Como exemplo, esta é uma visão panorâmica da análise de dados agrupada por zonas
eleitorais. É possível verificar se há muitos conjuntos numéricos, em diferentes leituras
e formatos, que apresentam não conformidades aparentes com os parâmetros NBL, que
serão o objeto de análise mais profunda específica.
Foram utilizados dados puros para análise, obtidos do TSE (Superiora Eleitoral Court)
data repository. thttps://www.tse.jus.bdeleicoesieleicoes-2022/divulgacao-dos-resultados-das-eleicoes-20221
A aplicação da regra do 1o dígito para a NBL requer números que atendam a todas as
séries numéricas que alcancem os dígitos 1 a 9, no caso de zonas e cidades Eleitorais.
Ambos servem para aproveitar a regra NBL (Newcomb-Benford Law). No entanto, o
estudo realizado por cidades, se realizado com um universo muito restrito, pode gerar
distorções.
A distância da população entre a maior e a menor zona eleitoral do Brasil tem um intervalo
menor do que a distância da população entre o menor e o maior município brasileiro.
A primeira parte do estudo utiliza a regra NBL de 1o dígito, na qual foram avaliadas as
2,637 zonas Eleitorais no Brasil e no exterior. A presença de distorção é observada,
onde o desvio médio excede as possíveis margens de erro.
Como uma visão geral planimétrica inicial, alguns gráficos são apresentados em sequência.
Estes são os dados que serão objeto de estudo adicional (1):
(1) esta tabela contém as UMIs - Unidades informativas mínimas - utilizadas para o presente estudo. Ele
será repetido várias vezes durante o texto. Ele é gerado em português, porque reflete imagens
capturadas diretamente do processamento de dados primário. Suas colunas são as seguintes, com
seus respetivos significados em inglês: Dígito/quantidade votos / NBL1 St / %1o dígito/ NBL padrão /
variação / NBL por zonas / Total
DIGITO CA VOWS NSW % 1a longe do PADRAO Nil NBL POR ZONAS - PE
1 504.494 VARIACAO 3 1 3 0 , 1 % j 40,016
2 L003.556 4 5 , 6 % 4 2
IMIKK3 17,4,4 1! 0 iGITOPADRAO NBL
35,0%
3 650.745 19 ,6% 12,5% 24,7%
30,0%
4 816.827 1 8 E M, 8 % 9,7% 52,3%
25,0%
5 573.275 11 11:11 9,0% 7,9% 20,0%
0 0,0% 6,7%
15,0%
0 0,0% 5,8%
10,0%
0 0,0% 5,1%
5,0%
Os casos acima (RJ, CE e PE) foram demarcados porque mostraram alta incidência de
"zero" nas células onde deveria haver um valor positivo. Eles estão aqui colocados como
anomalias detectadas nos exemplos de nível de Estado. No entanto, seu estudo isolado
não pode ser dissociado do estudo global com dados agregados.
Da mesma forma que os dados isolados em nível de estado de DF, AC, BA e CE, os
Estados também mostram identificação de anomalias nos registros de grupos
detectados.
Considerando o curto período de tempo entre a expedição dos resultados definitivos e
a análise, é evidente a necessidade de desdobrar esses focos referenciados como um
ponto de observação particularizado.
Apresentamos abaixo todas as tabelas de dados referentes aos votos obtidos pelos 4
candidatos mais votados, com as tabulações referentes a votos em branco e inutilizados,
na seguinte ordem:
a) Quantitativo nacional;
b) Quantitativo regional.
Outra técnica da Lei de Benford utilizada, trabalha com o 2º dígito. O renomado pesquisador
Walter Mebane, da Universidade de Michigan, utilizou essa técnica para avaliar as eleições
iranianas de 2009. Foram encontradas fortes anomalias que indicavam a vitória do político
Ahmadinejad. Nesta série, os dados foram trabalhados por zona eleitoral considerando os votos
que atingiram mais de 10 votos, de forma a beneficiar apenas o 2º dígito.
As proporções históricas para o segundo dígito são as mostradas acima.
Nos gráficos abaixo, é possível observar as aparentes distorções que ocorrem nos totais
agregados por Zonas Eleitorais dos estados brasileiros, posteriormente agrupados por região
geográfica. Conforme mostrado nos gráficos, um valor agregado de dados cuja análise foca no
segundo dígito pode apresentar aparentes distorções. Essas distorções devem ser objeto de
estudos específicos, que serão vistos em séries de dados posteriores.
Segue-se um grupo de exemplos em que existem regiões pelo agrupamento do segundo dígito.
Há também evidências de anomalias na distribuição de dados:
Em relação à análise do último dígito, temos uma linha reta, com a inversão dos parâmetros, ao
invés de uma curva descendente com os valores ideais da Lei de Benford. Há muitos dados e
gráficos de todo o dado universal eleitoral de todo o país Como exemplo e elemento indicativo,
trazemos alguns gráficos descritos abaixo:
Nestes três grupos numéricos apresentados, há um fenômeno muito interessante do ponto de
vista analítico. Onde deveria haver uma linha, há uma curva.
Há outro caso com comportamento semelhante (mas invertido) derivado dos dados do segundo
dígito:
Neste exemplo, ocorre o inverso. Onde deveria haver uma “curva descendente”, existe uma
“quase reta”, ou uma curva levemente ascendente. Este tipo de situação (curvas onde deveriam
haver retas, ou retas onde deveriam haver curvas, ou curvas ascendentes versus curvas
descendentes) materializa o sinal de maior preocupação com a integridade dos conjuntos de
dados. Isto constitui um forte elemento indicativo.
Esse tipo de inversão é exatamente o que aconteceu na polêmica eleição venezuelana de 2004.
Ocorreu a inversão de eixos, o que pode significar que alguns dos conjuntos de números não são
produtos de distribuição natural, mas de geradores de números aleatórios. A hipótese é
explicada no vídeo-documentário "El Poder de la Matemática", disponível no Youtube.
[https://www.youtube.com/watch?v=IZNiFCvlbP8&t=303s]
Essa inversão de comportamento entre curvas e retas) foi identificada em pelo menos 4
situações nas eleições presidenciais brasileiras do primeiro turno de 2022.
CONCLUSÃO
1) A sexta coluna de cada tabela contém a variação percentual que ocorreu entre o parâmetro
considerado "ideal" para o NBL e os dados reais encontrados. Em várias células esta variação
teve uma quantidade significativa.
iI.c) Em 7 ocasiões supera a média de 30%. 1 deles excede 40% e outro excede 50%
iii) O comparativo dos itens “i”, “ii” e “iii” considera 30 tabelas [5 regiões compostas pelos 4
candidatos mais votados, mais votos em branco e nulos) referentes à análise do 1º dígito,
iv) Existem outros tipos de variações que não reivindicam os padrões considerados adequados,
considerando a análise do segundo e do último dígito, bem como existem situações específicas
de agravamento mais intenso (como os casos de células "zero" nos estados mencionado). No
entanto, esses dados são localizados e precisam ser examinados no contexto do conjunto de
dados nacional
Ex positis (isto posto), e considerando a rapidez e escassez de tempo, conclui-se que (tal como no
passado) existe um potencial de risco de invasão indevida e a realização de adulteração artificial
de dados que justifique as discrepâncias encontradas sem que esta seja afirmação constitui, ao
no momento presente, uma evidência definitiva. Este fato constitui elemento probatório e pode
ensejar a adoção de medidas EMERGENTES e URGENTES quanto à preservação da
SOBERANIA NACIONAL da Nação brasileira em face de eventuais interesses internacionais.
É preciso garantir a total independência dos resultados do segundo turno, diante de qualquer
ameaça internacional, conforme registrado. Tais medidas consistem na atuação conjunta e
cooperativa dos órgãos federativos, cada um dentro de sua área de atuação.
Obs: Este documento é um trabalho em andamento e será ampliado nos próximos dias. A forma
acelerada como o estudo foi produzido e relatado pode levar a eventuais imprecisões ortográficas
e de redação, e está em revisão imediatamente após sua conclusão.