Você está na página 1de 5

Automatização da Descoberta de Riscos em Procedimentos

Licitatórios
Valney da G. Costa1
1
Departamento de Computação – Universidade Federal do Piauí (UFPI)
Teresina – Piauí – Brasil
valney.gama@gmail.com
Resumo. Este projeto propõe a criação de um modelo de decisão baseada em
aprendizagem de máquina utilizando o algoritmo ID3 aplicado aos
procedimentos licitatórios publicados no Tribunal de Contas do Estado do
Piauí, com a finalidade de melhorar as técnicas de fiscalizações dos Tribunais
de Contas.

1. Introdução
A Licitação é o processo administrativo em que um ente público, ao executar um
processo de compra ou contratação, oferta aos interessados a oportunidade de
formularem propostas, entre as quais escolhe a melhor entre as apresentadas, visando
iguais oportunidades aos que desejam contratar com o serviço público [Furtado, 2013].
Para respeitar aos princípios da Administração Pública (Legalidade,
Impessoalidade, Moralidade, Publicidade e Eficiência), o processo licitatório segue
regras definidas pelas Leis Federais No 8.666/93, No 10.520/02 e No 12.462/11,
conhecidas como Normas Gerais, além de outras normas estaduais e municipais.
Pretende-se, com este trabalho, desenvolver uma pesquisa computacional, no
sentido de enumerar indícios de fraudes em licitações, a fim de desenvolver uma
ferramenta que, com estes dados, reconheça processos licitatórios com maiores riscos de
sofrerem atividades fraudulentas.
Para isso, iremos conceituar a aprendizagem de máquina, bem como suas
classificações e a definição de árvore de decisão. Iremos também identificar indícios de
irregularidades em licitações e editais existentes, além de criar uma ferramenta que,
utilizando uma árvore de decisão, tomará decisões baseada nas informações anteriores e
aprenderá com as novas informações.
Este trabalho foi elaborado por meio de uma pesquisa bibliográfica, de caráter
experimental, baseada nos estudos da disciplina de Sistemas Inteligentes do Programa
de Pós-graduação em Ciência da Computação da Universidade Federal do Piauí (UFPI),
bem como em autores reconhecidos da área de Inteligência Artificial.
Não apenas o interesse pessoal justifica esta pesquisa, mas a criação de
mecanismos que ajudem no combate à corrupção no estado do Piauí, por meio do
trabalho realizado pelo Tribunal de Contas do Estado do Piauí (TCE-PI).

2. Descrição do Problema
A legislação de licitações prevê expressamente que frustrar ou fraudar processos
licitatórios configura crime. Entretanto, isso não impede que pessoas o façam, vide
escândalos de corrupção que sempre são informados nos jornais. Em média, R$ 160
bilhões por ano são perdidos pela corrupção [KIRSCHE, 2019].
Descobrir fraudes em licitações é uma tarefa difícil, pois por ser um crime, não é
possível encontrar um recibo, autorização ou documento atestando combinação de
valores, ou até associação com entes públicos [SANTOS, 2018]. Mesmo assim, existem
formas de encontrar riscos e inferir quais delas apresentam fraudes ou não.
Os servidores encarregados para esta função possuem dificuldades para
identificar previamente as fraudes destas licitações e até mesmo efetuarem fiscalizações
devido à grande quantidade de processos. Criar uma ferramenta que possa descobrir
automaticamente certames que apresentem riscos para a Administração Pública é o
cerne norteador desta pesquisa.

3. Referencial Teórico
O Tribunal de Contas do Estado do Piauí é o ente que fiscaliza a administração
orçamentária e financeira de órgãos públicos do estado e municípios do Piauí. Criado
em 1899, com a redemocratização, em 1985, se consolidou como um órgão de
fiscalização atuante das contas públicas. Desde 2011, o TCE-PI possui dados digitais de
licitações, contratações públicas e informações sobre admissões e demissões, dentre
várias bases de dados.
A análise de licitações é um dos meios de fiscalização efetuados pelo Tribunal
de Contas. Essa fiscalização, somente na área de Tecnologia da Informação, resultou na
economia de R$ 2,9 milhões no ano de 2019 [TCE, 2020]. Ainda assim, o órgão
investiga diversos casos de corrupção em processos por ano.
Uma forma eficiente para realizar esta investigação envolve utilizar programas
que descubram semelhanças entre licitações com fraudes e outras licitações ainda não
analisadas, de forma a tentar perceber se estas novas licitações podem conter
irregularidades. Essa aprendizagem deve ser sempre evolutiva, uma vez que as
estratégias de corrupção são dinâmicas.
O levantamento bibliográfico que será a base para este estudo será realizado por
meio de pesquisa de aporte teórico utilizando autores que são referências na área de
Inteligência Artificial, além da análise de dados e testes experimentais de uma
ferramenta que será criada para identificar licitações com indícios de possíveis fraudes.

3.1. Aprendizagem de Máquina


A Aprendizagem de Máquina consiste em criar programas computacionais que possuam
a capacidade de aprender continuamente ou descobrir padrões no processo de
descoberta de uma solução, sem serem programados especificamente para isso. Em seu
desenvolvimento, o programa que utiliza aprendizagem de máquina deve passar por
uma etapa de treinamento, na qual poderá entender padrões e rotinas e criar seu
conhecimento.
O tipo de aprendizagem é de ampla importância na descoberta de conhecimento
de um programa. Por exemplo, aprendendo a jogar xadrez, o conhecimento que a
máquina aprenderá pode vir de forma direta de exemplos das peças em um tabuleiro e a
forma correta de agir, ou da informação indireta das sequências de movimentos e seu
resultado final, ou seja, se um jogo é vencido ou perdido [MITCHELL, 1997].
Segundo Russel e Norvig [2004], a aprendizagem de máquina é subdividida em
três subgrupos: aprendizagem supervisionada, aprendizagem não supervisionada e
aprendizado por reforço.
Na aprendizagem supervisionada, o programa é treinado anteriomente por uma
série de entradas e suas saídas esperadas, com o intuito de aprender a prever saídas para
novas entradas.
Por sua vez, na aprendizagem não supervisionada, os dados não possuem valores
de saídas específicos e a aplicação deverá descobrir similaridades e caracteísticas
específicas destas referências, podendo categorizar novos dados e até reorganizar as
informações existentes em virtude de novas entradas.
Por fim, no aprendizado por reforço, o programa deve aprender a partir do
reforço, isto é, a avaliação de suas saídas de maneira que uma resposta positiva ou
negativa determina se seu comportamento é ou não desejável.

3.2. Árvore de Decisão e Algoritmo ID3


No aprendizado supervisionado, o conhecimento adquirido pode ser categorizado de
forma que seja possível organizar determinados grupos de resultados, ou as
probabilidades para se chegar às possíveis soluções de um dado problema.
Uma árvore de decisão é um modelo estatístico de apoio à decisão que, a partir
de problemas anteriores descritos por várias propriedades, define uma árvore em que
cada nó representa uma possível decisão, seus ramos são cada possível valor desta
decisão e suas folhas são as classes em que serão definidos os problemas. Este
aprendizado pode ser aplicado a novos problemas de mesmas propriedades, induzindo
uma solução para estes.
O algoritmo ID3, criado por Ross Quinlan em 1986, é uma forma simples e
comumente utilizada para criar árvores de decisão. Consiste, primeiramente, em uma
lista de aprendizagem com entradas e saídas, calcular a Entropia(S) do atributo de saída
do conjunto completo, definida pela equação:

,
Sendo [p1, p2, ..., pi] as probabilidades dos valores neste atributo, e c a
quantidade destes. Então, para cada atributo que ainda não tenha sido adicionado à
árvore gerada, subtrai-se o valor descoberto pela entropia de cada valor deste atributo
em relação aos valores da Entropia(S). A este novo valor dá-se o nome de Ganho de
Informação.
O atributo com o maior valor de Ganho de Informação se torna o nó desta árvore
e seus valores distintos os ramos. Para cada ramo o algoritmo repete recursivamente,
sem o nó da árvore escolhida e utilizando o subconjunto de entradas cujo valor do nó
corresponde ao ramo, até que não existam mais atributos a serem adicionados em nós na
árvore.
3.3. Preparação dos Dados
As informações provenientes do banco de dados de Licitações do Tribunal de Contas
não contêm, inicialmente, informações sobre quais processos licitatórios são aqueles de
maior ou menor risco e determinar essa informação é um passo essencial na criação da
árvore de decisão. O cruzamento desses dados com outros provenientes de outras bases
de dados públicas do próprio TCE pode ajudar nessa descoberta.
Existem métodos que os auditores utilizam para descobrir prováveis indícios de
riscos nas licitações: por exemplo, em um processo licitatório com três empresas, se
duas delas são concorrentes repetitivos de outros processos, mas nunca venceram
nenhum; ou então, casos de processos licitatórios com participantes que já sofreram
fiscalizações anteriores. Esses padrões são denominados trilhas de risco.
Quanto mais uma licitação figura em uma trilha de risco, mais ela pode ser
considerada arriscada, por assim dizer. Estas classificações iniciais serão atribuídas
pelos auditores à parte das licitações já finalizadas, criando a base de treinamento que
será utilizada no algoritmo para criar a árvore de decisão.

4. Resultados Esperados
Pretende-se, com este estudo, clarificar quais classes de licitações acabam por ser as
principais escolhidas por pessoas mau intencionadas, seja por valor alto ou baixo, por
forma de licitação, se é presencial ou virtual, entre outros. Este conhecimento definirá
trilhas para o desenvolvimento de uma ferramenta, que ativamente descobrirá e
redescobrirá estas trilhas e dará a auditores e servidores públicos informações e
caminhos para a correta fiscalização das contas públicas.

Figura 1. Exemplo de Árvore de Decisão Esperada

5. Considerações Finais
Neste estudo, com o objetivo de automatizar a descoberta primária de licitações
públicas com maiores riscos de fraude, espera-se obter um modelo de classificação e
descoberta de processos licitatórios com características similares a outros que são os
principais alvos de corrupção. Durante a pesquisa, o problema foi discutido e definido
para assim entender e propor uma solução.
Escolher um método de classificação baseada em aprendizagem de máquina
tornou-se um desafio, uma vez que outras formas de definição e resolução do problema
proposto também podem ser válidas, bastando apenas redefinir a forma de resolução.
Espera-se que este modelo automático possa ser base para outros trabalhos
similares, e outros projetos de classificadores que utilizem aprendizagem de máquina.
Além disso, o modelo pode ser utilizado em outros Tribunais de Contas, aperfeiçoando
os métodos de combate à fraude e corrupção.
Futuramente, o modelo automático pode ser utilizado para refinar as trilhas de
risco previamente definidas, utilizando os próprios dados treinados para decidir a
importância de uma trilha específica.

Referências
Furtado, L. R. (2013). “Curso de Direito Administrativo”, Fórum, Belo Horizonte.
https://www.forumconhecimento.com.br/livro/1145, agosto.
Santos, F. B. e Souza, K. R. (2018) “Como Combater A Corrupção em Licitações”.
Fórum, Belo Horizonte. https://www.forumconhecimento.com.br/livro/1419, agosto.
Kirsche, W. (2019) “Brasileiro trabalha 29 dias por ano para pagar a conta da
corrupção, diz instituto, G1”. https://g1.globo.com/pr/parana/noticia/2019/06/05/bras
ileiro-trabalha-29-dias-por-ano-para-pagar-a-conta-da-corrupcao-diz-instituto.ghtml,
agosto.
Mitchell, T. M. (1997) “Machine Learning”, McGraw-Hill Science/Engineering/Math,
Tribunal de Contas do Estado. (2020) “Fiscalizações de licitações na área de TI geraram
economia de R$ 2,9 milhões”. https://www.tce.pi.gov.br/fiscalizacoes-de-licitacoes-
em-ti-geraram-economia-de-r-29-milhoes-aos-cofres-publicos/, agosto.

Você também pode gostar