Estimativa de variáveis geometalúrgicas por aprendizado de máquinas

David Alvarenga Drumond
Estimativa e classificação de variáveis

geometalúrgicas a partir de técnicas de
aprendizado de máquinas
Porto Alegre
2019
Estimativa e classificação de variáveis geometalúrgicas a

partir de técnicas de aprendizado de máquinas
Documento de qualificação submetido ao pro-

grama de Pós-graduação em Engenharia de
Minas, Metalúrgica e Materiais da Escola de
engenharia da UFRGS, como quesito parcial
para a obtenção ao título de Doutor em En-
genharia.
Universidade Federal do Rio Grande do Sul

Faculdade de Engenharia de Minas
Programa de Pós-Graduação em Engenharia de Minas, Metalúrgica e Materiais -
PPGE3M
Orientador: João Felipe Coimbra Leite Costa

Coorientador: Áttila Leães Rodrigues
Porto Alegre
2019
Estimativa e classificação de variáveis geometalúrgicas a partir de técnicas de
aprendizado de máquinas/ David Alvarenga Drumond. – Porto Alegre, 2019-
205 p. : il. (algumas color.) ; 30 cm.
Orientador: João Felipe Coimbra Leite Costa
Tese – Universidade Federal do Rio Grande do Sul

Faculdade de Engenharia de Minas
Programa de Pós-Graduação em Engenharia de Minas, Metalúrgica e Materiais -
PPGE3M, 2019.
1. Geometalurgia. 2. Aprendizado de máquinas. I. Orientador. II. Universidade
Federal do Rio Grande do Sul. III. Faculdade de Engenharia de Minas. IV. Título
CDU 02:141:005.7
Este trabalho é dedicado aos meus pais, Marcos José Santos Drumond e Maria Inêz
Alvarenga Drumond, que sempre me apoiaram ao longo de minha vida.
Agradecimentos
Agradeço este trabalho ao meu orientador João Felipe Coimbra Leite Costa, uma pessoa
admirável e um profissional dedicado.
Agradeço ao coorientador Áttila Leães Rodrigues, pelo auxílio e dedicação ao decorrer da
tese.
Agradeço a geóloga Mariana Gazire Lemos, pelo auxílio prestado no desenvolvimento
desta tese, juntamente com a Anglo Gold .
R
Agradeço aos amigos e colegas do laboratório, pelo companheirismo e ajuda nos

momentos difíceis.
Agradeço as instituições de fomento da pesquisa brasileira CAPES e CNPQ, pelo apoio
financeiro durante a construção desta tese.
Agradeço a todos que também auxiliaram anonimamente neste trabalho. Toda a
construção da minha pesquisa somente foi possível devido o apoio e respaldo de muitos.
“Não vos amoldeis às estruturas deste mundo,
mas transformai-vos pela renovação da mente,
a fim de distinguir qual é a vontade de Deus:
o que é bom, o que Lhe é agradável, o que é perfeito.
(Bíblia Sagrada, Romanos 12, 2)
Resumo
A geometalurgia é o ramo da engenharia de minas, que pretende obter a partir de variáveis
georeferenciadas, respostas para o beneficiamento mineral. Em muitos casos, é necessário
neste processo, obter funções de transferências, que associam cada variável primária
com a variáveis resposta metalúrgica, e assim serem realizadas predições que auxiliam a
engenharia, otimizando custos e receitas, e incentivando soluções para os problemas das
empresas.
A determinação destas funções de transferência é uma tarefa difícil de ser realizada,
principalmente em depósitos com alta variabilidade geológica, tais como os depósitos
de ouro, de origem hidrotermal. Esta tarefa pode ser agilizada, se realizado modelos
computacionais de alta performance, que aprendam com os dados obtidos a melhor
classificação/regressão, e se atualizem de acordo com o crescimento do banco de dados.
Estas técnicas são denominadas no atual estado da arte como aprendizado de máquinas.
(Machine Learning).
O objetivo principal deste trabalho é criar modelos de aprendizado de padrões, que
relacionem uma função de transferência unindo variáveis do depósito mineral, como
mineralogia e teor, com variáveis de resposta de equipamentos de beneficiamento (ore
sorting, flotação), como a recuperação metalúrgica. Os dados apresentados pertencem a
depósitos minerais auríferos do quadrilátero ferrífero.
Como contribuição à comunidade, e ao meio científico, esta tese propõe avanços em tecno-
logias de automatização, que correlacionam parâmetros entre a geologia e o beneficiamento
mineral, permitindo um conhecimento mais profundo das variáveis relacionadas com a
produção mineral. De tal forma estes modelos produzem informações suficientes para a
tomada de decisão e planejamentos, que podem ser realizados posteriormente ao desenvol-
vimento desta tese, como a redução de consumo de água nas usinas (um problema atual
para barragens de rejeito no Brasil), redução e economia de reagentes, atualização mais
apurada das reservas minerais, entre outras otimizações que possam vir a se usufruir destes
resultados.
Resultados foram obtidos na criação de modelos geometalúrgicos que se aplicam tanto
em domínios reduzidos como em um equipamento ore sorting ,como em macro domínios
na predição de valores da usina, a partir de informações da geologia. Espera-se que este
trabalho seja uma ponte inicial para o desenvolvimento de técnicas mais modernas de
estatística e computação para a aplicação na mineração.
Palavras-chaves: Ore Sorting, Beneficiamento Mineral, Geometalurgia, Aprendizado de
máquinas, Funções de transferência.
Abstract
The geometallurgy is a mining engineering branch that aims to estimate geometalurgical
response variables from primary geological variables. In several problems it is necessary to
obtain transfer functions that combines each primary variable value into reponse variable
values, thereafter predicting mining process scheduling, optimizing costs and revenue, and
proposing technological solutions for the problems faced by mining corporations.
The determination of these transfer functions is sometimes a difficult task, mainly in
hidrotermal gold ore deposits allied with high variability. This task could be streamlined
creating high performance computational models, that learns with data obtained the best
classification/regression and updating according the data bank growing. These techniques
are called machine learning methods in the current state of the art.
The main thesis objective is create a machine learning model that connects a transfer func-
tion from mineral deposit variables, such as mineralogy, grades, for processing equipments
(ore sorting) or response variables(Recovery, reagent consumptions, grindability, etc.).
As a contribution to community and scientific community, this thesis proposes technological
advances that correlates geological parameters with ore processing, allowing to obtain a
deep knowledge about the mining production variables. These models will produce the
necessary information to take decisions in mining planning, such as the milling plant water
consumption (A recent problem in tailing dams in Brasil), reduction and saving reagents,
best updating of mineral inventory, and other optimization process that will use these
results.
Results are obtained for creating geometalurgical models applied in small size domains as
in ore sorting equipment, such as in big size domains for predicting mill variables using
geological information. We hope that this work might be an initial development of modern
statistical and computational techiniques applied in mining.
Key-words: Ore Sorting, mineral processing, Geometalurgy, Machine Learning, Transfer
Functions.
Lista de ilustrações
Figura 1 – Geometalurgia como uma união das áreas da mineração: pesquisa mi-
neral, lavra e beneficiamento mineral. A pesquisa mineral compreende
a primeira etapa de descobrimento e avaliação do depósito mineral, a
lavra consiste na etapa de explotação do minério e o beneficiamento o
conjunto de técnicas industriais para transformar o o minério em um
concentrado ou produto final. A seta representa a união destas três
grandes áreas que possuem direção de produção contínua. . . . . . . . 39
Figura 2 – Diferentes assuntos da geometalurgia relatados em um diagrama de

triângulo. No centro é representada a geometalurgia como uma união
entre diversas subáreas como a geoestatística, o beneficiamento mineral
e o aprendizado de máquinas. . . . . . . . . . . . . . . . . . . . . . . . 47
Figura 3 – Relação entre variáveis primárias e resposta metalúrgica. Variáveis pri-

márias representadas como parte integrante do depósito mineral, tais
como massa, cor e tamanho dos grãos minerais. Variáveis resposta
representadas como medidas do beneficiamento mineral, tal como recu-
peração metalúrgica, moabilidade e consumo de reagentes. Ao centro
dispõe as variáveis mistas, que compõe tanto propriedades da própria
geologia, como também como variáveis resposta. . . . . . . . . . . . . 49
Figura 4 – (A) mineral minério (B) ganga. Representação de uma separação perfeita
entre dois componentes binários (caso ideal), onde as partículas pretas
(mineral minério) estão completamente divididas das partículas brancas
(ganga). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Figura 5 – (a) Partícula de mineral minério liberada (branco) (b) Partícula in-
tercrescida (contém mineral minério(branco) e ganga(pontos negros))
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Figura 6 – Exemplo de fluxograma da planta de Capivari, pertencente a antiga

CSN (Companhia Siderúrgica Nacional). . . . . . . . . . . . . . . . . . 56
Figura 7 – Exemplo de overfitting, underfitting e um modelo adequadamente ajus-

tado, para casos de aprendizado supervisionado. Em (A), são apresen-
tados os modelos de regressão, em que as curvas pretas representam o
modelo e as bolas azuis as variáveis numéricas. Em (B), é representado
o modelo de classificação em que as bolas azuis e vermelhas representam
diferentes classes e a curva negra representa a superfície de separação. 58
Figura 8 – Exemplo de validação cruzada. Caixas cinzas correspondem ao grupo
de teste, enquanto as brancas correspondem ao grupo de treino. No
eixo x são representados os diferentes grupos, enquanto no eixo y são
representadas as divisões. . . . . . . . . . . . . . . . . . . . . . . . . . 59
Figura 9 – Validação cruzada em k grupos representado em (a). Em (b) a validação
cruzada estratificada . Caixas cinza representam os valores de teste,
enquanto as caixas brancas de treino. No eixo x assume-se o valor de
uma variável, enquanto em y assume-se os diferentes grupos. Os valores
estão ordenados crescentemente. . . . . . . . . . . . . . . . . . . . . . 60
Figura 10 – Seleção do melhor parâmetro (gamma) para máquinas de vetores de
suporte. No eixo x os valores do coefficiente gamma, e no eixo y a acu-
rácia.Valor escolhido é aquele que apresenta melhor acurácia, circulado
de vermelho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Figura 11 – Matriz de confusão para duas classes. No gráfico TP representa (true
positives ou positivo verdadeiros), TN(true negatives, ou falso negativos),
FP (false postives ou falsos positivos), FN(false negatives ou falsos
negativos). TN e TP representam valores corretamente classificados
enquanto FP e FN representam valores incorretamente classificados. . . 61
Figura 12 – Curva ROC (receiver operating characteristcs curve). Valores do eixo x
representados pela razão de falsos positivos (FPR). Valores do eixo y
representados pela razão de positivos verdadeiros (TPR) ou revocação. 63
Figura 13 – Exemplo da curva de aprendizado para a média da validação cruzada
em diferentes proporções dos dados. Curva azul representada pela média
dos scores da cross validação para o banco de teste. Curva amarela
representada pela média dos scores para a cross validação no banco de
dados de treino. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Figura 14 – Exemplo de rotação proposta pela técncia do PCA. Em (a), observamos
os dados originais plotados para duas variáveis X1 e X2. Em (b), é
realizada a análise de componentes principais para estes dados (PCA),
formando dois fatores F1 e F2. Os fatores formados pela rotação do
PCA em (b) conservam o máximo de variância com os dados originais,
em que o fator F1 recebe o máximo de variância. . . . . . . . . . . . . 67
Figura 15 – Exemplo de aplicação da técnica de análise de componentes principais
na identificação de grupos geometalúrgicos. A esquerda é disposto o
PCA para diferentes tipos de variáveis, demonstrando o primeiro e o
segundo fator. Neste gráfico, são utilizadas técnicas para determinar
agrupamentos para diferentes classes, cada qual com uma cor diferente.
À direita são representados gráficos de caixa com cada uma das variáveis
e as suas proporções em cada classe. . . . . . . . . . . . . . . . . . . . 68
Figura 16 – Exemplo de aplicação da técnica de t-SNE em um banco de dados fictício.
Os dados multivariados são demonstrados em apenas duas dimensões,
honrando a menor diferença entre as variáveis para um kernel gaussiano.
Grupos diferentes podem ser observados com várias cores diferentes. . 71
Figura 17 – Procedimento gráfico para transformação da função de distribuição dos

0
dados originais x em valores de uma distribuição normal X . F e G
representam, respectivamente, as distribuições acumuladas da variável
0
original X e da variável transformada X . . . . . . . . . . . . . . . . . . 73
Figura 18 – Exemplificação da codificação de variáveis categóricas a partir da técnica

de categorização baseada em objetivo. . . . . . . . . . . . . . . . . . . 74
Figura 19 – Exemplo da determinação da superfície linear discriminante. Em (a),

temos uma projeção qualquer. Em (b), temos uma projeção utilizando
a função discriminante linear. Note que em (b), temos a menor sobre-
posição entre as distribuições da classe azul e vermelha, representando
uma melhor classificação. . . . . . . . . . . . . . . . . . . . . . . . . . 78
Figura 20 – Exemplo da regressão logística. Curva negra representada pela função

logit. A linha verde indica 50% de probabilidade para separação das
classes 1 ou 0. Triângulos azuis representam a classe 0, e círculos laranjas
representam a classe 1. Eixo horizontal representa os valores das variáveis
e eixo vertical representa as probabilidades. . . . . . . . . . . . . . . . 79
Figura 21 – Minimização entre duas classes x1 e x2 pelo método do máquinas de

vetores suportados. d é a distância entre o ponto mais próximo da
classe x1 e da classe x2 e H1 e H2 os hiperplanos que dividem as classes
contidas em x1 e x2 . A reta wx + b = 0 representa o hiperplano com
menor margem possível. . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Figura 22 – Utilização de kernels para a transformação do espaço original dos dados.

O modelo de classificação linear pode ser aplicado no espaço modificado
procurando a mínima distância entre a margem das duas classes. À
esquerda está representado o espaço de entrada das variáveis. À direita
é representado o espaço transformado a partir de um kernel. . . . . . . 80
Figura 23 – Exemplo de redes neurais. Valores de input dos dados à esquerda e

valores de output à direita. Unidades escondidas demonstradas como as
variáveis z não diretamente ligadas às variáveis originais. . . . . . . . . 81
Figura 24 – Exemplo da utilização de vizinhos mais próximos para a classificação

de pontos simbolizados por estrelas, com dados de treinamento sim-
bolizados como círculos e triângulos. Os valores estimados nos pontos
correspondem aos dados originais mais próximos. . . . . . . . . . . . . 82
Figura 25 – Exemplo da utilização de k vizinhos mais próximos para a classificação
de pontos simbolizados por estrelas com dados de treinamento simbo-
lizados como círculos e triângulos. Os valores estimados nos pontos
correspondem a maior proporção dos k valores mais próximos. . . . . . 82
Figura 26 – Demonstração da influência do número de vizinhos mais próximos na

superfície de decisão entre duas classes azul e vermelha. (a) Utilização
de apenas um vizinho mais próximo, (b) Utilização de três vizinhos
mais próximos, (c) Utilização de nove vizinhos mais próximos. . . . . . 83
Figura 27 – Exemplo da aplicação do florestas aleatórias. (a) À esquerda podemos

ver a superfície de decisão para a primeira árvore de decisão dividindo o
espaço em duas regiões. À direita podemos observar uma representação
gráfica da árvore, considerando a divisão entre variáveis. (b) À esquerda
podemos notar o segundo nível da árvore. À direita é representado o
novo nível adicionado na árvore. . . . . . . . . . . . . . . . . . . . . . . 83
Figura 28 – Gráfico representando distâncias entre cidades da Inglaterra. Cada nó,

no gráfico, representa uma cidade, enquanto as distâncias entre nós são
mantidas independente da rotação produzida. . . . . . . . . . . . . . . 84
Figura 29 – Diferentes tipos de métricas para medida de similaridade e dissimilari-

dade entre as variáveis no gráfico MDS, xr e xs são duas observações
distintas aos quais se deseja medir a distância. Σ é a matriz de correlação
entre as variáveis, p é o número total de pares de amostras e x̄ é o valor
médio da amostra selecionada. . . . . . . . . . . . . . . . . . . . . . . . 85
Figura 30 – Utilização do agrupamento hierárquico para definição de grupos. Em

(a) é possível notar três grupos diferentes de acordo com as variáveis
X1 e X2 . Em (b) notamos o dendograma em que a linha pontilhada
representa a divisão entre estes grupos. . . . . . . . . . . . . . . . . . . 86
Figura 31 – Fluxograma utilizado por Shu et al. (2018) para determinar classificação
do tamanho de partículas minerais. . . . . . . . . . . . . . . . . . . . 87
Figura 32 – Classificação de partículas minerais automática obtida por Maitre et

al. (2019). Em (A) observa-se a segmentação dos grãos e em (B) a
classificação das diferentes partículas minerais. . . . . . . . . . . . . . 88
Figura 33 – Anomalias geoquímicas encontradas por 39 elementos utilizando apren-

dizado automático. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Figura 34 – Imagens de raio x. (a) radiografia de um peitoral humano. Os ossos
como são mais densos que o material a sua volta, como músculos e
gordura, estes obstruem a passagem dos raios x. (b) partícula mineral
atravessada pelo raio x, diferenças composicionais produzem transmitivi-
dade diferente ao longo da partícula mineral. Pixels escuros representam
valores de baixa densidade, enquanto pixels claros representam alta
densidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Figura 35 – Transmissão em partículas de acordo com a sua espessura. I0 representa

a intensidade da radiação emitida, enquanto I1 representa a intensidade
da radiação transpassada. Setas maiores indicam maior intensidade ,
enquanto setas menores representam menor intensidade. (A) partícula
grossa (B) partícula fina. . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Figura 36 – Transmissão em partículas de acordo com a sua densidade. I0 representa

a intensidade de radiação emitida, enquanto I1 representa a intensidade
de radiação transpassada. O tamanho das setas demonstra a intensi-
dade de radiação. Os pontos circulados representam regiões de menor
densidade na partícula. (A) partícula homogênea (B) partícula mista . 90
Figura 37 – Figura demonstrativa da equação de lambert.Idet representa os raios

detectados pelo equipamento, I0 representa os raios emitidos, µ(λ)
representa o coeficiente de absorção de massa, dependente da frequência
da onda emitida e d a espessura da partícula de minério. Os raios
emitidos pela fonte de raio x são atenuados pela partícula mineral e
detectados em seguida pelo sensor. . . . . . . . . . . . . . . . . . . . . 92
Figura 38 – Em (a) e em (b): Imagens de raio x geradas para alta e baixa frequência.
Cada pixel em cinza representa a transmissão de dois canais para o raio
x. Em (c) cada pixel cinza representa os pixels das imagens de (a) e (b).
Esses pontos estão dispersos envolta de uma curva de calibração contínua
negra, para o mineral de interesse. A decisão se o pixel apresenta valores
de alta e baixa densidade é determinado a partir da comparação com a
curva de calibração. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Figura 39 – Representação da simulação na transmissão de dois canais. Eixo x

considerando os valores da imagem de raio x baixa intensidade e y
considerando os valores da imagem de raio x de alta densidade. Cinco
regiões definidas de acordo com a posição relativa da curva de densidade:
regiões de alta densidade, média densidade, baixa densidade, região
escura e fundo da partícula mineral. . . . . . . . . . . . . . . . . . . . 94
Figura 40 – Representação da curva de densidade de 60% de acordo com a proporção
de pares conjugados abaixo da curva de densidade. (a) Representação
de diferentes imagens tomadas de várias partículas minerais, para os
canais de alta e baixa intensidade. (b) representação de uma curva de
densidade de 60%. Triângulos representando pares conjugados abaixo
da cruva. Quadrados representando valores acima da curva de calibração. 95
Figura 41 – Imagem dos grãos a partir de simulações do raio x. Em (a) observamos

a imagem do raio x de uma partícula mineral. Em (b) a sua respectiva
imagem gerada a partir de simulações de dois canais da partícula mineral.
As regiões definidas como vermelhoh representam baixa densidade, azuis
claros a densidade média e azul escuro representando alta densidade.
Em (c) observamos a simulação de um canal, apresentando contrastes
escuros e claros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Figura 42 – Mapa de localização das minas da Anglo Gold Ashanti, MG, Brasil. Em
(1) e (2), é representado o complexo de Cuiabá e Lamego, aos quais são
tratados os problemas de estimativa de variáveis geometalúrgicas. Em
(4) e (5), é representado Córrego do Sítio, onde é abordado o problema
do ore sorting. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Figura 43 – Mapa regional da região sul do Cráton São Francisco. . . . . . . . . . . 100
Figura 44 – Mapa simplificado da geologia-estrutura da região do Quadrilátero

Ferrífero demonstrando a localização do depósito de Lamego e CDS. . . 101
Figura 45 – Estratigrafia esquemática do depósito de Lamego baseado em mapea-

mento geológico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
Figura 46 – Imagem em perfil do equipamento ore sorting. . . . . . . . . . . . . . . 105
Figura 47 – Imagem do grão a partir de simulações do raio x. Em (a) observamos a

imagem do raio x de uma partícula mineral. Em (b) a sua respectiva
claros a densidade média e azul escuro representando alta densidade.
Em (c) observamos a simulação de um canal, apresentando contrastes
escuros e claros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
Figura 48 – Planta de ore sorting em Santa Bárbara. . . . . . . . . . . . . . . . . . 107

Figura 49 – Componentes do equipamento ore sorting. Em (a), é demonstrada a
alimentação das partículas minerais, ao qual uma grelha é responsável
pela separação de finos na entrada do equipamento. Em (b), é apresen-
tada uma esteira vibratória, responsável por criar uma camada única
de partículas no leito da esteira. Em (c), é demonstrada a fonte de raio
x, e o sensor. Em (d), é demonstrada a câmara de classificação, onde
as pistolas de ar impulsionam a partícula para um fluxo de minério ou
estéril. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Figura 50 – Equipamento de classificação com laser. (1) e (2) são os lasers utilizados
para atingir as partículas minerais. Em (4) é realizada a alimentação
da máquina e (3) o sopro para a concentração do material. . . . . . . 108
Figura 51 – Amostragem dos grãos pelo teste de hand sorting. Diferentes classifi-
cações são apresentadas de acordo com as variações mineralógicas das
partículas. (A) xisto grafitoso, (B) clorita, (C) minério sulfetado e (D)
quartzo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Figura 52 – As amostras analisadas quanto a mineralogia são encapsuladas nesta

manta, com identificação própria. Cada partícula é identificada e sub-
metida à análise pelo ore sorting. Após a análise física das partículas,
os grão são pesados, e enviados para análise física. . . . . . . . . . . . 109
Figura 53 – Fluxograma do laboratório de processamento da Anglo Gold Ashanti .

R 110
Figura 54 – Circuito de cominuição e adequação granulométrica. (A) britagem, (B)

peneiramento e (C) moagem. . . . . . . . . . . . . . . . . . . . . . . . 111
Figura 55 – Circuito de concentração. (A) concentração Falcon, (B) mesa vibratória

e (C) célula de flotação. . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Figura 56 – Circuito de lixiviação e calcinação. (A) lixiviação em garrafa. (B) mufla. 111
Figura 57 – Projeto de geometalurgia. Primeira etapa realizada pela Anglo Gold

Ashanti R
(amostragem, hand sorting e simulação). Segunda etapa
representada pela aplicação de algoritmos de aprendizado de máquinas.
A seta negra representa o encaminhamento do projeto. . . . . . . . . . 113
Figura 58 – Fluxograma do projeto. Em (a), são realizadas amostragens. Em (b), é

representada a análise de cada partícula. Em (c), as imagens de raio x,
de alta e baixa intensidade, para as partículas amostradas. Em (d) são
simulados os indicadores para os píxeis de alta, baixa e média densidade.
Em (e), é representado o banco de dados, contendo para cada partícula
amostrada, diferentes curvas de densidades, e proporções de pixels de
alta e baixa densidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Figura 59 – Fluxograma do projeto do ore sorting para obtenção da classe de
interesse. Em (a), são realizadas amostragens de partículas em diferentes
domínios geológicos. Em (b), é representada a análise realizada partícula
por partícula. Em (c), são obtidas medidas de mineralogia e química
para cada partícula. Em (d), um algoritmo define se cada partícula
mineral deve ser considerada minério ou estéril quanto os quesitos
econômicos e tecnológicos. Em (e), este valor entra dentro do banco de
dados como uma medida da classe de interesse. . . . . . . . . . . . . . 115
Figura 60 – Representação das variáveis utilizadas no desenvolvimento desta tese.

A esquerda temos as variáveis de entrada, representadas pelas variáveis
de posição, seja sua localização em um domínio geológico, seja na rota
de processo, além das variáveis de raio x. A direita temos as classes
utilizadas como resposta ao modelo matemático. . . . . . . . . . . . . . 115
Figura 61 – Matriz de confusão como a representação de partículas positivas (mi-

nério) e partículas negativas (ganga), classificadas em concentrado e
rejeito. Os valores positivos verdadeiros representam o minério devida-
mente alocado para o concentrado, enquanto os negativos verdadeiros
representam os valores de estéril devidamente alocadas para o rejeito. 116
Figura 62 – Representação da precisão do modelo. Linhas fechadas representando

subconjuntos considerados. Círculos azuis representam o minério en-
quanto os vermelhos representam a ganga. A precisão pode ser vista
como o teor de partículas minerais no concentrado.Precisão de 2/5. . . 117
Figura 63 – Representação da revocação do modelo. Linhas fechadas representando

subconjuntos considerados. Círculos azuis representam o minério, en-
quanto os círculos vermelhos representam a ganga. A revocação pode
ser comparada à recuperação de minério no concentrado. Revocação de
2/5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
Figura 64 – Representação da especificidade do modelo. Linhas fechadas represen-

tando subconjuntos considerados. Bolas azuis representam o minério
enquanto as vermelhas representam a ganga. A especificidade pode ser
representada como a recuperação do estéril no rejeito. Especificidade
de 1/4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
Figura 65 – Representação da acurácia do modelo. Linhas fechadas representando

subconjuntos considerados.Círculos azuis representam o minério en-
quanto os círculos vermelhos representam a ganga. A acurácia tende
a representar o percentual de partículas corretamente selecionadas.
Acurácia de 3/9. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
Figura 66 – Curva ROC e interpretação probabilística. Eixos demonstram proba-
bilidade condicional. A medida que se aumenta a probabilidade de
classificação do modelo, altera-se a probabilidade de divisão das classes
minério e estéril. A reta negra representa o modelo de pior classificação
e retas azul e vermelha diferentes modelos. . . . . . . . . . . . . . . . 119
Figura 67 – Proposição das classes em um diagrama de Venn. À esquerda o grupo
de partículas minerais de interesse. À direita é representado os minerais
com teores de ouro acima do teor de corte. A classe minério inclui a
mineralogia de interesse, e o conteúdo metálico. A classe estéril não
apresenta qualidade desejada. . . . . . . . . . . . . . . . . . . . . . . . 121
Figura 68 – Gráfico de barras para a variável mista criada. Partículas consideradas
minério como aquelas em que o teor está acima do teor de corte ou a
mineralogia contém sulfetos, quartzo e arsenopirita fina. . . . . . . . . 122
Figura 69 – Histograma da frequência absoluta da proporção de pixels com alta,
média e baixa densidade e densidade escura, para as curvas de calibração
DM 60, DM 70, DM 80 e DM 90. São apresentados também os valores
de ’Source’, respectivos à localização das partículas no processo e a
variável ’Ore Body’, representado o domínio geológico que a contém. . 123
Figura 70 – Matriz de correlação entre as variáveis do raio x. Curvas de densidade
representadas por valores de 60%, 70%, 80% e 90%, para altas, médias
e baixa densidades. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
Figura 71 – Importância das variáveis utilizando a média de valores obtidos para
diferentes tipos de algoritmos (correlação de Pearson com a variável
preditora, a importância segundo o critério de Gini para o algoritmo
de florestas aleatórias e para o algoritmo classificador de aumento
do gradiente). Variáveis da curva de densidade 90 apresentam grande
importância na classificação, se comparados com valores da curva de
60% e 70% . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Figura 72 – (a) Apresentação do primeiro e segundo fator da análise de componentes
principais (b) projeção dos dados nas variáveis Low 80 e High 80. . . . 126
Figura 73 – Projeção nas variáveis Low 80 e High 80. Grupo 1 representado por
minerais em sua maioria sulfetados. Grupo 2 representado em grande
maioria por quartzo e grupo 3 representado pela grande expressão de
mineralogias presentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
Figura 74 – Métricas de classificação para os dados de teste utilizando validação
cruzada de 10 grupos. Diferentes modelos (KNC, LOGISTIC, LDA,
SVM, RF, NEURAL, KNC, DT e NB) . . . . . . . . . . . . . . . . . . 129
Figura 75 – Validação LDA a) Curva de aprendizado b) Matriz de confusão. . . . . 130
Figura 76 – Validação LOGISTIC a) Curva de aprendizado b) Matriz de confusão. 130
Figura 77 – Validação KNC a) Curva de aprendizado b) Matriz de confusão. . . . . 130
Figura 78 – Validação SVM a) Curva de aprendizado b) Matriz de confusão. . . . . 131
Figura 79 – Validação NEURAL a) Curva de aprendizado b) Matriz de confusão. . 131
Figura 80 – Validação RF a) Curva de aprendizado b) Matriz de confusão. . . . . . 131
Figura 81 – Validação DT a) Curva de aprendizado b) Matriz de confusão. . . . . . 132
Figura 82 – Validação NB a) Curva de aprendizado b) Matriz de confusão. . . . . . 132
Figura 83 – Ajuste da curva ROC (receiver operating characteristic) para os modelos
ajustados. (NB = Naïve bayes, RF = Florestas Aleatórias, DT= Árvore
de decisão, KNC= K vizinhos mais próximos, NEURAL = Redes neurais,
SVM = Máquinas de vetores suportados, LDA = Análise Discriminante
Linear, LOGISTIC = Regressão Logística ) . . . . . . . . . . . . . . . 133
Figura 84 – Gráfico de barras representando a quantidade de amostras relativa a
cada domínio geológico de CDS (Córrego do Sítio). . . . . . . . . . . . 135
Figura 85 – Gráfico de caixas relativo às variáveis discrepantes no banco de dados.
Peso, teor de ouro e teor de enxofre. . . . . . . . . . . . . . . . . . . . 136
Figura 86 – t-SNE (t-distributed stochastic neighbor embedding). Representação de
cores dos domínios geológicos presentes. . . . . . . . . . . . . . . . . . 136
Figura 87 – Importância relativa das variáveis utilizando o algoritmo florestas alea-
tórias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
Figura 88 – Importância relativa das variáveis utilizando o algoritmo de classificação
de aumento do gradiente. . . . . . . . . . . . . . . . . . . . . . . . . . 137
Figura 89 – Matriz de confusão para o algoritmo de regressão logística. . . . . . . . 139
Figura 90 – Matriz de confusão para o algoritmo de análise discriminante linear. . . 139
Figura 91 – Matriz de confusão para o algoritmo de máquinas de vetores suportados. 140
Figura 92 – Matriz de confusão para o algoritmo de florestas aleatórias. . . . . . . 140
Figura 93 – Matriz de confusão para o algoritmo redes neurais utilizando multi-layer
perceptron. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
Figura 94 – Matriz de confusão para o algoritmo de k vizinhos mais próximos. . . 141
Figura 95 – Matriz de confusão para o algoritmo de árvores de decisão. . . . . . . 141
Figura 96 – Matriz de confusão para o algoritmo Bernoulli Naïve Bayes. . . . . . . 141
Figura 97 – Resumo das estatísticas de classificação para o algoritmo de regressão
logística. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
Figura 98 – Resumo das estatísticas de classificação para o algoritmo de análise
discriminante linear. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
Figura 99 – Resumo das estatísticas de classificação para o algoritmo de máquinas
de vetores suportados. . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Figura 100 – Resumo das estatísticas de classificação para o algoritmo de florestas
aleatórias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Figura 101 – Resumo para as estatísticas de classificação para o algoritmo redes
neurais utilizando multi-layer perceptron. . . . . . . . . . . . . . . . . 144
Figura 102 – Resumo para as estatísticas de classificação para o algoritmo de k
vizinhos mais próximos . . . . . . . . . . . . . . . . . . . . . . . . . . 144
Figura 103 – Resumo para as estatísticas de classificação para o algoritmo de árvores
de decisão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
Figura 104 – Resumo das estatísticas de classificação para o algoritmo Bernoulli
Naive Bayes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
Figura 105 – Curva de aprendizado para o algoritmo de regressão logística. Curva
azul representando o treinamento, enquanto curva verde representa o
teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Figura 106 – Curva de aprendizado para o algoritmo de análise discriminante li-
near. Curva azul representando o treinamento, enquanto curva verde
representa o teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Figura 107 – Curva de aprendizado para o algoritmo de máquinas de vetores supor-
tados.Curva azul representando o treinamento, enquanto curva verde
representa o teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
Figura 108 – Curva de aprendizado para o algoritmo de florestas aleatórias. Curva
teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
Figura 109 – Curva de aprendizado para o algoritmo redes neurais utilizando multi-
layer perceptron. Curva azul representando o treinamento, enquanto
curva verde representa o teste. . . . . . . . . . . . . . . . . . . . . . . 148
Figura 110 – Curva de aprendizado para o algoritmo de k vizinhos mais próximos.
Curva azul representando o treinamento, enquanto curva verde repre-
senta o teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
Figura 111 – Curva de aprendizado para o algoritmo de árvores de decisão. Curva
teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Figura 112 – Curva de aprendizado para o algoritmo Bernoulli Naive Bayes. Curva
teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Figura 113 – Predição das classes para o algoritmo de regressão logística. . . . . . . 150
Figura 114 – Predição das classes para o algoritmo de análise discriminante linear. . 150
Figura 115 – Predição das classes para o algoritmo de máquinas de vetores suportados. 151
Figura 116 – Predição das classes para o algoritmo de florestas aleatórias. . . . . . . 151
Figura 117 – Predição das classes para o algoritmo redes neurais utilizando multi-layer
perceptron. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
Figura 118 – Predição das classes para o algoritmo de k vizinhos mais próximos. . . 152
Figura 119 – Predição das classes para o algoritmo de árvores de decisão. . . . . . . 153
Figura 120 – Predição das classes para o algoritmo Bernoulli Naive Bayes. . . . . . 153
Figura 121 – Histogramas das variáveis de entrada do modelo geometalúrgico. Pro-
porção das litologias (BIF, BIF sulfetado, Quartzo, Sulfetos, Xisto
Carbonoso e Xisto Sulfetado), além dos teores de ouro e enxofre, e a
quantidade de massa alimentada na usina. . . . . . . . . . . . . . . . . 156
Figura 122 – Matriz de correlação entre as variáveis de entrada do modelo. Proporção
das litologias (BIF, BIF sulfetado, Quartzo, Sulfetos, Xisto Carbonoso
e Xisto Sulfetado), além dos teores de ouro e enxofre, e a quantidade
de massa alimentada na usina. . . . . . . . . . . . . . . . . . . . . . . 157
Figura 123 – Valores de produção diária para a recuperação metalúrgica de ouro da
flotação. Valores de 01/2017 até 04/2019. . . . . . . . . . . . . . . . . 158
Figura 124 – Valores de produção para 3 dias para a recuperação metalúrgica de ouro
da flotação.Valores de 01/2017 até 04/2019. . . . . . . . . . . . . . . . 159
Figura 125 – Valores de produção para 5 dias para a recuperação metalúrgica de ouro
da flotação. Valores de 01/2017 até 04/2019. . . . . . . . . . . . . . . 159
Figura 126 – Valores de produção para 15 dias para a recuperação metalúrgica de
ouro da flotação. Valores de 01/2017 até 04/2019. . . . . . . . . . . . 159
Figura 129 – Valores de produção diária para a recuperação metalúrgica de enxofre
da flotação . Valores de 01/2017 até 04/2019. . . . . . . . . . . . . . . 161
enxofre da flotação. Valores de 01/2017 até 04/2019. . . . . . . . . . . 162
Figura 135 – PCA para a produção de 1 dia em função da recuperação metalúrgica
de ouro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
Figura 136 – PCA para a produção de 3 dias em função da recuperação metalúrgica
de ouro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
de ouro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

de ouro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

de ouro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
Figura 140 – PCA para a produção de 30 das em função da recuperação metalúrgica

de ouro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Figura 141 – Gráfico de resíduos para a regressão da recuperação metalúrgica de

ouro do algoritmo florestas aleatórias - janela de 1 dia. Pontos verdes
representando os dados de teste e pontos azuis correspondendo ao dados
de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

ouro do algoritmo florestas aleatórias - janela de 3 dias. Pontos verdes
de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
Figura 147 – Gráfico dos valores reais x preditos no banco de dados de teste. (y)
representa os dados originais e (ŷ) representa os valores estimados.
Regressão da recuperação metalúrgica de ouro do algoritmo de florestas
aleatórias - janela de 1 dia. . . . . . . . . . . . . . . . . . . . . . . . . 170
Regressão da recuperação metalúrgica de ouro do algoritmo de florestas
aleatórias - janela de 3 dias. . . . . . . . . . . . . . . . . . . . . . . . . 171
Recuperação metalúrgica de ouro do algoritmo de florestas aleatórias -
janela de 5 dias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
janela de 15 dias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
janela de 20 dias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
janela de 30 dias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Figura 153 – Precisão da predição da recuperação de ouro (R2 ) em termos do tempo
da janela da média móvel para o algoritmo de florestas aleatórias. . . . 173
Figura 154 – Gráfico de resíduos para a regressão da recuperação metalúrgica de ouro
do algoritmo de máquinas de vetores de suporte - janela de 1 dia. Pontos
verdes representando os dados de teste e pontos azuis correspondendo
ao dados de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . 174
do algoritmo máquinas de vetores de suporte - janela de 3 dias. Pontos
ouro do algoritmo de máquinas de vetores de suporte - janela de 20
dias. Pontos verdes representando os dados de teste e pontos azuis
correspondendo ao dados de treinamento. . . . . . . . . . . . . . . . . 176
Recuperação metalúrgica de ouro do algoritmo máquinas de vetores de
suporte - janela de 1 dia. . . . . . . . . . . . . . . . . . . . . . . . . . . 177
suporte - janela de 3 dias. . . . . . . . . . . . . . . . . . . . . . . . . . 178
suporte - janela de 5 dias. . . . . . . . . . . . . . . . . . . . . . . . . . 178
suporte - janela de 15 dias. . . . . . . . . . . . . . . . . . . . . . . . . 179
Figura 166 – Precisão da predição da recuperação de ouro (R2 ) em termos do tempo
da janela da média móvel para o algoritmo de máquinas de vetores de
suporte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
enxofre do algoritmo florestas aleatórias - janela de 1 dia. Pontos verdes
de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
enxofre do algoritmo florestas aleatórias - janela de 3 dias. Pontos verdes
de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

enxofre do algoritmo florestas aleatórias - janela de 5 dias. Pontos verdes
de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

enxofre do algoritmo florestas aleatórias - janela de 15 dias. Pontos


Recuperação metalúrgica de enxofre do algoritmo de florestas aleatórias
- janela de 1 dia. y são os valores reais, enquanto ŷ representa os valores
estimados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
- janela de 3 dias. y são os valores reais, enquanto ŷ representa os valores
estimados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
- janela de 5 dias. y são os valores reais, enquanto ŷ representa os valores
estimados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
- janela de 15 dias. y são os valores reais, enquanto ŷ representa os
valores estimados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
Figura 179 – Precisão da predição da recuperação de enxofre (R2 ) em termos do

tempo da janela da média móvel para o algoritmo de florestas aleatórias 188

enxofre do algoritmo de máquinas de vetores de suporte - janela de
1 dia. Pontos verdes representando os dados de teste e pontos azuis

enxofre do algoritmo máquinas de vetores de suporte - janela de 3



enxofre do algoritmo de máquinas de vetores de suporte - janela de
20 dias. Pontos verdes representando os dados de teste e pontos azuis
Recuperação metalúrgica de enxofre do algoritmo máquinas de vetores
de suporte - janela de 1 dia. y são os valores reais, enquanto ŷ representa
os valores estimados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
de suporte - janela de 3 dias. y são os valores reais, enquanto ŷ representa
de suporte - janela de 5 dias. y são os valores reais, enquanto ŷ representa
de suporte - janela de 15 dias. y são os valores reais, enquanto ŷ
representa os valores estimados. . . . . . . . . . . . . . . . . . . . . . . 193
Figura 192 – Precisão da predição da recuperação de enxofre (R2 ) em termos do
tempo da janela da média móvel para o algoritmo de máquinas de
vetores de suporte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
Lista de tabelas
Tabela 1 – Percentual utilizado do banco de dados na análise estatística . . . . . . 120

Tabela 2 – Contribuição acumulada da variância para cada fator das componentes
principais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
Tabela 3 – Teste de Dickey-Fuller para as séries temporais da recuperação de ouro
na flotação da usina de beneficiamento. . . . . . . . . . . . . . . . . . 160
Tabela 4 – Teste de Dickey-Fuller para as séries temporais da recuperação de
enxofre na flotação da usina de beneficiamento. . . . . . . . . . . . . . 163
Tabela 5 – Tabela do coeficiente de determinação de acordo com a janela temporal
escolhida para o algoritmo de Florestas Aleatórias. . . . . . . . . . . . 174
escolhida para o algoritmo de Máquinas de Vetores de Suporte. . . . . 181
escolhida para o algoritmo de Florestas Aleatórias. . . . . . . . . . . . 188
escolhida para o algoritmo de Máquinas de Vetores de Suporte. . . . . 195
Lista de símbolos
At = transposta da matriz A
Σ = matriz de covariâncias, ou somatório
σ = variância
c = teor do concentrado
a = teor da alimentação
e = função exponencial, ou teor do rejeito
ln = função logarítimica
R = recuperação Metalúrgica
P (X = x) = probabilidade da Variável X assumir a realização x
ρ(h) = função correleograma
C(h) = função covariograma
γ(h) = função variograma
Cov = covariância
χ = distribuição qui-quadrado
Sumário
1 ESTADO DA ARTE . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.1.1 História do aprendizado de máquinas . . . . . . . . . . . . . . . . . . . . . 41
1.2 Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.3 Metas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.4 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.5 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.6 Contribuições da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.7 Organização da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2 REVISÃO BIBLIOGRÁFICA . . . . . . . . . . . . . . . . . . . . . . 47
2.1 Geometalurgia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.1.1 Classificação das variáveis geometalúrgicas . . . . . . . . . . . . . . . . . . 48
2.1.2 Características das variáveis geometalúrgicas . . . . . . . . . . . . . . . . . 49
2.1.3 Variáveis aleatórias regionalizadas e domínios geometalúrgicos . . . . . . . 50
2.1.4 Propriedades das variáveis geometalúrgicas . . . . . . . . . . . . . . . . . 52
2.1.4.1 Aditividade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.1.4.2 Linearidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.1.4.3 Independência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.2 Beneficiamento de ouro . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.2.1 Introdução ao beneficiamento . . . . . . . . . . . . . . . . . . . . . . . . 53
2.2.2 Recuperação Metalúrgica . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.3 Técnicas de aprendizado de máquinas . . . . . . . . . . . . . . . . . . 57
2.3.1 Seleção de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.3.1.1 Máxima Verossimilhança . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.3.1.2 Validação cruzada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.3.1.3 Matriz de confusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.3.1.4 Acurácia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.3.1.5 Precisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.3.1.6 Revocação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.3.1.7 f1-score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.3.1.8 Área sobre a curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.3.1.9 Erro médio absoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.3.1.10 Erro médio quadrático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.3.1.11 Coeficiente de determinação . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.3.1.12 Curva de aprendizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.3.2 Seleção de variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.3.3 Fatorização de variáveis e redução da dimensionalidade . . . . . . . . . . . 66
2.3.3.1 Análise de componentes principais . . . . . . . . . . . . . . . . . . . . . . . 66
2.3.3.2 Fatores de máxima correlação . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.3.3.3 t-Distributed Stochastic Neighbor Embendding (t-SNE) . . . . . . . . . . . . . 69
2.3.4 Pré-processamento dos dados . . . . . . . . . . . . . . . . . . . . . . . . 71
2.3.4.1 Normalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.3.4.2 Gaussianização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.3.4.3 Codificação de variáveis categóricas . . . . . . . . . . . . . . . . . . . . . . 73
2.3.5 Aprendizado supervisionado . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.3.5.1 Modelos de função de base lineares . . . . . . . . . . . . . . . . . . . . . . . 74
2.3.5.2 Regressão Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.3.5.3 Funções discriminantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.3.5.4 Regressão logística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.3.5.5 Máquinas de vetores de suporte . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3.5.6 Redes neurais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.3.5.7 k vizinhos mais próximos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.3.5.8 Florestas aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.3.6 Aprendizado não supervisionado . . . . . . . . . . . . . . . . . . . . . . . 84
2.3.6.1 Multi dimensional scaling - MDS . . . . . . . . . . . . . . . . . . . . . . . . 84
2.3.6.2 Agrupamento hierárquico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.3.7 Aplicações modernas do aprendizado de máquinas em beneficiamento mineral
e engenharia de minas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.4 Fundamentos do ore sorting e da transmissão de raios x . . . . . . . 89
2.4.1 Fundamentos da transmissividade por raio x . . . . . . . . . . . . . . . . . 91
2.4.2 Benefícios e restrições do uso do ore sorting . . . . . . . . . . . . . . . . . 96
3 APRESENTAÇÃO DO PROBLEMA . . . . . . . . . . . . . . . . . . 99
3.1 Apresentação geográfica do problema . . . . . . . . . . . . . . . . . . 99
3.2 Contexto geológico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.3 O depósito mineral de Lamego . . . . . . . . . . . . . . . . . . . . . . 103
3.4 O depósito mineral de Cuiabá . . . . . . . . . . . . . . . . . . . . . . 103
3.5 O depósito Córrego do Sítio . . . . . . . . . . . . . . . . . . . . . . . 103
3.6 Contexto da produção . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
3.7 Ore Sorting - Santa Bárbara . . . . . . . . . . . . . . . . . . . . . . . 105
3.8 Cuiabá e Lamego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.9 Considerações finais sobre o problema . . . . . . . . . . . . . . . . . . 112
4 ESTUDO DE CASO - ORE SORTING . . . . . . . . . . . . . . . . 113

4.1 Metodologia de obtenção do banco de dados . . . . . . . . . . . . . 113
4.2 Associação das métricas de classificação com o problema físico . . . 116
4.3 Apresentação dos resultados para calibração do ore sorting . . . . . 120
4.3.1 Validação do banco de dados . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.3.2 Pré-processamento das variáveis . . . . . . . . . . . . . . . . . . . . . . . 120
4.3.3 Determinação da classe preditiva . . . . . . . . . . . . . . . . . . . . . . . 121
4.3.4 Análise exploratória dos dados . . . . . . . . . . . . . . . . . . . . . . . . 122
4.3.5 Redução do número de variáveis . . . . . . . . . . . . . . . . . . . . . . . 125
4.3.6 Descrição técnica dos algoritmos de aprendizado de máquinas . . . . . . . 127
4.3.7 Avaliação dos modelos para calibração do ore sorting . . . . . . . . . . . . 127
4.3.8 Discussão dos resultados para a calibração do ore sorting . . . . . . . . . . 133
4.4 Determinação da origem geológica da partícula mineral a partir de
medidas físicas, químicas e mineralógicas . . . . . . . . . . . . . . . . 134
4.4.1 Pré-processamento dos dados . . . . . . . . . . . . . . . . . . . . . . . . 137
4.4.2 Avaliação dos modelos para origem geológica das partículas do ore sorting . 138
4.4.3 Discussão dos resultados para detecção do domínio geológico da amostra
segundo medidas físicas, químicas e mineralógicas . . . . . . . . . . . . . . 153
5 ESTUDO DE CASO - CUIABÁ E LAMEGO . . . . . . . . . . . . . 155

5.1 Descrição do problema de regressão para variáveis geometalúrgicas
de Cuiabá e Lamego . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
5.2 Valores de produção diários para a recuperação metalúrgica de ouro 158
5.3 Valores de produção diários para a recuperação metalúrgica de enxofre161
5.4 Evolução do padrão de acordo com o aumento do suporte . . . . . . 164
5.5 Descrição técnica dos algoritmos de aprendizado de máquinas . . . 166
5.6 Avaliação dos modelos para regressão da recuperação metalúrgica
de ouro utilizando dados geológicos . . . . . . . . . . . . . . . . . . . 166
5.7 Avaliação dos modelos para regressão da recuperação metalúrgica
de enxofre utilizando dados geológicos . . . . . . . . . . . . . . . . . 181
5.8 Discussão dos resultados da regressão de variáveis geometalúrgicas
para Cuiabá e Lamego . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
6 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . . . . 197

6.1 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
6.2 Recomendações de trabalhos futuros . . . . . . . . . . . . . . . . . . 198
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
1 Estado da arte
1.1 Introdução
A geometalurgia é um campo multidisciplinar, que estuda como correlacionar
propriedades metalúrgicas com variáveis regionalizadas do depósito mineral. O objetivo é
definir, a partir das características geológicas da jazida, quais influenciam no processo de
beneficiamento, aprimorando o planejamento estratégico da mina, definindo os limiares da
reserva mineral e avaliando riscos econômicos que afetam o investimento na mineração.
A geometalurgia permite unir grandes áreas da mineração: pesquisa mineral, lavra e
beneficiamento, de forma a otimizar a cadeia de produção. A figura 1 representa esta união
entre as fases do empreendimento mineiro.
Figura 1 – Geometalurgia como uma união das áreas da mineração: pesquisa mineral, lavra
e beneficiamento mineral. A pesquisa mineral compreende a primeira etapa de
descobrimento e avaliação do depósito mineral, a lavra consiste na etapa de
explotação do minério e o beneficiamento o conjunto de técnicas industriais
para transformar o o minério em um concentrado ou produto final. A seta
representa a união destas três grandes áreas que possuem direção de produção
contínua.
Fonte:Próprio Autor
O beneficiamento mineral, ou tratamento de minérios, denota o conjunto de técnicas

para obtenção de concentrados a partir das reservas minerais. Os primeiros estudos
datam do século passado (TAGGART, 1927). No entanto, a geometalurgia é uma ciência
recente,apresentando um maior volume de referências no início dos anos 2000 (ZHI-
JIAN, 2000; ASHLEY; CALLOW, 2000). O avanço contínuo desta ciência apresenta uma
CAPÍTULO 1. ESTADO DA ARTE
quantidade significativa de publicações na atualidade (LECHUTI-TLHALERWA et al.,

2019; LISHCHUK et al., 2019; MACFARLANE, 2019; ROSS, 2019)
A geometalurgia é utilizada em projetos de mineração, incluindo estudo de escopo,
pré-viabilidade e viabilidade, design, otimização de processo, expansão de cava para
diferentes classes de depósitos como ouro (LEICHLITER et al., 2011), urânio (BOWELL
et al., 2011) , cobre-molibdênio (GREGORY et al., 2013) , níquel e ferro (LAMBERG et
al., 2013).
Segundo Lund e Lamberg (2014), as altas demandas sociais e econômicas, para
futuras lavras, requerem a compreensão dos corpos geológicos mesmo nos estágios iniciais
da pesquisa mineral. A geometalurgia combina informações geológicas para criar um modelo
de gestão e planejamento da produção. A atividade deve ser construída, frente a necessidade
tecnológica, em depósitos minerais cada vez mais variáveis e pouco enriquecidos.
A natureza complexa dos depósitos minerais remanescentes, devido à variabilidade
intrínseca do corpo geológico, teores metálicos baixos, associações minerais prejudiciais no
beneficiamento (impurezas), entre outros fatores, criaram condições sine qua non para o
desenvolvimento das técnicas geometalúrgicas.
Os depósitos minerais, como uma consequência de eventos naturais, nos fazem crer
que padrões possam relacionar propriedades físicas, químicas e mineralógicas, às rotas
de beneficiamento. No entanto, a variabilidade geológica alta de alguns depósitos pode
dificultar a análise estatística, e estas relações nem sempre são de fácil compreensão.
Neste trabalho, são apresentados modelos geometalúrgicos em depósitos minerais
auríferos situados em Minas Gerais, Brasil. Apesar de diversas variáveis impactarem nestes
modelos, destaca-se a mineralogia como uma das maiores influenciadoras. Segundo Zhou e
Cabri (2004), o estudo dos minerais auxilia mineralogistas e metalurgistas a lidarem com
o processamento mineral complexo de depósitos de ouro.
Minérios de ouro são classificados em duas categorias quanto o beneficiamento:
os minérios refratários e os free-milling ores. Esta última classificação é definida para
materiais cuja recuperação em pilhas de lixiviação ultrapassa 90%. No entanto, minérios
refratários possuem baixa recuperação de ouro ou apresentam recuperações aceitáveis,
mas com consumo alto de insumos. Os processos hidrometalúrgicos desempenham papel
fundamental no beneficiamento destes minérios, portanto, variáveis resposta como cinética
de dissolução, consumo de cianeto e oxigênio, refratoriedade e metais deletérios (As, Hg,
Se, Sb, etc) devem ser exploradas. Em contrapartida, também existem propriedades físicas
importantes como moabilidade, dureza, grau de liberação, etc.
As variáveis de processo podem ser mapeadas no depósito mineral utilizando a
geoestatística, uma ciência que engloba o conceito de variável regionalizada para estimar,
simular e interpretar dados georreferenciados. Segundo Sepulveda et al. (2015), melhorias
Página 40
na mineração são promovidas com o conhecimento adequado dos recursos minerais e

sua performance metalúrgica, garantindo otimização completa da cadeia mineral. Neste
contexto, pretende-se utilizar técnicas computacionais de aprendizado de máquinas, para
auxiliar no desenvolvimento de modelos geometalúrgicos em depósitos auríferos.
Na criação de modelos matemáticos geometalúrgicos, são abordados dois problemas
principais. O primeiro consiste na calibração do equipamento ore sorting. O segundo
problema consiste na predição de variáveis geometalúrgicas, a partir de propriedades do
depósito mineral. Ambos os problemas abordam o reconhecimento de padrões.
As técnicas, conhecidas como "aprendizado de máquinas", consistem em algoritmos
que utilizam estatística multivariada, programação dinâmica, técnicas de otimização, entre
outras metodologias, que permitem o reconhecimento de padrões. São determinados pelo
termo "aprendizado", por evoluírem de acordo com a experiência, representada pelo banco
de dados, propriedades, ou variáveis. A qualidade das informações, aliada com a boa escolha
dos modelos preditivos, pode garantir modelos adequadamente ajustados, auxiliando a
tomada de decisão em um empreendimento.
Essa tese pretende contribuir com o estado da arte da modelagem geometalúrgica,
permitindo avaliações automáticas destes modelos, seja no desenvolvimento tecnológico em
equipamentos unitários do beneficiamento (ore sorting e flotação), seja na compreensão
das variáveis que afetam e definem o processamento mineral de depósitos de ouro.
1.1.1 História do aprendizado de máquinas

Turing (1948) desenvolveu os princípios básicos para o reconhecimento de máquinas
inteligentes, propondo um teste que verificaria se uma máquina reproduziria um discurso
humano, convencendo-se ser uma pessoa. Apesar das técnicas evoluírem ao ponto de
”quase” reproduzirem uma fala humana, até mesmo com personalidade, os conceitos de
inteligência e principalmente consciência são abstratos e ainda incompreendidos.
Samuel (1959) desenvolveu o primeiro programa de aprendizado de máquinas para
jogo de damas, criado pela IBM R
. Rosenblatt (1958) criou o primeiro modelo de redes
neurais (perceptron), inspirando-se no comportamento de neurônios. Os modelos de rede
neurais se desenvolveram em diversas disciplinas da inteligência artificial e aprendizado
profundo. Cover e Hart (1967) desenvolveram o primeiro algoritmo de vizinhos mais
próximos. Em 1997, o algoritmo deep blue venceu o campeão mundial de xadrez Garry
Kasparov. Em 2014, a empresa F acebook R
desenvolveu o DeepF ace R
, uma aplicação
capaz de reconhecer faces individualmente em fotos. Em 2016, a inteligência artificial
da Google ganhou
R de um jogador profissional de GO, um dos jogos de tabuleiro mais
complexos da humanidade.
No estado atual da arte, as técnicas de reconhecimento de padrões estão intimamente
Página 41
ligadas ao cotidiano, mesmo que tais mudanças tenham se desenvolvido nos últimos 50
anos. Com a gênese da linguagem de programação, desenvolvida por Rossum e Jr (1995),
chamada P ython R
, intensificou-se a facilidade de implementação dos algoritmos de
aprendizado de máquinas. Em tempos antigos, a atividade era exclusiva de profissionais
com expertise em programação, não obstante, está atualmente acessível a profissionais
de vários ramos. As diversas bibliotecas, fornecidas pela linguagem, permitem o uso de
algoritmos complexos com poucas instruções.
Esta popularização de tecnologias, nos leva a crer que, futuramente, os profissionais
da mineração precisarão se atualizar, incorporando estas tecnologias no seu ambiente de
trabalho. Embora esta difusão das técnicas tenha crescido, sua aplicação é restrita no
ramo da mineração, seja pela disponibilidade de informação ou da falta de qualificação
dos profissionais.
1.2 Problema
Dois problemas são abordados nesta tese em diferentes depósitos minerais. O

primeiro problema relaciona medidas físicas, dos sensores de um pré-concentrador mecânico
(ore sorting), com o seu desempenho de classificação nas minas de Córrego do Sítio. O
segundo problema trata variáveis metalúrgicas, nas minas de Cuiabá e Lamego, com
objetivo de previsão (regressão), destas em função de medidas físico-químicas no ROM.
O primeiro problema consiste na calibração do ore sorting. Imagens geradas pela
transmissão de raios x, em partículas minerais, permitem inferir regiões de densidades
distintas e criar informações relacionadas à sua concentração. Técnicas de simulação
(diferentemente do conceito da estatística) permitem identificar o número de pixels com
a proporção em áreas densas e pouco densas na partícula, separando-a em fluxos, de
acordo com a medição destas propriedades. O segundo problema aborda os modelos de
previsão geometalúrgicos, em que variáveis de resposta metalúrgica são estimadas a partir
de variáveis geológicas primárias.
1.3 Metas
Entre trabalho propõe o estudo de modelos geometalúrgicos para depósitos auríferos,

baseando em aprendizado de máquinas, considerando como meta as seguintes hipóteses
investigativas:
Página 42
Hipótese 1.3.1. Sabendo que as definições dos tipos do minério e desempenho de

um dado minério na planta de processo dependem intimamente
das características físico-químicas e mineralógicas dessse material,
poderíamos usar essas propriedades para aprender a classificar
os materiais fazendo o uso de modernas técnicas de aprendizado
de máquinas?
Hipótese 1.3.2. Poderíamos aprender com os dados qual sua origem no depósito
e qual seu resultado de recuperação metalúrgica para prever em
futura lavra o desempenho industrial e origem do ROM?
1.4 Objetivos
Para alcançar as metas previstas, esta tese propõe como objetivos principais:
Objetivo 1.4.1. Estudar a presença de padrões e propriedades importantes para

modelos matemáticos geometalúrgicos.
Objetivo 1.4.2. Estudar as variáveis mais importantes para a definição dos mo-
delos matemáticos, segundo diferentes critérios, e eleger as mais
impactantes no modelo geometalúrgico.
Objetivo 1.4.3. Definir classes preditivas para os modelos supervisionados se-
gundo critérios de máximo aproveitamento para o beneficiamento
mineral.
Objetivo 1.4.4. Estudar diferentes modelos e parâmetros para a classificação e
regressão das variáveis de interesse em geometalurgia. Elencar
estes modelos segundo o melhor desempenho.
1.5 Metodologia
A metodologia da tese envolve o estudo estatístico e geometalúrgico dos depósitos
minerais. As técnicas de aprendizado de máquinas exigem a análise exploratória dos dados,
seguidos dos passos para se definir os modelos preditivos, e suas validações.
Para o problema do ore sorting tem-se:
i Validação do banco de dados. É necessário realizar a feature extraction, norma-

lizando medidas do raio x para o mesmo tamanho de imagem.
ii Transformação das variáveis. Pretende-se encontrar transformações das variáveis

que possam ser utilizadas para maximizar a classificação do ore sorting.
iii Estatística descritiva das variáveis. Realizar a análise exploratória produzindo

histogramas, tabelas de covariâncias entre outras estatísticas.
Página 43
iv Determinação das variáveis mais importantes para a classificação do ore

sorting. O uso de muitas variáveis pode ser prejudicial aos modelos geometalúrgicos
(curse of dimensionality). Determinar a importância das variáveis permite identificar
as melhores respostas para a classificação.
v Determinação de uma variável mista de resposta, contendo informações

de química e mineralogia. Para o problema do ore sorting , é necessário incorporar
informações da mineralogia e da química para definir minério e estéril.
vi Determinação de grupos dentro modelo de classificação. Os domínios geo-

lógicos podem apresentar comportamentos distintos quanto suas propriedades físicas.
Técnicas de agrupamento permitem avaliar a relação de propriedades das partículas
minerais e estes domínios.
vii Determinação de um modelo de classificação a partir das variáveis do

raio x. Serão testados diferentes modelos de aprendizado de máquinas, tais como
redes neurais, análise discriminante linear, supported vector machines, vizinhos mais
próximos, etc.
viii Seleção e validação do melhor modelo de classificação. O melhor modelo de

classificação será avaliado de acordo com diferentes métricas: tabelas de confusão,
curvas de aprendizado, validação cruzada, etc.
Para os problemas relacionados com as minas de Cuiabá e Lamego (geometalurgia):
i Validação do banco de dados. Os dados geometalúrgicos serão avaliados quanto

a presença de valores anômalos.
ii Estatística univariada e bivariada das variáveis. Será realizada a análise ex-

ploratória com histogramas e tabelas de covariâncias, identificando a relação entre
variáveis primárias e verificando propriedades como linearidade, aditividade, inde-
pendência, etc.
iii Técnicas de agrupamento. Serão utilizadas técnicas de agrupamento para identi-

ficar domínios estacionários no suporte temporal.
iv Determinação de um modelo de regressão a partir das variáveis geome-

talúrgicas. Será determinado o melhor modelo de respostas geometalúrgicas consi-
derando as variáveis primárias existentes da geologia.
Página 44
1.6 Contribuições da Tese

Esta tese pretende contribuir com a modelagem geometalúrgica de minérios de ouro,
validando modelos que facilitem o entendimento da relação entre geologia e processamento
mineral. Para isso, dois problemas principais são abordados, em diferente minas do
quadrilátero ferrífero: o primeiro relacionado ao equipamento de pré-processamento ore
sorting em Córrego do Sítio, e o segundo, relacionando à flotação de ouro e enxofre, na
planta de Queiroz. Estes modelos matemáticos são um início para decisões de engenharia,
que afetarão o uso adequado destas reservas minerais.
1.7 Organização da Tese

Essa tese organiza-se em seis capítulos:
Capítulo 1 Contém uma introdução, definição do problema, metas e objetivos, a metodologia

utilizada, contribuição da tese, a organização da tese.
Capítulo 2 Apresenta uma revisão teórica envolvendo os aspectos de estatística multivariada

e técnicas de aprendizado de máquinas, utilizadas para calibração do ore sorting
(CDS) e da geometalurgia (Cuiabá-Lamego).
Capítulo 3 Apresenta, brevemente, os problemas abordados nesta tese.
Capítulo 4 Apresenta o estudo de caso do ore sorting, caracterizando as variáveis do problema,

e identificando suas relações com os valores obtidos dos sensores de raio x.
Capítulo 5 Apresenta o estudo de caso para a geometalurgia de Cuiabá e Lamego, demonstrando

os resultados obtidos.
Capítulo 6 Apresenta a conclusão do trabalho e indica trabalhos futuros a partir desta tese.
Página 45
2 Revisão Bibliográfica
A geometalurgia é uma ciência multidisciplinar, apresentando diferentes ramifica-

ções. A figura 2 demonstra estas vertentes, ligadas ao corpo principal do assunto desta
obra.
Figura 2 – Diferentes assuntos da geometalurgia relatados em um diagrama de triângulo.

No centro é representada a geometalurgia como uma união entre diversas
subáreas como a geoestatística, o beneficiamento mineral e o aprendizado de
máquinas.
Fonte: Próprio autor
Neste capítulo, serão abordados os conceitos sobre geometalurgia e geoestatística.

Em seguida, será realizada uma revisão sobre beneficiamento mineral de ouro, enfatizando
o papel da mineralogia. Posteriormente, serão abordadas as técnicas de aprendizado de
máquinas e da validação destes modelos. Ao final, é apresentado uma seção dedicada
apenas ao ore sorting.
2.1 Geometalurgia
A geometalurgia é uma ciência multidisciplinar, que integra informações geológicas
do depósito mineral, planejamento de mina e tratamento de minérios em uma única
CAPÍTULO 2. REVISÃO BIBLIOGRÁFICA
plataforma de trabalho. Segundo Coward et al. (2009), o objetivo principal da geometalurgia

é:
"Ao melhorar o entendimento da natureza espacial de propriedades re-

levantes da rocha, a mineração e o tratamento de minérios podem ser
otimizados, tanto nas fases de design e operação de projetos de mineração".
(nossa tradução) 1
Além disso, o conhecimento das variáveis metalúrgicas permite transformar recursos

em reservas, afetando o projeto econômico de uma mina. Entre os principais fatores para
definir um modelo geometalúrgico estão a descrição dos minerais, composição química,
proporção mássica e texturas dos minérios. (LISHCHUK, 2016) 2 .
O objetivo principal da geometalurgia é a criar um modelo, definido em quatro
níveis:
(i) Obtenção de informação sobre as variáveis primárias e resposta meta-

lúrgica: A variabilidade geológica possuí impacto significativo no beneficiamento,
portanto é necessário métodos de amostragem adequados e amostras com suporte
compatíveis. As variáveis metalúrgicas podem apresentar flutuações significativas e
também devem ser adequadamente amostradas,
(ii) Análise e modelagem dos dados e verificação dos seus comportamentos:

É necessário realizar a análise exploratória do banco de dados, verificando possíveis
padrões entre as variáveis geológicas e suas relações com as de processo,
(iii) Construção de um modelo de blocos que represente os dados metalúrgicos

no depósito mineral: Interpolam-se as variáveis de interesse, construindo um
modelo representativo das propriedades estatísticas do depósito mineral,
(iv) Otimizações subsequentes do planejamento de lavra e da usina de acordo

com as informações obtidas: É possível otimizar processos, melhorar o planeja-
mento mineral e reduzir impactos ambientais com a informação obtida.
2.1.1 Classificação das variáveis geometalúrgicas

As variáveis geometalúrgicas se dividem em primárias e resposta. As primárias
são medidas no depósito mineral tal como: massa, densidade, coloração, teores, tamanho
dos grãos e grau de alteração da rocha. As variáveis resposta são atributos do processo
1
"By improving the understanding of the spatial nature of relevant rock properties the mining and the
ore treatment operations can be improved, both at the desing phase and operation of mineral projects".
Página 109
2
"The key connecting elements in this description are minerals, their chemical composition, mass
proportions and ore textures". Página 4
Página 48
de beneficiamento, tais como recuperação metalúrgica, tamanho dos grãos cominuidos,

moabilidade, dureza, densidade aparente das partículas cominuídas, etc (COWARD et
al., 2009). A figura 3 apresenta a relação entre variáveis primárias e resposta em um
diagrama de Venn. Nota-se uma interseção ao qual tanto uma variável é primária e reposta
(COWARD et al., 2009). A variável peso, por exemplo,se relaciona ao depósito mineral, no
entanto, também pode ser uma variável resposta, quando considerado minério na usina.
Figura 3 – Relação entre variáveis primárias e resposta metalúrgica. Variáveis primárias

representadas como parte integrante do depósito mineral, tais como massa, cor
e tamanho dos grãos minerais. Variáveis resposta representadas como medidas
do beneficiamento mineral, tal como recuperação metalúrgica, moabilidade e
consumo de reagentes. Ao centro dispõe as variáveis mistas, que compõe tanto
propriedades da própria geologia, como também como variáveis resposta.
Fonte:Adaptado de (COWARD et al., 2009)
2.1.2 Características das variáveis geometalúrgicas

A geometalurgia pode apresentar como problemas multivariados, com relações
complexas entre estas variáveis. O comportamento em grupo destas propiedades pode
definir a escolha de um melhor modelo de predição. Variáveis independentes e aditivas
permitem o uso de métodos de estimativa lineares, como a krigagem ordinária e simples.
Porém, tais propriedades nem sempre são observadas, tolhendo o uso destas técnicas. Não
obstante, metodologias de krigagem não-linear como a krigagem lognormal, krigagem
disjuntiva e krigagem de indicadores, podem não se adequar em problemas geometalúrgicos
(DEUTSCH et al., 2016)3 . A utilização de simulação geoestatística parece ser a melhor
3
"Kriging techniques classified as nonlinear methods including lognormal kriging, disjuntive kriging,
and indicator kriging were investigated by Moyeed and Papritz (2002) and found to perform relatively
Página 49
opção ao lidar com problemas de geometalurgia (DEUTSCH et al., 2016).

A modelagem geometalúrgica, em fases iniciais de projetos de mineração, pode ser
refreada, devido à necessidade de um grande aporte de amostras para definição precisa
destes modelos. No caso das etapas greenfield, a aplicação da geometalurgia é laboriosa,
pois inferências devem ser realizadas sobre variáveis de processo, por vezes requerendo
informações análogas de depósitos minerais semelhantes (COWARD et al., 2009). Nas
sequências brownfield, a usina de beneficiamento fornece dados de reconciliação, que podem
correlacionar as características do depósito mineral com o processamento (COWARD et
al., 2009).
A modelagem geológica é trabalhosa, principalmente por utilizar informações de
diferentes etapas da cadeia mineral, com métodos díspares de amostragem, com distintos
volumes, e posicionamento espacial das amostras. Estas dificuldades se acentuam em
depósitos de grande complexidade geológica, como os referidos nesta tese. Carrasco et al.
(2008) comentam as dificuldades no tratamento de variáveis geometalúrgicas:
(i) Geralmente as amostras não possuem mesmo suporte,
(ii) As amostragens aglutinam porções vindas de diferentes localizações, invalidando o

georreferenciamento das amostras,
(iii) A recuperação metalúrgica não é aditiva,
(iv) Geralmente, um número pequeno de amostras e variáveis não é suficiente para acessar
a variabilidade do fenômeno,
(v) Os modelos de continuidade espacial, das variáveis que afetam o processo, como
litologia, alteração, textura, liberação, propriedades superficiais ou zonas de alteração
podem não estar disponíveis,
Todavia, a qualidade do banco de dados dos testes geometalúrgicos pode impor

dificuldades, a medida que pode apresentar dados faltantes em larga quantidade e protocolos
amostrais não controlados.
2.1.3 Variáveis aleatórias regionalizadas e domínios geometalúrgicos

Os primeiros trabalhos envolvendo a teoria das variáveis regionalizadas foram
propostos por Matheron no início da década de 60 (MATHERON, 1963). Uma variável
regionalizada, é uma função que associa cada elemento de um espaço amostral e seu suporte,
a um valor real . Entende-se como suporte o posicionamento, volume e geometria do objeto
amostrado. Considerando todos os suportes e variáveis pertencentes a um domínio D,
poorly for the estimation of skewed variables.". Página 162
Página 50
tem-se a função aleatória determinada por Z(u) : Ω → R. A variável regionalizada possui

aspecto dicotômico, podendo apresentar valores exatos no local onde é amostrada e valores
aleatórios nos lugares desconhecidos (JOURNEL; HUIJBREGTS, 1978).
Na mineração, as variáveis regionalizadas podem assumir tipos distintos, como
contínuas (reais) em teores metálicos, ou indicadoras (inteiras) em litotipos e mineralogia.
Na geoestatística clássica, não há necessidade do conhecimento da função aleatória
Z(u), na verdade só é necessário conhecer os momentos de primeira e segunda ordem. No
entanto, são necessárias algumas hipóteses a priori, também chamadas de hipótese de
estacionaridade. Segundo (WACKERNAGEL, 2013), a hipótese de estacionaridade pode
ser analogamente comparada ao testamento de Arlequino, na obra de Julio Verne:
"Everything is everywhere and always as the same as here .. up to a

certain degree of magnitude and perfection- Julio Verne
Ao transladar, de uma parte a outra no universo, nada muda ou é alterado. A

função de distribuição conjunta de n variáveis aleatórias regionalizadas no espaço é a
mesma realizando uma translação para um vetor ’h’. A equação 2.1 demonstra a hipótese
de estacionaridade intrínseca:
F (Z(u1 ), Z(u2 )...Z(un )) = F (Z(u1+h ), Z(u2+h )...Z(un+H )) (2.1)
onde Z(u) representa a função aleatória, e F a função de distribuição acumulada da variável

Z(ui ). A invariância por translação significa adotar um modelo fixo de continuidade espacial,
avaliado em um domínio D. A função de continuidade espacial depende apenas do vetor
de distâncias ’h’, e não da posição relativa no espaço.
Outra hipótese adotada nos modelos geoestatísticos é a hipótese de estacionaridade
de segunda ordem. Esta pode ser descomprovada, caso observada uma tendência no
depósito mineral, mas de outra forma podemos apenas aceitá-la como verdadeira, se os
dados não apresentarem uma tendência possível. A hipótese de estacionaridade de segunda
ordem implica que para um dado domínio D, a função aleatória apresenta uma média e
uma variância constante.
Durante a modelagem geometalúrgica, é necessário adotar hipóteses de estacionari-
dade em domínios conhecidos. A utilização de informações de domínios geometalúrgicos
diferentes pode apresentar resultados espúrios que não condizam com a realidade do
domínio modelado.
Página 51
2.1.4 Propriedades das variáveis geometalúrgicas

A geoestatística clássica requer uso de variáveis aditivas nos métodos de krigagem
ordinária, krigagem simples e krigagem universal (MATHERON, 1963). Posteriormente,
novas técnicas não-lineares de geoestatística foram criadas, como a krigagem disjuntiva
(MATHERON, 1976) e a krigagem de indicadores (JOURNEL, 1983). Estudos geometa-
lúrgicos parecem mostrar que estimativas não funcionam adequadamente em distribuições
assimétricas (DEUTSCH et al., 2016)3 , sendo a simulação geoestatística a melhor alterna-
tiva para a geometalurgia.
Nas subseções 2.1.4.1 a 2.1.4.3, são apresentados os conceitos de aditividade,
linearidade e independência.
2.1.4.1 Aditividade
Quantidades são aditivas se a quantidade média é igual a média aritmética das

quantidades (CARRASCO et al., 2008)4 . Neste caso, as variáveis teor, massa de elementos
metálicos e acumulação são exemplos comuns de variáveis aditivas. Se Q1 e Q2 são as
massas de elemento metálico de cada uma das amostras, e T1 e T2 os volumes da quantidade
de minério, a quantidade média pode ser dada por:
Q1 + Q2
Qm = (2.2)
T1 + T2
enquanto a média das quantidades pode ser dada pela por:
1 Q1 Q2

Q̄ = + (2.3)
2 T1 T2
logo, se e somente se T1 = T2 é possível que as variáveis sejam aditivas. Portanto, o suporte
igual das amostras é essencial para aplicações de técnicas de geoestatística clássica. A
principal variável aditiva na geoestatística é o teor do elemento metálico no depósito
mineral, no entanto, algumas variáveis como moabilidade e grau de liberação não podem
ser consideradas aditivas.
2.1.4.2 Linearidade
Uma função linear deve satisfazer não apenas o critério de aditividade, mas também
o critério de homogeneidade. Seja uma função f (x), então f (ax) = af (x)∀a. Isso significa
que o comportamento médio de duas variáveis pode ser descrito a partir de uma combinação
linear entre elas. Este é o princípio dos métodos geoestatísticos lineares que utilizam médias
3
"Kriging techniques classified as nonlinear methods including lognormal kriging, disjuntive kriging,
and indicator kriging were investigated by Moyeed and Papritz (2002) and found to perform relatively
poorly for the estimation of skewed variables.". Página 162
4
"Quantities are said to be additive if the averaged quantity equals the average of the quantities"
Página 52
ponderadas para estimativa. Comportamentos não lineares geralmente são transformados

em variáveis lineares, utilizadas nos cálculos, e em seguida retro transformadas.
Diversas técnicas são utilizadas para transformações não-lineares na geometalurgia,
dentre elas as razões logarítmicas, anamorfose gaussiana e transformações condicionais
"passo-a-passo". Cada uma possui vantagens e desvantagens, seja pela simplicidade, ou
pelos melhores modelos obtidos.
2.1.4.3 Independência
O conceito de variáveis aleatórias independentes é similar ao conceito de inde-

pendência de eventos, proposto pela teoria das probabilidades. Podemos definir se duas
variáveis são independentes X e Y, quando apresentarem valor x e y que levem a equação
2.4 ser verdadeira.
P (X = x, Y = y) = P (X = x)P (Y = y) (2.4)
Variáveis regionalizadas independentes permitem criar modelos intrínsecos. Neste

caso, não há diferenças entre a krigagem individual das variáveis ou a cokrigagem das
mesmas (RIVOIRARD, 1994). O modelo de covariâncias pode ser escrito como:
Cij = Cov [Zi (u + h), Zj (u)] = Cij (0)ρ(h) (2.5)
onde Zi e Zj são duas variáveis diferentes, Cij (0) é um patamar diferente para cada
covariograma e ρ(h) é um modelo de correlograma único, chamado de intrínseco. Dife-
rentes metodologias como PCA (Principal component analysis) ou SVD (Singular Value
Decomposition ) são alternativas para a decomposição de variáveis dependentes em fatores
descorrelacionados.
Uma alternativa para o teste de independência entre variáveis aleatórias é o teste chi-
quadrado de Pearson. A premissa para a utilização do teste é a amostragem seja aleatória
(MCHUGH, 2013) . Isso nem sempre é possível em bancos de dados regionalizados,
considerando que as amostras podem ser agrupadas, segundo critérios econômicos ou
geológicos.
2.2 Beneficiamento de ouro

2.2.1 Introdução ao beneficiamento
O conhecimento sobre metalurgia/beneficiamento mineral é um quesito necessário
para a aplicação adequada da geometalurgia. As peculiaridades de cada depósito mineral,
suas características mineralógicas e estruturais, torna a escolha de cada tecnologia de
Página 53
processamento única. O beneficiamento de minérios é o conjunto de técnicas utilizadas

para acrescentar qualidade ao minério, com objetivo de concentrar o elemento metálico
de interesse e reduzir contaminantes para processos metalúrgicos subsequentes. A figura
4 representa a concentração de minérios em que os componentes (A) constitui o mineral
minério de interesse, e em (B) a ganga, o material descartável.
Figura 4 – (A) mineral minério (B) ganga. Representação de uma separação perfeita entre
dois componentes binários (caso ideal), onde as partículas pretas (mineral
minério) estão completamente divididas das partículas brancas (ganga).
Fonte:(CHAVES, 2006)
A figura 4 demonstra um caso idealizado, onde os dois componentes podem ser

divididos em fluxos distintos. Na maioria dos casos, os processos são imperfeitos e frações
do mineral minério apresentam-se no rejeito, enquanto frações da ganga se apresentam no
concentrado. Para ocorrer um processo de concentração é necessário haver:
(i) Liberação das partículas de mineral minério e ganga. Deve haver uma divisão física
entre os componentes minerais, geralmente efetuada por um processo de cominuição,
(ii) Um meio fluido que permita um gradiente de forças atue, geralmente água ou ar, de
forma que as partículas possam ser selecionadas,
(iii) Uma propriedade diferenciadora capaz de interagir distintamente no mineral mi-

nério e na ganga, como a susceptibilidade magnética, densidade, ou até mesmo
comportamentos químico de interfaces (flotação).
Um importante critério para a classificação é a liberação do mineral-minério de

interesse. É necessário a fragmentação da rocha para produzir minerais-minério livres, e
uma superfície específica necessária para a ação de reagentes químicos, como em processos
hidrometalúrgicos e na flotação. A Figura 5 demonstra características de uma partícula
liberada e intercrescida de ganga.
Página 54
Figura 5 – (a) Partícula de mineral minério liberada (branco) (b) Partícula intercrescida
(contém mineral minério(branco) e ganga(pontos negros))
Fonte:(CHAVES, 2006)
No beneficiamento mineral, são realizadas operações unitárias, que compõe elemen-

tos no fluxo de processamento, permitindo produzir um concentrado. Segundo Chaves
(2006), as operações unitárias em uma planta podem ser divididas em três grandes grupos:
(i) Operações de cominuição: Visa reduzir o tamanho das partículas minerais. Dentre
elas, há processos de britagem, realizadas em material grosseiro e de moagem,
praticadas em material fino. Estas operações são acompanhadas da separação das
partículas por tamanho, como no peneiramento e classificação,
(ii) Operações de concentração: Visa separar as partículas minerais, dividindo o

material de interesse técnico e econômico (mineral-minério), do material sem interesse
(ganga),
(iii) Operações auxiliares: Visa transportar os diferentes materiais durante o circuito

de beneficiamento e separar a água da polpa. Algumas dessas operações são o
transporte de polpas, transporte de sólidos, estocagem e homogeneização em pilhas,
armazenamento em silos, espessamento, filtragem e secagem.
Essas operações podem ser representadas em um fluxograma, um conjunto de

desenhos que demonstram cada equipamento e os fluxos de entrada e saída do material em
processo intermitente. A figura 6 representa o fluxograma do lavador de carvão de Capivari,
operado por uma antiga empresa estatal brasileira (Companhia Siderúrgica Nacional -
CSN).
Página 55
Figura 6 – Exemplo de fluxograma da planta de Capivari, pertencente a antiga CSN

(Companhia Siderúrgica Nacional).
Fonte: (CHAVES, 2006)
As operações unitárias funcionam segundo condições de litologia e granulometria

específicas. A presença de magnetita no minério, por exemplo, pode sugerir o uso de
classificador magnético do tipo Jones no processo (MALY, 1995)4 .
2.2.2 Recuperação Metalúrgica

A recuperação metalúrgica é uma das principais variáveis resposta do processamento
mineral. Representa a quantidade de metal obtida após o beneficiamento de uma quantidade
de minério disponível na alimentação do processo. Pode ser escrita, em termos matemáticos
como:
c a−e

R= (2.6)
a c−e
em que ’c’ é o teor do concentrado, ’a’ o teor da alimentação e ’e’ o teor do rejeito. A
recuperação metalúrgica não é uma variável aditiva, assim como o teor de concentrado e do
rejeito. Não obstante, o teor da alimentação ser uma variável aditiva, o teor do concentrado
e do rejeito não são (CARRASCO et al., 2008). Carrasco et al. (2008) propoem estimar
4
"Conventional magnetic separation devices are generally restricted to separating strongly magnetic
materials, such as iron and magnetite". Página 223
Página 56
a recuperação metalúrgica ao obter a krigagem do teor recuperável, por ar = Ra, e a

krigagem do teor da alimentação, e ao final dividir ambas as relações. Segundo Carrasco et
al. (2008), o teor recuperável é uma variável aditiva, diferente da recuperação metalúrgica.
2.3 Técnicas de aprendizado de máquinas

O reconhecimento de padrões é base dos métodos científicos, permitindo predições
acerca do fenômeno estudado. Assim, como o astrólogo alemão Johannes Kepler desenvolveu
as leis da movimentação de corpos celestes ou Isaac Newton definiu as leis da mecânica
clássica, identificar padrões é um alicerce comum da ciência. Os fenômenos geológicos,
tais como eventos naturais, apresentam leis físicas, químicas e biológicas que os definem.
Mesmo que sejam realizações aparentemente caóticas, são definidos e estruturados por leis
fixas e imutáveis.
O aprendizado constitui no reconhecimento destes padrões, obtidos pela experiên-
cia e transformados em conhecimento. O nível do aprendizado é uma relação do modelo
preditivo e da informação disponível. Seres humanos reconhecem faces com poucas infor-
mações, porém é necessário a um computador, um banco de dados extenso, para identificar
padrões faciais da mesma forma. Shwartz e David (2014) fazem uma extensa referência à
classificação dos métodos de aprendizado. Essas metodologias se subdividem:
• Supervisionado e não supervisionado: O aprendizado supervisionado requer

que seja determinado o valor da classe de predição. Dada uma amostras x =
(x1 , x2 , ..., xn ) é necessário o valor y = (y1 , y2 , ..., yn ) que determina a classe. O apren-
dizado supervisionado divide-se em dois paradigmas principais, um de regressão
e outro de classificação. No primeiro caso, apresenta classes reais, enquanto no
segundo, classes inteiras. O aprendizado não supervisionado não necessita de uma
classe a priori.
• Ativo e passivo: O aprendizado ativo interage em tempo de execução, enquanto o

aprendizado passivo utiliza os dados em tempos determinados.
• Online ou batch: O aprendizado online pode ser realizado concomitante à aquisição

de informação, enquanto o aprendizado em batch é realizado distintamente da
obtenção de informação.
Para a avaliação dos modelos de aprendizado, uma prática comum consiste em

dividir o banco de dados em amostras de treinamento e amostras de teste. As amostras de
treinamento são utilizadas para ajustar parâmetros dos modelos de aprendizado, enquanto
as amostras de teste são utilizadas para validar a capacidade preditiva destes modelos. O
objetivo é alcançar a generalização, ou seja, encontrar um modelo que se adeque bem
Página 57
aos bancos de teste. Modelos que se adequam bem a base de treino, mas não de teste,
apresentam overfitting.
A figura 7 apresenta os modelos que atingiram o estado de overfitting, underfit-
ting e ajustes adequados. Os modelos acordados excessivamente aos dados, ou parcamente
ajustados apresentam baixo potencial preditivo. O princípio epistemológico da navalha de
Occam justifica que deve-se assumir a menor quantidade de premissas possíveis na mode-
lagem de fenômenos, portanto, modelos complexos podem produzir estimativas espúrias,
não representativas dos bancos de dados.
Figura 7 – Exemplo de overfitting, underfitting e um modelo adequadamente ajustado,

para casos de aprendizado supervisionado. Em (A), são apresentados os modelos
de regressão, em que as curvas pretas representam o modelo e as bolas azuis
as variáveis numéricas. Em (B), é representado o modelo de classificação em
que as bolas azuis e vermelhas representam diferentes classes e a curva negra
representa a superfície de separação.
Fonte: Modificado de (AMIDI, 2018)
2.3.1 Seleção de modelos
A modelagem matemática dos fenômenos estudados deve preceder o uso de métricas

de avaliação, para atingir um estado de generalização. Para estatísticas paramétricas,
estimadores de máxima verossimilhança são uma alternativa renomada para encontrar
melhores parâmetros para estes modelos. Para modelos não paramétricos, a validação
cruzada constitui a melhor alternativa. Especificamente para variáveis binárias, ferramentas
como a matriz de confusão e curva ROC auxiliam na criação de melhores modelos.
Página 58
2.3.1.1 Máxima Verossimilhança
O método de máxima verossimilhança determina o melhor estimador de um

modelo com distribuição de probabilidades conhecidas como f(X) e vários parâmetros
θ = (θ1 , θ2 ..., θn). Se as variáveis forem independentes, identicamente distribuídas e con-
tínuas, a função de máxima verossimilhança pode ser descrita como um produto das
densidades de probabilidade f (X1 , X2 , ..., Xn |θ) = ni=1 f (Xi |θ). Segundo Bishop (2006)4 ,
Q
o estimador de máxima verossimilhança pode sistematicamente subestimar a variância da

distribuição f(X). Este problema se torna cada vez menos significativo quando o número
de amostras ’n’ cresce. O método consiste em determinar o parâmetro θ, que maximize a
função de máxima verossimilhança, utilizando métodos de otimização numéricos tais como
de Newton (BISHOP, 2006).
2.3.1.2 Validação cruzada
A validação cruzada é uma estratégia de calibração que divide o banco de dados

repetidas vezes e aplica os modelos preditivos em parte dos dados removidos, utilizando
métricas para avaliar os modelos. Parte dos dados é dividida como treino, que constitui
base para ajustar os modelos, e a outra parte é dividida em teste, que compara os modelos
ajustados com os valores reais da classe pretendida. A utilização de um modelo adequado
para o treino não necessariamente implica em um modelo adequado para o teste. Apenas
obtendo a generalização, é possível obter boas métricas tanto na base de treino ou teste,
podendo ser realizada comparação entre o percentual de acerto nestes grupos.
A técnica de validação cruzada separa os dados em grupos ou folds. A figura 8
considera cinco grupos na validação cruzada. A técnica se procede da seguinte forma:
primeiramente o grupo 1 é utilizado como banco de teste, enquanto os demais (2,3,4,5) são
utilizados como treino. Em seguida, o grupo 2 é utilizado como teste e os grupos (1,3,4,5)
são utilizados como treino. Denomina-se esta técnica de validação cruzada em grupos.
Figura 8 – Exemplo de validação cruzada. Caixas cinzas correspondem ao grupo de teste,

enquanto as brancas correspondem ao grupo de treino. No eixo x são represen-
tados os diferentes grupos, enquanto no eixo y são representadas as divisões.
Fonte: (MÜLLER et al., 2016)
4
"In particular, we shall show that the maximum likelihood approach systematically underestimates the
variance of the distribution". Página 27
Página 59
Segundo Müller et al. (2016), existem benefícios ao utilizar a validação cruzada

em grupos, pois esta avalia o modelo em cenários distintos, ao contrário da prática de
dividir em apenas um grupo de teste e treino. Os autores indicam o problema da divisão
em apenas dois grupos, pois existe chance da modelagem favorecer um grupo específico
em detrimento de um comportamento global das variáveis. Müller et al. (2016) também
demonstram a validação cruzada estratificada como demonstrado na figura 9 (b) . Neste
caso, uma parte da cada um dos grupos é dividida novamente para se criar outros bancos
de dados, que serão avaliados como treino e teste.
Figura 9 – Validação cruzada em k grupos representado em (a). Em (b) a validação cruzada

estratificada . Caixas cinza representam os valores de teste, enquanto as caixas
brancas de treino. No eixo x assume-se o valor de uma variável, enquanto em y
assume-se os diferentes grupos. Os valores estão ordenados crescentemente.
A validação cruzada é uma técnica utilizada para ajustar o melhor parâmetro de

um modelo. Müller et al. (2016) demonstram, na figura 10, um gráfico para seleção do
melhor parâmetro gamma de um modelo de máquinas de vetores de suporte. Nota-se, que
o parâmetro escolhido é aquele que apresenta melhor acurácia.
Figura 10 – Seleção do melhor parâmetro (gamma) para máquinas de vetores de suporte.

No eixo x os valores do coefficiente gamma, e no eixo y a acurácia.Valor
escolhido é aquele que apresenta melhor acurácia, circulado de vermelho.
Página 60
2.3.1.3 Matriz de confusão
Em certos casos, os problemas de classificação são binários. Na mineração, o uso de

variáveis dicotômicas é comum (minério/estéril , concentrado/rejeito, lavrável/não-lavrável).
A matriz de confusão é uma métrica que avalia estas classes, geralmente chamadas de
positiva e negativa. A figura 11 demonstra a matriz de confusão como uma representação
dos valores verdadeiros obtidos nas classes negativa e positiva, e valores falsos obtidos nas
classes positiva e negativa.
Figura 11 – Matriz de confusão para duas classes. No gráfico TP representa (true positives
ou positivo verdadeiros), TN(true negatives, ou falso negativos), FP (false
postives ou falsos positivos), FN(false negatives ou falsos negativos). TN e TP
representam valores corretamente classificados enquanto FP e FN representam
valores incorretamente classificados.
Os modelos de classificação binários podem apresentar importâncias relativas para

suas classes. Na medicina, o custo ao assumir um valor falso negativo (pessoa classificada
como saudável, mas doente) é mais impactante que um falso positivo (pessoa classificada
como doente, mas saudável). Tal como na mineração, o custo por perder minério no estéril
é mais desacertado que o custo de aceitar estéril no concentrado.
2.3.1.4 Acurácia
A acurácia pode ser representada como a razão entre valores preditos corretamente
pela quantidade de valores no total. Em relação a figura 11, podemos determinar a acurácia
como:
TP + TN
Acurácia = (2.7)
TP + TN + FP + FN
em que TP e TN são os positivos verdadeiros e negativos verdadeiros, e FP e FN são os
falsos positivos e falsos negativos.
Página 61
2.3.1.5 Precisão
A precisão demonstra quantos valores positivos são realmente positivos. Pode ser
expressa por:
TP
Precisão = (2.8)
TP + FP
em que TP são os positivos verdadeiros e FP são os falsos positivos.
2.3.1.6 Revocação
A revocação mede quantos valores positivos são capturados pelas predições positivas,
de acordo com:
TP
Revocação = (2.9)
TP + FN
em que TP são os positivos verdadeiros e FN são os falsos negativos.
2.3.1.7 f1-score
Combinam-se as medidas de precisão e revocação utilizando o f1-score, determinado

pela equação 2.10. Um maior valor de f1-score representa uma melhor classificação para o
modelo, dado por:
precisão.revocação
f1-score = 2 (2.10)
precisão + revocação
2.3.1.8 Área sobre a curva ROC
Problemas desbalanceados apresentam proporções desiguais das classes preditivas,

e podem exibir métricas de classificação espúrias, se as classes não forem ponderadas
adequadamente. As categorias com maior proporção são melhor classificadas em detrimento
das com menor proporção, apresentando boas métricas de classificação, mas que não
traduzem o problema real. Prati et al. (2008) apresentam os conceitos da curva ROC
(receiver operating characteristics curve), uma ferramenta que pode ser utilizada em casos
desbalanceados.
A área sobre a curva ROC é uma forma de avaliar classificadores, tal como a matriz
de confusão. Para diferentes quantis da curva é determinado o valor da revocação e do
valor da razão dos falsos postivos (FPR - false positive rate), de acordo com:
FP
FPR = 2 (2.11)
FP + TN
Página 62
em que FP são os Falsos positivos, e TN são os negativos verdadeiros. A figura 12 apresenta

uma curva ROC. Os valores do eixo x são representados pela razão de falsos positivos
(FPR), enquanto os valores do eixo y representam a razão dos positivos verdadeiros (TPR),
ou a revocação.
Figura 12 – Curva ROC (receiver operating characteristcs curve). Valores do eixo x repre-
sentados pela razão de falsos positivos (FPR). Valores do eixo y representados
pela razão de positivos verdadeiros (TPR) ou revocação.
A curva ROC está ligada com a probabilidade de classificação dos modelos. A partir
da escolha desta probabilidade é possível identificar as melhores métricas de classificação,
atingindo pontos distintos da curva ROC. Um menor valor da área sobre a curva ROC
determina que o modelo de classificação é mais adequado. Ao contrário, uma maior área
abaixo da curva ROC representa um melhor modelo.
2.3.1.9 Erro médio absoluto
Pode ser representado pela média das diferenças absolutas entre os valores preditos
e os valores reais. É uma métrica utilizada para modelos de regressão. Pode ser expresso
por:
n
1X
EMA = (|ŷi − yi |) (2.12)
n i=1
em que n é o número de amostras, ŷi é o valor modelado, e yi o valor real. Um menor

valor de erro médio absoluto indica um melhor modelo de regressão.
2.3.1.10 Erro médio quadrático
Representa a média das diferenças entre os valores preditos e os valores reais ao

quadrado. Também é utilizada em modelos de regressão. O valor da medida pode ser
Página 63
expresso por:
n
1X
EMQ = (ŷi − yi )2 (2.13)
n i=1
em que n é o número de amostras, ŷi é o valor modelado, e yi o valor real. Um menor erro
quadrático indica um melhor modelo de regressão.
2.3.1.11 Coeficiente de determinação
O coeficiente de determinação é também uma métrica de modelos de regressão,

definido por:
(yi − ŷi )2
Pn
2 i=1
R =1− (2.14)
(yi − ȳi )2
Pn
i=1
em que ŷi representa o valor estimado para a classe, yi o valor real da classe e ȳi representa
o valor médio da classe. Valores de R2 mais próximos de 1 significam melhores modelos de
regressão. Os valores de coeficiente de determinação podem ser negativos.
2.3.1.12 Curva de aprendizado
Uma curva de aprendizado representa métricas de ajuste de um modelo com o

aumento do percentual dos dados de treinamento ou teste. Nesta tese, foi utilizada a média
da validação cruzada para diferentes percentuais do dados de treino, e comparado o score
(valores preditos como reais comparado aos valores totais).
Na figura 13, o score da curva de treino é muito maior do que a de teste, um
indicativo da possibilidade de overfitting. Quanto menor a discrepância entre as curvas de
treino e de teste, e um maior valor de score, maiores chances de um modelo estar bem
ajustado.
Página 64
Figura 13 – Exemplo da curva de aprendizado para a média da validação cruzada em

diferentes proporções dos dados. Curva azul representada pela média dos
scores da cross validação para o banco de teste. Curva amarela representada
pela média dos scores para a cross validação no banco de dados de treino.
Fonte: Próprio autor
2.3.2 Seleção de variáveis
Variáveis podem apresentar importâncias diferentes na modelagem matemática,

nem sempre segundo comportamento lineares, bem classificadas a partir do coeficiente de
Pearson. Intuitivamente, maiores teores dos elementos de interesse incentivam a recupe-
ração metalúrgica, porém, a presença de minerais deletérios pode ocasionar redução da
recuperação, mesmo com alto teor do elemento útil. As relações entre as variáveis nem
sempre são diretas.
Segundo Liu e Motoda (2007), os métodos tradicionais de seleção de variáveis
consideram o melhor conjunto segundo uma combinação linear entre estas propriedades.
No entanto, para relações não lineares complexas, como em modelos geometalúrgicos, é
necessário metodologias mais robustas nessa seleção.
As árvore de decisão são importantes na definição do melhor conjunto de variáveis.
A metodologia consiste em dividir o espaço em subconjuntos disjuntos de forma a garantir
o máximo de entropia possível. Para uma única árvore de decisão, uma medida sobre a
importância da variável pode ser definida a partir de critérios como a entropia e o índice
de Gini.
Uma das metodologias mais utilizadas para seleção de variáveis é recursive feature
elimination (RFE). A ideia do método é recursivamente computar a função de custo de
um modelo de classificação, eliminando uma variável ou tornando seu peso igual a zero. A
Página 65
função de custo pode ser determinada a partir de:
1 X
JD = (yi − zi )2 (2.15)
2 xi ∈D
em que yi é o valor da classe xi para cada valor i pertencente ao conjunto dos dados e
zi os valores classificados. Combinando o RFE com o modelo de florestas aleatórias, é
possível determinar as variáveis mais importantes para relação não-lineares complexas
como apresentadas pelas variáveis geometalúrgicas.
2.3.3 Fatorização de variáveis e redução da dimensionalidade

As relações entre variáveis primárias e resposta pode estar relacionado ao compor-
tamento individual das variáveis, mas também a uma combinação conjunta de diferentes
fatores destas variáveis, tais como litotipo, mineralogia, reagentes químicos, etc. As técnicas
de fatorização permitem criar um novo conjunto de fatores, descorrelacionados entre si, que
podem ser analisados individualmente. Cada fator carrega uma representação das variáveis
originais em certa proporção. Técnicas geoestatísticas multivariadas por vezes utilizam a
fatorização e redução da dimensionalidade como alternativa para reduzir tempo de análise,
mantendo o mesmo nível de confiabilidade nas estimativas e simulações. Nas subseções
2.3.3.1 e 2.3.3.3 são demonstradas as técnicas PCA(Principal Component Analysis) e
SVD(Singular Value Decomposition) utilizadas para esta finalidade.
2.3.3.1 Análise de componentes principais
A principal ideia do PCA (Principal Component Analysis) é reduzir a dimensiona-

lidade do problema conservando o máximo de variabilidade possível (JOLLIFFE, 1986).
Fatores são criados retendo o máximo de variância possível das amostras. A figura 15
demonstra a descorrelação pelo PCA. Em (a), apresenta-se 50 dados correlacionados por
duas variáveis x1 , x2 . Em (b), demonstra-se a rotação realizada pelo PCA, em dois fatores
descorrelacionados Z1 e Z2 . Neste caso, o fator Z1 apresenta o máximo de dispersão possível
dos dados.
Página 66
Figura 14 – Exemplo de rotação proposta pela técncia do PCA. Em (a), observamos os

dados originais plotados para duas variáveis X1 e X2. Em (b), é realizada a
análise de componentes principais para estes dados (PCA), formando dois
fatores F1 e F2. Os fatores formados pela rotação do PCA em (b) conservam
o máximo de variância com os dados originais, em que o fator F1 recebe o
máximo de variância.
Fonte: Modificado de (JOLLIFFE, 1986)
Considerando a matriz de covariâncias como Σ, calculada a partir um conjunto de

dados igual a x, podemos determinar a combinação linear de x definido como ax, sendo a os
coeficientes lineares. Logo, a variância dessa combinação linear pode ser escrita como at Σa.
O problema de componentes principais significa maximizar a variância desta combinação
linear, tal que os vetores a sejam ortogonais, ou seja aat = 1. Utilizando a otimização por
Lagrange podemos obter:

at Σa − µ aat − 1 = 0 (2.16)
em que µ é o multiplicador lagrangiano para o problema de otimização. Os componentes

principais resultam em um problema de autovalores e autovetores tal qual:
(Σ − λI) a = 0 (2.17)
em que λ também é chamado de autovalor e a de autovetor do problema associado e I a

matriz de identidade. Apesar de ser uma técnica simples de fatorização, o PCA possui
restrições quanto à descorrelação para distâncias de separação diferentes de zero. Cada
autovetor do problema associado carrega uma proporção da variância dos dados, sendo
representados em ordem decrescente da maior participação da variância, para a menor
participação.
Página 67
A utilização do PCA permite auxiliar a classificação de grupos com respostas

geometalúrgicas similares. Montoya et al. (2011) demonstram diferentes classificações para
os primeiros dois fatores de variáveis geológicas para La Colosa, um depósito de ouro
porfirítico na Colômbia. A figura 15 demonstra um gráfico com a participação de cada
variável em cada grupo.
Figura 15 – Exemplo de aplicação da técnica de análise de componentes principais na

identificação de grupos geometalúrgicos. A esquerda é disposto o PCA para
diferentes tipos de variáveis, demonstrando o primeiro e o segundo fator. Neste
gráfico, são utilizadas técnicas para determinar agrupamentos para diferentes
classes, cada qual com uma cor diferente. À direita são representados gráficos
de caixa com cada uma das variáveis e as suas proporções em cada classe.
Fonte: (MONTOYA et al., 2011)
2.3.3.2 Fatores de máxima correlação
De acordo com Larsen (2002), a decomposição pelo MAF(Maximum Autocorrelation

Factor) procura a transformação que maximiza a autocorrelação para um vetor de separa-
ção maior que zero, em contrapartida da metodologia tradicional do PCA. Sendo Zuk uma
variável aleatória, no suporte u, para uma propriedade k. Uma combinação linear destas
variáveis pode ser considerada como wt Zuk em que w é um vetor multiplicativo, represen-
tando uma rotação dos dados. A correlação entre esta combinação linear é demonstrada
por Larsen (2002) como:
n o 1 wt γ(∆)k w
Corr wt Zuk , wt Zu+h
k
=1− = 1 − R(w) (2.18)
2 wt Σw
em que γ(∆) representa a matriz de variogramas experimentais diretos e cruzados para
uma determinada distância δ, Σ representa a matriz de covariância dos dados e R(w)
também é chamado de coeficiente de Rayleigh na teoria dos sinais. Para minimizar a
correlação da combinação linear entre as variáveis, é necessário maximizar o coeficiente
Página 68
R(w), maximizando a variância dos dados originais e reduzindo a variabilidade para uma
distância determinada. A técnica de MAF e PCA somente podem ser utilizadas para um
conjunto de dados isotópicos, aos quais é possível calcular a matriz de covariância entre as
variáveis geometalúrgicas.
2.3.3.3 t-Distributed Stochastic Neighbor Embendding (t-SNE)
A visualização de dados multivariados a partir de métodos como PCA e MAF realiza

transformações lineares dos dados. Para relações não lineares complexas, a utilização do
t-SNE permite melhores resultados. O objetivo do t-SNE é reduzir o espaço multivariado
em um menor, bidimensional ou tridimensional. A distância no espaço multivariado é
calculada a partir de distribuições Gaussianas, mantendo-se a mesma no espaço reduzido,
tal que nesta dimensão menor, a distância é computada por distribuições t-Student. O
algoritmo otimiza a diferença entre as matrizes de distância no espaço multivariado e no
espaço reduzido. Segundo Siameh (2017), a ferramenta t-SNE permite:
i Revelar a estrutura dos dados em diferentes escalas em uma mapa,
ii Revelar a presença de múltiplos agrupamentos,
iii Aumenta a dispersão dos dados reduzindo a chance de formar grupos no centro do
mapa,
Diferente de algumas técnicas como o PCA, que tendem a visualizar os dados

baseados no comportamento global dos mesmos, a técnica t-SNE permite verificar estruturas
locais com maior precisão. Segundo Siameh (2017), o t-SNE também possuem algumas
desvantagens:
(i) O algoritmo é computacionalmente caro e demora muitas vezes horas, enquanto o

PCA pode finalizar em segundos,
(ii) O espaço de visualização do t-SNE geralmente se delimita a duas ou três dimensões,
(iii) O algoritmo é aleatório, gerando padrões diferentes de acordo com uma semente
selecionada,
(iv) O t-SNE não preserva e estrutura global dos dados, pois deforma o espaço multi-
dimensional dos dados, para que pequenas distâncias sejam mais valorizadas, e a
formação de agrupamentos locais seja mais evidente.
Página 69
Segundo Maaten e Hinton (2008), a ideia principal do t-SNE é associar ao conceito

de distância, probabilidades a partir da medida de funções gaussianas. A probabilidade de
duas amostras separadas pj|i pode ser definida matematicamente por:
exp (− k xi − xj k2 /2σi2 )
pj|i = P 2
(2.19)
k6=j (− k xi − xk k /2σi )
2
onde σi representa a variância das distribuições gaussianas, e xi e xj dois valores amostrais

em que se pretende determinar a distância. Para uma componente dimensional y menor
que a dos dados, é possível mapear as probabilides destas distâncias segundo:
exp (− k yi − yj k2 )
qj|i = P (2.20)
k6=j (− k yi − yk k )
2
onde y representa a variável no novo espaço reduzido. A função de custo pode ser encontrada
a partir do critério de entropia para as duas distribuições dado por:
XX pj|i
C= pj|i log (2.21)
i j qj|i
Segundo Maaten e Hinton (2008), obtendo a minimizacão da função custo em relação

a variável de menor componente dimensional é possível encontrar a relação demonstrada
por:
δC X
= 2 (pj|i − qj|i + pi|j − qi|j )(yi − yj ) (2.22)
δyi j
desta forma, o t-SNE consegue obter um gráfico de distâncias em y mantendo a menor

entropia, ou separação, com as distâncias originais em x. A Figura 16 demonstra um
exemplo de aplicação da técnica. O t-SNE possui a capacidade de providenciar uma
visualização mais robusta de pequenos agrupamentos que podem ser formados nos dados.
Página 70
Figura 16 – Exemplo de aplicação da técnica de t-SNE em um banco de dados fictício. Os

dados multivariados são demonstrados em apenas duas dimensões, honrando a
menor diferença entre as variáveis para um kernel gaussiano. Grupos diferentes
podem ser observados com várias cores diferentes.
Fonte: (ARENILLAS, 2019)
2.3.4 Pré-processamento dos dados

O pré-processamento consiste na etapa de preparação, organização e estruturação
dos dados, de forma a maximizar a informação obtida nos modelos preditivos. Nesta etapa
é possível realizar transformações matemáticas, escolher variáveis que possuem maior
correlação com as classes preditoras e eliminar valores anômalos (denominados outliers).
O pré-processamento de dados é uma das etapas mais importantes para as técnicas de
aprendizado de máquinas, e possui grande impacto na métricas de classificação e regressão.
Segundo Kotsiantis et al. (2006), em problemas reais, o banco de dados pode
apresentar diversas propriedades, mas somente algumas podem possuir relação com a
classe preditora. Podem haver redundâncias, enquanto apenas uma pequena quantidade
destas variáveis inserem informações adequadas ao modelo preditivo. Kotsiantis et al. (2006)
também descrevem a importância da atenção para problemas não balanceados. Algumas
soluções incluem a duplicação dos dados de treinamento das classes mal representadas, ou
a remoção de classes de treinamento que sejam super amostradas. Nas subseções 2.3.4.1,
2.3.4.2 e 2.3.4.3, são apresentados alguns dos métodos de pré-processamento utilizados
nesta tese.
2.3.4.1 Normalização
O processo de normalização consiste em reduzir a escala das variáveis. Quando

variáveis representam grandezas físicas diferentes, é normal que seus valores máximos e
mínimos sejam discrepantes. Os métodos de normalização permitem reduzir estas diferenças,
permitindo a comparação entre estas variáveis. Diversos tipos de algoritmos são afetados
Página 71
pelo uso de dados em escalas diferentes, como redes neurais e k vizinhos mais próximos
(KOTSIANTIS et al., 2006). Os métodos tradicionais consistem na normalização de
mínimos e máximos e na normalização z-score. A normalização de mínimos e máximos
consiste em:
X − min(X)
X0 = (nmaxX − nminX ) + nminX (2.23)
max(X) − min(X)
em que X 0 é a variável transformada, X é a variável a ser transformada, max(X) é o

máximo da variável X, min(X) é o mínimo da variável X e nmaxX e nminX representam
respectivamente o novo valor máximo e mínimo que a variável pretende assumir. Na
transformação z-score, podemos obter:
X −X
X0 = (2.24)
s(X)
0
em que X é a variável transformada, X é a variável a ser transformada, X é o valor médio
de X, e s(X) o valor do desvio padrão de X.
2.3.4.2 Gaussianização
Um número grande de fenômenos na natureza seguem distribuições gaussianas.

Entre eles temos o tamanho e a pressão sanguínea do ser humano, a posição de uma partícula
em uma experiência de difusão, e medidas de erro (PARBHAKAR, 2019). Algumas vezes,
os dados apresentam valores que se assemelham à distribuição normal, porém como as
amostras são pequenas, a forma da distribuição pode estar alterada (BROWNLEE, 2019).
Na grande maioria das vezes, a transformação gaussiana dos dados ocorre simplesmente
por pura convenção matemática, pela facilidade da manipulação da distribuição gaussiana.
Segundo (GOOVAERTS, 1997), podemos obter o valor de uma variável gaussiana a partir
da transformação:
X 0 = G−1 (F (X)) (2.25)
em que G−1 corresponde a inversa da função de distribuição acumulada gaussiana e F (X)

corresponde a função de distribuição acumulada da variável aleatória X. Uma das formas
de transformação mais conhecidas consiste em comparar as distribuições acumuladas da
variável original em conjunto com a variável gaussiana, quantil a quantil. A figura 17
corresponde à transformação entre distribuições.
Página 72
Figura 17 – Procedimento gráfico para transformação da função de distribuição dos dados

0
originais x em valores de uma distribuição normal X . F e G representam,
respectivamente, as distribuições acumuladas da variável original X e da
0
variável transformada X .
Fonte: Modificado de (GOOVAERTS, 1997)
2.3.4.3 Codificação de variáveis categóricas
Variáveis categóricas são aquelas que apresentam instâncias sem explícita hierarquia.
Por exemplo, uma variável binária X = {0 homem0 ,0 mulher0 } poderia ser considerada
categórica, para predizer o número de livros que leem ao ano. Não existe uma justificativa,
a priori, para se considerar que homens ou mulheres leiam mais, ou menos. No entanto, para
o tempo de corridas em maratonas, é considerável dizer que homens possuem vantagens
(HUNTER; STEVENS, 2013) 2 . Desta forma a variável binária ’homem’, ’mulher’, neste
caso, é ordinal, podendo atribuir X = {0 homem0 = 0,0 mulher0 = 1}, correspondendo aos
homens um número menor, associado ao tempo menor de corrida em maratonas. Este
tipo de abordagem é importante nos algoritmos de aprendizado, pois muitos destes não
permitem o uso de variáveis textuais como valores de entrada nos modelos matemáticos.
Assumir valores numéricos indistintamente para as classes pode constituir em um erro de
avaliação, pois estes algoritmos podem ponderar uma classe em detrimento de outra a
partir da diferença numérica destes valores.
Nesta tese, foi utilizado a técnica de codificação baseada em objetivo (Target-based
Encoding). O objetivo da técnica é numerizar a variável categórica a partir da classe
de predição. Esta é substituída por um novo valor, correspondente à probabilidade da
categoria pertencer à classe de predição (MCGINNIS, 2016). A figura 18 representa o
processo de tranformação de uma variável categórica. Em (A), são apresentadas as variáveis,
a classe preditora e o valor carimbado para cada categoria. Em (B), é formada a tabela de
frequências, que computa a proporção de cada categoria segundo a classe preditora. Cada
categoria recebe portanto, um valor associado com a classe a ser predita.
2
"Men were faster than women for all the marathons for first place (10.9%) and across the first five
runners (11.6%)." Página 11
Página 73
Figura 18 – Exemplificação da codificação de variáveis categóricas a partir da técnica de

categorização baseada em objetivo.
Fonte: Próprio Autor
2.3.5 Aprendizado supervisionado

2.3.5.1 Modelos de função de base lineares
Os métodos lineares de classificação são aqueles que utilizam funções lineares para
a definição das regiões das classes contidas no problema. Um modelo linear simples envolve
uma combinação de uma série de variáveis segundo:
y(x, w) = w0 + w1 x1 + ... + wn xn (2.26)
onde wi são os pesos, xi é um valor da variável Xi e y(x, w) é a variável preditora. Segundo

Bishop (2006), uma extensão dos modelos lineares clássicos envolve a combinação de
funções não lineares também chamadas de funções de base (φj ). Neste caso, podemos
resumir os modelos segundo:
M
X −1
y(x, w) = w0 + wj φj (x) (2.27)
j=1
em que M é o número de parâmetros no problema. Segundo Bishop (2006), mesmo

assumindo valores não lineares para as funções (φj ) o modelo descrito para a equação 2.27
é chamado de linear pois constitui na combinação linear de funções. Uma das equações
mais utilizadas nas funções de base é a função logística:
x − µj

φj (x) = σ (2.28)
s
em que µj é o parâmetro de localização e s é o parâmetro de escala e σ é a função logística
Página 74
demonstrada por:
1
σ(a) = (2.29)
1 + exp(−a)
x−µj
em que a = s
2.3.5.2 Regressão Linear Simples
O caso mais simples da regressão linear é demonstrado por:
y = w 1 x1 + w 0 + (2.30)
tal que w1 é chamado de vetor de pesos, w0 é chamado de viés e é o erro associado ao

par conjugado y e x1 . A regressão linear simples assume como premissa que a variância
e a média do erro não dependem da variável x, tal que V ar(|x1 ) = σ 2 e E(|x1 ) = 0
(WASSERMAN, 2013).
Considerando o erro estimado, podemos encontrar os parâmetros da regressão
obtendo o mínimo erro quadrático pela equação:
min(ˆ2 ) = min (y − ŷ)2 = min (y − (ŵ0 + ŵ1 x1 ))2 (2.31)
onde 2 representa o erro médio quadrádico e y o vetor das classes. O sinal (ˆ) é atribuído
ao valor estimado de um parâmetro, a medida que ŵ0 e ŵ1 são os parâmetros a serem
determinados pela regressão a partir das amostras. Assumindo a hipótese de normalidade
tal que |x1 ∼ N (µ, σ 2 ), podemos determinar que a solução dos mínimos quadrados é
também um estimador de máxima verossimilhança para o problema da regressão linear
(WASSERMAN, 2013).
Para o caso multivariado, possuímos uma matriz Xi,j em que i é considerada a
amostra, ou realização, variando de 1 a n e j cada uma das variáveis consideradas
 
X X12 ... X1k
 11 
 X21 X22 ... X2k 
 
X=
 .. .. .. ..  (2.32)
 . . . . 

 
Xn1 Xn2 ... Xnk
Página 75
em que os pesos podem ser demonstrados por:
 
W
 1
 W2 
 
W = . 
 (2.33)
 .. 

 
Wn
e os erros podem ser demonstrados pela equação:
 

 1
 2 
 
=
 .. 
 (2.34)
.
 
n
logo, podemos escrever o sistema tal como demonstrado na equação:
Y = XW + (2.35)
Se assumirmos que os nxn valores da matriz X t X forem inversíveis, então é possível

determinar os pesos por
Ŵ = (X t X)−1 X t Y (2.36)
onde ˆ(W ) é o vetor de pesos, X as variáveis e Y as classes preditas. Esta identidade é

denominada de equação normal, encontrada na literatura na solução de sistemas lineares.
Os modelos de regressão lineares devem ser aplicados com cuidado nas classificações ou
regressões, pois são susceptíveis a valores extremos, alterando demasiadamente a superfície
de decisão. Uma alternativa para melhorar as superfícies de classificação, pelo uso de
modelos lineares, é utilizar o princípio de regularização alterando os pesos do modelo,
como no caso da ridge regression (BISHOP, 2006). 4
2.3.5.3 Funções discriminantes
Considere uma variável binária y(x,w) que assume valores iguais a 1 ou 0, tal que
1 corresponde ao valor contido dentro do domínio e 0 fora do domínio. O modelo linear
pode ser descrito como:
Y (X, w) = wt X + w0 (2.37)
4
"One technique that is often used to control the over-fitting phenomenon in such cases is that of
regularization...Techniques such as this are known in the statistics literature as shrinkage methods
because they reduce the value of the coefficients" - página 10
Página 76
em que w é chamado de vetor de pesos e w0 é chamado de viés. Segundo Bishop (2006), se

o valor de y(x1 ) = y(x2 ) = 0, define-se uma superfície de separação que divide os valores
que não pertencem nem a y(x1 ) e nem a y(x2 ). Para que essa relação seja verdadeira, a
seguinte relação deve existir:
wt x w0
=− (2.38)
||w|| ||w||
sendo o viés (w0 ) responsável pela determinação da localização do hiperplano de decisão.

Os modelos discriminantes podem assumir diferentes formas, respeitando essa condição
a priori. Fisher (1936) propõe separar as classes considerando a diferença entre que as
médias reais, e a maximização das dispersões das distribuições. Pretende-se, desta forma,
otimizar a diferença entre os centros de dispersão das classes e minimizar a variância
intra-classe. Fisher (1936) propõe a minimização da função:
w t Sb w
J(w) = (2.39)
wt Sw w
em que w é o vetor de pesos. Sb e Sw representam respectivamente as diferenças entre
centróides das classes e a diferença entre as dispersões das classes, e podem ser definidos
como:
Sb = (m1 − m2 )(m1 − m2 )t (2.40)
(xi − mj )(xi − mj )t
X X
Sw = (2.41)
j=1,2 i∈X
onde m1 e m2 representam as médias das classes j = 1 e j = 2, e xi representa uma

realização i da variável aleatória X. A figura 19 apresenta o modelo discriminante linear
para a separação entre duas classes azuis e vermelhas. O objetivo da análise discriminante
linear é determinar a projeção em que ocorra a menor sobreposição entre as diferentes
classes.
Página 77
Figura 19 – Exemplo da determinação da superfície linear discriminante. Em (a), temos

uma projeção qualquer. Em (b), temos uma projeção utilizando a função
discriminante linear. Note que em (b), temos a menor sobreposição entre as
distribuições da classe azul e vermelha, representando uma melhor classificação.
Fonte:(BISHOP, 2006)
2.3.5.4 Regressão logística
Os métodos de regressão linear produzem informações importantes quando a classe

estimada apresenta resultado reais. Para variáveis binárias, o modelo de regressão logística
é mais adequado. Apesar de denominado um método de regressão, a regressão logística é
um método de classificação. Assim como nos modelos discriminantes, a regressão logísitca
utiliza uma variável de Bernoulli, tal que Y(X,w) =wT X= 0 ou 1. No entanto, esta
estipula valores de probabilidade para as classes considerando transformações não-lineares.
Considere a probabilidade da variável assumir valor 1 igual a πi , e a probabilidade de
assumir valor 0 de 1 − πi , logo a probabilidade de classificação pode ser determinada pela
função logística como:
1
πi = (2.42)
1 + e−yi
em que yi é o valor atribuído da classe. Logo, a probabilidade condicional P r(y(x, w)|πi ) =
πiyi (1 − πi )1−yi demonstra a probabilidade associada para um valor de uma classe y. King
e Zeng (2001) demonstram como obter os parâmetros wi a partir da otimização da função
de máxima verossimilhança. A equação 2.43 demonstra a função logarítmica da função de
máxima verossimilhança para a regressão logística.
n n n
ln 1 + e(1−2Yi )xi wi
X X X
ln(L(w|y)) = ln(πi ) + ln(1 − πi ) = (2.43)
i=1 i=1 i=1
em que xi o valor da variável, wi o valor do peso gerado pela combinação linear e Yi o

valor da classe binária Yi ∈ 0, 1. A figura 20 representa a regressão logística a partir da
Página 78
função logística e de classes representadas por círculos e triângulos.
Figura 20 – Exemplo da regressão logística. Curva negra representada pela função logit.
A linha verde indica 50% de probabilidade para separação das classes 1 ou
0. Triângulos azuis representam a classe 0, e círculos laranjas representam
a classe 1. Eixo horizontal representa os valores das variáveis e eixo vertical
representa as probabilidades.
Fonte:Próprio autor
2.3.5.5 Máquinas de vetores de suporte
As máquinas de vetores suportados (SVM - Supported Vector Machine) são algorit-

mos de aprendizado de máquinas supervisionado. O objetivo é identificar o hiperplano
que melhor divide as categorias. Diferentemente do método discriminante linear, que
pretende determinar a melhor projeção que divida a sobreposição dos grupos, o método
SVM determina o hiperplano que reduz a margem entre classes. A figura 21 demonstra
a máquina de vetores suportados para duas classes. Esta margem é definida por uma
distância (d), entre duas amostras x1 e x2 , de diferentes classes, que estão mais próximas
entre si. Define-se a superfície de separação por wx + b = 0 , pelo hiperplano que divide
ao meio as amostras mais próximas da classe 1 e da classe 2.
Figura 21 – Minimização entre duas classes x1 e x2 pelo método do máquinas de vetores

suportados. d é a distância entre o ponto mais próximo da classe x1 e da
classe x2 e H1 e H2 os hiperplanos que dividem as classes contidas em x1 e
x2 . A reta wx + b = 0 representa o hiperplano com menor margem possível.
Fonte:(LORENA; CARVALHO, 2007)
Página 79
Em alguns casos utiliza-se uma função kernel para encontrar classificações não
lineares. O objetivo é alterar o espaço original, transformando o problema em uma
classificação linear. Funções kernels são transformações não lineares realizadas por funções
ortogonais, comumente utilizadas nos algoritmos de aprendizado de máquinas. Segundo
Lorena e Carvalho (2007), define-se um kernel por uma função que recebe dois pontos
xi e xj , do espaço de entradas e computa o produto escalar destes dados no espaço de
características (Φ). A figura 22 exemplifica esta situação.
Figura 22 – Utilização de kernels para a transformação do espaço original dos dados.

O modelo de classificação linear pode ser aplicado no espaço modificado
procurando a mínima distância entre a margem das duas classes. À esquerda
está representado o espaço de entrada das variáveis. À direita é representado
o espaço transformado a partir de um kernel.
Fonte:(HEARST et al., 1998)
2.3.5.6 Redes neurais
A seção 2.3.5.1 também refere aos modelos lineares como uma combinação linear de
funções não lineares. O objetivo das redes neurais é formar um conjunto de combinações
lineares "ativadas", por funções não lineares, em uma cadeia que resulte na predição
de uma classe. O sistema é comparado ao funcionamento de um neurônio, tal como os
impulsos elétricos que atravessam um neurônio precisam de uma ”ativação” por um limite
de potencial elétrico. De acordo com Bishop (2006), um sistema de redes neurais pode ser
descrito como:
 
M
X
y(x, w) = f  w j xj  (2.44)
j=1
em que x representa o vetor de dados, w os respectivos pesos associados a esta combinação

linear e f(.) pode ser descrita como a função ativadora. Tal modelo foi inicialmente chamado
de perceptron e ocupa um papel importante nos algoritmos de aprendizado. Segundo Bishop
(2006), existem diversas formas de construir as redes neurais, seja pela combinação linear
das variáveis originais, seja por realizar diferentes ativações e por formas diferentes de
associar os valores ativados. Os nós dos elementos não ligados aos dados originais são
chamados de hidden units, ou unidades escondidas. A figura 23 apresenta um exemplo de
Página 80
redes neurais para classificação, em que à esquerda ocorrem as variáveis de entrada, ao

meio as unidades escondidas, e à direita os resultados de saída do modelo.
Figura 23 – Exemplo de redes neurais. Valores de input dos dados à esquerda e valores de
output à direita. Unidades escondidas demonstradas como as variáveis z não
diretamente ligadas às variáveis originais.
Fonte:(BISHOP, 2006)
O problema de redes neurais utilizando múltiplas camadas, ou unidade escondidas,

é conhecido como multiperceptron. As redes neurais são utilizadas em deep learning e
inteligência artifical, mas constituem modelos de difícil calibração.
2.3.5.7 k vizinhos mais próximos
O algoritmo de vizinhos mais próximos é um algoritmo supervisionado que determina

a classificação ou regressão a partir da distância euclidiana entre amostras. A figura 24
apresenta intuitivamente o princípio do algoritmo. Cada ponto representado pela estrela é
um valor a ser predito, enquanto os círculos e triângulos representam as classes originais.
A classe atribuída para as estrelas são o valor mais próximo dos dados originais.
Página 81
Figura 24 – Exemplo da utilização de vizinhos mais próximos para a classificação de

pontos simbolizados por estrelas, com dados de treinamento simbolizados
como círculos e triângulos. Os valores estimados nos pontos correspondem aos
dados originais mais próximos.
Fonte:(MÜLLER et al., 2016)
O algoritmo de k vizinhos mais próximos determina os valores das classes de acordo

com a proporção dos k valores mais próximos. A figura 25 apresenta o algoritmo. Os pontos
em estrela recebem uma classe, a partir dos dados originais, se possuir maior proporção
entre os valores mais próximos.
Figura 25 – Exemplo da utilização de k vizinhos mais próximos para a classificação de

pontos simbolizados por estrelas com dados de treinamento simbolizados como
círculos e triângulos. Os valores estimados nos pontos correspondem a maior
proporção dos k valores mais próximos.
Müller et al. (2016) demonstram como o número de vizinhos mais próximos interfere
na superfície de classificação. A figura 26 apresenta a superfície de decisão de acordo com
o número de vizinhos mais próximos. Um aumento do número de vizinhos tende a produzir
superfícies mais suavizadas evitando overfitting.
Página 82
Figura 26 – Demonstração da influência do número de vizinhos mais próximos na superfície

de decisão entre duas classes azul e vermelha. (a) Utilização de apenas um
vizinho mais próximo, (b) Utilização de três vizinhos mais próximos, (c)
Utilização de nove vizinhos mais próximos.
2.3.5.8 Florestas aleatórias
O algoritmo de floresta aleatória baseia-se em árvores de decisão. Uma árvore

de decisão é uma estrutura binária que segmenta em partes o banco de dados, a partir
de critérios de ganho de informação e entropia. Esta árvore divide os dados usando um
hiperplano, com o máximo de informação para cada classe. Müller et al. (2016) demonstram
o funcionamento de árvores de decisão, de acordo com o máximo de informação. A figura
27 apresenta o processo em dois níveis. O algoritmo seleciona k árvores n atributos para
definir a árvores de decisão, enquanto a combinação dos resultados dessas árvores decidirá
o resultado final da floresta.
Figura 27 – Exemplo da aplicação do florestas aleatórias. (a) À esquerda podemos ver a

superfície de decisão para a primeira árvore de decisão dividindo o espaço
em duas regiões. À direita podemos observar uma representação gráfica da
árvore, considerando a divisão entre variáveis. (b) À esquerda podemos notar
o segundo nível da árvore. À direita é representado o novo nível adicionado
na árvore.
Segundo Breiman (1996), a divisão entre os ramos das árvores de decisão é realizado
escolhendo um critério de otimização utilizando funções que meçam o máximo espalhamento
Página 83
dos dados tal como a função de Gini ou a função entropia.
2.3.6 Aprendizado não supervisionado

2.3.6.1 Multi dimensional scaling - MDS
A técnica MDS consiste em determinar distâncias relativas entre variáveis. Segundo

Cox e Cox (2000), a técnica multi dimensional scaling representa a procura de uma
dimensão inferior, usualmente euclidiana, ao qual cada realização mantenha a distância
entre as variáveis (drs ) mais próximas das dissimilaridades originais dos dados (φrs ). Um
exemplo clássico ilustra a técnica a partir da distância entre cidades em um mapa. O mapa
gerado não apresenta localização fixa, porém todas as distâncias relativas entre amostras
são mantidas constantes. O MDS é livre para rotação, mas a escala entre distâncias se
mantém constante. A figura 29 representa o gráfico MDS a partir da distância euclidiana
entre cidades.
Figura 28 – Gráfico representando distâncias entre cidades da Inglaterra. Cada nó, no

gráfico, representa uma cidade, enquanto as distâncias entre nós são mantidas
independente da rotação produzida.
Fonte:(COX; COX, 2000)
Cox e Cox (2000) apresentam diversas métricas para medir dissimilaridade entre
variáveis. A Figura 29 apresenta algumas dessas medidas, tal que a distância euclidiana é
a mais usual.
Página 84
Figura 29 – Diferentes tipos de métricas para medida de similaridade e dissimilaridade

entre as variáveis no gráfico MDS, xr e xs são duas observações distintas aos
quais se deseja medir a distância. Σ é a matriz de correlação entre as variáveis,
p é o número total de pares de amostras e x̄ é o valor médio da amostra
selecionada.
Fonte:(COX; COX, 2000)
2.3.6.2 Agrupamento hierárquico
Segundo Jain et al. (1999), o agrupamento hierárquico consiste em determinar

grupos pela menor distância entre amostras. O agrupamento hierárquico permite formar
um dendograma, demonstrando graficamente a relação destas distâncias. Um dendo-
Página 85
grama apresenta diferentes níveis, permitindo formar diferentes agrupamentos. A figura 30

demonstra o agrupamento em três grupos utilizando a técnica para sete dados diferentes.
Figura 30 – Utilização do agrupamento hierárquico para definição de grupos. Em (a) é

possível notar três grupos diferentes de acordo com as variáveis X1 e X2 . Em
(b) notamos o dendograma em que a linha pontilhada representa a divisão
entre estes grupos.
Fonte:(JAIN et al., 1999)
Segundo Jain et al. (1999) muitos dos algoritmos de agrupamento hierárquico são
derivados das variantes single-link e complete-link. Esses dois algoritmos se diferem na
forma de caracterizar a similaridade entre grupos. No primeiro método, a distância entre
dois grupos é a distância mínima entre todas as amostras entre grupos, enquanto no
segundo método a distância entre dois grupos é o máximo de todas as distâncias par a par.
Página 86
2.3.7 Aplicações modernas do aprendizado de máquinas em beneficiamento

mineral e engenharia de minas
A utilização de técnicas de aprendizado de máquinas no beneficiamento mineral
é uma tendência atual. O imageamento das partículas minerais e da análise da textura
mineral, tamanho e forma dos grãos pode ser automatizado a partir de técnicas como
máquinas de vetores de suportes e redes neurais. Shu et al. (2018) demonstram a deter-
minação do grau de classificação do tamanho de partículas minerais a partir do uso de
imagens. Segundo os autores, o processo poder ser determinado a partir da segmentação
das imagens, de forma a separar as características dos grãos minerais. Isto produzirá uma
imagem de contraste ao qual podem ser verificadas as diferenças de tamanhos dos grãos.
Estes valores são atribuídos a um nível de classificação, constituindo o rótulo do problema
supervisionado. A figura 31 demonstra o fluxograma do processo realizado pelos autores.
Figura 31 – Fluxograma utilizado por Shu et al. (2018) para determinar classificação do
tamanho de partículas minerais.
Fonte:(SHU et al., 2018)
Maitre et al. (2019) demonstram a importância da contagem e a identificação de

grãos minerais individuais em estudos de engenharia, meio ambiente, exploração mineral,
processamento e geometalurgia. Na maioria dos trabalhos, a identificação dos grãos é
realizada a partir de microscópio óptico em um procedimento oneroso e tedioso. Maitre
et al. (2019) apresentam um procedimento automático de reconhecimento das imagens
de microscópio, utilizando técnicas de aprendizado de máquinas, como as redes neurais
convolucionais. A figura 32 apresenta a classificação das partículas minerais de acordo com
o procedimento automático adotado por Maitre et al. (2019).
Página 87
Figura 32 – Classificação de partículas minerais automática obtida por Maitre et al. (2019).
Em (A) observa-se a segmentação dos grãos e em (B) a classificação das
diferentes partículas minerais.
Fonte:(MAITRE et al., 2019)
Algumas aplicações envolvendo pesquisa mineral utilizam o aprendizado de máqui-

nas para determinação de áreas de anomalias geoquímicas. Zuo e Xiong (2018) apresenta a
classificação de anomalias geoquímicas a partir de 39 variáveis de uma região ao sudeste da
província de Fujian na China, relacionadas a um tipo de sknarn polimetálico na região. A
figura 33 demonstra as anomalias geoquímicas determinadas pelo algoritmo de aprendizado
automático determinado por Zuo e Xiong (2018).
Figura 33 – Anomalias geoquímicas encontradas por 39 elementos utilizando aprendizado

automático.
Fonte:(ZUO; XIONG, 2018)
Página 88
2.4 Fundamentos do ore sorting e da transmissão de raios x

As imagens de raio x são medidas indiretas da densidade do material. A figura 34
(a) apresenta regiões de alta e baixa densidade em um corpo humano. Como os ossos são
mais densos que o resto do corpo, a passagem de radiação é atenuada diferencialmente, e
padrões claros são produzidos nos locais de maior absorção (LIMA et al., 2009). O mesmo
acontece em uma partícula mineral quando atravessada pelos raios x (figura 34 (b)). A
identificação de padrões de alta densidade e baixa densidade auxilia na identificação e
classificação mineralógica.
Figura 34 – Imagens de raio x. (a) radiografia de um peitoral humano. Os ossos como

são mais densos que o material a sua volta, como músculos e gordura, estes
obstruem a passagem dos raios x. (b) partícula mineral atravessada pelo raio
x, diferenças composicionais produzem transmitividade diferente ao longo
da partícula mineral. Pixels escuros representam valores de baixa densidade,
enquanto pixels claros representam alta densidade.
Duas propriedades principais dos materiais influenciam na transmissividade do raio

x: a espessura do material, e a densidade. Quanto maior a espessura do material, maior é
a probabilidade de uma partícula de raio x emitida interagir com átomos do fragmento
mineral. Quanto maior a densidade, maior o empacotamento cristalográfico, e maior a
chance de interação com o raio x. A figura 35 apresenta a relação da espessura com a
transmissão do raio x. Em (a), temos uma maior atenuação da partícula pela passagem do
raio incidente, enquanto em (b) temos uma menor atenuação.
Página 89
Figura 35 – Transmissão em partículas de acordo com a sua espessura. I0 representa a

intensidade da radiação emitida, enquanto I1 representa a intensidade da radi-
ação transpassada. Setas maiores indicam maior intensidade , enquanto setas
menores representam menor intensidade. (A) partícula grossa (B) partícula
fina.
A composição relativa da partícula afeta a transmissão do raio x diferencialmente,

pois proporções mais densas atenuam mais a passagem da radiação do que regiões menos
densas, para uma mesma dimensão de partícula. A presença de ouro livre é um bloqueador
da transmissão do raio x, pois os elementos metálicos apresentam uma camada de elétrons
livres na superfície, que permitem a interação com as partículas dos raios x emitidos.
A figura 36 mostra dois fragmentos minerais de mesmo tamanho, mas de densidade
diferentes. Na figura 36 (b), a presença de diferenças composicionais atenuam a radiação
diferencialmente.
Figura 36 – Transmissão em partículas de acordo com a sua densidade. I0 representa a

intensidade de radiação emitida, enquanto I1 representa a intensidade de
radiação transpassada. O tamanho das setas demonstra a intensidade de
radiação. Os pontos circulados representam regiões de menor densidade na
partícula. (A) partícula homogênea (B) partícula mista
Página 90
Para determinar se um material é de interesse a partir da densidade, o efeito do

tamanho do fragmento deve ser minimizado. A seção 2.4.1 demonstra os princípios da
transmitividade do raio x, e os processos para caracterização da densidade de partículas
minerais.
2.4.1 Fundamentos da transmissividade por raio x

A utilização de sensores de trasmissão de raio x nos equipamentos do ore sorting
identifica os raios x transpassados pelas partículas minerais. Parte da energia é absorvida
e parte é refletida, de acordo com a dimensão da partícula e pela densidade. Apenas uma
parte é registrada pelos sensores.
A equação de Lambert caracteriza o fundamento físico de transmissão dos raio
x ao longo da partícula mineral. Strydom (2011) expressa a separação de carvão de
torbanita explicitando o formalismo físico da equação de Lambert em sensores duais.
Matematicamente, a relação pode ser expressa como:
Idet = I0 e−µ(λ)ρd (2.45)
em que Idet representa os raios detectados pelo equipamento, I0 representa os raios emitidos,
µ(λ) representa o coeficiente de absorção de massa dependente da frequência da onda
emitida, ρ a densidade do material e d a espessura da partícula de minério.
A equação de Lambert representa o processo físico de atenuação dos raios x quando
atravessados por um material de determinada composição. No processo ao qual os elétrons
emitidos pelo raio x transpassam a partícula mineral, as partículas emitidas interagem com
os átomos, causando efeitos de espalhamento clássico, efeito foto-elétrico e efeito Compton
(SOARES et al., 2006).
A figura 37 demonstra esquematicamente a equação de Lambert: um raio emitido
pela fonte radioativa atravessa a partícula mineral, com certa espessura, e é atenuado de
acordo com as propriedades desta partícula. O raio atenuado é então identificado pelo
sensor.
Página 91
Figura 37 – Figura demonstrativa da equação de lambert.Idet representa os raios detectados

pelo equipamento, I0 representa os raios emitidos, µ(λ) representa o coeficiente
de absorção de massa, dependente da frequência da onda emitida e d a
espessura da partícula de minério. Os raios emitidos pela fonte de raio x são
atenuados pela partícula mineral e detectados em seguida pelo sensor.
Fonte:Próprio autor
Analisando a equação de Lambert, concluí-se que o aumento da espessura da

partícula reduz a intensidade do raio detectado, tal como o aumento da densidade do
material. Minerais com alta densidade podem ser identificados como padrões escuros na
imagem, considerando espessuras semelhantes. Além disso, o coeficiente de absorção de
massa é uma medida que considera os elementos químicos da partícula, logo a intensidade
do raio detectado é uma medida tanto da organização espacial dos elementos químicos
como de sua constituição.
Strydom (2011) atribui à Jong (2006) a aplicação da equação de Lambert na
detecção de diferentes tipos de materiais. Pode-se deduzir a relação entre as intensidades
dos dois canais de energia como:
I1
= (e−ρ∆µ )d = Cm
d
(2.46)
I2
em que d é a espessura da partícula mineral, ∆µ é a variação do coeficiente de absorção
Página 92
para os dois canais, ρ é a densidade da partícula e Cm é uma constante dependente da

constituição do material. A relação entre os canais de energia pode ser expressa em função
da constituição do material e da espessura, denominada de curva de densidade.
A figura 38 representa uma curva de densidade para a separação de materiais de
acordo com a equação 2.46. Ela representa um limite entre duas regiões, de baixa e alta
densidade, de acordo com a intensidade detectada nos canais de energia fraco e forte. Duas
regiões limítrofes são representadas por uma região "Dark", como alta concentração de píxeis
escuros, e uma região "Background"com píxeis muito claros, geralmente representando o
fundo da imagem da partícula.
Figura 38 – Em (a) e em (b): Imagens de raio x geradas para alta e baixa frequência. Cada
pixel em cinza representa a transmissão de dois canais para o raio x. Em (c)
cada pixel cinza representa os pixels das imagens de (a) e (b). Esses pontos
estão dispersos envolta de uma curva de calibração contínua negra, para o
mineral de interesse. A decisão se o pixel apresenta valores de alta e baixa
densidade é determinado a partir da comparação com a curva de calibração.
Cada pixel, para as imagens de alta e baixa frequência, podem ser representado
como um par conjugado na equação 2.46. Na figura 38, (a) e (b) representam as imagens
para os canais de alta energia e baixa energia. Estes valores representam um par conjugado,
para cada pixel, se o seu valor está abaixo ou acima da curva de densidade, demonstrada
na figura 38. Como a curva de densidade é uma função dependente do tamanho das
partículas, a relação entre os píxeis e a curva, apresenta apenas o efeito da densidade.
Esta propriedade é importante, pois píxeis contendo alta densidade e pequena espessura,
contendo por exemplo, altas quantidades de ouro, podem ser equivalentes a píxeis com
baixa densidade e grande espessura, contendo pouco ouro, se desconsiderado o efeito do
tamanho da partícula mineral.
Página 93
Consequentemente, píxeis que estão abaixo da curva podem ser considerados de

baixa densidade, enquanto os píxeis acima da curva podem ser considerados de alta
densidade.
A comparação entre os píxeis de alta e baixa densidade formam cinco regiões de
classificação, de acordo com a figura 39. Esse processo é chamado de "simulação", diferente
dos processos de simulação estatísticos que utilizam Monte Carlo. Nesta etapa, definem-se
indicadores para pares conjugados de alta e baixa energia, de acordo com sua posição
relativa com a curva de calibração.
Figura 39 – Representação da simulação na transmissão de dois canais. Eixo x considerando

os valores da imagem de raio x baixa intensidade e y considerando os valores
da imagem de raio x de alta densidade. Cinco regiões definidas de acordo com
a posição relativa da curva de densidade: regiões de alta densidade, média
densidade, baixa densidade, região escura e fundo da partícula mineral.
A região de média densidade é definida pela região entre as bandas e a curva

de calibração. Os valores de alta densidade são aqueles que se situam acima da banda
superior, e os valores de baixa densidade são definidos como aqueles que estão abaixo
da banda inferior. Além disso, define-se uma região escura, ao qual os pixels apresentam
alta densidade, ou a partícula possua grande espessura. A região do fundo da imagem,
representa as bordas da imagem da partícula, ao qual não ocorreu a interceptação do raio
pela partícula mineral.
A equação de Lambert é referência quando o material analisado é homogêneo. No
entanto, partículas de minério são formadas por diferentes tipos de minerais, com numerosos
coeficientes de absorção e densidades. A constante Cm , que depende apenas da constituição
Página 94
do material varia, desta forma, significativamente. A alternativa consiste em tomar várias

imagens das partículas de minério e traçar múltiplas curvas de calibração. Neste trabalho,
define-se uma curva de densidade, a partir do percentual que é apresentado de píxeis
abaixo dela. Uma curva de densidade de 60%, por exemplo, constitui em aproximadamente
60% dos píxeis abaixo desta curva. A representação da criação de uma curva de densidade
pode ser demonstrado na figura 40
Figura 40 – Representação da curva de densidade de 60% de acordo com a proporção

de pares conjugados abaixo da curva de densidade. (a) Representação de
diferentes imagens tomadas de várias partículas minerais, para os canais de
alta e baixa intensidade. (b) representação de uma curva de densidade de
60%. Triângulos representando pares conjugados abaixo da cruva. Quadrados
representando valores acima da curva de calibração.
As partículas minerais podem ser mapeadas de acordo com técnicas diferentes de

raio x. A grande vantagem da técnica de dois canais é sua capacidade de filtrar o efeito do
tamanho das partículas minerais, em contrapartida da técnica de um canal. A Figura 41
demonstra em (a) a imagem obtida pelo raio x nos grãos, em (b) pela simulação utilizando
as técnicas de dois canais e em (c) a simulação utilizando as técnicas de um canal. Ao
simular imagens de raio x utilizando as técnicas de um canal, apenas contrastes claros e
escuros são apresentados, diferentemente da utilização de vários canais.
Página 95
Figura 41 – Imagem dos grãos a partir de simulações do raio x. Em (a) observamos

a imagem do raio x de uma partícula mineral. Em (b) a sua respectiva
claros a densidade média e azul escuro representando alta densidade. Em (c)
observamos a simulação de um canal, apresentando contrastes escuros e claros
2.4.2 Benefícios e restrições do uso do ore sorting

Segundo Gülcan e Gülsoy (2017), a utilização de equipamentos de ore sorting
propiciam diversas vantagens para o beneficiamento de minerais:
i Redução do consumo de energia,
ii Aumento da eficiência no aproveitamento dos recursos minerais,
iii Redução do consumo de água no processo,
iv Redução do impacto ambiental,
v Aumento da qualidade do concentrado final,
O ore sorting possui algumas restrições operacionais:
i Volume de material processado pequeno, a alimentação é entorno de 25-300 t/h

(WILLS; FINCH, 2015),
ii A qualidade dos sensores escolhidos pode não ser adequada para diferenciar fases
minerais muito finas, devido à resolução das imagens obtidas pelo equipamento,
iii Existem limites da granulometria do material da alimentação (5-25 mm para 25 t/h

e 80-300 mm para 300 t/h, para o atual estado da arte) (WILLS; FINCH, 2015),
Página 96
Gülcan e Gülsoy (2017) demonstram a performance do ore sorting utilizando

equipamentos de laser óptico na divisão de fases minerais de cobre, ouro, hematita,
magnesita e quartzo. Os autores relatam, que diferenças discrepantes nos padrões de cor,
podem influenciar na classificação dos minerais. O mesmo pode ser estendido para o caso
das análises com raio x. Materiais que apresentam variabilidade composicional alta e
densidades diferentes dentro da mesma partícula podem ser difíceis de separar.
Além disso, o ore sorting possui restrições quanto a granulometria da alimentação,
e está condicionado pelo tamanho de liberação das fases minerais de interesse.
Ketelhodt e Bergmann (2010) demonstram a eficácia de sensores dois canais na
separação de carvão. Knapp et al. (2014) relatam que aplicações em minerais como
wolframita, cromita e diamantes são práticas recorrentes no uso do ore sorting. Tais
minerais possuem propriedades diferenciadoras características e menor heterogeneidade,
que auxiliam na classificação das partículas minerais.
Página 97
3 Apresentação do problema
3.1 Apresentação geográfica do problema

Neta tese são abordados problemas relacionados a depósitos de ouro do quadrilátero
ferrífero, aos quais os dados e informações foram diretamente fornecidos pela Anglo Gold
Ashanti .R Neste aspecto, duas regiões principais são abordadas neste tese, considerando o
beneficiamento de ouro para depósitos geograficamente próximos. A figura 42 representa o

mapa de localização para os depósitos minerais. Nas minas do Córrego do Sítio 42 (4) e (5),
será realizado um trabalho de classificação, a partir das leituras obtidas no equipamento
ore sorting, enquanto nas minas de Cuiabá e Lamego, (1) e (2), serão realizados trabalhos
de regressão com dados do beneficiamento mineral.
Figura 42 – Mapa de localização das minas da Anglo Gold Ashanti, MG, Brasil. Em (1) e
(2), é representado o complexo de Cuiabá e Lamego, aos quais são tratados
os problemas de estimativa de variáveis geometalúrgicas. Em (4) e (5), é
representado Córrego do Sítio, onde é abordado o problema do ore sorting.
Fonte:(ASHANTI, 2016)
3.2 Contexto geológico

O quadrilátero ferrífero é uma região que cobre em torno de 700 km2 na parte
sul do Cráton São Francisco, na região sudeste do Brasil e na região centro sul do
estado de Minas Gerais, apresentando estratigrafia e aspectos estruturais que guarnecem a
formação dos principais depósitos de ouro da região (BALTAZAR; ZUCCHETTI, 2007). O
quadrilátero ferrífero aborda: (1) Terrenos granito-gnaisse do Arqueano ao Proterozoico, (2)
Greenstone belts do Arqueano e (3) Sequências supracustrais do Proterozoico (BALTAZAR;
CAPÍTULO 3. APRESENTAÇÃO DO PROBLEMA
ZUCCHETTI, 2007). A figura 43 apresenta um mapa geológico regional do quadrilátero

ferrífero.
Figura 43 – Mapa regional da região sul do Cráton São Francisco.

Fonte:(BALTAZAR; ZUCCHETTI, 2007)
Os depósitos de ouro, aqui estudados, apresentam características metalogenéticas

distintas, demonstrando controle geológico estrutural. A forma e a evolução tectônica destes
depósitos, datados do arqueano, definem o padrão geométrico do depósito. Segundo Bierlein
et al. (2006), grandes depósitos de ouro com volumes acima de 500 t do tipo orogênico são
determinados em períodos de crescimento de margens continentais, principalmente, durante
o final do arqueano, paleoproterozóico e fanerozóico. Os autores se baseiam principalmente
que os corpos minerais e a textura do minério estão associados com eventos hidrotermais,
com a precipitação do ouro e alteração dos minerais. O Quadrilátero Ferrífero é uma das
regiões do Brasil de maior importância para a produção de ouro, documentadas desde o
século 18 e 19 (VIAL et al., 2007a) . A mina de Morro Velho, por exemplo iniciou sua
produção em 1834, quando a mineração São João Del Rei começou a operar na área (VIAL
Página 100
et al., 2007b) 1 . O Quadrilátero Ferrífero é localizado no sul do Cráton São Francisco

e foi subdividido por Dorr (1957) em três grandes domínios (i) complexos arqueanos
granito-gnaissicos mais velhos que 2.9 Ga (ii) supergrupo Rio das Velhas, um greenstone
belt datado entre 3.0-2.7 Ga e (iii) o supergrupo Minas do proterozóico, o grupo Itacolomi
e o supergrupo Espinhaço. A figura 44 demonstra a localização da mina de Lamego por
uma caixa preta e também de Córrego do Sítio (Cds) a leste no mapa.
Figura 44 – Mapa simplificado da geologia-estrutura da região do Quadrilátero Ferrífero

demonstrando a localização do depósito de Lamego e CDS.
Fonte:(MARTINS et al., 2016)
Os terrenos granito-gnáissicos são compostos de rochas tonalito-trondjhemita-

granodiorito (TTG). Estas consistem em domínios de domos de granito-gnaisse associadas
com intercalações de anfibolitos e rochas metasedimentares, aos quais são intrudidas por
tonalitos, andesitos, granitos, pegmatitos e diques máficos do proterozóico, com posterior
metamorfização(NOCE et al., 2007).
1
"Gold was first recovered at Morro Velho by Domingos da Fonseca Leme in 1700, and the deposit has
supported continuous mining since 1834, when the St. John D‘EL Rey Mining Co. began mechanized
operations in the area". Página 512
Página 101
O greenstone belt arqueano do Rio das Velhas cobre aproximadamente 4000 km2
no Quadrilátero Ferrífero e é dividido nos grupos de base de Nova Lima e Maquiné. O
grupo de Nova Lima compreende rochas ultramáficas, gralvacas e arenitos com rochas
quartzo-dolomito e quartzo-ankerita, conglomerados e pelitos carbonáceos. O grupo de
Nova Lima apresenta um grande número de depósitos de ouro incluindo Lamego. O grupo
Maquiné é dividido nas formações basal Palmital e topo Casa Forte (MARTINS et al.,
2016). A sequência do greenstone belt foi em sua maioria metamorfizada na fácies xisto
verde. A figura 45 demonstra a estratigrafia simplificada do depósito de Lamego.
Figura 45 – Estratigrafia esquemática do depósito de Lamego baseado em mapeamento

geológico.
Fonte:(MARTINS et al., 2016)
Baltazar e Zucchetti (2007) subdividem o supergrupo do Rio das Velhas de baixo

para cima, em sete associações de litofacies. Para o grupo de Nova Lima, temos: (i) vulcânico
máfico-ultramáfico (ii) vulcânico-químico (iii) clástico-químico (iv) volcanoclástico e (v)
associações sedimentares. Para o grupo Maquiné, temos: (vi) costal (vi) associações não
marinhas indicadas. Estas foram desenvolvidas durante ciclos sedimentares formados há
2.8 e 2.6 Ga.
Página 102
3.3 O depósito mineral de Lamego

Segundo Martins et al. (2016), a exploração no depósito mineral de Lamego iniciou-
se entre 1985 a 1990 com a identificação de diversas zonas mineralizadas encaixadas em
metachert e BIFs (Banded Iron Formations). Três áreas promissoras foram nomeadas como
Arco das Velha, Queimada e Cabeça de Pedra. Em 2001 uma nova campanha de sondagem
definiu o domínio de Carruagem, produzindo resultados positivos na exploração do ouro.
Somente em 2009 o projeto de Lamego foi finalizado em uma mina com utilização prevista
até 2016.
3.4 O depósito mineral de Cuiabá

O depósito mineral Cuiabá é um dos maiores depósitos com BIF encaixantes no
Quadrilátero Ferrífero e é uma das operações de mina subterrânea mais importantes no
Brasil. Segundo Lobato et al. (2001), as associações vulcanoclásticas e vulcano-químicas,
no grupo Nova Lima, hospedam o depósito de Cuiabá. Os BIFs contendo ouro variam de
6 a 15 m de espessura em rochas vulcânicas máficas com intercalações sedimentares, e
acima contendo também rochas máficas, vulcanoclásticas e rochas sedimentares. A lapa é
constituída de uma sucessão de rochas sedimentares acompanhadas de bandas de xisto
carbonáceo e intercaladas com pelito.
3.5 O depósito Córrego do Sítio

O depósito de Córrego do Síto está situado 35 km de Santa Bárbara. Segundo
Lobato et al. (2001), as rochas encaixantes do depósito são xistos carbonáceos e micáceos
e filitos, também pertencentes ao grupo Nova Lima, porém com a estratigrafia invertida.
Eles exibem intercalações com quartzo e xisto vulcanoclástico, clorita xisto aos quais
foram possivelmente originadas de rochas félsicas vulcanogênicas, BIF e diques máficos
metamorfizados. Ouro economicamente viável ocorre em um pequeno número de corpos aos
quais foram primeiramente extraídos em cava a céu aberto e depois em minas subterrâneas.
3.6 Contexto da produção

Segundo o relatório anual de reservas da mina (ASHANTI, 2016), Córrego do Sítio
- Figura 42 (4) e (5) é minerada com sub-level stoping, em que cada painel consiste em
três níveis com desenvolvimentos secundários entorno de 300 m ao longo do mergulho
em NE-SW, e cross cuts em 300 m na direção SW. Os painéis têm entorno de 15 m de
altura. A perfuração para uso dos explosivos é realizada em leque nas direções ascendentes
Página 103
e descendentes. O carregamento do minério é realizado com carregadeiras com concha de 8

t de capacidade e caminhões articulados de 30 t em uma razão de produção de 1500 tpd.
Para ao processamento mineral, existem duas plantas metalúrgicas em Córrego
do Sítio: planta de lixiviação de óxidos e uma planta de beneficiamento de sulfetos. O
beneficiamento de sulfetos consiste em britagem, peneiramento, concentração gravimétrica,
flotação, espessamento, acidulação, oxidação por pressão (autoclave), decantatação por
contra corrente e demais processamentos hidro-eletro metalúrgicos. A planta possui uma
capacidade de entorno 600 ktpa. A planta de lixiviação para óxidos possui britagem,
aglomeração, armazenagem, lixiviação e demais processos hidrometalúrgicos.
Quanto a geologia, Córrego do Sítio é localizada na parte inferior no cinturão
arqueano do Rio das Velhas. A mineralização de ouro, geralmente, está associada a quartzo
e sulfetos (principalmente arsenopirita) e é estruturalmente controlada numa direção de
16-20 km com 500 m de extensão vertical. Já a mina de Cuiabá é associada a sulfetos
e veios de quartzo contendo BIF (banded iron formations) e sequencias vulcanogênicas.
O controle estrutural do quartzo é basicamente realizado por ascensão de fluidos para
a maioria da mineralização, comumente associado a zonas de fraturas e a estruturas da
mina. Quanto a geologia Lamego é bem similar de Cuiabá, exceto por apresentar uma
complexidade estrutural muito maior, principalmente na mineralização associada aos BIFs.
Segundo o relatório anual das reservas da mina (ASHANTI, 2016), Cuiabá usa dois
métodos de mineração subterrânea principais: corte e aterro e longhole stoping. O método
de corte e aterro, geralmente, é aplicado nas regiões de menor inclinação requerendo o uso
de pilares em stopes de grande dimensões.
Os métodos de lavra utilizados na mineração de Lamego, geralmente, são corte
aterro e longhole stoping. O método de corte e aterro é utilizado para melhor seletividade
na lavra, sendo que o mesmo não ocorre com o longhole.
As minas de Cuiabá e Lamego alimentam a flotação na mina de Cuiabá e o processo
metalúrgico da mina de Queiroz. Na mina de Cuiabá, é realizada a britagem e moagem do
material, seguida de flotação e filtração para ser transportada por teleférico aéreo até a mina
de Queiroz para futuro tratamento. Aproximadamente, 25% a 30% do ouro é recuperado
por concentração gravítica na mina de Cuiabá. A planta de Queiroz é localizada em Nova
Lima e apresenta dois circuitos diferenciados, um para o minério não refratário e outro
para o minério refratário. Antes do refinamento, é realizada a calcinação do material. O
gás sulfeto é capturado e processado na planta, podendo ser produzidos aproximadamente
230 ktpa de ácido sulfúrico como co-produto.
Página 104
3.7 Ore Sorting - Santa Bárbara

A mineralogia tem impacto direto no beneficiamento de minérios de ouro. A pré-
concentração é uma alternativa para a redução de custos e aumento da recuperação,
principalmente para minérios refratários de difícil beneficiamento. A tecnologia de ore
sorting tem sido usada amplamente em minerais valiosos como esmeraldas, em que
existe uma correlação alta entre os parâmetros físicos (cor) com o mineral de interesse.
Outras aplicações são vistas para o processamento de produtos sucateados. A utilização
destes equipamentos de pré-concentração no beneficiamento dos minérios metálicos é uma
tecnologia recente e ainda necessita de muito estudo para melhorar sua eficiência.
O ore sorting é um equipamento que utiliza medidas físicas como de laser ou raio
x para a concentração do minério. De acordo com a Figura 46, o material é alimentado em
(1) com uma camada de praticamente a altura de uma partícula. O material passa por
uma fonte de raio x (2), e em seguida, o sensor identifica o material a partir de análises de
imagens, que permite a partir de cálculos computacionais, definir os fluxos destinados às
partículas de minério (3). Um jato de ar lança o material que deve ser selecionado para
uma câmara separada, ou permite que ele passe sem desvios na câmera de separação (4).
Antes da pré-concentração do material, é necessário realizar adequação granulométrica de
forma que os grãos no ore-sorting tenham tamanhos semelhantes.
Figura 46 – Imagem em perfil do equipamento ore sorting.

Página 105
Na Figura 47, tem-seas imagens obtidas pelo equipamento. Em (A), observa-se os

sinais obtidos diretamente da máquina. Após simulação da imagem, é possível obter duas
imagens a partir do tratamento da primeira, considerando sensores diferentes. Em (B), a
imagem obtida por simulação indica regiões de alta, baixa e média densidade. Neste tipo
de simulação, é considerada a espessura da partícula que atravessa o equipamento. Em (C),
observa-se apenas o contraste obtido sem considerar a espessura do material. Os filtros de
píxeis são utilizados para compensar valores das medidas de alta e baixa densidade nas
bordas da imagem dos grãos.
Figura 47 – Imagem do grão a partir de simulações do raio x. Em (a) observamos a imagem

do raio x de uma partícula mineral. Em (b) a sua respectiva imagem gerada a
partir de simulações de dois canais da partícula mineral. As regiões definidas
como vermelhoh representam baixa densidade, azuis claros a densidade média
e azul escuro representando alta densidade. Em (c) observamos a simulação
de um canal, apresentando contrastes escuros e claros
A Figura 48 mostra a planta de beneficiamento de Santa Bárbara utilizando o

ore sorting. O material proveniente da mina é cominuido para a faixa granulométrica de
+20-45 mm, e assim, alimentar o equipamento.
Página 106
Figura 48 – Planta de ore sorting em Santa Bárbara.

A Figura 49 demonstra o fluxo do material passante no equipamento do ore sorting.

Primeiramente, ele é alimentado em (a), onde o material fino é desbastado para não
interferir nas medições. Em (b), a esteira vibratória forma uma monocamada de grãos
pelo equipamento. Em (c), são realizadas as medições de raio x e em (d), o material é
separado na câmara a partir de jatos de ar lançados em intervalos de microsegundos.
Figura 49 – Componentes do equipamento ore sorting. Em (a), é demonstrada a alimenta-

ção das partículas minerais, ao qual uma grelha é responsável pela separação
de finos na entrada do equipamento. Em (b), é apresentada uma esteira vibra-
tória, responsável por criar uma camada única de partículas no leito da esteira.
Em (c), é demonstrada a fonte de raio x, e o sensor. Em (d), é demonstrada a
câmara de classificação, onde as pistolas de ar impulsionam a partícula para
um fluxo de minério ou estéril.
O rejeito do material obtido pela classificação do raio x pode ser reclassificado, a
Página 107
partir de sensores laser, em uma segunda etapa do processo. Devido a difração, brilho e
reflexão de determinadas cores, é possível realizar uma nova concentração. Materiais como
o quartzo apresentam alta difração com o laser e podem ser facilmente separáveis a partir
do uso destes sensores. A Figura 50 demonstra o equipamento em Santa Bárbara. Em 1 e
2, podemos ver os sensores de laser, que são aplicados diretamente na partícula mineral,
atingindo ambos os lados. Ao determinar se o material deve ou não ser classificado, os
sopradores agem dividindo em concentrado e rejeito as partículas.
Figura 50 – Equipamento de classificação com laser. (1) e (2) são os lasers utilizados para
atingir as partículas minerais. Em (4) é realizada a alimentação da máquina e
(3) o sopro para a concentração do material.
Para correlacionar a mineralogia com os parâmetros obtidos pela máquina, é

realizada a amostragens nas pilhas de minério e as partículas são classificadas manualmente,
uma a uma. Os grãos são divididos segundo sua mineralogia como demonstrado na Figura
51. Alguns minerais estão demonstrados tal como sulfetos, clorita, xisto grafitoso e quartzo.
A presença de ouro está principalmente ligada com a arsenopirita fina disseminada nestes
grãos ou em pequenas inclusões no quartzo.
Página 108
Figura 51 – Amostragem dos grãos pelo teste de hand sorting. Diferentes classificações
são apresentadas de acordo com as variações mineralógicas das partículas. (A)
xisto grafitoso, (B) clorita, (C) minério sulfetado e (D) quartzo.
As partículas de minério são separadas em mantas como demonstrado na Figura

52 e numeradas adequadamente para que possam ser correlacionadas com a análise das
imagens. Além disso, após a análise das imagens, os grãos são analisados para se obter os
teores de ouro e enxofre de cada partícula.
Figura 52 – As amostras analisadas quanto a mineralogia são encapsuladas nesta manta,

com identificação própria. Cada partícula é identificada e submetida à análise
pelo ore sorting. Após a análise física das partículas, os grão são pesados, e
enviados para análise física.
O objetivo principal desta primeira parte da tese é investigar uma possível correla-
ção entre os dados obtidos pela análise de raio x do ore sorting com dados da mineralogia
analisados pela amostragem e classificação manual.Existindo relação, pretende-se estabele-
cer um modelo de classificação que possa incorporar estas variáveis, analisadas na previsão
Página 109
de quais partículas seriam minério.
3.8 Cuiabá e Lamego

Diversos parâmetros metalúrgicos influenciam na recuperação mássica do concen-
trado e nos custos de processamento do minério. A segunda etapa desta tese propõe criar
um modelo geometalúrgico para previsão da recuperação do minério da usina de Queiroz,
alimentada pelo minério das minas de Cuiabá e Lamego, considerando os aspectos do
beneficiamento, tais como moabilidade, consumo de reagentes na flotação, na lixiviação,
etc. Os dados obtidos para esta tese são provenientes de amostragens da usina. O controle
do processo da usina é realizado a partir de ensaios laboratoriais, que tentam emular os
parâmetros obtidos na planta.
A Figura 53 representa o fluxograma dos ensaios laboratoriais, com os testes
químicos, análise em MLA (Mineral Liberation Analyser) e BET (Brunauer-Emmett-
Teller).
Figura 53 – Fluxograma do laboratório de processamento da Anglo Gold Ashanti .

R
O laboratório emula três circuitos principais. O primeiro de cominuição e classifica-

ção granulométrica, seguido de um circuito de concentração e um circuito de calcinação e
lixiviação. A figura 54 demonstra a britagem em A, o peneiramento em B e a moagem em
Página 110
C. Nesta etapa, é essencial avaliar como a mineralogia e a granulometria podem afetar as

recuperações no beneficiamento.
Figura 54 – Circuito de cominuição e adequação granulométrica. (A) britagem, (B) penei-

ramento e (C) moagem.
Em seguida, o material passa pela concentração gravítica e flotação. A figura 55

demonstra o circuito de concentração utilizado no processo.
Figura 55 – Circuito de concentração. (A) concentração Falcon, (B) mesa vibratória e (C)
célula de flotação.
Na próxima etapa, é realizada a calcinação do material na mufla e sua lixiviação

em garrafa. A Figura 56 demonstra os equipamentos.
Figura 56 – Circuito de lixiviação e calcinação. (A) lixiviação em garrafa. (B) mufla.

Página 111
3.9 Considerações finais sobre o problema

Nesta tese, dois problemas principais são abordados em regiões diferentes do
quadrilátero ferrífero. Os depósitos de ouro de Cuiabá e Lamego tal como em Córrego
do Sítio, possuem controle estrutural e apresentam grande complexidade nos litotipos
e mineralogias que definem o teor de ouro do minério. Apesar das similaridades dos
depósitos minerais, existem também diferenças composicionais entre estes corpos geológicos,
principalmente na presença de BIFs. Neste tocante, esta tese pretende resolver dois
problemas principais relacionados com a geometalurgia destes depósitos. Em Córrego do
Sítio são analisadas as características do equipamento ore sorting, enquanto em Cuiabá
e Lamego são utilizadas técnicas de regressão para prever a recuperação metalúrgica
utilizando informações dos depósitos minerais.
Página 112
4 Estudo de caso - Ore Sorting
Neste capítulo, são abordados os resultados para os modelos geometalúrgicos do

ore sorting, a partir de dados de CDS (Mina Córrego do Sítio), operada pela Anglo Gold
Ashanti R
. Na sessão 4.1 é apresentada a metodologia de obtenção do banco de dados. É
explicada a relação das atividades realizadas nesta tese, de acordo com o fluxo do projeto.
Na sessão 4.3, é apresentado o modelo de calibração do ore sorting, e determinados os
modelos ótimos de classificação e as métricas máximas obtidas. Na sessão 4.4, apresenta-se
a classificação dos domínios geológicos, segundo propriedades físicas das partículas minerais
alimentadas no equipamento.
4.1 Metodologia de obtenção do banco de dados

Como demonstrado no capítulo 2, o ore sorting é um equipamento que realiza a
concentração de partículas minerais, a partir de medidas físicas de sensores. Diferentes
sensores podem ser usados nesse equipamento; porém, nesta tese foi abordado o uso
do sensor de raio x em dois canais. A conceituação teórica desta metodologia pode ser
encontrada na seção 2.4.1 da tese. Duas abordagens metodológicas foram realizadas para
a obtenção do banco de dados. A primeira etapa foi exclusiva da empresa Anglo Gold
Ashanti R
, consistindo na amostragem, hand sorting e simulação das partículas minerais.
A segunda etapa relaciona-se com o escopo da tese, aplicando algoritmos de aprendizado
nos dados simulados pela empresa. A figura 57 apresenta a sequência de etapas para o
desenvolvimento do projeto e a conjuntura desta tese.
Figura 57 – Projeto de geometalurgia. Primeira etapa realizada pela Anglo Gold Ashanti
R
(amostragem, hand sorting e simulação). Segunda etapa representada pela

aplicação de algoritmos de aprendizado de máquinas. A seta negra representa
o encaminhamento do projeto.
CAPÍTULO 4. ESTUDO DE CASO - ORE SORTING
O fluxograma realizado pela Anglo Gold Ashanti , R pode ser resumido na figura
58. Realiza-se a amostragem de partículas em regiões do depósito mineral. Uma pequena

parte do lote é selecionada para o hand sorting. Nesta etapa, classifica-se a mineralogia
de cada partícula e são medidas suas imagens de raio x. Estas partículas são pesadas
e submetidas a análise química. Os dados gerados por cada uma destas imagens são
simulados, e identificam-se as proporções de pixels contendo valores de alta , média e baixa
densidade, para diferentes curvas de densidade.
Figura 58 – Fluxograma do projeto. Em (a), são realizadas amostragens. Em (b), é repre-

sentada a análise de cada partícula. Em (c), as imagens de raio x, de alta e
baixa intensidade, para as partículas amostradas. Em (d) são simulados os
indicadores para os píxeis de alta, baixa e média densidade. Em (e), é repre-
sentado o banco de dados, contendo para cada partícula amostrada, diferentes
curvas de densidades, e proporções de pixels de alta e baixa densidade.
Após a obtenção do banco de dados, determinou-se as categorias das classe de

interesse no aprendizado supervisionado. A figura 59 demonstra este procedimento. Em
(a), é realizado o processo de amostragem, o mesmo processo adotado na determinação
das variáveis do raio x. As partículas, após análise do raio x, são pesadas e identificadas
as mineralogias, teores de ouro e enxofre (c). Determina-se um algoritmo, em (d), que
classifica as partículas minerais como minério ou estéril. A seção 4.3.3 demonstra o processo
de transformação desta classe. Os resultados são adicionados ao banco de dados em (e).
Página 114
Figura 59 – Fluxograma do projeto do ore sorting para obtenção da classe de interesse. Em

(a), são realizadas amostragens de partículas em diferentes domínios geológicos.
Em (b), é representada a análise realizada partícula por partícula. Em (c),
são obtidas medidas de mineralogia e química para cada partícula. Em (d),
um algoritmo define se cada partícula mineral deve ser considerada minério
ou estéril quanto os quesitos econômicos e tecnológicos. Em (e), este valor
entra dentro do banco de dados como uma medida da classe de interesse.
O banco de dados apresenta 16 variáveis relacionadas ao raio x e mais duas variáveis

associadas a origem destas partículas minerais, seja em rotas de processo, ou relativo
ao domínio geológico de onde foram amostradas. A figura 60 demonstra as variáveis de
entrada e as categorias de saída do modelo matemático.
Figura 60 – Representação das variáveis utilizadas no desenvolvimento desta tese. A es-

querda temos as variáveis de entrada, representadas pelas variáveis de posição,
seja sua localização em um domínio geológico, seja na rota de processo, além
das variáveis de raio x. A direita temos as classes utilizadas como resposta ao
modelo matemático.
Página 115
4.2 Associação das métricas de classificação com o problema físico

O ore sorting é um equipamento de pré-concentração e divide as partículas alimen-
tadas em concentrado e rejeito. Esta tese propõe a criação de modelos matemáticos, que
identifiquem, de acordo com a combinação de leitura entre os canais do raio x, a melhor
classificação de partículas de minério e estéril, para uma condição de material alimentado.
Propõe-se, que métricas de classificação possam ser interpretadas como medidas
físicas do equipamento, em condições ideais. Evidentemente, os processo mecânicos não
são perfeitos, o que resulta em recuperações menores que as obtidas nos modelos experi-
mentais. Neste trabalho, evidencia-se os limites de classificação teórica da máquina, e as
consequências do aumento da recuperação de ouro em detrimento da redução de teor do
concentrado.
Algumas métricas de classificação do capítulo 2 podem ser atualizadas para o
contexto do equipamento de concentração. A matriz de confusão pode ser matematicamente
associada ao equipamento mecânico a partir da figura 61, tal que a representação das
partículas positivas de minério, e as partículas negativas de estéril, possam ser classificadas
dentro dos fluxos de concentrado e rejeito.
Figura 61 – Matriz de confusão como a representação de partículas positivas (minério)

e partículas negativas (ganga), classificadas em concentrado e rejeito. Os
valores positivos verdadeiros representam o minério devidamente alocado para
o concentrado, enquanto os negativos verdadeiros representam os valores de
estéril devidamente alocadas para o rejeito.
As partículas de minério encaminhadas para o concentrado e as partículas de estéril

alocadas para o rejeito representam o caso de classificação ideal. Os falsos positivos e
falsos negativos representam as imperfeições operacionais do modelo matemático, aos quais
Página 116
partículas se deslocam para fluxos indesejados.

As principais métricas de classificação dos algoritmos de aprendizado e suas relações
com os fluxos do equipamento mecânico são apresentadas nas figuras 62, 63, 64 e 65 .
A figura 62 demonstra a precisão como o teor de partículas de minério no concen-
trado. As partículas azuis são consideradas minério e as vermelhas são consideradas ganga.
A relação da quantidade de minério no concentrado, pela quantidade total do concentrado,
representa a precisão.
Figura 62 – Representação da precisão do modelo. Linhas fechadas representando sub-

conjuntos considerados. Círculos azuis representam o minério enquanto os
vermelhos representam a ganga. A precisão pode ser vista como o teor de
partículas minerais no concentrado.Precisão de 2/5.
A revocação, ou recall, pode ser demonstrada na figura 63, como a recuperação

do minério no concentrado. É representado pelo subconjunto de partículas de minério no
concentrado, dividido pelo conjunto de minério na alimentação. Esta representa uma das
principais métricas de avaliação. Uma quantidade elevada de revocação permite que mais
partículas minerais contendo ouro se encaminhem para o concentrado.
Figura 63 – Representação da revocação do modelo. Linhas fechadas representando sub-

conjuntos considerados. Círculos azuis representam o minério, enquanto os
círculos vermelhos representam a ganga. A revocação pode ser comparada à
recuperação de minério no concentrado. Revocação de 2/5.
Página 117
A especificidade, ou specificity, apresenta-se na figura 64 como a recuperação do

estéril no rejeito. É representada pela relação entre o subconjunto de partículas de ganga no
rejeito, dividido pelo conjunto total de estéril na alimentação. A especificidade representa
a capacidade de alocar devidamente o estéril no rejeito, ou eliminar o que realmente não
se interessa. Uma elevada especificidade indica que o ore sorting possui capacidade para
desbastar estéril.
Figura 64 – Representação da especificidade do modelo. Linhas fechadas representando

subconjuntos considerados. Bolas azuis representam o minério enquanto as
vermelhas representam a ganga. A especificidade pode ser representada como
a recuperação do estéril no rejeito. Especificidade de 1/4.
A acurácia pode ser demonstrada na figura 65. Esta representa a quantidade total de
partículas corretamente classificadas. A relação do subconjunto de minério no concentrado
e ganga no rejeito, pelo número de partículas totais representa esta medida.
Figura 65 – Representação da acurácia do modelo. Linhas fechadas representando subcon-

juntos considerados.Círculos azuis representam o minério enquanto os círculos
vermelhos representam a ganga. A acurácia tende a representar o percentual
de partículas corretamente selecionadas. Acurácia de 3/9.
É possível alterar as métricas de classificação ao mudar os parâmetros dos modelos

matemáticos. A curva ROC é uma das métricas que permitem avaliar a mudança de
métricas dos modelos, pela mudança de parâmetros ou pela probabilidade de classificação.
Página 118
Mudanças na probabilidade de classificação permitem obter diferentes revocações,

dimensionadas de acordo com o desejo da engenharia. Todavia, o aumento da recuperação
de minério, acarreta perda de teor destas partículas no concentrado.
A figura 66 mostra diferentes curvas ROC (preta, azul e vermelha) para modelos
genéricos. A reta negra na curva representa o pior modelo de classificação, em que a
probabilidade de divisão dos fluxos em concentrado e rejeito é a mesma. Os melhores
modelos apresentam inflexões cada vez maiores para o patamar superior, e desta forma,
podemos observar na figura 66 , que a curva vermelha é superior à preta, e a azul superior
à vermelha. Outra métrica que pode resumir o gráfico é a área abaixo destas curvas. Os
valores tendem a variar de 0.5 a 1.0, tal que 1.0 representa a classificação perfeita e 0.5 o
pior caso (performance aleatória).
Figura 66 – Curva ROC e interpretação probabilística. Eixos demonstram probabilidade

condicional. A medida que se aumenta a probabilidade de classificação do
modelo, altera-se a probabilidade de divisão das classes minério e estéril. A
reta negra representa o modelo de pior classificação e retas azul e vermelha
diferentes modelos.
Neste trabalho, define-se tais métricas de classicação, referindo-se aos melhores usos
de parâmetros e modelos para os classificadores matemáticos do equipamento. Pode-se
adequar a otimização das métricas metalúrgicas, de acordo com as necessidades previstas
da engenharia.
Página 119
4.3 Apresentação dos resultados para calibração do ore sorting
4.3.1 Validação do banco de dados

Realizou-se a validação do banco de dados, removendo dados faltantes e valores
inconsistentes encontrados. Muitas medidas realizadas não foram avaliadas pelo raio x,
apresentando apenas valores da mineralogia ou teor.
Optou-se pela remoção destes dados, pois as técnicas de substituição de dados
faltantes (como modelos de regressão e associação aos valores médios), para um número
de variáveis e amostras pequenas, poderia causar resultados espúrios. Rememora-se o uso
de bancos de dados completos em algoritmos de aprendizado de máquinas. A tabela 1
demonstra a quantidade de dados retidos para cada uma das regiões da mina.
Tabela 1 – Percentual utilizado do banco de dados na análise estatística
Percentual utilizado do banco de dados na análise estatística

Região da Mina Número de amostras retidas Número de amostras totais Percentual utilizado
CDS - Cachorro Bravo 320 320 100%
CDS - Carvoaria 245 437 56%
CDS - Laranjeiras 309 386 80%
CDS - São Bento 839 951 88%
CDS - Sangue de Boi 95 96 99%
CDS - Transição 538 539 100%
CDS-CVDQ 192 437 44%
SOMA 2538 3167 80%
4.3.2 Pré-processamento das variáveis

As partículas minerais apresentaram, em grande maioria, quantidades diferenciadas
de pixels, devido aos diferentes tamanhos das seções minerais nas imagens de raio x.
As proporções de pixels com densidade alta, baixa, média e da região escura foram
normalizadas para cada uma das imagens das partículas, permitindo a comparação das
medidas entre as partículas minerais.
Os efeitos do raio x nas bordas das partículas podem causar difrações criando
uma nova fonte de emissão pela onda eletromagnética, chamado efeito Huygens-Fresnel.
Segundo (SUORTTI, 1972), 3 vários autores estudaram os efeitos da porosidade no raio-x,
e em sua maioria concordam que existe um decréscimo de absorção da energia. Optou-se
por utilizar os filtros de pixel para ajustar estes efeitos de borda, adicionando valores nas
classes de alta e baixa densidade para cada curva de densidade, compensando estas perdas.
3
"The effects of the granular structure of a powder specimen on the x-ray absorption properties have been
studied theoretically by several authors ... According to these authors, there is an angle-independent
reduction of intensity in the reflection case and a decrease of absorption in direct transmission.". Página
325
Página 120
Para as variáveis categóricas (localização no depósito mineral e no processo), foi

utilizado o método de codificação de variáveis baseadas em objetivo, que relaciona cada
categoria a um valor de probabilidade, em relação à classe preditora. A seção 2.3.4.3
exemplifica os aspectos teóricos desta metodologia. Não há nenhuma premissa para
considerar uma categoria da região do depósito mineral ou da localização do processo em
detrimento de outra. Regularizando o tamanho das partículas e computando os efeitos de
borda do raio x, todas as variáveis apresentam valores de 0-1.
Também foi realizado o pré-processamento por gaussianização e em z-scores. A
escolha é somente uma transformação matemática para melhorar as métricas de classificação
finais.
4.3.3 Determinação da classe preditiva

O depósito de Córrego do Sítio, objeto do estudo deste trabalho, é caracterizada por
controle estrutural e hidrotermalismo. Tal condição implica em fases minerais distintas, na
mesma partícula, em que o ouro se apresenta em pequenas inclusões ou minerais sulfetados
de textura fina. A geologia demonstra que o ouro está associado principalmente a estas
fases minerais, no entanto, devido a gênese do depósito, a complexidade geológica pode
incluir outros tipos de rochas, podendo o minério se apresentar de diversas formas.
Tais dificuldades na operação do ore sorting tornam o minério de difícil separação
apenas por suas componentes mineralógicas ou químicas. Optou-se por criar uma variável
de classificação "minério", que contém as fases minerais de interesse (arsenopirita fina,
quartzo com inclusões de sulfeto, quartzo fumê com inclusões de sulfeto) como também as
partículas com teor de ouro acima do cut-off da mina (0.4 ppm). Dessa forma, o modelo
pretende maximizar a recuperação de ouro, mesmo com diluição do concentrado. A figura
67 ilustra a relação para as categorias consideradas minério e estéril.
Figura 67 – Proposição das classes em um diagrama de Venn. À esquerda o grupo de

partículas minerais de interesse. À direita é representado os minerais com
teores de ouro acima do teor de corte. A classe minério inclui a mineralogia
de interesse, e o conteúdo metálico. A classe estéril não apresenta qualidade
desejada.
Página 121
Para criar estas classes, o algoritmo 1 foi utilizado, determinando um teor de corte
acima de 0.4ppm e mineralogias de interesse como arsenopirita, pirita, sulfetos, etc.
Algoritmo 1 Transformação em variável indicadora

1: procedimento Tranformação(m, M, t) . m-mineralogia de
interesse,M-mineralogia global, t-teor de ouro
2: para i ← 1 até n faça
3: se m[i] ∈ M or t[i] > 0.4ppm então
4: I[i] ← minerio
5: senão
6: I[i] ← esteril
7: fim se
8: fim para
9: devolve I[i]
10: fim procedimento
A figura 68 demonstra o percentual das classes consideradas minério e estéril.

Nota-se, que as proporções não estão desbalanceadas, ou seja, o número de partículas de
minério não é muito maior do que de estéril (apenas 1.5 vezes maior).
Figura 68 – Gráfico de barras para a variável mista criada. Partículas consideradas minério
como aquelas em que o teor está acima do teor de corte ou a mineralogia
contém sulfetos, quartzo e arsenopirita fina.
4.3.4 Análise exploratória dos dados

A figura 69 apresenta o histograma das variáveis lidas nos sensores do ore sorting.
As variáveis escuras apresentam quantidade de valores nulos altos. Como ela representa
valores de alta densidade, tal como acresções de ouro, propõe-se que a presença de poucos
Página 122
pixels escuros constatam um efeito pepita natural deste minério. Também são apresentados
os histogramas das variáveis do domínio geológico "Ore body"e as variáveis de localização
da pilha no processo "Source", pré processadas pelo algoritmo de codificação de variáveis
baseadas em objetivo (observar seção 2.3.4.3) .
Figura 69 – Histograma da frequência absoluta da proporção de pixels com alta, média

e baixa densidade e densidade escura, para as curvas de calibração DM 60,
DM 70, DM 80 e DM 90. São apresentados também os valores de ’Source’,
respectivos à localização das partículas no processo e a variável ’Ore Body’,
representado o domínio geológico que a contém.
A figura 70 demonstra a correlação entre as variáveis do ore sorting. Existe uma

alta correlação entre as variáveis de mesma curva de densidade. Não obstante, a relação
das variáveis lidas entre curvas apresenta baixa correlação.
Página 123
Figura 70 – Matriz de correlação entre as variáveis do raio x. Curvas de densidade repre-

sentadas por valores de 60%, 70%, 80% e 90%, para altas, médias e baixa
densidades.
A importância das variáveis foi estimada de acordo com três técnicas principais, a
correlação de Pearson com a variável preditora, o critério de Gini 1 para o algoritmo florestas
aleatórias e o critério de Gini para o algoritmo classificador de aumento do gradiente. Para
1
O coeficiente de Gini é um dos critérios na literatura de aprendizado de máquinas para divisão entre
classes em um modelo supervisionado.
Página 124
cada critério de importância a variável mais importante recebeu o maio valor, neste caso
18 devido ao número de variáveis consideradas, e a variável menos importante recebeu
apenas 1. Após calculada as importâncias individuais para cada critério, a importância
global foi definida a partir da média destas três medidas, como indicado na figura 71.
Figura 71 – Importância das variáveis utilizando a média de valores obtidos para diferentes
tipos de algoritmos (correlação de Pearson com a variável preditora, a impor-
tância segundo o critério de Gini para o algoritmo de florestas aleatórias e
para o algoritmo classificador de aumento do gradiente). Variáveis da curva de
densidade 90 apresentam grande importância na classificação, se comparados
com valores da curva de 60% e 70%
Podemos notar a grande participação da variável relacionada ao domínio geológico

e da curva de densidade de 90%.
4.3.5 Redução do número de variáveis

Realizou-se a análise de componentes principais dos dados. A tabela 2 apresenta
a importância acumulativa das componentes principais. É possível notar, que seriam
necessários 10, dentre as dezesseis fatores para explicar 95% da variância dos dados.
Optou-se por utilizar os modelos preditivos contabilizando 10 fatores.
Página 125
Tabela 2 – Contribuição acumulada da variância para cada fator das componentes princi-
pais
Contribuição acumulada da variância para cada fator das componentes principais

Componente Participação acumulada Componente Participação acumulada
Componente Principal 1 0.47606 Componente Principal 9 0.93924
Componente Principal 8 0.91952
A figura 72 (b) apresenta a projeção dos dados nas variáveis LOW 80% e HIGH
80%, como a primeira e a segunda componente principal dos dados em (a). Os valores
calculados desconsideraram a variável escura, pois esta apresenta uma grande quantidade
de valores nulos que acabam por distorcer os padrões dispostos pelo PCA.
(a) (b)
Figura 72 – (a) Apresentação do primeiro e segundo fator da análise de componentes

principais (b) projeção dos dados nas variáveis Low 80 e High 80.
A figura 73 apresenta um padrão característico formado pelos dois primeiros fatores.

Três grupos são formados a partir dos pares conjugados. Uma análise da mineralógica
permite inferir que o grupo 1 está associado aos minerais sulfetados de alta densidade. O
grupo 2 associa-se com partículas de quartzo, apresentando possíveis acresções de ouro. O
grupo 3, no entanto, é o que contém a grande maioria das partículas minerais. O controle
estrutural do depósito de ouro parece justificar a grande mistura de valores de minério e
ganga no grupo 3, pois não parece neste grupo haver uma mineralogia que possa justificar
a presença do ouro neste grupo, apenas as estruturas geológicas no depósito é que definem
particularmente a disposição do ouro nesta disposição.
Página 126
Figura 73 – Projeção nas variáveis Low 80 e High 80. Grupo 1 representado por minerais em
sua maioria sulfetados. Grupo 2 representado em grande maioria por quartzo
e grupo 3 representado pela grande expressão de mineralogias presentes.
4.3.6 Descrição técnica dos algoritmos de aprendizado de máquinas

A linguagem de programação Python 3.0 e a distribuição Anaconda 2019.03 foram
selecionadas nesta tese. Demonstram-se as versões das principais bibliotecas utilizadas em
4.3.6, com a finalidade de reprodução científica. Foi utilizada a semente 31415 como base
dos algoritmos, considerando que muitos destes utilizam números pseudo-aleatórios.
(i) Pandas : 0.23.4
(ii) Numpy : 1.15.4
(iii) Sklearn : 0.20.3
(iv) Matplotlib : 3.0.2
(v) Yellowbrick : 0.9.1
(vi) Seaborn : 0.9.1
4.3.7 Avaliação dos modelos para calibração do ore sorting

Propõe-se 7 modelos de classificação supervisionada a partir do banco de dados.
Apresenta-se em 4.3.7 os parâmetros destes modelos e as suas respectivas siglas. O ajuste
dos melhores parâmetros foi realizado por uma procura em grid. A estratégia de procura em
grid consiste em escolher diferentes parâmetros dos modelos de aprendizado de máquinas
e aplicar o modelo modificando cada parâmetro, um a um, de forma a obter diferentes
valores da performance de classificação, e escolhendo aqueles parâmetros que retornam a
Página 127
melhor performance. Neste caso o valor da acurácia de classificação foi escolhido como a
métrica de avaliação para o algoritmo de classificação.
Os algoritmos utilizados são compatíveis com o sklearn 0.20.1.
(i) Regressão Logística (solver = newton cg, penalty = l2, dual = Falso, tol = 10−4 ,C
= 1.0, intercept scaling = 1.0, class weight = Nenhum, random state = Nenhum)
(LOGISTIC).
(ii) Análise Discriminante Linear (solver = eigen, shrinkage = Nenhum, n compo-

nents = Nenhum, store covariance = Falso, tol = 10−4 ) (LDA).
(iii) máquinas de vetores suportados (C = 1, kernel = rbf, degree = 3, gamma=’auto’,

coef0 = 0.0, shrinking = Verdadeiro, probability = Falso, tol = 10−3 , verbose = Falso,
max iter = -1, decision funcion shape = ’ovr’, random state = Nenhum) (SVM).
(iv) florestas aleatórias (max depth = 4, n estimators = 100, criterion = entropia, min
samples split = 15, min samples leaf = 1, min weight fraction leaf = 0, max features
= "auto", max leaf nodes = Nenhum, min impurity decrease = 0, min impurity split
= 1e-7, boostrap = Verdadeiro, oob score = Falso, n jobs = Nenhum, random state
= Nenhum, verbose = 0, warm start = Falso, class weight = Nenhum) (RF).
(v) Redes Neurais utilizando multi-layer perceptron (hidden layers = (20,40),

activation function = f(x) = max(0,x), solver = lbfgs , alpha = 0.0001, barch size =
auto, learning rate = constante, learning rate init = 0.001, power t = 200, shuffle
= Verdadeiro, random state = Nenhum, tol = 10−4 , verbose = Falso, warm start
= Falso, momentum = 0.0, nesterovs momentum = Verdadeiro, early stopping =
Falso, validation fraction = 0.1, beta 1 = 0.9, beta 2 = 0.999, epsilon = 10−8 , n iter
no change = 10) (NEURAL).
(vi) k vizinhos mais próximos (número de vizinhos = 15, weights =’uniform’, leaf
size = 30, p= 2, metric = minkowski, metric params = Nenhum, n jobs = Nenhum)
(KNC).
(vii) Árvore de decisão (maximum depth = 4, criterion = entropia, minimum samples

split = 15, min samples leaf = 1, min weight fraction leaf = 0, max features =
Nenhum, random state = Nenhum, max leaf nodes = Nenhum, min impurity decrease
= 0, min impurity split = 10−7 , class weight = Nenhum, presort = Falso) (DT).
(viii) Bernoulli Naïve Bayes (alpha = 0.5, binarize = 0.0, fit prior= Verdadeiro, class
prior= Nenhum) (NB)
A figura 74 apresenta os resultado das principais métricas de classificação (validação

cruzada de 10 grupos), aplicadas nos dados de teste.
Página 128
Figura 74 – Métricas de classificação para os dados de teste utilizando validação cruzada de

10 grupos. Diferentes modelos (KNC, LOGISTIC, LDA, SVM, RF, NEURAL,
KNC, DT e NB)
Podemos notar, na figura 74 ,que os modelos não lineares, principalmente o SVM,

RF, NEURAL e KNC, apresentam performances muito superiores se relacionados aos
demais. O modelo SVM parece se ajustar melhor, em média, em relação aos demais métodos,
principalmente quanto à revocação, interpretada como a recuperação de partículas de
interesse.
As figuras 75 a 82 demonstram os resultados obtidos para as curvas de aprendizado
e matriz de confusão para os sete modelos criados. Utilizou-se o f1 score e uma validação
cruzada de 12 folds, como métrca. No caso das tabelas de confusão, foi utilizado um
número de folds igual a 10 para a validação cruzada.
.
Página 129
(a) Curva de aprendizado LDA (b) Classificação LDA
Figura 75 – Validação LDA a) Curva de aprendizado b) Matriz de confusão.
(a) Curva de aprendizado LOGISTIC (b) Classificação LOGISTIC
Figura 76 – Validação LOGISTIC a) Curva de aprendizado b) Matriz de confusão.
(a) Curva de aprendizado KNC (b) Classificação KNC
Figura 77 – Validação KNC a) Curva de aprendizado b) Matriz de confusão.
Página 130
(a) Curva de aprendizado SVM (b) Classificação SVM
Figura 78 – Validação SVM a) Curva de aprendizado b) Matriz de confusão.
(a) Curva de aprendizado NEURAL (b) Classificação NEURAL
Figura 79 – Validação NEURAL a) Curva de aprendizado b) Matriz de confusão.
(a) Curva de aprendizado RF (b) Classificação RF
Figura 80 – Validação RF a) Curva de aprendizado b) Matriz de confusão.
Página 131
(a) Curva de aprendizado DT (b) Classificação DT
Figura 81 – Validação DT a) Curva de aprendizado b) Matriz de confusão.
(a) Curva de aprendizado DT (b) Classificação DT
Figura 82 – Validação NB a) Curva de aprendizado b) Matriz de confusão.
Foram calculadas as curvas ROC para todos os modelos selecionados (figura 83). De
acordo com alterações na probabilidades de classificação, é possível determinar diferentes
revocações para estes modelos.
Página 132
Figura 83 – Ajuste da curva ROC (receiver operating characteristic) para os modelos

ajustados. (NB = Naïve bayes, RF = Florestas Aleatórias, DT= Árvore de
decisão, KNC= K vizinhos mais próximos, NEURAL = Redes neurais, SVM
= Máquinas de vetores suportados, LDA = Análise Discriminante Linear,
LOGISTIC = Regressão Logística )
Os modelos de máquinas de vetores de suporte, k vizinhos mais próximos, florestas

aleatórias e redes neurais apresentam as melhores métricas de classificação. O resultado da
técnica Bernoulli Naïve Bayes apresentou a pior solução. Os melhores modelos ajustados
são representados por algoritmos não lineares, tais como Florestas Aleatórias e Máquinas
de Vetores de Suporte, com acurácia aproximada de (70% - 77%) e revocação em torno de
(80% - 90%). Os melhores modelos de classificação apresentaram valores que variam de
(6% - 8%) de falsos negativos (minério enviado ao rejeito).
4.3.8 Discussão dos resultados para a calibração do ore sorting

Os resultados apresentados para os modelos de classificação do ore sorting demons-
traram que os modelos não lineares, principalmente os algoritmos de máquinas de vetores
suportados, florestas aleatórias, redes neurais e k vizinhos mais próximos, apresentaram o
melhor desempenho dentro do conjunto proposto. Os resultados mostraram acurácia de
70% a 77% e revocação de 80% - 90%. Os resultados apontam que o equipamento possui
condições teóricas para a classificação do minério, recuperando quantidades significativas
de ouro.
A utilização de uma variável mista, composta por indicadores minerais do enri-
Página 133
quecimento supergênico do depósito mineral (quartzo fumê e arsenopirita fina) e teores

de ouro, permite qualidade estatística para definir o minério de entrada de uma usina.
Considerando que o ore sorting é um pré-concentrador, sua função consiste em selecionar
a melhor qualidade do material enviado ao processamento, e desta forma, entendemos
que dentro de condições limítrofes, os modelos matemáticos permitem a classificação das
partículas minerais, segundo interesses de processos de engenharia.
Os domínios geológicos apresentam-se como uma das variáveis mais importantes
na classificação do equipamento. A disposição espacial da origem das partículas minerais
é um importante requisito para a modelagem. Apesar do banco de dados não possuir
coordenadas geográficas, a compreensão dos domínios estacionários permite criar um
modelo de classificação mais acurado.
A quantidade presente de falsos negativos é uma métrica importante da avaliação
destes modelos na prática. A presença de minério no rejeito é um fator de perda de
qualidade, pois "perdemos"3 ouro neste processo. Essa análise pode ser comparada a uma
classificação de doenças em uma análise médica: temos maior consequências ao classificar
alguém como saudável, mas doente, do que classificar como doente, alguém saudável.
O modelo de máquinas de vetores suportados, florestas aleatórias, redes neurais e
k vizinhos mais próximos foram os mais conservativos, reduzindo a quantidade de falsos
negativos para 8%. Um classificador pior, como o naïve bayes, aumenta a quantidade
de falsos positivos, porém reduz a proporção de falsos negativos. Um modelo como este
aumenta a precisão do minério, porém reduz a revocação. Estas duas forças trabalham em
equilíbrio dentro de classificadores reais.
Os resultados apresentaram métricas adequadas de classificação para o ore sorting.
Estes modelos geometalúrgicos criados não podem ser vislumbrados como reproduções
exatas da realidade, pois os processos físicos de separação das partículas estão submetidos à
uma série de variáveis que não estão previstas nestes modelos (erros humanos de operação,
problemas de manutenção das pistolas de ar, limpeza dos sensores, etc.), mas apresentam
condições teóricas limites de produção.
4.4 Determinação da origem geológica da partícula mineral a partir

de medidas físicas, químicas e mineralógicas
Os resultados da seção 4.3 indicam que os domínios geológicos acrescentam infor-
mações importantes na classificação das partículas minerais pelo ore sorting. O processo
reverso, ao qual as informações químicas, físicas e mineralógicas determinam estes domínios
3
Perder, neste caso, significa que o material destina-se a um fluxo diferente do que deveria no equipamento,
e não realmente ocorre perda de conteúdo metálico ao longo do processo. Outras etapas, como a
lixiviação podem ser realizadas com os fluxos de saída do equipamento
Página 134
geológicos, pode ser estabelecido. Ao estabelecer um modelo de aprendizado que consiga

mapear a origem geológica de partículas minerais, podemos otimizar o planejamento
mineral, identificando dentro das rotas de processo, as implicações nas performances do
beneficiamento, de acordo com as informações primárias do depósito mineral.
Tal como o problema anterior, a determinação da origem geológica da partícula
mineral é um procedimento de aprendizado supervisionado. As classes preditas estão
relacionadas com seis categorias dos domínios geológicos:
(i) Cachorro Bravo (CB)
(ii) Carvoaria (CV)
(iii) Laranjeiras (LJ)
(iv) Sangue de Boi (SB)
(v) São Bento
(vi) Transição
(vii) CVDQ
A figura 84 apresenta a proporção de amostras de cada um dos domínios geológicos .

Nota-se que a proporção de Sangue de Boi é pequena se comparada às outras classes. Devido
ao desbalanceamento das classes foram realizados métodos de amostragem estratificada.
Figura 84 – Gráfico de barras representando a quantidade de amostras relativa a cada

domínio geológico de CDS (Córrego do Sítio).
Além das curvas de densidade demonstradas na seção 4.3, o banco de dados também
apresenta o valor dos teores de ouro (ppm) e enxofre (%), o peso da partícula mineral, e a
variável categórica "Source", que representa a região amostrada no processo de produção.
Representam-se estas variáveis em quatro grandes grupos:
(i) Teores de ouro (ppm) e enxofre (%),
Página 135
(ii) Peso da partícula (g),
(iii) Curvas de densidade DM 60, 70, 80 e 90,
(iv) Source - Região do processamento proveniente da partícula mineral.
O rastreamento dos outliers foi realizado por gráficos de caixas (boxplot) (figura
85). Definiu-se que apenas as partículas minerais que possuíssem valores de teor de ouro
abaixo de 400 ppm, peso abaixo de 200 g, e teores de enxofre menores que 100 % fossem
utilizadas nos modelos.
Figura 85 – Gráfico de caixas relativo às variáveis discrepantes no banco de dados. Peso,

teor de ouro e teor de enxofre.
A figura 86 apresenta o gráfico t-SNE para os domínios geológicos.
Figura 86 – t-SNE (t-distributed stochastic neighbor embedding). Representação de cores

dos domínios geológicos presentes.
Nota-se a separabilidade entre o domínio de transição, Sangue de Boi e Laranjeiras,

apresentando grupos distintos, em relação aos demais domínios geológicos. Tal discrepância
pode ser atribuída às diferenças composicionais do minério oxidado e sulfetado.
Página 136
A importância de cada variável foi computada pelos algoritmos de florestas aleatórias

e pelo classificador de aumento do gradiente. As figuras 87 e 88 indicam que a variável
"Source"e a mineralogia, possuem papel essencial na definição dos domínios geológicos. Em
contrapartida, as variáveis da região escura, ou ’Dark’, possuem baixa contribuição na
definição de melhores modelos matemáticos.
Figura 87 – Importância relativa das variáveis utilizando o algoritmo florestas aleatórias.
Figura 88 – Importância relativa das variáveis utilizando o algoritmo de classificação de

aumento do gradiente.
4.4.1 Pré-processamento dos dados

Foi realizado o pré-processamento pela normalização em z-scores e gaussianização.
As seções 2.3.4.1 e 2.3.4.2 apresentaram os conceitos teóricos destas etapas. Foram aplicadas
as transformações de codificação baseada em objetivo, para a mineralogia e para a variável
source. A seção 2.3.4.3 demonstrou os aspectos teóricos desta transformação.
Página 137
4.4.2 Avaliação dos modelos para origem geológica das partículas do ore
sorting
Apresentam-se seis modelos supervisionados para a classificação da origem geológica
da partícula. Os parâmetros ajustados dos modelos estão estão representados em 4.4.2, bem
como as respectivas siglas. Determinou-se uma procura em grid, buscando os parâmetros
que resultassem em maior acurácia nos modelos. Os algoritmos são compatíveis com a
biblioteca sklearn 0.20.1 da linguagem Python .R
(i) Regressão logística (solver = newton cg, penalty = l2, dual = Falso, tol = 10−4 ,C
= 1.0, intercept scaling = 1.0, class weight = Nenhum, random state = Nenhum)
(LOGISTIC).
(ii) Análise discriminante Linear (solver = svd, shrinkage = Nenhum, n components

= Nenhum, store covariance = Falso, tol = 10−4 ) (LDA).
(iii) Máquinas de vetores suportados (C = 1,kernel = linear, degree = 3, gamma =

’auto’, coef0 = 0.0, shrinking = Verdadeiro, probability = Falso, tol = 10−3 , verbose
= Falso, max iter= -1, decision funcion shape = ’ovr’, random state = Nenhum)
(SVM).
(iv) Florestas aleatórias (max depth = 25, n estimators = 50, criterion = gini, min
samples split = 2, min samples leaf =1, min weight fraction leaf =0, max features
="auto", max leaf nodes = Nenhum, min impurity decrease = 0, min impurity split
= 1e-7, boostrap = Verdadeiro, oob score= Falso, n jobs = Nenhum, random state
= Nenhum, verbose= 0, warm start = Falso, class weight = Nenhum) (RF).
(v) Redes neurais utilizando multi-layer perceptron (hidden layers = (20,30),

activation function = f(x) = max(0,x), solver = lbfgs , alpha = 0.0001, barch size =
auto, learning rate = constante, learning rate init = 0.001, power t = 200, shuffle
= Verdadeiro, random state = Nenhum, tol = 10−4 , verbose = Falso, warm start
= Falso, momentum = 0.0, nesterovs momentum = Verdadeiro, early stopping =
Falso, validation fraction = 0.1, beta 1 = 0.9, beta 2 = 0.999, epsilon = 10−8 , n iter
no change = 10) (NEURAL).
(vi) K vizinhos mais próximos (número de vizinhos = 10, weights = ’uniform’, leaf
size = 30, p= 2, metric = minkowski, metric params = Nenhum, n jobs = Nenhum)
(KNC).
(vii) Árvore de decisão (maximum depth = 25, criterion = gini, minimum samples
split = 2, min samples leaf = 1, min weight fraction leaf = 0, max features = Nenhum,
random state = Nenhum, max leaf nodes = Nenhum, min impurity decrease = 0,
min impurity split = 10−7 , class weight = Nenhum, presort = Falso) (DT).
Página 138
(viii) Bernoulli Naïve Bayes (alpha = 0.5, binarize = 0.0, fit prior = Verdadeiro, class
prior = Nenhum) (NB)
Os resultados das matrizes de confusão são apresentados nas figuras 89 à 96.
Figura 89 – Matriz de confusão para o algoritmo de regressão logística.
Figura 90 – Matriz de confusão para o algoritmo de análise discriminante linear.
Página 139
Figura 91 – Matriz de confusão para o algoritmo de máquinas de vetores suportados.
Figura 92 – Matriz de confusão para o algoritmo de florestas aleatórias.
Figura 93 – Matriz de confusão para o algoritmo redes neurais utilizando multi-layer

perceptron.
Página 140
Figura 94 – Matriz de confusão para o algoritmo de k vizinhos mais próximos.
Figura 95 – Matriz de confusão para o algoritmo de árvores de decisão.
Figura 96 – Matriz de confusão para o algoritmo Bernoulli Naïve Bayes.
Demonstram-se os resumos das métricas de classificação na figura 97 até a figura

104.
Página 141
Figura 97 – Resumo das estatísticas de classificação para o algoritmo de regressão logística.
Figura 98 – Resumo das estatísticas de classificação para o algoritmo de análise discrimi-

nante linear.
Página 142
Figura 99 – Resumo das estatísticas de classificação para o algoritmo de máquinas de

vetores suportados.
Figura 100 – Resumo das estatísticas de classificação para o algoritmo de florestas aleató-
rias.
Página 143
Figura 101 – Resumo para as estatísticas de classificação para o algoritmo redes neurais
utilizando multi-layer perceptron.
Figura 102 – Resumo para as estatísticas de classificação para o algoritmo de k vizinhos

mais próximos
Página 144
Figura 103 – Resumo para as estatísticas de classificação para o algoritmo de árvores de

decisão.
Figura 104 – Resumo das estatísticas de classificação para o algoritmo Bernoulli Naive
Bayes.
As figuras de 105 até 112 apresentam as curvas de aprendizado para os modelos.
Página 145
Figura 105 – Curva de aprendizado para o algoritmo de regressão logística. Curva azul
representando o treinamento, enquanto curva verde representa o teste.
Figura 106 – Curva de aprendizado para o algoritmo de análise discriminante linear. Curva
azul representando o treinamento, enquanto curva verde representa o teste.
Página 146
Figura 107 – Curva de aprendizado para o algoritmo de máquinas de vetores suporta-

dos.Curva azul representando o treinamento, enquanto curva verde representa
o teste.
Figura 108 – Curva de aprendizado para o algoritmo de florestas aleatórias. Curva azul
Página 147
Figura 109 – Curva de aprendizado para o algoritmo redes neurais utilizando multi-layer
perceptron. Curva azul representando o treinamento, enquanto curva verde
representa o teste.
Figura 110 – Curva de aprendizado para o algoritmo de k vizinhos mais próximos. Curva
azul representando o treinamento, enquanto curva verde representa o teste.
Página 148
Figura 111 – Curva de aprendizado para o algoritmo de árvores de decisão. Curva azul
representando o treinamento, enquanto curva verde representa o teste
Figura 112 – Curva de aprendizado para o algoritmo Bernoulli Naive Bayes. Curva azul
Obtém-se os gráficos de predição das classificações de acordo com as figuras 113 à

120. Em cada coluna, aparece uma classe e os números em que essa classe foi corretamente
classificada e os números em que a classe foi associada a outras classes erroneamente.
Página 149
Figura 113 – Predição das classes para o algoritmo de regressão logística.
Figura 114 – Predição das classes para o algoritmo de análise discriminante linear.
Página 150
Figura 115 – Predição das classes para o algoritmo de máquinas de vetores suportados.
Figura 116 – Predição das classes para o algoritmo de florestas aleatórias.
Página 151
Figura 117 – Predição das classes para o algoritmo redes neurais utilizando multi-layer
perceptron.
Figura 118 – Predição das classes para o algoritmo de k vizinhos mais próximos.
Página 152
Figura 119 – Predição das classes para o algoritmo de árvores de decisão.
Figura 120 – Predição das classes para o algoritmo Bernoulli Naive Bayes.
4.4.3 Discussão dos resultados para detecção do domínio geológico da amostra

segundo medidas físicas, químicas e mineralógicas
O rastreamento de partículas minerais a partir de medidas físicas é uma técnica
adequada para ser usada na mineração, como na indústria de petróleo. Ao identificar
o domínio geológico, é possível associar, a esse domínio, propriedades do depósito com
Página 153
variáveis metalúrgicas. O ore sorting, neste caso, desempenha papel de identificador tal
como de um classificador.
As variáveis representando a mineralogia e a posição da partícula mineral no
processo podem ser consideradas as mais importantes na determinação dos domínios
estacionários. Em contrapartida, a variáveis ’Dark’, das diferentes curvas de calibração,
apresentam baixa influência na previsão dos domínios. Devido o controle estrutural da
gênese do depósito mineral, as componentes de alta densidade ’Dark’, que apresentam as
inclusões de ouro, não estão diretamente relacionadas ao domínio geológico, mas à presença
de estruturas que favorecem o hidrotermalismo. Neste caso, justifica-se o baixo potencial
preditivo desta variável nos domínios geológicos presentes neste depósito mineral.
Observou-se pelo t-SNE, que os domínios de transição, sangue de boi e laranjeiras
apresentam propriedades distintas dos demais. Esta divisão pode ser atribuída às diferenças
mineralógicas entre os domínios. A divisão entre Sangue de Boi, Transição e Laranjeiras dos
demais domínios geológicos é mais precisa e acurada que as demais regiões. As categorias
que apresentam mais classificações errôneas são Cachorro Bravo, São Bento e CVDQ.
Os algoritmos de redes neurais, florestas aleatórias e máquinas de vetores de suporte
apresentam melhor desempenho na definição dos domínios estacionários a partir das
propriedades físicas.
Os valores das métricas de classificação foram altos para a precisão e acurácia
dos domínios. A identificação dos domínios geológicos da partícula, a partir de medidas
físicas e químicas parece factível, e pode ser utilizado não apenas no ore sorting, mas
como também em tecnologias de beneficiamento mineral. Com o avanço das técnicas de
análise químicas automáticas, reconhecimento de imagens e sensores multi espectrais é
possível criar tecnologias que identifiquem partículas durante o processo de beneficiamento
mineral. Desta forma, seria possível registrar a origem das partículas e sua performance de
qualquer processo unitário no beneficiamento. A geometalurgia poderia ser desenvolvida
de forma automática, unindo informações diretas e simultâneas da eficiência da tecnologia
de beneficiamento com as estratégias de planejamento mineral.
Página 154
5 Estudo de caso - Cuiabá e Lamego
5.1 Descrição do problema de regressão para variáveis geometalúr-

gicas de Cuiabá e Lamego
A planta metalúrgica do Queiroz recebe o produto extraído das minas subterrâneas
de Cuiabá e Lamego. O banco de dados fornecido pela Anglo Gold Ashanti R
possui
informações da litologia e elementos de interesse (ouro e enxofre) alimentados na usina. A
recuperação metalúrgica de ouro e enxofre da flotação são variáveis de saída do modelo.
O banco de dados apresenta valores de produção diários. Como variáveis de entrada do
problema podemos citar:
(i) Teor de ouro do ROM (g/t)
(ii) Teor de enxofre do ROM (%)
(iii) Total de massa enviada para a usina (t)
(iv) Percentual de BIF (Banded Iron Formation) do ROM (%)
(v) Percentual de BIF sulfetado do ROM (%)
(vi) Percentual de quartzo do ROM (%)
(vii) Percentual de Sulfeto do ROM (%)
(viii) Percentual de Xisto do ROM (%)
(ix) Percentual de Xisto Grafitoso do ROM (%)
(x) Percentual de Xisto Sulfetado do ROM (%)
Como variáveis de saída temos:
(i) Recuperação metalúrgica de ouro da flotação
(ii) Recuperação metalúrgica de sulfeto da flotação
A figura 121 demonstra o histograma destas variáveis.

CAPÍTULO 5. ESTUDO DE CASO - CUIABÁ E LAMEGO
Figura 121 – Histogramas das variáveis de entrada do modelo geometalúrgico. Proporção

das litologias (BIF, BIF sulfetado, Quartzo, Sulfetos, Xisto Carbonoso e
Xisto Sulfetado), além dos teores de ouro e enxofre, e a quantidade de massa
alimentada na usina.
Nota-se que as proporções de quartzo e Xisto são baixas e apresentam distribui-

ções assimétricas. A proporção de BIF sulfetado apresenta a maior dispersão. Além das
distribuições univariadas, a figura 122 demonstra a matriz de correlações entre as variáveis
do modelo, medidas pelos seus coeficientes de Pearson.
Página 156
Figura 122 – Matriz de correlação entre as variáveis de entrada do modelo. Proporção

das litologias (BIF, BIF sulfetado, Quartzo, Sulfetos, Xisto Carbonoso e
Xisto Sulfetado), além dos teores de ouro e enxofre, e a quantidade de massa
alimentada na usina.
As variáveis que apresentam maior correlação de Pearson entre si é o teor de

ouro e enxofre (R = 0.79). As demais relações apresentam baixo coeficiente de Pearson,
geralmente abaixo de 0.30. A associação entre ouro e enxofre é justificável, pois estes
depósitos minerais apresentam sulfetos como o grupo mineralógico principal de minérios
de ouro.
Página 157
5.2 Valores de produção diários para a recuperação metalúrgica de

ouro
A recuperação metalúrgica de ouro para a produção diária estão representados
na figura 123. Nota-se grande variabilidade para a série temporal, apresentando valores
de 88% até 98%. A regressão da recuperação nestes termos é prejudicada, pois a alta
variabilidade acarreta em predições espúrias por qualquer tipo de modelo utilizado.
Figura 123 – Valores de produção diária para a recuperação metalúrgica de ouro da

flotação. Valores de 01/2017 até 04/2019.
Considerou-se um aumento do suporte temporal como alternativa para redução da

variabilidade. Apresentou-se janelas de tempo não apenas diárias, mas também semanais,
quinzenais, mensais, etc. As variáveis de entrada do modelo são considerados lineares,
permitindo o uso da média aritmética. No entanto, não é possível tomar médias móveis
aritméticas da recuperação metalúrgica, pois esta não é aditiva. Considerou-se a proposta
de Carrasco et al. (2008) para o cálculo da média móvel da recuperação metalúrgica,
calculando o teor recuperável médio (teor da alimentação multiplicado pela recuperação
metalúrgica) e dividindo pelo teor da alimentação médio da flotação. O algoritmo 2
apresenta estas transformações.
Algoritmo 2 Obtenção da média móvel da recuperação metalúrgica a partir da proposição

de Carrasco et al. (2008)
1: procedimento Média móvel(Ri = Recuperação metalúrgica no tempo i, ai =
= alimentação da flotação no tempo i, δ(i) = tamanho da janela móvel)
2: Ordene (Ri ) em ordem ascendente com a data
3: creci ← Ri .ai . : ∀i
4: M1 = Média móvel(creci , δ(i))
5: M2 = Média móvel(ai , δ(i))
6: Rf = M1 /M2 devolve Rf
7: fim procedimento
Pode-se gerar diferentes séries temporais, considerando uma janela de 3, 5, 15, 20 e

30 dias, representados pelas figuras 124 a 128.
Página 158
Figura 124 – Valores de produção para 3 dias para a recuperação metalúrgica de ouro da
flotação.Valores de 01/2017 até 04/2019.
Página 159
Os perfis apresentam comportamento cada vez mais suavizado quando aumenta-se

o suporte. Para verificar a estacionaridade das séries temporais, foi utilizado o teste de
Dickey-Fuller. A tabela 3 demonstra os resultados dos testes de hipóteses e cada um dos p
valores.
Tabela 3 – Teste de Dickey-Fuller para as séries temporais da recuperação de ouro na
flotação da usina de beneficiamento.
no janela temporal p valor

0 1d 0.00000
1 3d 0.00004
2 5d 0.00168
3 15d 0.02993
4 20d 0.15421
5 30d 0.00663
Os resultados demonstram que as séries consideradas falham em rejeitarem a

hipótese de não estacionaridade, tal que o p-valor é abaixo de 0.05 na maioria dos casos.
Apenas a janela móvel considerando 20 dias para as médias móveis possuiu p-valor acima de
0.05, mas tal fato poderia estar relacionado a algum valor outlier na série, e não representa
o conjunto global dos dados.
Página 160
A estacionaridade das séries temporais são uma importante condição à aplicação

destes modelos preditivos, pois o valor de recuperação metalúrgica independe do tempo
medido, mas apenas das variações de tempo, demonstrando que o fenômeno pode ser
aplicado em diferentes datas. Deve-se atentar que a estacionaridade pode ser violada, se ao
longo do tempo, houverem mudanças significativas nos parâmetros de produção da usina.
Este modelo pode ser considerado de acordo com as condições operacionais e o material
da alimentação vigente.
Os dados permitem adotar hipóteses de estacionaridade nos teores, sem haver uma
tendência comprovada neste caso. A previsibilidade pode melhor ser estudada, quando
considerada as médias móveis de vários dias.
5.3 Valores de produção diários para a recuperação metalúrgica de

enxofre
A recuperação metalúrgica de enxofre para a produção diária pode ser representadas
pela figura 129. Tal como apresentado pela variável do ouro, nota-se alta variabilidade
para a série temporal, apresentando valores entre 70% até 98%. A predição da recuperação
metalúrgica é afetada, pois a alta variabilidade produz predições espúrias por qualquer
tipo de modelo utilizado.
Figura 129 – Valores de produção diária para a recuperação metalúrgica de enxofre da

flotação . Valores de 01/2017 até 04/2019.
A alternativa utilizada para o cálculo das médias foi a mesma empregada pelo ouro.
Na seção 5.2 apresenta-se o procedimento de cálculo. Geram-se diferentes séries temporais
com janelas de 3, 5 ,15, 20 e 30 dias representados pelas figuras 130 até 134:
Página 161
Figura 130 – Valores de produção para 3 dias para a recuperação metalúrgica de enxofre
da flotação. Valores de 01/2017 até 04/2019.
Página 162
Tal como considerado no ouro, o cálculo das médias móveis permitem significativa-
mente reduzir a variabilidade das séries temporais e auxiliar na previsão da recuperação. A
tabela 4 demonstra os testes de Dickey-Fuller para as séries temporais de teor de enxofre.
Podemos notar que os testes falham em rejeitar a hipótese de não estacionaridade dos
dados (p-valor < 0.005).
Tabela 4 – Teste de Dickey-Fuller para as séries temporais da recuperação de enxofre na

flotação da usina de beneficiamento.
no janela temporal p valor

0 1d 0.00000
1 3d 0.00000
2 5d 0.00001
3 15d 0.00001
4 20d 0.01144
5 30d 0.00275
Página 163
5.4 Evolução do padrão de acordo com o aumento do suporte

O aumento do suporte temporal apresenta melhor definição dos padrões em relação
à recuperação metalúrgica. As figuras de 135 até 140 demonstram os gráficos da análise
de componentes principais (PCA), utilizando uma janela móvel de 1 até 30 dias.
Figura 135 – PCA para a produção de 1 dia em função da recuperação metalúrgica de

ouro.
Figura 136 – PCA para a produção de 3 dias em função da recuperação metalúrgica de

ouro.
Página 164

ouro.

ouro.

ouro.
Página 165
Figura 140 – PCA para a produção de 30 das em função da recuperação metalúrgica de

ouro.
O aumento de suporte tende a agrupar dados em regiões com padrões não-lineares,

que reproduzem melhor o comportamento da recuperação metalúrgica com o aumento da
janela.
5.5 Descrição técnica dos algoritmos de aprendizado de máquinas

Utilizou-se a linguagem de programação Python R
3.0 e a distribuição Anaconda

R
2019.03. Para finalidade de reprodução científica, apresentam-se as versões das principais
bibliotecas em 5.5. Nesta tese, adotou-se a semente 31415 para a geração de números
pseudo-aleatórios, utilizados em muitos algoritmos de aprendizado.
(i) Pandas : 0.23.4
(ii) Numpy : 1.15.4
(iii) Sklearn : 0.20.3
(iv) Matplotlib : 3.0.2
(v) Yellowbrick : 0.9.1
(vi) Seaborn : 0.9.1
5.6 Avaliação dos modelos para regressão da recuperação metalúr-

gica de ouro utilizando dados geológicos
Adotou-se dois modelos supervisionados de regressão para a recuperação metalúrgica
de ouro: máquinas de vetores suportados e florestas aleatórias. Os parâmetros de cada
Página 166
modelo e suas respectivas siglas são apresentados em 5.6. O ajuste dos melhores parâmetros
utilizou uma procura em grid, variando opções que retornasse o maior R2 . O ajuste foi
realizado nas médias móveis de 15 dias, procurando encontrar a melhor reprodução média
dos modelos. Os algoritmos são compatíveis com a biblioteca sklearn 0.20.1 da linguagem
Python R
.
(i) Máquinas de vetores suportados (C = 1, kernel = rbf, degree = 3, gamma =

’auto’, coef0 =0.0, shrinking = Verdadeiro, tol = 10−3 , verbose = Falso, max iter =
-1, max iter = -1) (SVR).
(ii) Florestas aleatórias (max depth = 50, n estimators = 1000, criterion = gini, min
= 1e-7, boostrap = True, oob score = Falso, n jobs = Nenhum, random state =
Nenhum, verbose = 0, warm start = Falso) (RF).
As figuras de 141 até 146 representam os gráficos de resíduos obtidos para a

regressão metalúrgica de ouro para o algoritmo de florestas aleatórias.
Figura 141 – Gráfico de resíduos para a regressão da recuperação metalúrgica de ouro do

algoritmo florestas aleatórias - janela de 1 dia. Pontos verdes representando
os dados de teste e pontos azuis correspondendo ao dados de treinamento.
Página 167

algoritmo florestas aleatórias - janela de 3 dias. Pontos verdes representando

Página 168


Página 169

Obtiveram-se os gráficos de predição do erro utilizando o algoritmo de florestas

aleatórias de acordo com as figuras de 147 até 152.
Figura 147 – Gráfico dos valores reais x preditos no banco de dados de teste. (y) repre-
senta os dados originais e (ŷ) representa os valores estimados. Regressão da
recuperação metalúrgica de ouro do algoritmo de florestas aleatórias - janela
de 1 dia.
Página 170
senta os dados originais e (ŷ) representa os valores estimados. Regressão da
recuperação metalúrgica de ouro do algoritmo de florestas aleatórias - janela
de 3 dias.
senta os dados originais e (ŷ) representa os valores estimados. Recuperação
metalúrgica de ouro do algoritmo de florestas aleatórias - janela de 5 dias.
Página 171
Página 172
A figura 153 demonstra o gráfico da precisão da estimativa da recuperação de ouro,

utilizando como métrica o R2 para cada janela de tempo esperada. Os bancos de dados de
treino e teste foram divididos de acordo com uma validação cruzada, considerando 30%
dos dados como a população de teste.
Figura 153 – Precisão da predição da recuperação de ouro (R2 ) em termos do tempo da

janela da média móvel para o algoritmo de florestas aleatórias.
A tabela 5 apresenta os resultados do coeficiente de determinação de acordo com a
Página 173
janela temporal escolhida para o algoritmo de florestas aleatórias.
Tabela 5 – Tabela do coeficiente de determinação de acordo com a janela temporal escolhida

para o algoritmo de Florestas Aleatórias.
no janela temporal Coeficiente de

Determinação
0 1d 0.0199
1 3d 0.4238
2 5d 0.6032
3 15d 0.9038
4 20d 0.9320
5 30d 0.9636

regressão metalúrgica de ouro para o algoritmo de máquinas de vetores de suporte

algoritmo de máquinas de vetores de suporte - janela de 1 dia. Pontos verdes
representando os dados de teste e pontos azuis correspondendo ao dados de
treinamento.
Página 174

algoritmo máquinas de vetores de suporte - janela de 3 dias. Pontos verdes
treinamento.

treinamento.
Página 175

treinamento.

do algoritmo de máquinas de vetores de suporte - janela de 20 dias. Pontos
verdes representando os dados de teste e pontos azuis correspondendo ao
dados de treinamento.
Página 176

treinamento.
Obtiveram-se os gráficos de predição do erro de acordo com as figuras de 160 até

165
metalúrgica de ouro do algoritmo máquinas de vetores de suporte - janela de
1 dia.
Página 177
3 dias.
5 dias.
Página 178
15 dias.
20 dias.
Página 179
30 dias.
A figura 166 apresenta o gráfico da precisão da estimativa da recuperação de ouro,

utilizando como métrica o R2 para cada janela de tempo esperada.
Figura 166 – Precisão da predição da recuperação de ouro (R2 ) em termos do tempo da

janela da média móvel para o algoritmo de máquinas de vetores de suporte.

janela temporal escolhida para o algoritmo de máquina de vetores de suporte.
Página 180

para o algoritmo de Máquinas de Vetores de Suporte.

Determinação
0 1d 0.0272
1 3d 0.3757
2 5d 0.5589
3 15d 0.8390
4 20d 0.9003
5 30d 0.9269
5.7 Avaliação dos modelos para regressão da recuperação metalúr-

gica de enxofre utilizando dados geológicos
Utilizou-se dois modelos supervisionados de regressão para obter a recuperação de
enxofre. Apresenta-se os parâmetros de ajuste dos modelos com suas siglas.
(i) Máquinas de vetores suportados (C = 4, kernel = rbf, degree = 3, gamma =

’auto’, coef0 = 0.0, shrinking = Verdadeiro, tol = 10−3 , verbose = Falso, max iter=
-1, max iter = -1) (SVR).
(ii) Florestas aleatórias (max depth = 50, n estimators = 800, criterion = gini, min
= 1e-7, boostrap = True, oob score= Falso, n jobs = Nenhum, random state =
Nenhum, verbose = 0, warm start = Falso) (RF).
Para o ajuste dos melhores parâmetros, foi utilizada uma procura em grid variando
diversos tipos de opção e escolhendo aquela com maior R2 . Os parâmetros foram iterados
no banco de dados referente a janela móvel de 15 dias, procurando os parâmetros que
melhor se ajustem a um limite de tempo médio entre a melhor e pior precisão encontrada.
Os algoritmos utilizados são compatíveis com a biblioteca sklearm 0.20.1 da linguagem
Python R
. Os bancos de dados de treino e teste foram divididos de acordo com uma
validação cruzada, considerando 30% dos dados como a população de teste.
As figuras de 167 até 172 representam os gráficos de resíduos obtidos para a previsão
da recuperação metalúrgica de enxofre com o algoritmo de florestas aleatórias.
Página 181
Figura 167 – Gráfico de resíduos para a regressão da recuperação metalúrgica de enxofre do

algoritmo florestas aleatórias - janela de 1 dia. Pontos verdes representando

Página 182


Página 183


Podemos obter os gráficos de predição utilizando o algoritmo de florestas aleatórias

de acordo com as figuras de 173 até 178.
Página 184
metalúrgica de enxofre do algoritmo de florestas aleatórias - janela de 1 dia.
y são os valores reais, enquanto ŷ representa os valores estimados.
metalúrgica de enxofre do algoritmo de florestas aleatórias - janela de 3 dias.
Página 185
metalúrgica de enxofre do algoritmo de florestas aleatórias - janela de 5 dias.
metalúrgica de enxofre do algoritmo de florestas aleatórias - janela de 15
dias. y são os valores reais, enquanto ŷ representa os valores estimados.
Página 186
A figura 179 demonstra o gráfico da precisão da estimativa da recuperação de

enxofre utilizando como métrica o R2 para cada janela de tempo esperada.
Página 187
Figura 179 – Precisão da predição da recuperação de enxofre (R2 ) em termos do tempo

da janela da média móvel para o algoritmo de florestas aleatórias

janela temporal escolhida para o algoritmo de florestas aleatórias.

para o algoritmo de Florestas Aleatórias.

Determinação
0 1d -0.2287
1 3d 0.2652
2 5d 0.5926
3 15d 0.8662
4 20d 0.9087
5 30d 0.9464

regressão da recuperação metalúrgica de enxofre para o algoritmo de máquinas de vetores
de suporte.
Página 188
Figura 180 – Gráfico de resíduos para a regressão da recuperação metalúrgica de enxofre

do algoritmo de máquinas de vetores de suporte - janela de 1 dia. Pontos

do algoritmo máquinas de vetores de suporte - janela de 3 dias. Pontos verdes
treinamento.
Página 189

do algoritmo máquinas de vetores de suporte - janela de 5 dias. Pontos verdes
treinamento.

Página 190

do algoritmo de máquinas de vetores de suporte - janela de 20 dias. Pontos

Podemos também obter os gráficos dos valores reais e preditos de acordo com as
figuras de 186 até 191
Página 191
metalúrgica de enxofre do algoritmo máquinas de vetores de suporte - janela
de 1 dia. y são os valores reais, enquanto ŷ representa os valores estimados.
de 3 dias. y são os valores reais, enquanto ŷ representa os valores estimados.
Página 192
Página 193
A figura 192 demonstra o gráfico da precisão da estimativa da recuperação de

enxofre utilizando como métrica o R2 para cada janela de tempo esperada.
Página 194
Figura 192 – Precisão da predição da recuperação de enxofre (R2 ) em termos do tempo da

janela da média móvel para o algoritmo de máquinas de vetores de suporte.

janela temporal escolhida para o algoritmo de máquinas de vetores de suporte.

para o algoritmo de Máquinas de Vetores de Suporte.

Determinação
0 1d -0.0165
1 3d 0.1311
2 5d 0.3217
3 15d 0.6843
4 20d 0.7797
5 30d 0.8189
5.8 Discussão dos resultados da regressão de variáveis geometalúr-

gicas para Cuiabá e Lamego
Os valores de produção diários para a recuperação metalúrgica, tanto de ouro
como enxofre, apresentam variabilidade elevada, demonstrando variações de picos e vales
discrepantes em suas séries temporais. Tal condição pode estar relacionada não apenas
Página 195
com a natureza destas variáveis, mas também com erros de amostragem, erros de medição
e, também, erro humano ao completar o banco de dados. A melhora de precisão destes
modelos somente é alcançada ao aumentar o suporte temporal das amostras. Os resultados
apresentaram um valor de precisão (R2 ) acima de 0.8 na maioria dos casos que se usou
uma janela móvel de 15 dias, excetuando no modelo de máquinas de vetores de suporte
para a variável enxofre. Neste último caso, apesar das tentativas de se ajustar os melhores
parâmetros para este modelo, não se obteve precisões iguais ou superiores em relação ao
modelo de florestas aleatórias. Os testes de estacionaridade de séries temporais foram um
forte indicativo que as varições da recuperação metalúrgica foram aleatórias, e remetem às
variações de processo, independentes do tempo.
De acordo com este modelo criado, é possível prever com razoável precisão para
uma dada janela temporal, qual é o valor de recuperação metalúrgica de interesse dado as
variáveis geológicas de entrada na usina. A planta de Queiroz recebe um blend constituinte
da produção das minas de Cuiabá e Lamego. Os modelos, neste caso, fazem consideração
das variáveis primárias de entrada na usina (Run of Mine) e não baseados em características
geológicas de cada mina. Com o devido planejamento, é possível projetar este blend para
alcançar uma recuperação metalúrgica adequada.
Página 196
6 Considerações finais
6.1 Conclusão
A geometalurgia é o ramo da engenharia que pretende obter a partir de variáveis

geológicas georeferenciadas, variáveis respostas do beneficiamento mineral. Em muitos
casos, é necessário neste processo obter funções de transferência, que associem cada valor
de propriedades primárias do depósito mineral com variáveis de desempenho metalúrgicas,
e, consequentemente, realizar predições de processo e de mina, com isso, otimiza-se custos
e receitas, propondo soluções tecnológicas adequadas para questões de engenharia.
A determinação destes modelos é singular, principalmente em depósitos minerais
com alta variabilidade, tais como depósitos de ouro de origem hidrotermal. A tarefa pode
ser aperfeiçoada se realizado modelos computacionais que reconheçam padrões entre as
variáveis de interesse, propondo a melhor classificação/regressão, e atualizados de acordo
com o incremento do banco de dados. Estas técnicas são denominadas de aprendizado de
máquinas (Machine Learning).
Nesta tese, foram aplicadas técnicas de reconhecimento de padrões em variáveis
geometalúrgicas em depósitos de ouro hidrotermais. Os problemas se subdividem em:
calibração da recuperação metalúrgica do ore sorting, identificação do domínio geoló-
gico de partículas por medidas físicas, químicas e mineralógicas, e regressão de dados
geometalúrgicos para as minas de Cuiabá e Lamego.
A criação de modelos matemáticos propostos na tese foram bem sucedidos. No
ore sorting, obteve-se classificações do minério e estéril com revocação de aproximada-
mente 80%, nos melhores modelos de aprendizado. Também, foi possível determinar o
domínio geológico das partículas minerais, a partir de medidas físicas e químicas, em
aprendizado supervisionado. Esta metodologia pode possuir uso eminente não apenas nos
pré-classificadores mecânicos como o ore sorting, mas também em outras componentes
da usina, permitindo a avaliação dos efeitos diretos das características da jazida mineral
na qualidade das rotas de processo. Não obstante, foi possível, a partir de técnicas de
regressão multivariada, a previsão da resposta de variáveis metalúrgicas da planta de
Queiroz a partir de dados da alimentação das minas de Cuiabá e Lamego. Detendo o
conhecimento da litologia e dos teores de ouro e enxofre alimentados na planta, é possível
prever a recuperação metalúrgica de ouro e enxofre da flotação, de acordo com uma janela
de tempo estabelecida. A previsão em suportes temporais pequenos é imprecisa; no entanto,
ao se considerar médias móveis com maior limite temporal (15, 20 e 30 dias), a precisão
na previsão destas variáveis é significativamente aumentada.
CAPÍTULO 6. CONSIDERAÇÕES FINAIS
Atenta-se que a criação destes modelos matemáticos está subjugada às caracterís-

ticas das jazidas minerais de ouro citadas, e dos parâmetros do beneficiamento mineral
durante o tempo do experimento que gerou o banco de dados. A utilização destes modelos
em condições de contorno diferentes, como domínios geológicos inexplorados, pode induzir
resultados espúrios, não condizentes com a realidade. A alimentação de um material não
caracterizado nestes modelos pode afetar os parâmetros de beneficiamento, modificando as
relações obtidas nesta tese. Afirma-se a necessidade de retreinar os modelos matemáticos
de acordo com mudanças nos domínios geológicos existentes.
Ao criar modelos matemáticos automáticos para definir relações entre o depósito
mineral e o beneficiamento, contribui-se para as tecnologias "real-time mining". Conjectura-
se que em um futuro ainda distante, a automatização na mineração permita reduzir a mão
de obra humana, tanto no projeto como na operação da mina, evitando o viés de decisão
humano.
6.2 Recomendações de trabalhos futuros

Algumas proposições nesta seção são estabelecidas, não apenas na melhoria dos
modelos matemáticos já criados, como também na criação de uma base de informações
adequada para a geração de novos modelos de automatizados para previsão e classificação
de variáveis geometalúrgicas.
(i) Melhor definição da mineralogia associada a cada partícula mineral. No banco de

dados inicial, do equipamento ore sorting, apenas a mineralogia mais presente na
partícula foi considerada. Sugere-se o uso de ábacos para definir melhor as proporções
de cada tipo mineralógico.
(ii) A utilização de mais sensores medindo outras propriedades físicas para o equipamento
ore sorting pode ser uma alternativa interessante para a criação de novas variáveis
que possam classificar melhor as partículas minerais.
(iii) A alta variabilidade das recuperações metalúrgicas diárias da usina sugerem reavaliar
os processos amostragem e planejamento mineral.
(iv) A partir do modelo de previsão da origem de partículas minerais, elaborar tecno-

logias para aplicação em diferentes componentes da usina, adequando o modelo
para outras granulometrias das partículas do minério. Desta forma, seria possível
obter informações geometalúrgicas automatizadas, ligando as origens dos domínios
geológicos com várias operações unitárias de beneficiamento.
Página 198
CAPÍTULO 6. CONSIDERAÇÕES FINAIS
(v) Obter informações de planejamento dos stopes, correlacionando não apenas o blend
de alimentação da usina, mas sim de cada região específica do depósito mineral, com
as informações de desempenho do beneficiamento mineral.
Página 199
Referências
AMIDI, A. Machine Learning tips and tricks cheatsheet. 2018. Disponível em: <https://
stanford.edu/~shervine/teaching/cs-229/cheatsheet-machine-learning-tips-and-tricks>.
Citado na página 58.
ARENILLAS, M. A. Distributed stochastic neighbor embedding. 2019. Disponível em:

<https://m-alcu.github.io/blog/2018/01/11/distributed-stochastic-neighbor-embedding/
>. Citado na página 71.
ASHANTI, A. Mineral resource and ore reserve report 2015. 2016. 104–108 p. Citado 3
vezes nas páginas 99, 103 e 104.
ASHLEY, K.; CALLOW, M. Ore variability: Exercises in geometallurgy. [S.l.]: Mining

Media, Inc., 2000. 24 p. Citado na página 39.
BALTAZAR, O.; ZUCCHETTI, M. Lithofacies associations and structural evolution of

the Archean Rio das Velhas greenstone belt, Quadrilátero Ferrífero, Brazil: A review of the
setting of gold deposits. [S.l.]: Elsevier, 2007. 471–499 p. Citado 3 vezes nas páginas 99,
100 e 102.
BIERLEIN, F. P. et al. Lithospheric controls on the formation of provinces hosting giant

orogenic gold deposits. [S.l.]: Springer, 2006. 874 p. Citado na página 100.
BISHOP, C. M. Pattern recognition and machine learning. [S.l.]: Springer, 2006. Citado 7
vezes nas páginas 59, 74, 76, 77, 78, 80 e 81.
BOWELL, R. et al. Geometallurgy of uranium deposits. [S.l.]: Elsevier, 2011. 1305–1313 p.

BREIMAN, L. Some properties of splitting criteria. [S.l.]: Springer, 1996. 41–47 p. Citado
na página 83.
BROWNLEE, J. How to transform data to better fit the normal dis-

tribution. 2019. Disponível em: <https://machinelearningmastery.com/
how-to-transform-data-to-fit-the-normal-distribution/>. Citado na página
72.
CARRASCO, P.; CHILES, J.-P.; SÉGURET, S. A. Additivity, metallurgical recovery, and

grade. 2008. on–CD p. Citado 5 vezes nas páginas 50, 52, 56, 57 e 158.
CHAVES, A. P. Teoria e prática do tratamento de minérios. [S.l.]: Signus, 2006. Citado 3

vezes nas páginas 54, 55 e 56.
COVER, T.; HART, P. Nearest neighbor pattern classification. [S.l.]: IEEE, 1967. 21–27 p.
COWARD, S. et al. The primary-response framework for geometallurgical variables. 2009.

109–113 p. Citado 3 vezes nas páginas 48, 49 e 50.
REFERÊNCIAS
COX, T. F.; COX, M. A. Multidimensional scaling. [S.l.]: Chapman and hall/CRC, 2000.
Citado 2 vezes nas páginas 84 e 85.
DEUTSCH, J. L. et al. Spatial modeling of geometallurgical properties: techniques and a

case study. [S.l.]: Springer, 2016. 161–181 p. Citado 3 vezes nas páginas 49, 50 e 52.
DORR, J. V. N. Revisão da estratigrafia pré-cambriana do Quadrilátero Ferrífero. [S.l.]:

Ministerio da Agricultura, 1957. Citado na página 101.
FISHER, R. The use of multiple measurements in taxonomic problems. 1936. 179-188 p.

GOOVAERTS, P. Geostatistics for natural resources evaluation. [S.l.]: Oxford University

Press on Demand, 1997. Citado 2 vezes nas páginas 72 e 73.
GREGORY, M. J. et al. Geometallurgy of the pebble porphyry copper-gold-molybdenum

deposit, Alaska: Implications for gold distribution and paragenesis. [S.l.]: Society of
Economic Geologists, 2013. 463–482 p. Citado na página 40.
GÜLCAN, E.; GÜLSOY, Ö. Y. Performance evaluation of optical sorting in mineral

processing–A case study with quartz, magnesite, hematite, lignite, copper and gold ores.
[S.l.]: Elsevier, 2017. 129–141 p. Citado 2 vezes nas páginas 96 e 97.
HEARST, M. A. et al. Support vector machines. [S.l.]: IEEE, 1998. 18–28 p. Citado na
página 80.
HUNTER, S. K.; STEVENS, A. A. Sex differences in marathon running with advanced

age: physiology or participation? 2013. 148–156 p. Citado na página 73.
JAIN, A. K.; MURTY, M. N.; FLYNN, P. J. Data clustering: a review. [S.l.]: Acm, 1999.
264–323 p. Citado 2 vezes nas páginas 85 e 86.
JOLLIFFE, I. T. Principal component analysis and factor analysis. [S.l.]: Springer, 1986.
115–128 p. Citado 2 vezes nas páginas 66 e 67.
JONG, T. P. D. DE-XRT sorting of coal. 2006. Citado na página 92.
JOURNEL, A. G. Nonparametric estimation of spatial distributions. [S.l.]: Springer, 1983.

445–468 p. Citado na página 52.
JOURNEL, A. G.; HUIJBREGTS, C. J. Mining geostatistics. [S.l.]: Academic press, 1978.

KETELHODT, L. V.; BERGMANN, C. Dual energy x-ray transmission sorting of coal.

2010. 371–378 p. Citado na página 97.
KING, G.; ZENG, L. Logistic regression in rare events data. [S.l.]: Cambridge University
Press, 2001. 137–163 p. Citado na página 78.
KNAPP, H. et al. Viable applications of sensor-based sorting for the processing of mineral
resources. [S.l.]: Wiley Online Library, 2014. 86–95 p. Citado na página 97.
KOTSIANTIS, S.; KANELLOPOULOS, D.; PINTELAS, P. Data preprocessing for

supervised leaning. [S.l.]: Citeseer, 2006. 111–117 p. Citado 2 vezes nas páginas 71 e 72.
Página 202
REFERÊNCIAS
LAMBERG, P. et al. Building a geometallurgical model in iron ores using a mineralogical

approach with liberation data. 2013. 317–324 p. Citado na página 40.
LARSEN, R. Decomposition using maximum autocorrelation factors. [S.l.]: Wiley Online
Library, 2002. 427–435 p. Citado na página 68.
LECHUTI-TLHALERWA, R.; COWARD, S.; FIELD, M. Embracing step-changes in
geoscientific information for effective implementation of geometallurgy. [S.l.]: The Southern
African Institute of Mining and Metallurgy, 2019. 355–360 p. Citado na página 40.
LEICHLITER, S. et al. Development of a predictive geometallurgical recovery model for
the La Colosa, Porphyry Gold Deposit, Colombia. 2011. 85–92 p. Citado na página 40.
LIMA, R. da S.; AFONSO, J. C.; PIMENTEL, L. C. F. Raios-X: fascinação, medo e
ciência. 2009. 263–270 p. Citado na página 89.
LISHCHUK, V. Geometallurgical programs : critical evaluation of applied methods and
techniques. 2016. Citado na página 48.
LISHCHUK, V. et al. Geometallurgical characterisation of Leveäniemi iron ore : Unlocking
the patterns. [S.l.]: Elsevier, 2019. 325–335 p. Citado na página 40.
LIU, H.; MOTODA, H. Computational methods of feature selection. [S.l.]: CRC Press,
2007. Citado na página 65.
LOBATO, L.; RIBEIRO, L.; VIEIRA, F. Brazil’s premier gold province. Part II: geology
and genesis of gold deposits in the Archean Rio das Velhas greenstone belt, Quadrilátero
Ferrífero. [S.l.]: Springer, 2001. 249–277 p. Citado na página 103.
LORENA, A. C.; CARVALHO, A. C. de. Uma introdução às support vector machines.
2007. 43–67 p. Citado 2 vezes nas páginas 79 e 80.
LUND, C.; LAMBERG, P. Geometallurgy : A tool for better resource efficiency. [S.l.]:
European Federation of Geologists, 2014. 39–43 p. Citado na página 40.
MAATEN, L. v. d.; HINTON, G. Visualizing data using t-SNE. 2008. 2579–2605 p.
MACFARLANE, A. Raising the geometallurgical flag. [S.l.]: The Southern African
Institute of Mining and Metallurgy, 2019. 5–6 p. Citado na página 40.
MAITRE, J.; BOUCHARD, K.; BÉDARD, L. P. Mineral grains recognition using
computer vision and machine learning. [S.l.]: Elsevier, 2019. 84–93 p. Citado 3 vezes nas
páginas 16, 87 e 88.
MALY, V. A study of matrices for high–intensity magnetic separators. [S.l.]: Hindawi,
MARTINS, B. de S. et al. The archean BIF-hosted Lamego gold deposit, Rio das Velhas
greenstone belt, Quadrilátero Ferrífero: Evidence for Cambrian structural modification of
an archean orogenic gold deposit. [S.l.]: Elsevier, 2016. 963–988 p. Citado 3 vezes nas
páginas 101, 102 e 103.
MATHERON, G. Principles of geostatistics. [S.l.]: SecG, 1963. 1246–1266 p. Citado 2
vezes nas páginas 50 e 52.
Página 203
REFERÊNCIAS
MATHERON, G. A simple substitute for conditional expectation: The disjunctive kriging.

[S.l.]: Springer, 1976. 221–236 p. Citado na página 52.
MCGINNIS, W. Target encoder. 2016. Disponível em: <http://contrib.scikit-learn.org/

categorical-encoding/targetencoder.html>. Citado na página 73.
MCHUGH, M. L. The chi-square test of independence. [S.l.]: Medicinska naklada, 2013.

143–149 p. Citado na página 53.
MONTOYA, P. et al. Geometallurgical modelling techniques applicable to prefeasibility

projects : La Colosa Case Study. 2011. 103–114 p. Citado na página 68.
MÜLLER, A. C.; GUIDO, S. et al. Introduction to machine learning with Python: A

guide for data scientists. [S.l.]: "O’Reilly Media, Inc.", 2016. Citado 6 vezes nas páginas
59, 60, 61, 63, 82 e 83.
NOCE, C. M.; TASSINARI, C.; LOBATO, L. M. Geochronological framework of the

Quadrilátero Ferrífero, with emphasis on the age of gold mineralization hosted in Archean
greenstone belts. [S.l.]: Elsevier, 2007. 500–510 p. Citado na página 101.
PARBHAKAR, A. Why data scientists love gaussian? 2019. Disponível em:

<hhttps://towardsdatascience.com/why-data-scientists-love-gaussian-6e7a7b726859>.
PRATI, R.; BATISTA, G.; MONARD, M. Curvas ROC para avaliação de classificadores.
RIVOIRARD, J. Introduction to disjunctive kriging and non-linear geostatistics. [S.l.]:

Clarendon Press, 1994. Citado na página 53.
ROSENBLATT, F. The perceptron: A probabilistic model for information storage and

organization in the brain. [S.l.]: American Psychological Association, 1958. 386 p. Citado
na página 41.
ROSS, V. Key aspects of bench flotation as a geometallurgical characterization tool. [S.l.]:

The Southern African Institute of Mining and Metallurgy, 2019. 361–367 p. Citado na
página 40.
ROSSUM, G. V.; JR, F. L. D. Python reference manual. [S.l.]: Centrum voor Wiskunde
en Informatica Amsterdam, 1995. Citado na página 42.
SAMUEL, A. L. Some studies in machine learning using the game of checkers. [S.l.]: IBM,
SEPULVEDA, E.; DOWD, P.; XU, C. Modelling geometallurgical response variables using
Projection Pursuit regression. 2015. 1-10 p. Citado na página 40.
SHU, L. et al. An automatic methodology for analyzing sorting level of rock particles. [S.l.]:
Elsevier, 2018. 97–104 p. Citado 2 vezes nas páginas 16 e 87.
SHWARTZ, S. S.; DAVID, S. B. Understanding machine learning: From theory to

algorithms. [S.l.]: Cambridge university press, 2014. Citado na página 57.
SIAMEH, T. Graph analytics methods in feature engineering. 2017. Citado na página 69.
Página 204
REFERÊNCIAS
SOARES, F. A. P. et al. Produção de raios X em ampolas radiográficas: estudo do

tomógrafo computadorizado do Hospital Regional de São José/SC. 2006. Citado na
página 91.
STRYDOM, H. The application of dual energy x-ray transmissions sorting to the

separation of coal from torbanite. 2011. Citado 2 vezes nas páginas 91 e 92.
SUORTTI, P. Effects of porosity and surface roughness on the X-ray intensity reflected
from a powder specimen. [S.l.]: International Union of Crystallography, 1972. 325–331 p.
TAGGART, A. F. Handbook of ore dressing. [S.l.]: J. Wiley & sons, Incorporated, 1927.
TURING, A. M. Intelligent machinery. [S.l.]: National Physical Laboratory, 1948. Citado

na página 41.
VIAL, D. et al. Smaller gold deposits in the Archean Rio das Velhas greenstone belt,
Quadrilátero Ferrífero, Brazil. [S.l.]: Elsevier, 2007. 651–673 p. Citado na página 100.
VIAL, D. S. et al. The geology of the Morro Velho gold deposit in the Archean Rio das
Velhas greenstone belt, Quadrilátero Ferrífero, Brazil. [S.l.]: Elsevier, 2007. 511–542 p.
WACKERNAGEL, H. Multivariate geostatistics: An introduction with applications. [S.l.]:

Springer Science & Business Media, 2013. Citado na página 51.
WASSERMAN, L. All of statistics: A concise course in statistical inference. [S.l.]: Springer

Science & Business Media, 2013. Citado na página 75.
WILLS, B. A.; FINCH, J. Wills’ mineral processing technology: an introduction to the

practical aspects of ore treatment and mineral recovery. [S.l.]: Butterworth-Heinemann,
2015. Citado na página 96.
ZHI-JIAN, T. The relation between geological-metallurgy and the explotaition of mineral

resources and enviromental protection. [S.l.]: Gold Geological Party, 2000. Citado na
página 39.
ZHOU, J. Y.; CABRI, L. J. Gold process mineralogy: Objectives, techniques, and

applications. [S.l.]: Springer, 2004. 49–52 p. Citado na página 40.
ZUO, R.; XIONG, Y. Big data analytics of identifying geochemical anomalies supported
by machine learning methods. [S.l.]: Springer, 2018. 5–13 p. Citado na página 88.
Página 205

Estimativa de variáveis geometalúrgicas por aprendizado de máquinas

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estimativa de variáveis geometalúrgicas por aprendizado de máquinas

Enviado por

Direitos autorais:

Formatos disponíveis

David Alvarenga Drumond

Estimativa e classificação de variáveis

Estimativa e classificação de variáveis geometalúrgicas a

Documento de qualificação submetido ao pro-

Universidade Federal do Rio Grande do Sul

Orientador: João Felipe Coimbra Leite Costa

Orientador: João Felipe Coimbra Leite Costa

Tese – Universidade Federal do Rio Grande do Sul

Agradeço aos amigos e colegas do laboratório, pelo companheirismo e ajuda nos

Figura 2 – Diferentes assuntos da geometalurgia relatados em um diagrama de

Figura 3 – Relação entre variáveis primárias e resposta metalúrgica. Variáveis pri-

Figura 6 – Exemplo de fluxograma da planta de Capivari, pertencente a antiga

Figura 7 – Exemplo de overfitting, underfitting e um modelo adequadamente ajus-

Figura 17 – Procedimento gráfico para transformação da função de distribuição dos

Figura 18 – Exemplificação da codificação de variáveis categóricas a partir da técnica

Figura 19 – Exemplo da determinação da superfície linear discriminante. Em (a),

Figura 20 – Exemplo da regressão logística. Curva negra representada pela função

Figura 21 – Minimização entre duas classes x1 e x2 pelo método do máquinas de

Figura 22 – Utilização de kernels para a transformação do espaço original dos dados.

Figura 23 – Exemplo de redes neurais. Valores de input dos dados à esquerda e

Figura 24 – Exemplo da utilização de vizinhos mais próximos para a classificação

Figura 26 – Demonstração da influência do número de vizinhos mais próximos na

Figura 27 – Exemplo da aplicação do florestas aleatórias. (a) À esquerda podemos

Figura 28 – Gráfico representando distâncias entre cidades da Inglaterra. Cada nó,

Figura 29 – Diferentes tipos de métricas para medida de similaridade e dissimilari-

Figura 30 – Utilização do agrupamento hierárquico para definição de grupos. Em

Figura 32 – Classificação de partículas minerais automática obtida por Maitre et

Figura 33 – Anomalias geoquímicas encontradas por 39 elementos utilizando apren-

Figura 35 – Transmissão em partículas de acordo com a sua espessura. I0 representa

Figura 36 – Transmissão em partículas de acordo com a sua densidade. I0 representa

Figura 37 – Figura demonstrativa da equação de lambert.Idet representa os raios

Figura 39 – Representação da simulação na transmissão de dois canais. Eixo x

Figura 41 – Imagem dos grãos a partir de simulações do raio x. Em (a) observamos

Figura 43 – Mapa regional da região sul do Cráton São Francisco. . . . . . . . . . . 100

Figura 44 – Mapa simplificado da geologia-estrutura da região do Quadrilátero

Figura 45 – Estratigrafia esquemática do depósito de Lamego baseado em mapea-

Figura 46 – Imagem em perfil do equipamento ore sorting. . . . . . . . . . . . . . . 105

Figura 47 – Imagem do grão a partir de simulações do raio x. Em (a) observamos a

Figura 48 – Planta de ore sorting em Santa Bárbara. . . . . . . . . . . . . . . . . . 107

Figura 52 – As amostras analisadas quanto a mineralogia são encapsuladas nesta

Figura 53 – Fluxograma do laboratório de processamento da Anglo Gold Ashanti .

Figura 54 – Circuito de cominuição e adequação granulométrica. (A) britagem, (B)

Figura 55 – Circuito de concentração. (A) concentração Falcon, (B) mesa vibratória

Figura 57 – Projeto de geometalurgia. Primeira etapa realizada pela Anglo Gold

Figura 58 – Fluxograma do projeto. Em (a), são realizadas amostragens. Em (b), é

Figura 60 – Representação das variáveis utilizadas no desenvolvimento desta tese.

Figura 61 – Matriz de confusão como a representação de partículas positivas (mi-

Figura 62 – Representação da precisão do modelo. Linhas fechadas representando

Figura 63 – Representação da revocação do modelo. Linhas fechadas representando

Figura 64 – Representação da especificidade do modelo. Linhas fechadas represen-

Figura 65 – Representação da acurácia do modelo. Linhas fechadas representando

Figura 138 – PCA para a produção de 15 dias em função da recuperação metalúrgica

Figura 139 – PCA para a produção de 20 dias em função da recuperação metalúrgica

Figura 140 – PCA para a produção de 30 das em função da recuperação metalúrgica

Figura 141 – Gráfico de resíduos para a regressão da recuperação metalúrgica de

Figura 142 – Gráfico de resíduos para a regressão da recuperação metalúrgica de

Figura 143 – Gráfico de resíduos para a regressão da recuperação metalúrgica de

Figura 144 – Gráfico de resíduos para a regressão da recuperação metalúrgica de

Figura 145 – Gráfico de resíduos para a regressão da recuperação metalúrgica de

Figura 146 – Gráfico de resíduos para a regressão da recuperação metalúrgica de

Figura 169 – Gráfico de resíduos para a regressão da recuperação metalúrgica de

Figura 170 – Gráfico de resíduos para a regressão da recuperação metalúrgica de

Figura 171 – Gráfico de resíduos para a regressão da recuperação metalúrgica de