Você está na página 1de 71

MODELOS

QUIMIOMÉTRICOS DE
1 FUSÃO DE DADOS
MARCELO M. SENA

Universidade Federal de Minas Gerais

marcsen@ufmg.br
MÓDULO 2

APLICAÇÕES DE
2

FUSÃO DE
DADOS
Aplicação 1: Dados Cromatográficos

Artigo de Fusão de
Dados + citado em QA:
153 citações em
3
agosto/2019

− Detecção de fraudes em uma formulação medicinal


chinesa: “Danshen Dropping Pill” (DSDP)

− Fusão de baixo nível de dados cromatográficos


(picos/fingerprints).

− Modelo PCA.
Aplicação 1: Dados Cromatográficos
− HPLC: Cromatogramas obtidos para dois tipos de
compostos:

4
(I) Deepside (II) Saponinas

− Fingerprints I e I obtidos em diferentes condições


e usando 2 tipos de detecção: UV e MS

− Simples fusão dos vetores contendo as áreas dos


picos obtidas nas duas condições
Aplicação 1: Dados Cromatográficos

UV

MS
Aplicação 1: Dados Cromatográficos

PCA

6
Aplicação 2: Cerveja (5 Técnicas)

7
Aplicação 2: Cerveja (5 Técnicas)
Reale, Birra del Borgo
(Roma, Itália)
American Pale Ale
8

• Caracterização e Discriminação de uma cerveja artesanal de


alto valor agregado
• 5 Técnicas analíticas: Termogravimetria, Espectroscopias no
MIR, NIR, UV e Visível
• 60 amostras no total. 31 de Birra del Borgo, sendo 19 Reale e
12 representativas de outras ales do mesmo produtor. 29 ales
de outros produtores europeus
• Modelos PLS-DA e SIMCA. Fusão de Dados apenas c/ PLS-DA
Aplicação 2: Cerveja (5 Técnicas)
Amostras

9
Aplicação 2: Cerveja (5 Técnicas)
Sinais Termogramas MIR

Analíticos

10

NIR UV

Visível
Aplicação 2: Cerveja (5 Técnicas)
Resultados PLS-DA (Técnicas Individuais):

11

Resultados PLS-DA (Fusão de Dados):


Aplicação 2: Cerveja (5 Técnicas)
VIP Escores Termogramas MIR

12

NIR UV

Visível
Aplicação 2: Cerveja (5 Técnicas)
Resultados SIMCA (Técnicas Individuais):

13

Modelo SIMCA UV

ZOOM
Aplicação 2: Cerveja (5 Técnicas)
CONCLUSÕES:

• Melhor Modelo: PLS-DA Fusão de Dados de nível médio


• Não foi feita Fusão de Dados p/ modelos SIMCA (!?)
14
• Melhor modelo SIMCA: Espectros UV
• Interpretação dos dados: Proteínas, Ésteres e Cor são
discriminantes
Aplicação 3: Café/PCR (Contraexemplo)

15
Aplicação 3: Café/PCR

• Modelos de classificação (PCA-LDA) e calibração (PCR,


chamado pelos autores de “PCA-MLR”) para detectar
adulteração de cafés Arabica com café Robusta
16
• Fusão (níveis baixo e médio) de espectros de fluorescência
sincronizada (synchronous fluorescence) e UV/vis
• 33 amostras de diferentes países, sendo 25 Arabica e 8
Robusta
• Quatro séries de misturas experimentais utilizando diferentes
preparos que refletem as práticas de mercado
• 147 misturas na faixa de 0 a 100% m/m (Robusta/Arabica)
para o modelo de calibração
Aplicação 3: Café/PCR

Fluorescência

17

Espectros UV/Vis
Aplicação 3: Café/PCR
• Muitas deficiências neste trabalho, principalmente em
relação ao desenvolvimento dos modelos
• Não houve separação em conjuntos de calibração e
18 validação. Portanto, não houve validação independente
• A validação cruzada foi realizada de 2 formas (leave-one-out
e reamostragem), embora não fique claro, no texto, qual das
duas formas forneceu o menor valor de RMSECV
• O artigo não forneceu nenhum gráfico de linearidade ou
maiores detalhes sobre os resultados para a previsão das
amostras
• Maior problema: No absurdo de CPs usadas nos modelos,
superior a 30 e chegando a 38 p/ o dito melhor modelo
Aplicação 3: Café/PCR
Comparação entre Modelos:

19
Aplicação 4: Óleo de transformador (3 Técnicas)

20
Aplicação 4: Óleo de transformador (3 Técnicas)

TRANSFORMADORES

21

- papel tipo Kraft


Sistema
Isolante:
- óleo mineral
Aplicação 4: Óleo de transformador (3 Técnicas)

TRANSFORMADORES

Monitoramento das condições de


22 degradação: O2, temperatura, umidade

importância
papel óleo

técnicas analíticas, ensaios


físico-químicos e medidas
elétricas
Aplicação 4: Óleo de transformador (3 Técnicas)

TRANSFORMADORES

23
Papel Medida do Grau de Polimerização (GP)

- Análise de Gás dissolvido (DGA)


Óleo - Análise de Furanos

Ensaios Físico-Químicos

Tensão
Interfacial
Aplicação 4: Óleo de transformador (3 Técnicas)

TRANSFORMADORES

Tensão mede Concentração de


24
Interfacial indiretamente substâncias polares no óleo

oxidação tensão
do sistema interfacial
Aplicação 4: Óleo de transformador (3 Técnicas)

• Determinação da Tensão Interfacial e da Cor de amostras de


Óleos de Transformador
• Fusão de nível baixo e seleção de variáveis (VIP scores)
25
utilizando 3 técnicas analíticas: NIR, RMN de 1H e
fluorescência (emissão)
• 100 amostras de óleo de transformador obtidas da CELG
(Companhia Elétrica de GO), nos mais variados estados de
degradação (1 a 30 anos)
• Faixa de Tensão Interfacial: 17 a 46 mN/m; Cor: 0,5 a 6,0
Aplicação 4: Óleo de transformador (3 Técnicas)
- Método de referência:
- Tensiômetro de torção Kruss modelo K8

26

- Método padrão (NBR 6234) possui baixa precisão e é


relativamente demorado
Aplicação 4: Óleo de transformador (3 Técnicas)

ESPECTROS NIR

27
Aplicação 3: Óleo de transformador (3 Técnicas)

ESPECTRO MÉDIO RMN

28
Aplicação 4: Óleo de transformador (3 Técnicas)

Mapas de Contorno de Fluorescência de algumas amostras

29
Aplicação 3: Óleo de transformador (3 Técnicas)

LINEARIDADE DOS MODELOS

Tensão Interfacial COR


30
Aplicação 4: Óleo de transformador (3 Técnicas)

RESULTADOS
31
APLICAÇÃO 5: Carne Bovina in natura

UTILIZAÇÃO DE ESPECTROSCOPIA NO
INFRAVERMELHO MÉDIO E FUSÃO DE
32 DADOS NA ANÁLISE DE FRAUDES EM
CARNE BOVINA IN NATURA

Karen M. Nunes (Mestrado)


APLICAÇÃO 5: Carne Bovina in natura
OPERAÇÃO VACA ATOLADA (POLÍCIA FEDERAL, 2012):
5 frigoríficos na Região Metropolitana de Belo Horizonte

33

• Fraudes por adição de ingredientes não cárneos: NaCl, fosfatos,


carragena, maltodextrina, colágeno.
• Visando o aumento da capacidade de retenção de água da carne
(Water Holding Capacity).
APLICAÇÃO 5: Carne Bovina in natura
AMOSTRAS: 43 amostras adulteradas e 12 controles, de 6
diferentes cortes de carne.

34

• 5 parâmetros físico-químicos analisados: Proteínas, Cinzas,


Sódio, Cloreto e Fosfato.
• Espectros ATR-FTIR, 4000-525 cm-1.
0.45

0.4

0.35

0.3

0.25
A b so rb an ce

0.2

0.15

0.1

0.05

-0.05
4000 3500 3000 2500 2000 1500 1000 500
Wavenumber (cm-1)
APLICAÇÃO 5: Carne Bovina in natura
RESULTADOS: Foram construídos modelos (i) somente c/ os
dados físico-químicos, (ii) somente c/ os espectros, de fusão de
dados completa (iii) de baixo e (iv) médio nível, e (v) de fusão de
dados com seleção de variáveis por VIPscores (Cl- mais 8 picos
35 espectrais selecionados).
• O melhor modelo foi o de fusão de dados completa de baixo nível.
1.4

Suspeitas de Fraude
Treinamento Controle
1.2 Threshold
Y Predito (Amostras Suspeitas de Fraude)

1
Teste

0.8

0.6

0.4

0.2

0
5 10 15 20 25 30 35 40 45 50 55
Amostra
APLICAÇÃO 5: Carne Bovina in natura
RESULTADOS:
Falso Falso Falso Falso
Eficiência Eficiência Negativo Positivos Negativo Positivos
Modelo
(treinamento) (teste)
(treinamento) (treinamento) (teste) (teste)
36

FQ 83,3% 84,6% 5 0 2 0

FTIR 45,8% 51,9% 5 3 3 1

Fusão
completa 93,3% 84,6% 2 0 2 0
(baixo nível)

Fusão c/
70,8% 84,6% 5 1 2 0
sel. de vars
APLICAÇÃO 5: Carne Bovina in natura
VIPscores das variáveis espectrais do modelo de fusão de dados completo
entre 890 e
930 cm-1
1690 e 1230 cm-1
VIP Scores para Y (Amostras Suspeitas de Fraude)

tripolifosfato
vibrações de agregados
5
de sódio
37
de folhas-beta de proteínas

2916
4 cm-1 1220 cm-1
deformação axial éster sulfato da
assimétrica
3
de CH2 carragena

0
3500 3000 2500 2000 1500 1000

Variável
605 cm-1
vibração esquelética
o anel piranóide de
Maltodextrina
APLICAÇÃO 5: Carne Bovina in natura
CONCLUSÃO:
• O melhor modelo de classificação foi obtido por fusão de
dados utilizando todas as variáveis. No entanto, um modelo
que utilizou seleção de variáveis obteve resultados um
38 pouco inferiores usando apenas um parâmetro físico-químico
(Cl-) e 8 picos espectrais, representando uma boa razão
custo/benefício.
APLICAÇÃO 6: Autenticidade de Cafés

39

Camila Assis Prof. Leandro


Oliveira
ARÁBICA versus ROBUSTA

O Café é uma matriz


química complexa

40

As duas mais importantes


espécies de café são: Arábica
(Coffea arabica) (56%) e
Robusta (Coffea canephora)
(44%). Cafés Arábica são 20-
25% mais caros

Cafés Arábica são alvo de


fraude por adulteração
com Robusta
CAFÉ

41
TÉCNICAS ANALÍTICAS

Método oficial para análise de café


(AOAC): baseado em HPLC
42

Métodos alternativos baseados


em espectroscopia vibracional
combinada com quimiometria,
como FTIR
OBJETIVO
− Construir modelos de calibração multivariada
(PLS) para quantificar o teor de Café Robusta em
43
blendas com Café Arábica, utilizando diferentes
técnicas analíticas

− Otimizar os modelos usando Seleção de


Variáveis.

− Comparar modelos obtidos com técnicas


individuais com modelos de Fusão de Dados.
TÉCNICAS ANALÍTICAS
− Espectroscopia no Infravermelho Médio (ATR-
FTIR)
44

− Espectroscopia no Infravermelho Próximo (NIRS)

− Espectrometria de Massas com Ionização por


Paper Spray (PS-MS)

− Fluorescência de Raios-X por Reflectância Total


(TXRF)
PARTE EXPERIMENTAL
Grãos verdes secos e descascados obtidos de
diferentes produtores de Arábica (30) e Robusta
(10)

45
Amostras torradas em 3 níveis: leve/185oC,
médio/195oC, e forte/205oC (N=40 p/ cada nível)

Amostras torradas foram moídas e peneiradas


(40 mesh)

Blendas (10 g) preparadas na faixa de 0-33%


(passo 1%) de Robusta
MELHOR MODELO INDIVIDUAL
ATR-FTIR, OPS-PLS (310 variáveis)
RMSEC = 1,2% RMSEP = 1,8%

46
MELHOR MODELO INDIVIDUAL

47
FUSÃO DE DADOS: MELHORES MODELOS

48
1º MODELO

ATR-FTIR + PS-MS
PARTE EXPERIMENTAL
ATR-FTIR PS-MS

49

IRAffinity-1S Shimadzu
com acessório de ATR (ZnSe) Thermo LCQ FLEET – Ion trap
Faixa: m/z 100-500
Faixa: 4000 a 800 cm-1
Modo Positivo

Amostras: misturas de pós Amostras: extratos em água


quente
Espectrometria de Massas por Ionização
Ambiente
Métodos modernos baseados em MS são usados na
caracterização de matrizes complexas
MS fornece informação molecular específica através da
50
interpretação dos fingerprints obtidos

Na busca por simplificação no pré-tratamento da amostra,


diversas técnicas MS de ionização ambiente foram
desenvolvidas nos últimos anos (EASI, DESI, DART, etc.)
Paper Spray Mass Spectrometry (PS-MS)
Uma técnica de ionização ambiente desenvolvida em 2010
Esta é uma técnica simples e de baixo custo que tem sido aplicada a
matrizes complexas, consumindo mínimos volumes de solventes

51

No Brasil:
Prof. Rodinei
Augusti (UFMG) R.G. Cooks
Paper Spray Mass Spectrometry (PS-MS)

O substrato poroso usado em PS-MS pode reter


alguns compostos interferentes das matrizes
complexas, minimizando efeitos de matriz e de
52

supressão iônica, e aumentando a eficiência de


ionização

S. Maher et al., Scientific Reports 6:35643 (2016).


ESPECTROS

ATR-FTIR PS-MS

53

Pre-processamento: MSC e centrar na média (FTIR); centrar na


média (MS); autoescalamento (Fusão de Dados)
RESULTADOS PLS

54

O melhor modelo de Fusão de Dados (OPS/baixo nível) foi


ligeiramente melhor que o modelo construído somente com
espectros FTIR, mas muito melhor que o modelo construído
somente com espectros PS-MS.
RESULTADOS PLS

55
VARIÁVEIS SELECIONADAS

IR: 111 variáveis


56
MS: 119 variáveis

Redução de 2.202
(espectro inteiro) para 230
(10,5%) variáveis

Muitas das variáveis selecionadas por MS foram atribuídas com


base na literatura, sendo relacionadas a componentes específicos
do café, como trigonelina, cafeína, ácidos clorogênicos,
kaempferol, arabinose, sacarose, ácido quínico, etc.
APLICAÇÃO 6: Autenticidade de Cafés

57
FUSÃO DE DADOS: MELHORES MODELOS

58
2º MODELO

NIRS + TXRF
Fluorescência de Raios-X por Reflexão Total (TXRF)

59
PARTE EXPERIMENTAL
NIRS TXRF

60

Espectrômetro de TXRF
RED-Wave-NIRX-SR S2 PICOFOX™ da Bruker
Portátil com tubo de Mo
Faixa: 900 a 2000 nm
Elementos analisados (14): P,
S, Cl, K, Ca, Ti, Mn, Fe, Ni, Cu,
Zn, Br, Rb, Sr
ESPECTROS NIR

61
RESULTADOS PLS
Pre-processamento: MSC e centrar na média (NIRS);
autoescalamento (TXRF)
Robusto
62
GA OPS
Modelos de Fusão de Nível nVL 6 6
Baixo um pouco melhores nvars 32 55
do que modelos de Fusão
RMSEC (%) 0.9 1.5
de Nível Médio
Rc 0.99 0.98
RMSECV (%) 1.3 2.2
Rcv 0.98 0.95
RMSEP (%) 1.5 1.8
Rp 0.98 0.97
RESULTADOS PLS

63
VARIÁVEIS SELECIONADAS (NIR)

64
VARIÁVEIS SELECIONADAS (TXRF)

65

4 dos 14 elementos/variáveis selecionados por GA:


K, Mn, Fe, Br

Comparação c/ a literatura: Poucos artigos (2) indicando P,


K, Mn, Cu e Mo como discriminantes entre espécies de café.

- Martin et al., Anal. Chim. Acta (1998): ICP-AES


- Santato et al., J. Mass Spectr. (2012): ICP-MS e IRMS
Manuscrito a ser submetido

A data fusion model merging information from


near infrared spectroscopy and X-ray
66
fluorescence. Searching for atomic-molecular
correlations to characterize the composition of
coffee blends

Analytica Chimica Acta


CONCLUSÕES
Modelos de fusão de dados forneceram melhores
resultados do que modelos construídos com dados de
técnicas individuais.
67
Todos os modelos foram otimizados por seleção de
variáveis e os métodos OPS e GA forneceram os
melhores resultados.
Fusão de baixo nível um pouco melhor do que de nível
médio.
Modelos de Fusão de Dados permitiram caracterizar as
amostras, sendo interpretados espectralmente.
Particularmente, o modelo NIRS+TXRF permitiu
encontrar correlações entre composição molecular e
atômica.
OUTRAS APLICAÇÕES DE FUSÃO ATÔMICO-
MOLECULAR

Fusão de Raman e LIBS p/ a detecção de explosivos,


usando modelos discriminantes baseados em medidas de
correlação e dissimilaridade
68
OUTRAS APLICAÇÕES DE FUSÃO ATÔMICO-
MOLECULAR

Fusão de NIRS, MIRS e ICP-OES p/ a construção de


modelos PCA e PLS-DA visando a classificação de amostras
de grão de cacau de acordo com sua origem (país/região)
69
OUTRAS APLICAÇÕES DE FUSÃO ATÔMICO-
MOLECULAR

Fusão de NIRS e EDXRF p/ a construção de modelos PLS


visando a quantificação de nutrientes em folhas de oliva

70
AGRADECIMENTOS

71

Você também pode gostar