Você está na página 1de 135

UNIVERSIDADE FEDERAL DE MINAS GERAIS UFMG

INSTITUTO DE CINCIAS EXATAS ICEX


DEPARTAMENTO DE QUMICA

Bruno Gonalves Botelho

Desenvolvimento e validao de mtodos para


anlise direta de alimentos usando ferramentas
quimiomtricas, espectroscopia no infravermelho e
imagens digitais

Belo Horizonte
2014

UFMG-ICEx/DQ.XXXX
T.473.

Bruno Gonalves Botelho

Desenvolvimento e validao de mtodos para anlise direta de alimentos


usando ferramentas quimiomtricas, espectroscopia no infravermelho e
imagens digitais

Tese
apresentada
ao
Departamento de Qumica do
Instituto de Cincias Exatas da
Universidade Federal de Minas
Gerais como requisito parcial
para a obteno do grau de
Doutor em Cincias - Qumica

Belo Horizonte
2014

(FICHA CATALOGRFICA)

(ATA DE DEFESA)

AGRADECIMENTOS
Gostaria de agradecer primeiramente minha famlia, por todo apoio
dispensado no s nesses quatro anos, mas ao longo de toda a minha vida
acadmica.
Keila, minha noiva e companheira, que dividiu comigo as alegrias e os
perengues enfrentados nesse doutorado. E ao Bolinha, que, nos privou de
algumas horas de sono, mas a cada sorriso banguela, faz tudo valer a pena.
Ao Marcelo, que alm de orientar e transmitir conhecimento, sempre se
mostrou preocupado com minha formao moral e profissional com relao ao
meio acadmico.
Aos companheiros de grupo, incluindo a Cris, que dividiram comigo
todos os momentos alegres e alguns momentos tensos, algumas roubadas em
congressos, e que tambm contriburam para minha formao profissional e
crescimento como pessoa.
Ao IMA, por permitir a utilizao do seu espao, equipamentos e
infra-estrutura, e em especial Bruna, que tanto nos auxiliou no incio desde o
incio desse projeto
Aos professores DQ, em especial aos professores da Analtica, por todo
o conhecimento transmitido.
Aos funcionrios do DQ, em especial s funcionrias da secretaria de
ps graduao, que sempre estavam dispostas a nos ajudar.
Aos amigos de longa data, que, mesmo no entendendo nada de
quimiometria, sempre estavam dispostos a tomar cerveja!
E aos rgos de fomento, que tornaram a realizao desta tese possvel.

No! Tentar no!


Faa.
Ou no faa.
Tentativa no h.
Mestre Yoda

Sumrio

1. Introduo ..................................................................................................... 1
2. Reviso bibliogrfica ................................................................................... 3
2.1 INTERAO LUZ/MATRIA

2.2 ESPECTROSCOPIA VIBRACIONAL

2.2.1 OSCILAO HARMNICA E ANARMNICA ...................................................................................... 4

2.3 ESPECTROSCOPIA NO INFRAVERMELHO PRXIMO (NIRS)

2.4 ESPECTROSCOPIA NO INFRAVERMELHO MDIO (MIRS)

2.5 ANLISE DE IMAGENS DIGITAIS

10

2.6 QUIMIOMETRIA

12

2.6.1 CALIBRAO MULTIVARIADA ..................................................................................................... 12


2.6.2 MNIMOS QUADRADOS PARCIAIS (PLS) ...................................................................................... 13
2.6.3 N-PLS................................................................................................................................... 15
2.6.5 PLS-DA ................................................................................................................................ 17
2.6.6 QUIMIOMETRIA APLICADA ANLISE DE ALIMENTOS..................................................................... 18

2.7 VALIDAO ANALTICA MULTIVARIADA

19

2.7.1 DETECO DE AMOSTRAS ANMALAS (OUTLIERS)......................................................................... 19


2.7.2 SINAL ANALTICO LQUIDO (NAS) E CURVAS PSEUDOUNIVARIADAS .................................................. 20
2.7.3 FIGURAS DE MRITO (FOM) ..................................................................................................... 21
2.7.4 VALIDAO QUALITATIVA MULTIVARIADA.................................................................................... 29
2.7.5 MONITORAMENTO PS-MODELO .............................................................................................. 32

3. Modelos para o controle fiscal de queijos utilizando espectroscopia NIR


e PLS ............................................................................................................... 34
3.1 DETERMINAO DE UMIDADE E GORDURA EM QUEIJOS MUARELA

34

3.1.2 OBJETIVOS ............................................................................................................................. 37


3.1.3 MATERIAIS E MTODOS ............................................................................................................ 37
3.1.4 RESULTADOS E DISCUSSO ........................................................................................................ 38

3.2. DETERMINAO
PLS

DE UMIDADE EM QUEIJOS MINAS ARTESANAL UTILIZANDO

NIR E
53

3.2.1 OBJETIVOS ............................................................................................................................. 54


3.2.2 MATERIAL E MTODOS ............................................................................................................. 55
3.2.3 RESULTADOS E DISCUSSO ........................................................................................................ 55

3.3 CONCLUSO

64

4. Desenvolvimento de um mtodo de triagem para a deteco simultnea


de cinco adulterantes em leite cru utilizando infravermelho mdio e PLSDA .................................................................................................................... 66
4.1 INTRODUO

66

4.2 OBJETIVOS

68

4.3 MATERIAIS E MTODOS

68

4.3.1 EQUIPAMENTOS E SOFTWARES .................................................................................................. 68


4.3.2 AMOSTRAS E REAGENTES.......................................................................................................... 68
4.3.3 PROCEDIMENTO...................................................................................................................... 69

4.4 RESULTADOS E DISCUSSO

71

4.4.1 ESPECTROS DE INFRAVERMELHO ................................................................................................ 71


5.4.2 MODELOS PLS-DA ................................................................................................................. 74
4.4.3 VALIDAO QUALITATIVA MULTIVARIADA.................................................................................... 78

4.5 CONCLUSO

80

5. Determinao do corante amarelo crepsculo em bebidas no


alcolicas utilizando anlise multivariada de imagens .............................. 81
5.1 INTRODUO

81

5.2 OBJETIVOS

82

5.3 MATERIAIS E MTODOS

83

5.3.1 EQUIPAMENTOS E SOFTWARES .................................................................................................. 83


5.3.2 AMOSTRAS ............................................................................................................................ 83
5.3.3 PROCEDIMENTO...................................................................................................................... 83

5.3.4 ANLISES CROMATOGRFICAS

85

5.4 RESULTADOS E DISCUSSO

85

5.4.1 MODELO PLS ......................................................................................................................... 85


5.4.2 VALIDAO ANALTICA MULTIVARIADA ...................................................................................... 88
5.4.3 -TI ...................................................................................................................................... 91

5.5 CONCLUSES

92

6. Telefone celular como instrumento de aquisio de imagens para


modelos multivariados: Determinao do corante vermelho 40 em balas
duras ............................................................................................................... 93
6.2 OBJETIVOS

96

6.3 MATERIAIS E MTODOS

96

6.3.1 EQUIPAMENTOS E SOFTWARES .................................................................................................. 96


6.3.2 AMOSTRAS ............................................................................................................................ 97
6.3.3 PROCEDIMENTO...................................................................................................................... 97

6.4 RESULTADOS E DISCUSSO

100

6.4.1 MODELO PLS/RGB

100

6.4.2 MODELO N-PLS/FFT ............................................................................................................ 100


6.4.3 VALIDAO ANALTICA MULTIVARIADA ..................................................................................... 101

6.4.4 -TI .................................................................................................................................... 104

6.5 CONCLUSES

105

7 Concluses Gerais .................................................................................... 106


8 Referncias Bibliogrficas ....................................................................... 107

ndice de Figuras
Figura 1 Representao esquemtica dos modelos do oscilador harmnico e
anarmnico1 ....................................................................................................... 5
Figura 2 Representao grfica do sistema RGB ......................................... 10
Figura 3 Formao de tons no sistema RGB ................................................ 11
Figura 4 - Decomposio de um arranjo multidimensional atravs do modelo
N-PLS ............................................................................................................... 15
Figura 5 - Representao esquemtica da decomposio da matriz Y atravs
do modelo NPLS .............................................................................................. 16
Figura 6 Representao vetorial do NAS ...................................................... 20
Figura 7 Butirmetro de Gerber..................................................................... 35
Figura 8 Espectros das 123 amostras de queijo muarela ............................ 39
Figura 9 - Espectros de queijo muarela pr-processados com MSC.............. 40
Figura 10 Coeficientes de regresso para o modelo de determinao de
gordura em queijo muarela ............................................................................. 41
Figura 11 - Coeficientes de regresso para o modelo de determinao de
umidade em queijo muarela ........................................................................... 41
Figura 12 Grfico de resduos vs. valores preditos para o modelo de
determinao de gordura amostras de calibrao () e de validao () ..... 44
Figura 13 - Grfico de resduos vs. valores preditos para o modelo de
determinao de umidade amostras de calibrao () e de validao () .... 44
Figura 14 Curva de valores de referncia vs. norma do NAS para o modelo
de determinao de gordura - amostras de calibrao () e de validao () . 46
Figura 15 - Curva de valores de referncia vs. norma do NAS para o modelo de
determinao de umidade - amostras de calibrao () e de validao () ..... 46
Figura 16 Erros relativos das amostras de validao para o modelo de
determinao de gordura ................................................................................. 47
Figura 17 - Erros relativos das amostras de validao para o modelo de
determinao de umidade ................................................................................ 48
Figura 18 Efeitos do teste de robustez, de acordo com um planejamento 22 50

Figura 19 - Erro amostral especfico de predio das amostras de validao


para o modelo de determinao de gordura - valores de referncia () e valores
preditos (*) ........................................................................................................ 51
Figura 20 - Erro amostral especfico de predio das amostras de validao
para o modelo de determinao de umidade - valores de referncia () e
valores preditos (*) ........................................................................................... 51
Figura 21 Carta de controle para monitorar a estabilidade do modelo de
determinao de gordura ................................................................................. 52
Figura 22 - Carta de controle para monitorar a estabilidade do modelo de
determinao de umidade ................................................................................ 53
Figura 23 Espectros das amostras de queijo minas artesanal ...................... 56
Figura 24 Espectros de queijo minas artesanal pr-processados com MSC 56
Figura 25 Coeficientes de regresso para o modelo de determinao de
umidade em queijo minas artesanal ................................................................. 57
Figura 26 - Grfico de resduos vs. valores preditos para o modelo de
determinao de umidade amostras de calibrao () e de validao () .... 60
Figura 28 - Erros relativos das amostras de validao para o modelo de
determinao de umidade ................................................................................ 61
Figura 29 Erro amostral especfico de predio para as amostras de
validao valores de referncia () e valores preditos (*) ............................. 62
Figura 30 Carta de controle da estabilidade do modelo para determinao de
umidade em queijo minas artesanal ................................................................. 63
Figura 31 Espectros de infravermelhos de todas as amostras de leite cru
bovino (amostras brancas, adulteradas com um nico adulterantes e
adulteradas com as misturas de adulterantes) ................................................. 72
Figura 32 Espectro de infravermelho mdio de (a) amostra branca; (b)
adulterao com gua (10,0 % p/v); (c) adulterao com amido (10,0 % p/v); (d)
adulterao com citrato de sdio (10,0 % p/v); (e) adulterao com formol
(10,0 % p/v); (f) adulterao com sacarose (10,0 % p/v). A regio espectral
utilizada para a construo dos modelos est delimitada pelas linhas tracejadas
......................................................................................................................... 73
Figura 33 Grficos de previso para adulteraes com (a) gua; (b) amido;
(c) citrato de sdio; (d) formol; (e) sacarose.  - Amostras Brancas;  adulterao com gua;  - Adulterao com amido; - Adulterao com
citrato;  - Adulterao com formol;  - Adulterao com sacarose.
Marcadores cheios Amostras de treinamento; Marcadores vazios Amostras
teste ................................................................................................................. 76
Figura 34 VIP escores para os modelos de deteco de adulterao de leite
cru com (a) gua; (b) amido; (c) citrato; (d) formol; (e) sacarose ..................... 77
Figura 35 Estrutura qumica do Amarelo Crepsculo ..................................... 82
Figura 36 Escner CanoScan LiDE 110 com o anteparo .............................. 84
Figura 37 Imagem adquirida de uma amostra de refrigerante....................... 84

Figura 38 Representao esquemtica da decomposio matemtica das


imagens ............................................................................................................ 85
Figura 40 Coeficientes de regresso do modelo PLS para determinao de
AC em bebidas no alcolicas ......................................................................... 87
Figura 41 Grfico de valores de referncia vs. valores preditos. Calibrao
(quadrados) e validao (tringulo) .................................................................. 90
Figura 42 Intervalos de confiana para a predio das amostras de validao,
estimados com base no EAEP. Valores preditos (tringulos) e de referncia
(crculos)........................................................................................................... 91
Figura 43 - -TI estimados para o modelo (linhas azuis) e erros mximos
relativos definidos pelo guia de validao brasileiro (linhas vermelhas) .......... 92
Figura 44 Estrutura molecular do vermelho 40.............................................. 95
Figura 45 Celular Motorola RAZR, empregado como instrumento para a
aquisio das imagens ..................................................................................... 96
Figura 46 Cmara de aquisio de imagens (vista superior fechada)........... 98
Figura 49 Imagem obtidas pelo celular de uma das amostras de bala
analisadas ...................................................................................................... 100
Figura 50 Grfico de valores preditos vs. valores de referncia para o modelo
de determinao do corante vermelho 40 em balas duras ............................. 102
Figura 51 Erros relativos das amostras do conjunto de validao (Limites
estabelecidos pela legislao em vermelho) .................................................. 103

ndice de tabelas
Tabela 1 - Otimizao dos modelos PLS pela deteco de amostras anmalas
(modelos finais esto destacados em negrito) ................................................. 42
Tabela 2 - Figuras de mrito, estimadas para os modelos PLS de determinao
de gordura e umidade ...................................................................................... 45
Tabela 3 - Otimizao dos modelos PLS para determinao de umidade em
queijo minas artesanal pela deteco de amostras anmalas (modelo final est
destacado em negrito)...................................................................................... 57
Tabela 4 - Figuras de mrito estimadas para o modelo PLS de determinao de
umidade em queijo minas artesanal ................................................................. 59
Tabela 5 Planejamento de mistura para a adulterao de leite...................... 69
Tabela 6 Nmero de VLs, varincias explicadas e erros de classificao de
validao cruzada (ECVC) para os modelos PLS-DA desenvolvidos .............. 75

Tabela 7 FOM estimadas para os modelos de deteco de adulterantes em


leite cru bovino ................................................................................................. 79
Tabela 8 - Resultados da otimizao do modelo PLS atravs da deteco de
outliers (modelo final em negrito) ..................................................................... 88
Tabela 9 Parmetros para avaliao das FOM no modelo proposto para a
determinao de AC em bebidas no alcolicas.............................................. 89
Tabela 10 - Resultados da otimizao do modelo PLS atravs da deteco de
outliers (modelo final em negrito) ................................................................... 101
Tabela 11 - Parmetros para avaliao das FOM no modelo proposto para a
determinao de Vermelho 40 em balas duras .............................................. 103

Lista de siglas e abreviaes


AC Amarelo Crepsculo
ANN Redes Neurais Artificiais (Artificial Neural Networks)
ATR Reflectncia Total Atenuada (Attenuated Total Reflectance)
BF Teste de Brown-Forsythe
CLS Mnimos Quadrados Clssicos (Classical Least Squares)
DPR Desvio Padro Relativo
DRIFTS Espectroscopia com Reflectncia Difusa (Diffuse Reflectance
Spectroscopy)
DW Teste de Durbin-Watson
EAEP Erro Amostral Especfico de Predio
ECVC Erro de Classificao da Validao Cruzada
FFT Transformada Rpida de Fourier (Fast Fourier Transform)
FOM Figuras de mrito (Figures of Merit)
ICS International Chemometrics Society
IMA Instituto Mineiro de Agropecuria
LAFQ Laboratrio de Anlises Fsico-qumicas
MAPA Ministrio da Agricultura, Pecuria e Abastecimento
MIRS Espectroscopia no Infravermelho Mdia (Mid Infrared Spectroscopy)
MIR Infravermelho mdio (Mid Infrared)
MSC Correo de espalhamento multiplicativo (Multiplicatve Scatter
Correction)
NAS Sinal analtico lquido (Net Analyte Signal)
NIR Infravermelho prximo (Near Infrared)
NIRS Espectroscopia no Infravermelho prximo (Near Infrared Spectroscopy)
OSC Correo Ortogonal de Sinal (Orthogonal Signal Correction)

PAS Espectroscopia Fotoacstica (Photoacoustic Spectroscopy)


PCR Regresso por componentes principais (Principal Components
Regression)
PLS Mnimos quadrados parciais (Partial Least Squares)
RJ Teste de Ryan-Joiner
RLM Regresso Linear Mltipla
RMSEC Raiz do erro quadrtico mdio de calibrao (Root Mean Square
Error of Calibration)
RMSECV Raiz do erro quadrtico mdio de validao cruzada (Root Mean
Square Error of Cross Validation)
RMSEP Raiz do erro quadrtico mdio de predio (Root Mean Square Error
of prediction)
RPD Relao de desempenho do desvio (Residual Prediction Deviation)
SNV Padronizao pelo desvio padro (Standard Normal Variate)
SDV Desvio padro dos erros de validao (Standart Deviation of Validation
Errors)
SEL Seletividade
SEN Sensibilidade
VIM Vocabulrio Internacional de Metrologia
VIP Scores Escores de importncia de projeo de variveis (Variable
Importance Projection Scores)
VL Variveis latentes

RESUMO

Esta tese teve como principal objetivo o desenvolvimento de


metodologias

analticas

empregando

ferramentas

quimiomtricas,

espectroscopia no infravermelho (mdio MIRS - e prximo NIRS) e anlise


de imagens digitais obtidas com equipamentos de baixo custo para o controle
de qualidade de produtos alimentcios. Em todas as aplicaes desenvolvidas
foi dada nfase validao analtica multivariada, um aspecto de crescente
importncia visando a aplicao prtica de mtodos quimiomtricos. Todos os
mtodos desenvolvidos foram validados buscando harmonizao com guias e
normas

nacionais

internacionais.

No

captulo

mostrado

desenvolvimento de mtodos para a determinao de parmetros de qualidade


de queijos, em condies reais de controle fiscal, num laboratrio estatal.
Modelos PLS foram construdos utilizando espectros NIR para determinao
dos teores de umidade e gordura em queijos muarela e umidade em queijos
minas. A estabilidade dos modelos gerados foi avaliada ao longo de um ano. O
modelo para determinao de gordura em queijo muarela apresentou erros
relativos de predio variando entre -8,7 e 8,1%. J o modelo de umidade
apresentou erros menores, entre -3,5 e 2,9%. O modelo de determinao de
umidade em queijo minas apresentou erros entre -6,5 e 9,8%. No captulo 4
mostrado o desenvolvimento de um mtodo de triagem qualitativo para a
deteco simultnea de cinco adulterantes em leite cru utilizando MIRS. gua,
amido, sacarose, formol e citrato de sdio foram escolhidos como adulterantes
em funo da sua presena em amostras de leite adulteradas encontradas nas
ltimas operaes da Polcia Federal. Modelos PLS-DA foram construdos para
a identificao dos cinco adulterantes individualmente, mesmo em amostras
contendo misturas de dois ou mais deles. Todos os modelos, com exceo do
modelo para determinao de amido apresentaram taxa de falso negativo
menor que 5%. No captulo 5 relatado o desenvolvimento de um mtodo para
determinao do corante artificial amarelo crepsculo em refrigerantes e
bebidas isotnicas utilizando imagens digitais obtidas em um escner de mesa
comercial. O modelo apresentou erros de predio entre -6,2 e 9,0%. Este
mtodo tambm foi validado, mostrando que histogramas de frequncia RGB
obtidos de imagens digitais so capazes de fornecer respostas adequadas

sua utilizao como sinal analtico, com uma srie de vantagens, como rapidez
e simplicidade de anlise. No captulo 6, uma aplicao similar do capitulo 5,
porm empregando um telefone celular como equipamento de aquisio de
imagens, foi desenvolvida para a quantificao do corante vermelho 40 em
balas duras. Este modelo apresentou erros elevados, entre -24,8 e 39,5%,
porm a grande maioria (mais de 80%) das amostras possui erros entre -20 e
+10%.

ABSTRACT
The main objective of this thesis was the development of methods using
chemometric tools, infrared spectroscopy (near and mid) and digital image
analysis obtained using low cost equipment for foodstuff quality control. In all
applications, multivariate analytical validation was emphasized, a subject with
growing importance in chemometrics. All the proposed methods were validated
searching for an harmonization um national and international validation guides.
Chapter 3 presents the development of methods for the determination of quality
parameters in cheese, in a real legal laboratory condition, in an official
laboratory. PLS models were built using NIR spectra for the determination of
moisture and fat in mozzarella cheese and moisture in minas cheese. The
stability of the proposed models was evaluated over a year. The fat
determination model for mozzarella presented erros between -8.7% and 8.1%,
and the moisture determination model for the same cheese type presented
smaller errors (-3.5% 2.9%). The moisture determination model for minas
chesse presented erros ranging from -6.5% to 9.8%. Chapter 4 present the
development of a screening method for the simultaneous detection of five
adulterants in raw milk using MIRS. Water, starch, sucrose, formaldehyde and
sodium citrate were chosen as adulterants due to its presence in adulterated
milk samples recently discovered in the last Federal Police operations. PLS-DA
models were built for the individual identification of the five adulterants, even in
samples that contained two or more adulterants. All the the models presented a
false negative rate below 5%, been the starch model the only exception.
Chapter 5 describes the deveploment of a method for the determination of the
artificial dye sunset yellow in beverages using digitais images obtained from a
commercial flatbed scanner. The model presented prediction errors varying
from -6.2 to 9.0%. This method was also validated, proving that RGB
histograms obtained from digital images are able to be used as analytical data,
with a series of advantages, such as quickness and simplicity. In chapter 6, a
similar application to the one presented in chapter 5 was developed, but using a
cellphone to obtain images of hard candies, and this images were used to
quantify the concentration of the allura red dye. This model presented higher

errors than the ones seen in the other models in this thesis (from -24.8% to
39.5%), but the great majority of the errors (80%) were between -20% and 10%.

1. Introduo
A quantificao de compostos e a determinao de parmetros de
qualidade de produtos alimentcios sempre envolveram processos analticos
laboriosos, principalmente em funo da complexa composio desse tipo de
matriz, o que demanda, na grande maioria das vezes, etapas de extrao e
pr-tratamento das amostras. Essas etapas consomem muito tempo e utilizam
solventes e reagentes que, muitas vezes, so txicos e oferecem risco ao
analista. Tudo isso corrobora para a necessidade de desenvolver mtodos
analticos visando o controle de qualidade de alimentos e bebidas, que sejam
mais simples, rpidos e baratos.
Desde seu incio, a quimiometria encontrou na anlise de alimentos um
campo de aplicao com amplas possibilidades, uma vez que suas
ferramentas, que permitem obter informaes qumicas de uma amostra com
mnimo pr-tratamento e de maneira rpida, conseguem superar o maior
gargalo enfrentado pelos analistas de alimentos. As tcnicas espectroscpicas,
em especial, adquiriram uma importncia notria no desenvolvimento de
mtodos que aplicam quimiometria na anlise de alimentos, principalmente
pela facilidade de manuseio dos equipamentos, versatilidade e rapidez.
A utilizao de mtodos quimiomtricos como metodologias oficiais de
anlise praticamente inexiste, devido principalmente ausncia de guias de
validao que contemplem as particularidades de mtodos multivariados, como
por exemplo, a no existncia de curvas de calibrao e a capacidade de se
trabalhar em condies de baixa seletividade.
Tendo em vista o exposto acima, esta tese teve como principal objetivo
desenvolver e validar mtodos quimiomtricos para a anlise de alimentos,
empregando

trs

diferentes

tcnicas

analticas:

espectroscopias

no

infravermelho prximo e mdio, e anlise de imagens digitais geradas por


equipamentos de baixo custo. Aps esta introduo, o Captulo 2 apresenta os
fundamentos das tcnicas analticas e dos mtodos quimiomtricos utilizados,
alm de discutir importantes aspectos da validao analtica multivariada. O
Captulo 3 descreve o desenvolvimento e a validao analtica de mtodos
para a determinao de parmetros de qualidade em queijos (umidade e
1

gordura em muarela e umidade em queijo minas) utilizando espectroscopia no


infravermelho prximo e calibrao multivariada. Este captulo teve a
particularidade de desenvolver os modelos em condies reais de uso, atravs
de uma parceria com um laboratrio de controle fiscal do Governo de Minas
Gerais. Por isto, ele tambm descreve um estudo de estabilidade dos modelos
gerados, que empregou cartas de controle para avaliar por quanto tempo eles
continuaram a fornecer resultados aceitveis. O Captulo 4 descreve o
desenvolvimento de um mtodo de triagem qualitativo para a deteco
simultnea de cinco adulterantes tpicos (gua, amido, citrato de sdio, formol e
sacarose) em leite bovino cru utilizando espectroscopia no infravermelho mdio
e classificao supervisionada. Este mtodo tambm foi validado atravs da
estimativa de figuras de mritos especficas harmonizadas para mtodos
qualitativos multivariados. Os Captulos 5 e 6 descrevem o desenvolvimento de
mtodos para a determinao de corantes artificiais em alimentos atravs da
utilizao de imagens digitais como sinais analticos. Para a determinao do
corante amarelo crepsculo em refrigerantes e bebidas isotnicas foi utilizado
um escner de mesa comercial e uma metodologia de calibrao multivariada a
partir dos histogramas RGB extrados das imagens. Na determinao do
corante vermelho 40 em balas duras foi utilizado um equipamento artesanal,
montado com um telefone celular, para aquisio das imagens digitais. Nesta
aplicao, a metodologia utilizada no captulo anterior no forneceu resultados
satisfatrios, devido presena de variaes texturais nas superfcies das
balas. Foi ento necessrio o uso de uma metodologia mais complexa,
envolvendo calibrao multidimensional, aps a converso das imagens
utilizando transformada de Fourier.

2. Reviso bibliogrfica
2.1 Interao luz/matria
A interao entre luz e matria tem despertado a curiosidade dos
homens ao longo da histria. Por volta de 130 a.C, Ptolomeu descreveu a
refrao da luz por uma gama de materiais transparentes e, em 1305, Von
Freiburg simulou a estrutura do arco-ris utilizando esferas de vidro preenchidas
com gua. Por todo o sculo XVIII, a interao luz-matria foi estudada, e
pesquisadores como Snell, Huyguens, Newton, Bradley e Priestly formularam
leis sobre a refrao e a reflexo da luz, assim como a proposio de sua
natureza dual (partcula/onda). Porm, a descoberta da radiao no
infravermelho creditada ao cientista ingls William Herschell,1 em 1800. A
teoria moderna sobre a luz, baseada na ondulao de um campo
eletromagntico,

foi

desenvolvida

por

JC

Maxwell

(1831 1879).2
Os

primeiros

experimentos

modernos

utilizando

tcnicas

espectroscpicas foram realizados por W. W. Coblentz, em 1905. Coblentz


obteve o espectro de 19 compostos entre 800 e 2800 nm, com um
espectrmetro equipado com cristal de quartzo e um detector caseiro. A partir
destes primeiros espectros, foi possvel concluir que cada substncia possui
um espectro caracterstico e que grupos qumicos idnticos presentes em
molculas diferentes exibem absores nos mesmos comprimentos de onda.2
O desenvolvimento de mtodos analticos utilizando a NIRS (Near
Infrared Spectroscopy, Espectroscopia no Infravermelho prximo) s comeou
em 1949, quando o Departamento da Agricultura dos Estados Unidos (USDA)
lanou um projeto para avaliar a qualidade de ovos. O primeiro estudo
relacionado a anlise quantitativa de um composto foi publicada em 1962, por
Hart et al.3, descrevendo um mtodo para a determinao de umidade em
sementes utilizando espectroscopia no infravermelho prximo.2

2.2 Espectroscopia vibracional


A absoro na regio do infravermelho induz os movimentos vibracionais
das molculas. Essas absores tm sido utilizadas de forma qualitativa e
quantitativa para diversas anlises e para a atribuio das bandas de absoro
a grupos qumicos especficos. De forma geral, o movimento vibracional de
dois tomos de uma molcula diatmica pode ser considerado como a
compresso e extenso de uma mola, na qual os tomos se atraem e se
repelem.1
2.2.1 Oscilao harmnica e anarmnica
A oscilao harmnica o modelo mais simples de vibrao, no qual
massas vibrantes m1 e m2 variam a distncia internuclear em at 10%. Nesse
caso, a lei de Hooke aplicvel, e a energia potencial, V, pode ser
representada como
=

1
1
 
= 
2
2

1

onde k a fora da ligao, r a distncia internuclear durante a vibrao, re


a distncia internuclear de equilbrio. A curva da energia potencial de tal
oscilador parablica e simtrica de acordo com re. Este modelo leva a uma

frequncia vibracional 

 =

1 k

2 m

2

onde a massa reduzida m dada por


=

 
 + 

3

A partir das equaes 2 e 3 possvel verificar que a frequncia


vibracional depende da estrutura do composto analisado, e essa a base da
grande utilizao da espectroscopia no infravermelho para a elucidao de
compostos. 1
A interao da radiao com a molcula, entretanto, s possvel se o
vetor eltrico da radiao oscilar com a mesma frequncia que o momento de
dipolo molecular, . Ento, uma vibrao s ativada no infravermelho se o
4

momento de dipolo molecular for modulado pela vibrao e se /q for


diferente de zero. O requerimento de uma mudana no momento de dipolo
durante a vibrao faz do infravermelho mdio (MIR) especialmente sensvel a
grupos funcionais polares. 1
Entretanto, o modelo do oscilador harmnico no adequado a maiores
amplitudes de vibraes, devido s foras repulsivas entre os tomos vibrantes
e a possibilidade de dissociao, quando a ligao muito estendida. Diferente
da oscilao harmnica, os nveis de energia no so equidistantes no modelo
anarmnico, e a regra de seleo estrita (n=1) expandida para mais de um
nvel energtico. Com isso, a curva de energia potencial representada por
uma funo de Morse assimtrica (Figura 1). 1

Figura 1 Representao esquemtica dos modelos do oscilador harmnico e


anarmnico1
Normalmente, uma molcula no linear contendo N tomos ter 3N-6
graus de liberdade vibracionais, enquanto uma molcula linear possui 3N-5. O
nmero de graus de liberdade vibracional representa o nmero de frequncias
vibracionais da molcula. Para uma determinada molcula, um modo de
vibrao normal corresponde ao movimento atmico no qual todos os tomos
se movem com a mesma frequncia, mas com amplitudes diferentes.
Adicionalmente s vibraes normais, transies correspondentes a n=2,
3... so agora permitidas e so chamadas de sobretons, que ocorrem na
regio do infravermelho prximo.1
5

Alm dos sobretons, combinaes de diferentes transies vibracionais


(soma e diferena de vibraes fundamentais) tambm podem ser observadas.
Entretanto, a probabilidade dessas transies diminui significativamente com a
sua ordem, e geralmente a banda de absoro correspondente a transies de
sobretom

ou

combinao

tem

intensidade

inferior

suas

anlogas

fundamentais. Ao contrrio do MIR, a regio do NIR contm quase que


exclusivamente bandas de absoro que podem ser atribudas s vibraes de
sobretons e combinaes. Infelizmente, a sobreposio dessas bandas de
sobretons e combinaes diminuem significativamente a especificidade do NIR,
o que uma das principais razes pelas quais esta regio foi subestimada por
espectroscopistas durante muito tempo.1
2.3 Espectroscopia no Infravermelho prximo (NIRS)
A espectroscopia no infravermelho prximo (NIRS, do ingls near
infrared spectroscopy) um tipo de espectroscopia vibracional, a qual emprega
energia do fton (h) no intervalo de 2,65x10-19 a 7,96x10-20 J, que corresponde
faixa de comprimento de onda de 750 a 2500 nm (nmeros de onda: 13300 a
4000 cm-1). Esta faixa de energia maior do que a necessria para promover
as molculas somente para seu estado vibracional excitado de menor energia
(atravs de uma transio vibracional fundamental) e menor que os valores
necessrios para a excitao de eltrons em molculas (com exceo de
alguns compostos de terras raras).4
A combinao da energia da radiao com a diferena de energia entre
dois nveis vibracionais provoca uma resposta seletiva do sistema molecular
radiao incidente. Isso significa que em determinado comprimento de onda,
uma frequncia correspondente absorvida. Esta figura complexa da
intensidade de absoro versus comprimento de onda constitui o espectro de
absoro de uma substncia ou amostra. O principal objetivo do uso da
espectroscopia NIR sondar uma amostra, a fim de adquirir dados qualitativos
e/ou quantitativos provenientes da interao de ondas eletromagnticas no
infravermelho prximo com seus componentes.4
Os mtodos analticos resultantes do uso da regio espectroscpica NIR
propiciam anlises rpidas (um minuto ou menos, por exemplo), no
6

destrutivas, no invasivas, com alta penetrao do feixe de radiao de


sondagem, adequadas para uso em linha, de aplicao quase universal
(qualquer molcula contendo C-H, N-H, S-H ou ligaes O-H) e, na maioria dos
casos, com uma preparao mnima da amostra.4
Existem vrios modos de aquisio dos espectros em espectroscopia
NIR: transmitncia, interactncia, transflectncia e reflectncia difusa. A
seleo do modo de aquisio ideal depende de diversos fatores, como tipo de
amostra e condies do equipamento. A espectroscopia de reflectncia mede a
luz refletida pela superfcie da amostra, que composta por um componente
especular e outro difuso. A reflectncia especular, descrita pela lei de Fresnel,
contm pouca informao sobre a composio amostral, portanto sua
contribuio minimizada ao se ajustar a posio do detector em relao
amostra. Por outro lado, a reflectncia difusa, que descrita pela teoria de
Kubelka-Munk, a base para a aquisio de espectros por reflectncia. O
modo de aquisio dos espectros por reflectncia difusa especialmente
apropriado para slidos, e a sua aplicao foi responsvel pelo aumento da
versatilidade e simplicidade no uso da espectroscopia NIR, contribuindo para a
difuso da tcnica. Nas medidas de reflectncia difusa, o espalhamento e a
absoro de luz pelas partculas do slido contribuem para mudar a
intensidade do sinal analtico. Na verdade, a radiao penetra alguns
micrometros na amostra, sendo absorvida em funo de sua composio
qumica, antes de retornar ao detector. Na grande maioria das aplicaes
quantitativas envolvendo NIR, ao invs da relao de Kubelka-Munk, usa-se
uma funo mais prtica, log (1/R), na qual R significa o valor de reflectncia.
Essa

relao

equivalente

absorbncia

obtida

em

medidas

de

transmisso.1,4,5
Desde os primrdios, o uso das informaes dos espectros do NIR para
efeitos de anlise baseou-se na abordagem multivariada para a calibrao.
Hoje essa interdependncia ainda mais importante, devido ao crescente
poder dos microcomputadores e da qualidade dos espectrofotmetros NIR, que
permitem que milhares de dados sejam obtidos em questo de segundos.
Como a tecnologia NIR prope uma medida direta da amostra sem prtratamento, ela tambm no apresenta nenhum fator inibitrio para aquisio
7

de dados, contribuindo para a gerao de grandes conjuntos durante a fase de


calibrao.4
2.4 Espectroscopia no infravermelho mdio (MIRS)
A espectroscopia no infravermelho mdio monitora as vibraes
fundamentais de molculas, as quais fornecem um perfil qumico de um
determinado composto. A regio da MIRS, de 4000 a 400 cm-1, muito robusta
e reprodutvel, o que permite a medio de pequenas variaes dos
componentes de uma amostra. As molculas que absorvem na regio do MIR
apresentam vibraes em uma ou mais regies do espectro, dependendo de
diversos fatores, como configurao e posio das ligaes.4
Cada tipo de ligao tem sua prpria frequncia natural de vibrao, e
como dois tipos idnticos de ligao em dois diferentes compostos esto em
ambientes levemente diferentes, os padres de absoro no infravermelho
mdio em duas molculas de estruturas diferentes nunca so exatamente
idnticos. Apesar das frequncias absorvidas nos dois casos serem iguais,
jamais os espectros infravermelhos sero idnticos.5
Um outro uso da MIRS, ainda mais importante, fornecer informaes
estruturais de molculas. As absores de cada tipo de ligao (N-H, C-H, O-H,
C-X, C=O, C-O, C-C, C=C, CC, CN, entre outras) so encontradas,
geralmente, apenas em regies especficas do espectro de infravermelho
mdio5. Bandas de absoro caractersticas podem ser associadas com
componentes majoritrios de alimentos. A gua um composto com absoro
acentuada na regio do MIRS e pode interferir na determinao de outros
componentes presentes no alimento. Picos intensos so esperados em 3920,
3490, 3280 e 1645 cm-1, entretanto sua localizao exata pode ser influenciada
pela presena de solutos, ligaes de hidrognio e pela temperatura. A ligao
ster de triglicrides (C-O) (~1175 cm-1), o grupo C=O (~1750 cm-1) e a ligao
C-H (3000-2800 cm-1) normalmente esto associadas presena de lipdios,
enquanto as bandas de absoro de amidas I (~1653 cm-1) e II (~1567 cm-1)
tm sido relacionadas com a presena de protenas e alteraes em sua
estrutura secundria. Vibraes originadas do estiramento de ligaes C-O e
C-H na regio entre 1100 e 1000 cm-1 tm sido utilizadas para identificar
8

acares solveis, enquanto carboidratos mais complexos apresentam bandas


de absoro em nmeros de onda mais elevados, como a hemicelulose (1732
e

1240

cm-1),

celulose

(1170-1150,

1050

1030

cm-1),

lignina

(1590 e 1510 cm-1) e pectina (1680-1600, 1260 e 955 cm-1).6


Um fator crtico para a difuso do uso da MIRS foi a sua aplicao na
anlise de amostras complexas. Historicamente, at o comeo dos anos 1980,
a aquisio dos espectros esteve restrita as medidas de transmisso em celas
de comprimento fixo no caso de amostras lquidas e, para slidos,
preparao de pastilhas de haletos (KBr, NaCl) ou filmes contendo a amostra.
Entretanto,

estas

tcnicas

demandavam

um

considervel

preparo

manipulao da amostra, geralmente de maneira destrutiva. A ampliao da


aplicabilidade da MIRS veio com o desenvolvimento de novos mtodos de
aquisio de espectros mais prticos, rpidos e versteis, como a
espectroscopia fotoacstica (PAS), a refletncia difusa (DRIFTS) e a
reflectncia total atenuada (ATR), sendo esta ltima a mais comumente
utilizada.6
Com o uso do acessrio de ATR, a amostra (slida ou lquida)
simplesmente colocada em contato com a superfcie superior de um cristal de
alto ndice de refrao, normalmente de seleneto de zinco (ZnSe), germnio
(Ge), diamante ou iodeto de tlio (KRS-5). O sistema de ATR mede a mudana
na intensidade que ocorre em um feixe de radiao infravermelha internamente
refletido quando entra em contato com a amostra. Esta interao acontece
quando a radiao penetrando no cristal sofre reflexo na sua parte superior, a
qual se repete diversas vezes (entre nove e onze vezes ao longo do cristal).
Uma onda chamada de onda evanescente gerada em cada ponto de
reflexo. Esta penetra na amostra, interage com a mesma e reduz sua
intensidade, produzindo um espectro.6
Se comparada com a NIRS, a MIRS possui sinais mais bem resolvidos,
mais seletivos e de maior intensidade, o que explica sua aplicao mais antiga
e consolidada em anlises qualitativas, principalmente de compostos orgnicos
(atribuio de bandas a ligaes especficas), assim como sua maior
sensibilidade, que permite a deteco de componentes em concentraes mais
reduzidas. Na anlise de amostras menos complexas, possvel inclusive
9

encontrar nmeros de onda seletivos, que permitam desenvolver modelos de


calibrao univariada, ao contrrio do que acontece com o uso da NIRS. Por
outro lado, o uso de acessrio de ATR diminui a sensibilidade da tcnica.6,7
2.5 Anlise de imagens digitais
Imagens digitais tm sido utilizadas como fonte de informao analtica
desde o sculo passado. O primeiro trabalho descrevendo a utilizao de
imagens digitais empregou uma verso rudimentar de um escner para
converter exames mdicos em dados digitais, que serviram como base para
diagnsticos mais rpidos e acurados.8
Mais de vinte anos depois, Geladi e colaboradores publicaram o primeiro
artigo que empregou um tratamento quimiomtricos de imagens digitais.9
Desde ento, principalmente nos ltimos anos, diversos artigos tm sido
publicados utilizando diferentes instrumentos para a aquisio de imagens, tais
como celulares, webcams, escners de mesa e cmeras digitais.1016
A maneira mais comum de se extrair informaes de imagens digitais
a sua decomposio em um sistema de cores, como o RGB. O sistema RGB
um sistema de cores aditivo, que utiliza a combinao das cores Vermelho
(Red, em ingls), Verde (Green, em ingls) e Azul (Blue, em ingls), para
formar uma ampla variedade de tons (Figura 2).

Figura 2 Representao grfica do sistema RGB


Fonte: http://www.jbprint.com.br/blog/imgs/rgb.jpg

10

Cada pixel, unidade formadora bsica de uma imagem digital, formado


pela combinao dessas trs cores. A intensidade de cada cor no sistema RGB
medida em canais (256 para cada cor). O canal 0 significa completa ausncia
de uma cor, enquanto o canal 255 representa essa mesma cor em sua
intensidade mxima. A combinao dos canais do sistema RGB fornecem 256
possveis tonalidades de tons (Figura 3).

Branco

Figura 3 Formao de tons no sistema RGB


Fonte:https://fperrotti.wikispaces.com/file/view/cuborgb.jpg/418292514/2
27x223/cuborgb.jpg
Aps a decomposio de todos os pixels da imagem, a frequncia de
cada canal contada, produzindo um histograma de frequncias. Este
histograma pode ser tratado de maneira similar a dados espectrais utilizados
no desenvolvimento de modelos quimiomtricos. As variveis RGB tambm
podem ser fundidas com outros parmetros de cor, como saturao,
intensidade e matiz, resultando em colorgramas.1214,16
Outra estratgia, que demanda um processamento matemtico mais
complexo, a gerao de arranjos de dados n-dimensionais (3 dimenses ou
mais) que podem ser tratados com mtodos de ordem superior.15 As amostras
decompostas no sistema RGB geram arranjos do tipo OOV (pixel x pixel x
canal), sendo que O denota um objeto e V um varivel. Se as imagens de
vrias amostras so agrupadas, um arranjo de quarta dimenso obtido
(OOOV). Para a simplificao e agilidade no processamento computacional, as
variveis RGB podem ser convertidas para escala de cinzas, reduzindo uma
dimenso dos dados, que so ento condensados em um arranjo
11

tridimensional (OOO) (amostra x pixel x pixel). Um arranjo do tipo OOO no


congruente e, por isso, obviamente no-trilinear. Consequentemente, esse
tipo de arranjo no pode ser tratado diretamente por mtodos de ordem
superior, requerendo para isso a utilizao de tcnicas de transformao do
domnio, como a transformada rpida de Fourier (FFT, Fast Fourier Transform)
ou a transformada wavelet. Estas tcnicas convertem arranjos OOO em
arranjos OVV (amostra x componente de frequncia x componente de
frequncia). Esta estratgia normalmente aplicada quando se quer incorporar
ao modelo informaes relacionadas com a textura da amostra a ser
analisada.15,17 Quando as imagens analisadas so homogneas e no contm
variaes texturais, a primeira estratgia descrita, baseada na modelagem
direta dos histogramas de frequncia de cor, mais adequada, por ser mais
simples e parcimoniosa.
2.6 Quimiometria
De acordo com a definio da ICS (International Chemometrics Society),
a quimiometria a disciplina qumica que emprega mtodos matemticos e
estatsticos para planejar ou selecionar experimentos de forma otimizada e
para extrair o mximo de informao qumica a partir da anlise dos dados
multivariados. O crescimento e desenvolvimento da quimiometria esto
intimamente relacionados com o desenvolvimento e a popularizao dos
microprocessadores,

nas

dcadas

de

1970

1980,

resultando

em

equipamentos analticos que permitiram a aquisio de uma grande quantidade


de informao sobre uma amostra em pouqussimo tempo, como, por exemplo,
espectros de UV/Visvel, de NIR e MID, e at dados mais complexos, como
superfcies de fluorescncia.4,18,19
De maneira geral, podemos classificar as tcnicas quimiomtricas em
trs grandes grupos: planejamentos e otimizao de experimentos, calibrao
multivariada e reconhecimento de padres, que se pode ser dividido em
reconhecimento de padres supervisionado e no supervisionado.18
2.6.1 Calibrao multivariada
O principal objetivo da calibrao multivariada estabelecer um modelo
de regresso relacionando os sinais analticos medidos para uma amostra (um
12

espectro de NIR, por exemplo), com uma propriedade especfica. Os mtodos


mais consagrados na literatura, todos de calibrao inversa, so a regresso
linear mltipla (RLM), a regresso de componentes principais (PCR), os
quadrados mnimos parciais (PLS), as redes neurais artificiais (ANN) e as
mquinas de suporte de vetores (SVM).
Dentre estes mtodos, os mais utilizados so o PCR e o PLS, devido
principalmente sua ampla gama de aplicaes e sua facilidade de uso.
Ambos os mtodos so capazes de lidar com grande presena de
colinearidade e rudos nos dados, assim como permitem manipular arranjos
com mais variveis que amostras (mais colunas do que linhas na matriz de
dados), superando as principais limitaes da RLM no tratamento quantitativo
de dados espectrais.18,20,21
A principal diferena entre esses dois mtodos a forma pela qual as
componentes principais so calculadas. O PLS relaciona a informao contida
no bloco Y, das variveis independentes (concentrao do analito ou outras
propriedades), com o bloco X, das variveis dependentes (espectrais), durante
a decomposio dos dados, utilizando os dois simultaneamente. Isto leva a
uma pequena perda da ortogonalidade das componentes principais, e com
isso, elas recebem a denominao mais abrangente de variveis latentes. O
PCR decompe X separadamente e depois correlaciona seus escores com Y,
atravs de uma RLM.18,20
2.6.2 Mnimos quadrados parciais (PLS)
Na

construo

de

modelos

PLS,

so

decompostas

simultaneamente em uma soma de h variveis latentes. X uma matriz n x p;


sendo n o nmero de amostras e p o nmero de variveis medidas
(absorbncia em determinados comprimentos de onda, intensidade relativa em
determinada razo massa/carga ou valores de diferentes propriedades); Y
pode ser um vetor (y) n x 1, quando o modelo PLS prediz apenas uma
propriedade (PLS1), ou n x k, quando o PLS prediz k propriedades
simultaneamente (PLS2). importante ressaltar que a denominao PLS1 ou
PLS2 no est relacionada com a quantidade de propriedades preditas, e sim
com a ordem do tensor dos valores de referncia. A base estrutural do modelo
PLS dada pelas seguintes equaes.
13

 =  +  =  




+

" = #$ + % =  & ' + %

4

5

Onde T e U so as matrizes de escores das matrizes X e Y, respectivamente, P


e Q so as matrizes de pesos (loadings) de X e Y, respectivamente, e E e F
so os resduos de X e Y, respectivamente. O coeficiente de regresso linear b
correlaciona os blocos X e Y de forma linear, de acordo com a equao abaixo:
& = ) 

6

Os valores de )+ so agrupados na matriz diagonal B, que contm os

coeficientes de regresso entre as matrizes de escores T de X e U de Y. A

melhor relao linear possvel entre os escores desses dois blocos obtida
atravs de pequenas rotaes das variveis latentes dos blocos X e Y. Os
valores preditos para novas amostras (Y) podem ser ento calculados de
acordo com a equao 7, com base nos seus escores T*.
" =  -$

7

Uma etapa crucial nesse processo a definio de h (nmero de


variveis latentes). Normalmente, utilizada a validao cruzada, um processo
de reamostragem, que define o nmero de variveis latentes com o qual o
modelo apresenta menor erro de predio (RMSECV, raiz do erro quadrtico
mdio de validao cruzada). Os tipos de validao cruzada usados empregam
diferentes critrios de reamostragem, de acordo com a natureza dos dados.
Para conjuntos de dados pequenos (at em torno de 20 amostras de
calibrao), usa-se o leave-one-out, no qual uma amostra retirada de cada
vez. J para conjuntos de dados maiores so recomendadas a validao por
blocos contnuos, para conjuntos de dados nos quais as amostras esto
organizadas em ordem aleatria, por subconjuntos aleatrios, quando as
amostras esto organizadas de maneira sistemtica, ou por venezianas
(venetian blinds), que seleciona as amostras retiradas em intervalos
constantes, o que recomendado para conjuntos de amostras organizados em
ordem sistemtica de agrupamentos/classes. Esta ltima situao comum em
modelos de classificao supervisionada usando PLS-DA.2,18

14

2.6.3 N-PLS
O N-PLS (N-Way Partial Least Squares, Mnimos Quadrados Parciais
Multilineares) um mtodo de calibrao multivariada para tratar dados de
ordem superior. O N-PLS pode ser considerando uma extenso do PLS, capaz
de lidar com arranjos de dados de ordem maior do que dois. Ele relaciona um
arranjo trilinear de variveis independentes X (I,J,K) com uma matriz de vetores
independentes Y. Neste mtodo, X decomposto de maneira trilinear, de forma
a encontrar a mxima covarincia entre os escores de X e Y. A principal
diferena em relao a outros mtodos de segunda ordem, como por exemplo
o PARAFAC, a modelagem simultnea dos dados das variveis
independentes e dependentes.22
Assim como no modelo PLS, duas etapas so necessrias para a
construo do modelo N-PLS, etapa de calibrao e etapa de previso. Na

calibrao, o arranjo / decomposto em escores (tn) e pesos (wj e wj),


conforme a Figura 4.

Figura 4 - Decomposio de um arranjo multidimensional atravs do modelo


N-PLS
Onde X o arranjo tridimensional, T(I, F) a matriz relacionada ao
modo/dimenso das amostras (escores) e as matrizes WJ (J, F) e WK(K, F) so
relacionadas s outras duas dimenses, ou seja, so matrizes de pesos
(weights) contendo as informaes a respeito das variveis. O arranjo E
contm os resduos, que so a parte no explicada pelo modelo. Esta
decomposio est representada na equao 8, nas formas vetorial e matricial.
5
3
/ 0,2,3 =  4 52 62,7
63,7
+ 85,2,3 = / = 9: ; ||: =
> + 8 8

Onde o smbolo || representa o produto de Khatri-Rao, um operador para


matrizes de ordem superior23. A matriz Y tambm decomposta em escores e
pesos, representados pela Figura 5 e pela equao 9.
15

Figura 5 - Representao esquemtica da decomposio da matriz Y atravs


do modelo NPLS

@ = AB4 + C

9

Onde Y a matriz contendo a propriedade de interesse, U a matriz contendo


os escores de Y, Q a matriz contendo os loadings de Y e F a matriz de

resduos de Y, que assim como no arranjo /, no podem ser explicados pelo

modelo.

Para relacionar a matriz de escores de / e a matriz de escores de Y

necessrio encontrar uma relao linear entre a matriz de dados e a matriz da


propriedade de interesse. Essa relao representada pela equao 10.
A = 9E

10

Onde B uma matriz contendo os coeficientes de regresso linear entre o


G para as novas amostras pode ser estimada
arranjo de dados / e Y. A matriz @

a partir de novos escores T*, conforme a equao 11.


G =  H
@

11

O NPLS apresenta vantagens em relao aos mtodos baseados no


prvio desdobramento da matriz tridimensional, que so mtodos de primeira
ordem usados para tratar dados de segunda ordem (unfold-PLS, por exemplo).
Este tipo de mtodo no verdadeiramente multidimensional, porque utiliza
uma decomposio bilinear para tratar dados multidimensionais. Dentre essas
vantagens encontram-se maior robustez, parcimnia, simplicidade do modelo e
a facilidade na interpretao dos resultados, alm da menor sensibilidade ao
rudo.15,22,23
2.6.4 Mtodos de classificao supervisionada
16

Mtodos

de

classificao

supervisionada

so

ferramentas

quimiomtricas, que buscam desenvolver modelos matemticos capazes de


classificar cada objeto/amostra em sua determinada classe com base em um
conjunto de dados, de maneira supervisionada. Uma vez que o modelo de
classificao foi gerado, a atribuio de amostras desconhecidas a uma das
classes previamente definidas pode ser realizada. Enquanto modelos de
calibrao fornecem respostas quantitativas, os mtodos de classificao so
qualitativos. Os mtodos de classificao definem uma relao matemtica
entre varveis descritivas (variveis espectrofotomtricas, espectros de massa,
composio mineral, dentre outras) e uma resposta qualitativa (pertence/no
pertence a uma determinada classe).2
Dentre os mtodos de classificao supervisionada mais comuns,
podemos citar a LDA (Linear Discriminant Analysis, Anlise discriminante
linear), a QDA (Quadratic Discriminant Analysis, Anlise discriminante
quadrtica), o PLS-DA (Partial Least Squares Discriminant Analysis, Anlise
discriminante por mnimo quadrados parciais) e o SIMCA (Soft Independent
Modelling of Class Analogies, Modelos independentes de similaridade
utilizando componentes principais).
2.6.5 PLS-DA
O PLS-DA uma adaptao do mtodo PLS para modelos qualitativos.
A principal diferena entre os dois est nas variveis dependentes, uma vez
que no PLS-DA elas representam valores qualitativos (classes) e no
quantitativos. Em problemas de classificao binria, a varivel Y pode ser
arbitrariamente definida como 0 e 1, sendo 1 para amostras pertencentes
classe, e 0 para amostras no pertencentes. O modelo ento fornecer uma
resposta numrica, assim como nos mtodos quantitativos, e este valor poder
no ser exatamente 1 ou 0. Ento, um limite de deciso (treshold) precisa ser
estabelecido. Este limite pode ser arbitrrio (0,5, por exemplo) ou calculado
atravs da teoria bayesiana. O clculo do limite bayesiano assume que a
varincia predita de Y segue uma distribuio similar que ser observada nas
novas amostras. Amostras com valores preditos abaixo do limite so
classificadas como 0 (no pertencente a classe) e amostras com valores
preditos acima do limite so classificadas como 1.24
17

Quando o modelo possuir mais de uma classe, a estratgia acima citada


no pode ser utilizada, pois se Y for definido com um nmero para cada classe
(1, 2, 3, 4...N para N classes diferentes, por exemplo), isto significaria uma
relao matemtica de continuidade entre as classes, como, por exemplo, a
classe 2 ser uma classe intermediria entre 1 e 3. A soluo definir um vetor
coluna para cada classe e se aplicar o algoritmo PLS1 (cada vetor y previsto
em separado) ou PLS2 (todos os vetores agrupados em uma matriz) para
respostas multivariadas qualitativas. Para cada amostra, o PLS2-DA fornecer
a predio como um vetor de tamanho Nx1, com valores entre 0 e 1. Neste
caso, o critrio de classificao das amostras o mesmo para quando s
existem duas classes.2,24
2.6.6 Quimiometria aplicada anlise de alimentos
Uma alternativa promissora para superar as desvantagens dos mtodos
clssicos de anlise de alimentos a utilizao conjunta das tcnicas acima
citadas e quimiometria. Esta combinao pode fornecer mtodos que so
rpidos, no destrutivos, livres de solventes e reagentes, com baixa ou
nenhuma gerao de resduos. Alm disso, estes mtodos demandam um
mnimo de pr-tratamento da amostra e tm suficiente preciso e sensibilidade
com menos interveno humana. Uma restrio aplicao da NIRS na
anlise de alimentos a sua sensibilidade relativamente baixa, pois o limite de
deteco desta tcnica , em geral, prximo de 0,1% (p/p)4, o que torna
invivel a

sua utilizao na determinao de microcontaminantes, como

resduos de drogas veterinrias, pesticidas, toxinas e outros compostos em


baixas

concentraes.

Situao

similar

ocorre

com

outras

tcnicas

mencionadas, como a MIR combinada com ATR e a anlise de imagens


digitais adquiridas por equipamentos de baixo custo.
Mtodos quimiomtricos em anlise de alimentos podem ser usados, por
exemplo, para o controle de qualidade direto (online), para separar frutos
defeituosos de sadios, na quantificao de diversos parmetros nas mais
variadas matrizes, como leite e derivados,25 frutas e vegetais,25,26 azeite,27
mel28 e cervejas.29 Alm de quantificao, a quimiometria pode ser til para
deteco de adulteraes,3032 determinao de denominao de origem e
classificao de diversas matrizes.3335
18

2.7 Validao analtica multivariada


O principal entrave para a validao de mtodos multivariados tem sido
a falta de guias especficos e regulamentao oficial apropriada. Na rea de
alimentos, tanto os guias oficiais brasileiros3638 quanto os internacionais3942
ignoram

completamente

aspectos

multivariados

intrnsecos

ao

desenvolvimento de mtodos multivariados. Existe uma necessidade de


harmonizao de alguns conceitos, como seletividade, sensibilidade e curvas
de calibrao. Todos os guias tradicionais exigem seletividade total do sinal
analtico, o que no faz sentido para calibrao multivariada, a qual s tem
utilidade na ausncia de um sinal seletivo. Recomenda-se tambm a avaliao
da linearidade atravs das curvas de calibrao (resposta analtica versus
concentrao), que no so estritamente possveis de obter em modelos
multivariados. Dentre os esforos feitos nos ltimos anos buscando a
harmonizao de aspectos univariados e multivariados, o conceito mais
importante o NAS (Net Analyte Signal, sinal analtico lquido), o qual
possibilita separar uma parte especfica do sinal total diretamente proporcional
propriedade de interesse, permitindo o clculo de algumas figuras de mrito
(FOM) multivariadas.43
2.7.1 Deteco de amostras anmalas (outliers)
Amostras anmalas so amostras que so muito diferentes do restante
do conjunto de dados, e sua deteco crucial no desenvolvimento de
modelos multivariados. Estas diferenas podem ser causadas por erros de
medio, amostras provenientes de outras populaes, etc. A deteco de
amostras anmalas pode ser realizada de vrias maneiras, e este trabalho
adotou uma metodologia robusta para a deteco de amostras com alta
influncia (leverage), altos resduos no bloco X, isto , nos dados espectrais, ou
altos resduos no bloco Y, ou seja, os valores de propriedade ou de teor do
analito.44,45
Se uma amostra tem um leverage, uma medida de sua influncia no
modelo PLS, maior que um valor limite (h > 3k/nc, onde k o nmero de
variaveis latentes do modelo PLS e nc o nmero de amostras de calibrao),
ela deve ser considerada uma amostra anmala. Amostras anmalas com altos
19

resduos em X so detectadas atravs da comparao do desvio-padro total,


s(e), dos dados espectrais no-modelados com os respectivos desvios padro
de cada amostra, s(ei). Se uma amostra apresentar s(ei)>2,5s(e), ela deve ser
removida com nvel de confiana de 99%. Amostras anmalas com altos
resduos em Y podem ser detectadas atravs da comparao do erro
quadrtico mdio da calibrao (RMSEC) com os erros de predio. Se uma
amostra possuir um erro de predio maior do que trs vezes o RMSEC, ela
deve ser removida.44,46
Os dois primeiros testes acima descritos foram aplicados a ambos os
conjuntos de calibrao e de validao, enquanto que o terceiro teste s foi
aplicado ao conjunto de calibrao. Amostras anmalas no conjunto de
validao tambm foram detectados pelo teste de

resduos padronizados

Jacknife. Este teste estima a varincia dos resduos da regresso


independente do ponto avaliado, o que dispensa a necessidade de se calcular
vrias regresses a cada novo ponto excludo.47
2.7.2 Sinal Analtico Lquido (NAS) e curvas pseudounivariadas
O NAS (do ingles Net Analyte Signal) um conceito multivariado
proposto por Lorber em 198648, que pode ser definido como a parte do sinal
analtico que exclusivamente relacionada com o analito/propriedade de
interesse, e ortogonal ao espao gerado pelos interferentes (Figura 6).

Sinal Analtico
NAS

Sinal dos interferentes


Figura 6 Representao vetorial do NAS
Inicialmente, este conceito foi proposto para mtodos de calibrao
multivariados diretos, como o CLS (mnimos quadrados clssicos), mas a sua
aplicao prtica surgiu apenas alguns anos mais tarde, quando esse conceito
20

foi ampliado para os mtodos de calibrao inversa, tais como PLS e PCR49 e

JKLM
melhorado43. O vetor de NAS I
+0 pode ser calculado para cada amostra i a
partir dos coeficientes de regresso de um modelo PLS com h variveis
latentes (VL), b, de acordo com a equao 12.
JKLM
I
= HH H
N HO IP
+0

12

A norma (ou mdulo) de cada vetor fornece um QRS


T 0 escalar para cada

amostra, que anlogo a um sinal de analito seletivo univariado.42,43.45,49

O NAS um conceito til na validao analtica multivariada porque


usado para calcular algumas Figuras de Mrito (FOM) tais como a
sensibilidade, a seletividade e os limites de deteco e quantificao.51 Este
conceito tambm til para traar as curvas pseudounivariadas de calibrao,
as quais so uma maneira mais simples de apresentar os resultados obtidos a
partir de modelos multivariados, harmonizando-os com o pensamento
univariado.52
Para isso, em primeiro lugar, valores escalares de NAS so calculados
para as amostras de calibrao e, em seguida, um coeficiente de regresso

G KLM estimado atravs de uma regresso linear entre o vetor ns, o qual
H
KLM
JU0
contm as normas dos vetores I
de cada amostra, e o vetor das

concentraes do analito ou propriedades (Y).

HKLM = VWO VW
NX VWH Y 13

Em seguida, o modelo de regresso expresso como na equao 13,


onde e um vetor contendo os resduos.

Z[  HKLM VW  \ 14

2.7.3 Figuras de mrito (FOM)

A validao analtica foi realizada a fim de harmonizar conceitos


univariados e multivariados. Neste sentido, este trabalho procurou adaptar os
requisitos das diretrizes brasileiras38 e internacionais3942 para o estado do arte
de como estimar FOM em calibrao multivariada.44,50 Assim, as seguintes
FOM foram estimadas: veracidade, preciso, linearidade, faixa de trabalho,
seletividade, sensibilidade, sensibilidade analtica, robustez, vis (bias) e
relao de desempenho do desvio (RPD, residual prediction deviation). Os
21

limites de deteco e quantificao podem ser calculados com base no NAS,


mas estes no foram estimados no presente trabalho, nem os conceitos
alternativos de limite de deciso (CC) e capacidade de deteco (CC), pois
eles no so exigidos para mtodos de determinao de analitos que esto
presentes em concentraes elevadas.
2.7.3.1 Exatido
De acordo com o Vocabulrio Internacional de Metrologia (VIM), o
conceito de exatido utilizado tradicionalmente foi atualizado. Ele foi substituido
pela juno dos conceitos veracidade e preciso. A veracidade definida como
o grau de concordncia entre a mdia de um nmero infinito de valores
medidos repetidamente e o valor de referncia. E a somatria da veracidade
com a preciso agora chamada de exatido, a qual definida como o grau de
concordncia entre um valor medido e um valor verdadeiro de um
mensurando.53
A veracidade e a preciso podem ser estimadas de forma semelhante
para mtodos univariados e multivariados. A veracidade foi avaliada atravs
dos erros relativos de predio para cada amostra. No entanto, a veracidade de
mtodos multivariados usualmente estabelecida atravs de parmetros mais
especficos no mencionados nos guias tradicionais de anlise de alimentos,
tais como RMSEC (raiz do erro quadrtico mdio de calibrao) e RMSEP (raiz
do erro quadrtico mdio de predio). O RMSEP mais robusto que o
RMSEC, uma vez que estimado a partir de amostras de validao externas
ao conjunto de calibrao.18
A preciso dos mtodos desenvolvidos nesta tese foi avaliada em dois
nveis, repetitividade e preciso intermediria. A repetitividade foi estimada pela
anlise de trs amostras diferentes, com diferentes concentraes, pelo
mesmo analista, seis repeties para cada amostra. A preciso intermediria
foi estimada por trs diferentes analistas que determinaram as mesmas trs
amostras em seis replicatas, no mesmo dia.40
2.7.3.2 Linearidade
Uma vez que no h curvas de calibrao para modelos multivariados, a
linearidade costuma ser estimada atravs do coeficiente de correlao (r) entre
22

os valores de referncia e os valores preditos. Mas, um valor de r prximo de 1


no considerado suficiente para assegurar a linearidade do mtodo.40
essencial ainda que se verifique previamente se os resduos do ajuste
apresentam comportamento aleatrio.
Esta verificao frequentemente realizada por inspeo visual de um
grfico dos resduos, o que pode ser considerado bastante subjetivo. A fim de
adotar critrios mais objetivos para avaliar a linearidade, esta tese adaptou a
metodologia utilizada por Souza & Junqueira47 para o mtodo univariado dos
mnimos quadrados ordinrios. Assim, o comportamento aleatrio dos resduos
do ajuste de predio foi verificado atravs da aplicao de testes estatsticos,
a fim de avaliar a sua normalidade, homocedasticidade, e independncia,
respectivamente . O principal teste o de Durbin- Watson (DW),54 usado para
verificar a ausncia de autocorrelao, no qual o desvio padro dos dados
ordenados residuais (SD) comparado com o desvio padro das diferenas
sucessivas (SDsd) do mesmo conjunto de dados. Se os dados so
aleatoriamente e normalmente distribudos e homoscedsticos, no deve haver
diferena estatstica entre o SD e o SDsd . Um valor DW estimado, variando
de 0 a 4, com mdia 2. Se o valor calculado converge para 2, isto significa que
no h autocorrelao. Se estes valores afastam-se para 0 ou 4, a
autocorrelao aumenta de maneira positiva ou negativa, respectivamente. Os
valores de 1,5 e 2,5 podem ser utilizados como os limites de aceitao
superiores e inferiores.
A normalidade dos resduos foi estimada pelo teste de Ryan Joiner (RJ).
Para a execuo deste teste, os resduos so ordenados em ordem crescente
e plotados contra a os valores dos percentis estimados para uma distribuio
normal reduzida (quantis normais). Considerando que os resduos so
ordenados para uma amostragem de tamanho n, um grfico de probabilidade
normal, tambm conhecido como grfico normal quantil quantil (ou grfico QQ), produzido ao se plotar o resduo de cada amostra (ei) contra qi, sendo qi
correspondente aos percentis de uma distrubuio normal reduzida. Os quantis
normais so obtidos pela equao 15.47

23

0  ]

N

3
8 ` , _ = 1,2,3 . Q
^
1
Q + 4
_

15

Onde qi o valor normal esperado e ] N o inverso de uma funo de


distribuio normal padro. Ento, o coeficiente de correlao entre ei e qi
calculado. Coeficientes de correlao abaixo de um valor crtico significam a
rejeio da hiptese de normalidade dos resduos. Coeficientes de correlao
crticos para diferentes nveis de significncia podem ser estimados atravs das
equaes abaixo:47
cde0f 1,007

0,1371

cde0f 1,0063
cde0f 0,9963

0,1288
Q

0,0211
Q

0,3682 0,7780
+
, iRR j = 0,10
Q
Q

16

1,4106 3,1791
+
, iRR j = 0,01
Q
Q

18

0,6118 1,3505
+
, iRR j = 0,05
Q
Q

17

Para a avaliao da homoscedasticidade, foi utilizado o teste de Levene,


modificado por Brown e Forsythe (BF). Neste teste, os resduos de predio
so divididos em dois grupos de tamanho n1 e n2. A mediana de cada grupo

(k k k
calculada. O valor absoluto das diferenas entre a mediana e cada

valor de resduo calculado. A mdia mo e a soma quadrtica dos resduos

SQDj dos dij valores para cada grupo so calculados. A estatstica pq de Levene

estimada pela equao 19. Quando pq no excede o valor crtico de p1

para n1+ n2-2 graus de liberdade, h indicao de homocedasticidade.47


pq =

m m

1
1
st + u Sv
Q Q

19

Onde Sv a varincia combinada, que pode ser estimada pela equao 20.
Sv =

Como

alternativa,

wxy + wxy

Q + Q 2

os

parmetros

20

da

curva

de

calibrao

pseudounivariada, introduzida na seo 2.7.2 podem tambm ser usados para


expressar a linearidade.
24

A faixa de trabalho do mtodo pode ser estabelecida atravs da


confirmao de que o mtodo proporciona graus aceitveis de veracidade,
linearidade e preciso dentro dos limites estudados.
2.7.3.3 Sensibilidade e seletividade do modelo
Para os mtodos de calibrao multivariada, a seletividade (SEL)
calculada para cada amostra i como a razo entre a norma de seu vetor NAS,
||nasi||, e a norma de cada respectivo espectro, ||xi||.
wz{ =

|||}~5 ||
||I0 ||

21

medida que cada amostra tem uma SEL diferente, um valor mdio utilizado
para caracterizar o mtodo. J que mtodos multivariados no necessitam de
resoluo de sinal, tambm importante ressaltar que a SEL no til para
fins de controle de qualidade. Ela apenas quantifica quanto do sinal analitico
utilizado no modelo. 55
A sensibilidade (SEN) de mtodos inversos, tais como PLS e PCR,
pode ser calculada como o valor do NAS em concentrao unitria, e obtida a
partir da norma do vetor dos coeficientes de regresso:
wz =

1
||H||

22

Uma vez que a SEN dependente da tcnica analtica empregada,


uma FOM mais til para fins de comparao com outros mtodos a
sensibilidade analtica (), que calculada como a razo entre a SEN e o rudo
instrumental (). No caso das medies de reflectncia difusa ou ATR, pode
ser estimado atravs do desvio padro combinado de um certo nmero de
replicatas de espectros da cela vazia, sendo o mesmo vlido para as imagens
adquiridas por escner. O para as imagens adquiridas pelo celular foi
estimado utlizando imagens do suporte sem amostra. 55
=

wz

23

O inverso de (-1) fornece uma estimativa da diferena de concentrao


mnima que distinguvel pelo mtodo, considerando o rudo aleatrio
experimental como a nica fonte significativa de erro, independentemente da
25

tcnica utilizada. Este valor define tambm o nmero de algarismos


significativos com o qual o resultados do modelo devem ser expressos.55
2.7.3.4 Robustez
A robustez avalia a susceptibilidade de um mtodo analtico para
pequenas alteraes deliberadas em condies experimentais. Para as
anlises de amostras de queijo utilizando NIRS foram avaliadas os tipos de
placas utilizadas na aquisio dos espectros e a forma de processamento da
amostra. 45
2.7.3.5 Vis (Bias)
O vis, ou bias, uma FOM que avalia a presena de erros sistemticos
no modelo, e calculado apenas para o conjunto de validao, como segue:45
K

onde Z0

)_RS = 
0

Z0

Z[0

24

e Z[0 so os valores de referncia e preditos para a propriedade de

interesse, respectivamente, e Q o nmero de amostras no conjunto de

validao. O desvio padro dos erros de validao (SDV) tambm estimado e


utilizado em um teste t de Student para determinar se as estimativas de
validao apresentam um vis estatisticamente significativo. O valor t calculado

ento comparado com o valor t crtico usando o nmero apropriado de graus


de liberdade, que igual a Q .55

[Z0e Z[0 )_RS]


wy = 
Q 1

25

2.7.3.6 Relao de desempenho do desvio (RPD)


Outra FOM adequada para avaliar a capacidade de predio dos
modelos de calibrao a relao de desempenho do desvio (RDP, do ingls
residual predition deviation ou relative predictive determinant).56 A RPD a
relao da variao natural nas amostras de calibrao ou de validao em
relao ao tamanho dos provveis erros que ocorrem durante a predio, e
mais til para a comparao de modelos em conjuntos de dados diferentes (em
diferentes faixas de valores previstos), ou em termos absolutos. Ela calculada
26

para a calibrao e validao, de acordo com as equaes 26 e 27, nas quais


SDcal e SDval so os desvios-padro dos valores de referncia para a calibrao
e validao, respectivamente.56,57
cydL =

wydL
cwz

26

wyL
cwz

27

cyL =

2.7.3.7 Erro amostral especfico de predio (EAEP)


A estimativa da incerteza de predio em calibrao multivariada um
assunto muito recente, comeando a ser estudada apenas no final da dcada
de 1980.58 Desde ento, tem havido um interesse crescente em determinar a
melhor maneira de estimar a incerteza multivariada. Alguns autores utilizam
estratgias de reamostragem, que consistem em simular novos dados
matematicamente, a partir dos dados j obtidos, atravs da adio de resduos
aleatrios (bootstrap) ou pela adio de rudo aleatrio. Dessa forma,
possvel aumentar o nmero de amostras (normalmente n > 1000), e a partir
da, o erro de predio para cada amostra calculado. Outra abordagem para
a estimao do erro de predio a utilizao de equaes, como as
desenvolvidas por Martens & de Vries em 1995 59 e Faber & Kowalski.60

Em alguma das aplicaes desta tese, o EAEP 


foi calculado com

base na equao descrita por Faber & Kowalski.58 Esta estratgia permite a
estimativa da incerteza de medida para cada amostra, com base em seu
leverage (h). Esta equao utiliza a incerteza do mtodo de referncia para o
clculo da incerteza multivariada, e justamente por isso, escolhemos esta
abordagem. A incerteza para cada amostra calculada de acordo com a

equao abaixo, na qual MSEC o erro mdio de calibrao, e  a

incerteza associada aos valores de referncia do conjunto de validao.


Quando este valor no est disponvel, como o caso deste trabalho, utiliza-se
o RMSECV como estimativa de  .60

27

s[1 +
wz  ]

28

Uma vez que os fatores de um modelo PLS podem consumir mais de um


grau de liberdade, o nmero de pseudo graus de liberdade (PGL) usado,
juntamente com os EPE, na estimativa dos intervalos de confiana. O nmero
de PGL estimado atravs da Equao 29, na qual nc o nmero de amostras
de calibrao.61
{ = Qd 1
2.7.3.8 Intervalos de -tolerncia

cwz

cwz

29

Uma ferramenta proposta mais recentemente para a validao de


mtodos analticos a estimativa de perfis de exatido baseados em intervalos
de tolerncia de expectativa (-TI). Os -TI foram propostos originalmente
para a calibrao univariada

62

e so utilizados como uma ferramenta visual

complementar de deciso para avaliar o desempenho de modelos preditivos.


Eles garantem que uma frao (ex. 95%) de todos os resultados futuros
obtidos por aquele mtodo apresentar um erro dentro dos limites do intervalo
calculado. Ento, se o -TI se encontra contido no intervalo definido como
aceitvel pelos guias de validao, o mtodo proposto atende os requerimentos
necessrios para a validao. A utilizao do -TI foi recentemente estendida
calibrao multivariada, focando principalmente na validao de mtodos
utilizando NIRS em anlises farmacuticas.63
O -TI pode ser estimado atravs das seguintes equaes:
TI  cz%
o t1 

1
cwy%
o 30

iQe o

Onde p o nmero de sries avaliadas, nr o nmero de replicatas


independentes por srie, RE(%) o erro relativo mdio para as n replicatas no
j-simo nvel, RSD(%) o desvio padro relativo para as n replicatas do jsimo nvel. t o valor critico bicaudal de t de Student para graus de
liberdade. calculado atravs da equao abaixo.

28

co  1

1
1
co 

1
Qe
Qe

i1
iQe

31

Onde Rj a razo entre a varincia intra-sries e a varincia entre series, e Bj


estimado utilizando Rj
co  1
o  
32

Qe co  1
2.7.4 Validao qualitativa multivariada
Mtodos analticos qualitativos fornecem como respostas variveis
dicotmicas (1/0, Sim/No, Ausncia/Presena, Conforme/No Conforme).
Estes mtodos j foram considerados como um ramo da qumica analtica em
declnio nas ltimas dcadas, principalmente por serem associados de maneira
restrita identificao de ons utilizando reaes qumicas por via mida.
Porm, com os avanos dos mtodos analticos instrumentais e a necessidade
de, muitas vezes, caracterizar a presena ou ausncia de um adulterante ou
contaminante, independente da sua concentrao, mtodos qualitativos esto
sendo revisitados, sendo identificados como ferramentas promissoras para o
desenvolvimento e implementao de mtodos de triagem (screening)
confiveis

64.

Mtodos de triagem simples e rpidos podem confirmar a

presena de analitos de interesse, simplificando o processo analtico, e


reduzindo tempo e custos, ao reduzir o nmero de amostras que so
submetidas a um processo analtico mais complexo e laborioso de anlise
quantitativa.65,66
Assim como os mtodos quantitativos, mtodos qualitativos tambm
devem ser submetidos a procedimentos de validao analtica. Como a
resposta fornecida por este mtodos so discretas, testes analticos e
procedimentos diferem daqueles utilizados para a validao de mtodos
quantitativos. Em 2002, a Unio Europeia publicou o primeiro guia oficial
incluindo a validao de mtodos qualitativos.67 Desde ento, o interesse neste
assunto tem crescido continuamente.6871 Com o visvel crescimento do nmero
de mtodos multivariados de classificao supervisionada, se faz necessria a
discusso de como proceder para sua validao, assim como tem sido feito
29

com os mtodos de calibrao multivariada.72 Entretanto, este assunto ainda


insipiente na literatura.
O primeiro passo no processo de desenvolvimento de um mtodo
qualitativo a definio do limite que caracteriza uma amostra como 0
(negativa/no conforme/ausncia) ou 1 (positiva/aceita/presena). Mtodos
qualitativos modernos normalmente se baseiam em leituras instrumentais para
a classificao das amostras, e este valor chamado de limite de corte (LC)
(treshold limit, em ingls), estimado atravs da teoria de Bayes.69,73 A
estimativa do LC foi estendida para mtodos multivariados, especificamente
para o PLS-DA.74 Assumindo que todas as amostras no conjunto de
treinamento pertenam a uma das classes definidas, A e B, por exemplo, o
seguinte pode ser estabelecido:

PA|y
 PB|y
 1

33

Atravs da teoria de Bayes, possvel estimar que uma amostra


pertence classe A dado um valor determinado de y, P(A|y), atravs da
seguinte equao:
PA|y


Py|A
PA

34)
Py|A
PA
 Py|B
PB

Onde P(A) e P(B) so as probabilidades para a observao da classe A ou B


no futuro. Se assumirmos que a probabilidade de se observar A ou B similar
a quantas amostras de A ou B estavam no conjunto de treinamento, possvel
reduzir a equao acima para:
P(A|y) =

P(y|A)
(35)
P(y|A) + P(y|B)

e
P(B|y) =

P(y|B)
(36)
P(y|A) + P(y|B)

Estas duas distribuies tipicamente se interceptam em um nico valor,


que nos leva a um nico ponto no qual P(B|y) e P(A|y) so iguais a 0,5. Este
ponto selecionado como o limite de corte.71
30

Aps esse limite ser definido, o prximo passo determinar o nmero de


amostras falso positivas (FP) e falso negativas (FN). FP o nmero de
amostras que no pertencem classe e so classificadas como pertencentes,
por exemplo, uma amostra que no est adulterada sendo classificada como
tal, e FN o parmetro oposto. Utilizando FP e FN as seguintes FOM so
estimadas: Taxa de Falso Negativo (TFN), Taxa de Falso Positivo (TFP), Taxa
de Seletividade (TSL), Taxa de Especificidade (TES) e Taxa de Confiabilidade
(TCF). 71
A TFP definida como a relao entre FP e a soma de FP com o total
de amostras conhecidamente negativas (TN)
 =

(37)
+ 

Analogamente, a TFN definida como a relao entre FN e a soma de


FN mais o nmero de amostras conhecidamente positivas (TN).
 =


(38)
 +

A TSL definida como a relao entre TP e a soma de TP e FN, e a


TES como a relao entre TN e a soma de TN e FP. Alm disso, a TCF pode
ser definida como a diferena entre o total dos resultados (100%) e a soma de
TFP e TFN.
w{ =

100 (39)
+ 

zw =


100 (40)
 +

= 100 ( + ) (41)
Apesar de algumas FOM utilizadas nas validaes qualitativa e
quantitativa terem o mesmo nome, os conceitos e maneiras de avalia-las so
diferentes. Enquanto TFP, TFN e TCF expressam a veracidade em anlises
qualitativas, TSL e TES so consideradas FOM relacionadas com a
seletividade do mtodo. Outras duas FOM, Acordncia (ACO) e Concordncia
(CON), expressam a preciso do mtodo. A ACO a probabilidade de duas
31

amostras idnticas fornecerem a mesma resposta (ambas positivas ou


negativas) quando realizadas pelo mesmo laboratrio ou batelada, sob
condies de repetitividade. Para a sua estimativa, a probabilidade de duas
amostras fornecerem a mesma resposta calculada, e estimada uma mdia
dessa probabilidade para cada batelada, conforme a equao abaixo: 71
=

( 1 ) + (Q  )(Q  1)
(42)
Q(Q 1)

Onde n o nmero total de amostras em cada batelada e k o nmero de


resultados positivos em cada batelada. A CON a FOM qualitativa equivalente
estimativa da preciso intermediria ou reprodutibilidade, em mtodos
quantitativos. Ela estima a probabilidade de duas amostras de mesma classe
fornecerem o mesmo resultado em diferentes laboratrios ou bateladas. A CON
pode ser estimada de acordo com a equao abaixo. 71

 =

2( Q)) + Q)(Q) 1) Q)(Q 1)


(43)
Q)() 1)

Onde b o nmero de laboratrios ou bateladas.71,75


2.7.5 Monitoramento ps-modelo
A grande maioria dos mtodos de calibrao multivariada publicados na
literatura no se preocupa em avaliar o seu desempennho posterior,
acompanhando-o por um prazo mais longo. Como muitos trabalhos so
puramente acadmicos, a vida til desses modelos no costuma ser avaliada.
No entanto, em aplicaes reais uma das primeiras preocupaes prticas
dos responsveis pelo laboratrio de controle de qualidade a questo: At
quando o modelo vai continuar funcionando? Nesse sentido, esta tese se
props a fazer um monitoramento ps-modelo em sua primeira aplicao, a
qual foi desenvolvida em situao real, numa parceria com um labortorio de
controle fiscal do Governo de Minas Gerais.
As amostras utilizadas para construir os modelos foram obtidas a partir
de 2009. Aps os mtodos baseados em NIRS terem sido estabelecidos e
validados, eles foram ento implementados em substituio aos mtodos
32

tradicionais no IMA, a partir de 2011. O desempenho dos modelos foi


monitorado por amostragem aleatria de, no mnimo, uma amostra por
semana, as quais tambm foram determinadas pelos mtodos de referncia. A
veracidade destas determinaes foi avaliada de acordo com as normas
brasileiras.36
As cartas de controle foram contrudas com base nos erros relativos de
predio. De acordo com essa normatizao, dois teros das amostras podem
apresentar erros relativos dentro da faixa de 15% (limites de alerta), enquanto
um tero pode ter erros mximos admissveis abaixo de 33% (limites de
ao). Caso o limite seja ultrapassado, o modelo deve ser revisado.36

33

3. Modelos para o controle fiscal de queijos utilizando


espectroscopia NIR e PLS
A grande maioria dos modelos multivariados propostos para a anlise de
alimentos no so suficientemente robustos para uso em anlise de rotina,
necessitando incorporar mais varincia e ter sua confiabilidade testada em
condies reais. Poucos trabalhos publicados apresentaram um mtodo
multivariado que efetivamente fosse usado e testado no dia a dia de um
laboratrio de rotina, ou mesmo realizaram um processo de validao analtica,
garantindo sua confiabilidade.
Neste captulo, duas aplicaes foram desenvolvidas para o controle de
parmetros fsico-qumicos de qualidade de queijos: i) determinao de
umidade e gordura em queijo muarela e ii) determinao de umidade em
queijo minas. No desenvolvimento destes mtodos utilizaram-se amostras
oriundas da rotina analtica do IMA, visando justamente incorporar toda
variabilidade presente em uma situao real de um laboratrio de controle
fiscal. Essa amostragem incluiu diferentes produtores, diferentes receitas e a
prpria sazonalidade do produto, uma vez que as amostras foram coletadas ao
longo de dois anos, com isso incorporando a variabilidade inclusive ocasionada
pelas pocas de chuva e de seca, que alteram as caractersticas nutricionais
do leite.
3.1 Determinao de umidade e gordura em queijos muarela
A Muarela um queijo originalmente feito de leite de bfala
pasteurizado e parcialmente desnatado, amplamente encontrada em todo o
mundo, e originrio da regio de Campania, no sul da Itlia. o queijo mais
consumido nos EUA, Brasil e outros pases, principalmente devido ao seu uso
em pizzas, sanduches e lanches.76
No Brasil, o Estado de Minas Gerais o maior produtor de queijo, com
cerca de metade da produo (215 mil toneladas por ano, em 2001).77 Desse
total, 24% corresponde a muarela. A produo de muarela no Brasil
regulada

pelas

diretrizes

do

Ministrio

da

Agricultura,

Pecuria

Abastecimento (MAPA), que estabelecem limites para a gordura (mnimo de


35% p/p, em base seca) e umidade (mximo de 60% p/p).78
34

De acordo com esta legislao, o mtodo de referncia para a


determinao de gordura o de Rose Gottlieb, que consiste em extrair os
compostos lipdicos do leite atravs de sucessivas extraes com solventes
orgnicos de diferentes polaridades, seguidas de evaporao dos solventes e
pesagem dos compostos lipdicos residuais. Por ser um mtodo demorado,
muitas vezes ele substituido pelo mtodo de Gerber em rotinas
laboratoriais.79 Este mtodo baseia-se na utilizao de um butirmetro (Figura
7), e possui desvantagens. A determinao no pode ser automatizada e
envolve um certo risco na manipulao de cido sulfrico concentrado78. Alm
disso, a manipulao do butirmetro requer prtica, o que tem efeito negativo
sobre a robustez e a preciso do mtodo.80

Escala do
butirmetro

Teor de
gordura
Corpo do butirmetro
Abertura

Rolha

Figura 7 Butirmetro de Gerber


A determinao de umidade realizada pelo mtodo gravimtrico de
dessecao em estufa78. Embora este mtodo seja simples, a sua principal
desvantagem a lentido, uma vez que cada anlise demora entre 3 e 6
horas.81
Em

geral,

os

mtodos

analticos

para

determinao

de

macroconstituintes, tais como gordura e umidade, so lentos, relativamente


caros, e exigem pessoal altamente qualificado. Estes mtodos clssicos no
so eficazes o suficiente para cobrir a crescente demanda e os baixos custos
necessrios no controle de qualidade de alimentos em indstrias ou na
inspeo de qualidade pelos rgos pblicos.82

35

O primeiro trabalho a sugerir um mtodo baseado em NIRS para a


quantificao em produtos lcteos foi publicado por Ben Gera & Norris, em
1968,83 os quais estimaram o contedo de gordura no leite por meio de
regresso linear mltipla (RLM). Mas, em geral, a utilizao mais ampla de
mtodos de NIRS s surgiu no final dos anos oitenta, quando modelos de
calibrao multivariada mais estveis e robustos, como o PLS e o PCR,
substituram a RLM na maioria das aplicaes prticas. Em 1994, Pierce &
Wehling84 publicaram o primeiro trabalho desenvolvendo um mtodo usando
NIRS e PLS para determinar umidade e gordura em queijo cheddar. Desde
ento, vrios artigos foram publicados usando NIRS e calibrao multivariada
para predio destes parmetros de qualidade, tais como gordura, protena,
umidade e outros, em diferentes tipos de queijos (fresco, Danbo, Emmental e
Cheddar) e derivados.7,8590 Especificamente, nenhum artigo foi publicado
desenvolvendo mtodos baseados em NIRS para a determinao de
parmetros em queijos muarela.
Muitos modelos de calibrao multivariada baseados em NIRS no so
confiveis, robustos e suficientemente estveis para serem usados na prtica
em anlises de rotina. A maioria dos artigos citados acima no incorporou
varincia suficiente em seus modelos, necessria para um uso mais amplo e
robusto na rotina do controle de qualidade fiscal Da, a necessidade de
desenvolver modelos mais robustos, para os quais a estratgia de incorporar
amostras com uma grande diversidade de origem fundamental.91. Nesses
trabalhos, os modelos foram desenvolvidos a partir de amostras de queijo
obtidas de um pequeno nmero de produtores (s vezes, de um nico
produtor). Absolutamente nenhum dos modelos desenvolvidos nesses
trabalhos foram aplicados em situaes reais de anlises de rotina ou tiveram
sua robustez avaliada nesse contexto. Alm disso, uma validao analtica
multivariada no foi realizada em nenhum dos artigos previamente citados.Esta
deficincia encontrada no apenas em trabalhos relacionados a rea de
bromatologia, mas na grande maioria dos artigos envolvendo calibrao
multivariada. Talvez, a falta dessas avaliaes mais rigorosas seja um dos
fatores que contribui para a no utilizao destas tcnicas em situaes de
rotina, e tambm para falta de reconhecimento de mtodos multivariados pelos
36

orgos oficiais, que, salvo raras excees, negligenciam por completo a


calibrao multivariada.
3.1.2 Objetivos
Desenvolver modelos PLS robustos para a determinao de gordura e
umidade em queijos muarela utilizando NIR e PLS, e valid-los de acordo com
a legislao vigente, tentando harmonizar o guia do MAPA com a realidade
multivariada.
3.1.3 Materiais e mtodos
3.1.3.1 Equipamentos e softwares
Os espectros de infravermelho foram obtidos em um espectrofotmetro
Perkin Elmer FTIR 400 (Waltham, EUA), equipado com um acessrio de
reflectncia difusa. Os dados foram tratados usando o software MATLAB,
verso 7.13 (MathWorks, Natick, EUA) juntamente com o pacote PLS Toolbox
verso 6.5 (Eigenvector Technologies, Manson, USA). Para a deteco de
amostras anmalas utilizou-se uma rotina desenvolvida por Jez W. B. Braga
(IQ-UnB).92
3.1.3.2 Materiais, reagentes e amostras
Todos os reagentes e materiais (cido sulfrico, lcool isoamlico e areia
purificada) foram de grau analtico, adquiridos de fornecedores certificados e
utilizados sem purificao adicional. Um total de 123 amostras de queijo
muarela, fabricados por diferentes processos e originrias de mais de 100
diferentes produtores de todo o Estado de Minas Gerais foram coletadas e
analisadas entre 2009 e 2010. As amostras de queijo foram transportadas sob
refrigerao a 4 C e analisadas imediatamente aps a sua abertura no
laboratrio. Antes da abertura, as amostras eram deixadas em repouso para
atingir o equilbrio trmico por um perodo de 30 minutos. As fatias da amostra
foram retiradas da parte interna do queijo, evitando a parte externa, que est
sujeita a ressecamento e degradao.
3.1.3.3 Procedimentos
Todos os procedimentos foram realizados no Laboratrio de Anlises
Fsico-Qimicas (LAFQ) do Instituto Mineiro de Agropecuria (IMA), localizado
37

em Contagem/MG. As amostras de queijo foram cortadas, trituradas com um


misturador industrial, e transferidas para uma placa Perkin Elmer, em
quantidade suficiente para cobrir seu fundo. Os espectros foram coletados
como uma mdia de 32 varreduras, de 1000 a 2500 nm, passo 2 nm, com
resoluo de 8 cm-1. Dez espectros idnticos da placa vazia foram tambm
registradas nas mesmas condies, a fim de estimar o rudo instrumental.
Durante todas estas medies, a temperatura da sala foi controlada a
22 1 C.
As anlises por mtodos de referncia foram realizados de acordo com a
literatura,79 sem repeties. A determinao de gordura foi realizada com o
mtodo de Gerber. Um grama de uma amostra de queijo foi pesada com
preciso no butirmetro, no qual 10 ml de uma soluo de cido sulfrico
(d=1,605 g.cm-1) e 1 mL de lcool isoamlico foram adicionados, ento, a
vidraria foi fechada, agitada e aquecida durante 15 minutos num banho de
gua a 65 C; a agitao e o aquecimento foram repetidos at digesto total da
amostra pelo cido e, finalmente, a fase lipdica foi ajustada para a leitura no
ponto zero da vidraria.
A determinao da umidade foi realizada por mtodo gravimtrico
(dessecao em estufa). Trs gramas de uma amostra de queijo foram
pesadas numa placa e misturadas com a mesma quantidade de areia fina
purificada pr-seca. A adio de areia auxilia na secagem mais rpida e
eficiente da amostra, evitando a formao de crostas que dificultam a
evaporao da gua. Esta mistura foi homogeneizada e seca em estufa a
105 C, at peso constante (variao menor que 0,001g), o que costuma
durar de trs a seis horas.
3.1.4 Resultados e discusso
3.1.4.1 Desenvolvimento do modelo PLS
Os espectros de infravermelho prximo das 123 amostras de queijos
muarela analisadas so mostrados na Figura 8. Ao observar estes espectros,
possvel atribuir as bandas mais intensas e largas centradas em 1454 e 1936
nm s vibraes das molculas de gua, que correspondem ao primeiro
sobretom de estiramento da ligao OH, e combinao das bandas
38

vibracionais dos modos de estiramento e deformao angular de ligaes O-H


respectivamente.83,84

Figura 8 Espectros das 123 amostras de queijo muarela


Outros picos observados podem ser relacionados com o teor de gordura
dos queijos e a vibraes das molculas lipdicas, tais como: a banda centrada
em 1210 nm, que atribuda ao segundo sobretom do estiramento de ligaes
C-H; os picos em 1730 e 1763 nm, relacionados com o primeiro sobretom de
estiramento

C-H,

os

picos

em

2308

2348

nm,

atribudos

bandas de combinao resultantes de estiramento C-H e deformao de um


grupo CH2.83,84
As amostras foram divididas em 82 para o conjunto de calibrao e 41
para o conjunto de validao usando o algoritmo de Kennard-Stone,93 que
garante a presena das amostras mais representativas no conjunto de
calibrao. O algoritmo define, inicialmente, as duas amostras mais distantes
entre si, utilizando a distancia euclidiana. Para selecionar novas amostras para
o conjunto, o algoritmo seleciona a amostra mais distante daquelas
previamente selecionadas. Este processo repetido at que o nmero de
amostras, definido previamento, seja atingido.
Na Figura 8 tambm pode ser observada a presena de desvios nolineares de linha de base, tpicos em medidas de reflectncia difusa, causados
pelo espalhamento multiplicativo da luz. Assim, os dados foram prprocessados usando correo de espalhamento multiplicativo (MSC), a fim de

39

superar este problema,94 antes de serem centrados na mdia. O espectros prprocessados por MSC so mostrados na Figura 9.

Figura 9 - Espectros de queijo muarela pr-processados com MSC


O nmero de VLs em cada modelo foi escolhido por validao cruzada
usando diviso em blocos contnuos (9 divises), com base nos valores mais
baixos de RMSECV (raiz do erro quadrtico mdio de validao cruzada). Os
melhores modelos foram inicialmente selecionados, com 4 e 7 VLs para
umidade e gordura, respectivamente.
Modelos PLS por intervalos (iPLS com 10 intervalos) tambm foram
testados, mas todos os resultados foram piores (em geral, maiores valores de
RMSECV e maior nmero de VLs) do que os modelos PLS utilizando toda a
faixa espectral. Os coeficientes de regresso dos modelos PLS para
determinao de gordura e umidade so mostrados nas Figuras 10 e 11,
respectivamente. Ao observar a Figura 10, possvel identificar as regies
espectrais que mais contribuiram para a predio de gordura. Como era de se
esperar, os maiores coeficientes foram relacionados aos segundo e primeiro
sobretons de estiramento de ligaes C-H lipdicas (cerca de 1210, 1730 e
1763 nm); no entanto, interessante notar que a contribuio mais intensa veio
da regio entre 1870 e 1890 nm, que pode ser atribuda banda de
combinao de vibraes de C-O e O-H de cidos carboxlicos,95 os quais
esto presentes na muarela em baixos teores.

40

Figura 10 Coeficientes de regresso para o modelo de determinao de


gordura em queijo muarela
Na Figura 11 podem ser vistas as regies que mais contribuem para a
predio da umidade. Os coeficientes so mais positivos entre 1850 e 1910
nm,correspondendo banda de combinao de O-H de gua; por outro lado,
os coeficientes mais negativos foram relacionados s vibraes C-H lipdicas,
uma vez que existe uma relao inversa entre gua e gordura na composio
de queijos. Essas vibraes foram observadas em torno de 1440 nm, e entre
1690 e nm 1780, atribudas combinao de primeiro sobretom de C-H, e ao
primeiro sobretom de estiramento C-H, respectivamente.

Figura 11 - Coeficientes de regresso para o modelo de determinao de


umidade em queijo muarela

41

3.1.4.2 Otimizao dos modelos pela deteco de amostras anmalas


Aps a construo dos modelos PLS, foi realizada a otimizao
utilizando o procedimento para a deteco de amostras anmalas descrito
previamente. Os valores extremos foram detectados a um nvel de confiana
de 99%, e os resultados foram resumidos na Tabela 1. As amostras anmalas
podem ser removidas dentro de um limite de 2/9 (22,2 %) de seu nmero total,
conforme estabelecido pelas diretrizes brasileiras.36
Tabela 1 - Otimizao dos modelos PLS pela deteco de amostras anmalas
(modelos finais esto destacados em negrito)
1
2
3
4
Modelos

Amostras de calibrao
Amostras de validao
Variveis latentes
RMSEC (%)
RMSEP (%)
Amostras de calibrao
Amostras de validao
Variveis latentes
RMSEC (%)
RMSEP (%)

otimizao

do

Gordura
82
41
7
3,1
3,2
Umidade
82
41
4
1,8
2,2

conjunto

de

77
41
8
2,1
3,0

74
37
8
1,8
2,1

-----------

77
41
8
1,0
1,8

74
41
8
0,8
1,7

73
35
6
0,6
0,9

validao

foi

realizada

aps

a otimizao do conjunto de calibrao. Alm disso, no mais de trs rodadas


de deteco de amostras anmalas (quatro modelos) devem ser realizadas, a
fim de evitar o "efeito bola de neve" (snowballing), que ocorre quando so
sempre identificados novos outliers a cada novo modelo.44
Como pode ser visto na Tabela 1, para o modelo de gordura, oito outliers
foram detectados no conjunto de calibrao (correspondente a 9,8% das
amostras) e quatro no conjunto de validao (tambm 9,8%); destes 12
outliers, trs foram detectados com base no alto leverage e nove com base nos
resduos em Y. Para o modelo de umidade, nove outliers foram identificados
no conjunto de calibrao (11,0%) e seis no conjunto de validao (14,6%).
42

Destes quinze outliers, trs foram detectados com base no leverage, um com
base nos residuos espectrais (X) e onze com base nos residuos em Y.
Portanto, o modelo PLS otimizado para a determinao de gordura foi
construdo com 74 amostras de calibrao e 37 amostras de validao, usando
8

VLs,

explicando

99,1%

da

varincia

em

89,8%

em

Y.

O modelo otimizado para determinao de umidade foi construdo com 73


amostras de calibrao e 35 amostras de validao, utilizando 6 VLs,
explicando 98,2% da varincia em X e 94,1% em Y.
3.1.4.3 Validao analtica
A Tabela 2 resume os parmetros estimados para a avaliao das FOM
para os mtodos propostos. Nas subsees seguintes, cada FOM estimada
discutida especificamente.
3.1.4.3.1 Linearidade
Tal como discutido na subseco 2.7.3.2, a linearidade foi estimada
atravs do ajuste dos valores de referncia contra os valores preditos. Os
resduos para os modelos de gordura e de umidade esto apresentados nas
Figuras 12 e 13. Na maioria da literatura referente calibrao multivariada, os
resduos so plotados em funo dos valores de referncia, o que no
estritamente correto. Os resduos devem ser representados graficamente em
funo dos valores preditos, uma vez que no existe correlao entre eles
(r=0). Se os resduos so plotados contra os valores de referncia, sempre
haver correlao, com o coeficiente de correlao (r) sendo igual a um menos
o valor de r da curva de calibrao.96

43

Figura 12 Grfico de resduos vs. valores preditos para o modelo de


determinao de gordura amostras de calibrao () e de validao ()

Figura 13 - Grfico de resduos vs. valores preditos para o modelo de


determinao de umidade amostras de calibrao () e de validao ()
Como pode ser observado nas figuras acima, nenhuma tendncia
sistemtica

evidente

nas

distribuies

residuais.

No

entanto,

comportamento aleatrio destes resduos foi confirmada por testes estatsticos


apropriados.47 No nvel de confiana de 95%, os resduos dos dois modelos
foram considerados normais e homoscedsticos, de acordo com os testes RJ e
BF, respectivamente. Alm disso, a independncia dos resduos foi verificada
pelos valores do teste DW (Tabela 2), os quais estavam dentro dos limites da
faixa de aceitao, entre 1,50 e 2,50.

44

Tabela 2 - Figuras de mrito, estimadas para os modelos PLS de determinao


de gordura e umidade
Figuras de Mrito

Paramtros

Veracidade (n=40)

Erro relativo mdio

Gordura

Umidade
Valores

2,1 %

0,1 %

2,6 % (1,8 %)

1,4 % (1,8 %)

DPR preciso
intermediria b
(DPRR)
Durbin-Watson

3,2 % (1,7 %)
3,6 % (1,8 %)
3,1 % (2,7 %)
8,5 % (2,6 %)
4,1 % (2.7 %)
1,8

1,8 % (1,8%)
1,7 % (1,7 %)
1,6 % (2,6 %)
2,2 % (2,8 %)
1,7 % (2,5 %)
1,9

Inclinao

1,00 0,02

1,00 0,03

Intercepto

0,01 2,70

0,00 1,40

Coeficiente de
correlao (r) c

0,9442

0,9702

Faixa de trabalho

38,7 a 58,0 %

41,5 a 55,1 %

Seletividade do modelo

0,07

0,11

DPR repetitividade a
(DPRr)
Preciso (n=18)

Linearidade

Sensibilidade do modelo

0,009

0,012 d

Sensibilidade analtica ()

1,8 %-1

2,4 %-1

0,60%

0,40%

RPD calibrao

-0,7751,942
%
2,1

RPD validao

2,0

Vis
RPD

0,0010,933 %
2,9
2,4

Resultados para trs amostras em trs diferentes concentraes analisadas no mesmo dia
por um mesmo analista, em sextuplicata. Valores limites de DPRr (entre parnteses) calculados
atravs da equao de Horwitz para cada nvel de concentrao estudado.
b Resultados para trs amostras em trs diferentes concentraes em dias diferentes por
analistas diferentes, em sextuplicata. Valores limites de DPRR (entre parnteses) calculados
atravs da equao de Horwitz para cada nvel de concentrao estudado.
c Parmetros do ajuste para a curva de valores de referncia vs. valores preditos para as
amostras de calibrao
d Valores expressos como a razo entre log (1/R) e %
a

45

Uma vez que os modelos lineares foram considerados vlidos, atravs


da avaliao dos testes estatsticos, os parmetros do ajuste da curva de
valores de referncia contra os valores previstos puderam ser calculados
(Tabela 2). Outra forma de expressar a linearidade de modelos multivariados
NIRS atravs das curvas de calibrao pseudo-univariada, que so
mostradas para os modelos de gordura e de umidade nas Figuras 14 e 15. Os
ajustes das curvas so mostrados nas equaes 19 e 20, respectivamente.

Figura 14 Curva de valores de referncia vs. norma do NAS para o modelo


de determinao de gordura - amostras de calibrao () e de validao ()

Figura 15 - Curva de valores de referncia vs. norma do NAS para o modelo de


determinao de umidade - amostras de calibrao () e de validao ()
46

Este tipo de representao permite uma melhor compreenso dos


modelos PLS, de uma forma univariada, o que til em anlises de rotina. Os
valores de norma do NAS so equivalentes intensidade de sinais analticos
seletivos obtidos, aps a eliminiao da contribuio dos interferentes, a partir
do vetor do espectro de cada amostra.

mR  110,91|VW| + 8,94


_mRmk = 47,69|VW| + 4,45

(44)
(45)

3.1.4.3.2 Veracidade, preciso e faixa de trabalho


A veracidade dos mtodos pode ser avaliada atravs do valores de
RMSEP (absolutos) 2,1 e 0,9%, para gordura e umidade, respectivamente
(Tabela 2). Ela tambm pode ser avaliada com base nos erros relativos mdios
observados, 2,1 % (variando entre -8,7 e 8,1%) para a determinao de
gordura, e 0,1% (variando entre -2,9 e 3,5%) para a determinao de umidade
(Figuras 16 e 17). Os resultados encontrados esto de acordo com o
esperados, pois para a faixa de concentrao do analito, os erros relativos
mdios podem variar entre -3 e 3%.41

Figura 16 Erros relativos das amostras de validao para o modelo de


determinao de gordura

47

Figura 17 - Erros relativos das amostras de validao para o modelo de


determinao de umidade

As precises sob condies de repetitividade e preciso intermediria,


expressas como valores de desvio padro relativo (DPRr e DPRR,
respectivamente), foram estimadas por anlise de varincia dos valores
preditos para 18 replicatas de amostras em trs nveis de concentrao
distintos.47 Os valores de DPRR variaram entre 3,1 e 8,5% para gordura e entre
1,6 e 2,2% para umidade, e os valores de DPRr variaram entre 2,6 e 3,6% para
gordura e entre 1,4 e 1,7% para umidade. Todos os valores estimados para o
modelo da umidade esto abaixo do limite mximo, estimado atravs da
equao de Horwitz, enquanto todos os valores estimados para o modelo da
gordura esto acima do limite estabelecido.40 Apesar de ser o mtodo mais
comum para se estimar o limite de preciso de mtodos analticos, e de ter sido
utilizado neste trabalho, ele no aplicvel a todo tipo de anlise. Segundo os
autores, a equao de Horwitz no deve ser aplicada a determinaes que so
mtodos-dependentes, como a determinao de gordura, umidade, ou cinzas,
muito comuns em anlises de alimentos. Por isso, mesmo o modelo de
determinao de gorudra no atendendo aos limites determinados pela
equao, foi dada sequncia validao dos dois modelos.97
Considerando-se os estudos de linearidade e preciso, os intervalos de
trabalho dos mtodos foram estabelecido como 38,7 - 58,0% p/p para a
gordura e 41,5 - 55,1% p/p para a umidade. importante ressaltar que estes
48

intervalos no so necessariamente idnticas s faixas teis de calibrao.


Enquanto a calibrao pode cobrir uma vasta gama de concentraes, o
restante da validao abrange um leque mais restrito.40
3.1.4.3.3. Seletividade e sensibilidade analtica
Como discutido anteriormente, os valores de SEL no tm interesse
prtico para o controle de qualidade de um ponto de vista multivariado. As
estimativas de SEL apenas indicam que 7 e 11% do sinal analtico foram
utilizados para predizer a gordura e a umidade, respectivamente.
Uma vez que os valores de SEN no so apropriados para comparao
com outros mtodos, o dos mtodos (Tabela 2) foi tambm calculado com
base no estimado de 0,005. O inverso da indicou que os mtodos foram
capazes de discriminar diferenas de concentrao mnimas de 0,6% para
gordura e 0,4% para umidade, considerando o rudo aleatrio instrumental
como a nica fonte de erros.
3.1.4.3.4. Robustez
Dois fatores de interesse prtico foram escolhidos para a avaliao de
robustez. O objetivo foi verificar se seria possvel substituir as placas fornecidas
pelo fabricante do equipamento por placas de petri convencionais, menos
dispendiosas para as medidas de reflectncia. E tambm se um pr-tratamento
mais simples da amostra, sem triturao, proporcionaria os mesmos
resultados. Um planejamento fatorial completo 2 (2 fatores em 2 nveis), em
triplicata, indicou que os dois fatores estudados no apresentaram efeito
significativo sobre os resultados no nvel de confiana de 95%. Como pode ser
visto na Figura 18, todos os efeitos estimados esto abaixo do valor crtico de
2,31, o que indica que o tipo de processamento e o tipo de placa utilizados no
influenciam o resultado obtido. Portanto, para novos modelos, placas de petri
comuns e amostras fatiadas podero ser utilizadas.

49

Placa*Processamento

Processamento

Gordura
Umidade

Placa

0.5

1.5

2.5

Efeitos padronizados

Figura 18 Efeitos do teste de robustez, de acordo com um planejamento 22


3.1.4.3.5. Vis e RPD
O vis foi calculado apenas com base nas amostras de validao e as
suas estimativas para ambos os modelos so mostradas na Tabela 2. Com os
valores de vis e SDV, um valor de t = 0,005 foi estimado para o modelo de
umidade, o que est abaixo do t crtico de 2,026 com 37 graus de liberdade
e no nvel de confiana de 95%. Para o modelo de gordura, t = 2,426 foi
estimado, o que pode indicar a ausncia de um vis estatisticamente
significativo apenas a 98% de confiana (tcritico=2,431).
De acordo com a literatura,56 valores de RPD maiores que 2,4 so
considerados desejveis para boas equaes de calibrao e valores entre 2,4
e 1,5 so considerados satisftorios, enquanto modelos com RPD inferior a 1,5
so considerados inadequados. Assim, os valores RPD para o modelo de
umidade foram considerados bons, enquanto os valores de RPD para o modelo
de gordura foram considerados satisfatrios (Tabela 2).
3.1.4.3.6 Erro amostral especifico de previso (EAEP)
Os EAEP variaram entre 1,1% e 1,3% para umidade e entre 2,5%
e 2,8% para gordura. Comparando os valores preditos, juntamente com os
intervalos de erro estimados, com os valores de referncia, h uma
concordncia de 75% para o modelo de predio de gordura, enquanto a
concordncia para o modelo da umidade de quase 90% (Figuras 19 e 20).
50

Isso se deve principalmente exatido dos mtodos de referncia. Como j foi


discutido anteriormente, o mtodo gravimtrico de dessecao em estufa
mais exato que o mtodo de Gerber.

Figura 19 - Erro amostral especfico de predio das amostras de validao


para o modelo de determinao de gordura - valores de referncia () e valores
preditos (*)

Figura 20 - Erro amostral especfico de predio das amostras de validao


para o modelo de determinao de umidade - valores de referncia () e
valores preditos (*)

51

3.1.4.3.7 Monitoramento ps modelo


Uma vez que os mtodos foram validados, aprovados e implantados no
IMA para o controle de qualidade de queijos muarela, surgiu a necessidade de
que fossem monitorados, a fim de avaliar as suas estabilidades. Durante um
perodo de cerca de um ano, em 2011, 53 amostras foram coletadas e
analisadas pelo mtodo de referncia e pelos modelos PLS desenvolvidos . Os
resultados so mostrados como cartas de controle. O eixo y representa o erro
relativo para cada amostra e o eixo x representa cada amostra em funo da
data de anlise (Figuras 21 e 22). Os limites indicados nestas cartas de
controle so baseados nas diretrizes brasileiras,36 que estabelecem os limites
de aceitao de erros para o monitoramento da estabilidade de mtodos
quantitativos.

40.00
30.00

Erro relativo (%)

20.00
10.00
0.00
-10.00
-20.00
-30.00
-40.00
Amostras

Figura 21 Carta de controle para monitorar a estabilidade do modelo de


determinao de gordura

52

40.00
30.00

Erro relativo (%)

20.00
10.00
0.00
-10.00
-20.00
-30.00
-40.00
Amostras

Figura 22 - Carta de controle para monitorar a estabilidade do modelo de


determinao de umidade
De acordo com essa normatizao, dois teros das amostras podem
apresentar erros relativos dentro da faixa de 15% (limites de alerta), enquanto
um tero pode ter erros mximos admissveis no limite mximo de 33%
(limites de ao). Uma vez que apenas trs amostras (5,6% do total) para o
modelo de gordura e uma amostra (1,9%) para o modelo de umidade
apresentaram erros relativos entre 15% e 33%, ambos os modelos foram
considerados satisfatoriamente estveis.

3.2. Determinao de umidade em queijos minas artesanal utilizando NIR e


PLS
A produo de queijos artesanais no Brasil iniciou-se no perodo colonial
por portugueses que traziam consigo rebanhos bovinos. Os animais tinham
parte de sua escassa produo leiteira destinada fabricao de um queijo
frescal, semelhante ao da Serra de Estrela, de Portugal. A diferena entre o
queijo portugus e o produzido no Brasil referia-se ao tipo de material usado
para coagulao do leite. Em Portugal, eram utilizados extratos de flores e
53

brotos de cardo silvestre (Cynara cardunculus L.), que no Brasil foram


substitudos por estmago seco e salgado de moc, bezerro ou cabrito.98
No Brasil, so considerados como artesanais os queijos Minas,
produzidos nas regies de Arax, Serra da Canastra, Cerrado, Serro e Campo
das Vertentes, no estado de Minas Gerais; o queijo de Coalho e o queijo de
Manteiga, produzidos na Regio Nordeste; o queijo Serrano e o queijo Colonial,
produzidos na Regio Sul; e o queijo Caipira, produzido no estado do Mato
Grosso do Sul. As estatsticas sobre a produo e consumo de queijos
artesanais brasileiros so escassas.98
Queijo minas um queijo tradicional do brasileiro, sendo o queijo mais
consumido em todo o pas. Ele pode ser classificado em dois tipos diferentes: o
Queijo minas artesanal, produzido apenas no estado de Minas Gerais, e o
Queijo minas padro, produzido em todo o pas. As leis federais apenas
reconhecem o queijo minas padro, de modo que o queijo artesanal s pode
ser comercializado dentro do Estado de Minas Gerais.99
De acordo com as leis do Estado de Minas Gerais, para ser considerado
queijo artesanal, alguns pr-requisitos devem ser cumpridos. O leite utilizado
na produo de queijo deve ser da mesma fazenda onde o queijo ser
produzido, e este leite no pode ser pasteurizado. Em relao s propriedades
fsico-qumicas, o teor de umidade no deve ser superior a 45,9%. O mtodo
oficial para determinao de umidade a dessecao em estufa.100,101
3.2.1 Objetivos
O objetivo deste trabalho foi desenvolver um mtodo simples, robusto e
rpido para determinao do teor de umidade em queijos minas artesanal
usando NIRS e PLS. Esse mtodo deve ser usado para o controle de qualidade
destes queijos no IMA (Instituto Mineiro de Agropecuria). Este trabalho
tambm tem como objetivos a realizao das anlises sob o ambiente do
controle de qualidade, incluindo uma validao analtica e a avaliao
permanente do desempenho do mtodo atravs do monitoramento da
estabilidade ps-modelo.

54

3.2.2 Material e mtodos


3.2.2.1 Equipamentos e Softwares
Para a obteno dos espectros e tratamento dos dados, foram utilizados,
os mesmos equipamentos e softwares citados na sesso 3.3.1.
3.2.2.2 Materiais, reagentes e amostras
Noventa e cinco amostras de queijo minas foram coletadas entre 2009 e
2010. As amostras foram mantidas em temperatura inferior a 4 C e analisadas
aps um perodo de 30 minutos, para que atingissem a temperatura ambiente.
As condies para o preparo das amostras e a aquisio dos espectros foram
similares s utilizadas para as amostras de muarela, descritas na sesso
3.1.3.2.
O mtodo de anlise de referncia foi realizado de acordo com a
literatura. O teor de umidade total nos queijos foi determinado utilizando-se o
mtodo gravimtrico, sem repeties.79 Trs gramas de amostra foram
pesadas e misturadas homogeneamente com a mesma quantidade de areia
fina pr-seca, a fim de se evitar a formao de crosta e para acelerar o
processo de secagem. As amostras foram, em seguida, secas a 105 C, at
atingirem peso constante.
3.2.3 Resultados e discusso
3.2.3.1 Desenvolvimento do modelo PLS
A Figura 23 mostra todos os espectros para as 95 amostras de queijo
minas artesanal. possvel ver que as bandas mais intensas e largas esto por
volta de 1450 e 1900 nm, o que corresponde ao primeiro sobretom de
estiramento de ligaes O-H e banda de combinao de estiramento e
deformao angular de O-H, respectivamente.83,84 As amostras foram divididas
em um conjunto de calibrao (63 amostras) e um conjunto de validao (32
amostras), utilizando o algoritmo de Kennard Stone.93

55

Figura 23 Espectros das amostras de queijo minas artesanal


Aps a separao dos grupos, os espectros foram pr-tratados para
remover artefatos fsicos. Como pode ser visto na Figura 23, desvios de linha
base no lineares esto presentes nos espectros. Assim, para corrigi-los, a
correo do espalhamento multiplicativo (MSC) foi usada, antes de centrar os
dados na mdia. Os espectros pr-processados podem ser vistos na Figura 24.
O melhor nmero de variveis latentes foi escolhido baseado no menor valor
de RMSECV, calculado com base na validao cruzada por blocos contnuos
(7 divises).

Figura 24 Espectros de queijo minas artesanal pr-processados com MSC


Ao observar os coeficientes de regresso para o modelo (Figura 24),
possvel observar, como esperado, que as regies mais importantes esto
relacionadas com vibraes de O-H, com os maiores valores positivos
prximos de 1450 e 1900 nm. Tambm interessante destacar os dois picos
negativos, em 1200 e 1730 nm. Estes picos correspondem ao segundo e
56

primeiro sobretons, respectivamente, de ligaes C-H,90 as quais podem ser


relacionadas aos teores de carboidratos, gorduras e protenas no queijo, que
esto inversamente relacionados com o teor de umidade.

Figura 25 Coeficientes de regresso para o modelo de determinao de


umidade em queijo minas artesanal

3.2.3.2 Deteco de amostras anmalas e otimizao do modelo


Aps o desenvolvimento do modelo, o mesmo foi otimizado tal como
descrito anteriormente, utilizando um nvel de confiana de 99%. Os resultados
esto resumidos na Tabela 3

Tabela 3 - Otimizao dos modelos PLS para determinao de umidade em


queijo minas artesanal pela deteco de amostras anmalas (modelo final est
destacado em negrito)
Modelos

Amostras de calibrao
Amostras de validao
Variveis latentes
RMSEC (%)
RMSEP (%)

63
32
3
3,1
5,2

58
32
6
2,0
5,0

55
27
7
1,5
2,0

57

Oito outliers foram detectados no grupo de calibrao, o que


corresponde a 12% do total das amostras. Deste grupo, dois foram removidos
por apresentarem alto Ieverage, um por alto resduo espectral e cinco por altos
resduos em Y. No conjunto de validao, cinco outliers foram detectados (16%
do

total

de

amostras),

todos

eles

por

altos

resduos

em

Y.

O modelo final otimizado foi construdo com 55 amostras no conjunto de


calibrao e 27 no conjunto de validao, usando 7 VLs e explicando 99,5% da
varincia em X e 95,5% da varincia em Y.
3.2.3.3 Validao analtica
A Tabela 4 resume os parmetros estimados para cada FOM, os quais
sero discutidos especificamente nas subsees seguintes.
Para confirmar esta aleatoriedade, alguns testes estatsticos foram
utilizados. Os resduos foram avaliados para distribuio normal (RJ),
homocedasticidade (BF) e ausncia de autocorrelao (DW), todos eles com
um nvel de confiana de 95%. O resultado de DW, apresentado na tabela 4,
est dentro dos limites de aceitao (1,5-2,5), o que assegura que no h
dependncia entre os resduos. Uma vez que o ajuste linear foi considerado um
pressuposto vlido, os parmetros da curva de valores referncia contra
valores preditos foram calculados. A linearidade tambm pode ser expressa
atravs da curva de calibrao pseudounivariada (Figura 27).
3.2.3.3.1 Linearidade
A linearidade foi estimada a partir dos resduos do ajuste dos valores de
referncia contra os valores preditos Como pode ser observado, no h uma
tendncia sistemtica visvel na distribuio residual (Figura 26).

58

Tabela 4 - Figuras de mrito estimadas para o modelo PLS de determinao de


umidade em queijo minas artesanal
Figuras de Mrito

Paramtros

Valores

Veracidade (n=27)

Erro relativo mdio

-0,7%

Durbin-Watson

1,4 % (1,6 %)
1,4 % (1,5 %)
1,5 % (1,6 %)
1,6 % (2,3 %)
1,4 % (2,3 %)
1,7 % (2,4 %)
2,0

Inclinao

0,95 0,06

Intercepto

1,86 2,40

Coeficiente de correlao (r) c

0,9773

DPR repetitividade a
(DPRr)
Preciso (n=18)
DPR preciso intermediria b
(DPRR)

Linearidade

Faixa de trabalho

28,5 a 55,5 %

Seletividade do modelo
Sensibilidade do modelo

0,120
0,058 d

Sensibilidade analtica ()

10,34 %-1

0,1%

Bias

0,8201,902 %

RPD

RPD calibrao
RPD validao

3,4
2,1

Resultados para trs amostras em trs diferentes concentraes analisadas no mesmo dia
por um mesmo analista, em sextuplicata. Valores limites de DPRr (entre parnteses) calculados
atravs da equao de Horwitz para cada nvel de concentrao estudado.
b Resultados para trs amostras em trs diferentes concentraes em dias diferentes por
analistas diferentes, em sextuplicata. Valores limites de DPRR (entre parnteses) calculados
atravs da equao de Horwitz para cada nvel de concentrao estudado.
c Parmetros do ajuste para a curva de valores de referncia vs. valores preditos para as
amostras de calibrao
d Valores expressos como a razo entre log (1/R) e %
a

59

Figura 26 - Grfico de resduos vs. valores preditos para o modelo de


determinao de umidade amostras de calibrao () e de validao ()

Figura 27 - Curva de valores de referncia vs. norma do NAS para o modelo de


determinao de umidade - amostras de calibrao () e de validao ()

3.2.3.3.2 Exatido e faixa de trabalho


Para este modelo, o RMSEP foi de 2,0% (Tabela 4), e os erros relativos
variaram entre -9,8 e 6,5%, com valor mdio de -0,7% (Figura 27). De acordo
com a AOAC41, os limites de aceitao de erros relativos so -3%/3%, de modo
que pode ser considerado que o mtodo fornece resultados verdadeiros. Os
valores de preciso sob condies de repetitividade e preciso intermediria,
expressos como desvio padro relativo (DPRr e DPRR, respectivamente), foram
60

estimadas por anlise de varincia dos valores preditos para 18 replicatas de


amostras em trs nveis de concentrao distintos.47 Os valores de DPRR
variaram entre 1,4 e 1,7%, e os valores de DPRr variaram entre 1,4 e 1,5%.
Todos os valores estimados para o modelo da umidade esto abaixo do limite
mximo, calculado atravs da equao de Horwitz.40 Os resultados de
veracidade e preciso permitem assegurar que o mtodo exato.
Considerando-se os estudos de linearidade e preciso, a faixa de
trabalho do mtodo foi estabelecido como 28,5 - 55,5% p/p.

Figura 28 - Erros relativos das amostras de validao para o modelo de


determinao de umidade

3.2.3.3.3 Seletividade e sensibilidade analtica


Como discutido antes, a SEL no tem interesse prtico em modelos
quimiomtricos. A sua estimativa apenas nos d uma ideia de quanta
informao espectral foi utilizada para a construo do modelo. Para este
modelo, 12% do sinal analtico foi utilizado na predio da umidade.
A sensibilidade analtica (), calculada usando a SEN e o rudo
instrumental (), uma FOM til, que permite a comparao entre a
sensibilidade de diferentes tcnicas, e o inverso da (-1) indica a concentrao
mnima que o modelo pode discriminar, considerando o rudo instrumental
como a nica fonte de erros. O -1 calculado para este modelo foi de 0,1%
(Tabela 4).
61

3.2.3.3.4 Vis e RPD


O vis foi calculado com base apenas em amostras de validao,
utilizando 27 graus de liberdade, e apresentada na tabela 4. O resultado de
0,820 1,920 indica ausncia de erros sistemticos, no nvel de confiana de
95%. Levando em conta os limites estabelecidos para RPD na literatura,56,57 o
presente modelo pode ser considerado adequado para quantificao
(Tabela 4).
3.2.3.3.5. Erro amostral especfico de predio (EAEP)
Neste clculo, a incerteza do mtodo de referncia, 0,1%, foi obtida de
dados histricos. De acordo com a Equao 29, 9 pseudo graus de liberdade
foram usados no clculo dos intervalos de confiana (t = 2,03). O EAEP
estimado variou entre 2,5 e 2,7%. A Figura 29 mostra os valores preditos com o
intervalo de EAPP e os valores de referncia para cada amostra de validao.
De um total de 27 amostras, sete estavam fora dos limites do intervalo. Este
elevado nmero de amostras fora dos limites pode ser devido capacidade do
mtodo de referncia em determinar apenas gua livre na amostra, e o NIRS
detecta toda a gua, at mesmo a quimicamente ligada. Talvez, devido a este
fato, seis das sete amostras citadas acima tm valores de referncia menores
do que os valores preditos.

Figura 29 Erro amostral especfico de predio para as amostras de


validao valores de referncia () e valores preditos (*)
62

3.2.3.3.6 Monitoramento ps-modelo


Depois que o mtodo foi validado e adotado como anlise de rotina para
determinao de umidade em queijo minas artesanal, o mesmo foi monitorado
a fim de avaliar a sua estabilidade. Durante um ano, pelo menos uma amostra
por semana foi analisada em ambos os mtodos, de referncia e NIRS, e a
diferena foi avaliada atravs dos erros relativos. Os resultados so mostrados
na Figura 30, atravs de uma carta de controle. O limite de alerta ( 15%) e o
limite de ao ( 33%) foram estabelecidos de acordo com as diretrizes
brasileiras [39]. Para ser considerado estvel, o modelo pode apresentar dois
teros das amostras analisadas com erros relativos dentro do limite de ateno
( 15%), enquanto apenas um tero pode estar entre o limite de ateno e o
limite de ao (33%).

40.0
30.0

Erros relativos (%)

20.0
10.0
0.0
-10.0
-20.0
-30.0
-40.0

Amostras
Figura 30 Carta de controle da estabilidade do modelo para determinao de
umidade em queijo minas artesanal

63

Apenas trs amostras ficaram acima do limite de ateno (10% do total


de amostras analisadas), o que indica que o modelo permaneceu estvel
durante um ano aps a sua validao.
3.3 Concluso
A implementao de modelos multivariados para o controle de qualidade
de queijos minas e muarela se mostrou uma alternativa vivel aos mtodos
tradicionais. Ambas as aplicaes foram desenvolvidas em condies reais de
anlise, sem alterar os protocolos e a rotina convencional do laboratrio.
Estes mtodos apresentaram vantagens sobre os mtodos tradiconais
usados na rotina, tais como baixo custo, processo simplificado, sem
necessidade de reagentes e sem gerar resduos qumicos. A principal
vantagem dos mtodos desenvolvidos foi a rapidez das anlises, uma vez que
apenas cerca de trs minutos foram gastos para a determinao de ambos os
paramtros. Assim, os mtodos NIRS foram cerca de 30 vezes mais rpidos do
que o mtodo de Gerber para a determinao de gordura, e 80 vezes mais
rpidos do que o mtodo gravimtrico para a determinao de umidade.
Todos os mtodos foram validados em conformidade com as diretrizes
brasileiras e internacionais, sendo considerados lineares, precisos, sensveis e
robustos. Alm disso, aps os mtodos serem adotados, seus desempenhos
foram monitorados durante cerca de um ano empregando de cartas de
controle, demonstrando que eles continuaram a fornecer previses aceitveis.
Alm da reduo de custos com a utilizao da areia purificada prseca, que um produto com preo elevado (R$ 1000 por quilo, como so
consumidos 3 g por medida, estima-se que s com a economia deste reagente
deixese de gastar cerca de R$ 3,10 em cada anlise), e da eliminao da
necessidade de se trabalhar com cido sulfrico concentrado, um reagente
potencialmente perigoso, a substituio dos mtodos tradicionais de anlise
permitiu uma reduo do tempo total de anlise e eliminou a gerao de
resduos.
Finalmente, mais do que estes mtodos especficos, esta aplicao teve
como objetivo apresentar uma completa e robusta metodologia multivariada.
Esta metodologia empregou o conceito de sinal do analito lquido e harmonizou
64

a validao tradicional univariada com os requisitos dos mtodos multivariados


de calibrao, o que essencial para a implementao de novos mtodos
NIRS na rotina de anlise para controle de qualidade dos alimentos.

65

4. Desenvolvimento de um mtodo de triagem para a deteco


simultnea de cinco adulterantes em leite cru utilizando
infravermelho mdio e PLS-DA
4.1 Introduo
O leite pode ser definido como o fluido secretado pelas fmeas de todas
as espcies de mamferos, com funo primria de suprir a demanda
nutricional do neonato, principalmente energia, aminocidos essenciais e
grupos amino para a biossntese de aminocidos no essenciais, cidos graxos
essenciais, vitaminas, elementos inorgnicos e gua. Alm disso, o leite
tambm se tornou o componente majoritrio em dietas humanas em diversas
partes do planeta.102
Em 2011, foram produzidos mais de 735 milhes de toneladas de leite
no mundo, incluindo leites de vaca, bfala, cabra, ovelha e camela. Os EUA foi
o pas com a maior produo mundial (87,5 milhes de toneladas), enquanto o
Brasil ocupa a quinta posio, com 31,7 milhes de toneladas. Entretanto,
assim como a demanda e a produo de leite tm crescido, um nmero
crescente de adulteraes sofisticadas tem sido reportado em diferentes
pases.103
A adio de adulterantes em leite com a inteno de aumentar os lucros
no um assunto novo, mas recentemente tem atrado mais ateno por todo
o mundo. No Brasil, dois escndalos recentes de adulterao de leite foram
descobertos em operaes da Polcia Federal. Em 2007, a Operao Ouro
Branco denunciou o uso de citrato de sdio, hidrxido de sdio, cloreto de
sdio, sacarose, fosfatos, carbonatos, bicarbonatos e perxido de hidrognio
para a correo de defeitos no leite, como acidez elevada e crescimento
microbiano, alm de mascarar a adio de gua.104 Em 2013, a Operao
Leite Compen$ado revelou a utilizao de fertilizantes contendo ureia e formol
para mascarar a adio de gua em leite.105 Souza et al.106 analisaram 100
amostras de leite UHT comercializadas no Brasil e detectaram uma elevada
taxa de no conformidades, com 55 % das amostras apresentando urina, 44 %
com presena de formol, 30 % com perxido de hidrognio e 12 % com
presena de cloretos. Atualmente, a deteco de adulterantes em leite
66

realizada
especficas

atravs
e

de

mtodos

variaes

no

fsico-qumicos
ponto

de

baseados

congelamento

em
ou

reaes
gravidade

especfica.107,108 Estes mtodos so demorados, trabalhosos e podem no


fornecer resultados precisos.
Uma vez que a adio de qualquer tipo de substncia estranha ao leite
cru proibida no Brasil, em qualquer nvel, somente mtodos qualitativos so
descritos nos compndios oficiais para a avaliao de adulterao em leite. Por
isso, mais importante o desenvolvimento de mtodos analticos que detectem
com confiabilidade os possveis adulterantes.107,108
Nos ltimos anos, a utilizao de metodologias quimiomtricas de
classificao supervisionada e/ou calibrao multivariada combinadas com
espectroscopia no infravermelho (mdio ou prximo) tem permitido o
desenvolvimento de mtodos rpidos e no destrutivos para detectar e/ou
quantificar adulterantes em leite, tais como ureia, urina sinttica, leite sinttico,
soro de leite, perxido de hidrognio, gua, melamina e nitrato de amnio.109
113

Um mtodo alternativo, baseado em anlise de imagens tambm foi

aplicado para detectar e quantificar a adio de gua e hidrxido de sdio em


leite.12
Considerando as adulteraes reportadas recentemente, a presena
simultnea de diversos adulterantes comum, mas a maioria dos mtodos
quimiomtricos encontrados na literatura determinam apenas um ou no mximo
dois adulterantes simultaneamente.109,112,113 Para esta aplicao, foram
escolhidos cinco dos adulterantes mais comuns recentemente identificados
pela Policia Federal em amostras de leite brasileiro: gua, amido, citrato de
sdio, formol e sacarose. A gua o adulterante mais comum, utilizado para
aumentar o volume total do leite por diluio, resultando consequentemente em
uma diminuio da concentrao dos componentes do leite, como protenas,
gordura e lactose. O amido utilizado como espessante, aumentando tambm
o teor de slidos totais do leite adulterado. O citrato de sdio utilizado como
estabilizante e conservante, evitando a precipitao de nutrientes. O formol
utilizado para evitar o desenvolvimento e a contaminao microbiana do leite
adulterado, uma vez que ms condies de armazenamento e produo, alm
de excessiva manipulao do produto durante uma possvel adulterao,
67

podem elevar o risco de contaminao microbiana. A sacarose utilizada para


restaurar os valores normais de amostras de leite adulteradas nos testes de
controle fsico-qumicos, alm de melhorar as suas propriedades sensoriais.
4.2 Objetivos
Desenvolver um mtodo de triagem rpido e no destrutivo para a
deteco simultnea de at cinco adulterantes (gua, amido citrato de sdio,
formaldedo e sacarose) em leite bovino cru, utilizando espectroscopia no
infravermelho mdio com acessrio de reflexo total atenuada (ATR) e PLSDA.
Estimar algumas FOM especficas utilizadas em validao analtica
qualitativa, tais como sensibilidade, especificidade, taxa de confiabilidade,
acordncia e concordncia. Considerando que so poucos os trabalhos na
literatura que implementaram uma validao analtica de mtodos de
classificao multivariados, este captulo se prope tambm a harmonizar os
aspectos univariados presentes na maioria das normatizaes com a realidade
multivariada.
4.3 Materiais e mtodos
4.3.1 Equipamentos e softwares
Os espectros de infravermelho foram adquiridos utilizando um
espectrofotmetro Shimadzu IR Affinity1, usando um acessrio de ATR
equipado com uma cela de ZnSe. Os softwares utilizados foram os mesmos
citados na sesso 3.3.1.
4.3.2 Amostras e reagentes
As amostras brancas de leite bovino cru foram fornecidas pela Fazenda
Modelo da Escola de Veterinria da Universidade Federal de Minas Gerais
(UFMG), localizada em Pedro Leopoldo/MG. Citrato de sdio, formol, amido,
sacarose (todos de grau analtico) e gua destilada foram utilizados como
adulterantes.

68

4.3.3 Procedimento
O leite foi armazenado em garrafas de vidro mbar a -18 C, aquecidas
em banho de gua at temperatura ambiente para o preparo das amostras.
Neste preparo, todos os adulterantes foram pesados em balana analtica
(0,0001 g). Para as amostras contendo apenas um adulterante, gua,
sacarose, formol, amido ou citrato foram adicionados em concentraes
variando de 0,5 a 10,0% p/v, com incrementos de 0,5%, resultando em 20
amostras adulteradas para cada analito. Para o preparo das amostras com dois
ou mais adulterantes, um planejamento de misturas com cinco componentes foi
empregado.

Neste

planejamento,

as

concentraes

individuais

dos

componentes variaram entre 0,5 e 10,0 %, resultando em misturas de


concentraes finais, somando todos os adulterantes presentes, iguais a 10,0
%. O planejamento proposto resultou em 71 amostras (30 amostras binrias,
30 amostras ternrias, 5 amostras quaternrias e 6 amostras pentenrias), cuja
composio est discriminada na Tabela 5.
Todas as amostras foram analisadas diretamente, sem nenhum prtratamento, colocando-se 30 L no acessrio de ATR. Os espectros foram
obtidos como mdias de 20 varreduras, de 600 a 4000 cm-1. Antes de cada
medida, uma correo de linha de base foi realizada para evitar a interferncia
atmosfrica e reduzir o rudo instrumental. Aps a aquisio de cada espectro,
o acessrio foi limpo com acetona P.A.
Tabela 5 Planejamento de mistura com cinco componentes para a
adulterao de leite com gua, amido, citrato de sdio, formol e sacarose

Amostras
1
2
3
4
5

gua
0,0
2,5
2,5
7,5
5,0

6
7
8
9
10
11

2,5
0,0
0,0
6,0
0,0
5,0

Adulterao (% p/v)
Amido
Citrato
Formol
5,0
2,5
0,0
0,0
0,0
5,0
0,0
5,0
0,0
2,5
0,0
0,0
0,0
0,0
2,5
0,0
0,0
0,0
1,0
2,5
0,0

2,5
7,5
2,5
1,0
5,0
0,0

2,5
2,5
0,0
1,0
2,5
5,0

Sacarose
2,5
2,5
2,5
0,0
2,5
2,5
0,0
7,5
1,0
0,0
0,0
69

12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57

1,0
0,0
0,0
0,0
0,0
2,5
0,0
2,5
2,5
0,0
0,0
0,0
2,5
2,5
2,5
5,0
5,0
0,0
0,0
0,0
1,0
2,5
2,5
0,0
7,5
0,0
5,0
0,0
0,0
0,0
1,0
2,5
0,0
2,5
0,0
5,0
0,0
0,0
0,0
7,5
0,0
2,5
5,0
2,5
5,0
0,0

1,0
5,0
2,5
2,5
0,0
5,0
2,5
0,0
2,5
0,0
2,5
5,0
0,0
2,5
5,0
0,0
2,5
5,0
2,5
0,0
1,0
7,5
0,0
7,5
0,0
0,0
2,5
2,0
0,0
0,0
1,0
2,5
0,0
5,0
0,0
0,0
0,0
5,0
2,5
0,0
7,5
0,0
0,0
2,5
2,5
7,5

1,0
5,0
2,5
0,0
0,0
0,0
0,0
0,0
0,0
5,0
7,5
0,0
7,5
2,5
0,0
0,0
2,5
0,0
2,5
0,0
6,0
0,0
0,0
0,0
0,0
2,5
0,0
2,0
2,5
0,0
1,0
0,0
2,5
2,5
5,0
5,0
5,0
2,5
2,5
0,0
0,0
5,0
2,5
2,5
0,0
2,5

6,0
0,0
0,0
7,5
5,0
0,0
0,0
0,0
0,0
5,0
0,0
5,0
0,0
0,0
2,5
0,0
0,0
0,0
5,0
2,5
1,0
0,0
2,5
0,0
0,0
7,5
2,5
2,0
5,0
7,5
1,0
5,0
2,5
0,0
0,0
0,0
2,5
2,5
2,5
2,5
2,5
2,5
0,0
2,5
0,0
0,0

1,0
0,0
5,0
0,0
5,0
2,5
7,5
7,5
5,0
0,0
0,0
0,0
0,0
2,5
0,0
5,0
0,0
5,0
0,0
7,5
1,0
0,0
5,0
2,5
2,5
0,0
0,0
2,0
2,5
2,5
6,0
0,0
5,0
0,0
5,0
0,0
2,5
0,0
2,5
0,0
0,0
0,0
2,5
0,0
2,5
0,0
70

58
59
60
61
62
63
64
65
66
67
68
69
70
71

0,0
5,0
0,0
7,5
2,5
1,0
0,0
0,0
5,0
2,5
2,5
2,5
2,5
0,0

2,5
5,0
0,0
0,0
2,5
6,0
2,5
2,5
0,0
2,5
0,0
0,0
0,0
5,0

0,0
0,0
7,5
2,5
0,0
1,0
0,0
5,0
2,5
5,0
2,5
0,0
2,5
0,0

5,0
0,0
0,0
0,0
2,5
1,0
2,5
0,0
2,5
0,0
5,0
7,5
0,0
2,5

2,5
0,0
2,5
0,0
2,5
1,0
5,0
2,5
0,0
0,0
0,0
0,0
5,0
2,5

4.4 Resultados e discusso


4.4.1 Espectros de infravermelho
Os espectros de todas as amostras esto mostrados na Figura 31. Pela
observao destes espectros, possvel atribuir a banda mais larga e intensa,
entre aproximadamente 3600 e 3000 cm-1, a vibraes de estiramento de
ligaes O-H. Os dois picos pequenos prximos a 2800 cm-1 esto
relacionados com o estiramento dos grupos CH2 de cidos graxos do leite.
Outro pico, prximo de 1700 cm-1, caractersticos de amida I e II, e pode ser
relacionado ao contedo proteico do leite.110,111 Inicialmente, a regio entre
2430 e 2230 cm-1 foi removida devido interferncia do CO2 atmosfrico.
Mesmo

com

correo

atmosfrica

instrumental,

algumas

amostras

apresentaram um pico caracterstico nesta regio espectral, a qual foi ento


removida de todas as amostras.

71

Figura 31 Espectros de infravermelhos de todas as amostras de leite cru


bovino (amostras brancas, adulteradas com um nico adulterantes e
adulteradas com as misturas de adulterantes)
A Figura 32(a) mostra um espectro de uma amostra de leite branca, sem a
adio de nenhum adulterante. Como mencionado anteriormente, dois picos
podem ser notados, relacionados com os teores de gua e protena do leite. A
Figura 32(b) mostra o espectro de uma amostra de leite adulterada com 10,0 %
p/v de gua, e nenhuma mudana visual significativa pde ser notada no
espectro. A Figura 32(c) mostra o espectro de uma amostra adulterada com
10,0 % p/v de amido. Em comparao com a Figura 32(a), possvel notar
pequenas variaes na regio de impresso digital (fingerprint), entre 1200 e
900 cm-1. Essas absores podem ser associadas com vibraes da ligao
glicosdica -1,4, deformaes angulares de C-H e estiramentos de C-O e
C-C.114 A Figura 32(d) mostra o espectro de uma amostra adulterada com
10,0 % p/v de citrato de sdio. As duas bandas observadas prximas a 1400 e
1600 cm-1 podem ser relacionadas com os estiramentos simtrico e assimtrico
de ligaes C-O de grupos carboxilato. A Figura 32(e) mostra o espectro de
uma amostra adulterada com 10,0 % p/v de formol. Um pico caracterstico
prximo a 1000 cm-1 pode ser destacado. Este pico est relacionado com as
vibraes de estiramento e balano (wagging) de grupos CH2 do formol.5 A
Figura 32 (f) mostra um espectro de uma amostra adulterada com 10,0 % p/v
de sacarose. A presena de sacarose pode ser associada com o aparecimento
de diversos picos na regio de fingerprint, atribudos aos estiramentos de C-H e
C-O, estiramento e deformao angular de C=O de cetonas e estiramento e
deformao de C-O.115
72

(a)

(b)

(c)

(d)

(e)
(f)

(f)

Figura 32 Espectro de infravermelho mdio de (a) amostra branca; (b)


adulterao com gua (10,0 % p/v); (c) adulterao com amido (10,0 % p/v); (d)
adulterao com citrato de sdio (10,0 % p/v); (e) adulterao com formol
73

(10,0 % p/v); (f) adulterao com sacarose (10,0 % p/v). A regio espectral
utilizada para a construo dos modelos est delimitada pelas linhas tracejadas
A regio entre 2000 e 900 cm-1 apresentou as maiores variaes
espectrais e foi considerada de melhor poder discriminante, contendo bandas
caractersticas para quase todos os adulterantes. Ento modelos locais foram
testados e apresentaram erros de classificao menores quando comparados
aos modelos que usaram os espectros inteiros. Por isso, os modelos finais
foram desenvolvidos e validados utilizando apenas esta regio espectral.
5.4.2 Modelos PLS-DA
Cinco modelos PLS1-DA foram construdos, um para cada adulterante.
Cada modelo foi construdo utilizando 155 amostras (15 amostras brancas, 100
amostras contendo apenas um adulterante, sendo 20 para cada um deles, e 40
amostras contendo o adulterante escolhido para aquele modelo em misturas
com outros adulterantes). As amostras foram divididas em conjuntos de
treinamento e de teste; 25% dessas amostras em cada modelo (38) foram
selecionadas para o conjunto teste, sendo escolhidas em intervalos regulares
de acordo com a composio das misturas. Para selecionar o melhor nmero
de VLs, foi feita uma validao cruzada usando o critrio das venezianas
(venetian blinds), com 6 divises. Como o conjunto de calibrao formado por
um

grande

nmero

de

amostras

foi

organizado

agrupando-as

sequencialmente em funo da classe, esse critrio o mais apropriado para


garantir uma seleo representativa e homognea das amostras de todas as
classes. Foi selecionado o nmero de VLs que apresentou o menor erro de
classificao de validao cruzada (ECVC). A Tabela 6 mostras os valores de
ECVC (a razo entre amostras erroneamente classificadas e nmero total de
amostras) para cada modelo, assim como a varincia explicada, que foi de
99,5% em X para todos os modelos, e variou entre 69,3 e 77,0% em Y. Os
grficos de classificao, com os valores preditos para todas as amostras
podem ser vistos na Figura 33. Nestes grficos, os dados esto ordenados de
maneira a sempre comear pelas amostras que no contm o adulterante de
cada modelo. O LC para cada classe/modelo foi estimado atravs da teoria de
Bayes, para minimizar os erros de classificao.74

74

Tabela 6 Nmero de VLs, varincias explicadas e erros de classificao de


validao cruzada (ECVC) para os modelos PLS-DA desenvolvidos
Varincia
Varincia
Variveis
Adulterantes
Explicada - Explicada- Y
ECVC
Latentes
X (%)
(%)
gua
9
99,5
76,2
0,07
Amido
8
99,5
72,5
0,07
Citrato de
9
99,5
77,0
0,02
Sdio
Formol
9
99,5
69,3
0,04
Sacarose
9
99,5
73,1
0,07

Em todos os modelos, a primeira derivada com alisamento SavitzkyGolay foi utilizada, e os dados foram ento centrados na mdia. Outros prprocessamentos foram testados, como OSC, MSC e SNV, porm todos
resultaram em ECVC mais elevados.
A interpretao espectral de modelos PLS ou PLS-DA frequentemente
feita a partir da observao dos seus coeficientes de regresso. Entretanto,
como ressaltado por Brown & Green (2009),116 esta interpretao no deve se
basear somente nos coeficientes de regresso dos modelos, uma vez que eles
so

dependentes

da

composio

das

amostras

no

conjunto

de

calibrao/treinamento, da covarincia implcita entre os componentes dessas


amostras e da relao sinal/rudo dos dados.
Uma ferramenta mais adequada para a interpretao espectral de
modelos PLS so os grficos da Importncia das Variveis na Projeo dos
escores (Variable Importance in Projection, VIP scores), que estimam a
importncia de cada varivel na projeo utilizada pelo modelo PLS atravs
dos coeficientes em cada componente, juntamente com a significncia de cada
componente na regresso.117 A Figura 34 mostra os VIP escores para cada
modelo. possvel verificar uma alta concordncia entre as atribuies
espectrais apresentadas na seo 4.4.1 e as variveis de maior importncia
observadas nos VIP escores.

75

(a)

(b)

(c)

(d)

(e)

Figura 33 Grficos de previso para adulteraes com (a) gua; (b) amido;
(c) citrato de sdio; (d) formol; (e) sacarose.  - Amostras Brancas;  adulterao com gua;  - Adulterao com amido; - Adulterao com
citrato;  - Adulterao com formol;  - Adulterao com sacarose. Marcadores
cheios Amostras de treinamento; Marcadores vazios Amostras teste

76

(a)

(b)

(c)

(d)

(e)

Figura 34 VIP escores para os modelos de deteco de adulterao de leite


cru com (a) gua; (b) amido; (c) citrato; (d) formol; (e) sacarose

77

Como pode ser visto na Figura 34, todos os VIPs escores apresentaram
picos distinguveis em regies especificamente caractersticas de cada
adulterante, como os dois picos entre 1080 e 1040 cm-1 e 1015 e 980 cm-1,
caractersticos do citrato, uma banda larga entre 1100 e 1000 cm-1,
caracterstica do formol, e os dois picos intensos em 1080 e 980 cm-1, relativos
sacarose.
4.4.3 Validao qualitativa multivariada
Conforme mencionado anteriormente, a validao de mtodos analticos
quimiomtricos um tema em desenvolvimento, no muito bem estabelecido, e
a estimativa de FOM para mtodo multivariados qualitativos tem recebido ainda
menos ateno. Como possvel verificar na Tabela 7, sete diferentes FOM
foram estimadas para os conjuntos de treinamento e teste.
O modelo para detectar adulteraes com gua apresentou os mais
altos valores de TFP (4,0 %) e a segunda maior TFN (3,2 %) no conjunto de
treinamento, alm da maior TFP no conjunto de teste (11,5%). O nmero
relativamente alto de classificaes erradas neste modelo pode estar
relacionado com a similaridade entre as amostras adulteradas com gua e as
amostras de branco (leite cru), e tambm com a deteco de amostras com
nveis mais baixos de outros adulterantes (Figura 32).
O modelo de adulterao por amido apresentou baixas TFP e TFN no
conjunto teste (3,0 e 4,8 %, respectivamente), com a classificao errnea de
amostras contendo citrato e gua sendo a ocorrncia mais frequente. Este
modelo tambm apresentou TFP e TFN relativamente elevadas no conjunto de
teste (8,0 e 16,7 %, respectivamente). Os modelos para formol e sacarose
apresentaram TFP (0,0 e 1,0 %, respectivamente) e TFN (3,2 e 4,8 %,
respectivamente) similares no conjunto teste, e resultados idnticos no
conjunto teste para a TFP (4,2 %) e a TFN (0,0 %). O modelo para deteco de
citrato apresentou os melhores resultados, no produzindo nenhuma
classificao equivocada nos conjuntos de treinamento e teste.

78

Tabela 7 FOM estimadas para os modelos de deteco de adulterantes em


leite cru bovino
Conjunto Treinamento
TFP
TFN
gua
4,0% 3,2%
Amido
3,0% 4,8%
Citrato de sdio
0,0% 0,0%
Formol
0,0% 3,2%
Sacarose
1,0% 4,8%
Conjunto Teste
TFP
TFN
gua
11,5% 0,0%
Amido
8,0% 16,7%
Citrato de Sdio
0,0% 0,0%
Formol
4,2% 0,0%
Sacarose
4,2% 0,0%

TSL
96,8%
95,2%
100,0%
96,8%
96,8%

TES
96,0%
97,0%
100,0%
100%
99,0%

TCF
92,8%
92,2%
100,0%
96,8%
95,7%

TSL
93,8%
83,3%
100,0%
93,8%
93,8%

TES
88,5%
92,0%
100,0%
95,8%
95,8%

TCF
82,8%
75,3%
100,0%
89,6%
89,6%

TFP Taxa de falso positivo; TFN Taxa de falso negativo; TSL Taxa de
seletividade; TES Taxa de especificidade; TCF Taxa de confiabilidade

De acordo com a Diretiva 657/200267 da Comunidade Europeia, a TFN


deve ser inferior a 5%. Resultados falso negativos devem ser mais
rigorosamente controlados para garantir a segurana do consumidor, evitando
que amostras adulteradas sejam classificadas como no adulteradas.
Resultados falso positivos so menos preocupantes, pois todas as amostras
positivas em um mtodo de triagem devem ser confirmadas por um mtodo de
referncia. Com exceo do modelo para a deteco de amido, todos os
modelos propostos esto de acordo com o guia de validao acima citado.
Uma FOM mais representativa da veracidade, TCF, tambm consta na
Tabela 7. Os valores de TCF para o conjunto de treinamento variaram entre
92,2 e 100 %, e para o conjunto teste variaram de 75,3 a 100 %, com os dois
piores resultados sendo apresentados pelo modelo de deteco de amido.
A ACO foi estimada utilizando trs replicatas de trs diferentes nveis
(0,5, 5,0 e 10 % p/v), analisadas em condies de repetitividade. A CON foi
estimada utilizando o mesmo protocolo para a estimativa da CON, repetido em
trs dias diferentes por trs analistas diferentes. O modelo para a adulterao
79

de gua apresentou os menores valores de ACO e CON (78 e 92 %,


respectivamente), com todos os outros modelos apresentando ACO e CON de
100 %. Estes resultados sugerem que a deteco da adio de gua no leite
pelo mtodo proposto no foi to precisa, possivelmente devido ao elevado
teor de gua presente no leite naturalmente em amostras no adulteradas e
variao natural de seu teor.
4.5 Concluso
Um mtodo de triagem multivariado simples para a deteco simultnea
de at cinco adulterantes em leite bovino cru foi desenvolvido e validado. O
mtodo foi capaz de detectar a presena especfica de gua, amido, citrato de
sdio, formol e sacarose em amostras de leite cru em concentraes de at
0,5 % p/v. Todos os modelos, exceto o modelo para a deteco de amido,
forneceram

resultados

consonantes

com

os

guias

de

validao

internacionais67,70. O mtodo proposto consome uma quantidade muito


pequena de amostra (30 L), muito rpido (no mximo um minuto para
aquisio de cada espectro), no destrutivo, no demanda nenhum prtratamento da amostra nem utiliza reagentes, alm de analisar todos os
adulterantes simultaneamente a partir dos mesmos espectros. Esta aplicao
significou ainda um interessante exemplo de validao analtica de um mtodo
qualitativo multivariado, baseado em PLS-DA. Este assunto, raramente
abordado na literatura, demanda uma maior ateno devido necessidade de
harmonizao de conceitos, com vistas a uma futura incorporao do
pensamento multivariado nas regulamentaes oficiais sobre mtodos
qualitativos.

80

5. Determinao do corante amarelo crepsculo em bebidas


no alcolicas utilizando anlise multivariada de imagens
5.1 Introduo
Corantes industriais esto constantemente presente no estilo de vida
moderno, sendo amplamente utilizados em cosmticos, roupas, frmacos e,
particularmente, em alimentos. Eles possuem uma srie de vantagens se
comparados aos corantes naturais, como maior estabilidade ao oxignio, luz e
mudanas de pH, boa solubilidade em gua e baixo custo de produo.118,119
Os corantes azo constituem o maior grupo de corantes sintticos,
correspondendo a aproximadamente 70% de todos os corante artificiais
conhecidos, e sua estrutura molecular se caracteriza pela presena de um
grupo azo (-N=N-) localizado entre anis aromticos.119
Apesar de fornecerem diversos benefcios tecnolgicos, e melhorarem
as caractersticas sensoriais de um alimento, um grande nmero de estudos
tem demonstrado efeitos colaterais provocados pelo consumo dos corantes
azo,

como

respostas

alrgicas,

asma,

urticria

imunossupresso,

especialmente se consumidos em excesso.119


O Amarelo Crepsculo (AC), tambm conhecido como Sunset Yellow,
Amarelo Entardecer, E110 ou Amarelo Comestvel 3 (Figura 35), um dos
corantes azo mais utilizados. Ele possui uma colorao alaranjada e utilizado
principalmente em produtos com sabor de frutas, como refrigerantes, sucos,
doces e sorvetes. O AC tambm possui uma ampla utilizao nas indstrias
farmacuticas e de cosmticos. Entretanto, o seu consumo pode causar alguns
efeitos colaterais em humanos, e a sua ingesto tem sido associada a riscos de
falncia renal e danos hepatocelulares.119

81

Figura 35 Estrutura qumica do Amarelo Crepsculo


O grande aumento na utilizao e consumo de corantes artificiais,
principalmente em produtos destinados a crianas, criam uma necessidade de
mtodos que possam monitorar e quantificar estes corantes. No Brasil, a
ANVISA (Agencia Nacional de Vigilncia Sanitria) o rgo governamental
responsvel pela regulao de alimentos, e estabelece os limites para
utilizao de corantes artificiais em diferentes produtos. De acordo com a
resoluo R05/07, o limite para a concentrao de amarelo crepsculo em
bebidas no alcolicas de 100 mg.L-1.120 Um dos mtodos mais tradicionais
para a determinao de corantes azo baseado em espectrofotometria
UV/VIS, o qual demanda extraes sequenciais com metanol contendo 5% de
hidrxido de amnio.107
Outros mtodos, envolvendo diferentes tcnicas analticas, como
cromatografia, potenciometria, voltametria, imunoensaios e extrao no ponto
nuvem

com

determinao

espectrofotomtrica

foram

descritos

na

literatura118,121124. Estratgias quimiomtricas tambm tm sido aplicadas na


determinao

de

corantes

em

alimentos,

principalmente

usando

espectrofotometria UV/Vis, avaliando misturas binrias ou ternrias de


corantes.125127
5.2 Objetivos
Desenvolver e validar um mtodo analtico multivariado simples e rpido
utilizando imagens digitais obtidas em um escner de mesa comercial para a
determinao do corante amarelo crepsculo em bebidas no alcolicas
(refrigerantes e isotnicos).
82

5.3 Materiais e mtodos


5.3.1 Equipamentos e softwares
As imagens foram obtidas utilizando um escner de mesa comercial
CanoScan LiDE 110 (Tokio, Japo). Os softwares utilizados foram os mesmos
citados na sesso 3.3.1, juntamente com o Image Processing Toolbox, verso
8.0 (The MathWorks, Natick, MA, EUA).
5.3.2 Amostras
Oitenta e trs amostras de bebidas no alcolicas de vinte e cinco
marcas diferentes (refrigerantes de laranja e bebidas isotnicas de laranja e
tangerina) contendo o AC como nico corante artificial foram adquiridas
predominantemente no comrcio local de Belo Horizonte/MG, mas tambm em
diversos outros locais do Brasil, e armazenadas a 4 C at a anlise.
5.3.3 Procedimento
As amostras foram deixadas por 30 minutos em descanso sobre a
bancada do laboratrio, para atingirem o equilbrio trmico antes do incio dos
procedimentos. 30 mL de cada amostra foram coletados em um bquer de 50
mL e levados ao banho de ultrassom, para degaseificao, por 5 minutos. Aps
esta etapa, 1 mL da amostra foi destinado analise cromatogrfica, para a
obteno dos valores de referncia, e 5 mL foram utilizados para a aquisio
das imagens.
A aquisio das imagens foi realizada utilizando placas de Petri
pequenas (5,0 cm de dimetro x 1,5 cm de altura), nas quais as amostras a
serem lida eram vertidas, e as placas posicionadas no canto inferior esquerdo
do escner. Um anteparo foi utilizado para evitar a entrada de luz externa
(Figuras 36 e 37). Todas as imagens foram digitalizadas no sistema RGB 24bit, com 16,8 milhes de cores e resoluo de 300 ppp (pixels por polegadas),
no formato .tif. A converso das imagens em histogramas RGB foi realizada
em ambiente MatLab. Primeiramente, uma rea de 100x100 pixels de cada
imagem foi selecionada de uma rea central da placa de Petri, em uma parte
homognea da imagem. A rea selecionada foi tratada com um filtro digital
(unsharp) para reduo de rudo, e ento decomposta em histogramas RGB.
83

Aps todos os tratamentos, um histograma contendo a frequncia de 768


canais (256 para cada cor RGB) foi obtido para cada amostra (Figura 38). Cada
amostra foi escaneada trs vezes, e a mdia dos trs histogramas de cada
amostra foi utilizada para a construo do modelo PLS.

Figura 36 Escner CanoScan LiDE 110 com o anteparo

Figura 37 Imagem adquirida de uma amostra de refrigerante

84

Figura 38 Representao esquemtica da decomposio matemtica das


imagens
5.3.4 Anlises Cromatogrficas
A metodologia utilizada para a obteno dos valores de referncia das
amostras foi adaptada a partir de um mtodo cromatogrfico desenvolvido por
um fabricante de equipamentos.128 As anlises foram realizadas em
equipamento de cromatografia lquida de alta eficincia Finningan Surveyor
HPLC system (Thermo Fisher Scientific, San Jose, EUA) com deteco por
arranjo de diodos (CLAE-DAD), utilizando uma coluna C-18 Shimadzu ShimPack XR-ODS (3 mm d.i. x 150 mm comp.). Foi utilizada eluio por gradiente,
com a fase mvel sendo composta por uma soluo aquosa de acetato de
amnio 20 mM e uma fase orgnica de acetonitrila/metanol (80:20, v/v). Um
fluxo de 1,2 mL.min-1 foi utilizado e a deteco foi realizada em 484 nm. O
tempo total da corrida foi de 15 minutos, com o tempo de reteno do AC de
7,5 min.
5.4 Resultados e discusso
5.4.1 Modelo PLS
Todas as amostras analisadas continham apenas AC como o nico
corante artificial adicionado. Previamente construo do modelo multivariado
utilizando os valores de referncia obtidos por CLAE para as amostras reais,
uma estratgia alternativa foi testada. Um modelo multivariado construdo com
dados de imagens de solues padro de AC foi utilizado na predio das
amostras reais, mas no apresentou bons resultados. Todos as bebidas
analisadas continham aditivos e outros ingredientes, o que tornou as amostras
um pouco turvas, impedindo que as mesmas fossem preditas com erros
satisfatrios utilizando um modelo obtido a partir de solues padro. Alm
85

disso, diversas amostras continham uma pequena quantidade de suco natural,


e

consequentemente,

corantes

naturais,

interferentes

que

contribuem

diretamente para a cor, justificando mais uma vez a utilizao de um modelo


multivariado construdo a partir de amostras reais. Dessa forma, um modelo
PLS foi construdo utilizando as imagens de refrigerantes e bebidas isotnicas
e os valores de referncia (concentrao de AC) foram obtidos atravs de um
mtodo cromatogrfico.
A Figura 39 mostra os histogramas RGB para as 83 amostras
analisadas. possvel notar que o canal 513 o de maior frequncia, seguido
pelo canal 256, o que indica uma predominncia de tons amarelados nas
imagens (mistura das cores vermelha e verde). Como esses dois canais
apresentaram maiores frequncias nos histogramas, modelos univariados para
cada uma destas duas frequncia foram construdos. Estes modelos foram
comparados aos modelos multivariados atravs de seus coeficientes de
correlao (r) entre os valores de referncia e os valores preditos. Boas
correlaes foram encontradas (0,827 para o canal 513 e -0,778 para o canal
256), mas estes valores no foram considerados satisfatrios para um modelo
de quantificao. A remoo de algumas reas do histograma tambm foi
avaliada, porm no foi observada melhora nos modelos.

Figura 39 Histograma de frequncia para as amostras de bebidas no


alcolicas analisadas
Para a construo do modelo, os histogramas das amostras foram
divididos em dois teros para o conjunto de calibrao (56 amostras) e um
tero para o conjunto de validao (27 amostras), utilizando o algoritmo de
86

Kennard-Stone.93 Os histogramas foram apenas centrados na mdia, sem


nenhum outro pr-processamento. O nmero de variveis latentes foi
selecionado com base no menor valor de RMSECV, estimado atravs da
validao cruzada do tipo veneziana (6 divises), sendo o melhor modelo
construdo com 4 VLs. Os coeficientes de regresso estimados para o modelo
PLS so mostrados na Figura 40.

Figura 40 Coeficientes de regresso do modelo PLS para determinao de


AC em bebidas no alcolicas
Atravs da observao dos coeficientes na Figura 40, possvel
identificar os canais que mais contribuem para a previso do AC. O coeficiente
mais significativo foi observado no canal 768, que mostrou uma influncia
negativa para quantificao do AC, indicando uma relao inversamente
proporcional entre tons azuis e a concentrao de AC. O maior coeficiente
positivo foi apresentado pelo canal 256, porm, o coeficiente de regresso do
canal 513, o canal mais frequente nos histogramas das amostras, no foi muito
significativo,

que

indica

que

os

sinais

mais

intensos

no

so,

necessariamente, os mais importantes para a predio. Um modelo univariados


correlacionando as frequncias no canal 768 e os valores de referncia foi
construdo, porm, sem apresentar bons resultados (r=0,539).
O modelo PLS foi otimizado atravs da deteco de outliers e avaliado
com base no RMSEP e no RPD, como mostrado na Tabela 8. Onze outliers
foram removidos do conjunto de calibrao (19,6%), nove por em alto resduos
em Y e dois por alto leverage. Cinco outliers (18,5%) foram removidos do

87

conjunto de validao, todos por alto resduo em Y. O modelo final, com 4 VLs,
explicou 98,8% da varincia em X e 97,2% em Y.
Tabela 8 - Resultados da otimizao do modelo PLS atravs da deteco de
outliers (modelo final em negrito)
Modelo
Amostras de calibrao
Amostras de validao
Variveis latentes
RMSEC (mg L-1)
RMSEP (mg L-1)
RPD calibrao
RPD validao

1
56
27
4
2,7
2,6
2,3
3,3

2
51
27
4
2,1
2,9
3,1
3,0

3
48
27
4
1,7
3,1
3,8
2,8

4
45
22
4
1,3
1,3
4,6
6,5

5.4.2 Validao Analtica Multivariada


A Tabela 9 apresenta as FOM estimadas para o modelo otimizado. O
grfico dos valores preditos vs. valores de referncia mostrado na Figura 41.
Para confirmar a linearidade, testes estatsticos apropriados foram utilizados
para avaliar a linearidade (RJ), homocedasticidade (BF) e ausncia de
correlao dos resduos (DW), a 95% de confiana. Os resultados dos testes
confirmam a linearidade do modelo, principalmente o DW (1,86), que
apresentou um valor dentro dos limites de aceitao (1,5 2,5), confirmando a
independncia dos resduos. Uma vez considerado linear, os parmetros para
a regresso linear foram estimados, incluindo o coeficiente de correlao entre
valores preditos e valores de referncia (r) de 0,9742.
A veracidade foi estimada atravs de parmetros que avaliam os erros
absolutos, como o RMSEP (1,3 mg L-1). Erros relativos individuais de predio
para cada amostra tambm foram estimados, apresentando valores entre -6,2
e 9,0 %, com valor mdio de -2,0% que esto de acordo com o guia de
validao da AOAC41 (-20/+10). Os valores de preciso sob condies de
repetitividade e preciso intermediria, expressos como desvio padro relativo
(DPRr e DPRR, respectivamente), foram estimadas por anlise de varincia dos
valores preditos para 18 replicatas de amostras em trs nveis de concentrao
distintos.47 Os valores de DPRR variaram entre 4,1 e 5,6%, e os valores de
DPRr variaram entre 1,0 e 3,1%. Todos os valores estimados esto abaixo do
limite mximo, calculado atravs da equao de Horwitz.40
88

Os resultados de veracidade e preciso corroboram com a afirmao de


que o mtodo pode ser considerado exato. Considerando a exatido e a
linearidade, a faixa de trabalho do mtodo foi definida como sendo de 7,8 a
39,7 mg L-1 de AC.

Tabela 9 Parmetros para avaliao das FOM no modelo proposto para a


determinao de AC em bebidas no alcolicas
Figuras de Mrito

Parmetro

Valores

Veracidade (n=22)

Erro relativo mdio

Faixa de trabalho
Seletividade do modelo
Sensibilidade do modelo

-2,0 %
2,9 % (7,2 %)
1,0 % (6,2 %)
3,1 % (6,4%)
4,4 % (11,0 %)
5,6 % (9,2 %)
4,1 % (9,6 %)
1,86
0,97 0,02
0,80 0,74
0,9702
7,8 - 39,7 mg L-1
0,17
154,11d

Sensibilidade analtica ()

3,4 L mg-1

-1
Vis

0,3 mg L-1
0,5121,210 mg L-1

DPR repetitividade a
(DPRr)
Preciso (n=18)

Linearidade

DPR preciso
intermediriab
(DPRR)
Durbin-Watson
Inclinao c
Intercepto c
Coeficiente de correlao

Resultados para trs amostras em trs diferentes concentraes analisadas no mesmo dia
por um mesmo analista, em sextuplicata. Valores limites de DPRr (entre parnteses) calculados
atravs da equao de Horwitz para cada nvel de concentrao estudado.
b Resultados para trs amostras em trs diferentes concentraes em dias diferentes por
analistas diferentes, em sextuplicata. Valores limites de DPRR (entre parnteses) calculados
atravs da equao de Horwitz para cada nvel de concentrao estudado.
c Parmetros do ajuste para a curva de valores de referncia vs. valores preditos para as
amostras de calibrao
d Valores expressos como a razo entre frequncia e mg L-1.
a

Na Figura 41 possvel notar que as amostras no se distribuem de


maneira homognea ao longo da curva, formando 3 grupos claramente
distinguveis. O primeiro grupo, com as menores concentraes, formado
pela amostras de isotnicos. O segundo grupo, no meio da curva, formado
89

pelas amostras mais famosas de refrigerantes de laranja, e o terceiro grupo


formado por refrigerantes de laranja menos conhecidos e de menor preo no
mercado, que apresentavam as maiores concentraes de AC.

Figura 41 Grfico de valores de referncia vs. valores preditos. Calibrao


(quadrados) e validao (tringulo)
A SEN e a SEL tambm foram estimadas, com base no NAS. A
necessidade de um valor mnimo de SEL no tem sentido prtico na validao
multivariada, uma vez que, diferente da validao univariada, mtodos
multivariados podem ser acurados mesmo com valores de SEL baixos. A SEL
estimada indica que 17% do sinal analtico original foi utilizado no modelo para
a determinao de AC. A foi estimada atravs do rudo instrumental (44,7),
obtido da medida de dez replicatas de imagens de uma placa de Petri vazia. O
seu inverso (-1), 0,3 mg.L-1, indica a quantidade mnima discernvel pelo
mtodo, considerando o erro instrumental aleatrio como nica fonte de erro, e
tambm define o nmero de casas com o qual os resultados devem ser
expressos.
O vis, estimado apenas para o conjunto de calibrao, apresenta um
valor de t (1,98) menor que o valor crtico (2,06, com 22 graus de liberdade e
95% de confiana), o que indica a ausncia de erro sistemtico nas predies
do modelo. De acordo com a literatura,56,57 bons modelos de calibrao devem
apresentar valores de RPD acima de 2,4, enquanto valores entre 2,4 e 1,5 so
considerados aceitveis. Considerando os valores apresentados na Tabela 9,
as estimativas de RPD foram satisfatrias tanto para a calibrao quanto para
a validao.
90

O EAEP, calculado com a equao EIV (Errors in variables), variou


entre 3,3 e 3,6 mg.L-1. A Figura 42 mostra os valores de referncia e os valores
preditos com os respectivos intervalos de confiana para cada amostra. Para
essa estimativa, a incerteza do mtodo de referncia (0,03 mg.L-1) foi obtida
atravs de estudos de preciso intermediria. Cinco pseudo-graus de
liberdade59 foram utilizados na estimativa dos intervalos de confiana (t=2,77).
Para todas as amostras, os valores de referncia esto dentro do intervalo de
confiana estimado.

Figura 42 Intervalos de confiana para a predio das amostras de validao,


estimados com base no EAEP. Valores preditos (tringulos) e de referncia
(crculos)
5.4.3 -TI
O -TI estimado para o modelo pode ser visto na Figura 43. Este perfil
de acurcia mostra que os limites de confiana calculados esto contidos no
intervalo definido pela AOAC.41 Isto indica que esperado que todos os valores
obtidos utilizando este mtodo iro apresentar erros relativos dentro do limites
da legislao. Para a menor concentrao avaliada (9,6 mg.L-1), o -TI variou
entre -15,4 e 9,6 %. Para a concentrao intermediria (30,0 mg.L-1), o -TI
variou

entre

-13,7

6,0

%,

para

concentrao

mais

elevada

(38,8 mg.L-1), ele variou entre -12,2 e 9,4 %.

91

30

Erros relativos (%)

20
10
0
8

13

18

23

28

33

38

-10
-20
-30

[AC] (mg.L-1)

Figura 43 - -TI estimados para o modelo (linhas azuis) e erros mximos


relativos definidos pelo guia de validao brasileiro (linhas vermelhas)
5.5 Concluses
Um mtodo de calibrao multivariada simples baseado em histogramas
RGB obtidos a partir de imagens digitais foi desenvolvido e validado para a
determinao de amarelo crepsculo em bebidas no alcolicas. Este mtodo
utilizou um equipamento de baixo custo (escner de mesa comercial), no
necessitou de pr-tratamento das amostras ou utilizou solventes e reagentes,
alm de ter sido muito mais rpido que o mtodo de referncia (poucos
segundos contra 15 minutos da corrida cromatogrfica). Adicionalmente, o
mtodo proposto pode ser utilizado para automatizao online de processos
industriais com uma frequncia de amostragem elevada, ou em equipamentos
portteis. O mtodo foi completamente validado de acordo com guias
brasileiros e internacionais de validao, sendo considerado linear, acurado,
com ausncia de vis e adequado para a utilizao como metodologia oficial
para quantificao de corantes artificiais em alimentos.

92

6. Telefone celular como instrumento de aquisio de imagens


para

modelos

multivariados:

Determinao

do

corante

vermelho 40 em balas duras


As balas so produtos obtidos a partir do cozimento de acares,
adicionados de corantes, aromatizantes e acidificantes, podendo conter ainda
outras substncias permitidas, caractersticas para cada tipo de bala. Elas
podem ser classificadas em balas duras e mastigveis.129
A bala dura um produto preparado base de acares e adicionado de
substncias, como corantes, cidos e aromatizantes, devendo estar em estado
vtreo, tendo caractersticas de translucidez, com textura dura e quebradia, e
com teor de slidos solveis de 97 a 98%. As balas mastigveis se diferenciam
pelo teor de slidos solveis, que varia de 90 a 93%, e pela adio de
gorduras, que lhes fornecem maior consistncia e maciez.129
O Brasil o terceiro maior produtor mundial de balas e confeitos,
superado apenas pelos EUA e Alemanha, tendo exportado, em 2004, 153.000
toneladas para 144 pases, gerando divisas de R$ 161 bilhes.129 De acordo
com a legislao brasileira, denominam-se balas e caramelos as preparaes
base de pasta de acar fundido, de formatos variados e de consistncia dura
ou semidura, com ou sem adio de outras substncias permitidas.130
Normalmente, so adicionados s balas acidulantes, aromatizantes, e
corantes.
A utilizao de corantes em alimentos desencadeia uma srie de
polmicas, pois a principal justificativa para seu emprego tornar o produto
mais

atrativo

esteticamente.

Somado

isto,

diversos

estudos

vm

demonstrando a ocorrncia de reaes adversas a curto e longo prazo,


associadas ao consumo de alimentos que apresentam esses aditivos. Portanto,
j se sabe que eles no so totalmente inofensivos sade.131
O pblico infantil o maior consumidor de alimentos coloridos, pois a
indstria investe maciamente nesse segmento visando as crianas e tornando
seus produtos mais atrativos a esta faixa etria. Porm, a presena de reaes
93

alrgicas no rara, pois as crianas apresentam maior suscetibilidade s


reaes adversas provocadas pelos aditivos alimentares, devido sua
imaturidade fisiolgica, que prejudica o metabolismo e a excreo dessas
substncias.132 Alm disso, a capacidade cognitiva de um adulto para controlar
o consumo regular de alimentos ainda no observada em uma criana.131 O
mtodo mais usado para a determinao de corantes em balas o mesmo
citado

no

captulo

anterior,

para

determinao

de

corantes

em

refrigerantes.107 Ele um mtodo que consome uma grande quantidade de


solvente (metanol com 5% m/v de NH4OH) e demorado, em funo de
requerer sucessivas extraes. Com isso, tem-se a necessidade de novos
mtodos tambm para a determinao do teor de corantes nesse tipo de
produto. Mtodos alternativos de anlise de corantes em balas tambm foram
propostas por diferentes autores, utilizando diferentes tcnicas, como
polarografia de pulso diferencial133, cromatografia134 e UV conjuntamente com
mtodos multivariados de ordem superior135 (mnimos quadrados bilineares
com bilinearizao residual).
O continuo progresso no aperfeioamento e aumento das capacidades
de telefones celulares tem feito destes equipamentos mais que simples
aparelhos de comunicao, transformando-os em verdadeiros computadores
portteis, equipados com cmeras cada vez mais potentes. A miniaturizao de
equipamentos e o conceito de Lab on a chip (laboratrio em um chip)
encontraram nos celulares modernos uma grande ferramenta, pois eles
conciliam, no mesmo equipamento, alta capacidade de aquisio de dados e
alto poder de processamento.136 A utilizao de telefones celulares em
mtodos analticos um assunto recente, que surgiu juntamente com a
popularizao dos mesmos. Atualmente, eles so utilizados nas mais diversas
reas, como avaliao de estgio de maturao de frutas137,138, analise de
gua139141, diferenciao de peas de carne11
O vermelho 40, tambm conhecido como Allura Red AC, Food Red 17,
E-129 ou CI 16035 (Figura 44), um dos corantes do tipo azo, que teve seu
uso aprovado pelo FDA (Food and Drug Administration) em 1971. Este corante
apresenta boa estabilidade luz, calor e cido, alm de ser o corante vermelho
mais estvel para bebidas na presena do cido ascrbico, um agente redutor.
94

Diversos estudos metablicos mostraram que o vermelho 40 pouco absorvido


pelo organismo e em estudos de mutagenicidade ele no apresentou potencial
carcinognico.142

Figura 44 Estrutura molecular do vermelho 40

Diferentemente das amostras de refrigerantes, as balas se encontram no


estado slido, e para a aquisio das imagens de maneira similar realizada
na aplicao anterior, elas teriam que ser solubilizadas em gua. Esse
procedimento aumentaria o tempo total de anlise e poderia aumentar o erro
analtico, em funo da maior manipulao da amostra. Por isso, a alternativa
foi a aquisio das imagens digitais dessas amostras no estado slido. Dessa
maneira, o processo da aquisio das imagens foi facilitado e a solubilizao
das balas no necessria. Ao se trabalhar com as amostras no estado slido,
porm, um novo problema surge, que a variao textural das amostras.
Embora a cor das balas costume ser homognea, sempre so observadas
certas variaes texturais em suas superfcies, as quais dificilmente so
perfeitamente lisas. A decomposio das imagens no sistema RGB no
consegue modelar variaes texturais, pois cada pixel decomposto
individualmente, sem levar em conta a sua vizinhana.17
Uma possvel soluo para contornar o problema da variao textural
a utilizao de outra estratgia de tratamento de imagens digitais que, ao invs
de utilizar os histogramas RGB, trata diretamente os valores de intensidade de
cor em funo de sua posio (localizao nos pixels x e y), gerando dados
95

multidimensionais.15 Esses dados devem ento ser pr-processados por uma


FFT para que se tornem congruentes e adquiram trilinearidade, condio para
que sejam tratados por mtodos quimiomtricos de ordem superior, como por
exemplo o NPLS.22 A descrio completa desta metodologia apresentada no
ltimo pargrafo da seo 2.5 (Anlise de imagens digitais) desta tese e
tambm pode ser encontrada no artigo de Huang e coautores.17
6.2 Objetivos
Desenvolver um modelo N-PLS para determinao do corante vermelho
40 em balas duras de diferentes sabores (morango, framboesa, tutti frutti e
cereja) utilizando imagens digitais obtidas com um telefone celular.
6.3 Materiais e mtodos
6.3.1 Equipamentos e softwares
As imagens foram obtidas utilizado um celular da marca Motorola RAZR,
modelo XT910 (Illinois, EUA), mostrado na Figura 45. Os softwares utilizados
foram os mesmos citados na sesso 3.3.1, juntamente com o Image
Processing Toolbox, verso 8.0 (The MathWorks, Natick, MA, EUA).

Figura 45 Celular Motorola RAZR, empregado como instrumento para a


aquisio das imagens

96

6.3.2 Amostras
Duzentos e quarenta amostras de balas duras de quatro sabores
diferentes (morango, framboesa, cereja e tutti frutti) e de duas marcas distintas,
contendo o vermelho 40 como nico corante artificial, foram adquiridas
predominantemente no comrcio local de Belo Horizonte/MG e armazenadas a
temperatura ambiente at a data da anlise.
6.3.3 Procedimento
As amostras foram desembaladas e as imagens foram imediatamente
adquiridas. Para a aquisio das imagens foi construda uma cmara, com
material reciclado (uma caixa de papelo). Esta cmara tem por objetivo
padronizar a posio da aquisio das imagens, atravs de suportes para o
celular e para a amostra (feito com durepox), assim como padronizar a
iluminao, o que foi feito utilizando uma luminria alimentada via USB (Figuras
46-48). Aps a aquisio das imagens, as balas foram solubilizadas em 30 mL
de gua deionizada aquecida (50 60 C) por 15 minutos e analisadas pelo
mtodo de referncia, uma adaptao do mtodo oficial substituindo a soluo
metanlica de NH4OH a 5% por gua deionizada. As leituras forma realizadas
em um equipamento Varian Cary100 UV/VIS, utilizando cubetas de quartzo de
10 mm e leitura em 505 nm.

97

Luminria USB

Figura 46 Cmara de aquisio de imagens (vista superior fechada)

Suporte de
amostras
Luminria USB

Figura 47 - Cmara de aquisio de imagens (vista superior aberta)

98

Suporte para
o celular

Figura 48 - Cmara de aquisio de imagens (vista lateral)


Para a aquisio das imagens, as balas foram posicionadas no suporte
interno, o celular encaixado no suporte externo e a luminria USB ligada. As
fotos foram adquiridas sem flash, em triplicatas, em formato .jpg (Figura 49).
A FFT foi aplicada nas imagens em ambiente MatLab. Primeiramente, uma
regio de 751x351 pixels foi selecionada, buscando abranger a maior rea da
amostra possvel. Em seguida, a rea selecionada foi convertida para escala
de cinza, visando reduzir a complexidade dos dados e o tempo computacional
gasto no clculo dos modelos, e uma mdia foi estimada para as triplicatas das
amostras. Aps o tratamento dos dados, uma matriz 240 x 751 x 351 foi
gerada.

99

Figura 47 Imagem obtidas pelo celular de uma das amostras de bala


analisadas
6.4 Resultados e discusso
6.4.1 Modelo PLS/RGB
Inicialmente, um modelo PLS utilizando imagens decompostas atravs
do sistema RGB foi utilizado. Apesar de aceitveis, os erros foram
considerados elevados, com RMSEC de 6,4 mg.Kg-1 e RMSEP de 9,2 mg.Kg-1,
aps a remoo de outliers. Conforme exposto anteriormente, a decomposio
em sistema RGB no modela muito bem a informao textural. Para superar
este problema, a FFT foi testada.
6.4.2 Modelo N-PLS/FFT
Para a construo dos modelos, as amostras foram divididas em dois
teros para o conjunto de calibrao (160 amostras) e um tero para o conjunto
de validao (80 amostras), utilizando o algoritmo de Kennard-Stone89 aplicado
aos seus histogramas RGB, e nenhum pr-processamento foi utilizado. O
nmero de variveis latentes do modelo N-PLS foi estimado com base no
RMSECV, utilizando validao cruzada do tipo veneziana (7 divises), sendo o
melhor modelo obtido com 6 VLs.

100

O modelo N-PLS foi otimizado atravs da deteco de outliers e avaliado


com base no RMSEP e no RPD, como mostrado na Tabela 10. 36 outliers
(22% do total) foram removidos do conjunto de calibrao e 16 (21% do total)
foram removidos do conjunto de validao. Neste captulo em especfico, a
deteco de outliers foi realizada utilizando o teste Jacknife. Esta estratgia foi
adotada devido ao elevado tempo computacional requerido para o clculo dos
modelos. Como o mtodo de Jacknife remove todos os outliers de uma nica
vez, apenas o modelo inicial e o otimizado foram calculados. Destaca-se,
portanto, que nesta aplicao a deteco de outliers se limitou aos resduos de
previso (no bloco Y).
Tabela 10 - Resultados da otimizao do modelo N-PLS atravs da deteco
de outliers (modelo final em negrito)
Modelo
Amostras de calibrao
Amostras de validao
Variveis latentes
RMSEC (mg.Kg-1)
RMSEP (mg.Kg-1)
RPD calibrao
RPD validao

1
160
78
6
4,8
9,3
3,2
1,7

2
124
62
6
3,8
6,8
4,1
2,3

6.4.3 Validao analtica multivariada


A Tabela 11 apresenta as FOM estimadas para o modelo otimizado, e o
grfico de valores preditos vs. valores de referncia apresentado na Figura
50. A linearidade do modelo foi confirmada atravs de testes estatsticos para
avaliar a linearidade (RJ), homocedasticidade (BF) e a ausncia de correlao
dos resduos (DW), a 95% de confiana. Os resultados dos testes confirmam a
linearidade, especialmente o valor de DW (1,96). Aps a confirmao da
linearidade, a regresso linear foi calculada e os seus parmetros esto
descritos na Tabela 11.

101

Figura 48 Grfico de valores preditos vs. valores de referncia para o modelo


de determinao do corante vermelho 40 em balas duras
Ao alterar o domnio dos dados, a FFT faz com que os coeficientes de
regresso ou VIP Scores no sejam interpretveis, por isso no houve
discusso dos coeficientes de regresso para este captulo em especfico.17
A veracidade foi estimada atravs de parmetros absolutos, como o
RMSEP (6,8 mg.Kg-1), e atravs do erros relativos de predio, que variaram
entre 39,5 e -24,8%. Apesar de alguns poucos erros elevados, a grande
maioria das amostras (80% do total) apresentou erros dentro da faixa aceitvel,
que varia entre -20%/+10% (Figura 51).41 A sensibilidade, sensibilidade
analtica e -1 foram estimados atravs do NAS, calculado utilizando a equao
MKL143, e o rudo instrumental calculado atravs do desdobramento da matriz
das imagens dos brancos.
Os valores de preciso sob condies de repetitividade e preciso
intermediria, expressos como desvio padro relativo (DPRr e DPRR,
respectivamente), foram estimadas por anlise de varincia dos valores
preditos para 18 replicatas de amostras em quatro nveis de concentrao
distintos.47 Os valores de DPRR variaram entre 5,5 e 8,0%, e os valores de
DPRr variaram entre 4,6 e 5,8%. Todos os valores estimados esto abaixo do
limite mximo, calculado atravs da equao de Horwitz.40

102

Tabela 11 - Parmetros para avaliao das FOM no modelo proposto para a


determinao de Vermelho 40 em balas duras
Figuras de Mrito

Parametro

Valores

Veracidade (n=62)

Erro relativo mdio

-0,1%
5,3 % (6,1 %)
5,8 % (6,1 %)
5,1 % (6,3 %)
4,6 % (6,0 %)

DPR repetitividade a
Preciso (n=18)

6,2 % (9,1 %)
5,8 % (9,1 %)
8,0 % (9,4 %)
5,5 % (9,0 %)

DPR preciso intermediria a


Durbin-Watson
Inclinao b
Intercepto b
Coeficiente de correlao b

Linearidade
Faixa de trabalho
Seletividade do modelo
Sensibilidade do modelo
Sensibilidade analtica ()
-1
Vis

1,96
0,940,02
0,330,12
0,9669
22,9 78,8 mg.Kg-1
---2,64
4,25
0,2
-0,1150,6578mg.Kg-1

a Resultados

para seis amostras em quatro diferentes concentraes


Parmetros do ajuste para a curva de valores de referncia vs. valores preditos para as
amostras de calibrao
b

50
40
ERROS RELATIVOS (%)

30
20
10
0
-10
-20
-30
-40
-50
0

10

20

30

40

50

60

AMOSTRAS DE VALIDAO

Figura 49 Erros relativos das amostras do conjunto de validao (Limites


estabelecidos pela legislao em vermelho)
103

Os resultados de veracidade e preciso confirmam a exatido do


mtodo. Considerando a exatido e a linearidade, a faixa de trabalho do
mtodo foi definida como sendo de 22,9 a 78,8 mg Kg-1 de Vermelho 40.
O vis apresentou um valor de t (1,13) menor que o valor critico (1,67
para 57 graus de liberdade e 95% de confiana), o que indica ausncia de erro
sistemtico nas predies do modelo. O modelo tambm apresentou valores de
RPD dentro do recomendado pela literatura.56,57
6.4.4 -TI
O -TI estimado confirmou que existe uma tendncia do modelo
desenvolvido em fornecer resultados com erros positivos. Como possvel
verificar na Figura 52, existe uma maior quantidade de erros positivos, e estes
deslocaram o -TI para fora do limite recomendado pelo guia de validao
brasileiro,37 sendo os maiores desvios encontrados nas amostras de mais baixa
concentrao. Tal condio talvez possa ser explicada pela variao da
tonalidade do corante em funo da concentrao. A cor, diferentemente da
absorbncia, no varia de maneira linear medida que aumentamos a
concentrao de corante, o que pode ser um complicador quando se
desenvolve mtodos utilizando imagens que possuem uma ampla faixa
analtica de trabalho.
40

Erros relativos (%)

30
20
10
0
-10
-20
-30
-40
35

40

45

50

55

60

65

70

75

Vermelho 40 (mg/L)

Figura 50 - -TI estimados para o modelo (linhas tracejadas) e erros mximos


relativos definidos pelo guia de validao brasileiro (linhas slidas)

104

6.5 Concluses
Um mtodo de calibrao baseado em imagens obtidas atravs de um
telefone celular foi desenvolvido e validado para determinao do corante
vermelho 40 em balas duras. Este mtodo foi capaz de quantificar o corante de
maneira no destrutiva, alm de ser muito mais rpido que o mtodo de
referncia. O mtodo foi submetido a um processo completo de validao
analtica, no atendendo porm, a todos os parmetros exigidos.
Mesmo no atendendo a todos parmetros exigidos, a utilizao de um
simples telefone celular como instrumento analtico capaz de realizar medies
da ordem de partes por milho um fato relevante. A utilizao de imagens
digitais em qumica analtica um campo relativamente recente, e muitos
avanos ainda so necessrios, mas o resultados obtidos nesta aplicao
provam que este campo muito promissor.

105

7 Concluses Gerais
A aplicao de tcnicas espectroscpicas e anlise de imagens digitais
se mostraram poderosas ferramentas na anlise de alimentos. A associaes
entre estas tcnicas e ferramentas quimiomtricas como o PLS, PLS-DA e o NPLS permitiu o desenvolvimento de modelos capaz de determinar parmetros
de qualidade, concentrao de aditivos e detectar fraudes de maneira simples,
rpida e eficiente.
Um importante entrave que impede mtodos multivariados de serem
aceitos como mtodos oficiais de anlise ou mesmo de rotina a falta de guias
especficos que contemplem as particularidades destes mtodos. Esta tese
um passo para essa harmonizao entre a realidade univariada e a
multivariada, tentando propor adaptaes para que estes mtodos possam ser
validados e aplicados de maneira adequada.

106

8 Referncias Bibliogrficas
1.

Burns,D.A & Ciurczak, E. W. Handbook of Near Infrared Analysis. 3. ed.


2008, Boca Raton: CRC Press. 836p.

2.

Sun, D. W. Infrared Spectroscopy for Food Quality Analysis and Control.


1. ed.2009, Nova York:Academic Press. 451p.

3.

Hart, J. R., Norris, K. H. & Golumbic, G. Determination of the moisture


content of seeds by near-infrared spectrophotometry of their methanol
extracts. Cereal Chem. 39, 9499 (1962).

4.

Pasquini, C. Review near infrared spectroscopy: Fundamentals , practical


aspects and analytical applications. J. Braz. Chem. Soc. 14, 198219
(2003).

5.

Pavia, D., Lampman, G., Kriz, G. & Vyvyan, J. Introduction to


Spectroscopy. 4. ed. 2008. Stamford: Cengage Learning. 752p.

6.

Karoui, R., Downey, G. & Blecker, C. Mid-infrared spectroscopy coupled


with chemometrics: a tool for the analysis of intact food systems and the
exploration of their molecular structure-quality relationships - a review.
Chem. Rev. 110, 61446168 (2010).

7.

Karoui, R.,Mouazen, A. M., Dufour, E.,Pillonel, L., Schaller, E., Picque,


D., De Baerdemaeker,J. & Bosser, J. A comparison and joint use of NIR
and MIR spectroscopic methods for the determination of some
parameters in European Emmental cheese. Eur. Food Res. Technol. 223,
4450 (2006).

8.

Ledley, R. S. High-Speed Automatic Analysis of Biomedical Pictures.


Science 146, 216223 (1964).

9.

Geladi, P., Wold, S. & Esbensen, K. Image analysis and chemical


information in images. Anal. Chim. Acta 191, 473480 (1986).

10.

Foca, G., Masino, F., Antonelli, A. & Ulrici, A. Prediction of compositional


and sensory characteristics using RGB digital images and multivariate
calibration techniques. Anal. Chim. Acta 706, 238245 (2011).

11.

Iqbal, Z. & Bjorklund, R. B. Assessment of a mobile phone for use as a


spectroscopic analytical tool for foods and beverages. Int. J. Food Sci.
Technol. 46, 24282436 (2011).

12.

Santos, P. M., Wentzell, P. D. & Pereira-Filho, E. R. Scanner digital


images combined with color parameters: A case study to detect
adulterations in liquid cows milk. Food Anal. Meth. 5, 8995 (2012).

107

13.

Borin, A., Ferro, M. F., Mello, C., Cordi, L., Pataca, L. C., Durn, N. &
Poppi, R. J. Quantification of Lactobacillus in fermented milk by
multivariate image analysis with least-squares support-vector machines.
Anal. Bioanal. Chem. 387, 11051112 (2007).

14.

Acevedo, C. A., Skurtys, O., Young, M. E., Enrione, J., Pedreschi, F. &
Osorio, F. A non-destructive digital imaging method to predict immobilized
yeast-biomass. LWT - Food Sci. Technol. 42, 14441449 (2009).

15.

Godinho, M. S., Oliveira, A. E. & Sena, M. M. Determination of interfacial


tension of insulating oils by using image analysis and multi-way
calibration. Microchem. J. 96, 4245 (2010).

16.

Oliveira, L. F., Canevari, N. T., Guerra, M. B. B., Pereira, F. M. V.,


Schaefer, C. E. G. R. & Pereira-Filho, E. R. Proposition of a simple
method for chromium (VI) determination in soils from remote places
applying digital images: A case study from Brazilian Antarctic Station.
Microchem. J. 109, 165169 (2013).

17.

Huang, J., Wium, H., Qvist, K. B. & Esbensen, K. H. Multi-way methods in


image analysisrelationships and applications. Chemom. Intell. Lab.
Syst. 66, 141158 (2003).

18.

Ferreira, M. M. C., Antunes, A. M., Melgo, M. S. & Volpe, P. L. O.


Quimiometria I: Calibrao multivariada, um tutorial. Quim. Nova 22, 724
731 (1999).

19.

Barros Neto, B. de, Scarminio, I. S. & Bruns, R. E. 25 anos de


quimiometria no Brasil . Quim. Nova 29 , 14011406 (2006).

20.

de Sena, M. M., Poppi, R. J., Frighetto, R. T. & Valarini, P. Avaliao do


uso de mtodos quimiomtricos em anlise de solos. Quim. Nova 23,
547556 (2000).

21.

Shao, X., Bian, X., Liu, J., Zhang, M. & Cai, W. Multivariate calibration
methods in near infrared spectroscopic analysis. Anal. Meth. 2, 1662
1666 (2010).

22.

Bro, R. Multiway calibration. Multilinear PLS. J. Chemom. 10, 4761


(1996).

23.

Bro, R. Multi-way Analysis in the Food Industry: models, algorithms and


applications. 309p. Tese de doutorado. Real Universidade de Veterinria
e Agricultura, Dinamarca (1998).

24.

Barker, M. & Rayens, W. Partial least squares for discrimination. J.


Chemom. 17, 166173 (2003).

108

25.

Rodriguez-Otero, J. L., Hermida, M. & Centeno, J. Analysis of Dairy


Products by Near-Infrared Spectroscopy: A Review. J. Agric. Food
Chem. 45, 28152819 (1997).

26.

Sun, T., Huang, K., Xu, H. & Ying, Y. Research advances in


nondestructive determination of internal quality in watermelon/melon: A
review. J. Food Eng. 100, 569577 (2010).

27.

Nicola, B. M., Beullens, K., Bobelyn, E., Peirs, A., Saeys, W., Theron, K.
I. & Lammertyn, J. Nondestructive measurement of fruit and vegetable
quality by means of NIR spectroscopy: A review. Postharvest Biol.
Technol. 46, 99118 (2007).

28.

Bucci, R., Magri, A. D., Marini, D. & Marini, F. Chemical authentication of


extra virgin olive oil varieties by supervised chemometric procedures. J.
Agric. Food Chem. 50, 413418 (2002).

29.

Garca-Alvarez, M., Ceresuela, S., Huidobro, J. F., Hermida, M. &


Rodrguez-Otero, J. L. Determination of polarimetric parameters of honey
by near-infrared transflectance spectroscopy. J. Agric. Food Chem. 50,
419425 (2002).

30.

Llario, R., In, F.A., Garrigues, S. & de la Guardia, M. Determination of


quality parameters of beers by the use of attenuated total reflectanceFourier transform infrared spectroscopy. Talanta 69, 469480 (2006).

31.

Antonelli, A., Cocchi, M., Fava, P., Foca, G., Franchini, G. C., Manzini, D.
& Ulrici, A. Automated evaluation of food colour by means of multivariate
image analysis coupled to a wavelet-based classification algorithm. Anal.
Chim. Acta 515, 313 (2004).

32.

Haughey, S. A., Graham, S. F., Cancout, E. & Elliott, C. T. The


application of Near-Infrared Reflectance Spectroscopy (NIRS) to detect
melamine adulteration of soya bean meal. Food Chem. 136, 15571561
(2013).

33.

Gurdeniz, G. & Ozen, B. Detection of adulteration of extra-virgin olive oil


by chemometric analysis of mid-infrared spectral data. Food Chem. 116,
519525 (2009).

34.

Guerreiro, J. S., Barros, M., Fernandes, P., Pires, P. & Bardsley, R.


Principal component analysis of proteolytic profiles as markers of
authenticity of PDO cheeses. Food Chem. 136, 15261532 (2013).

35.

Casale, M., Oliveri, P., Casolino, C., Sinelli, N., Armanino, C., Forina, M.
& Lanteri, S. Characterisation of PDO olive oil Chianti Classico by nonselective (UV-visible, NIR and MIR spectroscopy) and selective (fatty acid
composition) analytical techniques. Anal. Chim. Acta 712, 5663 (2012).

109

36.

Alves, M. R., Cunha, S. C., Amaral, J. S., Pereira, J. A. & Oliveira, M. B.


Classification of PDO olive oils on the basis of their sterol composition by
multivariate analysis. Anal. Chim. Acta 549, 166178 (2005).

37.

Secretaria de Defesa Agropecuria. Ministrio da Agricultura, Pecurria


e Abastecimento. Instruo Normativa n 24 - Anexo II. (2009).

38.

Secretaria de Defesa Agropecuria. Ministrio da Agricultura, Pecurria


e Abastecimento. Manual de garantia da qualidade analtica: Resduos e
Contaminantes em alimentos. (2011).

39.

Instituto Nacional de Metrologia, Normalizao e Qualidade Industrial INMETRO. - Orientaes sobre validao de mtodos de ensaios
qumicos. DOQ-CGCRE-008, Rio de Janeiro, 2011. Reviso 04, 20p.

40.

Food and Agriculture Organization. Validation of analytical methods for


food control. Report of a Joint FAO/IAEA Experte Consultation, FAO Food
and Nutrition Paper n 68, Roma, Itlia.

41.

Thompson, M., Ellison, S. L. R. & Wood, R. Harmonized guidelines for


single-laboratory validation of methods of analysis (IUPAC Technical
Report). Pure Appl. Chem. 74, 835855 (2002).

42.

AOAC (Association of Official Analytical Chemists). AOAC Official


Methods of analysis. Guidelines for Standard Method Performance
Requirements. Washington: AOAC,2012.

43.

EURACHEM. The fitness for purpose of analytical methods, a laboratory


guide to method validation and related topics. Teddington: LGC, 1998,
61p.

44.

Bro, R. & Andersen, C. M. Theory of net analyte signal vectors in inverse


regression. J. Chemom. 17, 646652 (2003).

45.

Valderrama, P., Braga, J. W. B. & Poppi, R. J. Variable Selection, Outlier


Detection, and Figures of Merit Estimation in a Partial Least-Squares
Regression Multivariate Calibration Model. A Case Study for the
Determination of Quality Parameters in the Alcohol Industry by NearInfrared Spectroscopy. J. Agric. Food Chem. 55, 83318338 (2007).

46.

Annual Book of ASTM Standards, Standard Practices for Infrared


Multivariate Quantitative Analysis - E1655-12, ASTM International, West
Conshohocken, Pennsylvania, EUA, 2012.

47.

Silva, M. A. M., Ferreira, M. H., Braga, J. W. B. & Sena, M. M.


Development and analytical validation of a multivariate calibration method
for determination of amoxicillin in suspension formulations by near
infrared spectroscopy. Talanta 89, 342351 (2012).

110

48.

De Souza, S. V. C. & Junqueira, R. G. A procedure to assess linearity by


ordinary least squares method. Anal. Chim. Acta 552, 2535 (2005).

49.

Lorber, A. Error propagation and figures of merit for quantification by


solving matrix equations. Anal. Chem. 58, 11671172 (1986).

50

Lorber, A., Faber, K. & Kowalski, B. R. Net analyte signal calculation in


multivariate calibration. Anal. Chem. 69, 16201626 (1997).

51.

Olivieri, A. C., Faber, N. M., Ferr, J., Boqu, R., Kalivas, J. H. & Mark, H.
Uncertainty estimation and figures of merit for multivariate calibration
(IUPAC Technical Report). Pure Appl. Chem. 78, 633661 (2006).

52.

Faber, N. M. Response to Comments on construction of confidence


intervals in connection with partial least squares.J. Chemom. 14, 363
369 (2000).

53.

Faber, N. M. Exact presentation of multivariate calibration model as


univariate calibration graph. Chemom. Intell. Lab. Syst. 50, 107114
(2000).

54.

Instituto Nacional De Metrologia, Qualidade E Tecnologia; Oliveira, J.C.V.


(coord.). Vocabulrio Internacional de Metrologia: conceitos fundamentais
e gerais e termos associados. Rio de Janeiro: INMETRO, 2009.

55.

Durbin, J. & Watson, G. S. Testing For Serial Correlation in Least


Squares Regression. Biometrika 38, 159178 (1951).

56.

Valderrama, P. & Braga, J. W. B. Estado da arte de figuras de mrito em


calibrao multivariada. Quim. Nova, 32, 12781287 (2009).

57.

Williams, P & Norris, K. Near-infrared technology in the agricultural and


food industries,1 ed. 2001. American Association of Cereal Chemists
Inc.: St. Paul.

58.

Patil, A. G., Oak, M. D., Taware, S. P., Tamhankar, S. A. & Rao, V. S.


Nondestructive estimation of fatty acid composition in soybean [Glycine
max (L.) Merrill] seeds using Near-Infrared Transmittance Spectroscopy.
Food Chem. 120, 12101217 (2010).

59.

Faber, N. M. & Bro, R. Standard error of prediction for multiway PLS.


Chemom. Intell. Lab. Syst. 61, 133149 (2002).

60.

de Vries, S. & J.F. ter Braak, C. Prediction error in partial least squares
regression: a critique on the deviation used in The Unscrambler.
Chemom. Intell. Lab. Syst. 30, 239245 (1995).

61.

Faber, K. & Kowalski, B. R. Prediction error in least squares regression:


Further critique on the deviation used in The Unscrambler. Chemom.
Intell. Lab. Syst. 34, 283292 (1996).
111

62.

Zhang, L. & Garcia-Munoz, S. A comparison of different methods to


estimate prediction uncertainty using Partial Least Squares (PLS): A
practitioners perspective. Chemom. Intell. Lab. Syst. 97, 152158 (2009).

63.

Rozet, E., Wascotte, V., Lecouturier, N., Prat, V., Dew, W., Boulanger,
B. & Hubert, P. Improvement of the decision efficiency of the accuracy
profile by means of a desirability function for analytical methods
validation. Application to a diacetyl-monoxime colorimetric assay used for
the determination of urea in transdermal iontophoretic ext. Anal. Chim.
Acta 591, 239247 (2007).

64.

Mantanus, J., Zimons, E., Rozet, E., Streel, B., Klinkenberg, R., Evrard,
B., Rantanen, J. & Hubert, P. Building the quality into pellet manufacturing
environment--feasibility study and validation of an in-line quantitative near
infrared (NIR) method. Talanta 83, 305311 (2010).

65.

Valcrcel, M. & Crdenas, S. Modern qualitative analysis. TrAC Trends


Anal. Chem. 24, 467 (2005).

66.

Magalhes, C. G., De Paiva, C. R., Botelho, B. G., De Oliveira, A. M., De


Souza, L. F., Nonaka, C. V., Santos, K. V., Farias, L. M. & Carvalho, M.
A. In-house validation of PremiTest, a microbiological screening test
with solvent extraction, for the detection of antimicrobial residues in
poultry muscles. Food Addit. Contam. Part A 29, 535540 (2011).

67.

Pikkemaat, M. G. Microbial screening methods for detection of antibiotic


residues in slaughter animals. Anal. Bioanal. Chem. 395, 893905 (2009).

68.

European Community Directive 657. Comission Decision of 12 August


2002 implementing Council Directive 96/23/EC concerning the
performance of analytical methods and the interpretation of results,
Official Journal, L221, 8-36, Bruxelas, Blgica.

69.

Trullols, E., Ruisnchez, I. & Rius, F. X. Validation of qualitative analytical


methods. TrAC Trends Anal. Chem. 23, 137145 (2004).

70.

Gondim, C. S., Junqueira, R. G. & Souza, S. V. C. Tendncias em


validao de mtodos de ensaios qualitativos (Trends in implementing
the validation of qualitative methods of analysis). Rev. Inst. Adolfo Lutz
70, 433447 (2011).

71.

NATA. Technical Note 17. Guidelines for the validation and verification of
quantitative and qualitative test methods. 32p. Canberra: National
Association of Testing Authorities (2013).

72.

Gondim, C. S., Coelho, O. A., Alvarenga, R. L., Junqueira, R. G. & de


Souza, S. V. An appropriate and systematized procedure for validating
qualitative methods: its application in the detection of sulfonamide
residues in raw milk. Anal. Chim. Acta 9, 1122 (2014).
112

73.

Botelho, B., Mendes, B. P. & Sena, M. Development and Analytical


Validation of Robust Near-Infrared Multivariate Calibration Models for the
Quality Inspection Control of Mozzarella Cheese. Food Anal. Meth. 6,
881891 (2013).

74.

Pulido, A., Ruisnchez, I., Boqu, R. & Rius, F. X. Uncertainty of results


in routine qualitative analysis. TrAC Trends Anal. Chem. 22, 647654
(2003).

75.

Wise, B. W., Gallagher, N. B., Bro, R., Shaver, J. M., Windig, W. & Koch,
R. S. PLS-Toolbox 4.0 for use with MatlabTM (Manual). (2006).

76.

Langton, S. D., Chevennement, R., Nagelkerke, N. & Lombard, B.


Analysing collaborative trials for qualitative microbiological methods:
accordance and concordance. Int. J. Food Microbiol. 79, 175181 (2002).

77.

Harbutt, J., The World Cheese. 1. ed. 2009, Nova Iorque: DK Publishing

78.

Teixeira, L. V & Fonseca, L. M. Perfil fsico-qumico do soro de queijos


mozarela e minas-padro produzidos em vrias regies do estado de
Minas Gerais. Arq. Bras. Med. Vet. Zootec. 60, 243-250 (2008).

79.

Secretaria de Defesa Agropecuria. Ministrio da Agricultura, Pecuria e


Abastecimento. Portaria n 364, Brasil (1997)

80.

Y. Pomeranz & C. E. Meloan: Food Analysis: Theory and Practice. 3. ed.


2002, Berlim: Springer Science & Business Media

81.

Badertscher, R., Berger, T. & Kuhn, R. Densitometric determination of the


fat content of milk and milk products. Int. Dairy J. 17, 2023 (2007).

82.

Bradley, R. L. J. & Vanderwarn, M. A. Determination of moisture in


cheese and cheese products. J. AOAC Int. 84, 570592 (2001).

83.

Gera, L. B. & Norris, K. H. Influence of fat concentration on the absorption


spectrum of milk in the near infrared region. Isr. J. Agric. Res. 18, 117124 (1968).

84.

Pierce, M. M. & Wehling, R. L. Comparison of sample handling and data


treatment methods for determining moisture and fat in Cheddar cheese by
near-infrared spectroscopy. J. Agric. Food Chem. 42, 28302835 (1994).

85.

Rodriguez-Otero, J. L., Hermida, M. & Cepeda, A. Determination of fat,


protein, and total solids in cheese by near-infrared reflectance
spectroscopy. J. AOAC Int. 78, 802806 (1995).

86.

Wittrup, C. & Nrgaard, L. Rapid Near Infrared Spectroscopic Screening


of Chemical Parameters in Semi-hard Cheese Using Chemometrics. J.
Dairy Sci. 81, 18031809 (1998).
113

87.

Blazquez, C., Downey, G., Donnell, C. O. & Callaghan, O. Prediction of


moisture , fat and inorganic salts in processed cheese by near infrared
reflectance spectroscopy and multivariate data analysis. 157, 149157
(2004).

88.

Lucas, A., Andueza, D., Rock, E. & Martin, B. Prediction of Dry matter,
fat, ph, vitamins, minerals, carotenoids, total antioxidant capacity, and
color in fresh and freeze-dried cheeses by visible-near-infrared
reflectance spectroscopy. J. Agric. Food Chem. 56, 68016808 (2008).

89.

Pi, F., Shinzawa, H., Ozaki, Y. & Han, D. Non-destructive determination of


components in processed cheese slice wrapped with a polyethylene film
using near-infrared spectroscopy and chemometrics. Int. Dairy J. 19,
624629 (2009).

90.

Ntsame Affane, A. L., Fox, G. P., Sigge, G. O., Manley, M. & Britz, T. J.
Simultaneous prediction of acidity parameters (pH and titratable acidity) in
Kefir using near infrared reflectance spectroscopy. Int. Dairy J. 21, 896
900 (2011).

91.

Huang, H., Yu, H., Xu, H. & Ying, Y. Near infrared spectroscopy for on/inline monitoring of quality in foods and beverages: A review. J. Food Eng.
87, 303313 (2008).

92.

Ferreira, M. H., Braga, J. W. B. & Sena, M. M. Development and


validation of a chemometric method for direct determination of
hydrochlorothiazide in pharmaceutical samples by diffuse reflectance
near infrared spectroscopy. Microchem. J. 109, 158164 (2013).

93.

Kennard, R. W. & Stone, L. A. Computer Aided Design Of Experiments.


Techometrics 11, 137148 (1969).

94.

Isaksson, T. & Naes, T. The effect of multiplicative scatter correction


(MSC) and linearity improvement in NIR spectroscopy. Appl. Spectrosc.
42, 12731284 (1988).

95.

Workman, J.J. and L. Weyer, Practical guide to interpretative near


infrared spectroscopy. 2008, Boca Raton: CRC - Press.

96.

Draper, N.R. and H. Smith, Applied Regression Analysis. 1998, Nova


Jersey: John Wiley & Sons.

97.

Horwitz, W. & Albert, R. The Horwitz ratio (HorRat): A useful index of


method performance with respect to precision. J. AOAC Int. 89, 1095
1109 (2006).

98.

Resende, M.F.S., Queijo Minas Artesanal da Serra da Canastra:


Influncia da altitude e do nvel de cadastramento das queijarias nas
caracteristcas fsico-qumicas e microbiolgicas. 72p. Dissertao de
mestrado. Universidade Federal de Minas Gerais, Brasil. (2010).
114

99.

Nogueira, M. C. L., Lubachevsky, G. & Rankin, S. A. A study of the


volatile composition of Minas cheese. LWT - Food Sci. Technol. 38, 555
563 (2005).

100. MINAS GERAIS. Assemblia Legislativa do Estado de Minas Gerais.


Decreto n 44.864 de 01 de agosto de 2008. Altera o regulamento da lei
n 14.185 de 31 de janeiro de 2002, que dispe sobre o processo de
produo do queijo Minas artesanal. Belo Horizonte: Assemblia
Legislativa.
101. MINAS GERAIS. Assemblia Legislativa do Estado de Minas Gerais.
Decreto n 42.645, de 05 de junho de 2002. Aprova o regulamento da Lei
n 14.185, de 31/01/2002, que dispe sobre o processo de produo de
queijo Minas artesanal.
102. Fox, P. F. & McSweeney, P. L. H. Advanced Dairy Chemistry: Volume 1:
Proteins, Parts A&B: Protein.1 ed. 2003,Springer Science & Business
Media:Berlim.1236p
103. EMBRAPA - Empresa Brasileira de Pesquisa Agrcola. Estatsticas de
produao
de
leite.
(2014).
Disponivel
em
<http://www.cnpgl.embrapa.br/nova/informacoes/estatisticas/producao/pr
oducao.php. >. Acesso em julho/2014
104. Hoorfar, J. Case Studies in Food Safety and Authenticity: Lessons From
Real-Life
Situations.
1
ed.
2012,
Woodhead
Publishing
Limited:Cambridge (2012)
105. UOL, Operao desmonta esquema de empresas que adulteravam leite
no
Sul.
(2014).
Disponivel
em
<
http://noticias.uol.com.br/cotidiano/ultimas-noticias/2013/05/08/operacaodesmonta-esquema-de-empresas-que-fraudavam-leite-no-sul.htm >
106. Souza, S. S., Cruz, A. G., Walter, E. H. M., Faria, J. A. F., Celeghini, R.
M. S., Ferreira, M. M. C., Granato, D.& Sant'Ana, A. S. Monitoring the
authenticity of Brazilian UHT milk: A chemometric approach. Food.
Chem.124, 692-695 (2011)
107. IAL. Mtodos Fsicos-Qumicos para Anlise de Alimentos. 4 ed.Instituto
Adolfo Lutz: So Paulo (IAL), (2005).1020p
108. MAPA. Instruo Normativa nmero 22 de 19 de abril de 2006. (2006).
109. Kasemsumran, S., Thanapase, W. & Kiatsoonthon, A. Feasibility of nearinfrared spectroscopy to detect and to quantify adulterants in cow milk.
Anal. Sci. 23, 907910 (2007).
110. Nicolaou, N., Xu, Y. & Goodacre, R. Fourier transform infrared
spectroscopy and multivariate analysis for the detection and quantification
of different milk species. J. Dairy Sci. 93, 56515660 (2014).
115

111. Santos, P. M., Pereira-Filho, E. R. & Rodriguez-Saona, L. E. Application


of hand-held and portable infrared spectrometers in bovine milk analysis.
J. Agric. Food Chem. 61, 12051211 (2013).
112. Santos, P. M., Pereira-Filho, E. R. & Rodriguez-Saona, L. E. Rapid
detection and quantification of milk adulteration using infrared
microspectroscopy and chemometrics analysis. Food Chem. 138, 1924
(2013).
113. Zhang, L. G., Zhang, X., Ni, L., Xue, Z., Gu, X. & Huang, S. Rapid
identification of adulterated cow milk by non-linear pattern recognition
methods based on near infrared spectroscopy. Food Chem. 145, 342
348 (2014).
114. Kizil, R., Irudayaraj, J. & Seetharaman, K. Characterization of Irradiated
Starches by Using FT-Raman and FTIR Spectroscopy. J. Agric. Food
Chem. 50, 39123918 (2002).
115. Tewari, J. C. & Malik, K. In situ laboratory analysis of sucrose in
sugarcane bagasse using attenuated total reflectance spectroscopy and
chemometrics. Int. J. Food Sci. Technol. 42, 200207 (2007).
116. Brown, C. D. & Green, R. L. Critical factors limiting the interpretation of
regression vectors in multivariate calibration. TrAC Trends Anal. Chem.
28, 506514 (2009).
117. Chong, I.-G. & Jun, C.-H. Performance of some variable selection
methods when multicollinearity is present. Chemom. Intell. Lab. Syst. 78,
103112 (2005).
118. Ghoreishi, S. M., Behpour, M. & Golestaneh, M. Simultaneous
determination of Sunset yellow and Tartrazine in soft drinks using gold
nanoparticles carbon paste electrode. Food Chem. 132, 637641 (2012).
119. Xing, Y., Xing, Y., Meng, M., Xue, H., Zhang, T., Yin, Y & Xi,R.
Development
of
a
polyclonal
antibody-based
enzyme-linked
immunosorbent assay (ELISA) for detection of Sunset Yellow FCF in food
samples. Talanta 99, 125131 (2012).
120. ANVISA. Agncia Nacional de Vigilncia Sanitria. Compndio da
Legislao Brasileira de Aditivos Alimentares, Brasilia.163p. (2011)
121. Bonan, S., Fedrizzi, G., Menotta, S. & Elisabetta, C. Simultaneous
determination of synthetic dyes in foodstuffs and beverages by highperformance liquid chromatography coupled with diode-array detector.
Dyes Pigm. 99, 3640 (2013).
122. Vidotti, E. C., Costa, W. F. & Oliveira, C. C. Development of a green
chromatographic method for determination of colorants in food samples.
Talanta 68, 516521 (2006).
116

123. Nevado, J. J. B., Flores, J. R. & Llerena, M. J. V. Square wave adsorptive


voltammetric determination of sunset yellow. Talanta 44, 467474 (1997).
124. El-Shahawi, M. S., Hamza, A., Al-Sibaai, A. A., Bashammakh, A. S. & AlSaidi, H. M. A new method for analysis of sunset yellow in food samples
based on cloud point extraction prior to spectrophotometric determination.
J. Ind. Eng. Chem. 19, 529535 (2013).
125. Berzas Nevado, J. J., Rodrguez Flores, J., Guiberteau Cabanillas, C.,
Villaseor Llerena, M. J. & Contento Salcedo, a. Resolution of ternary
mixtures of Tartrazine, Sunset yellow and Ponceau 4R by derivative
spectrophotometric ratio spectrum-zero crossing method in commercial
foods. Talanta 46, 933942 (1998).
126. Nevado, J., Flores, J. R., Llerena, M. J. V & Farias, N. R. Simultaneous
spectrophotometric determination of tartrazine, patent blue V, and indigo
carmine in commercial products by partial least squares and principal
component regression methods. Talanta 48, 895903 (1999).
127. El-Sheikh, A. H. & Al-Degs, Y. S. Spectrophotometric determination of
food dyes in soft drinks by second order multivariate calibration of the
absorbance spectra-pH data matrices. Dyes Pigm. 97, 330339 (2013).
128. Pedjie, N. Analysis of color additives in beverages with the PerkinElmer
Flexar FX-15 system equipped with a PDA detector. Application Note,
PerkinElmer,
Waltham,
USA.
Disponivel
em
<http://www.perkinelmer.com/CMSResources/Images/44134896APP_Food_Additives_in_Beverages.pdf>
129. Benassi, M. D. T. Nota Prvia Metodologia para avaliao de
cristalizao em balas duras por imagem digitalizada. Cienc. Tecnol.
Aliment. 9, 151155 (2006)
130. ANVISA. Agncia Nacional de Vigilncia Sanitria. Resoluo n44, de
05 de Agosto de 1977.
131. Pinheiro, S., Schumann, A., Lucia, M. & Polnio, T. Avaliao do
consumo de corantes artificiais por lactentes , pr-escolares e escolares.
Cienc. Tecnol. Aliment. 28, 534539 (2008).
132. Pinheiro, M. C. O. & Abrantes, S. M. P. Avaliao da exposio aos
corantes artificiais em balas e chicletes por crianas entre 3 e 9 anos
estudantes de escolas particulares da Tijuca/Rio de Janeiro. Rev. Anal.
Disponvel em <http://www.revistaanalytica.com.br/artigos/8.html>.
133. Yilmaz, U. T., Ergun, F. & Yilmaz, H. Determination of the food dye
carmine in milk and candy products by differential pulse polarography. J.
Food Drug Anal. 22, 329335 (2014).

117

134. Prado, M. A. & Godoy, H. T. Teores de corantes artificiais em alimentos


determinados por cromatografia lquida de alta eficincia . Quim. Nova
30 , 268273 (2007).
135. Asadpour-Zeynali, K., Maryam Sajjadi, S., Taherzadeh, F. & Rahmanian,
R. Analysis of variation matrix array by bilinear least squares-residual
bilinearization (BLLS-RBL) for resolving and quantifying of foodstuff dyes
in a candy sample. Spectrochim. Acta. A. Mol. Biomol. Spectrosc. 123,
273281 (2014).
136. Preechaburana, P., Suska, A. & Filippini, D. Biosensing with cell phones.
Trends Biotechnol. 32, 351355 (2014).
137. Intaravanne, Y., Sumriddetchkajorn, S. & Nukeaw, J. Cell phone-based
two-dimensional spectral analysis for banana ripeness estimation.
Sensors Actuators B Chem. 168, 390394 (2012).
138. Hazir, M. H. M., Shariff, A. R. M. & Amiruddin, M. D. Determination of oil
palm fresh fruit bunch ripenessBased on flavonoids and anthocyanin
content. Ind. Crops Prod. 36, 466475 (2012).
139. Kanwar, L. & Rao, K. K. Development of a low-cost portable colorimeter
for the estimation of fluoride in drinking water. Sensors Actuators B
Chem. 149, 245251 (2010).
140. Garca, A. et al. Mobile phone platform as portable chemical analyzer.
Sensors Actuators B Chem. 156, 350359 (2011).
141. Iqbal, Z. & Bjorklund, R. B. Colorimetric analysis of water and sand
samples performed on a mobile phone. Talanta 84, 11181123 (2011).
142. Borzelleca, J. F., Olson, J. W. & Reno, F. E. Lifetime
toxicity/carcinogenicity studies of FD & C Red No. 40 (allura red) in mice.
Food Chem. Toxicol. 29, 313319 (1991).
143. Messick, N. J., Kalivas, J. H. & Lang, P. M. Selectivity and related
measures for nth-order data. Anal. Chem. 68, 15721579 (1996).

118

Você também pode gostar