Escolar Documentos
Profissional Documentos
Cultura Documentos
limite superior (cubo maior) e limite inferior de concentrao dos 3 que so as amostras 2, 26, 27 e 48, podem ser consideradas como
analitos (cubo menor). anmalas (amostras que possuem alguma espcie de comportamen-
A aquisio dos espectros foi realizada em um espectrofotmetro to diferenciado da populao da qual foram extraidas). O grfico da
de infravermelho Nicolet 520 FT-IR, utilizando a tcnica de reflexo primeira componente principal contra a segunda componente prin-
total atenuada (ATR), empregando um acessrio do tipo bote com cipal, mostra que estas amostras possuem valores de escores na se-
um cristal de seleneto de zinco. Os espectros foram obtidos utilizan- gunda componente principal bem superior que as demais amostras.
do 32 leituras por espectro; resoluo de 2 cm-1, regio de aquisio Isso leva a concluir que elas podem no pertencer a mesma popula-
de 4000 a 400 cm-1, em uma cmara purgada com nitrognio. Foi o dos demais sessenta espectros obtidos.
utilizado o ar como espectro de referncia.
Para o desenvolvimento dos modelos de calibrao foram esco-
lhidas 24 amostras para a construo do modelo de calibrao (fase
de calibrao) e 19 amostras para a fase de seleo das variveis
(fase de validao). Os mtodos de inteligncia artificiais como o
algoritmo gentico, exigem o uso de um terceiro grupo de amostras
(conjunto teste) que no tenha sido usado na etapa de seleo das
variveis. Isso porque durante a seleo de variveis o algoritmo
pode selecionar variveis que apresente bons resultados somente para
o caso particular das amostras do conjunto de validao, no poden-
do ser aplicada a outras amostras. Com o uso de um terceiro conjun-
to, composto de 17 amostras nesse caso, este tipo de problema pode
ser detectado.
onde: Oi o valor real Este comportamento, indica que provavelmente haja uma rela-
Oi representa o valor estimado pelo modelo o direta entre os erros de previso dos trs analitos. Isso pode estar
n o nmero de amostras. associado ao fato dos acares possurem estruturas qumicas pare-
cidas. A glicose, maltose e frutose tm espectros no infravermelho
A Figura 7 evidencia que o modelo de calibrao apresentou similares, devido aos modos vibracionais do anel dos acares se-
melhor desempenho para a previso da concentrao de glicose, pois rem os principais responsveis pelo perfil dos espectros36.
50 Costa Filho e Poppi Quim. Nova
Os erros padro de previso para o conjunto de validao foram: resultados obtidos sem o pr-tratamento dos dados e sem a seleo de
0,93 gL-1 para a maltose, 1,06 gL-1 para a glicose e 0,66 gL-1 para a variveis. Neste caso, os erros padro de previso para o conjunto de
frutose. Para o conjunto teste obteve-se os seguintes erros de previ- validao foram 1,03 gL-1 para a maltose, 1,05 gL-1 para a glicose e
so: 1,45 gL-1 para a maltose, 1,26 gL-1 para a glicose e 0,82 gL-1 0,52 gL-1 para a frutose. Para o conjunto teste os erros foram 1,16 gL-
1
para a frutose. para a maltose, 0,86 gL-1 para a glicose e 0,55 gL-1 para a frutose.
Ao comparar os resultados obtidos para o PLS com e sem a sele-
o de variveis, pode-se notar uma melhora significativa na estima-
tiva da concentrao dos acares.
onde:
- SEPAG_XX representa o valor obtido para o erro padro de previ-
so dos modelos que utilizaram o algoritmo gentico para a sele-
o de variveis.
- SEPPadro representa o valor obtido para o erro padro de previso
dos modelos que utilizaram somente o PLS (sem a seleo de
variveis).
- n e j indicam o nmero de amostras utilizadas para calcular
o SEP do conjunto teste, utilizando o algoritmo gentico (AG) e
para o mtodo padro de referncia de calibrao, respectiva-
mente.
A Tabela 1 apresenta os valores do teste F para os modelos de
calibrao dos mnimos quadrados parciais e regresso linear multipla
sem pr-tratamento dos dados. Para este conjunto de dados, com 95
% de confiana, o valor crtico para o teste F 2.27.
Figura 11. Erro relativo para o conjunto teste do modelo de calibrao,
utilizando o algoritmo gentico na seleo de variavis no mtodo dos
Tabela 1. Valores do teste F para os modelos de calibrao sem pr-
mnimos quadrados parciais.
tratamento dos dados.
Modelo Maltose Glicose Frutose
PLS 2.39 1.76 2.83
RLM 4.30 2.00 3.89
ANLISE DOS RESULTADOS OBTIDOS Os resultados obtidos pela regresso linear mltipla com a sele-
o de variveis so semelhantes aos com seleo envolvendo o
Como pode-se observar pelos resultados apresentados, a seleo mtodo dos mnimos quadrados parciais. Tambm pode-se constatar
de nmeros de onda proporciona uma significativa melhora nos re- que os resultados da RLM so similares quando os dados so pr-
sultados dos modelos de calibrao multivariada. Alm disso, pos- processados ou no. Isso mostra que os resultados podem independer
svel constatar que os resultados da regresso linear mltipla apre- da sofisticao do modelo matemtico e portanto, reforando a tese
sentaram desempenho comparvel aos fornecidos pelos modelo de de que modelos mais simples e sem pr-tratamento podem fornecer
os mnimos quadrados parciais com seleo de variveis, evidenci- resultados to bons quando os mais complexos. Contudo, os leitores
ando a viabilidade do uso de um modelo matemtico mais simples mais cticos podem argumetar que o algoritmo genetico por si s
na quantificao da mistura de acares. mais complexo que o PLS, o que no justificaria sua aplicao. En-
Para realizar uma comparao mais rigorosa dos resultados obti- tretanto, necessrio lembrar que a utilizao do algoritmo gentico
dos, pode-se empregar o teste F30. Este procedimento visa mostrar se mais simples e pode ser realizada sem a interveo ou ajuda do
as diferenas obtidas entre os resultados para o conjunto teste dos operador, o que confere uma grande vantagem para ser utilizado
diversos modelos so realmente significativas. Desta forma poss- quando exista pouco, ou nenhum, conhecimento sobre tcnicas
vel avaliar o desempenho de diferentes modelos para um mesmo quimiometricas. Por outro lado, para a utilizao de modelos como
conjunto de dados. o dos mnimos quadrados parciais necesrio um conhecimento
O teste F foi usado da seguinte maneira: mnimo do mtodo.
Na Figura 13 esto indicados os nmeros de onda selecionados
pelo algoritmo gentico para a regresso linear mltipla, quando se
(2) utiliza a primeira derivada dos espectros nos clculos.
52 Costa Filho e Poppi Quim. Nova
REFERNCIAS