Você está na página 1de 99

G E N I L S O N P E R E I R A S A N TA N A

QUIMIOMETRIA COM R

O AU TO R

Copyright 2013 Genilson Pereira Santana


publicado pelo o autor
www.clubedaquimica.com
Nenhuma parte desta publicao pode ser gravada, armazenada em sistema eletrnico, fotocopiada, reproduzida por meios mecnicos em outros quaisquer serm autorizao prvia do autor/editor
Primeira impresso, January 2013

Sumrio

O uso da Quimiometria

Estatstica Bsica
2.1 Mdia

11

21

21

2.2 Desvio Padro


2.3 Mediana

22

26

2.4 Propagao de erros

27

2.4.1

Adio e subtrao

2.4.2

Multiplicao e diviso

27
28

2.5 Arredondamento de dados


2.6 Medidas da Preciso
2.6.1

2.7.1

32

Coeficiente de Variao

2.7 Amostra

32

34

Amostragem

35

2.8 Teste de significncia


2.8.1

Teste de F

40

2.8.2

Teste de t

44

30

40

2.8.3

Teste de t para mltiplas amostras

2.9 Rejeio de resultados


2.10 Boxplot

46

51

54

Calibrao

57

3.1 Comparao com padres

57

3.1.1

Comparao direta

3.1.2

Titulaes

3.1.3

Calibrao com padres externos

3.1.4

Mtodo dos Mnimos Quadrados ou Quadrados Mnimos Ordinrios

58

58

3.2 Curva de calibrao no R


3.2.1

58

61

Usos da curva de calibrao

3.3 Calibrao multivariada

66

76

3.4 Mnimos Quadrados Parciais - PLS

Sinal Analtico

79

4.1 A razo sinal/rudo

79

4.2 Classificao dos tipos de rudos


4.3 Suavizao de rudo instrumental

77

4.3.1

Mdias de sinal

4.3.2

Filtro de Savitzky-Golay

4.3.3

Filtro de transformada de Fourier

Anlise multivariada

80
81

82
83
84

85

5.1 Anlise de componentes principais

85

59

Introduo ao R

87

.1

Informaes gerais

.2

Instalao de R

.3

Iniciando o R

.4

Comandos Bsicos

.5

Entrada de Dados Externos

.6

Gerao e salvamento de grficos

87
88

88
88
88
89

.6.1

Funes relevante para gerar grficos

.6.2

Alguns Parmetros importantes do Grfico

.6.3

Grficos estatsticos

Tabelas

89

91

Referncias Bibliogrficas

ndice Remissivo

99

95

89
89

Luana, Gianluca e Giulia.

Introduo

Este material tem como objetivo ensina as ferramentas de estatstica


usadas no cotidiano da quimica. A princpio o contedo escrito aqui
no abordado sob o ponto de vista estatstico; ou seja, a ao a ser
ensinada aqui da aplicao e no da fundamentao terica. Para
aumentar o seu conhecimento aconselha-se a leitura de materiais
mais elaborados.
Geralmente, a literatura de qumica analtica tem sugerido como
pacote para o tratamento estatstico as planilhas eletrnica, principalmente o Excel. A problemtica do uso de planilhas eletrnicas est
na obteno licencias, que nem sempre o aluno de qumica tem poder
aquisitivo para adquir-la.
Outro problema no uso de planilhas eletrnicas o questionamento dos resultados. Por causa disso, neste material fizemos a opo pelo software R, que alm de ser Open Source, tem suas aplicaes
aumentada significativamente.

1
O uso da Quimiometria

A qumica avanou consideravelmente suas metodologias de


anlises qumicas. At bem pouco tempo atrs a qumica quantitativa
era feita basicamente por titulaes, gravimetrias e fotometrias. A
quantidade de dados obtidos com essas tcnicas eram relativamente
pequenas, consequentemente a forma de tratar os dados estatisticamente se resumia a comparar mdias e varincias. A evoluo da
informtica e dos materiais levaram as anlises qumicas a produzir grandes quantidades de dados. Os equipamentos modernos so
capazes de produzir milhares e milhares de nmeros. Por exemplo,
em volumes menores que 1 mL possvel determinar com o ICPOES a tabela peridica toda, e se for ICP-MS os respectivos istopos
tambm.
Bruce R. Kowalski1 da Universidade de Washington, introduziu na qumica um novo termo, chamado de Quimiometria. Mais
tarde foi criada a Sociedade Internacional de Quimiometria tendo
como principal objetivo estabelecer metodologias para o tratamento
de dados na rea de Qumica. A Quimiometria , portanto, uma disciplina que usa a matemtica e mtodos estatsticos para a obteno
de informaes relevantes de diversas medidas realizadas na rea de
qumica.
A obteno de dados confiveis requer a execuo de um
procedimento experimental bem definido, cujos detalhes so determinados pela finalidade do experimento. Digamos, por exemplo,
que o problema seja descobrir a concentrao de cido actico numa
amostra de vinagre. Isso geralmente feito utilizando a volumetria
de neutralizao tendo como reagentes o hidrxido de sdio e a fenolftalena. Inicialmente, necessrio o uso de um padro primrio
(bifitalato de potssio) para padronizar a soluo de hidrxido de
sdio. Ressalta-se que a confiabilidade da anlise est diretamente
relacionada padronizao do hidrxido de sdio. Outras variveis

Para Kowalsk: "as ferramentas quimiomtricas so veculos que podem


auxiliar os qumicos a se moverem mais
eficientemente na direo do maior
conhecimento"
1

12

quimiometria com r

importantes na anlise do cido actico so as etapas necessrias para


a determinao da concentrao, como pesagens, diluies, titulao
e leituras das medidas.
Naturalmente, os resultados obtidos nunca sero todos
iguais, mas logicamente se o vinagre foi fabricado de acordo com
a legislao vigente (4,00% de cido actico) podemos considerar
o produto como de qualidade.Su- ponhamos que, ao titular duas
amostras de procedncias diferentes, um qumico tenha obtido 3,80
e 4,20% de cido actico, respectivamente. Isso quer dizer que ele
deve aceitar a segunda amostra e rejeitar a primeira por conter menos
cido que o mnimo determinado por lei?
impossvel responder esse questionamento sem ter uma
estimativa da incerteza associada a esses resultados. Por exemplo,
cada uma das operaes de laboratrio necessrias para a titulao
est sujeita a erros, que influenciam diretamente no resultado final.
Uma medida pode ser afetada por diversos fatores, como,
distrao do qumico durante a titulao, vidrarias com escalas que
no condizem com o valor medida (descalibradas), entre outras. Os
erros que acompanham uma medida podem ser classificados em
duas categorias:
1. Erros determinados ou sistemticos - Possuem um valor definido
e, pelo menos em princpio, podem ser medidos (se detectados) e
computados no resultado final.
2. Erros indeterminados - No possuem valor definido, no so
mensurveis e flutuam de um modo aleatrio.
Os erros determinados, por exemplo quando se trabalha
com um indicador inadequado, no observncia da solubilidade dos
precipitados, processo mal executado de co e ps-precipitao, denominado de erro de mtodo. As manipulaes feitas durante a anlise
qumica ocorrem erros, a saber, deixar o bquer destampado permitindo a introduo de poeira na soluo; deixar um lquido contido
em um frasco sob forte aquecimento; entre outras. Neste caso, o qumico est cometendo o chamado erro operacional. A incapacidade do
qumico em executar determinada operao, por problema de inaptido, conhecida como erros pessoais.
Tal erro aparece com a dificuldade, por exemplo, em observar corretamente a mudana de cor de indicadores. Agora, sem
sombras de dvidas, o erro pessoal mais grave o qumico pr-julgar
ou mesmo ter preconceito em relao a anlise qumica. As imperfeies dos instrumentos, aparelhos volumtricos e reagentes outra
fonte importante de erros determinados, sendo conhecida como erros
devidos a instrumentos e reagentes. Classicamente, esto includas o uso

Quais so as maneiras de voc detectar


um erro determinado?
As maneiras de detectar um erro
determinado so:
1. Analisar a amostra conhecida
conforme o Material Padro de
Referncia;
2. Analise a amostra em "branco"que
no contm o analito. Se for observado um resultado diferente de
zero, o mtodo responde a mais do
que o pretendido por voc.
3. Utilize diferentes mtodos analticos
para o mesmo analito. Se os resultados no concordarem, existe erro em
um (ou mais) dos seus mtodos;
4. Arredondamento a partir de uma
srie de experimentos. Analise
amostras idnticas, em diferentes
laboratrios, manipuladas por diferentes mtodos. As discordncias
alm do erro aleatrio esperado so
um erro sistemtico.

o uso da quimiometria

13

de equipamentos no calibrados, as impurezas e uso fora do prazo


de validade dos reagentes.
Evidentemente, nem as anlises qumica e nem a estatstica
trata dos erros determinados. O qumico deve durante sua trajetria
como analsta evitar a todo custo cometer esses erros. Conhecer e entender todos os passos de uma anlise qumica regra fundamental
para o sucesso dos resultados no final do processo. Mesmo assim, a
ausncia de erros determinados no conduz a resultados que sejam
numericamente iguais, sempre haver variaes. Isso consequncia
direta dos chamados erros indeterminados, que no podem ser localizados e nem corrigidos.
natural, por exemplo, que duas titulaes de uma mesma
amostra produzam resultados numricos no idnticos. Como diferenciar os resultados obtidos do determinado para o indeterminado?
A Figura mostra que:
1. Os valores obtidos flutuam, mas tambm tendem a concentrar-se
em torno de um certo valor intermedirio.
2. A flutuao em torno desse valor ocorre aparentemente ao acaso.
Se determinada titulao resultou num valor abaixo da mdia, por
exemplo, isso no permite prever em que direo flutuar o valor
da prxima titulao, nem de quanto ser o seu desvio.
3. A aparncia do grfico sugere que a concentrao da amostra
est mesmo fora da especificao, j que a maioria dos valores
determinados inferior a 4%.

Figura 1.1: Resultados de titulao


feitas na mesma amostra de vinagre.
Fonte: Barros-Neto, Scarminio e Bruns
(1995)

Essas situaes so corriqueiras nas mais variadas determinaes experimentais e indicam que, por mais que se tente controlar

14

quimiometria com r

o processo, algumas fontes de erro sempre terminam permanecendo.


Geralmente, os resultados oscilam para mais ou para menos, tendo
como influncia o acaso. Durante uma determinao um qumico
pode realizar infinitas medidas, o que lhe da condies de ter um
conjunto relativamente grande de valores.
Esses valores, na estatstica so chamados de populao que
qualquer coleo de indivduos, finita ou infinita. Em cada medida
realizada existem erros indeterminados2 e, portanto, o resultado
obtido pura e simplesmente uma probabilidade de ser correto ou
no.
Por causa do grande nmero de medida, uma parte da
populao , normalmente, selecionada com o objetivo de se fazer
inferncias sobre a populao. Essa parte da populao denomina-se
amostra cuja escolha deve ser rigorosamente aleatria, portanto,
no tendenciosa. Esta condio muito importante na prtica, porque as inferncias estatsticas sempre supem que as amostras so
representativas da populao. Por isso, ao realizar um experimento,
devemos sempre tomar cuidado para coletar os dados de modo que a
hiptese de aleatoriadade seja, no rigorosamente, pelo menos aproximadamente obedecida.
A Figura 1.2 mostra um grfico construdo com os resultados obtidos de uma srie de resultados de uma anlise qumica
de soda castica. Nota-se que a concentrao variou de 0,10 a 0,30
mol L1 distribudas em intervalos segundo uma frequncia de ocorrncia de concentrao. No centro do histograma tem-se a maior
frequncia o que significa geralmente que a concentrao da soda
castica mais provvel est entre 0,18 e 0,20 mol L1 .

Espera-se que o analista no tenha


cometido qualquer erro determinado
2

Figura 1.2: Distribuio dos resultados


de uma anlise qumica de NaOH

Esses comportamento mais comum quando se faz me-

o uso da quimiometria

dies de concentrao nas anlises qumicas. O grfico construdo


mostra na realidade uma distribuio dos erros que denominada
gaussiana, sendo mais conhecida como distribuio normal. Quando
o grfico construdo com um nmero infinito de medida no centro
do grfico se localiza o valor verdadeiro, por exemplo, de uma determinada concentrao. Em torno do valor verdadeiro esto os erros.
Matematicamente a distribuio normal pode descrita com a seguinte
equao:
exp{( x }2 /22 }

y=
(1.1)
2
O grfico da distribuio Normal apresentado na Figura
1.3, em que pode ser verificada a simetria a partir . Interessante
afirmar que os resultados das anlises qumicas so influenciados
aleatriamente que produzem valores normalmente distribudos.
Assim, resultados de dois ou mais sries de medidas representam
curvas de normais, contendo cada uma e desvio padro absoluto
; ou seja, existem famlias de distribuies normais. O ponto mais
alto de cada curva de distribuio se concentra a mdia, mediana e a
moda da distribuio. O desvio padro determina a largura da curva;
valores maiores resultam em curvas mais largas e mais planas (maior
variabilidade nos dados).
Figura 1.3: Distribuio normal

Na prtica quem trabalha com tratamento estatstico utiliza


uma estimativa do valor mais provvel de ser o verdadeiro, sendo
conhecida como mdia aritmtica (x). A estimativa do erro, que
indica a disperso das medidas, tambm expressa na forma de
desvio padro (dp).
Exemplo 1.1 Um qumico, usando a potenciometria com ons seletivos, fez
50 medida para a determinao de ons nitratos (g L1 ), cujos resultados
so apresentados na Tabela 1.1. Construa uma tabela de frequncia com os
resultados e estabelea qual o valor mais provvel de ons nitratos presentes
na amostra.

15

16

quimiometria com r

0,51
0,51
0,49
0,51
0,51

0,51
0,52
0,48
0,51
0,50

0,50
0,53
0,46
0,51
0,50

0,51
0,48
0,49
0,48
0,53

0,49
0,49
0,49
0,50
0,52

0,52
0,50
0,48
0,47
0,52

0,53
0,52
0,49
0,50
0,50

0,50
0,49
0,49
0,51
0,50

0,50
0,49
0,51
0,49
0,51

0,47
0,50
0,47
0,48
0,51

Tabela 1.1: Resultados das determinaes de ons nitratos (g L1 )

Ao observamos os valores da Tabela 1.1, nota-se que o menor valor


0,46 e o maior 0,53, variando de 0,01 unidade. Ao contar os valores de
concentrao de nitrato nos intervalos 0,01 unidade obten-se uma frequncia
dos dados, conforme mostrado na Tabela 1.2
Concentra de ons nitratos (g L1 )
0,46
0,47
0,48
0,49
0,50
0,51
0,52
0,53

Frequncia
1
3
5
10
10
13
5
3

Tabela 1.2: Frequncia para a medies


obtidas de ons nitratos

Exerccio 1.1 Construa um histograma para os dados da Tabela 1.3. A


literatura em geral recomenda que o nmero de barras seja aproximadamente
igual raiz quadrada do nmero total de observaes. Como a Tabela tem
20 valores, seu histograma deve ter 4 ou 5 barras. Prefira cinco, que um
nmero mpar, e lhe permitir enxergar melhor possveis simetriais.
Titulao
1
2
3
4
5
6
7
8
9
10

Concentrao (%)
3,91
4,01
3,61
3,83
3,75
3,91
3,82
3,70
3,50
3,77

Titulao
11
12
13
14
15
16
17
18
19
20

Concentrao (%)
3,96
3,85
3,67
3,83
3,77
3,51
3,85
4,04
3,74
3,97

Exemplo 1.2 Como forma de estabelecer uma distribuio dos comportamento das massas de caroos de feijo, faa um grfico de frequncia usando
a Tabela 1.4 no R.

Tabela 1.3: Resultados de 20 titulaes


feitas no mesmo lote de vinagre

o uso da quimiometria

0,1188
0,1795
0,2382
0,2505
0,1810
0,2833
0,2309
0,1746
0,2327
0,2311
0,2459
0,1814
0,2595
0,1848
0,2593
0,2657
0,1399

0,2673 0,1795 0,2369 0,1826 0,1860


0,1910 0,1409 0,1733 0,2146 0,1965
0,2091 0,2660 0,2126 0,2048 0,2058
0,1823 0,1590 0,1722 0,1462 0,1985
0,2126 0,1596 0,2504 0,2285 0,3043
0,2380 0,1930 0,1980 0,1402 0,2060
0,2458 0,1496 0,1865 0,2087 0,2335
0,1677 0,2456 0,1828 0,1663 0,1971
0,2137 0,1793 0,2424 o,2012 0,1968
0,1902 0,1970 0,1644 0,1935 0,1421
0,2098 0,1817 0,1736 0,2296 0,2200
0,1340 0,2051 0,2455 0,2008 0,1740
0,1470 0,2670 0,1701 0,2055 0,2215
0,2184 0,2254 0,1573 0,1696 0,1463
0,1799 0,2585 0,2153 0,2365 0,1629
0,2666 0,2535 0,1874 0,1869 0,2266
0,2790 0,1988 0,1904 0,1911 0,2186
Fonte:Barros-Neto, Scarminio e Bruns (2003)

0,2045
0,2326
0,1666
0,1769
0,1683
0,2097
0,2173
0,2341
0,2433
0,1202
0,2025
0,2089
0,2080
0,1917
0,1875
0,2143
0,1606

Vamos inicialmente entra com os dados no R


>feijao<-c(0.1188, 0.2673, 0.1795, 0.2369, 0.1826, 0.1860, 0.2045,
0.1795, 0.1910, 0.1409, 0.1733, 0.2146, 0.1965, 0.2326, 0.2382, 0.2091,
0.2660, 0.2126, 0.2048, 0.2058, 0.1666, 0.2505, 0.1823, 0.1590, 0.1722,
0.1462, 0.1985, 0.1769, 0.1810, 0.2126, 0.1596, 0.2504, 0.2285, 0.3043,
0.1683, 0.2833, 0.2380, 0.1930, 0.1980, 0.1402, 0.2060, 0.2097, 0.2309,
0.2458, 0.1496, 0.1865, 0.2087, 0.2335, 0.2173, 0.1746, 0.1677, 0.2456,
0.1828, 0.1663, 0.1971, 0.2341, 0.2327, 0.2137, 0.1793, 0.2424, 0.2012,
0.1968, 0.2433, 0.2311, 0.1902, 0.1970, 0.1644, 0.1935, 0.1421, 0.1202,
0.2459, 0.2098, 0.1817, 0.1736, 0.2296, 0.2200, 0.2025, 0.1814, 0.1340,
0.2051, 0.2455, 0.2008, 0.1740, 0.2089, 0.2595, 0.1470, 0.2670, 0.1701,
0.2055, 0.2215, 0.2080, 0.1848, 0.2184, 0.2254, 0.1573, 0.1696, 0.1463,
0.1917, 0.2593, 0.1799, 0.2585, 0.2153, 0.2365, 0.1629, 0.1875, 0.2657,
0.2666, 0.2535, 0.1874, 0.1869, 0.2266, 0.2143, 0.1399, 0.2790, 0.1988,
0.1904, 0.1911, 0.2186, 0.1606)
Digite
> hist(feijao,main=,xlab="massa de feijo (g)",ylab="Frequncia")
em que feijao so os dados, main ttulo do grfico, xlab e ylab so as
legendas dos eixos x e y, respectivamente. O resultado o grfico mostrado
na Figura 1.4
Na prtica ao invs de usar a distribuio normal na maioria
dos resultados analticos utilza-se a distribuio de t de Student, que
uma famlia de distribuies de probabilidade contnuas usadas

17

Tabela 1.4: Pesos de caroos de feijo


extrados aleatoriamente de um pacote
de 1 kg de feijo preto (g)

18

quimiometria com r

Figura 1.4: Distribuio de frequncia


relativa massa de feijo

para estimar o de uma distribuio normal. A grande vantagem


dessa distribuio o pequeno tamanho da amostra usado para encontrar a mdia, alm de no precisar do desvio padro, geralmente
desconhecido. Ela desempenha papel em vrias anlises estatsticas,
incluindo a avaliao da significncia estatstica entre duas amostras
meios, na construo de intervalos de confiana entre duas mdias da
populao, e em linear anlise de regresso.
A distribuio de t uma distribuio de probabilidade
terica. simtrica, campaniforme, e semelhante curva normal
padro, porm com caudas mais largas, ou seja, uma simulao da t
de Student pode gerar valores mais extremos que uma simulao da
distribuio normal. O nico parmetro que a define e caracteriza a
sua forma o nmero de graus de liberdade. Quanto maior for esse
parmetro, mais prxima da normal ela ser. A Figura 1.5 mostra
uma comparao entre a curva da distribuio normal e de t. Nota-se
que para um grau de liberdade de 5 as duas curvas so praticamente
iguais. A semelhana de comportamento tornam a distribuio de t
muito utilizada na estatstica.

Exerccio 1.2 Utilize o R para verificar se as medidas de volumes de uma


bureta, apresentadas na Tabela, abaixo sequem a distribuio normal.

o uso da quimiometria

19

Figura 1.5: Comparao da distribuio


normal com t

9,988
9,990
9,980
9,991
9,988
9,983

9,973
9,980
9,994
9,981
9,971
9,980

9,986
9,989
9,992
9,969
9,986
9,984

9,980
9,978
9,984
9,985
9,978
9,979

9,975
9,971
9,981
9,977
9,986

9,982
9,982
9,987
9,976
9,982

9,986
9,983
9,978
9,983
9,977

9,982
9,988
9,983
9,976
9,986

9,981
9,975
9,982
9,990
9,978

Exerccio 1.3 Um qumico estava com dvidas se a massa de aproximadamente 3,000 g de uma moeda correspondia ao valor mais provvel de uma
moeda. A importncia dessa informao est no aumento ou na reduo do
erro de uma medida. Use a tabela abaixo para estabelecer qual provvel
massa da moeda.

3,126
3,053
3,055
3,116
3,181
3,101
3,084
3,091
3,066
3,113

3,140
3,099
3,105
3,005
3,108
3,049
3,104
3,077
3,113
3,085

3,092
3,065
3,065
3,115
3,114
3,082
3,093
3,178
3,102
3,117

3,095
3,059
3,083
3,103
3,121
3,142
3,126
3,054
3,033
3,142

3,080
3,068
3,065
3,086
3,105
3,082
3,138
3,086
3,112
3,031

3,065
3,060
3,073
3,103
3,078
3,066
3,131
3,123
3,103
3,083

3,117
3,078
3,084
3,049
3,147
3,128
3,120
3,115
3,126
3,104

3,034
3,125
3,148
2,998
3,104
3,112
3,100
3,055
3,111

3,126
3,090
3,047
3,063
3,146
3,085
3,099
3,057
3,126

Exerccio 1.4 Um levantamento de trs meses dos resultados das anlises


de densidade (kg m3 num p de polmero foi realizado como forma de saber
qual era o comportamento dos resultados. Faa um grfico de distribuio
para verificar o comportamento da densidade.

3,057
3,100
3,121
3,055
3,095
3,086
3,097
3,097
3,052

20

quimiometria com r

328
332
335
338
340
339
328

338
337
335
334
337
330
319

334
336
353
340
345
328
336

330
333
338
323
332
349
327

335
331
320
340
348
337
328

330
337
331
331
332
340
339

335
316
331
353
342
348
333

342
338
334
333
343
332
338

339
335
343
335
336
338
332

331
332
342
335
335
340
332

328
335
352
338
334
336

339
339
329
335
332
334

Exerccio 1.5 Uma soluo padro estava sendo usada como referncia de
um mtodo antigo do laboratrio. O qumico anotou as 60 ltimas determinaes para avaliao. Como os dados construa um histograma.
21,0
20,0
17,0
17,7
22,9

16,5
18,2
24,7
20,5
21,6

18,7
22,2
20,3
19,5
21,8

24,5
21,1
17,4
20,9
23,0

16,0
20,2
20,5
21,5
18,9

21,2
23,4
21,5
19,8
24,0

25,4
19,2
22,5
16,2
22,5

20,2
16,5
14,5
19,5
20,8

14,0
19,0
20,8
20,0
23,8

26,0
19,7
21,2
18,2
19,5

19,4
22,9
20,8
18,5
20,5

17,8
18,9
22,3
21,7
22,7

2
Estatstica Bsica
2.1

Mdia

Por definio mdia ou mdia aritmtica como a soma de


todos os valores dos elementos dividido pelo nmero de variveis.
Geralmente, a mdia uma medida de posio central, e as variveis
se distribuem simetriacamente ao seu redor.
Por ser uma das medidas mais teis e seguras, a mdia o
resultado mais usados na estatstica para fazer inferncias. Um dos
seus maiores problemas o falseamento do resultado final por causa
da desproporcionalidade observada entre as medidas. Assim, haver
um valor de mdia muito alto ou baixo o que leva a interpretaes
erradas.
A mdia aritmtica calculada da seguinte forma:
x =

x1 + x2 + . . . + x n
n x
= i =1 i
N
N

O porqu da utilizao de triplicatas


nas aulas de qumica analtica?
Esse procedimento est relacionado
com a estimativa da concentrao da
amostra no analito. No n = 3, o intervalo de confiana do valor mdio est
no limite crtico da distribuio de t de
Student com N-1 graus de liberdade.
Aumentando o valor de N, o intervalo
de confiana ir diminuir por causa
da
reduo do valor de t1 e do fator
1/ N. A anlise qumica em triplicata
representa um melhoramento considervel da preciso de t2 = 12,71 para t3
= 3,04. No caso de uma qadruplicata
observa-se que a preciso permanece
praticamente a mesma (Figura 2.1).

(2.1)

Figura 2.1: Grfico de 1/ N em funo


do nmero de rplicas N, ilustrando
como a preciso diminui quando se
aumenta o nmero de rplicas. Fonte:
Passari, Soares e Bruns (2011)

22

quimiometria com r

Exemplo 2.1 Os valores de cinzas em g g1 de uma amostra foram: 100,


120, 115, 110 e 115. Calcule a mdia dos resultados obtidos, Depois use o R
para calcular a mdia.
x =

100 + 120 + 115 + 110 + 115


in=1 xi
=
N
5

170
= 114 g g1
5
Usando o R
Primeiramente entre com o conjunto de dados:
> x<-c(100,120,115,110,115)
Bastar digitar:
> mean(x)
No R o resultado ser apresentado da seguinte forma:
[1] 114
x =

Exerccio 2.1 Cinco amostras de solo foram pesadas antes da anlise. As


massas registradas so as seguintes: 23,67, 34,53, 31,56, 26,34 e 42,19 g.
Calcule a mdia para a massa dessas cinco amostras.
Exerccio 2.2 Um estudante de qumica realizou como parte de seu trabalho
de concluso de curso seis anlises de ferro por espectrometria de absoro
atmica de gua de um poo artesiano. Sabendo que os resultados foram
19,4, 19,5; 19,6, 19,8, 20,1 e 20,3 g L1 , calcule a mdia destes valores.

2.2

Desvio Padro

A mdia sempre acompanhada por uma diferena entre os


valores medidos, cujo nome desvio; ou seja
n

desvio =

xi x

(2.2)

i =1

A diferena ( xi x ) utilizada para calcular a medida de


disperso em relao a mdia, sendo mais conhecida como desvio
padro (dp). A disperso mostra o distanciamento que ocorre entre o
valor verdadeiro e o valor medido, estabelecendo nesse sentido uma
grandeza denominada de Erro Absoluto:
E = x xv

(2.3)

em que E o erro absoluto, x o valor medido e xv o valor verdadeiro.


Essa grandeza pode ser utilizada para calcular, por exemplo,
em termos relativos o erro cometido por um analista durante a determinao de uma concentrao qualquer, sendo expressa da seguinte
forma:
E
Er =
(2.4)
xv

O que exatido e preciso?


A exatido a proximidade de um
valor medido em relao ao valor verdadeiro ou aceito.A preciso descreve
a reprodubilidade dos resultados; ou
seja, quo prximas as medidas se encontram umas das outras. Geralmente,
a preciso considerada a disperso de
um conjunto de medidas ou leituras.

estatstica bsica

23

Exemplo 2.2 O resultado de uma anlise de cloro foi de 32,90%, entretanto o valor verdadeiro deveria ser de 33,30%. Determine o erro absoluto e
relativo cometido pelo analista ao efetuar essa anlise qumica.
1. O erro absoluto cometido pelo analista pode ser calculado da seguinte
forma:
E = x xv = 32, 90 33, 3 = 0, 40%
2. De posse do valor do erro absoluto podemos calcular o erro relativo. Para
isso devemos utilizar a seguinte equao:
Er =

0, 40
100 = 1, 2%
33, 30

Exerccio 2.3 Calcule o erro relativo em percentagem para a anlise de uma


amostra de gua extrada de um rio, cujo valor registrado de 15,7 mgL1
de Cu, quando o valor verdadeiro de fato 18,0 mgL1 .

O que erro relativo?


O erro relativo de uma medida
o erro absoluto dividido pelo valor
verdadeiro, podendo expressos em
percentagem, partes por mil ou partes
por milho.

Exerccio 2.4 Uma titulao cido-base indicou que a concentrao de


uma soluo de HCl de 0,104 molL1 em vez de 0,110 mol L1 (valor
verdadeiro). Expresse o erro relativo dessa anlise qumica.
Exerccio 2.5 Calcule os erros relativos para os seguintes resultados

a
b
c
d

Valor medido
22,62 g
45,02 mL
2,68%
85,6 cm

Valor aceito
22,57 g
45,31 mL
2,71%
85,0 cm

Devemos chamar a ateno para os valores negativos encontrados nos dois erros, cuja explicao se dar em virtude da tcnica
utilizada pelo analista que no foi suficiente para alcanar o valor
verdadeiro. A Figura 2.2 representa muito bem o que ocorre geralmente em uma anlise qumica, que a distncia observada entre o
valor encontrado e o verdadeiro. Evidentemente que todo qumico
analtico que chegar o mais prximo possvel do valor verdadeiro, da
o termo exatido.
Figura 2.2: Variao do erro em relao
ao valor verdadeiro

24

quimiometria com r

Como em qumica analtica geralmente a quantidade de dados


obtidas nas anlises qumicas baixo, o dp calculado por sua estimativa:
s
in=1 ( xi x )2
dp =
(2.5)
n1
Exemplo 2.3 Determine o valor de desvio padro usando o R para o conjunto de dados do Exemplo 2.1.
Usando o R
Primeiramente entre com o conjunto de dados:
> x<-c(100,120,115,110,115)
Bastar digitar:
> sd(x)
No R o resultado ser apresentado da seguinte forma:
[1] 9.354143
Exerccio 2.6 Para a realizao da anlise qumica do sdio em gua mineral um qumico utilizou a fotometria de chama. Ele gostaria de saber qual
o desvio padro do conjunto de dados obtido pelo qumico: 19,4, 20,6, 18,7,
19,2, 21,6, 18,9 e 19,9. Utilize o R para calcular o desvio padro.
Exerccio 2.7 Uma amostra de gua foi coletada em um igarap contaminado para a determinao de Cd.Todos os valores encontrados esto acima
da resoluo estabelecida pelo CONAMA e o qumico precisa apresentar os
resultados ao orgo ambiental. Uma das maneira apresentar os resultados
na forma de mdia e desvio padro. Com os seus resultados calcule os dois
parmetros utilizando o R. Resultados encontrados em mgL1 : 20,2, 18,5,
21,4, 19,2, 21,8 e 18,8.
Exerccio 2.8 Seis garrafas de vinho da mesma variedade foram analisadas
para se determinar o contedo de aucar residual, os resultados so apresentados na Tabela 2.1
Garrafa
1
2
3
4
5
6

Aucar residual (mv1 )


0,99 0,84 1,02
1,02 1,13 1,17 1,02
1,25 1,32 1,13 1,20 1,12
0,72 0,77 0,61 0,58
0,90 0,92 0,73
0,70 0,88 0,72 0,73

1. Avalie o desvio padro para cada conjunto de dados


2. Combine os dados para obter um desvio padro absoluto para o mtodo

Tabela 2.1: Resultados da anlise de


aucar residual das seis garrafas de
vinho

estatstica bsica

25

Exerccio 2.9 Uma amostra padro de sdio de 42,0 g L1 foi distribuda


para cinco laboratrios diferentes. Depois de feitas as anlises de sdio os
cinco laboratrio forneceram os seguintes resultados:
A 42,5 41,6 42,1 41,9 41,1 42,2
B 39,8 43,6 42,1 40,1 43,9 41,9
C 43,5 42,8 43,8 43,1 42,7 43,3
D 35,0 43,0 37,1 40,5 36,8 42,2
E 42,2 41,6 42,0 41,8 42,6 39,0
Calcule a mdia e o desvio padro. Com os resultados obtidos faa um
comentrio a respeito da preciso e exatido dos laboratrios.
Exerccio 2.10 Um analista utilizou uma bureta automtica para realizar
uma srie de titulaes, obtendo os seguintes valores em mL: 10,002, 9,993,
9,984, 9,996, 9,989, 9,983, 9,991, 9,990, 9,988 e 9,999. Utilize o R para
calcular o erro absoluto (Dado o volume terico das titulaes 10,000 mL) e
o erro relativo.
Exerccio 2.11 A Tabela 2.2 mostra uma srie de resultados de volumes
gastos na titulao e comentrios a respeito da preciso e exatido do mtodo.
Sabendo que o volume terico para a titulao utilize o R para para calcular
a mdia e o desvio padro e confirme se os comentrios esto corretos ou no.
Estudante

resultado (mL)
10,08
10,11
10,09
10,10
10,12
9,88
10,14
10,02
9,80
10,21
10,19
9,79
9,69
10,05
9,78
10,04
9,98
10,02
9,97
10,04

Comentrio

Preciso e inexato

Exato e impreciso

Inexato e impreciso

Exato e preciso

Tabela 2.2: valores obtidos por quatro


estudantes de titulaes realizadas em
sala de aula

26

2.3

quimiometria com r

Mediana

A mediana uma medida de tendncia central, um nmero


que caracteriza as observaes de um grupo de dados ordenados
separa a metade inferior da amostra, populao ou distribuio de
probabilidade, da metade superior. Dessa forma, 1/2 da populao
ter valores inferiores ou iguais mediana e 1/2 da populaao ter
valores superiores ou iguais mediana.
No caso de dados ordenados de amostras de tamanho n, se
for mpar, a mediana ser o elemento central (EC)
EC =

( n + 1)
2

(2.6)

Se n for par, a mediana ser o resultado da mdia simples entre os


elementos
n n
e + 1.
(2.7)
2 2
Exemplo 2.4 Calcule a mediana para o seguinte conjunto de resultados de
uma anlise qumica de uma amostra de calcrio:1,0, 3,0, 5,0, 7,0 e 9,0%.
Como a sequncia um nmero impar, a posio central ser
n+1
5+1
=
=3
2
2
Logo, a mediana o terceiro elemento que 5.
Usando o R
Primeiramente entre com o conjunto de dados:
> x<-c(1,3,5,7,9)
Bastar digitar:
> median(x)
No R o resultado ser apresentado da seguinte forma:
[1] 5
Exerccio 2.12 Determine a mediana para o seguinte conjunto de anlises
qumicas realizadas para o Pb2+ : 20,1, 19,5, 20,3, 19,7, 20,0, 19,4, e 19,6.
Exemplo 2.5 Um analista aps analisar amostras de guas por espectrometria de absoro atmica encontrou os seguintes valores para a concentrao
de ferro: 1,0, 2,0, 4,0, 8,0, 9,0, 10,0 mg L1 . Determine a mediana para
esses resultados.
Como os resultados formam um conjunto par, portanto, no existe um
elemento central. Neste caso, a mediana ser calculada com os dois valores
centrais (o terceiro e o quarto valores). Assim
mediana =

4+8
=6
2

estatstica bsica

Usando o R
Primeiramente entre com o conjunto de dados:
> x<-c(1,2,4,8,9,10)
Bastar digitar:
> median(x)
No R o resultado ser apresentado da seguinte forma:
[1] 6
Exerccio 2.13 O qumico que realizou o Pb2+ do exercicios 2.12 esqueceu
de colocar um resultado. Calcule a mediana para o novo conjunto de dados:
20,1, 19,5, 20,3, 19,7, 20,0, 19,4, 19,6 e 19,9.
Exerccio 2.14 As medida da concentrao de potssio em mg L1 uma
amostra foram 10,4, 10,4, 10,6, 10,3, 10,5 e 10,6. Calcule a mdia, mediana
e desvio padro para essa srie de resultados.
Exerccio 2.15 Para investigar a reprodubilidade de um mtodo para a determinao de selnio em arroz, um analista executou uma srie de anlises
qumicas, cujos resultados foram:
Amostra Conc. de selnio (g g1 )
1
0,07
2
0,07
3
0,08
4
0,07
5
0,07
6
0,08
7
0,08
8
0,09
9
0,08
Fonte: Moreno-Domngues, Garca-Moreno e Marin-Font (1983)
Calcule a mdia, mediana e desvio padro dos resultados obtidos

2.4

Propagao de erros

A partir do conhecimento da incerteza dos equipamentos utilizados durante uma anlise qumica pode-se estimar a incerteza
final em uma medida. Os erros em nmeros individuais ir se propagar por uma srie de clculos, que depende diretamente do tipo de
operao realizada:adio, subtraes, multiplicao ou diviso.

2.4.1

Adio e subtrao

Considere a adio e subtrao da seguinte sequncia de nmeros:

(65, 00 0, 07) + (16, 13 0, 01) (22, 68 0, 02) = 58, 51(?)

27

28

quimiometria com r

A incerteza absoluta1 na adio e subtrao aditiva, ser


necessrio representada pelos desvios padro representa erros indeterminados associados com cada nmero. Se esses desvios fossem
somados, ento a incerteza final poderia ser 0, 10. No entanto, a
incerteza no aditiva, sendo necessrio levar em conta a varincia
absoluta (s2a ):
s2a = s2b + s2c + s2d
(2.8)
q
s a = s2b + s2c + s2d
(2.9)

Valor mximo dos desvios de uma


medida em relao mdia
1

No caso do exemplo acima tem-se


q
s a = (0, 07)2 + (0, 01)2 + (0, 02)2 = 7, 3x102
Exemplo 2.6 Um aluno est em dvida para expressar o resultado de uma
anlise qumica. A anlise de fsforo (mg L1 ) teve os seguintes resultados 3, 978 0, 004, 2, 536 0, 003 e 3, 680 0, 003. Como o aluno deve
expressar os seus dados?
A mdia dos dados pode ser calculada da seguinte forma:

(3, 978 0, 004%) + (2, 536 0, 003%) + (3, 680 0, 003%)


3
A incerteza na soma
q
s a = (0, 004) + (0, 003) + (0, 003) = 0, 006 mg L1
x =

A mdia pode ser calculada da seguinte forma


x =

3, 978 + 2, 536 + 3, 680


= 3, 398
3

Portanto, o resultado final ser


x = 3, 398 0, 006 mg L1

2.4.2 Multiplicao e diviso


Considere a seguinte operao de um clculo arbitrrio realizado durante uma anlise qumica

(13, 67 0, 02)(120, 4 0, 2)
= 356, 0(?)
4, 623 0, 006
Neste caso, as incertezas relativas2 so aditivas, sendo que
o erro mais provvel representado pelo quadrado das somas das
varincias relativas:
q
(s a )rel = (s2b )rel + (s2c )rel + (s2d )rel
(2.10)
O clculo da incerteza relativa dos dados acima feito da seguinte
forma:
0, 02
(sb )rel =
= 0, 0015
13, 67

Valor do quociente entre a incerteza


absoluta e o valor mais provvel da
medida. A incerteza relativa exprime-se
por vezes em termos de percentagem e
define ento a chamada percentagem de
erro, ou incerteza percentual
2

estatstica bsica

0, 2
= 0, 0017
120, 4
0, 006
=
= 0, 0013
4, 623

(sc )rel =
(sd )rel
(s a )rel =

(0, 0015)2 + (0, 0017)2 + (0, 0013)2 = 2, 6x103

A incerteza absoluta ser


s a = 356, 0x (2, 6x103 ) = 0, 93
A expresso correta do resultado ser 356, 0 0, 9
Exemplo 2.7 Calcule a incerteza no nmero de milimols de cloreto contido
em 250 mL. Para isso, o qumico utilizou-se de trs alquotas iguais de
25,00 mL para a titulao com nitrato de prata. Os resultados das titulaes
foram 36,78, 36,82 e 36,75 mL. A concentrao do nitrato utilizado era
0, 1167 0, 0002 mol L1 .
Para a expressar o resultado corretamento necessrio primeiramente
calcular a mdia e desvio padro dos volumes obtidos na titulao.
Usando o R
Primeiramente entre com o conjunto de dados:
> x<-c(36,78,36,82,36,75)
Para o clculo da mdia bastar digitar:
> mean(x)
No R o resultado ser apresentado da seguinte forma:
[1] 36.78333
O clculo do desvio padro
> sd(x)
No R o resultado ser apresentado da seguinte forma:
[1] 0.03511885
Neste ponto, o resultado seria expresso da seguinte forma:
mmmol Cl = (0, 1167 0, 0002 mmol mL1 )(36, 78 0, 04 mL) = 4, 292(?)
No entanto, necessrio calcular as incertezas relativas

(sb )rel =
(sc )rel =
(s a )rel =

0, 0002
= 0, 0017
0, 1167

0, 035
= 0, 00095
36, 78

(0, 0017)2 + (0, 00095)2 = 1, 9x103

Agora temos condies de calcular a incerteza absoluta em milimols de


Cl
4, 292x (0, 0019) = 0, 0082 mmol

29

30

quimiometria com r

mmol de Cl em 25 mL = 4,292 0,0082 mmol


Para 250 mL tem-se mmol Cl = 10(4,292 0,0082)= 42,92 0,08
mmol
Exerccio 2.16 Calcule a incerteza das seguintes somas:
1. (1282)+(10258)-(6364)
2. (16,250,06)-(9,430,03)
3. (46,10,4)+(9351)
Exerccio 2.17 Calcule a incerteza das seguintes equaes:
1. (2,780,04)(0,0005060,000006)
2. (36,20,4)/(27,10,6)
3. (50,230,07)(27,860,05)/(0,11670,0003)
Exerccio 2.18 Calcule a incerteza da seguinte equao: [(25,00,1)(0,02150,0003)(1,020,01)(0,1120,001)](17,00,2)/(5,870,01)

2.5 Arredondamento de dados


especialmente importante postergar o arredondamento at
que o clculo seja completado. Pelos menos um dgito extra, depois dos algarismos significativos, deve ser mantido durante todos
os clculos de maneira que se evitem os erros no arredondamento.
Algumas vezes esse dgito extra chamado dgito "guarda". As calculadoras modernas geralmente mantm vrios dgitos extras que no
so significativos e o usurio precisa ser cuidadoso no arredondamento apropriado de resultados finais para que apenas os algarismos
significativos sejam includos.
Exemplo 2.8 Uma amostra de 3,4842 g de uma mistura slida contendo
cido benzcio (HBz), C6 H5 COOH (122,123 g mol 1 ) foi dissolvida e
titulada com base em bureta de vidro at o ponto final na presena de fenolftalena. O cido consumiu 41,36 mL de NaOH 0,2328 mol L1 . Calcule a
porcentagem de HBz na amostra.
A reao do HBz com o NaOH 1:1, ento
N o mol milimol HBz = N o mol milimol NaoH
N o mol milimol HBz = 41, 36.0, 2328 = 9, 628608 milimol
Em termos de massa de HBz temos
massa de HBz =

N o milimol HBz.122, 123 g


1.000 milimol

estatstica bsica

massa de HBz =

9, 628608.122, 123
= 1, 17587449478
1.000

Agora temos condies de calcular a % de HBz


% de HBz =

1, 17587449478
.100 = 33, 74877657075
3, 4842

Neste caso, para expressar o resultado obtido deve ser feito um


arredondamento. Para que seja feito, o arredondamento deve obedecer alguns princpios, como a preciso do equipamento utilizado,
operaes matemticas necessrias para encontrar o resultado final.
Vejamos o valor de % encontrado para HBz de 33,74877657075 um
valor alto para as quatro casas decimais da balana usada para pesa
a amostra e muito maior que a bureta usada para realizar a titulao
(0, 02mL). Ao verificar as incertezas nesse processo verifica-se:
1. A posio do nvel de lquido na bureta estimada como 0, 02 mL.
No entanto, as leituras inciais e finais precisam ser feitas, assim, o
dp do volume pode ser calculado levando em conta a propagao
de erro:
p
dp = 0, 022 + 0, 022 = 0, 028 mL
(2.11)
A incerteza relativa no volume ser:
dp
0, 028
=
100 = 0, 068%
V ( gasto na bureta)
41, 36
2. Geralmente a incerteza absoluta para uma massa obtida em uma
balana analtica ser da ordem de 0,0001 g (s D ). Dessa forma, a
incerteza relativa no caso da balana ser
sD
0, 0001
=
100 = 0, 0029%
massa pesada
3, 4842
3. A incerteza absoluta associada com a concentrao molar de uma
soluo de um reagente 0, 0001 mol L1 (s M ) e assim a incerterza relativa na concentrao molar do NaOH ser
sM
0, 0001
=
100 = 0, 043 %
Conc.
0, 2328
4. A incerteza relativa na massa molar do HBz vrias ordens de
grandeza menor que qualquer incerteza associada com os trs
dados experimentais e, portanto, sem consequncia. Observe,
contudo, que devemos manter dgitos suficientes no clculo para
que a massa molar seja dada, pelo menos, com um dgito a mais (o
dgito guarda) que qualquer um dos dados experimentais. Assim,
122,123 no clculo da massa molar (estamos mantendo dois dgitos
extras).

31

32

quimiometria com r

5. Para estabelecer a incerteza do valor de concentrao molar do


NaOH (s f ), temos que levar em contar as trs incertezas relativas
sf
=
medida

0, 028
41, 36

2

0, 0001
3, 4842

2

0, 0001
0, 2328

2

sf
= 8, 02x104
medida
s f = 8, 02x104 .medida = 8, 02x104 .33, 74877657075 = 0, 0270757998961
Assim, a incerteza no resultado calculado 0,027% de HBz e
devemos relatar o resultado como 33,75(0, 03)% de HBz.
Os valores de mdia e desvio padro encontrados nos exemplos 2.1 e 2.3 so usados geralmente paraa expressar os resultados de
uma anlise qumica. Assim, o teor de cinzas geralmente expresso
da seguinte forma 114 9 g g1 .

2.6

Medidas da Preciso

Os qumicos usam o desvio padro da amostra para relatar a


preciso dos seus dados. Muitas vezes so encontrados outros trs
termos nos trabalhos analtico.

2.6.1 Coeficiente de Variao


O coeficiente de variao (tambm conhecido como erro relativo) uma medida relativa de variabilidade, sendo usada para
expressar a relao percentual do desvio padro com a mdia dos
valores obtidos. O CV, como conhecido o coeficiente de variao,
expresso da seguinte forma:
CV =

dp.100%
x

(2.12)

O CV uma varivel que pode ser usada para avaliar a


qualidade de laboratrios e mtodos. Por exemplo, Horwitz (1982)
realizou um estudo com resultados de 150 laboratrios estabeleceu o
CV aceitvel para mtodos (Figura 2.3). Nota-se que o CV aumenta
medida que a quantidade a ser medida diminui; ou seja, quanto
maior a capacidade de medida mais alta a variao dos erros. No
estudo tambm ficou proposta uma equao para encontrar o CV em
funo da concentrao (C em massa analito/massa amostra):
CV (%) 2(10,5logC)

(2.13)

estatstica bsica

33

Figura 2.3: Coeficiente de variao com


funo da concentrao da amostra.
Fonte: Horwitz (1982)

Exemplo 2.9 Um qumico para avaliar um novo mtodo analtico, preparou


uma soluo conhecida de clcio de 50 mg L1 . Esta soluo foi analisada
seis vezes por absoro atmica, sendo obtido os seguintes resultados em mg
L1 : 48,2,51,0, 46,6, 51,5, 43,8 e 46,9. Diante desses resultados calcule a
mdia, desvio padro e CV usando o R.
Usando o R
Primeiramente entre com o conjunto de dados:
> x<-c(48.2,51.0,46.6,51.5, 43.8,46.9)
Para calcular a mdia bastar digitar:
> mean(x)
No R o resultado ser:
[1] 48
Para calcular o dp
> sd(x)
O resultado ser:
[1] 2.901724
Para calcular o CV
> sd(x)/mean(x)*100
O resultado ser:
[1] 6.045258
Exerccio 2.19 O estanho e o zinco contidos em uma solda foram analisados
por espectrometria de absoro atmica. a) Sn: 0,022, 0,025 e 0,026% e b)
Zn: 33,27, 33,37 e 33,34%. Utilizando o R calcule

Como interpretar o CV?


Quando o CV for inferior a 10%
dizemos que o experimento apresentou
uma tima preciso experimental;
quando variar de 10 a 15% dizemos
que o experimento apresentou boa
preciso experimental; quando estiver
no intervalo > 15% 20% dizemos que
o experimento apresentou uma preciso
experimental regular ou aceitvel;
quando estiver no intervalo > 20%
30% dizemos que o experimento
apresentou uma pssima preciso
experimental e quando for superior
a 30% dizemos que o experimento
apresentou uma preciso experimental
muito pssima.

34

quimiometria com r

1. Mdia
2. Desvio padro
3. CV
Exerccio 2.20 Os resultados das anlises qumicas de uma liga de prata
apresentaram os seguintes percentuais: 95,67, 95,61, 95,71 e 95,60% de Ag.
Utilizando o R calcule
1. Mdia
2. Desvio padro
3. CV
Exerccio 2.21 Uma srie de medidas da quantidade de etanol em um
efluente tratado resultou nos seguintes dados em %: 0,77, 0,67, 0,71, 0,90 e
0,78. Calcule o coeficiente de variao desses resultados.
Exerccio 2.22 As precentagens de um constituinte A num composto AB
forma determinadas encontrando-se 48,32, 48,36, 48,23, 48,11 e 48,38%.
Calcule a mdia, desvio-padro e CV para esse resultados.
Exerccio 2.23 Calcule o coeficiente de variao para as seguintes medidas
de ferro (mgL1 ) feita em amostra de gua contaminada:34,6, 29,5, 32,2,
33,7, 34,6, 32,4 e 35,1.
Exerccio 2.24 Os resultados apresentados na Tabela 2.3 so referente a
dois mtodos usados para determinar a quantidade de clcio no sanque. O
primeiro foi por espectrometria de absoro atmica e o segundo por colorimetria. Calcule no R o CV de cada mtodo e discuta os resultados.
AAS (mg L1 )
10,9
10,1
10,6
11,2
9,7
10,0

2.7

Colorimetria (mg L1 )
9,2
10,5
9,7
11,5
11,6
9,3
10,1
11,2

Tabela 2.3: Resultados analticos de dois


mtodos usados para determinar clcio
no sangue

Amostra

Antes de definir o conceito de amostra devemos saber antes o


que seja populao. Populao o conjunto de todos os elementos3

Unidade considerada para um estudo,


por exemplo, um objeto, um individuo,
uma quantidade de matria
3

estatstica bsica

existentes ou que sero obtidos em um processo qualquer ou que


se deseja estudar sob certas condies. Exemplos: um lote de peas,
habitantes do Estado do Amazonas, guas de um igarap, etc.
Ao conjunto representativo de todos os elementos extrados
de uma populao aleatoriamente chamado de amostra. Exemplos:
uma amostra retirada de um lote de comprimidos, uma amostra de
rotina durante o processo de um lote de latas de alumnio, etc.
O nmero de elementos (ou quantidade) existente na amostra, geralmente indicado pela letra n. Quando realizamos um estudo estatstico devemos considerar o nmero de amostras. O nmero ideal de anlises ou de medidas (n ou k) sobre uma amostra,
para realizar um estudo estatstico, algo que deve ser determinado
em comum acordo entre o grupo de trabalho do laboratrio e deve
estar de acordo com a caracterstica da anlise, quantidade de amostra, dificuldade analtica e equipamentos disponveis e confiaveis.

2.7.1 Amostragem
Uma amostra de n unidades tomada de um universo de N uniN!
dades ser uma possibilidade entre c = n!( N
! diferentes amostras.
n)
Como selecionar a amostra? No caso de estudos ambientais, o uso
de amostragem sistemtica, estratificada ou no, ou mesmo preferencial, as mais utilizada. Pela dificuldade em localizar os pontos de
amostragem previamente escolhidos ao acaso sobre mapas da rea,
a amostragem aleatria irrestrita tem sido considerada pouco prtica
nos estudos de ecossistemas naturais.
A amostragem sistemtica feita quando apenas o primeiro
membro da amostra ou do estrato for selecionado ao acaso, sendo
os demais tomados a intervalos regulares. A amostragem sistemtica tem como princpio a diviso da rea de coleta em estratos ou
segmentos, sendo feita de forma subjetiva.
Os guias de estatstica mostram que para amostras heterogneas, temos inicialmente que estabelecer qual a quantidade mnima
de amostra a ser coletada. Ingamells e Switzer (1973) proporam a
constante de amostragem de Ingamells, k s :
mCV 2 = k s

(2.14)

O m o peso da amostra analizada e CV a percentagem relativa do


desvio padro da composio da amostra. O k s representa a massa
de amostra para 1% de incerteza na amostragem para um limite de
confiana de 65%.
Exemplo 2.10 A constante de Ingamells para a anlise da quantidade de
nitrognio em trigo de 0,50 g. Qual massa deve ser pesada para obter uma
preciso de 0,2% (CV) na determinao de nitrognio em trigo?

35

O que so rplicas?
As rplicas so amostras com aproximadamente o mesmo tamanho das que
so submetidas a anlises exatamente
da mesma forma.

36

quimiometria com r

Sabemos que
mCV 2 = k s
Substituindo a constante de Ingamells k s de 0,50 g e o CV 2 de 0,2% teremos:
m(0, 2)2 = 0, 5
m=

0, 5
= 12, 5 g
(0, 2)2

Na prtica, os 12,5 g no totalmente determinado pois o processo de


triturao da amostra no consegue deix-la totalmente homognea.
Exemplo 2.11 Para conhecer a constante de Ingamells necessrio inicialmente determinar a mdia de um analito a partir de uma massa conhecida de
amostra. Assim, vamos imaginar a anlise de fsforo em amostras de sedimentos pesando 0,500 g. A mdia obtida para 10 determinaes de fsforo foi
de 23,14 mg kg1 e o desvio padro de 2,20 mg kg1 . Ento vamos calcular
k s para essa anlise.
Clculo do erro relativo (%)
CV =

2, 20
100 = 9, 50%
23, 14

Agora temos condies de calcular o k s


k s = mCV 2 = 0, 500.9, 502 = 45, 19 g
Exerccio 2.25 A constante de amostragem (k s ) para o radioisotopo 24 Na
em amostras homogneas de fgado humano de aproximadamente 35 g.
Qual erro relativo seria cometido por voc se em sua anlise qumica fossem
utilizados 1,0 g?
Exerccio 2.26 Para encontrar o k s de K2 O de solo, um analista realizou 12
determinaes em ICP. Os resultados esto apresentados abaixo:
0,247 0,300 0,236 0,258 0,304 0,330
0,247 0,275 0,212 0,311 0,258 0,187
Sabendo que para todas as anlises qumicas de K2 O foram usadas amostras pesando 0,100 g determine o valor de k s . Dica calcule a mdia e o desvio
padro para determinar o CV.
At o momento apredemos a calcular a massa de amostra
necessria para fazer uma anlise qumica. Vamos aprender qual o
nmero de amostras necessrio para fazer uma anlise qumica. O
nmero de amostras a serem coletadas pode ser estimado a partir do
erro padro (desvio padro relativo - sm ) em que o desvio padro de
uma observao dividido pela raiz quadrada do nmero de observaes (N) dado por
dp
(2.15)
sm =
N

estatstica bsica

Observa-se que o sm diminui medida que aumenta o nmero de


observaes, mais precisamente, ele inversamente proporcional
raiz quadrada do nmero de observaes.
Exemplo 2.12 Um qumico est interessado em analisar a quantidade
de clcio presente no leite em caixa de um lote. Ele est em dvida qual a
quantidade mnima tem que ser coletada para que os resultados de clcio no
leite sejam confiveis. Como ele no sabia a quantidade mnima necessria
para analisar resolveu fazer trs titulaes para determinar a quantidade e
encontrou o desvio padro 0,50. Sabendo que o erro relativo admitido para
anlise de 0,20, calcule o nmero mnimo de coletas a serem feitas.
Sabemos que
0, 50
0, 20 =
N

0, 5
N=
0, 2
N = 2, 52 = 6, 25
Conforme podemos perceber bastar coletar 6 amostras que os resultados
obtidos corresponderam ao admitido para anlise qumica do leite
Agora, qual o nmero ideal amostra deve ser coletado para
se ter uma boa representativadade? Idealmente, vrias amostras
deveriam ser coletadas e analisadas para que os resultados pudesse
gerar o valor mais provvel. Para responder a essa pergunta devemos
primeiramente definir o que seja intervalo de confiana (colocar um
fator probabilstico), neste ponto fazer uma estimativa de :
t.dp
= x
N

(2.16)

em que N nmero de amostras e t um fator estatstico obtido da


distribuio de student, sendo determinado pelo nmero de amostras
e nvel de confiana desejado (Tabela 3, pg. 92). Primeiramente,
vamos trabalhar um pouco com essa equao em alguns exemplo e
exerccios.
Exemplo 2.13 A quantidade de ons de sdio presente na urina foi determinada por potenciometria com um eletrodo de on seletivo. Os seguintes
valores foram obtidos: 102, 97, 99, 98, 101, 106 mmol L1 . Quais so as
concentrao mdia e o limite de confiana de 95% e 99%?
A mdia e o desvio padro dos valores acima respectivamente 100,5
e 3,27 mmol L1 . Existem seis medidas e portanto o grau de liberdade
cinco. Sendo assim, os valores tabelados de t (Tabela 3, pg. 92) para 95% e
99% so respectivamente 2,57 e 4,03. Com esses dados podemos encontra os
limites de confiana usando a equao 2.16. Para 95% tem-se
100, 5

2, 57.3, 27

= 100, 5 3, 4 mmol L1
6

37

38

quimiometria com r

Para 99% tem-se


100, 5

4, 03.3, 27

= 100, 5 5, 4 mmol L1
6

Exerccio 2.27 A quantidade de carboidrato de uma glicoproteina do aucar


foi determinada em cinco amostra. Os valores encontrados pelo analista em
100 g de amostra foram 12,6, 11,9, 13,0, 12,7 e 12,5 g. Determine o intervalor de confiana para 90% e 95% dos valores de concentrao encontrados.
Exerccio 2.28 Durante um experimento um qumico obteve os seguintes
valores de pH para um tampo
5,12 5,20 5,15 5,17 5,16 5,19 5,15
Calcule o limite de confiana para 95% desses valores.
Exerccio 2.29 Dez replicatas referente anlise de mercrio (ng mL1 )
em amostras de solos contaminados foram os seguintes:
23,3 22,5 21,9 21,5 19,9 21,3 21,7 23,8 22,6 24,7
Calcule a mdia, desvio padro, CV e limite de confiana de 95%.
Retornando ao processo de estimativa do nmero de amostras ideal para uma anlise qumica, temos que reescrever a equao
2.16:
tdp
x =
(2.17)
N
Desconsiderando o temos
tdp
x =
N

(2.18)

Se observamos a diferena - x, chega-se a um erro, que na


equao 2.15 o sm ; ou seja, temos aqui uma forma de expressar um
erro cometido pelo uso de amostras pequenas em relao ao grande
nmero de medidas. Nesse caso necessariamente o t de student
sugere uma proximidade probabilstica de x est prximo de .
Vamos estabelecer uma equao que permite saber o nmero ideal para a realizao de uma anlise qumica:
tdp
sm =
N

(2.19)

t2 dp2
(2.20)
N
Ento, o nmero ideal para uma anlise qumica representativa
2
Sm
=

N=

t2 dp2
s2m

(2.21)

estatstica bsica

Exemplo 2.14 A quantidade de ferro permitida no ouro 5% (massa/massa),


para um desvio padro de 0,021 (CV 2,1%). Quantas amostras devem ser
tomadas para que seja tenha um desvio padro relativo de 0,016. Faa o seu
clculo para um nvel de confiana de 95%.
Inicialmente, devemos calcular o nmero de amostra baseado no limite
de confiana para infinitas medidas, cujo valor de t 1,96. Dessa forma,
teremos um N de
(1, 96)2 (0, 021)2
N=
= 6, 6
(0, 016)2
A partir do resultado 6,6 comearemos a fazer interaes para obter um
nmero finito de amostras. Dessa forma tem-se para N = 7, t = 2,37
N=

(2, 37)2 (0, 021)2


= 9, 7
(0, 016)2

Na nova interao N = 10, t=2,23


N=

(2, 23)2 (0, 021)2


= 8, 6 = 9
(0, 016)2

Percebe-se que o N est entre 9 e 10, ou seja, para se ter um nvel de confiana de 95%, 10 amostras de ouro devem ser analisadas.
Exerccio 2.30 A anlise da acidez da aspirina revelou que o mtodo empregado de titulao tinha um desvio padro de 0,25 para uma quantidade de
1,00 g em comprimidos triturados. Quantas amostras so necessrias para se
obter um erro relativo de 0,05 no limite de confiana de 95%?
Exerccio 2.31 O sm da determinao das cinzas do arroz de 1,5 g de
2,0%. Use essa informao para calcular quantas amostras pesando 1,5 g
sero necessrias para uma anlise qumica com limite de confiana de 95%.
Dado o desvio-padro de 0,80%
Exerccio 2.32 Um qumico estava precisando determinar a quantidade de
clcio de um lago na regio amaznica. Para isso, ele levou em seu barco de
pesquisa um fotmetro de chama e os reagentes para a realizao da anlise.
Tradicionalmente, so realizadas determinaes em triplicatas e os resultados
expressos em termos de mdia e desvio padro. Aps ter realizado as trs
anlises, o qumico resolveu aprimorar seus resultados para isso ele no
sabia quantas amostras so necessrias para se a obteno de dados mais
confiveis. Sabendo que para amostras de 100 mL a quantidade de clcio
de 4,100,12 mg L1 , calcule a quantidade de amostras que devem ser
coletadas para um erro sm aceitvel de 0,01.
Exerccio 2.33 Geralmente nas aulas prticas de qumica analtica so
feitas trs titulaes e os resultados expressos em termos de mdia e desvio
padro. Um estudante realizou uma dessas titulaes e encontrou os seguintes volumes: 3,91, 4,01 e 3,97 mL. Com esses valores determine qual o sm
para um limite de confiana de 95%.

39

40

quimiometria com r

Exerccio 2.34 Na busca da melhor condio de medida um aluno de iniciao de pesquisa resoveu fazer uma srie de medidas. A Tabela 2.4 mostra
uma das sries obtidas pelo aluno. Pede-se que sejam calculados a mdia,
desvio padro e o nmero ideal para um limite de confiana de 95%. Considere como ideal um sm de 0,1.
48,4
48,6
48,2
54,8
49,6
54,8

2.8

50,8
50,6
51,0
54,6
54,2
54,8

51,3
49,3
49,3
50,7
48,3
52,3

47,9
49,7
50,3
53,9
50,5
52,5

Tabela 2.4: Srie de medidas obtidas


pelo aluno de iniciao cientfica

Teste de significncia

A comparao dos valores de um conjunto de resultados com o


valor verdadeiro ou com os valores de outros conjuntos de resultados
permite verificar a acurcia e a preciso de um mtodo analtico, por
exemplo. O desenvolvimento de um novo mtodo analtico passa
necessariamente por um teste estatstico para verificar a significncia entre o mtodo clssico e o novo. Entre os mtodos geralmente
usados se destacam o teste de F, t student e t pareado.
Esses mtodos utilizam o nmero de graus de liberdade,
em termos estatsticos, o nmero de valores independentes necessrios para determinar a quantidade estatstica. Assim, um conjunto
de n valores tem n graus de liberdade enquanto a soma ( x x )2
tem n-1 graus de liberdade. Isso ocorre porque qualquer que seja
somente n 1 valores podem ser escolhidos
o valor definido de x,
independentemente definido pelos outros valores.

2.8.1 Teste de F
Este um teste indicado para comparar se a de preciso entre dois mtodos diferena entre dois mtodos baseado sobre seus
desvios padro. O teste de Fisher (F), que a comparao de duas
varincias4 , serve para determinar se duas populaes possuem
variabilidades semelhantes ou se as variabilidades podem ser consideradas diferentes. No primeiro caso, as populaes so chamadas
de Homocedsticas, enquanto no segundo caso as populaes so
designadas Heterocedsticas. O teste de F definido em termos as
varincias de dois mtodos, em que a varincia a diviso entre o

A varincia o quadrado do desvio


padro possuindo as mesmas unidades
dos dados s que ao quadrado. Apesar
de a vantagem de ser aditiva em muitas
situaes, os qumicos preferem usar o
dp como uma medida de preciso.
4

estatstica bsica

quadrado dos desvios padro:


F=

s21
s22

(2.22)

em que s21 > s22 . Existem dois diferentes graus de liberdade v1 e v2 ,


cada um calculado da seguinte forma v = N 1.
Se o F calculado na equao 2.22 for maior que o F tabelado
(Tabela 2, pg. 91), o resultado indica que existe uma diferena significativa entre as duas medidas usadas para comparar, por exemplo,
dois mtodos analtico.
Exemplo 2.15 A qualidade de uma anlise qumica de clcio excutada por
um analista principiante e um experimente foi avaliada pela realizao de 6 e
5 determinaes complexomtricas por EDTA, respectivamente. Os resultados obtidos pelos dois analistas foram: para o iniciante de 32,25 0,34% e o
mais experiente de 35,350,25%.
Para estabelecer se o analista principiante, inicialmente devemos calcular
o valor de Fcalc :
0, 342
Fcalc =
= 1, 85
0, 252
Ao consultar os valores respectivos dos graus de liberdade 5 e 4 na Tabela
2 (pg. 91) encontramos o valor de F = 6,26. Como o valor calculado
menor que o valor tabelado, podemos afirmar que no nvel de confiana de
95% os resultados obtidos pelo analista principiante no se diferencia daques
obtidos pelo analista experimente.
Exemplo 2.16 Um analista A encontrou no 1o dia, numa anlise de uma
soluo de concentrao conhecida, um desvio de 2,5 ppm de Cl; foram
realizadas sete determinaes. No 7o dia, o mesmo analista encontrou um
desvio de 3,3 ppm de Cl em 10 determinaes. Existe alguma variao nas
determinaes do analista A para um limite de confiana de 95%.
Inicialmente vamos calcular o valor de F
Fcalc =

3, 32
= 1, 74
2, 52

Ao consultar os valores respectivos dos graus de liberdade 4 e 10 na


Tabela 2 (pg. 91) encontramos o valor de F = 4,10. Como o valor calculado
menor que o valor tabelado, podemos afirmar que no nvel de confiana de
95% os resultados obtidos pelo analista principiante no se diferencia daques
obtidos pelo analista experimente.
Exerccio 2.35 Um qumico trainee de um famoso laboratrio de anlises
qumicas de ambientais determinou a quantidade um antibitico como sua
prova de emprego. Para verificar a qualidade do trainee, um qumico experiente do laboratrio tambm fez a mesma anlise qumica. Com os dados dos

41

42

quimiometria com r

dois qumicos abaixo verifique se o qumico trainee ter ou no o emprego.


Critrio para empregar o qumico trainee que seu resultado (varincia) seja
estatisticamente igual ao do qumico experimente. Abaixo se encontram os
resultados das anlises:
Trainee X=14,57 mgdL1 dp=0,53 mgdL1 n = 6
Experiente X=13,95 mgdL1 dp=0,42 mgdL1 n = 5
Exerccio 2.36 A qualidade de dois mtodos estava precisando ser avaliada.
Caso fossem iguais, o laboratrio iria economizar cerca de 60%, representando uma reduo de custo considervel. Com base nos resultados abaixo
decida se suas varincias so iguais. Para isso, utilize o teste de F.
Mtodo 1 X=35,25% dp=0,34% n = 5
Mtodo 2 X=35,35% dp=0,25 % n = 5
Exerccio 2.37 O valor aceito para o teor de sulfato de uma amostra padro
obtida de cinco anlises qumicas prvias de 54,20% com um desvio padro
de 0,15%. Cinco anlises da mesma amostra foram feitas por um novo proceimento instrumental, obtendo-se os seguintes valores, 54,01, 54,24, 54,05,
54,27 e 54,11%. Est este novo mtodo produzindo resultados consistentes
com o valor aceito.
Exerccio 2.38 Catarino, Pinto e Curvelo-Garcia (2003) determinaram a
quantidade de ferro em dois vinho branco por espectrometria de absoro
atmica de chama. Eles encontraram que o vinho branco continha 1,100,02
em trs amostras analisadas. Para verificar se o resultado encontrado era
aceitvel ele obtiveram o resultados de 30 laboratrios credenciados (1,12
0,20). Verifique se o resultado da anlise de ferro obtido por Catarino,
Pinto e Curvelo-Garcia (2003) possui a mesma varincia que os laboratrios
credenciados.
Exerccio 2.39 As fbricas de gua mineral compram uma quantidade
muito grande de rtulos e por isso a quantidade de um determinado on
sempre a mesma. Preocupado com esse fato, um qumico resolveu verificar
se as informaes contidas no rtulo eram aceitveis. No seu teste ele usou
o on bicarbonato, realizando diversas anlises qumicas de uma marca de
gua mineral. Ele obteve 18,970,10 mg L1 aps 10 titulaes seguidas.
Para realizar o teste de F ele conseguiu saber que a informao do rtulo era
18,960,02 mg L1 , mdia e desvio padro de 6 amostras. Verifique se a
informao do rtulo ou no aceitvel.
Exemplo 2.17 Um novo mtodo colorimtrico foi desenvolvimento a fim
de substituir o mtodo para a determinao de glicose conhecido como FolinWu. Para verificar a qualidade do novo mtodo foram feitas uma sria de
medidas, sendo obtidos os seguintes resultados em mg dL1 : Novo mtodo
= 127, 125, 123, 130, 131, 126 e 129, Mtodo Folin-Wu = 130, 128, 131,
129, 127 e 125. Utilize o teste de F para avaliar se os dois mtodos so
significativamente diferente ou no.

estatstica bsica

43

Usando o R
5

sempre coloque os dados com maior


nmero de variveis
5

Primeiramente entre com o conjunto de dados:


> Novo <-c(127, 125, 123, 130, 131, 126, 129)
> Folin <-c(130, 128, 131, 129, 127, 125)
Para realizar o teste de F bastar digitar:
> var.test(Novo, Folin)
No R o resultado ser:
F test to compare two variances
data: novo and Folin F = 1.7653, num df = 6, denom df = 5, p-value = 0.5494
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.2529925 10.5698854
sample estimates:
ratio of variances
1.765306
Os resultados fornecidos pelo R mostram que o F calculado de
1,7653, tendo como graus de liberdade no numerador num df = 6 (relativos
aos dados do mtodo desenvolvido) e denominado denom df = 5. Ao verificar
na tabela os valores de F terico para os respectivos graus de liberdade notase que o F calculado menor, portanto podemos afirmar que os dois mtodos
para um nvel de significncia de 95% os dois mtodos so iguais. Outra
forma de avaliar o resultado pelo valor da probabilidade p> 0,05 (p-value =
0,5494) indicando que a possibilidade da hipotese que os dois mtodos sejam
iguais verdadeira.
Exerccio 2.40 A Tabela 2.5 mostra os resultados da anlise de Ti (%)
obtida de amostra de minrios de ferro por dois mtodos distintos. Utilizando
o R verifique se a varincia dos dois mtodos so significamente iguais ou
diferentes.
Ordem
1
2
3
4
5

Mtodo 1
0,0134
0,0144
0,1266
0,0111
0,0137

Mtodo 2
0,0135
0,0136
0,0137
0,0137
0,0136

Exerccio 2.41 O ltio um metal utilizado em importantes reas do conhecimentos, como medicina, geologia, astrofsica e qumica nuclear. A razo
6 Li/7 Li em material de referncia foi utilizada para testar duas metodologias
e os dados so apresentados na Tabela 2.6. Pede-se verificar com o R se as
varincias so iguais ou diferentes.

Tabela 2.5: Resultados do teor (%) de


titnio obtidos a partir de dois mtodos
diferentes em amostras de minrio de
ferro

44

quimiometria com r

Ordem
1
2
3
4
5
6

Mtodo 1
0,082601
0,082621
0,082589
0,082617
0,082598

Mtodo 2
0,08183
0,08186
0,08205
0,08206
0,08215
0,08208

Exerccio 2.42 Amostras ambientais de um rio foram coletadas em dois


locais diferentes, montante e jusante a fim de verificar se uma fbrica estava contaminando o percurso de gua. Como essa fbrica produz nquel, os
qumicos ambientais resolveram analisar este metal, considerado, potencialmente txicos e os resultados obtidos foram: montante 0,01, 0,02 e 0,03 mg
L1 e jusante 0,15, 0,20 e 0,25 mg L1 . Usando o R verifique se a varincia
da montante e jusante podem ser consideradas semelhantes.

2.8.2 Teste de t
Este teste usado para amostras pequenas. Seu propsito
comparar a mdia de uma srie de resultados com um valor de
referncia e exprimir o nvel de confiana associado ao significado da
comparao. tambm usado para testar a diferena entre as mdias
de dois conjuntos de resultados, x1 , x2 , por exemplo, o primeiro um
mtodo novo e segundo de referncia Christian (1994).
O valor de t quando se comparam duas mdias dado
porcentagem
x x2
t= 1
(2.23)
s p 1/n1 + 1/n2
em que s p , o desvio padro agrupado, que calculado da seguinte
forma:
s
(n1 1)s21 + (n2 1)s22
sp =
(2.24)
n1 + n2 2
Os valores calculos so comparados com os tabelados (Tabela
3, pg. 92).
Exemplo 2.18 Aznarez, Bonilla e Vidal (1983) trabalhando com uma srie
de amostras de plantas obteve diversos resultados relativos determinao
do boro por espectrofometria e fluorimetria. Dentre os resultados obtidos
pelos autor foi escolhidos dois feitos com a Malus communis (Golden): o
primeiro da anlise espectrofotomtrica cuja o valor foi 28,00 0, 30 e o
segundo fluorimtrico com mdia de 26,25 0, 23. Sabendo que cada mdia
represente 10 medidas, avalie se as mdias diferem entre s significamente.

Tabela 2.6: Resultados da razo 6 Li/7 Li


em material de referncia obtidos a
partir de dois mtodos diferentes

estatstica bsica

Primeiramente, vamos calcular o valor de s p


s
r
(n1 1)s21 + (n2 1)s22
9.0, 302 + 9.0, 232
sp =
=
= 0, 284
n1 + n2 2
16
Agora podemos calcular t
t=

28, 00 26, 25

= 13, 07
0, 284 1/9 + 1/9

Ao comparar o valor calculado para grau liberdade 18 com a Tabela 3


(pg. 92), cujo t = 2,10, consta-se que com um nvel de significncia de 5%
as mdias so diferentes entre s.
Exerccio 2.43 O teor de clcio na urina de um pessoa foi determinado em
dois dias diferentes, sendo obtidos os seguintes resultados (mgL1 ): 2388
(n = 4) e 25510 (n = 2). Pergunta-se: As mdias so significativamente
diferentes no nvel de confiana de 95%?
Exemplo 2.19 Um novo mtodo colorimtrico foi desenvolvimento a fim
de substituir o mtodo para a determinao de glicose conhecido como FolinWu. Para verificar a qualidade do novo mtodo foram feitas uma sria de
medidas, sendo obtidos os seguintes resultados em mg dL1 : Novo mtodo = 127, 125, 123, 130, 131, 126 e 129, Mtodo Folin-Wu = 130, 128,
131, 129, 127 e 125. Utilize o teste de t para avaliar se as duas mdias so
significativamente diferente ou no.
Usando o R
Primeiramente entre com o conjunto de dados:
> Novo <-c(127, 125, 123, 130, 131, 126, 129)
> Folin <-c(130, 128, 131, 129, 127, 125)
Para realizar o teste de F bastar digitar:
> var.test(Novo,Folin)
No R o resultado ser:
Welch Two Sample t-test
data: novo and Folin t = -0.7493, df = 10.86, p-value = 0.4696
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4.129653 2.034414
sample estimates:
ratio of x mean of y
127.2857 128.3333
Nota-se que o p-value se encontra dentro do intervalo de confiana de -4,13 a
2,03, portanto a hipotese que as duas mdias so iguais aceitvel dentro de
um limite de confiana de 95%. Observao o valor negativo de t no deve
ser considerado no julgamento da hipotse. Na realidade esse valor deve ser
considerado em termos absolutos.

45

46

quimiometria com r

Exerccio 2.44 As razes isotpicas do ltio so importantes em medicina,


geologia, astrofsica e qumica nuclear. A razo 8 Li/7 Li em um material de
referncia padro foi medida por dois mtodos:
Mtodo 1: 0,082601, 0,082621, 0,082589, 0,082617, 0,082598
Mtodo 2: 0,082604, 0,082542, 0,082599, 0,082550, 0,082583, 0,082561
Os dois mtodos produzem resultados estatisticamente equivalentes?
Exerccio 2.45 A % (massa/massa) de Na2 CO3 presente na soda castica
foi determinada por volumetria de neutralizao usando dois indicadores
diferentes. Verifique usando o R se os dois indicadores possuem resultados
equivalentes:
Indicador A: 36,82 37,04 36,93 37,01 36,20 37,00
Indicador B: 31,01 36,15 31,73 33,19 30,27 33,94
Exerccio 2.46 Os dados mostrados na Tabela 2.7 foram obtidos durante
um estudo da concentrao de Zn em um lago da Amaznia.
Utilizando
Ponto de coleta
1
2
3
4
5
6

[Zn2 ]
interface ar-gua
0,430
0,266
0,567
0,531
0,707
0,716

[Zn2 ]
interface gua-sedimento
0,415
0,238
0,390
0,410
0,605
0,609

o teste de t pareado determine se existe diferena significativa entre a concentrao de Zn2 entre a interface com ar-gua e sedimento e gua. Nvel de
confiana de 95%.
Exerccio 2.47 Um laboratrio de uma empresa desenvolveu um mtodo
baseado no efeito cataltico sobre a oxidao do cido sulfanlico pelo KIO4
com meta a melhorar a determinao de Fe3+ de soro humano. Para verificar
os seus resultados forma feitas oito determinaes, juntamente com um
mtodo padro. Os resultados em micromols/L apresentado na Tabela 2.8.
Verifique se o Mtodo proposto pode substituir o mtodo padro com nvel
de confiana de 95%.

2.8.3 Teste de t para mltiplas amostras


Geralmente em laboratrios de anlises qumicas necessrio
a criao de novos mtodos de anlises. Muitas vezes esses mtodos
consistem de mudanas relativamente pequenas ou mesmo de alteraes bastante considerveis. A eficincia depende normalmente da
anlise de vrios tipos de amostras, sendo assim, vamos supor uma
determinao de diferentes amostras de ferro pelos mtodos A e B. A

Tabela 2.7: Dados da concentrao de


um lago na Amaznia

estatstica bsica

Amostra
1
2
3
4
5
6
7
8

Mtodo proposto
8,25
9,75
9,75
9,75
10,75
11,25
13,88
14,25

Mtodo padro
8,06
8,84
8,36
8,73
13,13
13,65
13,85
13,43

47

Tabela 2.8: Resultado da determinao


de amostras de soro humano

quantidade de ferro encontrada nos dois mtodos so apresentadas


na Tabela 2.9

1
2
3
4
Mtodo A 17,6 6,8 14,2 20,5
Mtodo B 17,9 7,1 13,6 20,3
Fonte: Mendham et al. (2002)

Tabela 2.9: Resultados das anlises de


ferro usandos os mtodos A e B

5
9,7
10,2

Para esses casos, a realizao do teste de t simples no resolve o


problema, alm de serem necessrios uma quantidade de clculos
relativamente grande.
Uma alternativa utilizar o teste de t mltiplo em que a diferena entre cada medida pareada sobre cada amostra computada.
calculada e os desvios padro
Neste caso, a media da diferena D
individual usados para o clculo de sd so calculados da seguinte
forma:

D
t=
N
(2.25)
sd
s
sd =

)2
( Di D
N1

(2.26)

em que Di a diferena entre os dois mtodos em cada amostra


a mdia de todas as amostras.
utilizada e D
Exemplo 2.20 Imagine que voc desenvolveu um novo mtodo para determinar a quantidade de Fe presente nas guas ricas em matria orgnica
do rio Negro. Para ter certeza da capacidade do seu mtodo voc realizou
uma srie de anlises qumica conjuntamente com a metodologia recomendada pelo Standard Methods. Os resultados referentes a cada amostra so
apresentados abaixo:

48

quimiometria com r

Amostra
1
2
3
4
5
6

Mtodo Novo
10,2
12,7
8,6
17,5
11,2
11,5

Standard Methods
10,5
11,9
8,7
16,9
10,9
11,1

Com um limite de confiana de 95% verifique se o mtodo desenvolvido


por voc equivale ao Standard Methods.
e o para isso podemos
Primeiramente devemos calcular os valores de D
fazer os seguintes clculos:

Amostra
1
2
3
4
5
6

Mtodo Novo
10,2
12,7
8,6
17,5
11,2
11,5

Standard Methods
10,5
11,9
8,7
16,9
10,9
11,1

D=

Di
-0,3
0,8
-0,1
0,6
0,3
0,4
1,7
0,28

Di D
-0,6
0,5
-0,4
0,3
0,0
0,1

( Di D )2
0,36
0,25
0,16
0,09
0,00
0,01
0,87

Uma vez calculos vamos determinar o t:


r
sd =

t=

0, 87
= 0, 42
61

0, 28
. 6 = 1, 63
0, 42

Ao comparar o valor de t calculado (1,63) com o tabelado para um grau


de liberdade de 5 (t=2,57, Tabela 3, pg. 92), nota-se com o tcalc < ttabelado .
Este resultado permite afirmar que no diferena significativa entre os dois
mtodos.

Exerccio 2.48 Dois mtodos analticos diferentes foram usados para determinar cloro residual em efluentes de esgoto. Os dois mtodos foram usados
as mesmas amostras, coletadas em locais diferentes com tempo de contato de
cloro em perodos diferentes.A concentrao de cloro, expressa em mg L1 ,
tiveram os seguintes dados:

estatstica bsica

Amostra
1
2
3
4
5
6
7
8

Mtodo A
0,39
0,84
1,76
3,35
4,69
7,70
10,52
10,92

Mtodo B
0,36
1,35
2,56
3,92
5,35
8,33
10,70
10,91

Faa o teste de t pelo mtodo pareado para verificar se os dois mtodos so


iguais ou diferentes.
Exemplo 2.21 Dois cristalografos desenvolveram um mtodo para a determinao da % de caulinita em um mistura complexa de minerais. Para
testar a nova metodologia, os cristalografos mediram nove amostras sintticas de de caulinita com quantidades desconhecidas de outros minerais com o
mtodo novo e um estabelecido (padro) na literatura. Os resultados foram
os seguintes:
Novo: 5,0 10,0 20,0 40,0 50,0 60,0 80,0 90,0 95,0
Padro: 6,8 11,7 19,8 40,5 53,6 61,7 78,9 91,7 94,7
Utilize R para determinar se o mtodo desenvolvido pelos cristalografo
so equivalente, e portanto, pode ser substituir o mtodo padro.
Usando o R
Primeiramente entre com o conjunto de dados:
> Padrao <-c(6.8, 11.7, 19.8, 40.5, 53.6, 61.7, 78.9, 91.7, 94.7)
> Novo <-c(5, 10, 20,40,50,60,80,90, 95)
> t.test(Novo,Padrao,paired=T)
Paired t-test
data: Novo and Padrao
t = -2.1724, df = 8, p-value = 0.06158
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-2.1531073 0.0642184
sample estimates:
mean of the differences
-1.044444
Nota-se que o p-value se encontra dentro do intervalo de confiana de -2.15 a
0.064, portanto a hipotese que as duas mdias so iguais aceitvel dentro de
um limite de confiana de 95%. Observao o valor negativo de t no deve
ser considerado no julgamento da hipotse. Na realidade esse valor deve ser
considerado em termos absolutos.

49

50

quimiometria com r

Exerccio 2.49 A homogeneidade dos nveis de cloreto presente em uma


amostra de gua de um lago foi testada por meio de anlises de pores retiradas do topo e do fundo da coluna de gua, tendo apresentado os seguintes
resultados, em mg L1 de Cl :
Topo
26,30
26,43
26,28
26,19
26,49

Fundo
26,22
26,32
26,20
26,11
26,42

1. Aplique o teste de t em um nvel de confiana de 95% para determinar se


as mdias so diferentes.
2. Agora use o teste de t pareado e determine se h diferena significativa
entre os valores para o topo e fundo em um nvel de confiana de 95%.
3. Por que se chega a diferentes concluses quando se usa o teste de t pareado e quando apenas se combina os dados e se usa o teste de t para
diferenas nas mdias?
Exerccio 2.50 Dois laboratrios diferentes fizeram uma srie de anlise de
magnsio e gostariam de saber se seus resultados so equivalntes em um
nvel de confiana de 95%. O primeiro laboratrio obteve os seguintes resultados em %: 3,92, 3,28, 4,18, 3,53 e 3,35 e o segundo 2,99, 2,87, 2,17, 3,40
e 3,92.Com o teste de t pareado verifique se os dois laboratrios produzem
resultados equivalentes.
Exerccio 2.51 Um novo mtodo eletroqumico foi desenvolvido para determinar rapidamente a quantidade da monensina sdico, um antibitico usado
largamente para manipulao do metabolismo de bovinos, por um aluno de
ps-graduao. Por outro lado, o mtodo padro para anlise baseado na
atividade microbiolgica o que leva muito tempo para o obter os resultados.
Como parte para da eficincia do novo mtodo, amostras foram analisada em
diferentes tempo, sendo o mesmo procedimento para o mtodo padro. Com
os resultados apresentados na Tabela 2.10, verifique se o novo mtodo pode
substituir o mtodo padro. Para a sua avaliao use o R.
Exerccio 2.52 Dois cientistas teimosos resolveram mostrar um para o
outro que eram capazes de estudar uma amostra oriunda de marte. Para
ter acesso ao artefato marciano, os cientista tinham que analisar nquel em
10 amostras de planetas desconhecidos fornecida pela NASA. O primeiro
cientista usou a ativao neutrnica para determinar o chumbo e o segundo
usou o ICP-MS. Os resultados foram:
Cientista 1: 34,0 22,6 29,7 24,9 17,8 14,8 8,6 31,4 10,8 17,3 15,7 18,4
Cientista 2: 33,4 28,4 29,5 24,8 18,3 15,4 8,5 31,9 11,5 17,6 15,4 18,3

estatstica bsica

Amostra
1
2
3
4
5
6
7
8
9
10
11

Mtodo microbiolgico
129,5
89,6
76,6
52,2
110,8
50,4
72,4
141,4
75,0
34,1
60,3

Mtodo eletroqumico
132,2
91,0
73,6
58,2
104,2
49,9
82,1
154,1
73,4
38,1
60,1

Pergunta-se: Usando o teste de t pareado no R verifique se os resultados


dos dois cientistas so comparveis.

2.9

Rejeio de resultados

Durante a realizao de uma srie de anlises qumicas comum o analista se deparar com o problema de aceitar ou no determinado resultados. Geralmente, essa situao ocorre durante uma
titulao cujos os valores da bureta conduzem, quando o volume
muito diferente, ao pensamento de rejeitar ou no aquele resultado.
Os alunos de modo geral preferem fazer outra titulao de forma
a obter volumes prximos, no pensamento de que o seu resultado
anterior estava errado.
Por outro lado, a rejeio dos resultados deve obedecer a um
critrio cientfico aceitvel de forma que o conjunto dos dados esteja
fazendo parte de uma mesma distribuio. Normalmente, recomendado o teste de Q (ou Teste de Dixon) para a rejeio de resultados.
O teste de Q rejeita valores crticos com um nvel de confiana, sendo
que sua aplicao deve ser feita da seguinte maneira:
1. Colocar os valores obtidos em ordem crescente;
2. Determinar a diferena existente entre o maior e o menor valor da
srie (faixa);
3. Determinar a diferena entre o menor valor da srie e o resultado
mais prximo;
4. Dividir esta diferena (em mdulo) pela faixa, obtendo um valor
de Q;
5. Se Q > Qtabelado (Tabela 4, pg. 93), o menor valor rejeitado

51

Tabela 2.10: Resultados obtidos com os


mtodo microbiolgico e eletroqumico

52

quimiometria com r

6. Se o menor valor rejeitado, determinar a faixa para os valores


restantes e testar o maior valor da srie;
7. Repetir o processo at que o menor e o maior valores sejam aceitos;
8. Se o menor valor aceito, ento o maior valor testado e o processo repetido at que o maior e o menor valores sejam aceitos;
9. Quando a srie de medidas constituda por trs valores, aparentemente um valor ser duvidoso, de modo que somente um teste
precisa ser feito.
Exemplo 2.22 Um qumico obteve os seguintes resultados durante suas
anlises qumicas os seguintes resultados de cloreto (mgL1 ): 15,42, 15,51,
15,52, 15,53, 15,68, 15,52, 15,56, 15,53, 15,54, 15,56.
Primeiramente vamos ordenar os valores assim temos:
1.passo: 15,42, 15,50, 15,51, 15,52, 15,52, 15,53, 15,54, 15,56, 15,58 e
15,68.
2.passo: Diferena entre o maior e menor valor
1 = 15, 68 15, 42 = 0, 26
3.passo: Diferena entre o menor e o prximo da srie
2 = |15, 42 15, 50| = 0, 08
4.passo: Dividir esta diferena (em mdulo) pela faixa, obtendo um valor
de Q
0, 08
Qcalc =
= 0, 308
0, 26
5.passo: Comparando o valor calculado com Qtab de 2,23 para um n de 6
observa-se que o valor calculado menor, portanto, o valor menor prximo
no pode ser rejeitado.
Agora vamos testar o maior valor, repetindo o 3. passo para o prximo
mais alto. Assim
3.passo: Clculo da diferena
= 15, 68 15, 58 = 0, 10
4.passo: Diviso da diferena
Qcalc =

0, 10
= 0, 38
0, 26

5.passo: Comparando com Qtab verifica-se novamente que o maior valor


tambm no pode ser rejeitado.

estatstica bsica

Podemos resolver a questo da rejeio de dados facilmente


no R. Para podemos utilizar dois testes: teste de Dixon ou de Grubb.
Inicialmente, temos que instalar um pacote no R chamado Outliers.
Ento basta digitar no R:
>install.packages("outliers")
Alternativamente, voc pode utilizar a opo Packages no
R e procurar o pacote outliers. Em ambas as opes necessrio
escolher um local do espelho (mirror). Como opo escolho sempre o
da Universidade Federal do Paran. Vamos usar o R para resolver o
problema do exemplo 2.22
Exemplo 2.23 Soluo no R para o exemplo 2.22
Primero passo vamos entrar com os dados no R:
>dados<-c(15.42, 15.51, 15.52, 15.53, 15.68, 15.52, 15.56, 15.53, 15.54,
15.56)
Em seguida digitar
> dixon.test(dados,type=10,two.sided=TRUE)
Resposta do programa
Dixon test for outliers
data: dados
Q = 0.4615, p-value = 0.05297
alternative hypothesis: highest value 15.68 is an outlier
Como podemos observar o valor de Q = 0,46 com p-value = 0,053 sugerem a rejeio do valor maior de 15,68. Esse resultado o mesmo sugerido
acima.
Exemplo 2.24 Aplique o teste de Dixon na sequncia de resultados abaixo
para verificar se existe algum nmero anmolo que merece ser desprejado.
Conc. mol L1 : 0,10 0,11 0,12 0,11 0,10
Teste de Dixon no R dos dados
> dados<-c(0.10, 0.11, 0.12, 0.11, 0.10)
> dixon.test(dados,type=10,two.sided=TRUE)
Dixon test for outliers
data: dados
Q = 0.5, p-value = 0.2972
alternative hypothesis: highest value 0.12 is an outlier
Observa-se que o valor Q = 0,5 recomenda a no rejeio dos dados,
diferente do Exemplo 2.23.
O intervalo de Q entre 1,0 e 0,60 o teste de Dixon recomenda
aceitar o valor sugerido como um outlier. Abaixo de 0,60 recomendado rejeitar o valor sugerido de outileir. Ao contrrio da forma feita
manualmente, o prprio R sugere se o valor maior ou menor que
deve ser rejeitado.
Exerccio 2.53 Aplique o teste de Q aos conjuntos de dados abaixo para

53

54

quimiometria com r

verificar que dado(s) referentes anlise de ferro em minrio poder(em) ser


desprezados a um nvel de confiana de 95%.
1. 85,10, 84,62, 84,70
2. 85,10, 84,62, 84,65, 84,70
Exerccio 2.54 Quatro valores de replicatas foram obtidas para a determinao de pesticida em um rio:
0,403, 0,410, 0,401, 0,380 g L1
Verifique a possibilidade de rejeitar o valor de 0,380 g L1 .
Exerccio 2.55 A anlise de uma amostra de calcita gerou percentagens
de CaO de 55,95, 56,00, 56,04, 56,08 e 56,23. Utilize o R para verificar se
existe algum resultado anmolo que merece ser rejeitado.
Exerccio 2.56 aplique o teste Q (Dixon) aos conjuntos de dados que seguem para determinar se existem resultados anmolos.
1. 41,27 41,61 41,84 41,70
2. 7,295 7,284 7,388 7,292

2.10

Boxplot

Em 1977, John Tukey publicou uma proposta que posteriormente foi reconhecida como sendo eficiente mtodo para mostrar
cinco nmero que sumarizam qualque conjunto de dados. O grfico
proposto chamada de boxplot (Figura 2.4). Esse grfico possibilita
representar a distribuio de um conjunto de dados com base em alguns de seus parmetros descritivos, quais sejam: a mediana (Q2 ), o
quartil inferior (Q1 ), o quartil superior (Q3 ) e do intervalo interquartil
(IQR = Q3 Q1 ).
A linha central da caixa marca a mediana do conjunto de
dados. A parte inferior da caixa delimitada pelo quartil inferior
(Q1 ) e a parte superior pelo quartil superior (Q3 ). As hastes inferiores
e superiores se estendem, respectivamente, do quartil inferior at o
menor valor no inferior a Q1 1, 5( Q3 Q1) e do quartil superior
at o maior valor no superior a Q3 + 1, 5( Q3 Q1). Os pontos inferiores e superiores fora da caixa so representados individualmente
no grfico, sendo estes valores caracterizados como outliers.
O boxplot permite avaliar a simetria dos dados, sua disperso e a existncia ou no de outliers nos mesmos, sendo especialmente adequado para a comparao de dois ou mais conjuntos de
dados correspondentes s categorias de uma varivel qualitativa.

estatstica bsica

Figura 2.4: Boxplot

Exemplo 2.25 Construa no R o boxplot usando os dados abaixos que forma


obtidos de anlises qumicas de clcio usando quatro mtodos diferentes. Os
resultados so expresso em %.
A
0,10
0,20
0,15
0,25
0,35
0,20

B
0,20
0,30
0,25
0,25
0,20
0,40

C
0,30
0,40
0,25
0,10
0,35
0,20

D
0,30
0,60
0,70
0,35
0,10
1,50

Usando o R
Primeiramente entre com o conjunto de dados:
> A <-c(0.10,0.20,0.15,0.25,0.35,0.20)
> B <-c(0.20,0.30,0.25,0.25,0.20,0.40)
> C <-c(0.30,0.40,0.25,0.10,0.35,0.20)
> D <-c(0.30,0.60,0.70,0.35,0.10,1.50)
Para realizar o teste de F bastar digitar:
> boxplot(A,B,C,D,xlab="Mtodo",ylab="Concentrao (%)"
No final do processo o R ir desenhar um grfico como mostrado na
Figura 2.5
Exerccio 2.57 Construa no R um boxplot com os seguintes dados:

55

56

quimiometria com r

Figura 2.5: Boxplot relativo ao exemplo


2.25

Mtodo
A
B
C
D

1
11,08
11,35
10,75
11,11

2
11,19
10,76
11,33
11,04

3
11,17
10,63
11,14
11,43

4
11,50
11,13
11,55
10,98

5
11,14
11,30

Exerccio 2.58 Em um trabalho de qumica ambiental sobre a anlise de


pH de amostras em trs locais diferentes de um igarap contaminado. Os
resultados do estudo so apresentados abaixo.
Ordem pH1 pH2 pH3
1
6,64 4,57 7,31
2
6,54 6,62 7,27
3
6,56 6,66 7,15
4
6,44 6,62 7,07
5
6,45 6,43 6,98
6
6,41 6,74 7,02
Faa um grfico de boxplot e discuta os resultados em termos de variao
do valor pH.

3
Calibrao
Experimentos envolvendo a anlise espectrofotomtrica quantitativa de amostras com muitos componentes cujos espectros estejam
superpostos so bastante importantes em disciplinas de qumica
analtica, sejam elas bsicas ou mais avanadas. Em geral, as concentraes dos compostos de interesse numa amostra so determinadas
usando um sistema de equaes simultneas obtido pela lei de Beer
em tantos comprimentos de onda quantos forem os analitos.
O processo de calibrao normalmente consiste em duas
etapas. Na primeira, a etapa descritiva, medidas feitas numa srie
de padres analticos de concentraes conhecidas so usadas para
construir um modelo que relacione a grandeza da medida com a
concentrao da espcie de interesse. Na segunda etapa, conhecida
como preditiva, usa-se o modelo para prever concentraes de novas
amostras, a partir dos sinais analticos medidos para elas.
Curvas de calibrao so construdas em cada sinal (por
exemplo, comprimento de onda) a partir de solues padro de cada
analito a fim de estabelecer constantes de proporcionalidade individuais entre concentrao e intensidades de absoro.No caso de
misturas binrias simples, muitas vezes obtemos bons resultados por
este mtodo.
Entretanto, quando se passa para amostras reais, podem
surgir problemas devido a interferncias espectrais e desconhecimento da real identidade dos compostos de interesse. Nessas situaes, a resoluo simultnea das equaes j no fornece resultados
precisos e por isso foram desenvolvidos nos mtodos para resolver o
problema. Aprenderemos os dois modos de realizar uma calibrao.

3.1

Comparao com padres

Basicamente existem dois tipos de mtodos de comparao: a


direta e o procedimento titulomtrico.

58

quimiometria com r

3.1.1 Comparao direta


Alguns procedimentos analticos envolvem a comparao de
uma propriedade do analito (ou do produto de uma reao com a
analito) com padres, de forma que a propriedade que est sendo
avaliada se iguala ou quase se iguala quela do padro. Por exemplo,
nos colormetros antigos, a cor resultante de uma reao qumica do
analito era comparada com a cor produzida pela reao de padres.
Se a concentrao do padro era variada por diluio, por exemplo,
era possvel se obter uma igualdade de cor bastante exata. Ento, a
concentrao do analito era igual concentrao do padro aps a
diluio.

3.1.2 Titulaes
As titulaes esto entre os procedimentos analticos mais exatos. Em uma titulao, o analito reage com um reagente (o titulante),
que seja padronizado ou padro primrio, em uma reao de estequiometria conhecida. Geralmente, a quantidade de titulante variada
at que a equivalncia qumica seja encontrada, sendo detectada por
meio da mudana de cor de um indicador qumico ou por meio de
alterao da resposta instrumental. A quantidade de reagente padronizado necessrio para se obter a equivalncia qumica pode ser
ento relacionada quantidade de analito presente. A titulao ,
desta forma, um tipo de equiparao qumica.
Exemplo 3.1 Um estudante realizou uma titulao entre o hidrxido de
sdio padronizado com biftalato de potssio, um padro primrio, e o vinagre
tendo como indicador a fenolftalena.
Verifica-se nesta anlise qumica clssica o processo de comparao entre
o hidrxido de sdio padronizado e o vinagre. Sem o estabelecimento da
concentrao de hidrxido de sdio impossvel afirma qual a possvel
concentrao do cido actico no vinagre.

3.1.3 Calibrao com padres externos


Um padro externo preparado separadamente da amostra.
Padres externos so empregados para se calibrar instrumentos e
procedimentos quando no h efeitos interferentes advindos dos
componentes matriz presentes na soluo do analito. Uma srie de
padres externos contendo o analito em concentraes conhecidas
preparada. De forma ideal, trs ou mais solues so utilizadas em
um processo de calibrao.
A calibrao realizada pela obteno do sinal de resposta
(absorbncia, altura do pico, rea do pico/banda, etc.) como uma

calibrao

funo da concentrao conhecida do analito. Uma curva de calibrao (ou curva analtica) preparada construindo-se um grfico a partir dos dados ou ajustando-os a uma equao matemtica adequada,
como aquela empregada no mtodo dos mnimos quadradados.
y = a + bx ou sinal = a + b.conc

(3.1)

O prximo passo a etapa de previso, em que o sinal obtido da


amostra usado para encontrar a concentrao do analito:
conc =

1
(sinal a)
b

(3.2)

A qualidade da determinao da concentrao de uma amostra


desconhecida est condicionada relao entre os pontos experimentais obtidos pela medida de concentraes conhecidas com o sinal do
aparelho.2222

3.1.4 Mtodo dos Mnimos Quadrados ou Quadrados Mnimos Ordinrios


Uma curva de calibrao tpica mostrada na Figura 3.1 para
a determinao de uma amostra arbitrria. Inicialmente, vamos considerar que o ajuste dos dados colocados no grfico seja uma funo
linear representados pela equao da reta:
y = a + bx

(3.3)

Figura 3.1: Curva de calibrao tpica

Os mnimos quadrados se refere ao valor residual obtido


pela diferena vertical (distncia) entre dados experimentais e o modelo terico (geralmente representado por uma linha que passa na

59

60

quimiometria com r

mdia dos pontos experimentais). A obteno do modelo terico tem


como base a distribuio normal dos pontos que compem a curva
de calibrao. A Figura 3.2 mostra como seria os pontos mdios dentro de uma srie de distribuies normais numa curva de calibrao.
Figura 3.2: Representao dos pontos
de uma curva de calibrao com as
respectivas distribuies normais.
Adaptada de Thompson e Lowthian
(2011)

Cada distncia, d, determinada da seguinte forma:


d = y yb

(3.4)

em que yb o valor previsto pelo modelo terico, sendo encontrado


da forma:
yb = a + bx
(3.5)
Substituindo a equao 3.4 na equao 3.5 temos
d = y a bx

(3.6)

d2 = (y a bx)2

(3.7)

Em termos globais tem-se

Ao trmino de uma regresso linear tem-se a curva mostrada


na Figura 3.3. Nota-se o aparecimento de um resduo, cujo valor est
diretamente relacionado ao processo de minimizao da linha terica
e os pontos experimentais. O processo de minizao obtido por
N

SSresidual =

[yi (a + bxi )]2

(3.8)

i =1

N o nmero de pontos utilizados na construo da curva de calibrao.


Portanto, a equao da reta na curva de calibrao dada
por
y = a + bx + erro
(3.9)

calibrao

61

Figura 3.3: Representao de uma curva


de calibrao tpica aps a realizao de
uma regresso linear. Fonte: Hibbert e
Gooding (2006)

3.2

Curva de calibrao no R

O mtodo dos mnimos quadrados, ou Mnimos Quadrados


uma tcnica de otimizao matemtica que procura encontrar o melhor ajuste para um conjunto de dados tentando minimizar a soma
dos quadrados das diferenas entre o valor estimado e os dados observados (tais diferenas so chamadas resduos). Um requisito para
o mtodo mnimos quadrados que o fator imprevisvel (erro) seja
distribudo aleatoriamente, essa distribuio seja normal e independente. Outro requisito que o modelo seja linear nos parmetros; ou
seja, as variveis apresentam uma relao lienar entre si.
Inicialmente devemos estabelecer um critrio para a obteno da equao y = ax + b, para a obteno dos coeficientes a e b. Os
desvios individuais correspondem diferena entre a medida real da
medida experimental e a medida aproximada pela reta de regresso.
O somatrio dos quadrados dos desvios mostrado abaixo:
n

i =1

i =1

d2i = (yi yc )2

(3.10)

yi o valor observado de y e yc valor calculado de y na funo linear.


Os coeficientes da reta so calculados pelas frmulas abaixo:
a=

n in=1 xi yi in=1 xi in=1 yi


n in=1 xi2 (in=1 xi )2

(3.11)

in=1 yi a in=1 xi
(3.12)
n
A equao linear pode ser obtida no R por meio da funo
lm() que serve para calcular a regresso linear simples.
b=

62

quimiometria com r

Exemplo 3.2 Os dados na Tabela 3.1 foram obtidos durante uma determinao colorimtrica de glicose em soro sanguneo. Considerando uma relao
linear, encontre as estimativas por mnimos quadrados da inclinao e do
intercepto.
Conc. glicose (mmol L1 )
0,0
2,0
4,0
6,0
8,0
10,0

Absorbncia, A
0,002
0,150
0,294
0,434
0,570
0,704

O primeiro passo para construir a curva de calibrao no R a primeira


coisa a ser feita a entrada dos dados:
> x < c(0,2,4,6,8,10)
> y < c(0.002,0.150,0.294,0.434,0.570,0.704)
Vamos criar um data.frame
> dados=data.frame(x,y)
Verifique se o data.frame foi criado com o comando
> is.data.frame(dados) se aparece o resultado
[1] TRUE
significa que o data.frame foi criado.
Agora vamos fazer a regresso linear. Para isso, basta digitar
> regressao=lm(y x,data=dados)
Ao digitar essa expresso o comando lm() ir atribuir regresso os
resultados da regresso linear.
Digitando agora:
> regressao
Teremos como resposta
Call:
lm(formula = y x, data = dados)
Coefficients:
(Intercept) x
0.008286
0.070143
ou seja
y = 0, 008286 + 0, 070143x
Agora ao digitar
> summary(regressao)
Obteremos como resposta dados mais completos a respeito da regresso
linear
Call:
lm(formula = y x, data = dados)
Residuals:

Tabela 3.1: curva de calibrao da


determinao colorimtrica da glicose
em soro sanguneo

calibrao

1
-0.0062857
Coefficients:

2
0.0014286

3
0.0051429

4
0.0048571

5
0.0005714

6
-0.0057143

Estimate Std. Error


t value
Pr(>|t|)
(Intercept) 0.008286
0.004039
2.051
0.11
x 0.070143
0.000667 105.161 4.9e-08 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.005581 on 4 degrees of freedom
Multiple R-squared: 0.9996, Adjusted R-squared: 0.9995
F-statistic: 1.106e+04 on 1 and 4 DF, p-value: 4.903e-08
Os dados completos da regresso mostram i) os "Resduos"que fornece a diferena entre os sinais experimentais e previstos; ii) As estimativas
dos coeficientes do modelo juntamente com os desvios padro; iii) valor de
t e iv) probabilidade para a hiptese nula de que os coeficientes tm valores
de zero. No nosso exemplo, verifica-se que a intercepo e inclinao so diferentes. Na parte inferior encontramos o desvio padro sobre a regresso, o
coeficiente de correlao e um resultado de teste F da hiptese nula de que a
MSreg / MSres 1.
Em uma regresso linear necessrio verificar suas tendncias
para isso basta digitar:
> layout(matrix(1:4,22))
> plot(regressao)
A Figura 3.4 mostra a tendncia da regresso linear. possvel
observar que a esquerda um grfico dos erros residuais plotados versus seus
valores ajustados. Para ter uma boa curva de calibrao os resduos devem
ser distribudos aleatoriamente em torno da linha horizontal que representa
um erro residual de zero, isto , no deve haver uma tendncia ntida da
distribuio de pontos.
Na parte esquerda inferior da Figura 3.4 um grfico QQ padro,
que deve sugerir que os erros residuais so normalmente distribudos. J
parte superior a direita mostrado um grfico da contendo a raiz quadrada
dos resduos padronizados (uma espcie de raiz quadrada do erro relativo)
como uma funo dos valores ajustados. Mais uma vez, no deve haver qualquer tendncia evidente neste grfico. Por fim, na parte inferior a direita
mostra uma medida da importncia na determinao do resultado de regresso. possvel observar nesse grfico linhas de contorno para a distncia de
Cook, que outra medida da importncia de cada observao para a regresso. Distncias menores significa que a remoo da observao tem pouco
efeito sobre os resultados da regresso. Distncias maiores que 1 sugerem a
presena de possvel outlier possvel ou um modelo pobre.
Alm disso, o Multiple R-squared e Adjusted R-squared so bastante similiar indicando que a equao da reta encontrada pelo mtodo dos
mnimos quadrados pode ser utilizada tranquilamente para encontrar a
concentrao de amostras desconhecidas de soro sanguneo.

63

64

quimiometria com r

Figura 3.4: Tendncias observadas na


curva de calibrao

Exerccio 3.1 A forma reduzida da nicotinamida adenina dinucleotdeo


(NADH) uma coenzima importante e altamente fluorescente. Apresenta
uma absoro mxima a 340 nm. As solues padro de NADH forneceram
as seguintes intensidades de fluorescncia:
Conc. padro NADH mol L1 Intensidade relativa
0,100
2,24
0,200
4,52
0,300
6,63
0,400
9,01
0,500
10,94
0,600
13,71
0,700
15,49
0,800
17,91
Encontre a inclinao e o intercepto da curva de calibrao. Faa uma
avaliao completa da curva de calibrao no R.

Exerccio 3.2 Amostras de gua de igarap foram analisadas por ICP-MS


em um estudo multielementar. O vandio foi um dos elementos determinados e sua curva de calibrao se encontra abaixo:

calibrao

Conc. padro vandio pg mL1 Intensidade, unidades arbitrrias


0,00
2,1
2,00
5,0
4,00
9,2
6,00
12,5
8,00
17,4
10,00
20,9
12,00
24,7
Determine a equao da reta dessa curva de calibrao. Encontre os
desvios padro da inclinao e do intercepto. Faa uma avaliao completa da
curva de calibrao no R
Exerccio 3.3 Verifique se a curva de calibrao abaixo pode ser usada para
a determinao do analto de sdio.
Cs (mol L1 )
0,000
0,100
0,200
0,300
0,400
0,500

Sinal
0,00
12,36
24,83
35,91
48,79
60,42

Exerccio 3.4 A sequncia de dados abaixo foi obtida de uma provvel


curva de calibrao de Cd2+ :
[Cd2+ ] (mol L1 ) 15,4 30,4 44,9 59,0 72,7 86,0
Absorbncia
4,8 11,4 18,2 26,6 32,3 37,7
Construa uma curva de calibrao para os dados acima e verifique a
possibilidade de sua utilizao em uma anlise de Cd2+
Exerccio 3.5 Em um laboratrio de eletroanaltica foram feitos vrios
testes para o desenvolvimento de uma metodologia para analisar chumbo em
amostras de ar. Os resultados abaixo uma das curvas de calibrao obtida
por essa metodologia:
Alta do pico
Conc. Pb ng g1

1,4
2,4

3,8
2,5

7,5
1,3

10,2
1,3

11,7
0,7

15,0
1,2

Utilizando a regresso linear do R avalie a qualidade da curva de calibrao


da metodologia desenvolvida para a determinao de chumbo.
Exerccio 3.6 O mesmo laboratrio do exerccio 3.5 resolveu analisar a
mesma amostra, s que desta vez, usando a espectrometria do ultravioletavsivel (Uv-vis). Os resultados da curva de calibrao so apresentados
abaixo:
Absorbncia
Conc. Pb ng g1

0,05
10

0,17
25

0,32
50

0,60
100

1,07
200

1,40
300

65

66

quimiometria com r

Utilizando a regresso linear do R avalie a qualidade da curva de calibrao da espectrometria do Uv-vis. Compare os seus resultados com aqueles
obtidos no exerccio 3.5.

3.2.1 Usos da curva de calibrao


Dentre os usos da curva de calibrao, o mais utilizado a
determinao da concentrao, dita anteriormente e expressa pela
equao 3.2 (pg. 59). Vamos considerar alguns exemplos para reforar o uso da curva de calibrao na determinao da concentrao.
Exemplo 3.3 O mangans foi determinado em amostras de interesse geolgico por fluorescncia de raios X. A curva de calibrao apresentou os
seguintes valores:
% padro Mn
Intensidade pico Mn

0,00 0,10
80
106
Pergunta-se:

0,20
129

0,30
154

0,40
167

1. Faa a regresso linear e estabelea a qualidade da curva de calibrao.


2. Calcule a concentrao de Mn presente numa amostra cuja intensidade
medida na fluorescncia de raios X foi de 145.
Primeiramente temos que encontrar a equao da reta da curva de calibrao.
Para isso, temos que utilizar o mesmo procedimento anterior; ou sejal, a
funo lm(). Vamos l:
Entrada de dados:
> Conc<-c(0, 0.1,0.2,0.3,0.4)
> Int<-c(80, 106, 129, 154, 167)
Regresso
>dados=data.frame(Int,Conc)
>is.data.frame(dados)
[1] TRUE
> regressao=lm(Int Conc,dados)
> summary(regressao)
Call:
lm(formula = int padrao, data = dados)
Residuals:
1
-2.8

Coefficients: (Intercept)
padrao

2
1.0

3
1.8

Estimate
82.800
222.000

4
4.6

5
-4.6

Std. Error
3.298
13.466

t value
25.10
16.49

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Pr(>|t|)
0.000139
0.000486

**
***

calibrao

Residual standard error: 0.01908 on 3 degrees of freedom


Multiple R-squared: 0.9891, Adjusted R-squared: 0.9854
F-statistic: 271.8 on 1 and 3 DF, p-value: 0.0004857
Em princpio, os resultados da regresso linear mostram que tem uma
curva de calibrao com valores bastante satisfatrios. Caso tenha dvida
basta digitar:
> layout(matrix(1:4,22))
> plot(regressao) l e/ou
> layout(matrix(1:1,11))
> plot(padrao int,dados)
> abline(regressao)
A curva de calibrao apresentada na Figura 3.5. Nota-se claramente
que a interseo da curva de calibrao. A equao da reta dessa curva de
calibrao
int = 222conc + 82, 8
Portanto, a concentrao de Mn pode ser calculada da seguinte forma:

[ Mn] =

Intensidade + 0, 367
0, 00446

Como a intensidade 145 a concentrao de Mn:

[ Mn] =

145 82, 8
= 0, 28
222

Figura 3.5: Curva de calibrao do


exemplo 3.3

67

68

quimiometria com r

Exerccio 3.7 Em uma anlise usual de protena, um corante se liga


protena e a cor do corante muda de marrom para azul. A intensidade da
cor azul proporcional quantidade de protena presente. Com os dados da
curva de calibrao abaixo, determine a concentrao de uma amostra de
protena cuja absorbncia foi de 0,973. Expresse seu valor em micrograma de
proteina.
Protena (g)
Absorbncia

0,00
0,466

9,36
0,676

18,72
0,883

28,08
1,086

37,44
1,280

Exerccio 3.8 Em uma anlise instrumental foram obtidos os seguintes


resultados:
Conc.
Sinal

0
0,2

1
3,6

2
7,5

3
11,5

4
15,0

5
17,0

6
20,4

7
22,7

8
25,9

9
27,6

10
30,2

Faa a curva de calibrao e encontre a concentrao correspondente aos


sinais 5,16 e 27 unidades.
Existe uma concordncia na literatura de que a sensibilidade
de um instrumento ou de um mtodo uma medida de sua habilidade em discriminar entre pequenas diferenas na concentrao de
um analito. Dois fatores limitam a sensibilidade:
1. A inclinao da curva de calibrao;
2. A reprodutibilidade ou preciso do dispositivo de medida
Para dois mtodos que tenham a mesma preciso, aquele que
tem a curva de calibrao mais inclinada ser o mais sensvel. A
Figura 3.6 mostra o efeito da inclinao sobre a sensibilidade do
mtodo; ou seja, observa-se uma mudana para alguns casos significativa dependendo da curva de calibrao. Nota-se que a inclinao
s uma forma de mostrar que a sensibilidade de uma curva de calibrao diferente de outra. O uso da inclinao falha como uma
figura de mrito para considerar a preciso das medidas individuais
em uma curva de calibrao.
Como uma curva de calibrao no "fixa"; ou seja, o erro
de uma regresso reflete na senbilidade. Se os sinais de um instrumento analtico so referentes aos valores de concentrao mais baixo
a sensibilidade ser diferente dos mais altos. Mandel e Stiehler (1954)
reconheceram a necessidade de incluir a preciso em uma definio matemtica de sensibilidade, para isso foi proposta a seguinte
definio de sensibilidade analtica, :
=

coe f iciente angular


dp das medidas

(3.13)

O que sensibilidade? A sensibilidade de um instrumento ou mtodo


uma medida da sua habilidade em
discriminar pequenas diferenas na
concentrao do analito.

calibrao

69

Figura 3.6: Efeito da inclinao sobre a


sensibilidade do mtodo em uma Curva
de calibrao

A sensibilidade analtica oferece a vantagem de ser relativamente imune aos fatores de amplificao. Por exemplo, o aumento do
ganho de um instrumento por um fator cinco produz um aumento
de cinco vezes no valor do coeficiente angular. Normalmente, esse
aumento ser acompanhado por um aumento corresponde no desvio
padro da medida. Apesar da nova situao a sensbilidade permanece praticamente a mesma.
Exemplo 3.4 Uma srie de medidas de fluorescncia foram realizadas para
a determinao de solues cidas de quininas. Abaixo est apresentada os
dados da curva de calibrao:
Conc. ng mL1
Intensidade

0
4

10
22

20
44

30
60

40
75

50
104

Aps a construo da curva foram feitas trs medidas referente a uma triplicata, cujos valores das intensidades foram 44, 46 e 47. Diante dessas
informaes, utilize o R para determinar a sensibilidade do mtodos usado
para fazer as medidas de quininas.
Primeramente - Realizar regresso linear no R > conc<-c(0, 10,20,30,40,50)
> int<-c(4,22,44,60,75,104)
> dados=data.frame(int,conc)
> is.data.frame(dados)
[1] TRUE
> regressao
Call:
lm(formula = int conc, data = dados)
Coefficients:
(Intercept)
3.286

conc
1.929

70

quimiometria com r

> summary(regressao)
Call:
lm(formula = int conc, data = dados)
Residuals:
1
2
3
4
5
6
0.7143 -0.5714 2.1429 -1.1429 -5.4286 4.2857
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.28571
2.67325
1.229
0.286
conc
1.92857
0.08829
21.842 2.6e-05 ***

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1


Residual standard error: 3.694 on 4 degrees of freedom
Multiple R-squared: 0.9917, Adjusted R-squared: 0.9896
F-statistic: 477.1 on 1 and 4 DF, p-value: 2.6e-05
> plot(conc,int)
> abline(regressao)
> layout(matrix(1:4,22))
> plot(regressao)
Depois de toda essa avaliao vamos calcular a sensibilidade para as
medidas 44, 46 e 47 na curva de calibrao. Antes do clculo propriamente
dito temos que calcular o desvio padro:
>med<-c(44,46,47)
> sd(med) [1] 1.527525
Agora temos condies de calcular a sensibilidade dos pontos pela equao
3.13
coe f iciente angular
1.929
=
=
= 1, 26
dp das medidas
1.527525
Exerccio 3.9 A quantidade de chumbo presente na gua de chuva foi
determinada por espectrometria de absoro atmica. O qumico que realizou
as medidas forneceu a seguinte curva de calibrao:
Conc. ng mL1
Absorbncia

10
0,05

25
0,17

100
0,22

200
0,60

300
1,40

Perde-se
1. Faa a curva de calibrao;
2. Avalie a qualidade da curva de calibrao;
3. Expresse a curva de calibrao;
4. Sabendo que foram realizada 3 medidas, cujos absorbncias foram 0,18,
0,19 e 0,20 calcule a sensibilidade do mtodo.
Exerccio 3.10 Os dados da curva de calibrao abaixo foram obtidos de
uma anlise qumica de um metal raro. Determine a sensibilidade, sabendo
que as medidas de concentrao apresentam um desvio padro de 0,5.

calibrao

Conc. mg mL1
Sinal

0
1

10
263

20
531

30
801

40
1053

71

50
1333

Dentre as limitaes de uma curva de calibrao, a quantidade mnima a ser determinada uma questo motivo de discusso.
A quantidade mnima ou limite de deteco (L D ) mostra uma das
limitaes da lei de Beer. Segundo a lei de Beer
A = eCL

(3.14)

Na equao 3.14 prevista entre a concentrao zero e o primeiro ponto da curva de calibrao uma linha reta. No entanto,
podemos perceber at aqui, que esse comportamento nem sempre
chegar ao zero aps uma regresso linear. Por motivo bvio, a oscilao devida ao erro indeterminado limita a chegada da linha reta da
regresso ao zero, quando passa existe uma incerteza nas medidas.
Outro fator que causa a oscilao o prprio L D , cuja definio
dada como a concentrao ou massa mnima de analito que pode ser
detectada em um nvel confivel.
Este limite depende da razo entre a magnitude do sinal do
analito e o tamanho das flutuaes estatsticas do sinal do branco.
Isto , a menos que o sinal analtico seja maior que o branco por um
fator mltiplo de k da variao no branco devido aos erros aleatrios,
impossvel de detectar o sinal analtico com certeza. Na verdade, o
L D um conceito qualitativo, pois 50% das medidas efetuadas neste
limiar so indistinguveis do branco. A Figura 3.7 mostra como seria
o L D ; ou seja, a sua localizao se encontra entre o branco e o limite
de quantificao.

O que limite de deteco?


O limite de deteco a concentrao
mnima do analito que pode ser detectada em um dado nvel de confiana.

Figura 3.7: Representao estatstica do


limite de deteco. Adaptada: Miller e
Miller (2005)

Assim que o L D for atingido, o sinal analtico e o seu desvio


padro se aproximam do sinal do branco (Sbr ) e de seu desvio padro
(dpbr ). O sinal analtico mnimo distinguvel Sm ento tomado como

72

quimiometria com r

a soma do sinal mdio do branco (Sbr ) mais um mltiplo de k do


desvio padro (limite de confiana) do branco Sbr . Assim
Sm = Sbr + kSbr

(3.15)

Sendo que Sbr e Sbr calculado da seguinte forma:


Sbr =
s
Sbr =

iN=1 bri
N

(3.16)

iN=1 (bri Sbr )2


N1

(3.17)

Experimentalmente, Sm pode ser determinado por medidas do branco br repetidas vezes, entre 20 e 30 vezes. Os dados
resultantes so tratados estatisticamente para obter Sbr e Sbr . A
utilizao de k = 3 permite uma confiana nvel de 99,86% em que
Sm (Sbr + 3Sbr ) para uma medida baseada no erro do sinal de
um branco que segue a distribuio normal. Deve ser enfatizado que
se Sbr no segue uma normal distribuio, ento a probabilidade de
Sm (Sbr + 3Sbr ) deve ser 100(1 k12 ), ou 89%. Assim, Os valores
de k <3 no devem ser utilizados para o clculo de L D . Na maioria
das vezes k=3 tem sido usado para o clculo do L D . Geralmente a
equao 3.15 usada da seguinte forma:
Sm = Sbr + 3Sbr

(3.18)

Finalmente, o coeficiente angular da curva de calibrao e


usada para encontrar a concentrao do L D :
LD =

Sm Sbr
Coe f iciente angular

(3.19)

Substituindo a equao 3.18 em 3.19 tem-se


LD =

3Sbr
Coe f iciente angular

(3.20)

Exemplo 3.5 Um novo equipamento foi desenvolvido por um aluno de


doutorado para a determinao de fsforo em gua eutrofizada. Abaixo so
apresentadas as medidas de valor do branco e uma curva de calibrao.
Usando o R encontre o L D
0,012

0,056

0,004

g1

Conc. mg
Absorbncia

Absorbncia do branco
0,022 0,015 0,011 0,042

Curva de calibrao
0,00 0,50
1,25
2,00
0.00 0,514 0,993 1,486

0,094

3,00
2,044

0,089

4,00
2,342

0,055

calibrao

Para determinar o L D inicialmente temos que encontrar duas variveis: o desvio padro do branco (Sbr ) e o coeficiente angular da curva de
calibrao.
Clculo do desvio padro do branco no R
Entrada dos dados do branco
>branco<-c(0.012, 0.056, 0.004, 0.022, 0.015, 0.011, 0.042, 0.094, 0.089,
0.055)
Clculo do Sbr
>sd(branco)
[1] 0.03278211
Clculo do coeficiente angular
Entrada dos dados
> conc<-c(0,0.50,1.25,2,3,4)
> abs<-c(0,0.514,0.993,1.486,2.044,2.342)
> dados=data.frame(abs,conc)
> is.data.frame(dados)
[1] TRUE
> regressao=lm(abs conc,dados)
> regressao
Call:
lm(formula = abs conc, data = dados)
Coefficients:
(Intercept) conc
0.1830
0.5843
Qualidade da curva de calibrao
> summary(regressao)
Call:
lm(formula = abs conc, data = dados)
Residuals:
1
-0.18302

2
0.03885

3
0.07965

4
0.13444

5
0.10817

6
-0.17810

Coefficients:

(Intercept)
conc

Estimate
0.18302
0.58427

Std. Error
0.10691
0.04718

t value
1.712
12.385

Pr(>|t|)
0.162084
0.000244

***

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1


Residual standard error: 0.1603 on 4 degrees of freedom
Multiple R-squared: 0.9746, Adjusted R-squared: 0.9682
F-statistic: 153.4 on 1 and 4 DF, p-value: 0.0002443
Os dados da curva de calibrao mostram que sua qualidade
baixa, mas o que em princpio ir refletir no clculo do L D do mtodo desen-

73

74

quimiometria com r

volvido pelo aluno. Calculando teremos:


LD =

3.0, 0328
= 0, 1682 mg g1
0, 5843

O resultado mostra que o L D do mtodo desenvolvido pelo aluno relativamente alto para os padres exigidos atualmente.
Exerccio 3.11 Os resultados abaixo se referem determinao de prata por
espectrometria de absoro atmica.
0,0052

0,0033

Conc. ng g1
Absorbncia

0,008

0,00
0.003

0,006

Absorbncia do branco
0,0031 0,0006 0,0035

Curva de calibrao
5
10
15
0,127 0,251 0,390

20
0,498

0,0095

25
0,625

0,0085

30
0,763

Baseado nas informaes acima determine o L D da anlise de prata.


Exerccio 3.12 Uma anlise pelo mtodo dos mnimos quadrados de uma
curva de calibrao para a determinao de chumbo resultou na sequinte
equao da reta:
S = 1, 12c Pb + 0, 312
c Pb representa a concentrao de chumbo em partes por milho e S uma
medida de intensidade relativa da linha de emisso do chumbo. A tabela
abaixo mostra alguns dados derivados das medidas de chumbo.
Conc. Pb (ppm)
10,000
1,000
0,000

Nmero de repetio
10
10
24

valores mdios de S
11,62
1,12
0,0296

desvio padro
0,1500
0,0250
0,0082

Baseado nos dados acima calcule o L D


Exerccio 3.13 Os dados abaixo so referente determinao de ortofosfato
(H3 PO4 ) presente em gua de igarap.
Conc. H3 PO4
0,00
2,00
6,00
10,00
14,00
18,00

Sinal analtico
0,031
0,173
0,422
0,702
0,956
1,248

desvio padro
0,0079 (n=25)
0,0094
0,0084
0,0084
0,0085
0,0110

1. Calcule a sensibilidade da curva de calibrao


2. Diferente do branco, as outras medidas foram realizadas cinco vezes.
Diante dessas informaes, calcule a sensibilidade em cada medida.

0,0005

calibrao

3. calcule o coeficiente de variao das medidas


4. qual o limite de deteco do mtodo?
Exerccio 3.14 A resposta de um teste colorimtrico para glucose foi avaliada com a ajuda de solues padro. Aps 30 medidas o branco apresentou
como desvio padro o valor de 0,005. Utilize a concentrao de calibrao a
seguir para determinar o L D :
g1

Conc. ng
Absorbncia

Curva de calibrao
0,00
2
4
6
0.002 0,150 0,294 0,434

8
0,570

10
0,704

Exerccio 3.15 Lcker, Failing e Schmidt (2000) usando amostras brutas


mediu a concentrao de Cd diretamente por ETAAS no comprimento de
onda de 228,8 nm. Para determinar o valor de L D os autores utilizaram 40
medidas de brancos encontrando o valor de 0,0013 ng mg1 para uma curva
de calibrao de y = 0,42x - 0,0002. Diante dessas informaes, calcule o
desvio padro do branco.
Exerccio 3.16 Um novo programa de computador foi desenvolvido para
um espectrmetro de absoro atmica com forno de grafite pela equipe de
programao de uma indstria de equipamentos qumicos. Para verificar a
qualidade dos resultados do novo programa Kuselman et al. (1997) resolveram usar uma soluo padro de chumbo. A Tabela abaixo apresenta valores
referentes anlise de chumbo obtida do programa considerado tima e do
novo.
Conc. Pb (ppb)
Programa Padro (altura pico)
Programa Novo (altura pico)

0,0
0,011
0,015

5
0,056
0,060

10
0,104
0,113

20
0,188
0,188

30
0,267
0,281

1. Determine a sensibilidade da curva nos dois mtodos.


2. Calcule a concentrao nas duas curvas para as alturas de pico de 0,234 e
0,248.
3. Discuta os valores de concentrao obtidos anteriormente.
4. Sabendo que o desvio padro para o programa padro foi de 0,003 e do
programa novo de 0,02, calcule os L D para os dois programas.
Nem sempre uma curva de calibrao contendo todos os parmetros aceitveis para uma medida analtica pode ser recomendada.
Isso porque a resposta de uma medida analtica ter mais confiabilidade se estive livre de interferncias. Infelizmente, nenhum mtodo
analtico est totalmente livre de interferncias de outras espcies, e
frequentemente so necessrias diversas etapas para se minimizar os

40
0,337
0,370

75

76

quimiometria com r

seus efeitos. A Figura 3.9 representa uma medida contendo o analto


e uma interferncia; ou seja o sinal analtico registrado no aparelho se
refere a dois componentes (analitio e interferncia).
Figura 3.8: Efeito da interferncia
sobre uma Curva de calibrao. Fonte:
Olivieri et al. (2006)

Para o entendimento da seletividade vamos utilizar a situao em que um analito composto dentre outras espcies A, B e C.
B e C so inteferentes em potencial de A. Se c A ,c B e cC so as concentraes das trs espcies e m A , m B e mC so suas sensibilidades de
calibrao, ento o sinal instrumental total dever ser dado por
Sinal = m A c A + m B c B + mC cC + intercepto

(3.21)

Definindo coeficiente de seletividade para A com relao a B como


k B,A =

mB
mA

(3.22)

O coeficiente de seletividade representa a resposta relativa do mtodo espcie B quando comparado com A. Um coeficiente similar
para A com relao a C seria:
k C,A =

mC
mA

(3.23)

substituindo as equaes 3.22 e 3.23 em 3.21 tem-se:


Sinal = m A (c A + k B,A c B + k C,A cC ) + intercepto

3.3

(3.24)

Calibrao multivariada

A aplicao de modelos univariados, como a curva de calibrao anterior restrita a situaes em que a concentrao do analto
no tem interferncias, sendo medida diretamente no sistema (ex.:
absorbncia de um analito). Os possveis interferentes no causam
desvios na linearidade das medidas do analito; ou seja, a determinao da concentrao est diretamente relacionada com a propriedade
de interesse do analito.
Na Calibrao Multivariada duas ou mais respostas instrumentais so relacionadas com o analito. Esses mtodos possibilitam
anlises na presena de interferentes, determinaes simultneas,

Seletividade se refere a extenso que o


mtodo pode ser usado para determinar analitos em misturas ou matrizes
sem interferncias de outros componentes de comportamento similar.

calibrao

77

anlises sem resoluo etc. Capacidade que torna a calibrao multivariada seja uma alternativa vivel quando os mtodos univariados
no podem ser aplicados. Diversos modelos de calibrao multivariada so utilizados atualmente, destacam-se Regresso Linear Mltipla (MLR), Regresso por Componentes Principais (PCR) e Regresso
por Mnimos Quadrados Parciais (PLS).
Figura 3.9: Esquema geral para a
realizao de uma Curva de calibrao.
Fonte: Ferreira et al. (1999)

3.4

Mnimos Quadrados Parciais - PLS

Este o mtodo normalmente utilizado em anlises de calibrao multivariada. Neste mtodo, os sinais multivariados, como os
valores de absorbncias medidos em diferentes comprimentos de
onda do espectro na regio do ultravioleta (variveis x) e concentraes das vitaminas nas amostras (variveis y), so utilizados para
estabelecer um modelo de regresso linear. Para a construo do
modelo de calibrao, os dados so dispostos na forma de matrizes:
Matriz X e Matriz Y que contm os dados de variveis independentes
x e dependentes y, respectivamente. Estas matrizes so decompostas
em uma soma de produtos de dois vetores, os "scores"e os "loadings",
obtendo-se os seguintes modelos:
N

X = TP + E =

ti pit + E

i =1

(3.25)

78

quimiometria com r

X = TQ + F =

ti qit + F

(3.26)

i =1

T corresponde matriz de "scores", P e Q so os "loadings"para X


e Y, respectivamente e E e F representam os erros, ou falta de ajuste
do modelo. O sobrescrito t indica a matriz transposta. Uma relao
entre os dois blocos (variveis independentes X e variveis dependentes Y) pode ser realizada correlacionando-se os "scores"dos blocos X
e Y. Para que se encontre melhor correlao possvel, torna-se importante manipular a informao desses dois blocos simultaneamente.
No PLS isto feito por uma leve rotao das componentes
principais (devido a esta rotao, so chamadas agora de variveis
latentes), com conseqente mudana nos valores dos "scores". O
nmero de variveis latentes utilizado no processo de calibrao
obtido por meio de validao cruzada, que uma metodologia baseada na magnitude dos erros de previso de um dado modelo de
calibrao. Depois de estabelecidos o nmero de variveis latentes
e o modelo, este pode ser destinado previso de concentrao de
novas amostras. A concentrao de novas amostras pode ser estimada a partir dos novos "scores"T* e dos "loadings"Q do modelo de
calibrao, que podem ser substitudos na equao 3.26, obtendo-se
Yn = T Qt

(3.27)

Normalmente o PLS assume uma relao linear entre os parmetros analisados. Pequenos desvios da linearidade so aceitveis,
ou seja, o modelo capaz de dar uma boa previso desde que mais
variveis latentes sejam incorporadas ao modelo. Contudo, quando
substancial no-linearidade est presente nos dados analisados, erros considerveis so obtidos. Nestes casos, modelos de calibrao
no-lineares como as redes neurais artificiais so mais adequados.
Redes neurais artificiais (RNAs) o nome dado a um conjunto de mtodos matemticos e algoritmos computacionais especialmente projetados para simular o processamento de informaes e a
aquisio de conhecimentos do crebro humano. A rede realiza este
trabalho "aprendendo"como o sistema em estudo se comporta e, ento, aplica este conhecimento a novos dados de entrada para predizer
a sada desejada. Este mtodo de calibrao multivariada empregado principalmente na anlise de dados no-lineares, embora algumas aplicaes em casos de dados lineares possam ser encontradas.
Uma das principais vantagens em relao aos mtodos paramtricos
sua maior flexibilidade para o tratamento dos dados e a obteno
de um modelo de calibrao.

4
Sinal Analtico
Toda medida analtica constituda por dois componentes. O
primeiro denominado sinal que permite obter informaes sobre o
analito e o segundo, conhecido como rudo, interfere diretamente
na medida. Em qumica analtica, os sinais mais freqentemente
encontrados so: espectros, voltamogramas, registros de um pHmetro em funo do tempo, etc.
Infelizmente, a maioria dos sinais provenientes de instrumentos analticos apresentam-se contaminados (digamos, sobrepostos) com rudo, o que dificulta a interpretao e modelagem das propriedades associadas estes sinais. Tipicamente o rudo instrumental
afeta os limites de deteco, de deciso e de determinao, figuras de
mrito extremamente importantes na avaliao do desempenho de
instrumentos e mtodos analticos.

4.1

A razo sinal/rudo

O efeito do rudo sobre um sinal mostrado na Figura 4.1


cujo registro grfico de uma corrente contnua pequena igual a cerca
de 1015 . A Figura 4.1b um grfico terico da mesma corrente na
ausncia do rudo. A diferena entre os dois grficos corresponde ao
rudo associado medida.
Na maioria das medidas, a amplitude mdia do rudo N
constante e indenpende da magnitude do sinal S. O efeito do rudo
aumenta medida que a quantidade a ser medida decresce em sua
magnitude. Por esse motivo, a razo sinal/rudo em sua magnitude
utilizada para descrever a qualidade de um mtodo analtico ou o
desempenho de um equipamento. Muitas medidas feitas nos laboratrios necessitam de poucos esforos para que se mantenha a razo
sinal/rudo em um nvel aceitvel. Os exemplos incluem as determinaes de massas realizadas ao longo de uma sntese qumica ou a
comparao de cor feita ao se determinar a quantidade de cloro na
gua de uma piscina. Nos dois casos, os sinais geralmente so in-

80

quimiometria com r

Figura 4.1: Efeito do rudo sobre uma


medida de corrente: (a) papel de
registrador mostrando o resultado experimenal da medida de uma corrente
contnua de 0, 9x1015 A, (b) mdia
terica das flutuaes. Fonte: Holler,
Skoog e Crouch (2009)

tensos em relao ao rudo, e os requisitos para uma boa preciso e


exatido so mnimos.
Para um sinal de corrente contnua, como aquele mostrado
na Figura 4.1, por exemplo, a magnitude do rudo definida convenientemente como o desvio padro s de um grande nmero de
medidas de amplitude do sinal. O sinal dado pela mdia das medi
das x:
S
x
=
(4.1)
N
dp
Observe que a razo sinal/rudo, mostrada na equao 4.1, a
reciproca do erro relativo; ou seja
S
1
=
N
Erro relativo

(4.2)

A sensibilidade de uma tcnica analtica (anlises qualitativa e


quantitativa) dependem diretamente da razo S/N. Alm disso, em
termos quantitativo nos rudos tambm possvel encontrar o limite
de deteco de uma metodologia.

4.2

Classificao dos tipos de rudos

Os rudos podem ser classificados por espectros de frequncia,


por sua distribuio de amplitude e por fenmeno que os originaram.
Vejamos alguns deles:
Rudo qumico: Provm de fenmenos qumicos que ocorrem com
os analitos durante a medida. Por exemplo, variaes indetectveis
de temperatura ou de presso que afetam o equilbrio qumico, flutuaes de umidade relativa que causam alteraes na quantidade de
gua nas amostras, etc.
Rudo Jonson: Todo componente eletrnico alocado em qualquer
circuito gera um rudo entre seus terminais devido vibrao trmica

sinal analtico

dos tomos. O valor desse rudo (em volts) dado por:


Vr ( RMS) = (4kTRB)0,5

(4.3)

em que k a constante de Boltzman, T a temperatura absoluta (K),


R a resistncia do componente e B a largura de banda (em Hz)
em que o componente capaz de monitorar. Esse rudo independe
da freqncia monitorada, mas sim da largura de banda da faixa
monitorada, ou seja, se distribui uniformemente em todo o espectro,
e assim chamado rudo branco.
Este tipo de rudo torna-se particularmente crtico em detectores de radiao eletromagntica, de modo que em alguns casos
resfria-se o detector, na tentativa de minimizar esse efeito.
Rudo Shot: Devido ao fato de que a eletricidade formada
por um fluxo de eltrons, e que os mesmos, por sua vez,possuem
carga discreta, a passagem dos eltrons gera uma flutuao do campo
eltrico e consequentemente uma flutuao da corrente eltrica Se
as cargas atuam independentemente, a flutuao da corrente dada
por:
Ir ( RMS) = (2qIdc B)0.5
(4.4)
Assim como o rudo Jonson, o rudo Shot gaussiano e
branco (se apresenta em todas as freqncias).
Rudo Flicker (1/f): Os rudos Shot e Jonson so formas irredutveis de rudo, gerados de acordo com os princpios fsicos.
Existem uma srie de rudos que, adicionalmente aos rudos anteriormente mencionados, interferem nas medidas analticas. Esse tipo
de rudo possui uma distribuio aproximadamente proporcional a
1/f (tambm chamado de rudo rosa). H uma grande quantidade de
fenmenos que geram rudos Flicker, como por exemplo a corrente
catdica em tubos vcuo, a flutuao da resistncia em resistores,
devido a constituio do material com que so feitos, etc. No se
encontrou uma explicao unificada para esses tipos de rudos.
Rudo ambiental: ocorre em virtude de diversos fatores, como
fontes eletromagnticas no ambiente (estaes de rdio e TV), sistemas de ignio de motores, descargas eltricas, perturbaes na
ionosfera, etc.

4.3

Suavizao de rudo instrumental

Existem vrias estratgias que so amplamente utilizadas para


a suavizao do rudo, destacam-se mdias de sinais e filtragem.
Dentre os filtros mais utilizados temos o filtro de mdia mvel e o
filtro de Savitzky-Golay.. As duas estratgias de melhoria da qualidade da medida so comumentes encontradas nos equipamentos
comercializados no mercado.

81

82

quimiometria com r

4.3.1 Mdias de sinal


: Esse processo se basea no aumento de varreduras com adio das
medidas pontuais. Isso se deve ao fato da aleatoriadade das medidas
de rudo juntamente com o crescimento linear observado em cada
varredura, desta forma temos:
Qualidade do sinal N
Qualidade do sinal = k1 N

(4.5)

Podemos considerar que o efeito da mdia do sinal sobre


o nvel do rudo explicado pela propagao de erro. A varincia associada com a soma do erros independentes igual a soma de suas
varincias:
S2N =

Si2 = ( NSi )2

(4.6)

i =1

O desvio padro ser


dp =

( NSi )2

(4.7)

A intensidade do rudo aumenta numa taxa proporcional


raiz quadrada do nmero de varreduras:
intensidade ruido N 1/2
intensidade ruido = K2 N 1/2
Assim

s
k N
= 1 1/2 = kN 1/2
r
k2 N

(4.8)

(4.9)

Filtro de mdia mvel: tornou-se, nos ltimos anos, uma ferramenta


de uso comum para a suavizao de rudo em sinais analticos. O
motivo para tal popularidade deve-se sua simplicidade terica e a
sua incorporao a diversos softwares comerciais.
A idia bsica do mtodo dividir o sinal analtico em uma
srie de intervalos com a mesma largura, seqencialmente e ponto
ponto, e substituir o valor do ponto central do intervalo pelo valor
mdio do intervalo. O processo executado na seguinte seqncia:
1. Define-se o nmero total de pontos dos dados (n1);
2. Define-se o nmero de pontos do intervalo (n2), em que n2 um
nmero mpar;
3. Define-se a origem do sinal ( xi ),
i = I NT (

n2
)+1
2

sinal analtico

83

4.3.2 Filtro de Savitzky-Golay


: um clssico entre os filtros de suavizao de sinais analticos e
tambm encontra-se incorporado na maioria dos softwares comerciais para tratamento de dados. A idia bsica do mtodo de
Savitzky-Golay a seguinte:
1. Define-se a origem do sinal
2. Define-se a largura do intervalo
3. Define-se o ponto central do intervalo
4. Remove-se o ponto central do conjunto de pontos do intervalo
5. Ajusta-se atravs do mtodo de mnimos quadrados, um polinmio de grau varivel aos pontos restantes.
6. Utiliza-se o polinmio para estimar o valor do ponto re- movido.
7. Desloca-se o intervalo para o ponto seguinte do sinal original e
repete-se o processo anterior.
A Figura 4.2 mostra como o filtro de Savitzky-Golay funciona para suavizar os rudos existente numa medida.
Figura 4.2: Filtro de Savitsky-Golay
mostrando o seu processo de suavizao 2m + 1 = 5

Fonte: Chau
et al. (2004)
O filtro de Savitzky-Golay menos sensvel largura do
intervalo pois o novo ponto, isto , o ponto do sinal j suavizado,
obtido atravs do ajuste dos pontos do intervalo por um polinmio e
no pela simples mdia dos pontos vizinhos,como ocorre com o filtro
de mdia mvel. De modo geral a equao usada
xi =

1
2m + 1

j=m

w j xi + j

(4.10)

84

quimiometria com r

xij = a0 + a1 j + a2 j2 + + ak jk

(4.11)

( j = m, m + 1, , m; i = 1, , n)
xij = a + 0 + a1 j + a2 j2 ( j = 2, 1, 0, 1, 2; i =, , n)
i 2
x2 = ao + a1 (2) + a2 (2)2

i 1

x1 = ao + a1 (1) + a2 (1)
x0i = a0 + a1 (0) + a2 (0)2

x i +1 = a 0 + a 1 (1 ) + a 2 (1 )2

1i+2
x2 = a0 + a1 (2) + a2 (2)2

i 2
1 2 4
x 2

x i 1 1 1 1 a
0


i
0 0 a1
x0 = = 1

i +1
1
x1
1 1 a2
i +2
1
2 4
x2

(4.12)

(4.13)

(4.14)

ou
(4.15)

X=Ma
em

X=

i 2
x
2
i 1
x
1
x0i =
x1i+1
x2i+2

; M =

1
1
1
1
1

2
1
0
1
2

4
1
0
1
4

a0

; a= a1

a2

x = M(Mt M)Mt x

(4.16)

Esta caracterstica possibilita que o filtro de Savitzky-Golay


seja aplicado a sinais analticos com picos estreitos, apresentando
resultados superiores aos obtidos com o filtro de mdia mvel. Entretanto, ainda se observa distoro do sinal medida que o nmero de
pontos utilizado no intervalo aumenta.

4.3.3

Filtro de transformada de Fourier

A idia bsica deste tipo de filtro aplicar-se a transformada


de Fourier direta, dada pela Equao 3, para que se obtenha o sinal analtico representado no domnio das freqncias, ou melhor,
aplicamos a transformada de Fourier direta para obter o espectro de
freqncias F(w), do sinal analtico.
1
F (w) =
2

f ()eiw d

(4.17)

5
Anlise multivariada

5.1

Anlise de componentes principais

A tcnica de anlise de componentes principais foi incialmente


descrita por Karl Pearson (1901). Ele aparentemente acreditou que
era soluo correta para alguns dos problemas de interesse para biomtricos naquele tempo, apesar de ter proposto um mtodo prtico
de clculo para duas ou trs variveis apenas.
Uma descrio de mtodos computacionais prticos veio
muito mais tared de Hotelling (1933). Mesmo ento, os clculos eram
extremamente amedrontadores para mais do que poucas variveis
porque tinham que ser feitos mo. Somente aps os computadores
eletrnicos terem se tornado disponveis generalizadamente que a
tcnica de componentes principais alcanou amplo uso.
A PCA um dos mtodos mais importantes utilizados na
Quimiometria, tornando-se a base para diversos mtodos de reconhecimento de padres, classificao e calibrao multivariada. Normalmente, a PCA utilizada com o objetivo de visualizar a estrutura
dos dados, encontrar similaridades entre amostras, detectar amostras anmalas (outlier) e reduzir a dimensionalidade do conjunto de
dados.
A PCA um mtodo que permite a reduo da dimensionalidade atravs da representao do conjunto de dados em um novo
sistema de eixos, denominados componentes principais (PC), permitindo a visualizao da natureza multivariada dos dados em poucas
dimenses. No espao original, as amostras so pontos localizados
em um espao n-dimensional, sendo n igual ao nmero de variveis.
Com a reduo de dimensionalidade proporcionada pela PCA, as
amostras passam a ser pontos localizados em espaos de dimenses
reduzidas definidos pelas PC, por exemplo, bi- ou tridimensionais.
Matematicamente, na PCA, a matriz X decomposta em um produto
de duas matrizes, denominadas escores (T) e pesos (P), mais uma

86

quimiometria com r

uma matriz de erros (E):


X=TPT + E

(5.1)

Os escores representam as coordenadas das amostras no sistema de eixos formados pelos componentes principais. Cada componente principal constitudo pela combinao linear das variveis
originais e os coeficientes da combinao so denominados pesos.
Matematicamente, os pesos so os cossenos dos ngulos entre as
variveis originais e os componentes principais, representando,
portanto, o quanto cada varivel original contribui para uma determinada PC. A primeira componente (PC1) traada no sentido
da maior variao no conjunto de dados; a segunda (PC2) traada
ortogonalmente primeira, com o intuito de descrever a maior porcentagem da variao no explicada pela PC1 e assim por diante;
enquanto os escores representam as relaes de similaridade entre as
amostras.
A avaliao dos pesos permite entender quais variveis mais
contribuem para os agrupamentos observados no grfico dos escores.
Atravs da anlise conjunta do grfico de escores e pesos, possvel
verificar quais so os responsveis pelas diferenas observadas entre
as amostras. O nmero de componentes principais a ser utilizado
no modelo PCA determinado pela porcentagem de varincia explicada. Assim, seleciona-se um nmero de componentes de tal maneira
que a maior percentagem da variao presente no conjunto dados
originais seja capturada.

Introduo ao R

.1

Informaes gerais

O R comeou a ser desenvolvido por Robert Gentleman e Ross


Ihaka do Departamento de Estatstica da Universidade de Auckland
em Nova Zelndia, mais conhecidos por R & R, apelido do qual
originou-se o nome R do programa. O objetivo inicial de R & R,
em 1991, era produzir um software para as suas aulas de laboratrio
baseado na j revolucionria linguagem S, utilizada pelo software
comercial S-Plus criado por Jonh M. Chambers da AT&T que atualmente vem contribuindo para o aperfeioamento e ampliao das
anlises estatsticas do R.
O primeiro relato da distribuio do R foi em 1993, quando
algumas cpias foram disponibilizadas no StatLib, um sistema de
distribuio de softwares estatsticos. Com o incentivo de um dos
primeiros usurios deste programa, Martin Mchler do ETH Zrich
(Instituto Federal de Tecnologia Zurique da Sua), R & R, em 1995,
lanaram o cdigo fonte do R, disponvel por ftp (uma forma de se
transferir dados pela internet), sobre os termos de Free Software
Foundations GNU general license, que seria um tipo de licena para
softwares livres. O R distribudo livremente no site http://www.rproject.org.
Em 1997 foi formado um grupo de profissionais que tm
acesso ao cdigo fonte do R, possibilitando assim a atualizao mais
rpida do software. Desde ento o R vem ganhando cada vez mais
adeptos em todo o mundo, em parte devido ao fato de ser totalmente gratuito e tambm por ser um programa que exigi do usurio
o conhecimento das anlises que est fazendo, diminuindo assim as
chances de uma interpretao errada dos resultados.
Outro fato importante para a difuso do R a sua compatibilidade com quase todos os sistemas operacionais. O R est
disponvel para a maior parte dos MacOS, Windows a partir do 95 e
para UNIX e sistemas similares como Linux e FreeBSD.

88

quimiometria com r

.2

Instalao de R

O R pode ser instalado via o CRAN (Comprehensive R Archive


Network) ou a distribuio pode ser obtida para os sistema operacionais Windows, Linux e Mac. No caso do Ubuntu possvel instalar
diretamente do seu sistema de pacotes existente em sua biblioteca.

.3

Iniciando o R

Para iniciar o R no windows basta clicar sobre o icone ou na


parte iniciar programas, no caso do Linux basta digitar R em um
terminal ou console.

.4

Comandos Bsicos

Os comandos so realizados com auxilio de operadores e de


funes da seguinte forma: nome da funo(argumento 1, argumento
2,...,argumento N). Tenha sempre o cuidado de no utilizar acentuao nem espaos no nome da funo.

.5

Entrada de Dados Externos

Os dados contidos em planilha eletrnica ir convert-la para


ponto ou ii) alterar a configurao do editor de planilha para que
aceite o ponto como separador decimal.
De acordo com a Tabela 1, nota-se que os dados esto com o
ponto como separador decimal. Uma forma fcil de saber se o valor
digitado foi reconhecido como numrico ou no, observar o seu
posicionamento na coluna. Os caracteres so alinhados esquerda
e os numricos direita. Deve-se, ainda, evitar fazer formataes
na planilha de dados e, todas as frmulas executadas, devem ser
convertidas a valores. Como o Programa R ir reconhecer clulas em
branco que j tenham sido trabalhadas como sendo valor perdido,
para evitar possveis problemas aconselhvel copiar os valores
de entrada para uma nova planilha para depois convert-la para o
formato .csv.
Para salvar a planilha de dados no formato .csv, deve-se clicar em "Arquivo", e em "Salvar como ...", e selecionar a pasta onde o
arquivo ser salvo. Em seguida, deve-se escolher o nome do arquivo
que e o formato a ser salvo. No Excel, ser "CSV (separado por vrgula) (*.csv)"e clicar em "Salvar", aparecero duas mensagens. Clicar
"OK"na primeira e em "Sim"na segunda. No Calc, ser "Texto CSV
(.csv)"e aps clicar em "Salvar", sero exibidas trs mensagens. Clicar

introduo ao r

1
2
3
4
5
6
7
8
9
10
11
12

A
x
A
A
A
A
A
B
B
B
B
B

B
y
12.3
11.8
13.6
13
12.5
11.4
10.9
12.1
11.2
10.5

Tabela 1: Exemplo de dados externos

em "Sim", alterar a vrgula para ponto e virgula no item "Delimitador de campos"e clicar em "OK". A terceira ser um aviso, em que se
deve clicar em "OK".

.6
.6.1

Gerao e salvamento de grficos


Funes relevante para gerar grficos
plot(x)

plot(x,y)
points(x,y)
lines(x,Y)
text(x,y,"texto")

.6.2

Alguns Parmetros importantes do Grfico

main="ttulo"
xlab,ylab
pch
col

.6.3

Constroi um grfico usando valores de uma coluna (vetor) x


versus um ndice geralmente igual a x
Constroi como dos dados contidos em x versus y
Adiciona pontos a um grfico j construdo
Adiciona linhas a um grfico j construdo
coloca o texto entre aspas em cima dos
pontos existentes no grfico

Adiciona um ttulo ao grfico


Acidiciona ttulos aos eixos respectivamente
Coloca um smbolo correspondente a um nmero no grfico
em geral utiliza-se pch=3
Altera a cor dos smbolos

Grficos estatsticos

hist(x)
plot(density(x))
boxplot(x)
qqnorm(x)

Constroi um histograma de frequncia x


Constroi uma funo de densidade x
Constroi um boxplot de x
Constroi um grfico QQ de x

89

Tabelas

v2 =2
3
4
5
6
7
8

v1 =2
19,0
9,55
6,94
5,79
5,14
4,74
4,46

3
19,2
9,28
6,59
5,41
4,76
4,35
4,07

4
19,2
9,12
6,39
5,19
4,53
4,12
3,84

5
19,3
9,01
6,26
5,05
4,39
3,97
3,69

6
19,3
8,94
6,16
4,95
4,28
3,87
3,58

7
19,4
8,89
6,09
4,88
4,21
3,79
3,50

8
19,4
8,85
6,04
4,82
4,15
3,73
3,44

Tabela 2: Alguns valores de F ao nvel


de 95% de confiana

92

quimiometria com r

Grau de liberdade n 1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

Probabilidade
12,71
4,30
3,18
2,78
2,57
2,45
2,37
2,31
2,26
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,11
2,10
1,96

Tabela 3: Valores para t de Student em


funo do grau de liberdade n 1 para
um limite de confiana de 95%

tabelas

Nmero de observaes (N)


2
3
4
5
6
7
8
9
10

Q
0,970
0,829
0,710
0,625
0,568
0,526
0,493
0,466

93

Tabela 4: Valores para Q em funo do


nmero de observaes a um limite de
confiana de 95%

Referncias Bibliogrficas
AZNAREZ, J.; BONILLA, A.; VIDAL, J. C. Spectrophotometric and
fluorimetric determination of boron in soils, plants and water by
extraction with 2-methypentane-2,4-diol in isobutyl methyl ketone.
Analyst, v. 108, 1983.
BACCAN, N. et al. Qumica Analtica Quantitativa Elementar. 4 a revista, ampliada e restruturada. ed. Campinas: Edgar Blcher, 2001.
BARROS-NETO, B.; SCARMINIO, I. S.; BRUNS, R. E. Planejamento e
Otimizao de Experimentos. 2a. ed. Campinas: Editora da Unicamp,
1995.
BARROS-NETO, B.; SCARMINIO, I. S.; BRUNS, R. E. Como fazer
experimentos. Campinas: Editora Unicamp, 2003.
BARTHUS, R. C.; MAZO, L. H.; POPPI, R. J. Aplicao de mtodos de calibrao multivariada para a determinao simultnea de
riboflavina (vb2), tiamina (vb1), piridoxina (vb6) e nicotina (vpp).
Qumica Nova, v. 30, n. 7, p. 16381643, 2007.
BRERETON, R. G. Chemometrics - Data Analysis for the laboratory and
chemical plant. England: Wiley, 2002.
BRO, R. Multivariate calibration - what is in chemometrics for the
analytical chemist? Anaytica Chimica Acta, n. 500, p. 185194, 2003.
CATARINO, S.; PINTO, D.; CURVELO-GARCIA, A. S. Anlise em
espectrofotometria de absoro atmica com chama para doseamento
de cobre e ferro em vinhos e aguardentes. Cincia e Tcnica Vitivincola, v. 18 (2), p. 6576, 2003.
CERQUEIRA, E. O. et al. Utilizao de filtro de transformada de
fourier para a minimizao de rudos em sinais analticos. Qumica
Nova, v. 23, n. 5, p. 690698, 2000.
CHAU, F.-T. et al. Chemometrics from basics to wavelet transform. New
Jersey: Wiley-Interscience, 2004.

96

quimiometria com r

CHRISTIAN, G. D. Analytical Chemistry. New York: Johon Wiley &


Sons, 1994.
CIENFUEGOS, F. Estatstica Aplicada ao Laboratrio. [S.l.]: Editora
Intercincia, 2005.
DAWSON, R. How significant is a boxplot outlier? Journal of Statistics
Education, v. 19, n. 2, p. 113, 2011.
FERREIRA, M. M. C. et al. Quimiometria i: Calibrao multivariada,
um tutorial. Qumica Nova, v. 5, n. 22, p. 724731, 1999.
FERREIRA, P. V. Estatstica experimental aplicada agronomia. 3 a. ed.
Macei: Edufal, 2000.
HANSON, B. A. Chemospec: An r package for chemometric analysis
of spectroscopic data (cromatograms tool). outubro 2011. Disponvel
em: <http://cran.r-project.org/web/packages/ChemoSpec/index.html>.
HARRIS, D. C. Quantitative Chemical Analysis. 6a. ed. New Yorik: W.
H. Freeman and Company, 2007.
HARRIS, D. C. Explorando a Qumica Analtica. 4 a. ed. Rio de Janeiro:
LTC Editora, 2011.
HIBBERT, D. B.; GOODING, J. J. Data analysis for chemistry - An introductory guide for students and laboratory scientists. New York: [s.n.],
2006.
HIGSON, S. Qumica Analtica. So Paulo: MacGraw Hill, 2009.
HOLLER, F. J.; SKOOG, D. A.; CROUCH, S. R. Princpios de anlise
instrumental. 6 a. ed. [S.l.]: Bookman, 2009.
HORWITZ, W. Evaluation of analytical methods used for regulation
of foods and drugs. Analytical Chemistry, v. 54, p. 67A, 1982.
INGAMELLS, C.; SWITZER, P. A proposed sampling constant for use
in geochemical analysis. Talanta, v. 20 (6), p. 547568, 1973.
KEALEY, D.; HAINES, P. J. Instant Notes - Analytical Chemistry. Oxford: Bios Scientific Publishers Limited, 2002.
KUSELMAN, I. et al. Validation of a computer program for atomic
absorption analysis. Accreditation and Quality Assurance, v. 2, p. 234
237, 1997.
LEITE, F. Amostragem fora e dentro do laboratrio. Campinas: Editora
tomo, 2005.

referncias bibliogrficas

LONG, G. L.; WINEFORDNER, J. D. Limit of detection - a closer look


at the iupac definition. Analytical Chemistry, v. 55, n. 7, p. 712A718A,
1983.
LCKER, E.; FAILING, K.; SCHMIDT, T. Determination of analytical
limits in solid sampling etaas: a new approach towards the characterization of analytical quality in rapid methods. Journal of the Analytical
Chemistry, v. 366, p. 137141, 2000.
MANDEL, J.; STIEHLER, R. D. Sensitivity - a criterion for the comparison of methods of teste. Journal of Research of the National Bureau of
Standards, v. 53, n. 3, p. 155159, 1954.
MENDHAM, J. et al. Vogel - Anlise Qumica Quantitativa. 6a. ed. Rio
de Janeiro: LTC Editora, 2002.
MILLER, J. C.; MILLER, J. N. Estadstica para Qumica Analtica. 2. a.
ed. Mxico: Addison-Wesley Iberoamericana, 1993.
MILLER, J. N.; MILLER, J. C. Statistics and Chemometrics for anaytical
chemistry. 5. ed. Edinburgh: Pearson Education Limited, 2005.
MORENO-DOMNGUES, T.; GARCA-MORENO, C.; MARINFONT, A. Spectrofluorimetric determination and thin-layer chromatographic identification of selenium in foos. Analyst, v. 108, p. 505509,
1983.
OLIVEIRA, F. C. C. et al. A escolha da faixa espectral no uso combinado de mtodos espectroscpicos e quimiomtricos. Qumica Nova,
v. 27, n. 2, p. 218225, 2004.
OLIVIERI, A. C. et al. Uncertainty estimation and figures of merit for
multivariate calibration. Pure and Applied Chemistry, v. 78, p. 633661,
2006.
PASSARI, L. M. Z. G.; SOARES, P. K.; BRUNS, R. E. Estatstica aplicada qumica: Dez dvidas comuns. Qumica Nova, v. 34, n. 5, p.
888892, 2011.
PILLAR, V. P. Suficincia amostral. In:
(Amostragem em limnologia), p. 2543.

. So Carlos: Rima, 2004.

PIMENTEL, M. F.; BARR. Calibrao: Uma reviso para qumicos


analticos. Qumica Nova, v. 19, n. 3, p. 268277, 1996.
RANKE, J. Basic calibration functions for analytical chemistry. [S.l.],
Setembro 2011. Disponvel em: <http://cran.r-project.org/web/packages/chemCal/vignettes/chemCal.pdf>.

97

98

quimiometria com r

SAVITZKY, A.; GOLAY, M. J. E. Smoothing and differentiation of


data by simplified least squares procedures. Analytical Chemistry,
v. 36, n. 8, 1964.
SKOOG, D. A. et al. Fundamentos de Qumica Analtica. 8 a. ed. So
Paulo: Pioneira Thomson Learning, 2006.
SOUZA, A. M.; POPPI, R. J. Experimentos didtico de quimiometria
para anlise exploratria de leos vegetais comestveis por espectroscopia no infravermelho mdio e anlise de componentes principais:
um tutorial. parte i. Qumica Nova, p. 17, Prelo.
THOMPSON, M.; LOWTHIAN, P. Notes on Statistical and data quality
for analytical chemists. London: Imperial College Press, 2011.
VESSMAN, J. et al. Selectivity in analytical chemistry (iupac recommendations 2001). Pure and Applied Chemistry, v. 73, n. 8, p. 13811386,
2001.
WOLD, S.; SJSTRM, M.; ERIKSSON, L. Pls - regression: a basic
tool for chemometrics. Chemometrics and Intelligent Laboratory Systems,
n. 58, p. 109130, 2001.

ndice Remissivo

t de Student, 17
Amostra, 35
Amostragem, 35
Sistemtica, 35
Anlise de componentes principais,
85
Anlise multivariada, 85
Arredondamento de dados, 30
Boxplot, 54
Calibrao, 57
Comparao com padres, 57
Comparao direta, 58
Padres externos, 58
Titulaes, 58
Calibrao multivariada, 76
Coeficiente de Variao, 32
CV, 32
coeficientes da reta, 61
Comandos bsicos, 88
Constante de Ingamells, 35
CRAN, 88
Dados externos, 88
Desvio padro, 22
Distribuio normal, 15

Erro absoluto, 22
Erros determinados, 12
Sistemticos, 12
Erros indeterminados, 12
Estatstica bsica, 21
Estimativa de erro, 15

Multiplicao e diviso, 28

licena, 2
Limite de deteco, 71

Razo sinal/rudo, 79
resduos, 61
Rudos, 80
Ambiental, 81
Flicker, 81
Jonson, 80
Qumico, 80
Shot, 81

Mnimos Quadrados Parciais, 77


Mdia, 21
aritmtica, 21
Mdia mvel, 81
Mtodo dos quadrados mnimos, 59
Mtodo dos mnimos quadrados, 59
mtodo mnimos quadrados, 61
Mediana, 26
Medidas da preciso, 32

Savitzky-Gollay, 81
Sensibilidade, 68
Instrumento, 68
Mtodo, 68
Sinal Analtico, 79
Suavizao de rudo instrumental, 81
Filtro de mdia mvel, 82
Filtro de Savitzky-Golay, 83
Mdia de sinais, 82

Gerao de grficos, 89

Outliers, 54
Planilha eletrnica, 88
Populao, 14, 34
Propagao de erros, 27
Adio e subtrao, 27

Tabela F, 91
Teste de F, 40
Teste de Q, 51
Teste de significncia, 40
Teste de t, 44

Você também pode gostar