Você está na página 1de 39

28/09/2022

Modulo Ajuste de Curvas, Regressão e Correlação.


Calibração e Regressão.
4
Arlindo Gomes
Ano Letivo 2022/23

Módulo

 Ajuste de curvas
4
 Método dos mínimos quadrados
 Análise instrumental
 Calibração
Etapas
Curvas de calibração
Método da adição de padrão
Comparação entre métodos
Curva de calibração ponderada
Calibração (continuação)
Detecção da curvatura
“Outliers” na Regressão

1
28/09/2022

Módulo
Em situações práticas é frequente encontrar uma relação
4 entre uma variável independente (eixo dos XX’s) e uma
variável dependente contínua (eixo dos YY’s).

Sem interesse científico nem prático (lineares)


 Relação entre a espessura de um livro e o nº de páginas.
 Relação entre o nº de páginas de um livro e a respectiva massa.

Sem interesse científico mas com interesse prático (lineares)


 Relação entre os kms percorridos por um carro e o volume de combustível
consumido (em litros);
 Quantidade de aditivo a adicional à água do radiador para reduzir a
temperatura de congelação;
Sem interesse científico mas com interesse prático (não lineares)
 Relação entre a distância de travagem e a velocidade de circulação;
 Horas de estudo resultado numa prova de avaliação;

Módulo Com interesse científico


 Relação entre a concentração de um sal e a condutividade da
4 solução;
 Relação a concentração de um corante e a respectiva absorvência;
 Relação entre a concentração de ácido (H3O+) e o valor de pH;
 Estudos cinéticos (parâmetros obtidos através de regressão linear)
 …
Medição experimental
Variável dependente

Variável independente

2
28/09/2022

Os resultados experimentais são conjuntos:


x1 , y1 , x2 , y 2 ...xn , y n 

(X,Y)

Relação próxima de linear entre as variáveis X e Y

Relação não linear entre as variáveis

18.0

14.0

10.0

6.0

2.0
1.0 1.5 2.0 2.5 3.0

3
28/09/2022

Não existe relação entre as variáveis

O ajuste é sempre
(matematicamente) possível

7
(matematicamente) possível
O ajuste é sempre

4
28/09/2022

Um dos principais objectivos do ajustamento de curvas é


estimar uma das varáveis (a variável dependente - Y) a partir
da outra variável (a variável independente - X).
Este processo de estimação é muitas vezes referido como
regressão.

Se y deve ser estimado a partir de x por meio de uma equação,


esta equação designa-se por curva de regressão de y sobre x.

Muitas vezes a representação dos dados permite mais que uma


possibilidade de ajuste. Para evitar uma decisão precipitada
sobre o tipo de ajuste: a uma recta, parábola, etc., recorre-se ao
método dos mínimos quadrados.
Ou seja, pretende-se minimizar as diferenças entre os valores
experimentais e a curva (representação da função matemática).

10

5
28/09/2022

d12  (( x1 , y1 )  ( x1,equação , y1,equação ))

18.0

14.0

10.0

6.0

2.0
1.0 1.5 2.0 2.5 3.0

d12  d 22  ...  d n2  mínimo

11

Actualmente, os resultados da maioria das análises químicas é obtido através


de equipamentos: espectrofotómetros, métodos electroquímicos, cromatografia,
etc.. Sendo que o progresso destes equipamentos tem permitido detectar e
quantificar concentrações de analítos cada vez mais reduzidas.

Porém, a possibilidade destes equipamentos fornecerem resultados num


intervalo de concentração alargado depende de cálculos e da avaliação dos
erros aleatórios envolvidos.
As medições obtidas devem ser relacionadas com a concentração dos
analítos. Ou seja, os sinais produzidos devem ser relacionados com a
concentração das espécies químicas – calibração.

12

6
28/09/2022

Calibração (Etapas)
1) Preparação de “amostras” com concentração conhecida da
espécie a analisar. Estas soluções são designadas por padrões
e são sujeitas a medição nas mesmas condições que serão
usadas na análise das amostras.

13

Calibração (Etapas)
2) Preparação de um gráfico que relacione o sinal (do
equipamento ou detector) com a concentração dos padrões.
Obtenção de uma equação matemática.
3) Realização das medições experimentais com as amostras e
conversão do sinal em concentração.

…e os aspectos estatísticos relativos à fiabilidade deste


procedimento?

14

7
28/09/2022

…mas os aspectos estatísticos relativos à


fiabilidade deste procedimento?

• a relação entre a medição e a concentração é linear?


• qual a equação da recta que melhor representa a relação entre a
concentração e a medida experimental?
• admitindo que temos uma equação de uma recta, como podemos
estimar o erro e os limites de confiança para o declive e ordenada
na origem?

15

Construção de curvas de calibração


• o intervalo de concentrações dos padrões deve conter os
valores das amostras (excepto no caso do método de análise
por adição de padrão).

!Sempre Interpolação e nunca extrapolação!

16

8
28/09/2022

Construção de curvas de calibração


• o valor do “branco” deve ser incluído na curva de calibração.
O branco contém tudo menos a adição deliberada de analíto e
é sujeito aos mesmos procedimentos das amostras a analisar.
Todavia, o sinal obtido nem sempre é zero e está, tal como os
restantes padrões, sujeito a erros.

17

Construção de curvas de calibração (controvérsia):


• assume-se que os erros só afectam o eixo dos yy’ e que os
valores da concentração no eixo dos xx’ estão isentos de erro.
• a magnitude do erro da medição é independente da
concentração.
Porém, se o erro relativo da medição for constante então em
termos absolutos varia com a concentração.

18

9
28/09/2022

Construção de curvas de calibração

Será que a relação entre a concentração e a medida experimental


é linear? E podemos obter a equação de uma recta:

y  bx  a

Como se ajustam os pontos experimentais com a recta (coeficiente


de correlação)?

 xi 
 x yi  y 
r i
1 r 1

 
 

 xi  x  yi  y 
2

2

 i  i 

19

Na prática obtêm-se valores


considerados razoáveis quando:

r  0 ,95 r   0 ,95

Mas se não existe relação entre ambas as


grandezas?

20

10
28/09/2022

EXEMPLO:
Considere as medições de fluorescência de soluções padrão
resumidas na seguinte tabela (UA)
Intensidade
fluorescência 2,1 5,0 9.0 12,6 17,3 21,0 24,7
(UA)
Concentração
0 2 4 6 8 10 12
(pg/ml)

Determinar o coeficiente de correlação (comparar o resultado da


fórmula com o obtido através da calculadora e pelo Excel)
Resposta: r = 0,9989

21

Exemplo Curva Calibração


Medição
30,0
Experimental
Int. Fluorescência

25,0
Variável
20,0
Dependente
(UA)

15,0
10,0
5,0
0,0

0 Variável
5 independente
10 15
Conc. (mg/l)

Concentração

22

11
28/09/2022

Exemplo Curva Calibração

Int. Fluorescência 30,0 y = 1,9304x + 1,5179


25,0 R = 0,9989
20,0
(UA)

15,0
10,0
5,0
0,0
0 5 10 15
Conc. (mg/l)

23

Exemplo Curva Calibração


40,0 !SEM SIGNIFICADO!
(APESAR DOS
Int. Fluorescência

PROGRAMAS
30,0 PERMITIREM AJUSTAR
QQ EQUAÇÃO A QQ
(UA)

CONJUNTO DE
20,0 DADOS)

10,0 y = 2,5909x + 4,032


R = 0,9437
0,0
0 5 10 15
Conc. (mg/l)

24

12
28/09/2022

Apesar de se recomendar que se proceda sempre à


representação gráfica dos pontos, pode-se realizar um teste para
avaliar se o coeficiente de correlação é significativo.
O processo alternativo mais simples envolve o cálculo do valor
de t:
r ( n  2)
t
1  r 
2

Sendo o valor calculado comparado para o nível de


significância desejado com o valor tabelado do teste t (n-2
graus de liberdade, bilateral)
25

Sendo que a H0 neste caso corresponde a não existir correlação


entre x e y.

t calculado  t tabelado H0 rejeitada

No ponto seguinte vamos assumir que a representação dos


pontos experimentais permitiu concluir por uma relação linear
entre o sinal e a concentração. Como obter a equação da recta?

26

13
28/09/2022

Os valores da concentração estão sujeitos a erro. Porém, vamos


assumir que os erros estão limitados aos valores de y.
O método dos mínimos quadrados pretende minimizar o quadrado
dos resíduos, ou seja:

 x i 
 x yi  y 
a  y  bx
A complexidade dos cálculos
envolvidos determina a
b i

 x 
2 possibilidade de erros!
i x
i

27

Sy x
Sb 
 x 
Erro do declive 2
i x
i

xi2
Erro da ordenada na origem S a  S y x

n xi  x 2

A complexidade dos cálculos


envolvidos determina a
possibilidade de erros!

28

14
28/09/2022

Para obter o limite de detecção do procedimento analítico é


necessário estimar os erros aleatórios do declive e da ordenada
na origem.
2

i  i 
 
y  y
Calculo dos Resíduos
Sy x 
n2

graus de liberdade
são os valores de x calculados na equação
A complexidade dos cálculos
envolvidos determina a
possibilidade de erros!

29

Intervalos de confiança do declive e ordenada na origem

b  tS b sendo o valor de t obtido na respectiva


tabela para (n-2) graus de liberdade e nível
de confiança pretendido e S o desvio
padrão
a  tS a

30

15
28/09/2022

Obter o valor da concentração em função da medição experimental


requer simplesmente o uso da equação da recta. Porém, estimar o
erro da concentração é um problema mais complexo, e como tal é
comum o recurso à seguinte fórmula (aproximação):

uma leitura

 
A complexidade dos cálculos
2 envolvidos determina a
Sy x 1 y0  y possibilidade de erros!
S x0  1 
b n b2
 xi  x  
2

i valor experimental (que originou x0)


desvio padrão estimado para x0

31

Nas situações em que são realizadas várias leituras (m) para obter
y0 a equação a utilizar é:

S x0 
Sy x 1 1
 
y0  y 
2

b m n b2
 xi  x  
2

Para obter os limites de confiança:

x0  tS x 0 Para t consultar a tabela (n-2) bilateral graus de liberdade

32

16
28/09/2022

Em termos práticos verifica-se que os resultados mais precisos


são os que resultam em concentrações no centro do intervalo da
gama dos padrões (centróide da regressão linear).

A redução do limites de confiança pode ser obtidas através:


• aumentando o nº de pontos usados na calibração (soluções
padrão) – usar pelo menos 6;
• fazer mais que uma medição de y0 e usar a média para obter x0
– repetir as leituras;

33

O sucesso de muitas técnicas e métodos analíticos depende da


possibilidade de quantificar concentrações de analíto muito
reduzidas. Assim, o limite detecção é um critério muito
importante na comparação das diversas possibilidades
analíticas.
Limite de detecção: é a concentração de analíto que produz um
sinal (y) estatisticamente distinto do obtido com o “branco” ou
pelas flutuações de sinal (ruído de fundo). A concentração a
partir da qual podemos afirmar que o analíto está presente na
amostra.
Porém, a dificuldade em estabelecer um consenso determinou
uma simplificação …

34

17
28/09/2022

Limite de detecção: é a concentração de analíto que produz um sinal


(y) igual ao do “branco” - yB mais duas ou três vezes o desvio padrão
do branco - SB

y  y B  2S B y  yB  3S B

35

Sinal do branco

36

18
28/09/2022

Limite de quantificação: é a menor concentração de analíto que


pode ser quantificada de forma precisa. Porém, também neste
caso foi sugerido uma valor de referência que tem no entanto
uma aplicação mais limitada.

y B  10 S B

37

O método dos mínimos quadrados (regressão não ponderada) foi


desenvolvido considerando que cada ponto (incluindo o branco ou o ruído de
fundo) apresentam uma variação compatível com a distribuição normal
(exclusivamente na direcção de y) com um desvio padrão estimado por .

Sy
x
Então podemos usar SB (desvio padrão do “branco”) para estimar o limite de
detecção.

38

19
28/09/2022

Construção
(Só soluções padrão)

Utilização (cada amostra


requer pelo menos uma
leitura para obter a
concentração

39

Módulo

4 Método da Adição de Padrão


O facto das soluções padrão do analíto serem preparadas com água
destilada anula o efeito da matriz das amostras. Por exemplo,
determinar mercúrio por absorção atómica em sedimentos é uma
situação muito distinta da obtida através da preparação de soluções
padrão no laboratório. Surge assim a dúvida sobre a comparação entre
as medições realizadas:

Será que a mesma concentração de mercúrio numa


amostra produz o mesmo sinal que num padrão?

40

20
28/09/2022

Utilizar soluções puras (preparadas com água destilada) para obter


a curva de calibração é assumir que a matriz da amostra (outras
espécies além do analíto) é nulo.

Esta premissa nem sempre é válida!

A calibração através do Método da Adição de Padrão (MAP) baseia-


se na adição de quantidades crescentes de solução padrão do
analíto a um determinado volume de amostra.

41

Amostra
diluída

Exemplo Adição de Padrão


30
Int. Fluorescência

Sinal da 25
amostra 20
(UA)

15
10
y = 1,5321x + 6,4214
5 R2 = 0,9944
0
-5 0 5 10 15
Conc. na amostra
Conc. (mg/l)

42

21
28/09/2022

Atendendo a que o declive e a ordenada na origem desta recta estão


afectados por erro, o mesmo acontece com o valor calculado.
Todavia, neste caso o valor não é previsto a partir de uma só
medição do valor de y, assim, a fórmula para o cálculo do desvio
padrão, SxE do valor extrapolado de x (xE) é:

2
S y / x 1 y
S xE  
b n 
b 2  xi  x 
2

43

Mais uma vez, aumentar n aumenta a precisão da estimativa da


concentração de analíto na amostra. Recomenda-se que sejam
realizadas pelo menos 6 adições de padrão.

Os limites de confiança do resultado podem ser determinados


como:
x E  tS xE

44

22
28/09/2022

Desvantagens do Método da Adição de Padrão:


• requer grande quantidade de amostra;
• em termos estatísticos trata-se de um método de extrapolação
(menos preciso que a interpolação);
• requer a preparação de uma “curva de calibração” por cada
amostra, ou seja, mais trabalho.

45

Módulo

4 Comparação entre métodos


Após o desenvolvimento de um novo método analítico é natural
que se pretenda realizar a sua comparação com os métodos de
referência. O principal interesse é estabelecer se existem erros
sistemáticos – a nova técnica produz resultados que são
significativamente superiores ou inferiores relativamente à técnica
usada?

Quando as análises são repetidas muitas vezes num intervalo de


concentração limitado podem-se usar os testes estatísticos
anteriormente referidos. Porém, em análise instrumental tais
procedimentos não podem ser aplicados devido ao amplo intervalo
de concentrações que se pretende analisar.

46

23
28/09/2022

Situação ideal – ordenada na origem nula e coeficiente de correlação 1

12
Método A

8 Mesmo que os erros sistemáticos estejam


completamente ausentes, os erros
4 aleatórios asseguram uma certa
0 dispersão de valores.
0 4 8 12
Método B

47

Ordenada na origem superior a zero e coeficiente de correlação 1

12
Método A

8
Um dos métodos apresenta
4 sistematicamente resultados superiores
ao outro.
0
0 4 8 12 Indica a existência de erros sistemáticos
Método B

48

24
28/09/2022

Ordenada na origem nula e coeficiente de correlação próximo de 1


mas o declive inferior (ou superior) a 1

12
Um dos métodos apresenta
Método A

8 sistematicamente resultados inferiores


4 ao outro.

0 Indica a existência de erros sistemáticos


0 4 8 12
Método B

49

Na prática testam-se os resultados para uma ordenada na origem


diferente de zero e um declive que seja significativamente diferente
de 1.
Importa notar que o ênfase geralmente colocado no coeficiente de
correlação não faz sentido, porque a correlação pode ser boa mas
com uma ordenada na origem e um declive distintos dos
pretendidos. E como tal, é menos importante que os limites de
confiança para o declive e ordenada na origem.

50

25
28/09/2022

Módulo

4 Curva de calibração Ponderada

Os comentários anteriores feitos sobre os limites da regressão


convencional determinam que mais frequentemente a
regressão ponderada deveria ser adoptada.
Os cálculos envolvidos são mais complexos e requerem
informação adicional sobre o erro para diferentes níveis de
concentração, ou pelo menos, a possibilidade de antecipar a
sua importância.
Consideremos a seguinte situação em que se representam os
valores médios e os respectivos desvios padrão:

51

Exemplo Curva Calibração


Ponderada
30,0
Int. Fluorescência

25,0
Nesta situação é evidente
20,0
que deve ser dada maior
(UA)

15,0 ponderação aos pontos com


10,0 menores barras de erro
5,0
0,0
(±σ)
0 5 10 15
Conc. (mg/l)

52

26
28/09/2022

A ponderação é introduzida através da atribuição de uma


importância relativa que é inversamente proporcional à variância
das medidas realizadas para cada concentração (solução padrão).
Seja:
x1 , y1 
x2 , y 2  Pontos
xn , y n  Experimentais

w1
S1
Desvios w2 Ponderação
S2 padrão
w3
Sn

53

PONDERAÇÃO DECLIVE
w x
2
S  n xw y w
wi  i i i
  S i 2  b i
 
 wi xi2  n x w
2
 i  n 
   i

ORDENADA NA ORIGEM

a  y w  bx w

w y i i w x i i

yw  i
xw 
n n

54

27
28/09/2022

Comparação entre a regressão ponderada e não ponderada

Tipo de Regressão Equação

Não ponderada y=0,0725x+0,0133

Ponderada y=0,0738x+0,0091

Exemplo Miller&Miller, página 126

Neste caso os resultados obtidos são semelhantes porque os


pontos experimentais ajustam-se muito bem a uma recta.

55

R. não
Absorvência R. Ponderada
ponderada

0,100 1,23±0,12 1,20±0,65

0,600 8,01±0,32 8,09±0,63

Apesar dos valores da ordenada na origem e do declive serem


semelhantes, a vantagem da regressão ponderada é determinada
em relação à estimativa dos erros e dos limites de confiança nos
resultados fornecidos.

56

28
28/09/2022

O desvio padrão de uma concentração no caso da regressão


ponderada é dado por:

 2   2 
  wi y i2  n y w   b 2   wi xi2  n x w 
Sy x w   i   i 
n2
 
 
A complexidade dos
 2 
S  y / x w 1 1 y0  y w  cálculos envolvidos
S x0w     
determina a
possibilidade de erros!
b  w n  2 
0
b   wi y i  n x w  
2 2
  i  

57

Conclusão:
Apesar do acréscimo de complicação nos cálculos, a regressão
ponderada permite resultados mais fiáveis em química analítica
instrumental (em termos da concentração e dos respectivos limites
de confiança).

58

29
28/09/2022

Módulo

4 Detecção da curvatura

Apesar dos métodos de calibração estarem essencialmente


limitados à utilização de equipamentos cuja resposta é
proporcional à concentração de analíto, podem surgir situações
em que a partir de determinado valor de concentração ocorra uma
curvatura.
Neste caso como se detecta uma curvatura na calibração?

59

Neste caso como se detecta uma curvatura na calibração?


O coeficiente de correlação não permite testar a curvatura, até
porque uma linha com uma ligeira curvatura pode ter um valor de r
elevado. Assim, recorre-se a testes baseados na soma dos
resíduos – yresíduos nos pontos de calbração.

60

30
28/09/2022

yresíduos corresponde à diferença entre o valor experimental e o valor


calculado pela regressão:

y resíduo  y i  y i
Teste #1
Se a linearidade de uma calibração é apropriada, se a distribuição
dos os erros aleatórios relativos à medição experimental (eixo y) é
normal, então os valores dos resíduos terão também uma
distribuição normal em torno de zero senão deve-se suspeitar da
linearidade da recta.
Notar que o termo usado é suspeitar.

61

Teste #2
A inspecção do sinal (positivo ou negativo) dos valores dos
resíduos. Há medida que x aumenta devemos ter resíduos
positivos e negativos de forma aleatória. Pode-se suspeitar da
existência de uma curvatura se os sinais forem sempre iguais em
sequência a partir de uma certa concentração.

62

31
28/09/2022

A questão da curvatura de uma calibração é muito importante por


determina a gama de concentrações em que a linearidade pode ser
assumida.

Exemplo:
Averiguar na gama de concentração dos padrões se a relação com
a fluorescência é linear:

Int. Fluorescência 0.1 8,0 15.7 24,2 31.5 33,0


Concentração (µg/ml) 0 2 4 6 8 10

63

Azul – valor experimental;


Vermelho – obtido pela equação da reta

64

32
28/09/2022

Int. Fluorescência 0.1 8,0 15.7 24,2 31.5 33,0


Concentração 0 2 4 6 8 10
(µg/ml)
Exemplo Curva Calibração
40
Int. Fluorescência

32
24
(UA)

16
y = 3,479x + 1,357
8 R = 0,9878
0
0 2 4 6 8 10 12 14
Conc. (mg/l)
ANO LECTIVO 2009/10

65

Concentração 0 2 4 6 8 10
(µg/ml)
Int. Fluorescência 0.1 8,0 15.7 24,2 31.5 33,0
Resíduos -1.257 -0.314 +0.429 +1.971 +2.314 -3.143

Acréscimo dos valores do resíduo com a


concentração – linearidade?

6 2
 

  yi  yi   20,981
i 1  
Somatório do resíduos2 ?Excluir?

66

33
28/09/2022

Concentração 0 2 4 6 8 10
(µg/ml)
Int. Fluorescência 0.1 8,0 15.7 24,2 31.5 33,0
Resíduos 0,000 -0,000 -0,200 +0,400 -0,200 -3.143

Exemplo Curva Calibração


Int. Fluorescência (UA)

40
32
6 2
 


24
y
 i  y i   0,24
i 1  
16
y = 3,950x + 0,100
8 R = 0,9998
0
0 2 4 6 8 10 12 14
Conc. (mg/l) 67

67

Sugestão:
Através da segunda equação verificamos que a fluorescência do
padrão 10 µg/ml deveria ser 39,6 com um resíduo de –6,6.
Calculando o valor médio dos resíduos e o respectivo intervalo de
confiança (teste t) verifica-se que este valor está fora do intervalo,
ou seja, é um “outlier” entre os resíduos.

68

34
28/09/2022

Conclusão:
O intervalo de concentrações que conserva uma relação linear com
a medição da fluorescência termina no padrão 8 µg/ml
(considerando a informação disponível).
Adicionalmente, os valores da fluorescência das amostras devem
situar-se entre os obtidos para os padrões 2 e 8 µg/mL.

69

Em seguida o mesmo tipo de análise poderia ser aplicado ao


padrão 8 µg/ml, ou seja, ao ponto do gráfico (8, 31,5) e confirmar
que se conserva a linearidade. Recomendando-se a preparação de
uma série de padrões 6 padrões para no intervalo de concentração
entre 0 e 8 µg/ml.

70

35
28/09/2022

A ocorrência de resultados anómalos também pode suceder nos


processos de calibração, tal como acontece ao realizar réplicas de
medições experimentais, embora o problema seja mais complexo
devido aos procedimentos estatísticos envolvidos na regressão.
Apesar de se assumir que os valores yi são independentes, tal não
acontece com os valores dos resíduos (diversos tipos), aspecto
que impede a possibilidade de usar o teste Q.

71

Como identificar “outliers” numa calibração?


• excluir as situações de mau funcionamento ou engano no registo
da medição;
• resíduos dos valores suspeitos devem ser analisados (muitos
programas têm já a possibilidade do “diagnóstico” baseado nos
valores dos resíduos;

72

36
28/09/2022


yi  yi 
yi

Analisar se esta representação permite concluir pela distribuição


aleatória mas uniforme dos resíduos em torno do zero
(distribuição normal).

73

Distribuição de resíduos satisfatória

0,10

0,05

0,00
0 5 10 15
-0,05

-0,10

74

37
28/09/2022

O valor dos resíduos aumenta à medida que yi aumenta

0,10

0,05

0,00
0 5 10 15
-0,05

-0,10

75

O valor dos resíduos sugerem que os resultados


devem ser ajustados a um tipo diferente de curva

0,10

0,05

0,00
0 5 10 15
-0,05

-0,10

76

38
28/09/2022

O ajuste à equação é correcto excepto para um


ponto – provavelmente um “outlier”

0,10

0,05

0,00
0 5 10 15
-0,05

-0,10

77

Estes gráficos permitem identificar os pontos suspeitos mas não


proporcionam nenhum critério para a sua rejeição ou aceitação.
Alguns programas estatísticos assinalam os pontos quando:

yi  y i  2S y
x

78

39

Você também pode gostar