Você está na página 1de 10

TLF – 2010/11 Cap.

IX – Ajuste dos mínimos quadrados

Capítulo IX

Ajuste dos Mínimos Quadrados

9.1. Ajuste de uma linha recta a dados experimentais 92

9.2. Determinação dos parâmetros da recta, A e B


(Incertezas apenas em yi e iguais a σy para todas as medidas) 93

9.3. Cálculo da incerteza σy nas medidas yi 94

9.4. Cálculo das incertezas associadas aos parâmetros A e B


9.4.1. Incertezas em yi, iguais entre si 95
9.4.2. Incertezas diferentes em yi 96
9.4.3. Incertezas em xi e yi 97

9.5. Ajuste dos mínimos quadrados a outras curvas:


- Função polinomial 98
- Função exponencial 99
- Regressão múltipla 100

Departamento de Física da FCTUC 91


TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados

Ajuste dos Mínimos Quadrados

9.1. Ajuste de uma linha recta a dados experimentais

As experiências em Física consistem geralmente na medição de grandezas em


determinadas condições experimentais, a fim de se investigar a relação matemática entre si ou
entre essas variáveis medidas e outras grandezas com elas relacionadas e não directamente
medidas. Um exemplo realizado nas aulas práticas de TLF é a medida da tensão aos terminais
de uma lâmpada incandescente e da corrente eléctrica que a percorre a fim de se conhecer a
variação da potência dissipada em função da temperatura da lâmpada1.

Como já referimos em capítulos anteriores, a representação gráfica de grandezas


permite visualizar de forma simples e directa uma eventual dependência entre as variáveis
envolvidas. Neste capítulo vamos considerar apenas o caso de grandezas entre as quais existe
uma relação linear, ou seja, grandezas x e y relacionadas pela recta y = A + Bx .
Se as medições das grandezas x e y não estivessem inexoravelmente sujeitas a incertezas
experimentais, cada um dos N pares de pontos (xi,yi) medidos, estaria exactamente sobre a
recta y = A + Bx , como mostra a figura 9.1-a).

Figura 9.1 – Recta que melhor se ajusta aos pontos experimentais, no caso de (a) os pontos (xi,yi) não
terem erros experimentais; (b) terem erros experimentais.

Na prática há incertezas experimentais e o máximo que podemos esperar é que a distância


entre cada ponto (xi,yi) e a melhor recta ajustável aos pontos experimentais seja razoável
(figura 9.1-b).

Uma vez que neste capítulo damos como garantido que x e y estão linearmente
relacionadas, então o problema é precisamente encontrar a recta y = A + Bx que melhor se
ajusta aos resultados experimentais, ou seja, encontrar as melhores estimativas para as
constantes A e B com base nos dados (x1,y1), ..., (xN,yN). Esta questão pode ser abordada
graficamente e pode também ser tratada analiticamente, como faremos, aplicando o princípio
da máxima probabilidade. Neste caso, o método analítico para encontrar a recta que melhor
se ajusta a uma série de dados experimentais é designado por regressão linear ou ajuste dos
mínimos quadrados.

1
TP6 – Análise da radiação emitida por uma lâmpada de incandescência.

Departamento de Física da FCTUC 92


TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados

9.2. Determinação dos parâmetros da recta, A e B (Incertezas apenas em yi e iguais a σy


para todas as medidas)

Trata-se, portanto, de encontrar a melhor recta y = A + Bx que se ajusta aos pontos


medidos (x1, y1), ..., (xN, yN). Para simplificar admitiremos que a incerteza na medida de x é
desprezável. Quanto à grandeza y, assumiremos que cada yi é governado por uma distribuição
Gaussiana2 e que as incertezas nas medidas de yi têm todas o mesmo valor 3, ou seja, que
todas as distribuições têm a mesma largura σy.
Se conhecêssemos as constantes A e B, poderíamos definir que para qualquer valor xi
(que considerámos não ter incerteza associada) o verdadeiro valor de yi seria dado por:

(verdadeiro valor de yi) = A + Bxi .

Uma vez que a medida de yi segue uma distribuição Normal centrada no seu verdadeiro valor
e com largura σy, a probabilidade de obter o valor yi, de facto observado, é:

( yi −Yi )2 ( yi − A− Bxi )2
1 − 1 −
Prob A,B ( yi ) ∝
2 σ2y 2 σ 2y
e = e . (9.1)
σy σy

Os índices A e B lembram que a probabilidade depende dos valores (desconhecidos) de A e


de B. A probabilidade de obter a nossa série completa de medidas y1, …, yN corresponde ao
produto:

Prob A,B ( y1 ,..., y N ) = Prob A,B ( y1 )...Prob A,B ( y N ) ,


ou seja,
1 −χ 2 2
Prob A,B ( y1 ,..., y N ) ∝ e , (9.2)
σ Ny
onde o expoente é dado por:

χ2 = 
N
( yi − A − Bxi )2 . (9.3)
i =1 σ 2y

Agora, de um modo que já nos é familiar, consideraremos que as melhores estimativas


para as constantes desconhecidas A e B são os valores de A e B que maximizam a
probabilidade da eq. 9.2, ou seja, que minimizam a eq. 9.3 do χ2. Para encontrarmos esses
valores de A e B, diferenciamos a eq. 9.3 relativamente a A e a B, separadamente, e
igualamos as derivadas a zero:

∂χ 2 − 2 N
=  ( yi − A − Bxi ) = 0 ,
∂A σ 2y i =1
(9.4)

2
Admita, para exemplificar, que os pares de grandezas (xi,yi) são os pares de valores (comprimento do pêndulo
(l), período de oscilação (T)) necessários para a determinação da aceleração da gravidade (TP1). Se considerar
apenas um par (li,Ti), lembre-se que mediu 5 vezes o mesmo comprimento do fio e 5x10 vezes o mesmo
período. Se os tivesse medido um número incontável de vezes obteria uma distribuição Gaussiana tanto para li
como para Ti. Ora esta observação é também verdadeira para os outros 4 pares de valores (li,Ti) que
determinou no mesmo trabalho.
3
Esta aproximação é razoável em muitas realizações experimentais.

Departamento de Física da FCTUC 93


TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados

∂χ 2 − 2 N
=  xi ( yi − A − Bxi ) = 0 ,
∂B σ 2y i =1
(9.5)

As duas condições anteriores (9.4 e 9.5) dão origem, respectivamente, às equações:

AN + B xi = yi , (9.6)

A xi + B  xi2 = xi yi . (9.7)

O sistema formado pelas equações 9.6 e 9.7, por vezes designadas por equações normais,
pode ser resolvido de modo a fornecer a estimativa dos mínimos quadrados para as constantes
A e B:

x  y −x x y
2
i i i i i
A= i i i i
(9.8)
Δ
e
N  xi yi −  xi  yi
B= i i i
, (9.9)
Δ
onde
2
 
Δ = N  x −   xi  .
2
i (9.10)
i  i 

Os resultados 9.8 e 9.9 correspondem às melhores estimativas para as constantes A e B da


recta y = A + Bx , baseadas nos N pares de ponto medidos (x1, y1),..., (xN, yN). A recta
resultante é designada por recta de ajuste dos mínimos quadrados ou regressão linear de y
em x.

9.3. Cálculo da incerteza σy nas medidas yi

Relembremos que os números y1, ..., yN correspondem a N medidas de y realizadas em


condições experimentais diferentes (as mesmas dos x1,..., xN correspondentes) e, portanto, não
são N medidas do mesmo número4. Por isso, não tem sentido olharmos para os diferentes yi e
analisarmos a dispersão dos valores entre si.

Apesar disso, é possível fazermos uma estimativa da incerteza σy a partir dos próprios
pares de valores (xi,yi) medidos. Na verdade, segundo o princípio da máxima probabilidade, a
melhor estimativa para o parâmetro σy é aquela que maximiza a probabilidade dada pela
equação 9.2 e, portanto, minimiza o expoente 9.3. Então, diferenciando 9.3 relativamente a σy
e igualando a derivada a zero, obtém-se

1
 (y − A − Bxi ) .
2
σy = i (9.11)
N i

4
Usando novamente o exemplo da nota de rodapé nº 2, nesse trabalho prático (TP1) obtiveram-se N = 5 pares
diferentes das grandezas (comprimento do pêndulo (l), período de oscilação (T)).

Departamento de Física da FCTUC 94


TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados

Os verdadeiros valores dos parâmetros A e B da eq. 9.11 são desconhecidos. Devem,


portanto, ser substituídos pelas melhores estimativas de A e B, dadas pelas equações 9.8 e 9.9.
Esta substituição reduz ligeiramente o valor de 9.11 e pode mostrar-se que essa redução é
compensada se substituirmos o factor N do denominador por N–2. 5 Assim, o resultado final
para a incerteza σy é:

1
σy = 
N −2 i
( yi − A − Bxi )2 . (9.12)

É razoável admitirmos a substituição de N por N–2 se considerarmos a hipótese de


termos apenas dois pontos experimentais medidos: (x1,y1) e (x2,y2). Como sabemos, por
apenas dois pontos passa uma e uma só recta e o ajuste dos mínimos quadrados fornece
precisamente os parâmetros A e B dessa recta. Assim, os dois termos da soma no numerador
das equações 9.11 e 9.12 dão zero. Contudo, com N no denominador obteríamos a resposta
absurda σy = 0 (eq. 9.11). Com N–2, obtemos a indeterminação σy = 0/0, o que indica,
correctamente, que σy não se pode conhecer com apenas dois pares de medidas. É claro que,
se N for grande, a diferença entre N e N–2 não é importante.

Na verdade, este factor N–2 é uma reminiscência do factor N–1 que aparece no desvio
padrão de N medidas de uma mesma quantidade, por exemplo, x. Nesse caso, para
calcularmos σx tivemos primeiro que determinar o valor médio x . Uma vez que este cálculo
relaciona os N valores medidos que eram, à partida, independentes (diz-se que, à partida,
existiam N graus de liberdade), passam a haver apenas N–1 valores independentes. Podemos
assim dizer que, tendo calculado x , já só restam N–1 graus de liberdade.
No presente caso fizeram-se também N pares de medidas. Logo, à partida, existiam N
graus de liberdade. Contudo, para se calcular σy, foi necessário determinar previamente as
duas quantidades, A e B, a partir dos N pares de valores. Restam, então, N–2 graus de
liberdade.

Em geral, define-se nº de graus de liberdade em qualquer passo de um cálculo


estatístico como o nº de medidas independentes menos o nº de parâmetros calculados a
partir desse nº de medidas. Pode demonstrar-se (o que não faremos) que é o nº de graus de
liberdade, e não o nº de medidas, que deve aparecer em fórmulas tais como a definição 9.12.

9.4. Cálculo das incertezas associadas aos parâmetros A e B

9.4.1. Incertezas em yi, iguais entre si

Tendo encontrado o valor da incerteza σy, podemos agora estimar facilmente as


incertezas associadas aos parâmetros A e B. De facto, como as estimativas de A e B são
funções bem definidas dos números medidos x1, ..., xN e y1, ..., yN, as incertezas em A e B são
obtidas por simples propagação de erros. Tendo em conta que os xi têm incerteza desprezável
e que os yi vêm afectados por σy, pode mostrar-se que:

x 2
i
σA = σy i
(9.13)
Δ

5
De facto, se considerarmos a eq. 9.3, vimos que esta função é mínima para os valores de A e B obtidos pelas
fórmulas 9.8 e 9.9.

Departamento de Física da FCTUC 95


TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados

e que
N
σB = σ y , (9.14)
Δ

onde, como anteriormente,


2
 
Δ = N  x −   xi  . 2
i
i  i 

No caso particular de uma recta que passa na origem, ou seja, de y = Bx , as equações 9.9,
9.12 e 9.14 simplificam-se, dando:
i xi yi
B= , (9.15)
 xi2 i

1
σy = 
N −1 i
( yi − Bxi )2 (9.16)

e
σy
σB = . (9.17)
 xi2
i

9.4.2. Incertezas diferentes em yi

Os resultados apresentados até agora foram baseados na suposição de que só havia


incerteza nos valores experimentais de y e que essa incerteza era igual para todos os yi. O que
acontece se as incertezas σi dos yi forem diferentes? Se conhecermos os diferentes σi usamos
o método dos mínimos quadrados pesados, atribuindo a cada yi o peso:

1
wi = .
σi2

A expressão do χ2 que aparece na probabilidade total (eq. 9.2) vem, então:

χ 2 =  wi ( yi − A − Bxi )
2
(9.18)

e, aplicando o princípio da máxima probabilidade da forma habitual, obtemos todos os


parâmetros de interesse que caracterizam a melhor recta que se ajusta aos dados
experimentais:

w x w y −w x w x y
2
i i i i i i i i i
A= i i i i
(9.19)
Δ
e
w w x y −w x w y
i i i i i i i i
B= i i i i
, (9.20)
Δ

Departamento de Física da FCTUC 96


TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados

onde
2
 
Δ =  wi  w x −   wi xi  .
2
i i (9.21)
i i  i 

Por sua vez, as incertezas definem-se como


w x 2
i i
σA = i
(9.22)
Δ
e
w i
σB = i
. (9.23)
Δ

9.4.3. Incertezas em xi e yi

Consideremos primeiro o caso de as medidas xi virem afectadas de erro mas as medidas


yi não.
A figura 9.2 mostra a melhor recta y = A + Bx de um ajuste a pontos experimentais e
também um ponto particular medido (xi,yi), o qual não está sobre a recta devido à incerteza Δx
que afecta a medida de xi. A partir do mesmo gráfico, podemos perceber que se admitíssemos
que a medida de xi era exacta e tomássemos antes a incerteza Δy em yi, o ponto (xi,yi) estaria
igualmente afastado da recta. Podemos então definir um erro em yi equivalente ao erro em xi e
podemos relacioná-los, em 1ª aproximação, pela série de Taylor 6:

dy
Δy (equivalente ) ≈ Δx .
dx

Substituindo as incertezas pelos respectivos desvios padrão vem:

dy
σ y (equivalente ) = σx .
dx

yi

(xi,yi)
em xi

Figura 9.2 – O ponto experimental (xi,yi) está desviado da recta devido ao erro Δx em xi.

2
6 dy 1 2 d y dy
y = yi + ( x − xi ) + ( x − xi ) 2
+ ... ; Δy ≈ Δx
dx 2! dy dx

Departamento de Física da FCTUC 97


TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados

Este resultado é verdadeiro qualquer que seja a curva y(x) mas é particularmente simples se se
tratar de uma linha recta uma vez que, neste caso, dy/dx corresponde ao declive da recta, ou
seja, à constante B. Assim, para uma recta:

σ y (equivalente ) = Bσ x . (9.24)

Em particular, se todas as incertezas σx são iguais, o mesmo é verdade para as incertezas


equivalentes σy. Portanto, o problema de ajustar uma recta aos pontos (xi,yi) com iguais
incertezas em x e sem incertezas em y é equivalente ao problema de ter iguais incertezas em y
e nenhuma em x.7

Podemos agora estender este argumento ao caso em que ambas as medidas xi e yi têm
incertezas. A incerteza em x é equivalente à incerteza em y dada por 9.24. Além disso, y
também está sujeito à sua própria incerteza, σy. Estas duas incertezas são independentes e os
seus quadrados devem ser adicionados da forma conhecida para erros independentes e
aleatórios. Assim, o problema original com incertezas em x e y pode ser substituído por um
problema equivalente no qual apenas y tem incerteza dada por:

(
σ y (equivalente ) = σ 2y + Bσ 2x . ) (9.25)

Se as incertezas σx forem iguais entre si e as incertezas σy forem também iguais entre si,
então as incertezas resultantes da eq. 9.25 são também iguais e podemos usar as fórmulas 9.8
a 9.14. Se, pelo contrário, as incertezas em x e/ou em y não são iguais, a eq. 9.25 continua
válida mas teremos que usar o método dos mínimos quadrados pesados (equações 9.19 a
9.23).

Como vimos, no caso do ajuste de uma recta aos pontos experimentais, o facto de
existirem incertezas em ambas as grandezas x e y altera pouco a situação mais simples, de
incertezas apenas nas medidas de y.

9.5. Ajuste dos mínimos quadrados a outras curvas

Função Polinomial : y = A + Bx + Cx 2 + ... + Hx n

Para simplificar, e sem perda de generalidade, consideremos o polinómio:

y = A + Bx + Cx 2 .8 (9.26)

Como anteriormente, suponhamos que temos uma série de medidas (xi,yi), i = 1, …, N, com
os xi sem incertezas e os yi igualmente incertos. Para cada xi, o correspondente verdadeiro
valor de yi é dado pela eq. 9.26, onde A, B e C são ainda desconhecidos. Considerando que os
yi seguem distribuições normais, centradas no verdadeiro valor correspondente e com a

7
Na prática, os pontos não ficam exactamente sobre a recta e os dois problemas equivalentes não dão
exactamente a mesma solução para A e B. Contudo, as rectas concordam dentro das incertezas dadas pelas
definições 9.13 e 9.14.
8
Um exemplo bem conhecido é o da equação do espaço percorrido por um corpo em queda livre: y = y + v t − 1 gt 2
0 0
2

Departamento de Física da FCTUC 98


TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados

mesma largura σy, a probabilidade de obter os N valores observados y1,…, yN é, à semelhança


do procedimento usado nas secções anteriores:

Prob(y1 ,..., y N ) ∝ e − χ
2
2
, (9.27)
onde

χ =
2
N
(y − A − Bx − Cx )
i i
2 2
i
. (9.28)
i =1 σ 2y

Aplicando o princípio da máxima probabilidade, derivando o expoente e igualando a zero,


obtemos as seguintes equações:

AN + B  xi + C  xi2 =  yi
i i i

A xi + B  x + C  x =  xi yi 2
i
3
i (9.29)
i i i i

A xi2 + B  xi3 + C  xi4 =  xi2 yi .


i i i i

Extraindo os parâmetros A, B e C do sistema de equações 9.29 obtém-se o ajuste polinomial


dos mínimos quadrados ou a regressão polinomial.9

Função Exponencial: y = Ae Bx (9.30)

Para podermos determinar as constantes A e B recorrendo ao princípio da máxima


probabilidade, transformamos a eq. 9.30, não linear, numa relação linear entre y e x, à qual
sabemos depois aplicar o ajuste dos mínimos quadrados. Escolhemos então a transformação

(xi , yi ) → (xi , zi ) ,
fazendo primeiro
ln y = ln A + Bx
e depois
z = ln A + Bx . (9.31)

O método dos mínimos quadrados dá-nos a melhor estimativa para as constantes ln A (de
onde extraímos A) e B. Repare-se que mesmo quando as incertezas em y são iguais, as
incertezas em z não o são, uma vez que:
dz σy
σz = σy = .
dy y

Em rigor, deveríamos usar, portanto, o método dos mínimos quadrados pesados. Na prática,
muitas vezes a dispersão das incertezas em z não é grande e torna-se razoável assumir
incertezas iguais em z, aplicando então o método normal.

9
Em princípio, um método semelhante pode ser aplicado a qualquer função f(x) que dependa de parâmetros
desconhecidos A, B, etc. Embora alguns casos possam ser complexos, são sempre resolúveis aqueles que
correspondam a funções que dependem linearmente dos parâmetros A, B, etc, como é o caso, por exemplo, de
y = Asinx + Bcosx.

Departamento de Física da FCTUC 99


TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados

Regressão Múltipla

Até aqui considerámos apenas a relação entre 2 variáveis. E se existirem mais?


Recordemos, por exemplo, a equação dos gases ideais PV=nRT, onde se relacionam as três
grandezas pressão (P), volume (V) e temperatura (T).

Consideremos a relação geral entre z, x e y:

z = A + Bx + Cy (9.32)

e admitamos, para simplificar, que numa série de medidas (xi, yi, zi), com i = 1, …, N, os xi e
yi são exactos e os zi têm associadas iguais incertezas. Aplicando o princípio da máxima
probabilidade, como anteriormente, concluímos que as constantes A, B e C podem ser
determinadas a partir do sistema de equações:

AN + B  xi + C  yi =  zi
i i i

A xi + B  xi2 + C  xi yi =  xi zi (9.33)
i i i i

A yi + B  xi yi + C  yi2 =  yi zi .
i i i i

Este método é conhecido por regressão múltipla.

Departamento de Física da FCTUC 100

Você também pode gostar