Apnt 5 17

TLF – 2010/11 Cap.
IX – Ajuste dos mínimos quadrados
Capítulo IX
Ajuste dos Mínimos Quadrados
9.1. Ajuste de uma linha recta a dados experimentais 92
9.2. Determinação dos parâmetros da recta, A e B

(Incertezas apenas em yi e iguais a σy para todas as medidas) 93
9.3. Cálculo da incerteza σy nas medidas yi 94
9.4. Cálculo das incertezas associadas aos parâmetros A e B

9.4.1. Incertezas em yi, iguais entre si 95
9.4.2. Incertezas diferentes em yi 96
9.4.3. Incertezas em xi e yi 97
9.5. Ajuste dos mínimos quadrados a outras curvas:

- Função polinomial 98
- Função exponencial 99
- Regressão múltipla 100
Departamento de Física da FCTUC 91

TLF – 2010/11 Cap. IX – Ajuste dos mínimos quadrados
Ajuste dos Mínimos Quadrados
9.1. Ajuste de uma linha recta a dados experimentais
As experiências em Física consistem geralmente na medição de grandezas em

determinadas condições experimentais, a fim de se investigar a relação matemática entre si ou
entre essas variáveis medidas e outras grandezas com elas relacionadas e não directamente
medidas. Um exemplo realizado nas aulas práticas de TLF é a medida da tensão aos terminais
de uma lâmpada incandescente e da corrente eléctrica que a percorre a fim de se conhecer a
variação da potência dissipada em função da temperatura da lâmpada1.
Como já referimos em capítulos anteriores, a representação gráfica de grandezas

permite visualizar de forma simples e directa uma eventual dependência entre as variáveis
envolvidas. Neste capítulo vamos considerar apenas o caso de grandezas entre as quais existe
uma relação linear, ou seja, grandezas x e y relacionadas pela recta y = A + Bx .
Se as medições das grandezas x e y não estivessem inexoravelmente sujeitas a incertezas
experimentais, cada um dos N pares de pontos (xi,yi) medidos, estaria exactamente sobre a
recta y = A + Bx , como mostra a figura 9.1-a).
Figura 9.1 – Recta que melhor se ajusta aos pontos experimentais, no caso de (a) os pontos (xi,yi) não
terem erros experimentais; (b) terem erros experimentais.
Na prática há incertezas experimentais e o máximo que podemos esperar é que a distância

entre cada ponto (xi,yi) e a melhor recta ajustável aos pontos experimentais seja razoável
(figura 9.1-b).
Uma vez que neste capítulo damos como garantido que x e y estão linearmente
relacionadas, então o problema é precisamente encontrar a recta y = A + Bx que melhor se
ajusta aos resultados experimentais, ou seja, encontrar as melhores estimativas para as
constantes A e B com base nos dados (x1,y1), ..., (xN,yN). Esta questão pode ser abordada
graficamente e pode também ser tratada analiticamente, como faremos, aplicando o princípio
da máxima probabilidade. Neste caso, o método analítico para encontrar a recta que melhor
se ajusta a uma série de dados experimentais é designado por regressão linear ou ajuste dos
mínimos quadrados.
1
TP6 – Análise da radiação emitida por uma lâmpada de incandescência.

9.2. Determinação dos parâmetros da recta, A e B (Incertezas apenas em yi e iguais a σy

para todas as medidas)
Trata-se, portanto, de encontrar a melhor recta y = A + Bx que se ajusta aos pontos

medidos (x1, y1), ..., (xN, yN). Para simplificar admitiremos que a incerteza na medida de x é
desprezável. Quanto à grandeza y, assumiremos que cada yi é governado por uma distribuição
Gaussiana2 e que as incertezas nas medidas de yi têm todas o mesmo valor 3, ou seja, que
todas as distribuições têm a mesma largura σy.
Se conhecêssemos as constantes A e B, poderíamos definir que para qualquer valor xi
(que considerámos não ter incerteza associada) o verdadeiro valor de yi seria dado por:
(verdadeiro valor de yi) = A + Bxi .
Uma vez que a medida de yi segue uma distribuição Normal centrada no seu verdadeiro valor
e com largura σy, a probabilidade de obter o valor yi, de facto observado, é:
( yi −Yi )2 ( yi − A− Bxi )2
1 − 1 −
Prob A,B ( yi ) ∝
2 σ2y 2 σ 2y
e = e . (9.1)
σy σy
Os índices A e B lembram que a probabilidade depende dos valores (desconhecidos) de A e

de B. A probabilidade de obter a nossa série completa de medidas y1, …, yN corresponde ao
produto:
Prob A,B ( y1 ,..., y N ) = Prob A,B ( y1 )...Prob A,B ( y N ) ,

ou seja,
1 −χ 2 2
Prob A,B ( y1 ,..., y N ) ∝ e , (9.2)
σ Ny
onde o expoente é dado por:
χ2 = 
N
( yi − A − Bxi )2 . (9.3)
i =1 σ 2y
Agora, de um modo que já nos é familiar, consideraremos que as melhores estimativas

para as constantes desconhecidas A e B são os valores de A e B que maximizam a
probabilidade da eq. 9.2, ou seja, que minimizam a eq. 9.3 do χ2. Para encontrarmos esses
valores de A e B, diferenciamos a eq. 9.3 relativamente a A e a B, separadamente, e
igualamos as derivadas a zero:
∂χ 2 − 2 N
=  ( yi − A − Bxi ) = 0 ,
∂A σ 2y i =1
(9.4)
2
Admita, para exemplificar, que os pares de grandezas (xi,yi) são os pares de valores (comprimento do pêndulo
(l), período de oscilação (T)) necessários para a determinação da aceleração da gravidade (TP1). Se considerar
apenas um par (li,Ti), lembre-se que mediu 5 vezes o mesmo comprimento do fio e 5x10 vezes o mesmo
período. Se os tivesse medido um número incontável de vezes obteria uma distribuição Gaussiana tanto para li
como para Ti. Ora esta observação é também verdadeira para os outros 4 pares de valores (li,Ti) que
determinou no mesmo trabalho.
3
Esta aproximação é razoável em muitas realizações experimentais.

∂χ 2 − 2 N
=  xi ( yi − A − Bxi ) = 0 ,
∂B σ 2y i =1
(9.5)
As duas condições anteriores (9.4 e 9.5) dão origem, respectivamente, às equações:
AN + B xi = yi , (9.6)
A xi + B  xi2 = xi yi . (9.7)
O sistema formado pelas equações 9.6 e 9.7, por vezes designadas por equações normais,
pode ser resolvido de modo a fornecer a estimativa dos mínimos quadrados para as constantes
A e B:
x  y −x x y
2
i i i i i
A= i i i i
(9.8)
Δ
e
N  xi yi −  xi  yi
B= i i i
, (9.9)
Δ
onde
2
 
Δ = N  x −   xi  .
2
i (9.10)
i  i 
Os resultados 9.8 e 9.9 correspondem às melhores estimativas para as constantes A e B da

recta y = A + Bx , baseadas nos N pares de ponto medidos (x1, y1),..., (xN, yN). A recta
resultante é designada por recta de ajuste dos mínimos quadrados ou regressão linear de y
em x.
9.3. Cálculo da incerteza σy nas medidas yi
Relembremos que os números y1, ..., yN correspondem a N medidas de y realizadas em

condições experimentais diferentes (as mesmas dos x1,..., xN correspondentes) e, portanto, não
são N medidas do mesmo número4. Por isso, não tem sentido olharmos para os diferentes yi e
analisarmos a dispersão dos valores entre si.
Apesar disso, é possível fazermos uma estimativa da incerteza σy a partir dos próprios
pares de valores (xi,yi) medidos. Na verdade, segundo o princípio da máxima probabilidade, a
melhor estimativa para o parâmetro σy é aquela que maximiza a probabilidade dada pela
equação 9.2 e, portanto, minimiza o expoente 9.3. Então, diferenciando 9.3 relativamente a σy
e igualando a derivada a zero, obtém-se
1
 (y − A − Bxi ) .
2
σy = i (9.11)
N i
4
Usando novamente o exemplo da nota de rodapé nº 2, nesse trabalho prático (TP1) obtiveram-se N = 5 pares
diferentes das grandezas (comprimento do pêndulo (l), período de oscilação (T)).

Os verdadeiros valores dos parâmetros A e B da eq. 9.11 são desconhecidos. Devem,

portanto, ser substituídos pelas melhores estimativas de A e B, dadas pelas equações 9.8 e 9.9.
Esta substituição reduz ligeiramente o valor de 9.11 e pode mostrar-se que essa redução é
compensada se substituirmos o factor N do denominador por N–2. 5 Assim, o resultado final
para a incerteza σy é:
1
σy = 
N −2 i
( yi − A − Bxi )2 . (9.12)
É razoável admitirmos a substituição de N por N–2 se considerarmos a hipótese de

termos apenas dois pontos experimentais medidos: (x1,y1) e (x2,y2). Como sabemos, por
apenas dois pontos passa uma e uma só recta e o ajuste dos mínimos quadrados fornece
precisamente os parâmetros A e B dessa recta. Assim, os dois termos da soma no numerador
das equações 9.11 e 9.12 dão zero. Contudo, com N no denominador obteríamos a resposta
absurda σy = 0 (eq. 9.11). Com N–2, obtemos a indeterminação σy = 0/0, o que indica,
correctamente, que σy não se pode conhecer com apenas dois pares de medidas. É claro que,
se N for grande, a diferença entre N e N–2 não é importante.
Na verdade, este factor N–2 é uma reminiscência do factor N–1 que aparece no desvio
padrão de N medidas de uma mesma quantidade, por exemplo, x. Nesse caso, para
calcularmos σx tivemos primeiro que determinar o valor médio x . Uma vez que este cálculo
relaciona os N valores medidos que eram, à partida, independentes (diz-se que, à partida,
existiam N graus de liberdade), passam a haver apenas N–1 valores independentes. Podemos
assim dizer que, tendo calculado x , já só restam N–1 graus de liberdade.
No presente caso fizeram-se também N pares de medidas. Logo, à partida, existiam N
graus de liberdade. Contudo, para se calcular σy, foi necessário determinar previamente as
duas quantidades, A e B, a partir dos N pares de valores. Restam, então, N–2 graus de
liberdade.
Em geral, define-se nº de graus de liberdade em qualquer passo de um cálculo

estatístico como o nº de medidas independentes menos o nº de parâmetros calculados a
partir desse nº de medidas. Pode demonstrar-se (o que não faremos) que é o nº de graus de
liberdade, e não o nº de medidas, que deve aparecer em fórmulas tais como a definição 9.12.
9.4. Cálculo das incertezas associadas aos parâmetros A e B
9.4.1. Incertezas em yi, iguais entre si
Tendo encontrado o valor da incerteza σy, podemos agora estimar facilmente as

incertezas associadas aos parâmetros A e B. De facto, como as estimativas de A e B são
funções bem definidas dos números medidos x1, ..., xN e y1, ..., yN, as incertezas em A e B são
obtidas por simples propagação de erros. Tendo em conta que os xi têm incerteza desprezável
e que os yi vêm afectados por σy, pode mostrar-se que:
x 2
i
σA = σy i
(9.13)
Δ
5
De facto, se considerarmos a eq. 9.3, vimos que esta função é mínima para os valores de A e B obtidos pelas
fórmulas 9.8 e 9.9.

e que
N
σB = σ y , (9.14)
Δ
onde, como anteriormente,

2
 
Δ = N  x −   xi  . 2
i
i  i 
No caso particular de uma recta que passa na origem, ou seja, de y = Bx , as equações 9.9,
9.12 e 9.14 simplificam-se, dando:
i xi yi
B= , (9.15)
 xi2 i
1
σy = 
N −1 i
( yi − Bxi )2 (9.16)
e
σy
σB = . (9.17)
 xi2
i
9.4.2. Incertezas diferentes em yi
Os resultados apresentados até agora foram baseados na suposição de que só havia

incerteza nos valores experimentais de y e que essa incerteza era igual para todos os yi. O que
acontece se as incertezas σi dos yi forem diferentes? Se conhecermos os diferentes σi usamos
o método dos mínimos quadrados pesados, atribuindo a cada yi o peso:
1
wi = .
σi2
A expressão do χ2 que aparece na probabilidade total (eq. 9.2) vem, então:
χ 2 =  wi ( yi − A − Bxi )
2
(9.18)
e, aplicando o princípio da máxima probabilidade da forma habitual, obtemos todos os

parâmetros de interesse que caracterizam a melhor recta que se ajusta aos dados
experimentais:
w x w y −w x w x y
2
i i i i i i i i i
A= i i i i
(9.19)
Δ
e
w w x y −w x w y
i i i i i i i i
B= i i i i
, (9.20)
Δ

onde
2
 
Δ =  wi  w x −   wi xi  .
2
i i (9.21)
i i  i 
Por sua vez, as incertezas definem-se como

w x 2
i i
σA = i
(9.22)
Δ
e
w i
σB = i
. (9.23)
Δ
9.4.3. Incertezas em xi e yi
Consideremos primeiro o caso de as medidas xi virem afectadas de erro mas as medidas

yi não.
A figura 9.2 mostra a melhor recta y = A + Bx de um ajuste a pontos experimentais e
também um ponto particular medido (xi,yi), o qual não está sobre a recta devido à incerteza Δx
que afecta a medida de xi. A partir do mesmo gráfico, podemos perceber que se admitíssemos
que a medida de xi era exacta e tomássemos antes a incerteza Δy em yi, o ponto (xi,yi) estaria
igualmente afastado da recta. Podemos então definir um erro em yi equivalente ao erro em xi e
podemos relacioná-los, em 1ª aproximação, pela série de Taylor 6:
dy
Δy (equivalente ) ≈ Δx .
dx
Substituindo as incertezas pelos respectivos desvios padrão vem:
dy
σ y (equivalente ) = σx .
dx
yi
(xi,yi)
em xi
Figura 9.2 – O ponto experimental (xi,yi) está desviado da recta devido ao erro Δx em xi.
2
6 dy 1 2 d y dy
y = yi + ( x − xi ) + ( x − xi ) 2
+ ... ; Δy ≈ Δx
dx 2! dy dx

Este resultado é verdadeiro qualquer que seja a curva y(x) mas é particularmente simples se se
tratar de uma linha recta uma vez que, neste caso, dy/dx corresponde ao declive da recta, ou
seja, à constante B. Assim, para uma recta:
σ y (equivalente ) = Bσ x . (9.24)
Em particular, se todas as incertezas σx são iguais, o mesmo é verdade para as incertezas

equivalentes σy. Portanto, o problema de ajustar uma recta aos pontos (xi,yi) com iguais
incertezas em x e sem incertezas em y é equivalente ao problema de ter iguais incertezas em y
e nenhuma em x.7
Podemos agora estender este argumento ao caso em que ambas as medidas xi e yi têm
incertezas. A incerteza em x é equivalente à incerteza em y dada por 9.24. Além disso, y
também está sujeito à sua própria incerteza, σy. Estas duas incertezas são independentes e os
seus quadrados devem ser adicionados da forma conhecida para erros independentes e
aleatórios. Assim, o problema original com incertezas em x e y pode ser substituído por um
problema equivalente no qual apenas y tem incerteza dada por:
(
σ y (equivalente ) = σ 2y + Bσ 2x . ) (9.25)
Se as incertezas σx forem iguais entre si e as incertezas σy forem também iguais entre si,
então as incertezas resultantes da eq. 9.25 são também iguais e podemos usar as fórmulas 9.8
a 9.14. Se, pelo contrário, as incertezas em x e/ou em y não são iguais, a eq. 9.25 continua
válida mas teremos que usar o método dos mínimos quadrados pesados (equações 9.19 a
9.23).
Como vimos, no caso do ajuste de uma recta aos pontos experimentais, o facto de
existirem incertezas em ambas as grandezas x e y altera pouco a situação mais simples, de
incertezas apenas nas medidas de y.
9.5. Ajuste dos mínimos quadrados a outras curvas
Função Polinomial : y = A + Bx + Cx 2 + ... + Hx n
Para simplificar, e sem perda de generalidade, consideremos o polinómio:
y = A + Bx + Cx 2 .8 (9.26)
Como anteriormente, suponhamos que temos uma série de medidas (xi,yi), i = 1, …, N, com
os xi sem incertezas e os yi igualmente incertos. Para cada xi, o correspondente verdadeiro
valor de yi é dado pela eq. 9.26, onde A, B e C são ainda desconhecidos. Considerando que os
yi seguem distribuições normais, centradas no verdadeiro valor correspondente e com a
7
Na prática, os pontos não ficam exactamente sobre a recta e os dois problemas equivalentes não dão
exactamente a mesma solução para A e B. Contudo, as rectas concordam dentro das incertezas dadas pelas
definições 9.13 e 9.14.
8
Um exemplo bem conhecido é o da equação do espaço percorrido por um corpo em queda livre: y = y + v t − 1 gt 2
0 0
2

mesma largura σy, a probabilidade de obter os N valores observados y1,…, yN é, à semelhança

do procedimento usado nas secções anteriores:
Prob(y1 ,..., y N ) ∝ e − χ
2
2
, (9.27)
onde
χ =
2
N
(y − A − Bx − Cx )
i i
2 2
i
. (9.28)
i =1 σ 2y
Aplicando o princípio da máxima probabilidade, derivando o expoente e igualando a zero,

obtemos as seguintes equações:
AN + B  xi + C  xi2 =  yi
i i i
A xi + B  x + C  x =  xi yi 2
i
3
i (9.29)
i i i i
A xi2 + B  xi3 + C  xi4 =  xi2 yi .

i i i i
Extraindo os parâmetros A, B e C do sistema de equações 9.29 obtém-se o ajuste polinomial

dos mínimos quadrados ou a regressão polinomial.9
Função Exponencial: y = Ae Bx (9.30)
Para podermos determinar as constantes A e B recorrendo ao princípio da máxima

probabilidade, transformamos a eq. 9.30, não linear, numa relação linear entre y e x, à qual
sabemos depois aplicar o ajuste dos mínimos quadrados. Escolhemos então a transformação
(xi , yi ) → (xi , zi ) ,
fazendo primeiro
ln y = ln A + Bx
e depois
z = ln A + Bx . (9.31)
O método dos mínimos quadrados dá-nos a melhor estimativa para as constantes ln A (de
onde extraímos A) e B. Repare-se que mesmo quando as incertezas em y são iguais, as
incertezas em z não o são, uma vez que:
dz σy
σz = σy = .
dy y
Em rigor, deveríamos usar, portanto, o método dos mínimos quadrados pesados. Na prática,
muitas vezes a dispersão das incertezas em z não é grande e torna-se razoável assumir
incertezas iguais em z, aplicando então o método normal.
9
Em princípio, um método semelhante pode ser aplicado a qualquer função f(x) que dependa de parâmetros
desconhecidos A, B, etc. Embora alguns casos possam ser complexos, são sempre resolúveis aqueles que
correspondam a funções que dependem linearmente dos parâmetros A, B, etc, como é o caso, por exemplo, de
y = Asinx + Bcosx.

Regressão Múltipla
Até aqui considerámos apenas a relação entre 2 variáveis. E se existirem mais?

Recordemos, por exemplo, a equação dos gases ideais PV=nRT, onde se relacionam as três
grandezas pressão (P), volume (V) e temperatura (T).
Consideremos a relação geral entre z, x e y:
z = A + Bx + Cy (9.32)
e admitamos, para simplificar, que numa série de medidas (xi, yi, zi), com i = 1, …, N, os xi e
yi são exactos e os zi têm associadas iguais incertezas. Aplicando o princípio da máxima
probabilidade, como anteriormente, concluímos que as constantes A, B e C podem ser
determinadas a partir do sistema de equações:
AN + B  xi + C  yi =  zi
i i i
A xi + B  xi2 + C  xi yi =  xi zi (9.33)
i i i i
A yi + B  xi yi + C  yi2 =  yi zi .
i i i i
Este método é conhecido por regressão múltipla.

Apnt 5 17

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apnt 5 17

Enviado por

Direitos autorais:

Formatos disponíveis

TLF – 2010/11 Cap.

IX – Ajuste dos mínimos quadrados

Ajuste dos Mínimos Quadrados

9.1. Ajuste de uma linha recta a dados experimentais 92

9.2. Determinação dos parâmetros da recta, A e B

9.3. Cálculo da incerteza σy nas medidas yi 94

9.4. Cálculo das incertezas associadas aos parâmetros A e B

9.5. Ajuste dos mínimos quadrados a outras curvas:

Departamento de Física da FCTUC 91

Ajuste dos Mínimos Quadrados

9.1. Ajuste de uma linha recta a dados experimentais

As experiências em Física consistem geralmente na medição de grandezas em

Como já referimos em capítulos anteriores, a representação gráfica de grandezas

Na prática há incertezas experimentais e o máximo que podemos esperar é que a distância

Departamento de Física da FCTUC 92

9.2. Determinação dos parâmetros da recta, A e B (Incertezas apenas em yi e iguais a σy

Trata-se, portanto, de encontrar a melhor recta y = A + Bx que se ajusta aos pontos

(verdadeiro valor de yi) = A + Bxi .

Os índices A e B lembram que a probabilidade depende dos valores (desconhecidos) de A e

Prob A,B ( y1 ,..., y N ) = Prob A,B ( y1 )...Prob A,B ( y N ) ,

Agora, de um modo que já nos é familiar, consideraremos que as melhores estimativas

Departamento de Física da FCTUC 93

As duas condições anteriores (9.4 e 9.5) dão origem, respectivamente, às equações:

Os resultados 9.8 e 9.9 correspondem às melhores estimativas para as constantes A e B da

9.3. Cálculo da incerteza σy nas medidas yi

Relembremos que os números y1, ..., yN correspondem a N medidas de y realizadas em

Departamento de Física da FCTUC 94

Os verdadeiros valores dos parâmetros A e B da eq. 9.11 são desconhecidos. Devem,

É razoável admitirmos a substituição de N por N–2 se considerarmos a hipótese de

Em geral, define-se nº de graus de liberdade em qualquer passo de um cálculo

9.4. Cálculo das incertezas associadas aos parâmetros A e B

9.4.1. Incertezas em yi, iguais entre si

Tendo encontrado o valor da incerteza σy, podemos agora estimar facilmente as

Departamento de Física da FCTUC 95

onde, como anteriormente,

9.4.2. Incertezas diferentes em yi

Os resultados apresentados até agora foram baseados na suposição de que só havia

A expressão do χ2 que aparece na probabilidade total (eq. 9.2) vem, então:

e, aplicando o princípio da máxima probabilidade da forma habitual, obtemos todos os

Departamento de Física da FCTUC 96

Por sua vez, as incertezas definem-se como

Consideremos primeiro o caso de as medidas xi virem afectadas de erro mas as medidas

Substituindo as incertezas pelos respectivos desvios padrão vem:

Departamento de Física da FCTUC 97

Em particular, se todas as incertezas σx são iguais, o mesmo é verdade para as incertezas

9.5. Ajuste dos mínimos quadrados a outras curvas

Função Polinomial : y = A + Bx + Cx 2 + ... + Hx n

Para simplificar, e sem perda de generalidade, consideremos o polinómio:

Departamento de Física da FCTUC 98

mesma largura σy, a probabilidade de obter os N valores observados y1,…, yN é, à semelhança

Aplicando o princípio da máxima probabilidade, derivando o expoente e igualando a zero,

A xi2 + B  xi3 + C  xi4 =  xi2 yi .

Extraindo os parâmetros A, B e C do sistema de equações 9.29 obtém-se o ajuste polinomial

Função Exponencial: y = Ae Bx (9.30)

Para podermos determinar as constantes A e B recorrendo ao princípio da máxima

Departamento de Física da FCTUC 99

Até aqui considerámos apenas a relação entre 2 variáveis. E se existirem mais?

Consideremos a relação geral entre z, x e y:

Este método é conhecido por regressão múltipla.

Departamento de Física da FCTUC 100

Você também pode gostar