Você está na página 1de 5

Ajuste de curvas por quadrados mínimos lineares

Felipe Leonardo de Aguiar e Wanderley Innocêncio Moreira Júnior Engenharia de Minas – 1o. Período Professor: Rodney Josué Biezuner Disciplina: Geometria Analítica e Álgebra Linear

1. Introdução
Utilizamos este método quando temos uma distribuição de pontos e queremos ajustar a melhor curva a este conjunto de dados. Inicialmente, vamos analisar o caso em que a curva de ajuste é uma função linear: y i = a + bxi Para que esta seja a reta que melhor se ajusta aos dados, devemos minimizar a soma das diferenças entre os valores de f(x) tabelados yi e os valores da curva de ajuste a+bxi em cada ponto. Mas esta diferença pode ser tanto positiva quanto negativa, o que pode ocasionar em uma soma nula das diferenças mesmo com os valores muito distantes da reta. Uma forma de evitar o cancelamento é minimizar o quadrado da diferença. Poderíamos ter escolhido minimizar o módulo da diferença, mas isto acarretaria em uma complicação nos cálculos, devido à necessidade de se obter as primeiras derivadas. Supondo que sejam p pontos tabelados, definimos a função: S (a, b) = ∑ ( y i − (a + bxi ) )2
i =1 p

Nossa problema agora é encontrar valores de a e de b que minimizam S(a,b). Usando notação matricial, com os resíduos definidos por ri = y i − (a + bxi ) e definindo as matrizes  y1   r1  1 x1        a  y2   r2  1 x 2  X =  , Y =  , R =  , A =  b M M M M           yp   rp  1 x p        segue que y i = a + bxi para todo i variando de 1 até p é o mesmo que AX = Y . Assim, como queremos minimizar S (a, b) = ∑ ri 2
i =1 p

em notação matricial temos que

Para isso.. R =  . a1. em notação matricial. Ajuste de Curvas por Polinômios e outras Funções Podemos generalizar este resultado para ajustarmos qualquer polinômio da forma y = a 0 + a1 x + K + a n x n aos pontos (xi. .. temos que resolver o mesmo sistema ATAX=ATY. o vetor X de modo a minimizar M. Basta fazermos: ri = y i − a 0 + a1 xi + K + a n xin 1 x1  a1   y1   r1         1 x 2  a2   y2   r2  X =  . A =  M M M M M       ap   yp   rp  1 x p        ( ) 2 x1 2 x2 M x2 p n L x1   n L x2   O M  L xn  p Então.∑ ri 2 = R T R i =1 p onde R = Y − AX Denotando M = S (a. o sistema linear admite solução única e esta solução será o ponto crítico que será o ponto de mínimo. o gradiente de M (ou seja. Efetuando os cálculos de ATA e de ATY. Efetuando os cálculos de ATA e de ATY temos:  p  ∑1  T A A =  ip=1  x ∑ i  i =1   p   ∑ yi  xi  ∑   i =1  T i =1 .. Y =  . A Y =  p  p 2  x y  ∑ xi  ∑ i i  i =1   i =1  p 2. temos: . para encontrarmos os pontos a0. para encontrarmos a e b que faça com que a soma do quadrado das diferenças entre yi e a+bxi seja mínima basta resolvermos o sistema linear AT AX = AT Y Como a matriz ATA é simétrica definida positiva. a derivada primeira da função de duas variáveis M) deve ser nulo: ∇M = − AT Y − Y T A + 2 AT AX = 0 ⇒ AT AX = AT Y Assim. an. temos M = (Y − AX )T (Y − AX ) = Y T Y − X T AT Y − Y T AX + X T AT AX Queremos obter os parâmetro a e b ou. yi). b).

3 17. que é uma condição necessária para que a matriz AtA seja invertível. com isso podemos prever qual será a população em um ano posterior.2 51. Considere a tabela abaixo da população brasileira (em milhões): 1872 1890 1900 1920 1940 1950 1960 1970 1980 1991 1996 ano população 9.9 14.1 119.4 30. De posse da tabela podemos construir um sistema AX=Y onde: logo.9 70. 3.2 93. a solução X é obtida resolvendo o sistema cuja solução é . p 0  ∑ xi  i =1  p  x1 ∑ i  i =1M  p  xn ∑ i  i =1 ∑ x1 i ∑ xi2 i =1 i =1 p p ∑ xin+1 i =1 p M   p 0   ∑ xi y i  xin  ∑   i =1  i =1 a  0   p  p   1 n +1  a   1 x y  L ∑ xi   =  ∑ i i  i =1 i =1 M  O M    M  a n   p  p   2n   xn y  L ∑ xi  ∑ i i  i =1   i =1  p L Este procedimento pode ser generalizado para qualquer curva de ajuste da forma: y = a 0 g 0 ( x) + K + a n g n ( x) desde que as funções gj(x) avaliadas nos pontos resultem em vetores linearmente independentes. Um exemplo de aplicação do método de quadrados mínimos Podemos usar o método dos quadrados mínimos para ajustar uma curva aos dados da população brasileira entre os anos de 1872 e 1996.2 157.1 Vamos ajustar uma curva da forma de um polinômio de segundo grau y=a+bx+cx² onde y denota a população e x o ano.6 41.0 146.

1 população ln(população) 2.8 milhões de habitantes. vamos construir a matriz A e os vetores X e Y: .421 3.05688 Agora. é aplicando-se o logaritmo na expressão acima. juntamente com os pontos da tabela. cujo valor podemos comparar com os dados oficiais do IBGE que informa que a população brasileira em 2000 era de 169.4 30. obtemos ln(y) = lna+bx.1%.6 41.85647 3. Para este exemplo.29253 2.2 93.0 146.Daí podemos calcular a população em 2000 calculando y(2000)=167.1 119.9.9 14.2 51. ln(y)) pelo método dos quadrados mínimos.2 157. e com isso ajustamos uma reta aos pontos (x.6.98498 5.b e para aplicar o procedimento descrito anteriormente (quadrados mínimos lineares) devemos linearizar a curva de ajuste. Gráfico do polinômio de grau 2 obtida por quadrados mínimos. Vamos agora tentar ajustar aos mesmos pontos uma função do tipo y(x) = aexp(bx).9 70.53367 4.3 17. Neste caso a curva de ajuste não é linear nos parâmetros a. Note que os parâmetros a e b encontrados não são os que minimizam a função mas os que minimizam a função 1872 1890 1900 1920 1940 1950 1960 1970 1980 1991 1996 ano 9.77912 4. A partir desses dados podemos prever a população brasileira no ano de 2010 calculando y(2010)=197. Portanto calculamos ln(y).25135 4. Ajustando um polinômio de segundo grau pelo método dos quadrados mínimos conseguimos uma previsão para a população em 2000 que difere da real em 1.66026 2.71844 3.94932 4.

Em ambos os casos. Calculando o valor dessa função no ponto 2000 temos y(2000)=176.35.2.45.4266)exp(0.4266+0. Já para a exponencial temos que o resíduo é 11. cujo erro percentual comparado com os dados do IBGE é de 3. portanto a maneira como a curva se ajusta aos pontos tabelados não diz nada a respeito da maneira como essa curva fará previsões para outros pontos.0227992x)=2. dado pela norma 2 do vetor formado pela diferença entre o valor real e o valor calculado pela função obtida para cada ponto.2. conseguimos ajustar melhor os pontos iniciais.resolvendo o sistema .77287 10-18exp(0. Podemos então traçar o gráfico da nova função Gráfico da função exponencial obtida por quadrados mínimos.7%. A partir desses dados podemos prever a população brasileira no ano de 2010 calculando y(2010)=221. Note que quando ajustamos por uma função exponencial. Aplicando a função exponencial temos: y=exp(-40. . podemos calcular o resíduo. conseguimos ajustar melhor os pontos finais da tabela.0227992x. temos como solução o vetor: logo a solução é ln(y)=-40. Note que apesar do resíduo da exponencial ter sido menor do que o resíduo da parábola.0227992x). Para a parábola temos que o resíduo é 14. já no caso de uma parábola. juntamente com os pontos da tabela. a previsão feita pela parábola para o ano de 2000 foi melhor do que a da exponencial.