Você está na página 1de 5

• Universidade Federal do Rio de Janeiro • CPC702

Trabalho 1
CPC702–Problemas Inversos

Kristian Torres

24 de Julio, 2017

Utilizar um polinômio do quinto grau para aproximar os 3 conjuntos de dados do arquivo dados1.txt e

encontrar seus coeficientes minimizando a norma `1 e a norma `2 do resíduo.

A primeira coluna do arquivo contém as abscissas, as três proximas colunas contêm conjuntos de dados.

Anotar os coeficientes para cada método e cada conjunto de dados. Serão 6 solucões. Seria possível inferir

sobre as características dos conjuntos de dados por meio das soluções?

A Figura 1 apresenta os gráficos dos três conjuntos de dados observados para cada valor do

eixo das abscissas (cada conjunto de dados do arquivo dados1.txt contêm 100 medições).

Conjunto 1 Conjunto 2 Conjunto 3


350 350 350

300 300 300

250 250 250

200 200 200


f(x)

f(x)

f(x)

150 150 150

100 100 100

50 50 50

0 0 0
0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10
x x x

Figura 1: Conjuntos de dados do arquivo dados1.txt

Em termos gerales, os coeficientes do polinômio m( x ) = m0 + m1 x + m2 x2 + m3 x3 + m4 x4 +

m5 x5 que melhor ajusta a curva de cada conjunto, podem ser obtidos resolvendo o problema

   
1 x1 x12 ... x1n   d1
  m  
1
x22 x2n 
   
1 x2 ...  d2 

 .. 
Gm =  . ≈ =d (1)
  
.. .. ..   .    .. 
  
.
. . . .     . 
  mn  
1 xm 2
xm ... xmn dm

1
• Universidade Federal do Rio de Janeiro • CPC702

onde G é uma matriz de dimensões 100 × 6, m é um vetor de dimensões 6 × 1 e d é um vetor de

dimensões 100 × 1. Dependendo da norma escolhida para realizar a regressão linear, a solução

do problema da equação 1 pode ser atingida de diversas formas. Apresentam-se a seguir os

resultados obtidos na regressão linear minimizando as normas `1 e `2 , respetivamente.

I. Regressão linear: minimização da norma `2

Na minimização `2 , os coeficientes do polinômio foram obtidos resolvendo o sistema

GT Gm = GT d (2)

e a norma `2 do vetor resíduo r foi calculada utilizando a expressão


m
krk22 = ∑ ( di − ( G × m ) i ) 2 (3)
i =1

Na Tabela 1 são apresentados os valores da norma `2 e dos coeficientes obtidos para cada

conjunto de dados. Utilizando este tipo de regressão linear, o polinômio que melhor ajustou os

dados observados foi o obtido para o primeiro conjunto.

Conjunto
Coeficientes 1 2 3
m0 9.999 × 10−1 1.671 3.268
m1 2.000 × 10−1 −1.385 −7.557
m2 2.999 3.951 9.651
m3 4.000 × 10−2 −1.823 × 10−1 −2.065
m4 −3.745 × 10−7 2.246 × 10−2 2.714 × 10−1
m5 1.527 × 10−8 −8.231 × 10−4 −1.215 × 10−2
norma `2 7.935 × 10−8 20.091 2.593 × 103

Tabela 1: Resultados da regressão linear por minimização da norma `2

II. Regressão linear: minimização da norma `1

Neste tipo de regressão, os coeficientes do polinômio são calculados partindo do sistema

GT RGm = GT Rd (4)

onde R é uma matriz diagonal cujos elementos são o inverso do valor absoluto do vetor resíduo:

Ri,i = 1/|ri | (5)

2
• Universidade Federal do Rio de Janeiro • CPC702

Como a matriz R depende do vetor m, a regressão por minimização da norma `1 exige um

processo iterativo. Neste caso, foram utilizados os vetores resíduo obtidos na seção anterior, como

dados de entrada para a aproximação inicial no calculo da matriz R. O critério de parada escolhido

no processo iterativo foi:


k m k +1 − m k k 2
<τ (6)
1 + k m k k2

Finalmente, a norma `1 do vetor resíduo r foi calculada a cada iteração, utilizando a expressão
m q
k r k 1 = ∑ ( di − ( G × m ) i ) 2 (7)
i =1

Na Tabela 2 são apresentados os parâmetros utilizados no processo iterativo e os valores dos

coeficientes obtidos para cada conjunto de dados.

Conjunto
Coeficientes 1 2 3
m0 9.999 × 10−1 1.801 1.803
m1 2.000 × 10−1 −1.583 −1.721
m2 2.999 4.022 4.384
m3 4.000 × 10−2 −1.869 × 10−1 −3.402 × 10−1
m4 −2.556 × 10−7 2.167 × 10−2 4.379 × 10−2
m5 1.059 × 10−8 −7.491 × 10−4 −1.791 × 10−3
τ 0.01 0.01 0.01
N◦ de iterações 1 3 8
norma `1 2.817 × 10−4 56.572 55.611

Tabela 2: Resultados da regressão linear por minimização da norma `1

III. Comparação dos resultados

A regressão por minimização da norma `1 quantifica melhor o desajuste nos casos onde os dados

apresentam outliers. A matriz de peso R faz com que a aproximação esteja menos afetada por

estas anomalias. Na Figura 1, pode ser observado que o terceiro conjunto de dados apresenta

maior número de outliers, se comparado com os conjuntos 1 e 2.

Segundo os resultados apresentados nas Tabelas 1 e 2, o valor da norma `1 é maior do que a

norma `2 para o primeiro e o segundo conjunto de dados porque estes não contêm presença de

outliers. O caso contrário acontece no terceiro conjunto, onde o ajuste feito na minimização da

norma `1 ignora a presença de distorções nas medições. Na Figura 4 é possível observar que o

3
• Universidade Federal do Rio de Janeiro • CPC702

ajuste da minimização da norma `1 está sendo menos afetado nas regiões próximas aos outliers.

Conjunto 1
350

300

250

200
f(x)

150

100

50

0
0 1 2 3 4 5 6 7 8 9 10
x

Figura 2: Regresão linear pela minimização das normas `1 e `2 para o conjunto 1

Conjunto 2
350

300

250

200
f(x)

150

100

50

0
0 1 2 3 4 5 6 7 8 9 10
x

Figura 3: Regresão linear pela minimização das normas `1 e `2 para o conjunto 2

4
• Universidade Federal do Rio de Janeiro • CPC702

Conjunto 3
350

300

250

200
f(x)

150

100

50

0
0 1 2 3 4 5 6 7 8 9 10
x
Figura 4: Regresão linear pela minimização das normas `1 e `2 para o conjunto 3

Você também pode gostar