Escolar Documentos
Profissional Documentos
Cultura Documentos
Neste tpico iremos ver a definio da norma L1 e seu significado fsico. Em seguida iremos falar sobre dois estimadores. O primeiro o estimador de mnimo dos resduos via norma L1 e segundo o estimador da variao total (total variation TV).
Definio da norma L n
B
M = v i i =1
1/ n
(1)
i =1
vi
(2)
= yo yc
No tpico 6 deste curso, deduzimos o estimador de mnimos quadrados (MQ) que consiste em minimizar a soma dos quadrados dos resduos, i.e.,
y Ap
2
min
pF
(y A p) (y A p)
o T o
usando
quadrado da norma L2. Isto equivale a minimizarmos a norma L2. Vimos no tpico 6 que a minimizao desta funo Q resulta no estimador dos mnimos quadrados (MQ sobredeterminado). Aqui chamaremos este estimador de
p L2 =
(A
N i =1
-1
Q1 = 1 = i .
(4)
min { Q 1 } = min
= min
p
i =1
i.
(5)
min { Q 1 } = min
p
= min
p
i =1
= min y o i y c i
p
(6)
em que y c i a i-simo elemento do vetor de dados ajustados (ou calculados ou preditos), i.e, y C = A p . A condio de mnimo que a derivada da funo Q1 (equao 4) em relao ao vetor de parmetros p seja zero. diferencivel se um dos elementos de Note que esta funo no zero. Vamos ignorar este
1 ,..., N
pk
, nos pontos
no so zero:
2
Q1 N i N = = ai sgn( i) pk i =1 pk i =1 k
(7)
em que ai k o ik-simo elemento da matriz de sensibilidade A e sgn( i) o sinal do i-simo resduo. Note que a derivada da funo Q1 (equao 4) em relao ao vetor de parmetros
p
depende
do
resduo
como
= y o y c = y o A p ento estamos diante de um problema rigorosamente nolinear. Isto porque a derivada da funo depende dos parmetros desconhecidos
p que queremos estimar.
Apesar do problema de minimizao dos resduos segundo a norma 1 ser um rigorosamente no-linear, uma das alternativas resolver atravs de um mtodo iterativo dos mnimos quadrados reponderados ( IRLS iteratively reweighted least sqaures) . Para tanto vamos reescrever o sinal do i-simo resduo como
sgn( i) =
i , i
(8)
p {Q1} = A T W = A T W y o A p ,
(9)
em que W (N x N) uma matriz diagonal de pesos cujo i-simo elemento da diagonal o inverso do valor absoluto do resduo estimado na iterao anterior.
1 / | 1 | 1/ | 2 | W= O 1/ | N | N N
(9a)
Valria Cristina F. Barbosa Observatrio Nacional A condio de mnimo que a derivada da funo Q1 (equao 4) em relao ao vetor de parmetros p seja zero. Ento fazendo
p {Q1} = A T W y o A p = 0
temos
A T Wy o AT WA pL1 = 0 .
Logo chegamos ao sistema de equaes:
A T WA pL1 = A T Wy o
resduos atravs da norma 1.
(10)
Como a matriz de peso W no sistema de equao 10 depende dos resduos (i.e., depende dos parmetros), ento estamos diante de um sistema de equaes no lineares. Uma das alternativas usar o mtodo iterativo dos mnimos quadrados reponderados (IRLS). Ento, na k-sima iterao estimamos
( um vetor de parmetros pLk ) . O algoritmo comea com a soluo de mnimos 1 quadrados sobre determinado (estimador chamado neste tpico de p L 2 , veja a
equao 3). Ento, na iterao k = 1 estimamos:
( p L11) = p L 2
e a matriz de
pesos W (1) (equao 9a) na iterao k=1. Ento, ainda na iterao k=1, resolvemos o sistema de equaes (equao 10):
(1 A T W ( k ) A pLk +1) = A T W ( k ) y o
e a matriz de
em que um nmero pequeno chamado de tolerncia. Este procedimento falha quando se algum resduo for igual a zero por causa da matriz de pesos (equao 9a). A soluo definir um valor pequeno r de modo que se em alguma iterao k o i-simo resduo i( k ) for menor que r ento faz-se i( k ) = r , e consequentemente teremos que o i-simo elemento da
( diagonal da matriz de pesos W (k ) igual a wiik ) = 1 / r .
Qual o significado fsico da minimizao da Norma 1 do vetor de resduos Ao minimizarmos o vetor dos resduos segundo a norma 1 em relao ao vetor de parmetros p estamos minimizando a funo Q1 (equao 4). Ento minimizamos o sinal dos resduos. Minimizar o sinal dos resduos significa que podemos ter valores elevados dos resduos, porm o somatrio dos sinais destes resduos deve ser mnimo. Isto faz com que a minimizao da norma L1 dos resduos despreze dados observados que sejam esprios (outiliers). Dizemos que a minimizao da norma L1 dos resduos mais robusta no sentido de permitir grandes resduos (diferena entre os dados observados e os dados ajustados ou preditos). A Figura 1 mostra em pontos pretos um conjunto de observaes geofsicas. Note que h um nico dado esprio (outilier). As retas tracejadas coloridas representam retas de ajustes (dados ajustados ou preditos) minimizando-se as normas 2 resduos (reta L2) e 1 (reta L1) do vetor de
observado (pontos pretos) e o ajustado (retas ajustadas via normas L1 e L2). Note que a reta ajustada via norma L2 atrada pelo ponto esprio (outlier). Ao contrrio, a minimizao da norma L1 dos resduos permite grandes resduos
Curso de Inverso de Dados Geofsicos Programa de Ps-graduao em Geofsica do ON 5
Valria Cristina F. Barbosa Observatrio Nacional pois minimiza-se o sinal dos resduos. Logo a reta ajustada via norma L1 NO atrada pelo ponto esprio (outlier).
Figura 1
Estimador da Variao Total (TV) A funo TV TV (p) (Rudin et al., 1992) definida como
TV
(p ) = B p
1
(11)
em que B uma matriz representando o operador discreto de primeiras derivadas em relao as direes horizontais de distribuio dos parmetros e denota norma l1 . Note que o produto B p representa a diferena entre
equao 11 representa o regularizador de Tikhonov de ordem 1 mas usando-se a norma L1. A funo TV no penalize as discontinuidades da distribuio espacial do vetor de parmetros p de um modelo interpretativo (Vogel and Oman, 1996; 1998). Ento, minimizando-se a funo TV introduziremos a informao a prior que a distribuio espacial do vetor de parmetros no ser suave, mas descontnua. Usando a definio da norma l1 , a funo TV function dada na equao 11 pode ser reescrita como
TV
(p ) =
L l =1
pi p
(12)
em que l entende-se pelo l -simo par, pi e p j de parmetros espacialmente adjacentes em relao as direes de distribuio destes parmetros e L o nmero total de pares de parmetros espacialmente adjacentes. Como a funo TV TV (p) no diferencivel quando pi = p j , em geral usa-se a aproximao
1
TP PT
(p) (p) = [( pi p j ) + ]
TV TV L 2 l =1
1/ 2
(13)
TV (p)
evita
dificuldades
absolutos da funo original TV (p) por uma funo suave que discontinuidade da derivada. A funo (p)
TV
(p ) =
2 2
+ ( )
TV
(p )
Para detalhes veja a tese de doutorado do aluno do Observatrio Nacional: Cristiano Mendel Martins (Martins, C.M. 2009)
Referencias
Acar, R., and C. R. Vogel, 1994, Analysis of total variation penalty methods: Inverse Problems, 10, 12171229. Martins, C.M. 2009, Inverso gravimtrica do relevo 3d de bacias sedimentares e da variao da densidade usando informao a priori sobre o ambiente geolgico: Tese de doutorado do Observatrio Nacional. Rudin, L., S. Osher, and E. Fatemi, 1992, Nonlinear total variation based noise removal algorithms: Physica D, 60, 25968. Vogel, C. R., and M. E. Oman, 1996, Iterative methods for total variation denoising: SIAM Journal of Scientific Computing, 17, 227238.