Escolar Documentos
Profissional Documentos
Cultura Documentos
Abstract— The problem of restoring images degraded by linear position invariant distortions and noise is solved by means of a
L1 -norm regularization, which is equivalent to determining a L1 -norm solution of an overdetermined system of linear equations,
which results from a data-fitting term plus a regularization term that are both in L1 norm. This system is solved by means of a
gradient-based neural network with a discontinuous activation function, which is ensured to converge to a 1 -norm solution of the
corresponding system of linear equations.
Keywords— gradient systems, sliding modes, neural networks, image restoration, Persidskii systems.
Resumo— O problema de restaurar imagens degradadas por distorções lineares e invariantes no espaço e afetadas por ruído
é resolvido através de uma regularização em norma L1 , que equivale a determinar uma solução em norma L1 de um sistema
sobredeterminado de equações lineares, que resulta da norma L1 do erro somado a um termo de regularização, também em norma
L1 . Este sistema é resolvido através de um sistema gradiente com o segundo membro descontínuo, que pode ser interpretado
como um modelo de rede neural com funções de ativação descontínuas, que converge para uma solução em norma L1 do sistema
de equações lineares correspondente.
Palavras-chave— sistemas gradientes, modos deslizantes, redes neurais, restauração de imagens, sistemas Persidskii.
1
0
que no mínimo n componentes do vetor de resíduos a12
+
_
r1 a11
1
0 sgn(r1) 1
0
r∗ = Af ∗ − b são nulos (Bloomfield e Steiger, 1983), .. +
. + + R
a1n a21
1
0 .. +
µ1 1
0
ou seja, esta solução ajusta exatamente n pontos no b2
.
am1 +
x1
a21
vetor b. 1
0
+ −
a22 r2 a12
A solução do problema (2) pode ser determinada 1
0 ..
.
+
+
sgn(r2) 10
0 1
+ R
a2n a22
através de um sistema gradiente, dado pela seguinte 1
0
..
..
. ..
.
1
0 ..
.
+
+
µ2 1
0
x2
. bm am2
1
0
equação diferencial am1
..
. ..
− .
+ rm a1n
am2
T .. + sgn(rm) 1
0
ḟ = −M∇E(f ) = −MA sgn(Af − b), (3) .
amn +
a2n
+
µm
R
1
0
.. + xn
. +
amn
em que M = diag(µ1 , . . . , µn ) é uma diagonal po-
sitiva e cada componente do vetor sgn é dado em (4).
Note que o segundo membro de (3) é o gradiente gene- Fig. 1: Diagrama funcional da rede neural descrita pelo sis-
ralizado da função não-diferenciável E, dada em (2). tema gradiente (3)
= −1, se a < 0
correspondente. Redes de Hopfield modificadas que
sgn(a) ∈ [−1, 1], se a = 0 (4) operam em paralelo são analisadas em (Figueiredo e
Leitao, 1994). Algoritmos para restauração de ima-
= 1, se a > 0
gens em tempo real são apresentados em (Perry e
O sistema gradiente (3) pode ser interpretado Guan, 1996).
como uma rede neural com funções de ativação des-
contínuas (Forti et al., 2006), cujo diagrama funcional 2 Modelo matemático de formação da imagem
é mostrado na Fig. 1. As principais vantagens deste degradada
modelo é a convergência em tempo finito para uma
solução do sistema de equações lineares (1) se a ma- Uma imagem é formada pela propagação de energia
triz A tiver posto completo por linhas, bem como a luminosa a partir de um objeto, que passa por um sis-
possibilidade de paralelização e implementação em tema de formação ou aquisição de imagens, como as
computadores paralelos (Ferreira et al., 2005; Bhaya lentes de uma câmera ou o próprio olho humano, cons-
e Kaszkurewicz, 2006). truindo assim uma imagem do objeto original.
As propriedades de convergência do sistema gra- Uma imagem digital é armazenada sob a forma de
diente (3) são analisadas em (Ferreira et al., 2005), uma matriz, cujos elementos correspondem às intensi-
onde a convergência em tempo finito para uma dades dos tons de cinza nas posições correspondentes.
solução em norma L1 da equação (1), quando m ≤ As intensidades de tons de cinza são quantidades in-
n, é provada. Quando o sistema é sobredetermi- teiras, que variam de zero (mais escuro) a 255 (tom
nado, através de argumentos similares aos usados mais claro).
em (Ferreira et al., 2005), pode-se também provar a Sejam g(x, y) e fˆ(x, y) matrizes M × N em
convergência das trajetórias do sistema (3) para uma que estão armazenadas a imagem degradada e a ima-
solução em norma L1 do sistema (1). gem original, respectivamente. Usando a organização
lexicográfica das imagens, que consiste em empilhar
Observação 1 Como o segundo membro do sistema as linhas das matrizes g(x, y) e fˆ(x, y) em vetores-
gradiente (3) é descontínuo no conjunto {f : Af = coluna g e f̂ , respectivamente, a formação da imagem
b}, as soluções existem no sentido de Filippov degradada pode ser descrita matematicamente como
(Filippov, 1988). segue:
g = Hf̂ + n, (5)
A restauração de imagens utilizando redes neu-
rais tem sido alvo de muitas pesquisas. A idéia é tirar sendo que g ∈ RM N , f̂ ∈ RM N , n ∈ RM N é
vantagem da possibilidade de paralelização das redes o vetor de ruído e H ∈ RM N ×M N é a matriz de
neurais, bem como da possibilidade de implementação degradação, que em geral corresponde a um filtro
física, utilizando hardware de baixo custo, para pro- passa-baixa (Perry et al., 2002). A matriz H é formada
cessamento em tempo real. por um arranjo dos elementos da PSF, de tal maneira
A maioria das abordagens utilizam modificações que o produto Hf̂ executa a convolução discreta entre
da rede de Hopfield (Paik e Katsaggelos, 1992; Zhou a PSF e a imagem original fˆ(x, y).
et al., 1988; Sun, 2000a; Sun, 2000b), que determinam O efeito da aplicação uma determinada PSF em
uma solução de mínimos quadrados para o sistema de uma imagem varia com o tipo e com a dimensão da
equações lineares que descreve o problema de restau- PSF. Quanto ao tipo, a PSF é selecionada de modo
ração. O método dos gradientes conjugados também é a produzir alguma forma de degradação como, por
usado em aplicações de restauração de imagens (Chan exemplo, embaçamento da imagem original. A PSF é
e Ng, 1996; Chan et al., 1993), também determinando aplicada em cada ponto da imagem, e atua nos pontos
uma solução de mínimos quadrados do sistema linear vizinhos ao ponto central de aplicação, provocando o
efeito de embaçamento. Quanto maior a dimensão da A escolha do parâmetro de regularização λ é im-
PSF, mais visível é a distorção produzida, pois uma portante. Se λ é pequeno, o ruído na imagem restau-
PSF de dimensão maior atua em um número maior de rada é suavizado, porém, a imagem perde nitidez. Por
pontos em torno do ponto em que é aplicada. outro lado, se λ é grande, a imagem restaurada é mais
Considerando uma PSF quadrada, com dimensão nítida, porém o ruído não é suprimido adequadamente.
P × P , em que P << min(M, N ), para distorções Diversas técnicas estão disponíveis na literatura para
lineares e invariantes no espaço, a matriz H assume a ajustar o parâmetro λ; ver por exemplo (Galatsanos e
forma de uma matriz Toeplitz por blocos (Perry et al., Katsaggelos, 1992; Kang e Katsaggelos, 1995).
2002). Ao invés de usar a regularização de Tikhonov, que
Como as imagens são formadas por energia lu- usa norma L2 , optamos por uma abordagem alterna-
minosa, sua representação matemática deve satisfazer tiva de regularização utilizando norma L1 . Sabe-se
às seguintes restrições de não-negatividade (Andrews que as soluções em norma L1 são mais indicadas que
e Hunt, 1977): f̂ ≥ 0, g ≥ 0 e hij ≥ 0, onde hi,j as soluções de mínimos quadrados (norma L2 ) de um
são os componentes da matriz de degradação H. En- sistema de equações lineares em aplicações de proces-
tretanto, de acordo com Fu et al. (2006) a restrição de samento de sinais (Cichocki e Unbehauen, 1993). As
sinal no vetor f̂ é freqüentemente omitida em métodos vantages são maiores quando os dados do problema
de restauração. estão contaminados por um pequeno número de out-
liers (Rosen et al., 2000), pois as soluções de norma
3 Restauração através de regularização: a L1 são menos sensíveis a outliers que as soluções de
medida de degradação mínimos quadrados (Cichocki e Unbehauen, 1993).
Além disso, a solução de norma L1 também é mais in-
Uma das dificuldades em restaurar imagens dicada quando a distribuição do ruído não é Gaussiana
degradadas é o mal-condicionamento da matriz (Fu et al., 2006) e quando é desconhecida (Cichocki e
H (Andrews e Hunt, 1977). Neste contexto, a regu- Unbehauen, 1992).
larização de Tikhonov (Tikhonov e Arsenin, 1977) Neste contexto, a medida de degradação consiste
é usualmente usada para reduzir os efeitos do mal- da norma L1 do erro somada a um termo de regu-
condicionamento de H e restaurar uma imagem larização, também em norma L1 . Portanto, o pro-
degradada equivale a resolver o seguinte problema de blema de restauração de imagens é formulado através
minimização: do seguinte problema de minimização:
1 minimizar E(f ) = kg − Hf k1 + λkDf k1 , (10)
minimizar F (f ) = (kg − Hf k22 + λkDf k22 ), (6)
2
onde λ > 0 é um parâmetro de regularização. Há um
sendo que f é uma estimativa da imagem original f̂ ,
interesse crescente no uso da norma L1 para resolver o
λ > 0 é um parâmetro de regularização constante e
problema de restauração de imagens (Nikolova, 2004;
D é um operador de suavização, que em geral corres-
Kärkkäinen et al., 2005; Fu et al., 2006) e a regula-
ponde a um filtro passa-alta. Observe que, de acordo
rização em norma L1 aplicada à restauração de ima-
com a equação (5), o termo kg − Hf k22 é o quadrado
gens utilizada neste artigo também é discutida em (Fu
da norma Euclideana do vetor de ruído n.
et al., 2006).
O problema (6) pode ser reescrito na seguinte
A função objetivo E(f ) do problema (10) pode
forma (Paik e Katsaggelos, 1992):
ser escrita como segue:
1 T
minimizar F (f ) = (f Bf − cT f ), (7)
‚„ « „ « ‚
‚ g H
2
‚
E(f ) = ‚
‚ − f ‚ = kb − Af k1 . (11)
0 −λD ‚1
T T T
em que B := H H + λD D e c := H g. Como
∇F (f ) = Bf −c, o mínimo de F , dada em (7), ocorre
Isto significa que minimizar a função E(f ) em
quando f é solução do seguinte sistema de equações
(10) equivale a determinar uma solução de norma L1
lineares
de um sistema sobredeterminado de equações lineares.
Bf = c, (8)
Devido à robustez da solução em norma L1 ao
onde a matriz de coeficientes B e o vetor c são da- ruído, as vantagens da regularização dada em (10)
dos acima. O vetor f , que é uma solução de mínimos no problema de restauração de imagens são maiores
quadrados do problema (7), é a imagem restaurada, quando as imagens são corrompidas por ruído.
que é uma estimativa da imagem original, no sentido A função-custo não-diferenciável E pode ser
de mínimos quadrados. minimizada pelo sistema gradiente (3). Como o sis-
Note que a função objetivo F do problema de tema de equações lineares Af = b associado a (11) é
otimização (6) também pode ser escrita na forma: sobredeterminado, a convergência em tempo finito das
1‚
‚„ « „ « ‚2 trajetórias do sistema gradiente (3) para uma solução
‚ g − H 2
‚
F (f ) = ‚ = kb − Af k2 ,
f‚ (9) de (11) não pode ser garantida. Porém, a convergên-
2 ‚ 0 −λD 2
cia assintótica sempre pode ser assegurada no caso de
onde A ∈ R2M N ×M N e b ∈ R2M N ×1 . sistemas sobredeterminados.
O problema de determinar uma solução em norma em que αk > 0 é o tamanho do passo.
L1 para um sistema sobredeterminado de equações li- O passo αk é calculado iterativamente, usando a
neares é analisado por Rosen et al. (2000). Sob a seguinte fórmula de Barzilai-Borwein (Barzilai e Bor-
hipótese de que existe uma solução correta fc , no sen- wein, 1988):
tido que Ac fc = bc , em que Ac e bc são a matriz de
coeficientes e os dados do problema sem erros, respec- (fk − fk−1 )T (∇E(fk ) − ∇E(fk−1 ))
αk = (14)
tivamente, é mostrado que a única solução ótima f ∗ de k∇E(fk ) − ∇E(fk−1 )k22
(10) satisfaz f ∗ = fc , desde que o número de linhas
que contém erros da matriz aumentada [A b] satisfaça 4.3 Medida de qualidade das imagens restauradas
um limite superior, dado em função da matriz A e suas
dimensões. Ainda que este limite não seja satisfeito, A qualidade das imagens restauradas é medida quan-
sabe-se que uma solução em norma L1 de um sis- titativamente, em decibéis, através da relação sinal-
tema sobredeterminado sempre existe (Cichocki e Un- ruído (RSR) e da variação na relação sinal-ruído
behauen, 1993), ou seja, existe um vetor f ∗ que mini- (∆RSR). Estes índices são largamente utilizados na
miza a norma L1 do vetor de resíduos r := b − Af . literatura (Paik e Katsaggelos, 1992; Sun, 2000a; Sun,
2000b). A RSR é dada por
4 Implementação numérica RSR = 10 × log10 (kf̂ k22 /kf̂ − f k22 ).
O problema de restauração de imagens degradadas por Cichocki, A. e Unbehauen, R. (1992). Neural networks for solving systems of
linear equations – Part II: Minimax and least absolute value problems,
distorções lineares e invariantes no espaço é resolvido IEEE Trans. Circuits Syst. II 39(9): 619–633.
usando uma regularização em norma L1 que consiste Cichocki, A. e Unbehauen, R. (1993). Neural Networks for Optimization and
da norma L1 do erro somado a um termo de regulari- Signal Processing, John Wiley and Sons, New York.
zação, também em norma L1 . O problema de minimi- Ferreira, L. V., Kaszkurewicz, E. e Bhaya, A. (2005). Solving systems
zação decorrente é não-diferenciável e é resolvido por of linear equations using gradient systems with discontinuous right-
um sistema gradiente não-suave, que pode ser inter- hand sides: application to LS-SVM, IEEE Trans. Neural Networks
16(2): 501–505.
pretado como uma rede neural com função de ativação
descontínua. Figueiredo, M. A. T. e Leitao, J. M. N. (1994). Sequential and parallel im-
age restoration: neural network implementations, IEEE Trans. Image
Mostra-se através de um exemplo que a abor- Processing 3(6): 789–801.
dagem proposta é bastante efetiva. Quando com- Filippov, A. F. (1988). Differential Equations with Discontinuous Righthand
parado com as soluções de mínimos quadrados, obti- Sides, Kluwer Academic Publishers, Dordrecht.
das pelo método dos gradientes conjugados pré- Forti, M., Grazzini, M., Nistri, P. e Pancioni, L. (2006). Generalized approach
condicionado (PCG), as restaurações obtidas usando for convergence of neural networks with discontinuous or non-lipschitz
activations, Phisica D 214(1): 88–99.
a abordagem proposta apresentam melhor qualidade,
no sentido de atingir valores mais elevados da ∆RSR. Fu, H., Ng, M. K., Nikolova, M. e Barlow, J. L. (2006). Efficient minimization
methods of mixed l2 − l1 and l1 − l1 norms for image restoration,
Além disso, as soluções são obtidas em um número SIAM Journal on Scientific Computing 27(6): 1881–1902.
de iterações menor que as obtidas pelo PCG , ape-
Galatsanos, N. P. e Katsaggelos, A. K. (1992). Methods for choosing the regu-
sar de nenhuma técnica de pré-condicionamento ser larization parameter and estimating the noise variance in image restora-
usada com o sistema gradiente. Este fato sugere que tion and their relation, IEEE Trans. Image Processing 1(3): 322–336.
a abordagem usando a regularização em norma L1 Gonzalez, R. C. e Woods, R. E. (2002). Digital Image Processing, 2nd edn,
e o sistema gradiente (3) é menos sensível ao mal- Prentice-Hall„ Upper Saddle River.
condicionamento do problema. Comparamos também Kang, M. G. e Katsaggelos, A. K. (1995). General choice of the regular-
os resultados obtidos pela abordagem proposta com ization functional in regularized image restoration, IEEE Trans. Image
Processing 4(5): 594–602.
um algoritmo baseado na rede de Hopfield, que mini-
miza uma função-custo em norma L2 , observamos que Kärkkäinen, T., Kunisch, K. e Majava, K. (2005). Denoising of smooth im-
ages using L1 -fitting, Computing 74: 353–376.
as imagens obtidas pela abordagem proposta também
apresentam melhor qualidade. Nikolova, M. (2004). A variational approach to remove outliers and impulse
noise, Journal of Mathematical Imaging and Vision 20: 99–120.
Finalmente, outras vantagens são a capacidade de
implementação do sistema gradiente utilizando hard- Paik, J. K. e Katsaggelos, A. K. (1992). Image restoration using a modified
Hopfield network, IEEE Trans. Image Processing 1(1): 49–63.
ware de baixo custo para processamento em tempo
real, bem como a possibilidade de paralelização e im- Perry, S. W. e Guan, L. (1996). A partitioned modified Hopfield neural
network algorithm for real-time image restoration, Real-Time Imaging
plementação em computadores paralelos. O desen- 2: 215–224.
volvimento de uma implementação paralela eficiente
Perry, S. W., Wong, H.-S. e Guan, L. (2002). Adaptive Image Processing: A
do sistema gradiente (3) é objeto de pesquisas dos au- Computational Intelligence Perspective, Spie Press, Bellingham.
tores.
Rosen, J. B., Park, H., Glick, J. e Zhang, L. (2000). Accurate solution to
overdetermined linear equations with errors using L1 norm minimiza-
tion, Computational Optimization and Applications 17: 329–341.
7 Agradecimentos
Sun, Y. (2000a). Hopfield neural network based algorithms for image restora-
tion and reconstruction – part I: algorithms and simulations, IEEE
Os autores agradecem ao Conselho Nacional de Trans. Signal Processing 48(7): 2105–2118.
Pesquisa e Desenvolvimento Tecnológico (CNPq), Sun, Y. (2000b). Hopfield neural network based algorithms for image restora-
que financiou esta pesquisa através do projeto tion and reconstruction – part II: performance analysis, IEEE Trans.
Signal Processing 48(7): 2119–2131.
154447/2006-4 e à Coordenação de Aperfeiçoamento
de Pessoal de Nível Superior (CAPES). Tikhonov, A. N. e Arsenin, V. Y. (1977). Solutions of Ill-Posed Problems, V.
H. Winston & Sons, Washington.
Referências Utkin, V. I., Guldner, J. e Shi, J. (1999). Sliding mode control in electrome-
chanical systems, CRC Press, Boca Ratton.
Andrews, H. C. e Hunt, B. R. (1977). Digital Image Restoration, Prentice-
Hall, Englewood Cliff. Zhou, Y.-T., Chellappa, R., Vaid, A. e Jenkins, B. K. (1988). Image restora-
tion using a neural network, IEEE Trans. Acoustic, Speech, and Signal
Barzilai, J. e Borwein, J. M. (1988). Two-point step size gradient methods, Processing 36(7): 1141–1151.
IMA Journal of Numerical Analysis 8: 141–148.