Escolar Documentos
Profissional Documentos
Cultura Documentos
ABSTRACT: This paper describes and discusses the theoretical fundamentals and the computational and
algorithmic aspects of the Canny edge detection process. It is based on two basic performance criteria,
i.e., the detection and localization criteria. Both criteria must be still under a third one, which is known as
the multiple response constraint and enforces the edge detection process to detect single edge where there
is only one true edge. The major goal of Canny work is the development of an optimal detector for the
most common edge occurrence in digital images, i.e., the step edges. One of most important finding of
Canny is that the optimal operator found is very similar to the first derivative of the gaussian function. In
complement to this operator, it is proposed two processes that are known as the nonmaximum suppression
and the hysteresis. The goal of the nonmaximum suppression is the edge thinning, which allows the
detected edges to be one-pixel width. The hysteresis is based on a double thresholding and its goal is to
eliminate edge fragmentation due to the image noisy. This paper also presents, in addition to the
theoretical and computational aspects above mentioned, some experimental results obtained with
synthetic and real images.
x
Lembrando que a Srie de Taylor dada por:
Figura 2 - Ilustrao da borda G(x) como mximo local
na sada do operador (H G (x))
h h2 hn n
f(x) = f(x 0 ) + f '(x 0 ) + f '' (x 0 )+ ...+ f ( x 0 )+..
Sero abordadas inicialmente as questes relativas 1! 2! n!
razo sinal/rudo e localizao.
Seja f(x) a resposta de impulso do filtro e G(x) a
borda. Assumi-se que a borda est centrada em x = 0. onde h = x - x 0 , com x .
Ento, a resposta de impulso do filtro para esta borda, em Logo, a expanso de Taylor de H' G (x 0 ), em
relao ao seu centro, dada pela convoluo: relao origem (Mac-Laurin), dada por:
W
H' G (x 0 ) = H' G (0) + x 0 H'' G (0) + O(x 02 )
HG = W
G ( x )f ( x ) dx (1) (5)
Notar que:
assumindo que o filtro tem resposta de impulso finito no
intervalo [-W , W] com W < , ou seja, o suporte do
filtro (conjunto de pontos do domnio onde a funo no H' G (x 0 ) = H' G (0) + (x 0 - 0)/ 1! H'' G (0) + O(x 02 ) (6)
se anula) compacto (Limitado e Fechado) (Gomes,
1994). O erro mdio quadrtico da resposta para o rudo
n(x) somente, ser: Como H' G (0) = 0 o primeiro termo da expanso
(eq. 5) ignorado. Alm disso, como x 0 pequeno,
1 ignora-se os termos quadrtico e de ordem superior.
{
H n = E[n ( x ) * f ( x )]2 }1
2
= n0
W
W
2
f ( x ) dx
2
(2) Assim, das equaes 4 e 5, tem-se:
SNR =
W
G ( x )f ( x ) dx
(3)
E, substituindo a equao acima na equao 4:
W
n0 W
f 2 ( x ) dx
H' n (x 0 ) + H'' G (0) x 0 0
Na equao 3, acima, pode-se perceber que se o H' n (x 0 ) uma quantidade randmica Gaussiana e
denominador, que o erro mdio quadrtico da resposta
segundo Canny (1986) sua varincia dada por:
para o rudo somente, tender zero, SNR aumentar, isto
, se o rudo na imagem for prximo de zero a deteco
ser tanto melhor. Dessa forma percebe-se que a forma W
matemtica sintetiza bem a noo intuitiva. E[H'n (x 0 )] = n 02
W
f '2 ( x ) dx (8)
Como as bordas esto centradas em x = 0, na
ausncia do rudo deveria haver neste ponto um mximo
local, para a resposta. Sendo esta representada por onde E[y] o valor esperado de y (esperana de y).
H G (x), ento H' G (0) = 0. Se H n (x) a resposta do filtro Combinando este resultado com a equao 7 (substituindo
H' G (x 0 ) por x 0 H'' G (0)), tem-se:
para o rudo somente, ento a resposta total pode ser
G. Vale; A.. Dal Poz
Anais do Simpsio Brasileiro de Geomtica, Presidente Prudente - SP, 9-13 de julho de 2002.
Pela desigualdade de Schwarz, acima descrita, para
W
integrais, mostra-se que SNR limitado superiormente
E[ x 02 ]
n 02 W
f '2 ( x ) dx
= x 02 (9)
por:
2
W
G ' ( x ) f ' ( x ) dx W
W n 01 W
G 2 ( x ) dx (12)
Localizao =
W
G ' ( x ) f ' ( x ) dx
(10) Se ambos os limites so atendidos, ento o produto
W
n0 2
f ' ( x ) dx de SNR pela localizao maximizado quando
W f(x) = G(-x) para x [-W, W].
Assim, de acordo com os dois primeiros critrios,
o detetor timo de bordas tipo degrau deve possuir
As equaes 3 e 10 so as frmulas matemticas tambm a forma de um degrau, como o operador
para o primeiro e o segundo critrios e reduzem o diferena. Como este operador possui uma banda muito
problema de projeto do filtro maximizao de ambas as larga, sua aplicao, gera, devido ao rudo, respostas com
frmulas, simultaneamente. A fim de que isso ocorra, muitos mximos, gerando muitos mximos falsos de
maximiza-se o produto da primeira equao pela segunda. borda. Como foi visto anteriormente a filtragem com
Por enquanto ser usado o produto dos critrios para operadores diferena apresenta inmeros picos
bordas arbitrrias, isto , se buscar maximizar: (serrilhado), nas adjacncias da borda verdadeira,
dificultando ou impossibilitando a seleo de um nico
W W ponto de borda. necessrio adicionar aos critrios um
W
G ( x )f ( x ) dx W
G ' ( x ) f ' ( x ) dx quesito que diga que a funo f no ter muitas respostas
para uma nica borda na vizinhana do degrau. antes
(11)
W W
n0 2
f ( x ) dx n0 2
f ' ( x ) dx necessrio limitar o nmero de picos na resposta, de modo
W W que haja baixa probabilidade de serem detectadas mais
que uma borda. O ideal seria fazer a distncia entre os
picos na resposta do rudo se aproximar largura da
Esta equao deve possuir uma injuno adicional resposta do operador para um nico degrau de borda. Esta
na soluo, pois, at aqui, nenhuma definio sobre a largura seria uma frao da largura do operador.
eliminao de respostas mltiplas foi descrita A distncia entre mximos adjacentes na resposta
matematicamente. Tal problema ser explicitado na
de f devido ao rudo, denotado por x max , ser o dobro de
prxima seo.
x zc , que a distncia mdia entre pontos crticos desta
2.2 Eliminao de Respostas Mltiplas resposta, ou seja:
x max (f ) = kW (16)
G. Vale; A.. Dal Poz
Anais do Simpsio Brasileiro de Geomtica, Presidente Prudente - SP, 9-13 de julho de 2002.
A expresso 15 representa a injuno de resposta Como A uma constante positiva, pode-se retir-la
mltipla. Note que o nmero timo de k seria o que da integral e do mdulo e, como tambm u 1 (x) nulo
proporcionasse apenas um mximo para a regio de
para x<0, a equao pode ser rescrita como:
resposta do filtro. Sendo 2W a largura da regio onde se
concentra o suporte do filtro, o nmero de mximos (N n )
0
da resposta devido ao rudo dado por:
SNR =
A W
f ( x ) dx
(20)
+W
Nn =
2W 2W 2
= =
x max kW k
(17)
n0 W
f 2 ( x ) dx
3 UM DETETOR PARA BORDAS (STEP EDGES) onde h(x) uma funo contnua qualquer.
Uma borda tipo degrau pode ser expressa Quando se toma h (x) = f '(x), chega-se ao
matematicamente por G(x) = A u 1 (x), onde A a numerador da equao 22.
amplitude da borda e u 1 (x) dada por: Ambos os critrios melhoram diretamente com a
razo A/n 0 , que pode ser chamada razo sinal/rudo da
imagem. Agora, remove-se esta dependncia da imagem e
0, para x < 0 define-se duas medidas de desempenho e , as quais
u 1 ( x ) = (18)
1, para x 0 dependem somente do filtro:
0
E substituindo G(x) na equao 3:
A f ( x ) dx
(f ) (f ) =
W
SNR = onde (24)
n0 +W
W
f 2 ( x ) dx
SNR =
W
Au 1 ( x )f ( x ) dx
(19)
W
W
n0 W
f 2 ( x ) dx
A primeira destas equaes mostra que um filtro f (0) = 0 f (-W) = 0 f ' (0) = s f ' (-W) = 0 (29)
f com larga resposta de impulso ter melhor razo onde s um incgnita constante igual declividade da
sinal/rudo que um filtro estreito quando aplicado funo f na origem. Visto que f (x) assimtrica, pode-se
imagem. Matematicamente, se variar imediato que estender a equao 28 para todo o intervalo de suporte
(f ) variar diretamente. A segunda implica que um [-W, W] usando o fato de que f (-x) = -f (x). As quatro
condies de contorno possibilitam encontrar as
filtro estreito dar melhor localizao que um largo. quantidades de a 1 , a 2 , a 3 e a 4 em funo das incgnitas
Matematicamente, se variar, ento (f ' ) ter uma , , c e s . Aplicando as condies de contorno 29
variao inversamente proporcional a . Nota-se que as equao 28, obtm-se um sistema de equaes para a
variaes so inversamente relacionadas, isto , ambos os obteno dos valores de a 1 , a 2 , a 3 e a 4 em funo das
critrios ou crescem ou decrescem por . Trata-se incgnitas , , c e s .
ento de um princpio de incerteza relacionado com a Como c uma constante de integrao gerada na
deteco (SNR) e localizao, no podendo melhor-los obteno da equao 28, pode-se arbitr-la, ficando os
simultaneamente, ou seja, se a localizao melhora, ento parmetros incgnitos reduzidos a 3 ( , e =s/c).
a deteco tem seu resultado piorado e vice-versa.
interessante notar que esse resultado terico est Infelizmente isso no reduz a complexidade do problema,
relacionado com questes prticas de projetos de filtros de pois ainda necessrio determinar os valores destes
deteco de borda. Por exemplo, quando se usa uma parmetros que maximizam a condio de filtro timo
mscara de dimenso pequena, a sensibilidade aos (eq. 27). Se no bastasse, falta impor o critrio de resposta
detalhes ser maior. Infelizmente esta sensibilidade no mltipla. Como uma soluo analtica para este problema
aumenta apenas pelos detalhes reais da imagem, mas invivel, um processo de otimizao numrica
tambm pelos detalhes esprios da imagem, causados recomendado.
principalmente pelo rudo da imagem. Com um filtro A forma do filtro f depende, ento, da injuno de
largo ganha-se na deteco de detalhes mas perde-se em respostas mltiplas, isto , depende da distncias entre as
localizao. A discusso acima sugere que o critrio para respostas adjacentes (x max ). Em geral, o ideal que as
determinao do filtro (f) timo dado pelo produto das respostas adjacentes estejam o mais distantes possvel,
equaes (24) e (25), visto que este produto invariante facilitando a separao do pico verdadeiro dos falsos.
s mudanas de escala: Segundo Canny (1986), quanto menor o espaamento
entre as respostas adjacentes, mais ngreme a funo f
na origem. Assim, um filtro muito ngreme, em relao
0
W
f ( x ) dx
f ' (0)
origem, beneficia o critrio de localizao, mas no
favorvel aos outros critrios. Por outro lado, um filtro
(f ) . (f ' ) = . (27)
+W +W menos ngreme, em relao origem, desfavorvel ao
2 2
f ( x ) dx f ' ( x ) dx
W W
4) 1 0
5)
f ' (0) =
s
f ( x ) dx =1
(33)
6) + + 3
f 2 ( x ) dx =
2
f '2 ( x ) =
43
7)
Fonte: Canny, 1986 O ndice de desempenho total (eq. 27) para este
Figura 3 - O operador timo para vrios valores de x max . operador :
De cima para baixo, se tem os seguintes valores de x max :
0,15, 0,3, 0,5, 0,8, 1, 1,2, e 1,4. (f ) . (f ' ) = 0,92 (34)
G. Vale; A.. Dal Poz
Anais do Simpsio Brasileiro de Geomtica, Presidente Prudente - SP, 9-13 de julho de 2002.
Enquanto o valor r calculado a partir da equao onde B a imagem ruidosa, A a imagem sem rudo e N
(30) : o rudo, lembrando que A e N no so correlacionados.
Comumente, por uma questo prtica, assume-se que este
f ' (0) tipo de rudo segue a distribuio normal (rudo
= r r = 0,51 (35)
s Gaussiano), com mdia zero e um presumido desvio-
padro.
Quando se toma imagens com os parmetros de
O desempenho da primeira derivada da funo rudo conhecidos ( e ), o que se verifica que este
Gaussiana 20% pior que o desempenho do operador rudo possui uma distribuio homognea sobre a
timo. Quanto ao fator r, verifica-se que pior 10%. imagem. Dessa forma pode-se ento, tratar o problema de
Provavelmente, seria difcil detectar uma diferena desta estimao do rudo atravs da idia de que bordas tambm
magnitude visualmente, verificando-se o desempenho dos fazem parte do rudo (Wiener-Hopf, apud Parker, 1997).
dois operadores em imagens reais, e, por causa da A imagem seria filtrada e a varincia do rudo seria
primeira derivada do operador Gaussiano poder ser estimada a partir de uma mdia local calculada em uma
computada com muito menos esforo em duas dimenses, rea restrita da imagem filtrada. Contudo, esta forma de
dada tambm a sua simplicidade e separabilidade, ela tem estimao de parmetros do rudo sensvel s bordas e
sido, na prtica, usada com exclusividade. os parmetros estimados sero tendenciosos, tornando-se
A resposta de impulso dos dois operadores podem pouco teis.
ser comparadas, visualmente, na figura 5. Notar que as Uma soluo para este problema consiste em se
respostas de impulso de ambos os filtros so bastante construir um histograma global da imagem filtrada
semelhantes, o que intuitivamente sugere um desempenho (amplitude/freqncia) e analis-lo, considerando que a
semelhante. resposta para as bordas so baixas freqncias com
a) f(x) valores altos de amplitude e que o rudo representar o
x restante das respostas. Assim, pode-se efetuar a mdia
G(x) com valores de amplitude da imagem de entrada que, no
b) x histograma, apresentem amplitudes menores que 80%, por
exemplo.
No caso de rudo dependente do sinal o nvel de
rudo para cada ponto na imagem uma funo de seu
Figura 5 - a) Detetor timo de Bordas; b) Primeira nvel de cinza (Parker, 1997). Isto , o rudo esta
derivada da funo Gaussiana relacionado ao nvel de cinza dos pixels da imagem
atravs de alguma funo. Felizmente esta forma de rudo
5 ESTIMAO DO RUDO E LIMIARIZAO menos importante e pode ser melhor contornado
(Parker, 1997).
A afirmao "no h imagem sem rudo", At mesmo com a estimao do rudo, o detetor de
infelizmente verdadeira. Independente da causa ou do borda suscetvel fragmentao, principalmente se um
tipo de rudo, a verdade que ele sempre est presente e, nico limiar for usado. A fragmentao a separao de
por ser um evento randmico, no pode ser predito ou um contorno de borda causado pela flutuao da sada do
medido acuradamente em uma imagem, visto que, no se operador acima e abaixo do limiar, ao longo do contorno
pode separar rudo de dados da imagem. Dada a natureza
(Canny, 1986). Caso se tenha um nico limiar T1 e,
randmica do rudo, o que se pode fazer, algumas vezes,
caracterizar seu efeito na imagem atravs de uma supondo que se tenha uma borda que possua uma mdia
distribuio de probabilidade com mdia e desvio-padro de tons de cinza de mesmo valor ( T1 ), havero valores da
especficos. borda acima e abaixo do limar at mesmo quando o rudo
Existem dois tipos de rudo que podem ser tratados insignificante. O resultado da limiarizao sero
dessa forma: rudo independente do sinal e rudo fragmentos de bordas.
dependente do sinal. tambm muito difcil fixar um limiar tal que haja
O rudo independente do sinal randmico e uma pequena probabilidade de se detectar borda espria
estatisticamente independente do dados da imagem, isto , quando o detetor possui grande sensibilidade. Uma
adicionado aos pixels da imagem resultando uma soluo possvel para este problema efetuar a mdia da
imagem ruidosa (Parker, 1997). Freqentemente, isto magnitude ao longo de parte do contorno da borda. Se a
ocorre quando uma imagem eletronicamente transmitida mdia est acima de um limiar, o segmento inteiro
de um local a outro ou at mesmo quando de sua detectado. Se a mdia est abaixo do limiar, no se
aquisio (sensor). Pode-se expressar esta idia atravs da detecta nenhuma parte do contorno.
adio: Na implementao do operador de Canny a
limiarizao efetuada com histerese (duplo limiar) e
acompanhada de um processo de "complementao das
B=A+N
bordas", isto , se qualquer parte de um contorno est
acima do maior limar T 1 , ento estes pontos so
imediatamente detectados, formando um conjunto L1. O
G. Vale; A.. Dal Poz
Anais do Simpsio Brasileiro de Geomtica, Presidente Prudente - SP, 9-13 de julho de 2002.
restante dos pontos que se encontram abaixo do maior
limiar T 1 e acima do menor limiar T 2 (pontos do Q[i, j] 1/2 x * S[i, j]
contorno e pontos no pertencentes a ele) formam um
segundo grupo de pixels L2. O procedimento algortmico ou
consiste em buscar no conjunto de pontos detectados L1 a
ocorrncia de extremidades de contornos e, no segundo Q[i, j] (S[i, j] - S[i+1, j] +S[i, j+1] - S[i+1, j+1])/2
conjunto de pontos L2, escolher pixels que completem
estes contornos. O algoritmo efetua este preenchimento (39)
at que no hajam mais fragmentos de contornos isolados
em L1 ou que no hajam mais pontos em L2 que possam
ser aproveitados. onde * denota a convoluo.
A probabilidade de fragmentao muito reduzida
pois, para um contorno ser fragmentado, ele precisa As diferenas finitas tem sua mdia efetuada
flutuar sobre o maior limiar e abaixo do menor limiar. atravs das mscaras 2x2, mostradas acima, tal que, as
Tambm a probabilidade de falsos pontos de borda derivadas parciais so computadas em pontos de mesmas
isolados reduzida pois a magnitude de tais pontos coordenadas. A magnitude e orientao do gradiente so
precisa estar acima do maior limiar. A razo do maior computadas por frmulas de converso de coordenadas
para o menor limiar na implementao est na faixa de retangulares para polar:
dois ou trs para um, isto :
AGRADECIMENTOS
REFERNCIAS