Você está na página 1de 12

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.

3 7
COMPARAO ENTRE OS MTODOS DE MXIMA
VEROSSIMILHANA, DISTNCIA MNIMA E O MTODO
DE FISHER PARA RECONHECIMENTO DE PADRES EM
IMAGENS COLORIDAS
Sonia Isoldi Marty Gama Mller
Instituto Tecnolgico da Aeronutica
Departamento de Organizao
So Jos dos Campos SP
E-mail: sonia@mec.ita.cta.br
Fone: (012) 340-5966

Quintino Dalmolin
Hideo Araki
Universidade Federal do Paran
Departamento de Geomtica
Centro Politcnico Jardim das Amricas
CEP 81531-990 Curitiba PR
E-mail: dalmolin@geoc.ufpr.br
Fone: (041) 361-3148

RESUMO
Uma das grandes preocupaes no processo de automao em
Fotogrametria est relacionado com os algoritmos de reconhecimento de
padres. Apesar da metodologia ter avanado significativamente nos
ltimos anos, principalmente no que se refere ao tom de cinza, o
reconhecimento de padres de cores reais em imagens coloridas ainda se
encontra em fase de desenvolvimento. Neste sentido objetiva-se realizar
uma srie de ensaios com dados (cores) controlados e tambm com dados
reais para comparar a performance dos mtodos estatsticos de Mxima
Verossimilhana, Distncia Mnima e de Fisher para reconhecimento das
cores reais. A comparao entre os mtodos estatsticos foi feita
controlando o processo de classificao, ou seja, utilizando amostras
determinsticas para treinamento das funes discriminantes e criando
imagens para classificao no software (MATLAB). Com intuito de que a
comparao pudesse ser feita sem controle da imagem a ser classificada e
das amostras, utilizou-se uma imagem retirada de uma foto digitalizada,
para verificar a performance dos mtodos frente a um caso real. A anlise

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
3 8
de desempenho dos mtodos foi observada pela estatstica kappa e a
comparao pelo teste Z apropriado. Os resultados indicam que o Mtodo
de Distncia Mnima foi o melhor para classificao de cores reais sob
todos os aspectos estudados.

ABSTRACT
One of the main issues in the photogrametry automation process is related
to pattern recognition algorithms. Although there were significant
advances in the last years, mainly in regard to the gray tones, color
pattern recognition in colored images is still in a developmental stage. In
this sense, a series of tests with controlled data (colors) and also with real
data is made to compare the performance of the statistical methods:
Maximum Likelihood, Minimum Distance, and Fishes method in their
ability to recognize real colors. The comparison among the statistical
methods was performed by controlling the classification process, that is,
using deterministic samples for the training of discriminant functions and
test images created by a software (MATLAB). For the case of real
images, the statistical methods were compared without controlling both
the sample and the image by the utilization of an image extracted from a
digitized picture. The methods performance was analyzed using the kappa
statistic and the Z test. The results indicated that the Minimum Distance
Method was the best method to classify real colors under all assumptions.

1. INTRODUO
Reconhecimento de padres em imagens tem sido objeto de muitos estudos
nos ltimos anos, principalmente no que se refere a imagens em tom de cinza e
falsa-cor. O estudo de reconhecimento de cores reais ainda se encontra em fase de
desenvolvimento, porm de muita importncia atualmente devido ao avano
tecnolgico das cmeras digitais de vdeo.
Mtodos estatsticos de reconhecimento de padres tm sido explorados
para classificao de imagens, principalmente em sensoriamento remoto, com
aplicaes na agricultura, reflorestamento, planejamento urbano, etc. Tambm,
outras aplicaes podem ser citadas na rea da medicina, arquitetura e robtica
(viso de mquina) (ARGIALAS & HARLOW, 1990; GREEN, 1989; SONKA,
HLAVAC & BOYLE, 1993; GROOVER, WEISS, NADEL & ODREY, 1989).
Dos mtodos estatsticos utilizados, observa-se que o de mxima
Verossimilhana o mais popular devido principalmente a sua performance, sendo
por esta razo, que muitas das novas tcnicas apresentadas so comparadas com este
mtodo (BOLSTAD 7 LILLESAND, 1990).
Introduziu-se neste trabalho o mtodo de Fisher, no sendo este aplicado
em reconhecimento de falsa-cor, por conceber que as varincias das amostras so

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
3 9
iguais. No caso de cores reais este mtodos no sofre nenhuma restrio no seu uso,
verificando-se ser uma boa alternativa para classificao de imagens.
O mtodo de Distncia Mnima (um caso particular do mtodo de Mxima
Verossimilhana) tambm foi analisado neste trabalho, pois considera que as
matrizes de covarincia de todas as classes (cores) so diagonais e iguais e as
varincias de cada componente da cor so idnticas ou relativamente prximas, que
pertinente no caso de cores reais.
Com intuito de procurar um mtodo estatstico que apresentasse uma boa
performance na classificao de cores reais em uma imagem, comparou-se os
mtodos de Mxima Verossimilhana, Distncia Mnima e de Fisher.

2. MTODOS

2.1. MTODO DE MXIMA VEROSSIMILHANA
Muito utilizado para classificao de dados multiespectrais de
sensoriamento remoto, o mtodo de Mxima Verossimilhana tem obtido bons
resultados na discriminao de falsa-cor.
Neste mtodo, sendo FOODY, MCCULLOCH & YATES (1995), concebe-
se que as classes ou populaes tenham distribuies normais multivariadas, como
mostra a figura 2.1 apresentada por LILLESAND & KIEFER (1994), onde foram
obtidas classes a partir de duas bandas espectrais (sensoriamento remoto) e plotados
os valores de probabilidades em um grfico tridimensional.
Figura 2.1: FUNO DENSIDADE DE PROBABILIDADE DEFINIDA
POR MXIMA VEROSSIMILHANA
Fonte: LILLESAND & KIEFER (1994)
O desenvolvimento do mtodo se baseia, segundo RICHARDS (1986), na
funo penalidade, que avalia as decises incorretas, chegando a seguinte regra de
deciso:


Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
4 0
( ) ( ) ( ) ( )
m ..., 2, 1, j i, i j
, x x S x x S ln - x x S x x S ln - se x
j 0
1
j j 0 j i 0
1
i i 0 i i
=

>

(2.1)
Ento, neste trabalho, as classes
i

i
designadas acima so as vrias cores
que se deseja discriminar e o vetor mdio das observaes
i
x (correspondente as
componentes RGB) so obtidos a partir das amostras das respectivas cores, e
consequentemente
i
S sero as matrizes de covarincia para cada tipo de amostra.
Assim, quando se tem um vetor multivariado x
0
, que corresponde a um pixel na
imagem, com o qual se deseja alocar em um das classes ou cores, utiliza-se a regra
acima.

2.2. MTODO DE DISTNCIA MNIMA
Este mtodo um caso particular do mtodo de Mxima Verossimilhana
descrito anteriormente, pois considera as matrizes de covarincia de todas as classes
como diagonais e iguais (RICHARDS, 1986).
Assim a classificao ficaria mais simplificada e pode se utilizar a seguinte
regra:
( ) ( ) ( ) ( ) m ..., 2, 1, j i, i j x x x - x x x x - x se x
j 0 j 0 i 0 i 0 i
=

<

(2.2)
ou
( ) ( ) m ..., 2, 1, j i, i j x , x d x , x d se x
2
j 0
2
i 0 i
= < (2.3)
A classificao de um novo pixel pelo mtodo de Distncia Mnima
obtido a partir da menor distncia entre o pixel a ser classificado (x
0
) e os valores
mdios obtidos das amostras treinadas (
3 2 , 1
x e x , x ) como mostra a figura 2.2 para
um caso bivariado.

Figura 2.2: REPRESENTAO BIDIMENSIONAL DO MTODO DE DISTNCIA MNIMA
2.3. MTODO DE FISHER

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
4 1
O mtodo de Fisher considera que as classes provm de uma mesma
populao qualquer, no necessariamente com distribuio normal. A idia principal
deste mtodo de transformar observaes multivariadas em univariadas, fazendo
uma combinao linear entre elas, com o intuito de reduzir a dimenso. Pode-se
observar na figura 2.3 a representao grfica do mtodo para o caso bivariado,
onde
1
x e
2
x so respectivamente as mdias das duas classes que se deseja
discriminar (
1
e
2
) e x l

y = a combinao linear obtida a partir de amostras


(JOHNSON & WICHERN, 1985)
Figura 2.3: REPRESENTAO DO PROCEDIMENTO DE FISHER PARA DUAS CLASSES
Fonte: JOHNSON & WICHERN (1985)

A regra de discriminao para vrias classes ou populaes definida por
JOHNSON & WICHERN (1985) como segue:
Seja 0

,...,

s 2 1
> os autovalores no nulos de
0
1
B

W

, onde
1
W

a
inversa da matriz soma de produtos cruzados dentro dos grupos amostrais e
0
B


a estimativa da matriz soma dos produtos cruzados entre os grupos, e seja os
correspondentes autovetores
s 2 1
e ..., , e , e .
Ento, o vetor de coeficientes l

que maximiza a razo


l

W l

dado por
1 1
e l

= e a combinao linear
0 1 0 1
x e x l

= chamada de 1

Discriminante Amostral;
2 2
e l

= produz o 2

Discriminante Amostral
0 2 0 2
x e x l

= . Generalizando tem-se que




Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
4 2
k k
e l

= produz o k-simo Discriminante Amostral


0 k 0 k
x e x l

= para s k , onde
o
x o vetor a ser alocado em uma das classes
i
.
Este resultado fornece subsdios para classificar o novo vetor na classe,
cuja combinao linear tenha menor distncia quadrtica da mdia das combinaes
lineares das classes observadas.
Assim pode-se alocar
o
x na populao
k
se:
( ) ( ) [ ] ( ) [ ] k i , x x l

x x l

y y
r
1 j
2
i 0 j
r
1 j
r
1 j
2
k 0 j
2
kj j
=

= = =
(2.4)
onde:

0 j j
x l

y = e (2.5)
s r com , x l

y
k j kj
= (2.6)
As populaes
k
mencionadas aqui se referem, no propsito deste
trabalho, as cores serem discriminadas. Assim,
o
x e
k
x representam
respectivamente o vetor que corresponderia ao pixel analisado e a mdia da amostra
tomada para determinar cada cor.
Desta feita, aloca-se um novo pixel classe (cor) que tenha a menor
distncia quadrtica entre as combinaes lineares do ponto com um valor mdio
obtido pelos dados treinados.

3. METODOLOGIA
Para comparar o mtodo de Fisher com os outros j citados foi necessrio
gerar imagens digitais coloridas controladas atravs do software Matlab com
Processamento de Imagem. Tambm parte de uma foto digitalizada foi amostrada e
classificada pelos mtodos, a fim de que se pudesse observar o desempenho dos
mesmos frente a uma imagem cujas variveis se apresentassem com caracter
aleatrio.
Utilizou-se a estatstica kappa de COHEN (1960) e o respectivo teste
estatstico (Z) para a comparao do desempenho dos mtodos.
. Foram escolhidas quinze cores para o reconhecimento. Seis
corresponderiam a variaes de tons de verde, escolhidas com o objetivo de simular
cores prximas umas das outras. E outras nove cores chamadas de diversas que
podem ser encontradas comumente na natureza, como azul, vermelho, amarelo,
cinico, magenta, cinza, etc.
Os experimentos foram aplicados em dois casos: no primeiro considerou-se
a dependncia entre as componentes da cor (RGB) e no segundo considerou-se a
independncia entre elas, fazendo com que os mtodos de Mxima Verossimilhana
e de Fisher sofressem uma modificao na matriz de covarincia. O mtodo de

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
4 3
Distncia Mnima no sofreu alteraes porque no utiliza as matrizes de
covarincia na discriminao.
Para cada caso foram feitos seis experimentos: no experimento 1 verificou-
se a sensibilidade dos mtodos frente as variaes das mdias das amostras; no
experimento 2 estudou-se a influncia das varincias das amostras na classificao;
no experimento 3 foi verificado se o nmero de cores discriminadas
simultaneamente afetava os resultados; no experimento 4 verificou-se o tempo
mdio de processamento comparativo entre os mtodos; no experimento 5 criou-se
uma imagem com as 15 cores propostas, onde os classificadores selecionaram
apenas 6 tonalidades de verde; e no experimento 6 aplicou-se a metodologia a uma
amostra de imagem digitalizada para verificar o desempenho dos mtodos frente a
um caso totalmente aleatrio.

4. RESULTADOS
No primeiro caso, onde se considerou a dependncia entre as componentes
da cor (RGB), observou-se que o percentual de erros de classificao apresentado
foi grande para o mtodo de Mxima Verossimilhana, pequeno para o mtodo de
Fisher e nulo para o mtodo de Distncia Mnima. Para cada experimento conduzido
neste caso obteve-se os seguintes resultados:
Experimento 1:
Neste experimento foram observados os percentuais de erro de classificao em
funo das variaes possveis de ocorrer com o vetor mdio das amostras
observadas, como vemos na tabela 4.1.
Designou-se por mdias prximas ou afastadas quando as amostras foram
tomadas de modo no aleatrio com valores prximos ou no da cor desejada,
porm sem perda da tonalidade. Mdias homogneas e heterogneas quando as
componentes sofriam variaes iguais ou no. Mdias iguais quando as amostras
foram selecionadas somente com valores prximos ou afastados e mdias diferentes
quando se incluiu nas amostras valores prximos e iguais.


MTODOS
MXIMA
VEROSSIMILHAN
A
DISTNCIA
MNIMA
FISHER
Mdia Prxima 92 0 13
Mdia Afastada 87 0 12,5
Mdia Homognea 90 0 13
MdiaHeterognea 32 0 5
Mdia Iguais 90 0 13
Mdias Diferentes 100 0 1,5
Tabela 4.1. PERCENTUAL DE ERROS DE CLASSIFICAO POR TIPO DE
MDIA E MTODO

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
4 4
Verificou-se que o mtodo de Mxima Verossimilhana foi mais afetado
pela variao nas mdias das amostras, devido principalmente a grande quantidade
de erros apresentados na classificao.
Experimento 2:
Comparou-se, neste experimento, os mtodos em funo do percentual de
erros de classificao apresentados segundo a influncia da varincia das amostras,
como mostra a tabela 4.2.
Semelhante a comparao de mdias, denominou-se como varincias
pequena ou grande as amostras tomadas com pouca ou muita variao em suas
componentes. Varincias homogneas ou heterogneas quando as componentes
sofriam as mesmas variaes ou no. Varincias iguais quando as amostras
continham varincia pequena ou grande e varincias diferentes quando a mesma
amostra continha os dois tipos de varincias, isto , pequena e grande.



MTODOS
MXIMA
VEROSSIMILHANA
DISTNCIA
MNIMA
FISHER
Varincia Pequena 92 0 13
Varincia Grande 82 0 12,5
Varincia Homognea 87 0 13
Varincia Heterognea 32 0 5
Varincias Iguais 87 0 13
Varincias Diferentes 100 0 0
De acordo com os resultados obtidos neste experimento, verificou-se que o
mtodo de Mxima Verossimilhana sofreu interferncia significativa das varincias
das amostra, o mtodo de Fisher tambm sofreu alguma interferncia e que o
mtodo de Distncia Mnima no sofreu interferncia alguma, que era esperado
dado que este mtodo no utiliza a varincia para classificao.
Experimento 3:
Observou-se, neste experimento, se o nmero de cores conjuntamente
discriminadas afetava na performance dos mtodos. Com intuito de obter um melhor
resultado separou-se as tonalidades de cores em dois grupos que foram chamadas
verdes e diversas, onde o grupo verde foi constitudo de 6 tonalidades dessa cor e o
grupo diversos de 9 tonalidades de cores observadas na natureza.
Tabela 4.2. PERCENTUAL DE ERROS DE CLASSIFICAO POR TIPO DE
VARINCIA E MTODO

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
4 5
Verificou-se, no entanto, em todos os mtodos, que quanto mais cores
forem discriminadas conjuntamente, maior a chance de classificao correta.
Experimento 4:
Foi executado, neste experimento, apenas uma comparao do tempo de
processamento entre os mtodos, sem a preocupao de otimizar os algoritmos.
Apresenta-se na tabela 4.3 o percentual do tempo que cada mtodo gastou para
classificao do tempo total utilizado pelos trs mtodos, quando a discriminao foi
feita com 2, 3, 5, 6, 10 e 15 cores simultaneamente.



NMERO DE CORES
DISCRIMINADAS
MTODO TOTAL

MX. VER. DIST. MN. FISHER
2 CORES 59 10 31 100
3 CORES 63 9 27 100
5 CORES 66 11 23 100
6 CORES 63 12 25 100
10 CORES 64 11 25 100
15 CORES 65 10 25 100
Verificou-se que o mtodo mais rpido foi o de Distncia Mnima que
gastou aproximadamente 10% do tempo total, seguido do mtodo de Fisher que
consumiu aproximadamente 30% e do mtodo de Mxima Verossimilhana com
aproximadamente 60%.
Experimento 5 :
Na classificao dos tons de verde misturados aos demais constatou-se atravs do
teste da estatstica kappa que o mtodo de Mxima Verossimilhana apresentou um
resultado pouco satisfatrio (kappa=0,7637) quanto a classificao dos tons de
verde, se diferenciando dos demais mtodos (Fisher e Distncia Mnima) que
obtiveram classificao tima (kappa=1,0000), como pode ser visto na figura 4.1.



Experimento 6:
Tabela 4.3 : PERCENTUAL DO TEMPO MDIO DE PROCESSAMENTO POR MTODO E
NMERO DE CORES SIMULTANEAMENTE DISCRIMINADAS
Figura 4.1 - COMPARAO DOS MTODOS CONSIDERANDO COMPONENTES
DEPENDENTES, PARA IMAGEM COM LETRAS.

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
4 6
Na classificao de parte de uma foto digitalizada onde tudo aleatrio verificou-se,
como mostra a figura 4.2,que a performance dos mtodos foi diferente, comprovada
pelo teste Z de COEHEN (1960), onde observou-se:
kappa (Mxima Verossimilhana) = 0,8067
kappa (Distncia Mnima) = 0,8245
kappa (Fisher) = 0,7866




No segundo caso, onde modificou-se os mtodos alterando as matrizes de
covarincia de tal maneira que as componentes das cores fossem consideradas
independentes entre si, observou-se que todos os mtodos apresentaram soluo
tima, isto , no houve erro nas classificaes realizadas quando se controlou as
amostras.
Assim, os experimentos 1, 2, 3 e 5 (figura 4.3) no apresentaram erros de
classificao e o experimento 4, que se referiu ao tempo de processamento, no
mostrou alteraes nas propores do tempo gasto aos mtodos, apesar de se
observar no total uma maior rapidez de processamento, cerca de 20%, se comparado
ao primeiro caso.




Quando se submeteu os mtodos ao caso aleatrio (experimento 6), o mtodo de
Mxima Verossimilhana no apresentou bons resultados apresentando diferenas
significativas ao nvel de significncia de 5%. Analisando a estatstica kappa de
cada um dos mtodos resultou em 0,6370 para o mtodo de Mxima
Verossimilhana, 0,8245 para o de Distncia Mnima e 0,8286 para o mtodo de
Fisher. A anlise visual pode ser observada na figura 4.4 que segue.
Figura 4.2 - COMPARAO DOS MTODOS CONSIDERANDO COMPONENTES
DEPENDENTES, PARA PARTE DA FOTO DIGITALIZADA.
Figura 4.3 - COMPARAO DOS MTODOS CONSIDERANDO COMPONENTES
INDEPENDENTES, PARA IMAGEM COM LETRAS.

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
4 7




5. CONCLUSO
Atravs dos experimentos feitos neste trabalho observou-se que o mtodo
de Mxima Verossimilhana no apresentou bons resultados principalmente quando
as amostras foram controladas. Porm, no experimento 6 realizado para classificar
parte de uma foto digitalizada, verificou-se que este mtodo se comportou
satisfatoriamente bem. Sendo assim, pode-se concluir que este mtodo poderia ser
utilizado no casos em que os padres no fossem totalmente conhecidos e que se
necessitasse retirar amostras da imagem para determin-los.
O mtodo de Fisher apresentou bons resultados quando utilizado em sua
forma original, isto , no primeiro caso onde no se alterou as matrizes de
covarincia supondo assim a dependncia entre as componentes da cor, e melhorou
ainda mais quando no segundo caso em que as matrizes de covarincia foram
alteradas (componentes independentes).
O mtodo de Distncia Mnima teve excelentes resultados em todos os
experimentos controlados e apresentou o melhor desempenho no experimento
aleatrio.
Conclui-se, ento, que o mtodo de Distncia Mnima o mais apropriado
para reconhecimento de padres de cores reais, alm ser comprovamente o mais
rpido na classificao entre os mtodos estudados, podendo oferecer vantagens
quando da necessidade de reconhecimento de cores em tempo real.

REFERNCIAS BIBLIOGRFICAS
ARGIALAS, Demetre P. & HALOW, Charles A. Computational Image
Interpretation Models: An Overview and a Perspective. Photogrammetric
Engineering and Remote Sensing. Vol 56, june 1990, pp. 871-886.
BOLSTAD, Paul V. & LILLESAND, T. M. Rapid Maximum Likelihood
Classification. Photogrammetric Engineering & Remote Sensing. Vol. 57,
January 1991, pp. 67-74.
COHEN, J. A Coefficient of Agreement for Nominal Scales. Educational and
Psychological Measurement, vol. XX, No. 1, 1960
Figura 4.4 - COMPARAO DOS MTODOS CONSIDERANDO COMPONENTES
INDEPENDENTES, PARA PARTE DA FOTO DIGITALIZADA.

Bol. Cinc. Geod., Curitiba, v. 4, p.3-13, 1999.
4 8
FOODY, Giles M.; McCULLOCH, Mary B. & YATES, William B. Classification
of Remotely Sensed Data by an Artificial Neural Network: Issues Related to
Training Data Characteristics. Photogrammetric Engineering & Remote
Sensing. Vol. 61, No.4, April 1995, pp 391-401.
GREEN, William B. Digital Image Processing: A Systems Approach. Ed. Van
Nostrand Reinhold, New.York, 1989.
GROOVER, Mikell P.; WEISS, Michell; NAGEL, Roger N. & ODREY,
Nicholas G. Robtica. Tecnologia e Programao. Ed. McGraw-Hill. So
Paulo, 1989.
JOHNSON, Richard A. & WICHERN, Dean W. Applied Multivariate Statistical
Analysis. Ed. Prentice Hall International, 1985.
LILLESAND, Thomas M & KIEFER, Ralph W. Remote Sensing and Image
Interpretation. Ed. John Wiley & Sons, New York, 1994.
RICHARDS, John A. Remote Sensing Digital Image Analysis. Ed. Spring Verlag
Berlin Heidelberg, Alemanha 1986.
SONKA, Milan; HLAVAC, Vaclav & BOYLE, Roger. Image Processing, Analysis
and Machine Vision. Ed. Chapman & Hall, Cambridge, 1993.




(Recebido em 24/03/98. Aceito para publicao em 05/10/98.)

Você também pode gostar