PDI 7 Segmentação Classificação

Capítulo 7 – SEGMENTAÇÃO E CLASSIFICAÇÃO
7.1 SEGMENTAÇÃO DE IMAGENS

7.1.1 Crescimento de regiões
7.1.2 Segmentação baseada em bordas
7.1.3 Detecção de bacias
7.2 CLASSIFICAÇÃO
7.2.1 Classificação supervisionada
7.2.1.1 Treinamento
7.2.1.2 Classificação por Máxima Verosimilhança
7.2.1.3 MAXVER-ICM
7.2.1.4 Distância Euclidiana
7.2.1.5 Método do Paralelepípedo
7.2.2 Pós Classificação
7.2.3 Classificação Não-Supervisionada
7.2.3.1 Classificador Isoseg
7.1 Segmentação de Imagens
Segmentação de imagens é uma tarefa básica no processo de análise de imagens: a
imagem é particionada em regiões que devem corresponder às áreas de interesse da aplicação.
Entende-se por regiões um conjunto de pixels contíguos, que se espalham bidimensionalmente e
que apresentam uniformidade em relação a um dado atributo. Atributos das regiões tais como
área, forma, parâmetros estatísticos e textura podem ser extraídos e usados posteriormente no
processo de análise.
O particionamento da imagem pode ser realizado, basicamente, de três formas: (1)
por crescimento de regiões; (2) detecção de bordas e (3) combinação das outras duas.
A técnica de crescimento de regiões divide a imagem em um número de regiões
homogêneas, cada uma identificada por um rótulo. O resultado final é uma imagem rotulada. No
método de deteção de bordas, as bordas entre regiões homogêneas são extraídas gerando como
resultado um mapa de bordas.
Cada técnica é afetada diferentemente por vários fatores. Para algumas aplicações o
método de deteção de bordas não funciona bem devido a presença de “buracos” nas bordas, as
quais permitem que duas regiões diferentes sejam agregadas. Outra desvantagem é que esta
técnica é sensível às variações locais dos níveis de cinza e , então, os contornos geralmente não
são fechados.
Por outro lado, o método por crescimento de regiões sempre gera regiões com
contornos fechados. Este método é muito simples e efetivo em várias aplicações. A principal
desvantagem são os erros nos contornos das regiões: pixels de borda podem ser agregados à uma
das regiões vizinhas de forma aleatória.
A seleção de uma destas abordagens ou a combinação delas depende fortemente do
tipo de dados usados na análise e da área de aplicação.
7.1.1 Crescimento de regiões

A técnica por crescimento de regiões é um processo iterativo em que as regiões
espacialmente adjacentes são agrupadas segundo algum critério de similaridade.
No início do processo de segmentação a região pode ser um pixel ou um conjunto de
pixels. Para cada região, são calculados atributos espectrais como por exemplo média, variância
e textura. A agregação das regiões é feita usando algum critério de similaridade e um limiar, que
pode ser definido pelo usuário. Geralmente o critério de similaridade baseia-se em um teste de
hipótese estatístico que testa a média entre as regiões.
De um modo simplificado o processo pode ser descrito pelos seguintes passos:
1. Particione toda imagem em células padrões ( 1 ou mais pixels).
2. Cada célula padrão é comparada com as suas células vizinhas para determinar se elas são
similares, usando uma medida de similaridade. Se elas são similares, agrupe as células para
formar um segmento e atualize as propriedades usadas na comparação.
3. Continue o crescimento do segmento examinando todas os seus vizinhos até que não exista
regiões que possam ser agrupadas ao segmento. Rotule o segmento como uma região
completa.
4. Processe a próxima célula não completa, e repita estes passos até que todas as células sejam
rotuladas.
92 Processamento Digital de Imagens

CAPÍTULO 7 – Segmentação e Classificação
No segmentador, implementado no sistema SPRING, duas regiões adjacentes A e B são

agrupadas se e somente se:
• a média das regiões A e B são similares;
• a medida de similaridade satisfaz o limiar estabelecido;
• A e B são mutuamente próximas (dentre os vizinhos de A, B é a mais próxima de A, e dentre
os vizinhos de B, A é a mais próxima de B).
A Figura 7.1 mostra os contornos das regiões, obtidos através do algoritmo de

crescimento de regiões implementado no SPRING, sobrepostos à imagem original.
Fig. 7.1 - Imagem segmentada sobreposta à imagem original.
7.1.2 Segmentação baseada em bordas

As bordas na imagem caracterizam os contornos dos objetos e são bastante úteis para
segmentação e identificação de objetos na cena. Pontos de borda podem ser entendidos como as
posições dos pixels com variações abruptas de níveis de cinza. Os pontos de borda caracterizam
as transições entre objetos diferentes.
Existem várias técnicas de segmentação baseadas em bordas. As mais simples são
aquelas em que as bordas são detetados pelos operadores gradiente (Sobel, Roberts, Laplaciano)
seguidos de uma limiarização. A Figura 6.2 mostra o mapa de bordas obtido pelo operador
laplaciano da gaussiana (Gonzalez, 1992).
93
Fig. 7.2 - Mapa de bordas gerado pelo operador Laplaciano da gaussiana.
7.1.3 Detecção de bacias

A segmentação por detecção de bacias é feita sobre uma imagem resultante
da extração de bordas (mapa de bordas).
A extração de bordas é realizada por um algoritmo de detecção de bordas,
que pode ser, por exemplo, um filtro Sobel. Este algoritmo considera os gradientes de nível
de cinza da imagem original, para gerar uma imagem gradiente ou imagem de intensidade de
borda.
O algoritmo calcula um limiar para a perseguição de bordas. Quando ele
encontra um pixel com valor superior ao limiar estabelecido, tem-se início o processo de
perseguição da borda. Observa-se a vizinhança para identificar o próximo pixel de maior
valor de nível digital e segue-se nesta direção até que se encontre outra borda ou a fronteira da
imagem, identificado no mapa de bordas. Deste processo, gera-se uma imagem binária com os
valores de 1 referentes às bordas e 0, a regiões de não-bordas.
A imagem binária será rotulada de modo que as porções da imagem com
valores 0 constituirão regiões limitadas pelos valores 1 da imagem, constituindo a imagem
rotulada.
O procedimento de segmentação por detecção de bacias pressupõe uma
representação topográfica para a imagem, ou seja, para uma dada imagem gradiente, o valor
de nível digital de cada pixel eqüivale a um valor de elevação naquele ponto. A imagem
equivaleria a uma superfície topográfica com feições de relevo ou uma região com bacias de
diferentes profundidades.
O crescimento de uma região eqüivaleria à imersão da superfície topográfica
em um lago. Define-se um altura inicial (nível digital) para o preenchimento das bacias
(limiar). A "água" preencherá progressivamente as diferentes bacias da imagem até um limiar
definido pela topografia (valor de nível digital). Ao alcançar o limite, define-se uma barreira
entre duas regiões. O processo de preenchimento continua em outra direção até atingir um
novo limite topográfico, definindo-se mais uma barreira, e assim sucessivamente até que
todas as barreiras tenham sido definidas.

O resultado é uma imagem rotulada, cada região apresentando um rótulo

(valor de nível digital), que podem ser classificadas por classificadores baseados em regiões.
7.2 Classificação
Classificação é o processo de extração de informação em imagens para
reconhecer padrões e objetos homogêneos com o objetivo de mapear as áreas da superfície
terrestre. O resultado final de uma classificação de uma imagem é uma imagem temática
(mapa), onde os pixels classificados são representados por símbolos gráficos ou cores. Cada
cor ou símbolo está associado à uma classe (área urbana, tipos de florestas, tipos de solo, etc.)
definida pelo usuário. A Figura 7.3(b) ilustra como seria o resultado de uma classificação.
Fig. 7.3 - (a) Imagem original; (b) imagem classificada.
A classificação automática (feita por computador) envolve a análise

individual dos atributos numéricos de cada pixel na imagem, por isso é considerada uma
análise quantitativa.
Uma outra forma de classificação não automática é conhecida como
fotointerpretação onde, um especialista humano extrai as informações baseando-se na
inspeção visual da imagem. Essas duas abordagens são importantes e muitas vezes
complementares.
Na classificação automática, o computador é capaz de produzir medidas de
áreas mais precisas que o fotointérprete, porque cada pixel é tratado isoladamente. Além
disso, ao contrário do especialista humano, a classificação automática pode ser realizada
usando mais do que três bandas espectrais.
A saída de um processo de classificação é um mapa temático; um grande
número de níveis de cinza nas diversas bandas espectrais são transformados em um pequeno
número de classes em uma única imagem.
Uma forma de se representar uma imagem multi-espectral é através do
espaço de atributos, ou espaço vetorial multi-espectral, com tantas dimensões quantas forem o
número de bandas disponível para esse dado. Nesse espaço, cada pixel da imagem é plotado
como um ponto cujas coordenadas são dadas pelos seus valores de intensidade em cada uma
das bandas espectrais analisadas. Isso é exemplificado para o caso simples de duas bandas
espectrais na Figura 7.4.
95
Veget
.
Vegetação *****
***
****
+++++
+++ Solo.
++++
#####
Solo Água ###
#### Água.
Fig. 7.4 - Representação de uma imagem multi-espectral no espaço de atributos.

(a) mapa temático; (b) espaço de atributos.
Assumindo-se que as bandas espectrais fornecem uma boa discriminação

entre as diversas coberturas da superfície (ou alvos), é razoável supor que os pixels
pertencentes a um mesmo alvo irão agrupar-se formando nuvens no espaço de atributos. Essas
nuvens ou agrupamentos são chamados de classes, as quais espera-se que o algoritmo de
classificação automática seja capaz de detectar.
O projeto de um classificador consiste em se dividir o espaço de atributos
em regiões distintas, cada qual representando uma classe. Ou seja, deve se encontrar as
fronteiras de decisão entre as classes. A Figura 7.5 ilustra como é o projeto de um
classificador.
*****
***
****
+++++
+++
++++
#####
###
####
Fig. 7.5- Projeto de um classificador.
Em relação ao tipo de treinamento, a classificação automática pode ser

dividida em dois grupos: supervisionada e não supervisionada, as quais são descritas a
seguir.
Na classificação não supervisionada, cada pixel da imagem é associado a
uma classe espectral sem que o usuário tenha um conhecimento prévio do número ou
identificação das diferentes classes presentes na imagem. Isso é feito, basicamente, através de
algoritmos de agrupamento.
Na classificação supervisionada, o usuário seleciona amostras
representativas para cada uma das classes que se deseja identificar na imagem. Geralmente,
assume-se que as classes podem ser descritas por uma função densidade de probabilidade e,
portanto, descritas por seus parâmetros estatísticos. Estes parâmetros são estimados através
do conjunto de amostras de treinamento, previamente selecionados. A função densidade de
probabilidade será, então, usada como um critério de decisão sobre a que classe um pixel

pertence. Existem ainda outros métodos que particionam o espaço de atributos utilizando
superfícies otimamente localizadas.
Os classificadores podem ainda ser divididos em classificadores pixel a
pixel e classificadores por regiões. Os classificadores pixel a pixel utilizam apenas a
informação espectral isolada de cada pixel para identificar as regiões homogêneas.
A classificação por regiões é realizada, basicamente, em duas etapas.
Primeiro, a imagem é particionada em regiões (segmentação). Posteriormente, cada região é
associada à uma classe. Ou seja, todos os pixels pertencentes a uma dada região são mapeados
para uma mesma classe. Este método simula o comportamento de um foto-intérprete, que
reconhece as áreas homogêneas nas imagens, baseando-se nas propriedades espectrais e
espaciais destas imagens.
7.2.1 Classificação supervisionada

Do ponto de vista prático, e independentemente do algoritmo de
classificação supervisionada utilizado, os passos a serem seguidos para realizar uma
classificação supervisionada são:
1. seleciona-se as classes que se deseja identificar na imagem, por exemplo, água,
cultura, solo exposto, área urbana, mata, etc;
2. Escolhe-se um conjunto de amostras (conjunto de pixels) representativo de cada uma
das classes. Essas amostras formarão um conjunto de amostras de treinamento. Essas
amostras podem ser definidas usando dados de campo, fotos aéreas ou ainda da
interpretação visual da imagem a ser classificada;
3. Utiliza-se o conjunto de treinamento para estimar os parâmetros usados pelo
algoritmo de classificação. Estes podem ser propriedades do modelo de
probabilidade ou equações que definem o particionamento no espaço de atributos.
Esse passo é conhecido como treinamento;
4. Rotula-se cada pixel ou região como pertencente a uma dentre o conjunto de classes
definido no passo 1, usando os parâmetros estimados no passo 3;
5. Produz-se dados tabulares (por exemplo, área) ou mapas temáticos que mostram o
resultado da classificação.
7.2.1.1 Treinamento
Para executar o treinamento, o usuário deve identificar na imagem um
conjunto de pixels (área) representativo de cada classe. É importante que a área seja uma
amostra homogênea da classe correspondente, mas ao mesmo tempo deve-se incluir toda a
variabilidade dos níveis de cinza para a classe.
Recomenda-se que o usuário adquira mais do que uma área de treinamento,
utilizando o maior número de informações disponíveis, como trabalhos de campo, mapas, etc.
Para a obtenção de classes estatisticamente confiáveis, são necessários de 10
a 100 áreas de treinamento por classe. O número de pixels de treinamento necessário para a
97
precisão do reconhecimento de uma classe aumenta com o aumento da variabilidade entre as
classes. A Figura 7.6 ilustra um exemplo de amostras de treinamento:
Figura 7.6 – Exemplo de amostras de treinamento.
A seguir serão mostrados alguns classificadores supervisionados mais

comuns.
7.2.1.2 Classificação por Máxima Verosimilhança
MAXVER é o método de classificação "pixel a pixel" mais utilizado em

dados de sensoriamento remoto.
Suponha que as diferentes classes espectrais de uma imagem sejam:
wi , i = 1,...M
onde M é o número total de classes. A fim de se determinar a que classe um determinado

pixel com um vetor espectral x (um vetor dos valores de intensidade em cada banda
espectral) pertence, deve-se avaliar a probabilidade de que a classe wi seja a classe correta
para um pixel x , ou seja:
p ( wi | x ), i = 1,..., M (1)
O critério de classificação será dado por:

x ∈ wi se p ( wi | x ) > p( w j | x ) para todo i ≠ j (2)
ou seja, um pixel é atribuído a classe de maior probabilidade. Apesar de ser um critério
simples, tal probabilidade é desconhecida. No entanto a partir das amostras de treinamento é
possível estimar a distribuição de probabilidade de cada classe. Esta probabilidade descreve a
chance de encontrar um pixel da classe wi com um vetor espectral x , representada pela
probabilidade p ( x | wi ) . Ou seja, para um pixel na posição x do espaço de atributos, pode-se
calcular um conjunto de probabilidades de que o pixel pertença a cada uma das classes
possíveis.

Essa nova probabilidade relaciona-se com aquela descrita em (1) da seguinte

forma:
p ( wi | x ) = p( x | wi ) p ( wi ) (3)
Portanto, o critério de decisão descrito em (2) passa a ser:
x ∈ wi se p ( x | wi ) p ( wi ) > p( x | w j ) p( w j ) para todo i ≠ j (4)
p ( wi ) é a probabilidade de que a classe wi ocorra na imagem, e pode ser

determinada pelo especialista de acordo com o conhecimento da área, ou ser assumida como
igual para todas as classes sendo consideradas.
O próximo passo é considerar que a distribuição de probabilidade para as
classes são normais, essa suposição não é demonstrável, mas sim uma propriedade natural dos
alvos. Partindo-se dessa suposição e com algumas simplificações matemáticas, o critério de
decisão passa a ser:
x ∈ wi se g i ( x) > g j ( x ) para todo i ≠ j (5)
onde:
g i ( x ) = − ln | Σ i | −( x − mi ) t Σ −i 1 ( x − m ) (6)
mi e Σ i são o vetor média e a matriz de covariância, respectivamente, da

classe i calculados a partir das amostras de treinamento.
O critério de decisão deve ainda incorporar o conceito de limiar de decisão.
Considere as curvas da distribuição de probabilidade de duas classes 1 e 2 mostradas na
Figura 7.7 .
Figura 7.7 - Limite de decisão.
O limiar de decisão indica a % de pixels da distribuição de probabilidade de

uma classe que será classificada como pertencente a esta classe. Um limite de 99%, por
exemplo, engloba 99% dos pixels, sendo que 1% serão ignorados (os de menor
probabilidade). Isto pode compensar a possibilidade de alguns pixels terem sido introduzidos
no treinamento por engano, nesta classe, ou estarem no limite entre duas classes. Um limiar
de 100% resultará em uma imagem classificada sem rejeição, ou seja, todos os pixels serão
classificados.
Para diminuir a confusão entre as classes, ou seja, reduzir a sobreposição
entre as distribuições de probabilidades das classes, aconselha-se que a aquisição de amostras
seja realizada com muito cuidado. Ou seja, as amostras escolhidas devem ser significativas de
alvos distintos. Além disso, deve-se fazer uma avaliação das amostras através da matriz de
99
análise das amostras, que mostra quais amostras resultaram em maior confusão. Estas
amostras devem ser eliminadas ou refeitas.
A matriz de classificação apresenta a distribuição de porcentagem de pixels
classificados correta e erroneamente. No exemplo mostrado na Tabela 7.1, apresenta-se uma
matriz de classificação com as porcentagens de 4 classes definidas na aquisição de amostras,
os valores de desempenho médio, abstenção (quanto não foi classificado) e confusão média.
A classe 1 corresponde à Floresta, a classe 2 ao Cerrado, a classe 3 ao Rio e
a classe 4 ao Desmatamento.
Tabela 7.1 – Exemplo de matriz de classificação.
Não class. Floresta Cerrado Rio Desmat.

Floresta 4.7 94.3 0.0 0.0 0.9
Cerrado 0.1 0.0 82.3 0.0 16.6
Rio 0.0 13.3 0.0 86.7 0.0
Desmat. 3.8 0.0 4.7 0.0 91.5
Desempenho médio: 89.37

Abstenção média: 3.15
Confusão média: 7.48
Uma matriz de classificação ideal deve apresentar os valores da diagonal

principal próximos a 100%, indicando que não houve confusão entre as classes. Contudo esta
é uma situação difícil em imagens com alvos de características espectrais semelhantes.
O valor fora da diagonal principal, por exemplo 13.3 (linha 3 e coluna 1),
significa que 13.3% da área da classe "Rio" amostrada foi classificada como classe 1
(Floresta). O mesmo raciocínio deve ser adotado para os outros valores.
Para diminuir a confusão entre as classes, aconselha-se a análise das
amostras. A Tabela 7.2 exemplifica a análise das amostras adquiridas para a classe Floresta.

Tabela 7.2 – Análise das amostras
Am. 1 Am. 2 Am. 3
Floresta 90 0 87
Cerrado 5 50 3
Rio 5 0 0
Desmat. 0 0 10
Os valores em porcentagem indicam que na amostra 1, 90% dos pixels são

classificados como floresta, 5% como cerrado e 5% como rio, o que resulta em uma amostra
confiável. Por sua vez, a amostra 2 apresentou uma confusão de 50% entre as classes floresta
e cerrado, indicando que esta deve ser eliminada.
Os pixels dentro de uma área de treinamento são submetidos a um algoritmo
de agrupamento ("clustering") que determina o agrupamento do dado, numa feição espacial de
dimensão igual ao número de bandas presentes. Este algoritmo assume que cada agrupamento
("cluster") representa a distribuição de probabilidade de uma classe.
Uma outra forma de se avaliar o desempenho da classificação é através do
coeficiente Kappa, que foi originalmente definido por Cohen em 1960 (Hudson et al, 1987),
como
r r
N ∑ xii − ∑ xi+ x +i
k$
= i =1
r
i =1
(7)
N − ∑ x i+ x+ i
2
i =1
onde r é o número de linhas ou colunas da matriz de confusão; xii é o número de observações

dos elementos da diagonal da matriz; xi+ = ∑ xij é a soma dos valores da linha i ;
j
x +i = ∑ x ji é a soma dos valores da coluna i ; e N corresponde ao número total de

j
observações.
Para propósitos computacionais apresenta-se, com frequência, a seguinte forma equivalente

para o coeficiente Kappa (Hudson et al, 1987; Foody, 1992; Rosenfield et al, 1986)
θ1 − θ 2
k$
= (8)
1− θ2
r
1
onde θ1 =
N ∑ x ii
i =1
101
r
1
θ2 =
N2
∑ x i+ x+ i
i =1
onde r, xii , xi+ , x +i e N são os mesmos definidos acima.
A variância do Kappa pode ser estimada por
VARk$=
1
 1 1
+ 1 1 2 3
+
(
 θ (1 − θ ) 2(1 − θ )( 2θ θ − θ ) (1 − θ1 ) 2 θ 4 − 4θ 22 ) 
N  (1 − θ 2 ) ( ) (1 − θ 2 ) 4 
2 3
1 − θ
 2 
onde θ1 e θ 2 já foram definidos acima,
r
∑ xii ( xi+ + x+ i )
1
θ3 =
N2 i=1
r r
∑ ∑ x ij ( x j+ + x + i )
1 2
θ4 =
N3 i =1 j =1
Quando todos os elementos da matriz de confusão fora da diagonal possuem valor nulo, o
coeficiente Kappa possui valor 1, o que significa um desempenho excelente. O coeficiente
Kappa também pode assumir valores negativos indicando que o desempenho foi péssimo. A
tabela a seguir apresenta o desempenho da classificação em relação ao valor de Kappa obtido.
Tabela 7-3 : Índice do coeficiente Kappa e o correspondente conceito do desempenho da

classificaçao
Índice Desempenho
Kappa da classificação
<0 Péssimo
0 < k ≤ 0,2 Mau
0,2 < k ≤ 0,4 Razoável
0,4 < k ≤ 0,6 Bom
0,6 < k ≤ 0,8 Muito Bom
0,8 < k ≤ 1,0 Excelente
7.2.1.3 MAXVER-ICM
Enquanto o classificador MAXVER associa classes considerando pontos
individuais da imagem, o classificador MAXVER-ICM (Interated Conditional Modes)
considera também a dependência espacial na classificação.
Em uma primeira fase, a imagem é classificada pelo algoritmo MAXVER.
Na fase seguinte, leva-se em conta a informação contextual da imagem. Ou seja, a classe
atribuída depende tanto do valor observado nesse pixel, quanto das classes atribuídas aos seus
vizinhos.

O algoritmo atribui classes a um determinado pixel, considerando a

vizinhança iterativamente. Este processo é finalizado quando a % de mudança (porcentagem
de pixels que são reclassificados) definida pelo usuário é satisfeita.
7.2.1.4 Distância Euclidiana

Quando o número de amostras de treinamento por classe é limitado, e
portanto a estimativa da média m e a matriz de covariância Σ não é bastante confiável, pode-
se usar um algoritmo de classificação por distância euclidiana. Nesse método, as amostras de
treinamento são usadas para calcular a média de cada classe. Cada pixel será atribuído a
classe cuja distância entre o valor do pixel e a média da classe seja menor.
Seja mi , i = 1,...M as médias das M classes escolhidas durante o
treinamento, seja x o pixel a ser classificado. A medida de distância é dada por:
d ( x , mi ) 2 = ( x − mi ) t ( x − mi ) i = 1,...M (6)
O pixel será incorporado ao agrupamento que apresenta a menor distância
Euclidiana. Este procedimento é repetido até que toda a imagem seja classificada.
O método da distância Euclidiana possui a vantagem de ser,
computacionalmente, mais simples. Um limiar de decisão pode também ser usado, de maneira
análoga ao método da máxima verosimilhança.
7.2.1.5 Método do Paralelepípedo

O método do paralelepípedo é um classificador bastante simples. O
treinamento é feito com base nos histogramas das amostras das classes procuradas. Veja o
exemplo de uma amostra bi-dimensional de uma classe C1 na Figura 7.8:
x1
a b
c d
Figura 7.8 – Histograma das amostras.
Os valores mínimos e máximos dos histogramas em cada uma das bandas

são identificados e usados para definir os vértices de um paralelepípedo no espaço de
atributos (como mostrado na Figura 7.9) . Na classificação os pixels que se encontrarem
dentro desse paralelepípedo serão rotulados como pertencentes a essa classe.
103
x2
C2
C1
C3
c
x1
a b
Figura 7.9 – Método do paralelepípedo.
Apesar de simples o método do paralelepípedo apresenta algumas
limitações. Podem existir várias regiões não cobertas pelos paralelepípedos que não serão
classificadas. No caso de dados correlacionados pode haver regiões de interesecção entre os
paralelepípedos que definem as classes que não poderão ser separados.
7.2.2 Pós Classificação

Aplica-se este procedimento em uma imagem classificada, com o objetivo
de uniformizar os temas, eliminando pontos isolados que foram classificados diferentemente
de sua vizinhança. Com isto, gera-se um imagem classificada com uma aparência menos
ruidosa.
Por exemplo, pode-se considerar uma janela de 3 x 3 pixels onde o ponto
central é avaliado quanto à freqüência das classes (temas) em sua vizinhança. Esse processo
deve ser feito com cautela por isso o usuário tem a opção de definir parâmetros com valores
de peso e limiar, de forma a se ter um controle sobre o processo. O ponto central terá ou não
sua classe substituída pela classe de maior freqüência na vizinhança de acordo com tais
valores. O peso define o número de vezes que será considerada a freqüência do ponto central.
O limiar define o valor de freqüência acima do qual o ponto central será modificado.
7.2.3 Classificação Não-Supervisionada
Na classificação não supervisionada, o usuário não informa a priori o

número nem quais são as classes que devem ser encontradas durante a classificação.
Algoritmos de classificação supervisionada podem ser usados para gerar a classificação final,
particularmente quando não se pode obter dados de treinamento confiáveis. Podem ainda ser
usados para a determinação do número de classes distintas na imagem para um posterior
processo de classificação supervisionada. Basicamente, os algoritmos de classificação não
supervisionada são métodos de agrupamento baseados em alguma medida de similaridade, ou
seja, pixels ou regiões serão agrupados (ou rotulados como pertencentes a mesma classe) se a
medida de similaridade entre eles for satisfatória. Um exemplo desse tipo de algoritmo é
apresentado a seguir.

7.2.3.1 Classificador Isoseg

O classificador Isoseg é um algoritmo não supervisionado, aplicado sobre
um conjunto de regiões (resultantes de uma segmentação), que por sua vez são caracterizadas
por sua média, matriz de covariância e área.
A medida de similaridade utilizada pelo classificador é conhecida como
distância de Mahalanobis que utiliza atributos estatísticos como a média e a matriz de
covariância das regiões avaliadas. Esse algoritmo é descrito a seguir:
1. Definição do limiar: o usuário define um limiar de aceitação, dado em
porcentagem, com o qual calcula-se uma distância mínima entre as regiões
pertences a mesma classe. Quanto maior o limiar, menor a distância entre
as regiões (mais rigorosa a classificação) e portanto maior será o número
de classes diferentes detectadas pelo algoritmo.
2. Detecção das classes: as regiões são ordenadas em ordem decrescente de
área e inicia-se o procedimento para agrupá-las em classes. Atribui-se um
novo rótulo a região de maior área que ainda não tenha sido classificada.
Agrupa-se a ela todas as regiões cuja distância seja inferior ao valor
mínimo definido pelo limiar de aceitação. Esta fase se repete até que todas
regiões tenham recebido algum rótulo.
3. Competição entre classes: uma vez que a fase 2 é um processo sequencial
que pode favorecer as classes que são detectadas em primeiro
lugar.Visando eliminar este “favorecimento", procede-se uma
"competição” entre classes. Esta competição consiste em reclassificar
todas as regiões usando no calculo da distância as médias e matrizes de
covariância dos agrupamentos obtidos na entapa anterior. O processo
repete-se até que a média das classes não se altere (convergência). Ao
término do processo, todas regiões estarão associadas a uma classe
105

PDI 7 Segmentação Classificação

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

PDI 7 Segmentação Classificação

Enviado por

Direitos autorais:

Formatos disponíveis

Capítulo 7 – SEGMENTAÇÃO E CLASSIFICAÇÃO

7.1 SEGMENTAÇÃO DE IMAGENS

7.1.1 Crescimento de regiões

92 Processamento Digital de Imagens

No segmentador, implementado no sistema SPRING, duas regiões adjacentes A e B são

A Figura 7.1 mostra os contornos das regiões, obtidos através do algoritmo de

Fig. 7.1 - Imagem segmentada sobreposta à imagem original.

7.1.2 Segmentação baseada em bordas

7.1.3 Detecção de bacias

94 Processamento Digital de Imagens

O resultado é uma imagem rotulada, cada região apresentando um rótulo

Fig. 7.3 - (a) Imagem original; (b) imagem classificada.

A classificação automática (feita por computador) envolve a análise

Fig. 7.4 - Representação de uma imagem multi-espectral no espaço de atributos.

Assumindo-se que as bandas espectrais fornecem uma boa discriminação

Fig. 7.5- Projeto de um classificador.

Em relação ao tipo de treinamento, a classificação automática pode ser

96 Processamento Digital de Imagens

7.2.1 Classificação supervisionada

Figura 7.6 – Exemplo de amostras de treinamento.

A seguir serão mostrados alguns classificadores supervisionados mais

7.2.1.2 Classificação por Máxima Verosimilhança

MAXVER é o método de classificação "pixel a pixel" mais utilizado em

onde M é o número total de classes. A fim de se determinar a que classe um determinado

O critério de classificação será dado por:

98 Processamento Digital de Imagens

Essa nova probabilidade relaciona-se com aquela descrita em (1) da seguinte

p ( wi ) é a probabilidade de que a classe wi ocorra na imagem, e pode ser

mi e Σ i são o vetor média e a matriz de covariância, respectivamente, da

Figura 7.7 - Limite de decisão.

O limiar de decisão indica a % de pixels da distribuição de probabilidade de

Tabela 7.1 – Exemplo de matriz de classificação.

Não class. Floresta Cerrado Rio Desmat.

Desempenho médio: 89.37

Uma matriz de classificação ideal deve apresentar os valores da diagonal

100 Processamento Digital de Imagens

Tabela 7.2 – Análise das amostras

Am. 1 Am. 2 Am. 3

Os valores em porcentagem indicam que na amostra 1, 90% dos pixels são

onde r é o número de linhas ou colunas da matriz de confusão; xii é o número de observações

x +i = ∑ x ji é a soma dos valores da coluna i ; e N corresponde ao número total de

Para propósitos computacionais apresenta-se, com frequência, a seguinte forma equivalente

onde r, xii , xi+ , x +i e N são os mesmos definidos acima.

A variância do Kappa pode ser estimada por

onde θ1 e θ 2 já foram definidos acima,

Tabela 7-3 : Índice do coeficiente Kappa e o correspondente conceito do desempenho da

102 Processamento Digital de Imagens

O algoritmo atribui classes a um determinado pixel, considerando a

7.2.1.4 Distância Euclidiana

7.2.1.5 Método do Paralelepípedo

Os valores mínimos e máximos dos histogramas em cada uma das bandas

7.2.2 Pós Classificação

7.2.3 Classificação Não-Supervisionada

Na classificação não supervisionada, o usuário não informa a priori o

104 Processamento Digital de Imagens

7.2.3.1 Classificador Isoseg

Você também pode gostar