Você está na página 1de 20

Elementos de apoio à disciplina de Sistemas de

Informação Geográfica e Detecção Remota


2003/2004

Detecção Remota

Manuel Lameiras Campagnolo

Maio 2004

N.B. Estes elementos não cobrem a totalidade da matéria leccionada sobre Detecção
Remota. São complementares ao conteúdo das aulas e à bibliografia da disciplina.
As referências bibliográfica são indicadas no texto da seguinte forma:

[Chu00] E. Chuvieco, Fundamentos de Teledetectión Espacial , 3a edição, RIALP, 2000.


(Cota BISAU40-90.)
[CC97] M.L. Campagnolo e M.S. Caetano, Abordagens Multiestratégicas para
Classificação de Imagens de Satélite: uma aplicação numa zona florestal, 1997.
Relatório técnico #6 do Departamento de Matemática do Instituto Superior de
Agronomia. (Cota BISA U40-93 e http://math.isa.utl.pt/~mlc/amecis/amecis.html)
[FF04] A.D.Fonseca e J.C.Fernandes, Detecção Remota, Lidel, 2004.
[Jen96] J.R. Jensen, Introductory Digital Image Processing: a remote sensing
perspective, 2nd edition, Prentice-Hall, 1996. (Cota BISA U40-87.)
[Jen00] J.R. Jensen, Remote Sensing of the Environment: an earth resource perspective,
Prentice-Hall, 2000. (Cota BISA U40-86.)
[LK00] T. Lillesand and R. Kiefer, Remote Sensing and Image Interpretation, 4th edition,
Wiley, 2000. (Cota BISA U40-88.)
[RJ99] J. Richards and X. Jia, Remote Sensing Digital Image Analysis, 3rd edition,
Springer, 1999. (Cota BISA U40-84.)

Detecção remota

Detecção remota designa o conjunto de técnicas para obtenção de informação sobre um


objecto por um sensor que não está em contacto físico com o objecto [Jen00, LK00].

Contudo, detecção remota refere-se tipicamente a informação radiométrica que pode ser
representada por um conjunto de valores de pixels de uma imagem. Essa imagem pode
então ser analisada para ser obtida informação relevante sobre o objecto, como ilustrado
na figura de [LK00, p.3].

Exemplos de sistemas de detecção remota:


• sensores digitais instalados em satélites
• sensores digitais ou analógicos instalados em aviões
• sensores portáteis usados em trabalho de campo

1
Radiação electromagnética e detecção remota

Todos os objectos com temperatura superior ao zero absoluto (0 K=-273 ºC) emitem
energia electromagnética. A principal fonte de energia para detecção remota é o sol. A
radiação emitida total de um corpo negro é dada por

Mn= σ T4 (W m-2),

em que T é a temperatura absoluta em graus Kelvin e σ é a constante de Stefan-


Boltzmann. O comprimento de onda dominante dessa radiação é dada pela lei de Wien,

λ max = k / T (µ m),

em que k é uma constante de valor 2898 µ m K. Esses dois aspectos de dependência da


radiação da temperatura absoluta são ilustrados pela figura de [Jen00, p.33]. Os objectos
reais não se comportam no entanto como corpos negros. Designa-se por emitância a
razão entre radiação emitida por um objecto e a radiação emitida por um corpo negro a
igual temperatura.

A radiação visível corresponde apenas a uma reduzida porção do espectro


electromagnético, como se pode ver na figura de [LK00, p.5]. No entanto, a detecção
remota permite obter informação em outras zonas do espectro. Note-se que a gama de
comprimentos de onda captados por sensores analógicos (visível e infravermelho
próximo) é mais reduzida do que a gama captada por sensores digitais.

Por limitações físicas e tecnológicas, a gama de comprimentos de onda captados por


sistemas de detecção remota é aproximadamente 0.4 a 12 µ m (visível e infravermelho),
correspondentes a frequências entre 20 e 60 GHz, e 30 a 300 mm (microondas),
correspondentes a frequências entre 1 e 10 GHz (cf. [RJ99, p.2]). A relação entre
comprimento de onda e frequência é dada por

c= λ ν ,

em que c é a velocidade da luz e λ e ν representam o comprimento de onda e a


frequência respectivamente. A figura de [LK00, p.11] permite comparar, para diferentes
comprimentos de onda, a energia diponível para detecção remota, a localização
aproximada das “janelas” de transmissão da atmosfera e as gamas de comprimento de
onda captados por sensores.

Como foi dito anteriormente, a mais importante fonte de energia em detecção remota é o
sol. Para comprimentos de onda da gama do visível e do infravermelho próximo e
médio, a radiação captada pelo sensor é essencialmente proveniente, directa ou
indirectamente, do sol. A radiação em comprimentos de onda entre 10 e 12 µ m
(infravermelho térmico) depende da temperatura do objecto para temperaturas comuns
de objectos situados na superficie terrestre. Apenas nessa gama de comprimentos de
onda a radiação captada pelo sensor é essencialmente radiação emitida pelo próprio
objecto. A radiação proveniente de um objecto na gama do visível e do infravermelho
próximo e médio e captada pelo sensor é essencialmente radiação reflectida pelo objecto.

2
A energia de um fotão depende do comprimento de onda da radiação segundo a relação

Q = hc / λ (J),

em que Q é energy em joules e h é a constante de Planck. Esta relação tem


consequências importantes em detecção remota. Como é necessária uma quantidade
mínima de energia para excitar o sensor, a captação de radiação de maior comprimento
de onda (menor energia) pode exigir uma maior resolução espacial ou uma mais longa
exposição. Por exemplo, a banda 6 (c.d.o. entre 10.4 e 12.5 µ m) do sensor TM do
satélite Landsat tem resolução espacial de 120 m embora as restantes bandas (de menor
c.d.o.) tenham resolução espacial de 30 m.

A energia incidente que atinge um objecto pode ser decomposta na soma da energia
reflectida, da energia absorvida e da energia transmitida, i.e.,

EI(λ )=ER(λ )+EA(λ )+ET(λ ).

Essa decomposição, como indicado na fórmula acima, depende do comprimento de


onda, i.e., a decomposição altera-se para diferentes comprimentos de onda. Por exemplo,
a componente reflectida pela clorofila na região do verde (0.5 a 0.6 µ m) é superior à
componente reflectida na região do vermelho (0.6 a 0.7 µ m). A decomposição da
energia incidente sobre um objecto é ilustrada na figura de [LK00, p.12].

Designa-se por reflectância a razão

ρ λ = ER(λ ) / EI(λ ),

que, obviamente, depende do comprimento de onda. Dado que a decomposição varia


com o comprimento de onda é possível associar a cada objecto uma assinatura espectral,
i.e., um padrão de reflectância dependendo do comprimento de onda da radiação
incidente sobre o objecto. A característica dos objectos que os sistemas de detecção
remota captam, com grau variável de detalhe ou rigor, é a assinatura espectral. Na figura
de [Jen00, Fig. 2-17] são mostradas as assinaturas espectrais, na gama de 0.4 a 0.9 µ m,
de alguns tipos de coberturas do solo. Na figura de [RJ99, p.3] são representadas as
assinaturas espectrais típicas de água, vegetação verde e solo, e as regiões do espectro
electromagnético captadas por alguns sensores de satélite.

A quantidade de energia, em cada região do espectro electromagnético, depende dos


factores acima referidos mas também de outras interacções da radiação com a atmosfera
e a superfície. Um dos aspectos importantes é a tipo de reflexão que pode ocorrer. Na
figura de [Jen00, p.45] são ilustrados quatro tipos de padrão de reflexão que podem
ocorrer e que afectam a quantidade de energia reflectida que é captada pelo sensor. A
atmosfera também tem um efeito fundamental na filtragem ou difusão da radiação. A
radiação que atinge o sensor tem consequentemente diferentes origens como ilustrado na
figura de [Jen00, p.50].

Algumas características de objectos naturais na superficie terrestre que afectam a


reflectância

3
• Vegetação. A clorofila absorve mais na região do azul e do vermelho (com picos de
absorção em aproximadamente 0.43-0.45 e 0.64-0.67 µ m) do que no verde (pico de
reflexão em 0.54 µ m aproximadamente) [cf. Jen00, p.338, Fig 10-3]. O stress
hídrico causa uma diminuição do teor de clorofila e um aumento de reflectância na
região do vermelho. A estrutura interna das folhas causa um pico de reflectância na
região do IV próximo (de 0.7 a 1.3 µ m) com valores próximos de 45 a 50%. A
reflectância aumenta nessa região do espectro com o número de camadas de folhas.
Na região do IV médio existem picos de absorção em 1.4, 1.9 e 2.7 µ m
aproximadamente, causados pela presença de água nas folhas. Para comprimentos de
onda superiores a 1.3 µ m o aumento do teor de água nas folhas provoca uma
diminuição de reflectância como ilustrado pela fugura de [Jen00, Fig.7-15, p.197]. A
reflectância de um coberto verde depende fortemente do índice de área foliar.
• Água. A existência de sedimentos na água provoca um aumento da reflectância.
• Solo descoberto. Em geral a rugosidade do solo causa um aumento de reflectância. O
aumento do teor de matéria orgânica está associado a uma diminuição da
reflectância.

Para ilustrar as implicações que as características atrás têm sobre as especificações de


um sistema de detecção remota veja-se a tabela de [Jen00, p.194, Tab. 7-2] que resume
as características que podem ser avaliadas através das diversas bandas do sensor TM do
satélite Landsat. Em [Jen00, p.343, Fig 10-6] são descritas as distribuições das
assinaturas espectrais no plano definido pela reflectância na região do vermelho e do IV
próximo para combinações de solo e vegetação e em função do teor de água, definindo-
se uma “linha de solo” que representa as assinaturas espectrais típicas de solo descoberto
para diversos teores de humidade.

Sistemas de detecção remota

Os sistemas de detecção remota podem ser passivos ou activos. Os sistemas passivos não
têm uma fonte artificial de radiação e detectam radiação electromagnética que é
reflectida ou emitida pelo objecto a analisar (exemplo: sensores de satélite para radiação
visível ou infravermelha). Os sistemas activos contém uma fonte de radiação que incide
sobre o objecto a analisar (exemplo: microondas de radar ou sonar).

Os sistemas de detecção remota podem captar informação em forma digital (exemplo:


câmeras digitais) ou analógica (exemplo: fotografia aérea). Em geral a conversão (com
eventual perda de informação) das imagens analógicas em imagens digitais é um
procedimento simples.

As principais características de um sistema de detecção remota para a superficie terrestre


são:
• Resolução espectral: número e características dos intervalos (bandas) de
comprimento de onda captadas pelo sensor. Uma imagem é pancromática se contém
apenas uma banda e é multiespectral se contém mais do que uma.
• Resolução espacial: comprimento do lado de uma parcela no terreno correspondente
a um pixel da imagem obtida pelo sistema. Note-se que uma maior resolução
corresponde a uma imagem com menor detalhe.

4
• Resolução temporal: intervalo de tempo entre duas imagens consecutivas da mesma
parcela de terreno.

Na tabela de [Jen00, p.13] são apresentadas as características acima para alguns dos mais
importantes sensores, instalados em satélites ou em outros suportes. Os dados mais
comummente utilizados em detecção remota de recursos naturais provêm do sensor
AVHRR do satélite NOAA (resolução espacial de 1.1 km), dos sensores TM e ETM
(este apenas lançado em 1999) do satélite Landsat (resolução espacial de 30 metros no
modo multiespectral e 15 metros no modo pancromático) e dos sensores HRV e HRVIR
(lançado em 1998) do satélite SPOT (resolução de 20 metros no modo multiespectral e
10 metros no modo pancromático). As bandas espectrais desses três sistemas podem ser
vistas na tabela adaptada de [Je96, Tab. 2-2, p.26]. Note-se que estão disponíveis
comercialmente imagens de satélite com resolução espacial de 1 metro (em modo
pancromático, i.e., referentes a uma única banda do espectro electromagnético). As
características de alguns desses sistemas com grandes potencialidades para algumas
áreas de aplicação da detecção remota estão descritos na tabela de [Jen00, p.226, Tab. 7-
12].

Para além das resoluções referidas acima, existem características técnicas que têm
grande influência na qualidade dos dados obtidos. Entre essas destaca-se o facto da
captação da radiação em cada linha de pixels da imagem ser feito por varrimento
(através da oscilação de um espelho) como no sensor TM ou por uma fila linear de
detectores CDD como no sensor HRV. Esta última técnica elimina algumas fontes de
erro radiométrico na imagem.

Pré-processamento de imagens

As imagens obtidas por detecção remota estão sugeitas a erros de vários tipos. O erro é a
diferença entre a assinatura espectral real do objecto e a assinatura espectral captada pelo
sensor. Na medida do possível, e em função do tipo de análise dos dados de detecção
remota a realizar, é conveniente reduzir os erros aplicando técnicas de correcção. Serão
em seguida indicadas algumas técnicas simples que podem ser usadas.

Correcções radiométricas

A correcção radiométrica de uma imagem não é uma prática corrente quando o objectivo
da análise dos dados de detecção remota é a produção de mapas. Esta correcção, que visa
a redução de erros e distorções introduzidos pelos sensores e pela atmosfera, só é
realizada quando é necessário converter o sinal que é captado pelo sensor em reflectância
da superfície para que os dados de imagem possam ser relacionados com medições no
terreno. O tipo de correcção radométrica mais frequentemente realizada, em áreas com
topografia acentuada, mesmo quando as imagens são utilizadas para a produção de
mapas, é a redução do efeito topográfico. Esta correcção é necessária para reduzir as
diferenças introduzidas pela topografia na quantidade de radiação solar que atinge o
objecto e afecta a quantidade de radiação reflectida e consequentemente a quantidade de
energia que é captada pelo sensor.

Em geral, de entre as diversas fontes de erro radiométrico destacam-se o efeito da


atmosfera sobre a radiação, o efeito do relevo e os erros instrumentais.

5
Efeito da atmosfera. A atmosfera terrestre absorve e tem um efeito de difusão sobre a
radiação. Na figura de [Jen96, p.50] são ilustrados os diferentes percursos possíveis para
a radiação entre o sol e o sensor. Distinguem-se efeitos da atmosfera em função da
dimensão das partículas da atmosfera que os causam e das bandas de c.d.o. que são
afectadas.

O efeito de difusão de Rayleigh é causado pelas moléculas com diâmetro inferior ao


c.d.o. e é inversamente proporcional à quarta potência do comprimento de onda. Por
exemplo, a difusão causada pela atmosfera na banda do verde (0.5 a 0.6µ m) é 4 vezes
superior à difusão no infravermelho médio (0.7 a 0.8 µ m). O efeito de difusão de Mie
ocorre para comprimentos de onda semelhentes ao diâmetro de partículas da atmosfera.
As partículas que o causam são essencialmente poeiras, vapor de água e outros aerossois.
Uma ilustração dos efeitos de Rayleigh e Mie na radiação transmitida pela atmosfera em
função do ângulo de incidência da luz e do c.d.o. é dada na figura de [Jen96, Fig. 6-2].

A transmissão da atmosfera varia com o comprimento de onda e depende dos


constituintes da atmosfera, como indicado na figura de [Jen96, Fig. 6-3].

Efeito topográfico. Cada objecto no terreno é iluminado em função da sua exposição à


luz solar. Numa imagem da superficie terrestre, o declive e a exposição de cada parcela
de terreno afectam de forma muito significativa o sinal que é captado pelo satélite. É por
esse motivo que o relevo da superficie é a característica mais evidente numa imagem de
satélite de uma região não plana. É igualmente devido a esse factor que as imagens
obtidas perto do equinócio de verão têm menor erro de origem topográfica.

Erros instrumentais. Estes erros podem ter causas diversas. Um factor de erro
importante é a transferência input-output de cada detector. A figura de [RJ99, p.43]
mostra desvios possíveis relativamente à função de transferência teórica para 6 bandas
de Landsat MSS. Esse tipo de ruído pode ser reduzido partindo do pressuposto que todos
os detectores para a mesma banda do espectro electromagnético tem sinais
estatisticamente semelhantes.

Correcções radiométricas. A correcção das imagens para os efeitos acima descritos


pode ser absoluta ou relativa. No primeiro caso, o objectivo é modelar matematicamente
os factores (atmosféricos, topográficos) que causam erros por forma a poder corrigir a
imagem. As correcções relativas não dependem das características da atmosfera na altura
de obtenção da imagem. Vamos aqui considerar um modelo simples para realizar uma
correcção relativa.

Designe-se por número digital (ND) o valor do pixel numa banda da imagem de satélite.
Em geral, ND toma valores entre 0 e 255 (um byte de informação por pixel e por
banda). Um modelo simples que relaciona o número digital e a reflectância para
um pixel e uma banda é

ND=a+b r
em que a e b são constantes.

A constante aditiva a modela essencialmente os efeitos de dispersão da radiação na


atmosfera (ver secção atrás sobre o efeito da atmosfera, em que é referido que os efeitos

6
são distintos para as várias zonas do espectro e, portanto, para as várias bandas do
satélite) e erros instrumentais do sensor (ver secção correspondente). A constante
multiplicativa b modela essencialmente a transmitância da atmosfera e a geometria de
iluminação (ver secção sobre o efeito da topografia).

Simplificando a relação entre números digitais e reflectância, pode considerar-se que o


valor de a depende da banda mas é independente do pixel da imagem, i.e., pode atribuir-
se o mesmo valor de a a todos os pixels na mesma banda (abanda(i)=abanda). Em
contrapartida, o valor de b difere em geral de pixel para pixel (devido à topografia) mas
pode considerar-se constante para as várias bandas (bbanda(i)=b(i)).

O valor de a é maior para a região do azul e decresce para regiões de maior comprimento
de onda do espectro. Uma técnica simples para estimar a é uma técnica designada por
“remoção do objecto escuro”. O valor de a na banda i pode ser estimado pelo valor
mínimo dos NDs na banda i, quando existe na imagem algum objecto escuro (de
reflectância aproximadamente nula). Tipicamente, considera-se como objecto escuro
uma superficie de água profunda (zona de costa, lago, barragem). As figuras [Jen96, Fig.
6-6 e Fig. 6-7] ilustram essa técnica. O correcção então aplicada à imagem consiste
simplesmente numa translação dos valores em cada banda (uma transformação yi=xi-
min, em que xi é o valor observado para o pixel i, min é mínimo dos valores observados
e yi é o valor corrigido) por forma a que pixels que correspondem a objectos de menor
reflectância tenham valor 0 na imagem.

Existem diversas técnicas para diminuir o ruído causado pela topografia. A mais simples
é a normalização topográfica baseada no modelo de Lambert (que pressupõe que a
reflecção da superfície é isotrópica). Esta correcção é dada pela expressão

Sc=S0 / cos i,

em que S0 é a radiância medida pelo sensor, i é o ângulo entre a direcção dos raios
solares e a normal à parcela de terreno correspondente ao pixel. Sc é o valor da radiância
corrigida.

A aplicação da fórmula acima provoca contudo uma sobrecorrecção de zonas muito


ensombradas da imagem. Em [CC97] conclui-se que esta correcção é desnecessária para
um problema particular de determinação de classes de ocupação do solo a partir de uma
imagem de verão numa região com um relevo acentuado.

Correcções geométricas

7
Quando o objectivo da análise de dados de detecção remota é a produção de mapas é
indispensável proceder à correcção geométrica das imagens. As distorções geométricas
das imagens podem dever-se a uma grande diversidade de factores. Entre eles destacam-
se os seguintes.

1. A rotação da terra de poente para nascente, combinada com a deslocação do satélite


aproximadamente na direcção Norte-Sul sobre a região correspondente a uma
imagem, durante a captação desta, provoca um desvio das posições dos pixels ao
longo da imagem.
2. A distorção panorâmica para sensores de varrimento (exemplo: sensor do Landsat)
provoca uma alteração da dimensão e forma das parcelas de terreno que
correspondem aos pixels da imagem.
3. A curvatura da terra pode afectar a geometria de imagens de sensores como o
NOAA/AVHRR. Nesse caso, enquanto a distorção linear nas margens da imagens
seria da ordem de 2.89 supondo que a superficie terrestre fosse plana, essa distorção
atinge um valor próximo de 5 tendo em consideração a curvatura da terra.
4. O varrimento da cena combinado com o movimento da plataforma provoca um
desvio da posição dos pixels no sentido do movimento da plataforma. Este efeito
atinge 213m para cada linha da imagem para o sensor Landsat MSS.
5. As variações na altitude, velocidade e posição da plataforma podem causar
distorções acentuadas, especialmente se as imagens são obtidas por avião.
6. A sobreposição de linhas da imagem pode causar uma distorção da razão entre a
escala horizontal e vertical da imagem.
7. Erros instrumentais.

Em [FF04, p.65, Quadro 6] são ilustradas algumas dessas fontes de erro e indicado para
que tipo de sensores (de varrimento, como no Landsat TM, ou em arranjo linear, como
no SPOT HRV) os erros são mais significativos.

As técnicas usadas para reduzir distorções geométricas são essencialmente de dois tipos
que se descrevem abaixo.

1. Modelar os factores de distorção e deduzir as correcções a efectuar (ver [RJ99, p.64]).

2. Transformações polinomiais e pontos de controle. Este processo consiste em criar uma


nova imagem, num sistema de referência escolhido, e “projectar” a imagem original
sobre esse sistema de referência [cf. RJ99, p.58, Fig 2.13]. Para estabelecer a
transformação é necessário identificar na imagem a corrigir um conjunto de pontos de
controle e identificar as coordenadas originais e as coordenadas no sistema de referência.
Os pontos de controle são usualmente objectos que podem ser facilmente identificados
na imagem de satélite tais como intersecções de estradas, pontos extremos em zonas de
água, edifícios brilhantes, ou outros.

Note-se que, em geral, e mesmo quando não há distorção geométrica, esta técnica pode
ser usada em geral para transformar o sistema de coordenadas de uma imagem para o
sistema de coordenadas de outra imagem, por exemplo, determinar as coordenadas UTM
de um mapa que tenha um sistema de coordenadas local.

Considere-se então que cada ponto de controle tem coordenadas (ui,vi) na imagem
original e (xi,yi) na imagem correctamente referenciada. Pretende-se determinar uma

8
transformação u=f(x,y) e v=g(x,y) que minimize a soma dos quadrados dos resíduos nas
direcções dos eixos coordenados na imagem original ui-f(xi,yi) e vi-g(xi,yi) para o
conjunto de pontos de controle.

Uma escolha importante é a das funções f e g. Em geral escolhem-se polinómios lineares


(3 parâmetros a estimar), quadráticos (6 parâmetros) ou cúbicos (10 parâmetros).

Esta técnica é usualmente aplicada por um procedimento iterativo:

1. Escolher n pontos de controle na imagem original e na imagem (ou mapa)


correctamente georeferenciada.
2. Estimar os coeficientes dos polinómios por um método de mínimos quadrados.
3. Calcular os desvios |ui-f(xi,yi)| e |vi-g(xi,yi)|. Se o desvio padrão médio (indicado por
vezes por RMS) fôr inferior a um valor considerado aceitável então ir para 4. Senão,
e se a amostra tiver um número de pontos suficiente, eliminar ou corrigir pontos de
controle da amostra com um desvio elevado, e voltar a 2.
4. Para cada pixel de coordenadas (x,y) da nova imagem (no sistema de referência
escolhido), calcular as coordenadas transformadas (u,v)=(f(x,y),g(x,y)) e associar ao
pixel respectivo o valor do pixel de coordenadas (u,v) na imagem original. Como em
geral não existe uma concordância perfeita entre (u,v) e o centro do pixel na imagem
original, é atribuido ao pixel (x,y) um valor segundo o critério do vizinho mais
próximo ou um critério de interpolação. No primeiro caso, que é seguido quando a
imagem a rectificar é temática (valores qualitativos para os pixels), o valor do pixel
da imagem original com coordenadas mais próximas de (u,v). No segundo caso, que
corresponde à escolha típica para imagens de satélite, uma combinação dos valores
dos pixels com coordenadas mais proximas de (u,v). [ver Chu00, Fig 6.27].

Considera-se que a correcção é aceitável se o desvio padrão dos pontos de controle fôr
inferior a metade do lado da parcela de terreno correspondente a um pixel da imagem ou,
num critério mais relaxado, inferior ao valor do lado. Uma boa distribuição dos pontos
de controle na imagem é essencial para obter bons resultados.

Análise de dados

Os dados obtidos por detecção remota, após pré-processamento, podem ser


representados numa matriz de dados, em que cada linha corresponde a uma banda e cada
coluna a um pixel da imagem. Mais precisamente, denota-se por xij o valor da i-ésima
banda do sensor para o j-ésimo pixel. Se a imagem tem r linhas e s colunas, então a
imagem tem m=rs pixels.

Para um sensor com n bandas, a matriz de dados é portanto uma matriz com n linhas e m
colunas. A j-ésima coluna da matriz é um vector com n componentes denotado por x j ,
e designa-se por vector de observações (ou assinatura espectral) do j-ésimo pixel.

Considere-se um subconjunto S de ms colunas da matriz de dados e denote-se essa matriz


por A. Para esse subconjunto de colunas define-se:

• o vector média, representado por x , é um vector com n componentes

x =( x1 ,..., xn )

9
em que, para i =1,..., n ,

xi = ∑ j∈S xij / m s .

Assim, x j − x é o desvio entre a assinatura do j-ésimo pixel e a média x das


assinaturas em A, e

• a matriz de variância-covariância

1
Σx =
m s −1
∑j∈S ( x j − x )( x j − x ) T

uma matriz com n linhas e n colunas. Cada entrada vut da matriz Σx é a covariância
entre a u-ésima banda e a t-ésima banda. As entradas da diagonal principal vuu são as
variâncias das bandas. Se se dividir cada entrada vut por vuu vtt obtem-se uma matriz
R chamada matriz de correlação para a qual cada entrada rut é o coeficiente de
correlação entre a u-ésima banda e a t-ésima banda.

As matrizes Σx e R são matrizes simétricas (B é simétrica se B=BT, em que BT é a


transposta de B). Podemos então escrever para Σx (para R a decomposição é análoga) :

P T Σx P = D ,

sendo P uma matriz de vectores próprios P=[v1...vn] de Σx , ortonormais (i.e. PPT=I, a


matriz identidade), e D uma matriz diagonal cujas entradas não nulas são os valores
próprios l1,...,ln associados aos vectores próprios v1...vn . (Vamos supôr, no que se segue,
que os valores próprios estão ordenados por ordem decrescente, i.e., l1>...>ln).

Podemos realizar uma transformação linear dos dados num novo conjunto de eixos
(eixos principais) tal que as correlações nesse novo referencial sejam nulas. Seja G uma
matriz n por n tal e y=Gx a transformação de um vector x no referencial original (valores
nas bandas do sensor por exemplo). Pretendemos escolher G tal que a matriz Σy de
variância-covariância dos y’s seja diagonal (covariâncias nulas). Como

Σ y = E (( Gx − Gx )( Gx − Gx ) T ) = GE (( x − x )( x − x ) T )G T = GΣx G T

(em que E representa o operador valor médio), então escolhendo G=PT asseguramos que
Σ y seja diagonal.

Prova-se igualmente que v1 (o vector próprio de Σx associado ao maior valor próprio) é


o vector, entre todos os vectores v de norma 1, que maximiza a variância de Av (A é a
matriz de dados original) isto é, define a direcção segundo a qual a projecção dos dados
originais tem maior variância. A variância de Av1 é justamente o maior valor próprio de
Σx . Da mesma forma, v2 é a direcção (entre as direcções ortogonais a v1) que maximiza
a variância, e assim sucessivamente para os restantes vectores próprios de Σx .

Numa matriz simétrica, a soma dos elementos da diagonal principal é igual à soma dos
valores próprios da matriz. No contexto da análise de dados em detecção remota, isto

10
significa que a soma das variâncias das bandas (elementos da diagonal principal de Σx )
é a soma dos valores próprios de Σx . Dado que cada valor próprio de Σx é a variância
dos dados segundo a direcção do vector próprio associado, então considera-se que a
proporção da variabilidade total dos dados explicada pelos k primeiros eixos principais é
soma dos k primeiros valores próprios sobre a soma das variâncias.

Classificação assistida

Em geral, considera-se que o processamento de dados de detecção remota pode dar


origem a dois tipos diferentes de produtos: cartas temáticas e informação quantitativa
sobre a área de estudo. Cartas temáticas são cartas em que a superfície do terreno é
classificada num número relativamente reduzido de classes. Exemplo de cartas temáticas
são as cartas de ocupação do solo, as cartas de ocorrência de incêndios, as cartas de solos
ou as cartas geológicas. Em certos casos a produção de cartas temáticas pode ser feita de
forma automática usando imagens de satélite e informação sobre as assinaturas
espectrais das classes. Essa informação complementar consiste numa amostra de pixels
de classe conhecida, obtida usualmente por fotointerpretação de zonas da imagem.

Nesta secção irá ser definida a terminologia necessária para tratar de um problema de
classificação assistida, i.e., um problema de classificação em que as classes estão
definidas à partida e em que existe uma amostra de pixels para cada classe. Irão ser
descritos alguns grupos de técnicas de classificação. Apenas serão referidas algumas
abordagens estatísticas, paramétricas e não paramétricas. Não será feita referência a
outras técnicas importantes tais como as redes neuronais ou as árvores de classificação.

Hipótese do “pixel puro”. É vulgar postular-se que cada pixel de uma imagem pode ser
associado a uma única classe. Esta hipótese não é satisfeita na totalidade da
imagem, mas permite simplificar a resolução do problema de classificar
automaticamente uma imagem.

Num problema de classificação dispõe-se de


1. assinaturas espectrais dos pixels (imagem de satélite) e, eventualmente, outro tipo de
informação (dados auxiliares),
2. conjunto de k classes prédefinidas,
3. subconjunto de pixels para os quais é conhecida a classe a que pertencem no terreno
(amostra de treino),
e pretende-se afectar cada pixel da imagem a uma das classes por forma a minimizar um
certo critério de erro dependente da amostra.

O conjunto das classes consideradas (por exemplo, classes de ocupação do solo) é um


conjunto finito geralmente com um número relativamente pequeno de elementos. O
conjunto dos objectos a classificar é o conjunto das parcelas de terreno correspondentes
a cada um dos pixels. A matriz A é o conjunto das observações, ou seja, as
características observadas para cada um dos objectos como, por exemplo, as assinaturas
espectrais.

A escolha da amostra é a parte mais sensível do problema de classificação. Por um lado


é necessário que a amostra tenha uma dimensão e uma composição adequada para conter
a informação relevante para a resolução do problema. Por outro lado, a recolha da
informação da amostra é o aspecto de maior custo na resolução do problema. De facto, a

11
recolha de informação da amostra faz-se tipicamente por trabalho no terreno ou por
fotointerpretação.

É usual distinguir na amostra o subconjunto utilizado para definir a regra de afectação de


novos objectos às classes - amostra de treino - do subconjunto utilizado para avaliar a
precisão dessa regra - amostra de teste (ver secção sobre avaliação da precisão).
Designa-se-á por subamostra cada subconjunto da amostra constituido por pixels que
pertencem a uma determinada classe.

A resolução do problema de classificação consiste em definir uma partição do espaço de


representação dos objectos (o espaço das bandas, para imagens de satélite) e afectar cada
um dos elementos dessa partição a uma das classes prédefinidas. Cada elemento da
partição designa-se por região de decisão. As regiões de decisão são delimitadas por
superficies que são designadas fronteiras de decisão. A afectação das regiões de decisão
às classes é definida pela regra de decisão. As regras de decisão, no âmbito da
classificação, designam-se também por classificadores.

Abordagem estatística

Métodos paramétricos. A abordagem estatística convencional para a resolução de


problemas de classificação é suportada por técnicas de análise estatística multivariada,
devido ao facto de os objectos a classificar terem geralmente mais do que uma
característica, e pode ser definida pelos dois seguintes aspectos. Por um lado, os objectos
n
a classificar são representados por vectores de R , x = ( x1 ,..., xn ) , sendo xi o valor que
toma a variável aleatória Xi para o objecto considerado. Por outro lado, assume-se que
existe uma distribuição de probabilidade p( x / ci ) do vector aleatório
X = ( X 1 ,..., X n ) , para cada classe ci . As k classes definidas à partida são aqui
denotadas por c1 ,..., ck .

Uma das principais regras de decisão é a regra de erro mínimo de Bayes que define as
regiões de decisão da seguinte forma:

SE P(ci / x ) ≥ P(c j / x ), ∀j ≠ i ENTÃO classe ( x ) = ci .


sendo P(ci/x) a probabilidade de um objecto – descrito pelo vector de observações x –
pertencer à classe ci. Como se pode verificar a regra baseia-se no conhecimento de
probabilidades das classes condicionadas pela informação existente sobre o objecto.
Uma regra equivalente mas mais conveniente do ponto de vista operacional, por
depender de p( x / ci ) – distribuição de probabilidade dos vectores de observações na
classe ci – é obtida se se usar a relação:
P ( x / ci ). P (ci )
P ( ci / x) = .
P ( x)

Note-se que, nesse caso, a regra de decisão depende também de P( ci ) , isto é, da


probabilidade a priori da classe. Dado que a probabilidade P ( x ) de ocorrer um
determinado vector de observações é independente da classe, a equação acima mostra
que, para cada pixel, a probabilidade a posteriori de pertença a uma classe P (ci / x ) é
proporcional ao produto de P( x / ci ) com a probabilidade a priori de pertença à classe
P ( ci ) . As probabilidades a priori podem ser estimadas pela proporções de pixels da
imagem que pertencem a cada classe numa amostra aleatória. A distribuição de

12
probabibilidade p( x / ci ) é parametrizada e os seus parâmetros são estimados a partir da
amostra (ver abaixo).

A regra do erro mínimo de Bayes pode ser reescrita como

SE qi ( x ) ≥ q j ( x ), ∀j ≠ i ENTÃO classe ( x ) = ci ,

considerando que cada membro da desigualdade é uma determinada função – designada


discriminante – do vector de observações. Assim pode dizer-se, por exemplo, que a
função discriminante é linear (ou quadrática) se q é uma função linear (ou quadrática) de
x.
As diferentes possibilidades atrás referidas conduzem a regras de decisão óptimas para
um risco mínimo de erro de classificação, na hipótese de uma determinada distribuição
teórica p( x / ci ) .

Neste contexto, a distribuição paramétrica mais estudada é a distribuição normal. As


principais razões são: a) a normalidade é um bom modelo para muitos fenómenos
naturais, o que se pode justificar pelo teorema do limite central; b) a distribuição normal
multivariada é definida unicamente pelo vector média e pela matriz de variância-
covariância; c) a normalidade não é afectada por uma transformação não singular das
variáveis; e d) para uma determinada média e variância, a distribuição normal é a que
maximiza a entropia.

A distribuição normal multivariada tem função densidade de probabilidade

p( x / ci ) = (2π )− n / 2 | Σ i |− 1 / 2 e x p−{ 12 ( x − xi )T Σ i− 1 ( x − xi )},


em que Σi é a matriz de variância-covariância da classe ci , | Σi | é o seu
determinante e Σi−1 é sua inversa.

As funções discriminantes lineares e quadráticas podem ser construidas directamente a


partir das médias e das matrizes de variância-covariância das classes. Se as variáveis
tiverem distribuições normais para p( x / ci ) , mostra-se que, se as várias classes tiverem a
mesma matriz de variância-covariância, o classificador óptimo é uma função
discriminante linear. Para matrizes de variância-covariância distintas, o classificador
óptimo é uma função discriminante quadrática.

Como os parâmetros do modelo (médias e matrizes de variância-covariância) são


desconhecidos é necessário estimá-los a partir da amostra. Os estimadores mais
correntemente utilizados para o vector média e para a matriz de variância-covariância
são os estimadores de máxima verosimilhança. Aliás, é por essa razão que a função
discriminante quadrática – um classificador de uso generalizado em processamento de
imagens – é muitas vezes designado por “método da máxima verosimilhança” . Este
classificador corresponde ao módulo MAXLIKE no “software” IDRISI32.

Na figura abaixo representam-se as regiões de decisão obtidas para uma amostra de sete
classes de ocupação do solo no plano dos dois primeiros eixos discriminantes (os eixos
discriminantes são combinações lineares das bandas) de uma imagem Landsat TM de
Junho de 1996 para o Concelho de Castanheira de Pêra, retirada de [CC97, p.28].

13
resinosas
6 arbustivo
4 4 6
7 76 descoberto
6 6 6
563 6 6
18

5 4 3 6 4 7
4 65 466
43 5 6 6 4
54343 33 45 6 6 6 4
5 3 5 5 3
6 6
3 3 5 4 2 6 7 7
4 46
4 5 3 43 72 7
6 5
5 2 56 63 7 7 7
1 7 7 77
5
4 3
4536
17

m isto 3 1
3 7
5 3 6 7 1 1
1

4 7
5 5 7 7
3 5 1 1 5
2 5 462 2 1 1
folho sas 4 5 1 77
4 1
3 1
16

2 2 1
1
2
2 1 2
52 3 1
2 1 1
2 2 2 1 1
2 2
3 2
15

2 1 1
2 1 2
2 2
2

2
14

agricultura urbano

2
13

5 6 7 8 9 10 11

Fig. 1 - Regiões de decisão produzidas pela função discriminante quadrática para os dados de uma
amostra no plano dos dois primeiros eixos discriminantes. Na figura são indicadas as médias das classes
(+) e os elementos da amostra (1-urbano, 2-agricultura, 3-folhosas, 4-resinosas, 5-foresta mista, 6-
arbustivo, 7- descoberto). Os 7 tons de cinzento correspondem às 7 classes.

Dimensão das amostras. Para que as estimativas dos parâmetros sejam fiáveis é
necessário que as amostras tenham uma dimensão suficiente e um delineamento
amostral adequado, aspectos que não são aqui analisados. Regras empíricas referidas na
bibliografia de classificação de imagens de satélite recomendam 10n, 30n, ou 100n,
pixels em cada classe, em que n é o número de bandas.

Em [CC97] é feita uma comparação dos valores de precisão obtidos para vários
esquemas de amostragem para dados Landsat, numa zona predominantemente florestal
do centro de Portugal.

Métodos não paramétricos. São também usados para classificação de imagens métodos
estatísticos não paramétricos, em alternativa à suposição de uma determinada
distribuição teórica para p( x / ci ) .
O método dos k-vizinhos mais próximos é um método não paramétrico também baseado
na regra de erro mínimo de Bayes. Este método é utilizado em classificação de imagens
de satélite com muito bons resultados embora tenha o inconveniente de ser pesado
computacionalmente pois o tamanho da regra de decisão cresce com a dimensão da
amostra. Através deste método são estimadas directamente as probabilidades P (ci / x)
para cada indivíduo x por cálculo da proporção de indivíduos da amostra de treino, de

14
entre os k individuos mais próximos no espaço das variáveis, que pertencem a cada uma
das classes consideradas. Considere-se o subconjunto da amostra constituido pelos k
indivíduos mais próximos, para uma dada medida de distância em R n , de um dado
vector x . Formalmente, a probabilidade P (ci / x) é estimada pela proporção de
indivíduos da classe ci nesse subconjunto.

Um novo indivíduo x , de classe desconhecida, é afectado à classe para a qual essa


proporção é mais elevada. Para classificar uma imagem é necessário aplicar esse
procedimento a todos os pixels de imagem. No entanto, para estimar a precisão desse
método é suficiente considerar uma amostra de teste.

Na figura 2 representam-se as regiões de decisão pelo método dos k-vizinhos mais


próximos (k=3) obtidas para os dados da figura 1. A figura 2 é também retirada de
[CC97, p.31]

Note-se a desagregação das regiões de decisão na figura 2. De facto, dado que a


estimativa da probabilidade P (ci / x) depende dos elementos da amostra que são
vizinhos de x , não há garantia de conexidade das regiões de decisão.

re sinosas 6 arbustivo
4 4 6
7 76
6 6 6
563 6 6
18

5
4 65
4 3 6 4 7 descoberto
466 6 4
folh 43 5 6
54343 33 45 6 6 6 4
5 3 5 5 3
6 6
3 3 5 4 2 6 7 7
4 46
4 5 3 43 72 7
6 5
5 2 56 63 7 7 7
7
1 5
7 7 7
4 4536 3
17

m isto 3 1
7
5 3 3 6 7 1 1
1

4 7
5 5 7 7
3 5 1 1 5
2 5 462 2 1 1
4 5 1 77
4 1
3 1
16

2 2 1
2 1
2 1 2
52 3 1
2 1 1
2 2 2 1 1
2 2
3 2
15

2 1 1
2 1 2
2 2
2

2
14

agricultura urbano

2
13

5 6 7 8 9 10 11

Fig. 2 - Regiões de decisão produzidas pelo método dos k-vizinhos mais próximos (k=3) no plano dos dois
primeiros eixos discriminantes. Na figura são indicadas as médias das classes (+) e os elementos da
amostra amostra (1-urbano, 2-agricultura, 3-folhosas, 4-resinosas, 5-foresta mista, 6-arbustivo, 7-
descoberto). Os 7 tons de cinzento correspondem às 7 classes.

15
Uma simplicação sensível do método dos k-vizinhos mais próximos consiste em
substituir os elementos da amostra pelas médias das subamostras (uma média por cada
classe). Com essa simplificação, que visa reduzir o custo computacional do método, e
considerando k =1 , tem-se o método da distância à média mais próxima (minimum
distance to means). Este método simples corresponde ao módulo MINDIST no
IDRISI32 e produz regiões de decisão conexas.

A regra de decisão do método da distância à média mais próxima é a seguinte (em que
mi representa a média amostral da classe i)

Se dist(x,mi)< dist(x,mj) para todo o j≠ i então o pixel x é afecto à classe i.

Duas medidas de distância são em geral consideradas: a distância euclideana definida


x k − mki
∑ ∑
n n
por ( x k − m ki ) 2 e a distância estandardizada k =1
( ) 2 em que s ki é o
k =1 i
s k

desvio padrão amostral para a banda k da classe i. Neste último caso, a região de decisão
é alargada para classes com maior dispersão.

Avaliação da precisão

Uma das formas mais simples e completa de apreciar os resultados de um classificador é


através da designada matriz de erro. Essa representação é adequada quando se considera
um número baixo ou moderado de classes.

A matriz de erro (ou tabela de contigência) é uma tabela de dupla entrada na qual as
colunas representam a realidade (as classes a que efectivamente pertencem as
observações amostrais) e as linhas as classes previstas pelo classificador (ver tabela 1).
Cada célula do interior da tabela contém um valor nij, igual ao número de observações da
classe j classificadas pelo classificador na classe i. As observações da diagonal principal
(nii) são portanto as observações correctamente classificadas. Para além desses valores
absolutos podem representar-se nas margens da matriz os valores de precisão relativos
para cada classe e a precisão global do classificador para a amostra na célula inferior
direita.

classes no terreno
... j ... precisão do
utilizador
classes ... ... ... ... ...
previstas pelo i ... nij ... nii/ni*
classificador ... ... ... ... ...
precisão do ... njj/n*j ... Precisão global
produtor ∑nii/n

Tabela 1 - Matriz de erro para um classificador e uma amostra.

Existem dois valores de precisão para cada cada classe. O valor de precisão na carta –
também designada por precisão do utilizador – (nii/ni*) é o quociente entre o número de
pixels da classe i que estão bem classificados e o número total de pixels da classe i na
carta. O valor de precisão do classificador – também designada precisão do produtor –
(njj/n*j) é o quociente entre o número de pixels da classe i que estão bem classificados e o

16
número total de pixels da classe i na carta. Por exemplo, se uma classe tiver precisão do
utilizador de 40% e precisão do produtor de 80%, então isso significa que na carta obtida
com base nesse classificador estima-se que (1) apenas 40% dos pixels da classe indicada
na carta pertencem efectivamente a essa classe e que (2) 80% dos pixels dessa classe no
terreno são correctamente representados na carta.

Uma questão fundamental na apreciação dos valores da matriz de erro é a relação


existente entre as observações que são usadas para treinar o classificador (e que
constituem a amostra de treino) e as observações usadas para construir a matriz de
confusão e avaliar a precisão do classificador (amostra de teste). Se ambas as amostras
estiverem correlacionadas então os valores de precisão serão sobre-estimados. A situação
extrema é aquela em que se usa mesma amostra para construir o classificador e a matriz
de erro. A estimativa de precisão obtida nesse caso designa-se precisão aparente e pode
atingir valores muito superiores ao verdadeiro valor de precisão do classificador para os
dados analisados.

A validação cruzada é um método de estimação da matriz de erro, e consequentemente


dos valores de precisão obtidos a partir da matriz. Este método consiste em particionar
aleatoriamente a amostra em N subconjuntos de observações com dimensões
semelhantes. Assim obtêm-se N amostras de treino (constituidas por, aproximadamente,
(N-1)/N das observações da amostra) e as correspondentes N amostras de teste que
contêm, em cada caso, as restantes observações. Deste modo, cada uma das N matrizes
de erro obtidas contém estimativas dos valores de precisão. Para obter medidas médias
de precisão calcula-se a média para cada célula da matriz de erro (obtendo assim uma
matriz de erro média) e usam-se esses valores para calcular as margens da matriz média.
É comum considerar N=10.

Para amostras aleatórias, a validação cruzada produz estimativas centradas de precisão


(i.e., cujo valor médio é o valor real da precisão) e, embora tenha uma variabilidade
superior a de outros métodos de avaliação da precisão, é recomendada para amostras de
dimensão média em problemas de classificação.

Como referido acima, é conveniente assegurar uma baixa correlação entre amostras de
treino e de teste. Em processamento de imagem a existência de correlações entre os
valores das observações é uma consequência directa da proximidade espacial dos pixels.
Por tal razão não se deve considerar pixels de um mesmo polígono amostral nas duas
amostras. Em [CC97] observa-se para um exemplo concreto de classificação de imagens
de satélite que se se particionar aleatoriamente uma amostra em treino e teste sem ter o
cuidado de usar os pixels de um mesmo polígono para uma finalidade ou,
alternativamente, para a outra, os resultados de precisão podem ser sobre-estimados em
20 a 30%.

Transformações de dados e extracção de informação quantitativa

Transformações (lineares ou não lineares) de dados de detecção remota (valores das


bandas) podem ser usados para obter informação quantitativa sobre certas características
do terreno. Dois tipos de transformações serão consideradas: 1) índices de vegetação
(transformação não linear), para obter informação sobre quantidade de matéria verde
existente no terreno; 2) análise em componentes principais, para obter combinações
lineares das bandas originais que estão, de alguma forma, relacionados com algumas

17
características físicas ou biológicas do terreno. Como se verá, a utilização de índices de
vegetação permite atenuar o efeito da topografia. A análise em componentes principais
permite reduzir a dimensionalidade dos dados sem perder muita informação. A redução
da dimensionalidade pode ser de facto significativa em dados de detecção remota dado
que as diferentes bandas do sensor podem estar fortemente correlacionadas.

Índices de vegetação. Como referido anteriormente (ver, p.ex., [Jen99, Fig 2-17]) a
vegetação verde tem um padrão típico de reflectância na região do vermelho e
infravermelho próximo. Os índices de vegetação são funções dos valores das bandas
nessas regiões do espectro electro-magnético.

Denote-se por NDv(i) e por NDivp(i) os números digitais do pixel i nas bandas
correspondentes ao vermelho e ao infravermelho próximo (bandas 2 e 3 para o
sensor XS do satélite SPOT, bandas 3 e 4 para o sensor TM do satélite Landsat,
etc).

Em geral, um índice de vegetação toma um valor mais elevado quando a razão


NDivp(i)/NDv(i) é maior. Existem muitos índices de vegetação (ver p.ex. [Chu00]).
A razão NDivp/NDv é um exemplo. Um índice muito usado é o normalized
difference vegetation index

NDVI=( NDivp - NDv)/ ( NDivp + NDv).

Como o nome indica, este índice é normalizado e toma valores entre –1 e 1. Por
exemplo, alguns autores sugerem que um coberto vegetal corresponde a NDVI>0.1 e que
vegetação densa corresponde a NDVI>0.5 [Chu00].

Em rigor, os índices de vegetação deveriam ser calculados sobre os valores de


reflectância da superfície e não sobre os NDs. Denote-se por rv(i) e rivp(i) os
valores de reflectância do pixel i (a reflectância toma valores entre 0 e 1) nas
bandas do vermelho e do infravermelho próximo.

Uma das razões pelos quais os índices de vegetação são utilizados é a atenuação do
efeito do relevo. De facto, o relevo é a característica da superfície que é mais evidente
numa imagem, devido à geometria de iluminação. Como visto na secção sobre o efeito
do relevo existem técnicas para atenuar esse efeito. Isso pode ser feito usando um
modelo linear ND=a+br , em que b modela essencialmente o efeito do relevo. No
entanto, a aplicação dessa técnica requere o conhecimento da topografia (requer que
esteja disponível um modelo digital do terreno). O cálculo de quocientes de bandas
(como os índices de vegetação) permite a atenuação do efeito do relevo na imagem sem
necessidade de conhecer a topografia. Pelo foi dito atrás sobre as constantes a e b, e
escrevendo

NDbanda’(i)=NDbanda(i)-a(i)

para representar os NDs corrigidos para o efeito da dispersão da radiação na atmosfera


para o pixel i, vem:

18
'
ND ivp (i ) − ND v' (i ) bivp (i )rivp (i ) − bv (i )rv (i ) b(i )rivp (i ) − b(i ) rv (i ) rivp (i ) − rv (i )
= = =
ND '
ivp (i ) + ND (i )
'
v bivp (i )rivp (i ) + bv (i )rv (i ) b(i )rivp (i ) + b(i ) rv (i ) rivp (i ) + rv (i )

supondo que b é independente do comprimento de onda (ver secção sobre correcções


radiométricas). Assim, verifica-se que o valor do índice NDVI calculado sobre os valores
de ND’ é igual ao que seria obtido para os verdadeiros (desconhecidos) valores de
reflectância. Na prática, usam-se frequentemente os valores originais de ND e não de
ND’ dado que na região do vermelho e, sobretudo, do infravermelho próximo, os valores
da constante a são tipicamente baixos (ver [Jen96, Fig 6.6 e 6.7]).

Análise em componentes principais. Como referido na secção sobre análise de dados, a


primeira componente principal de uma matriz de dados é a direcção segundo a qual a
dispersão das observações é máxima. A segunda componente principal é uma direcção
normal à primeira que satisfaz o mesmo critério. Procede-se da mesma forma até
determinar a n-ésima componente principal, quando as observações pertencem a um
espaço de dimensão n.

Computacionalmente, este procedimento é simples pois as componentes principais


correspondem aos vectores próprios da matriz Σ de variância-covariância dos dados
(ver secção sobre análise de dados). Foi igualmente referido atrás que as primeiras m
componentes principais explicam uma certa proporção da variabilidade total dos dados
(que é medida como a proporção da soma das variâncias das variáveis originais,
representadas na diagonal principal de Σ ). Essa proporção é dada pela soma dos m
primeiros valores próprios de Σ sobre a soma dos elementos da diagonal principal de
Σ .

No software IDRISI32, o resultado produzido pela análise em componentes principais


(comando PCA) de uma imagem SPOT (3 bandas: xs1, xs2, e xs3), sobre os dados não
estandardizados, é algo como:

1a parte) matriz de variância-covariância e correspondente matriz de correlações:


VAR/COVAR xs1 xs2 xs3

xs1 568.45 604.43 139.18


xs2 604.43 689.10 161.27
xs3 139.18 161.27 465.79

COR MATRX xs1 xs2 xs3

xs1 1.000000 0.965725 0.270483


xs2 0.965725 1.000000 0.284650
xs3 0.270483 0.284650 1.000000

Note-se neste exemplo que a primeira e a segunda banda estão fortemente


correlacionadas.

2a parte) percentagem de variância explicada por cada componente principal, valores


próprios de Σ , e coeficientes das bandas originais nas componentes principais :
COMPONENT C 1 C 2 C 3

% var. 74.92 23.84 1.24


eigenval. 1291.16 410.90 21.29

19
eigvec.1 0.649060 -0.175795 0.740147
eigvec.2 0.718539 -0.177869 -0.672357
eigvec.3 0.249846 0.968225 0.010868

Os vectores próprios correspondem às colunas da matriz acima. Como mencionado na


secção de análise de dados, os valores próprios 1291.16, 410.90 e 21.29 são as variâncias
dos dados na direcção dos vectores próprios respectivos. As proporções da variabilidade
explicada por cada componente (.7492, .2384 e .0124 no exemplo acima) são portanto
calculadas como a razão entre cada valor próprio e a soma dos valores próprios. No
exemplo acima, as duas primeiras componentes principais explicam quase 99% da
variabilidade total dos dados. Em geral, em processamento de imagens de satélite, a(s)
última(s) componentes principais correspondem ao que se designa habitualmente por
“ruído” na imagem, e que correspondente à componente do sinal captado pelo sensor que
não está directamente relacionado com a ocupação do solo.

Os coeficientes dos vectores próprios são por isso usados com alguma frequência para
interpretar o “significado” físico ou biológico de cada componente. Por exemplo, no
exemplo acima, a 1a componente (C 1) depende mais das primeiras duas bandas
(coeficientes .649 e .718) do que da terceira (coeficiente .249). Assim, essa componente
pode ser interpretada como sobretudo relacionada com os valores nas bandas do verde e
vermelho, e portanto com o “brilho” da imagem na região do visível. A 2a componente
(C 2) tem coeficientes baixos (e com valor negativo) nas duas primeiras bandas e um
coeficiente bastante mais elevado (.968) na banda 3 (infravermelho próximo). Assim, a
2a componente poderá estar sobretudo relacionada com a quantidade de vegetação verde.
A 3a componente corresponderá ao “ruído” na imagem. A interpretação acima para a
primeira e segunda componentes em imagens de detecção remota não pode ser
generalizada mas é frequente em imagens em que existe uma quantidade razoável de
vegetação (ver [Chu00]).

Note-se que a interpretação atrás descrita de cada componente principal pode conduzir a
erros diversos. Um dos problemas mais comuns da análise em componentes principais
realizada sobre a matriz de variância-covariância é a dependência dos resultados da
escala das variáveis originais. No caso da análise de dados de satélite isso não constitui
em geral um problema pois todas as variáveis tomam valores em intervalos idênticos
(por exemplo, números digitais entre 0 e 255) e são medidas nas mesmas unidades. Caso
outras variáveis sejam usadas é preferível realizar a análise em componentes principais
sobre a matriz de correlação.

20