Comparação Da Exatidão de Métodos de Classificação Supervisionada e Não Supervisionada A Partir Do Índice Kappa Na Microbacia Do Ribeirão Duas Águas em Botucatu-SP PDF
Comparação da exatidão de métodos de classificação supervisionada e não supervisionada a partir do índice kappa na microbacia do Ribeirão Duas Águas em Botucatu-SP.pdf
Comparação Da Exatidão de Métodos de Classificação Supervisionada e Não Supervisionada A Partir Do Índice Kappa Na Microbacia Do Ribeirão Duas Águas em Botucatu-SP PDF
Comparao da exatido de mtodos de classificao supervisionada e no
supervisionada a partir do ndice kappa na microbacia do Ribeiro Duas guas em
Botucatu/SP
Danilo Fvero Tangerino Rodrigo Tommasello Loureno
Universidade Estadual Paulista UNESP/FCA Campus de Botucatu Rua Jos Barbosa de Barros, n 1780 Fazenda Lageado 18610-307 danilofaverot@yahoo.com.br rtloureno@yahoo.com.br
Abstract This study aims to compare the accuracy between the methods of supervised classification MAXVER and unsupervised CLUSTER with the kappa index in the watershed of Ribeiro Duas guas in Botucatu/SP. From that goal, we can understand what the best method to accomplish the classification of types of use in the area of study, as well as define the best procedure for the improvement on the environmental planning. Its been used the software Idrisi 15- The Andes Edition for this goal, and several papers about the theme, and the observation after the study is that, for this situation, the best method to do it is the supervised classification MAXVER, because of its best accuracy in the methodology of work and the intervention of the user to determinate the training sites of each class of land use.
1. Introduo
A apropriao da natureza pelo homem sempre foi uma condio para que o processo de fixao de comunidades fosse possvel, assim como para que a sociedade se organizasse, de maneira que podemos considerar a natureza a pedra fundamental para os processos que vivemos atualmente no capitalismo. Como fonte de infindveis recursos naturais, a natureza alvo constante de criao e recriao proveniente da criatividade humana, sendo tida como a matria-prima para quaisquer questes ou necessidades humanas. Esse processo se intensificou com a Revoluo Industrial no sculo XVIII, quando as mquinas movidas principalmente a vapor tomaram conta de vrios processos antes realizados por seres humanos ou animais. Ento surgem os problemas ambientais, que emergiram diante de um quadro insustentvel de xodo urbano, expanso urbana, e necessidade de cada vez mais matrias-primas, tudo isso sem a existncia de um planejamento ambiental e urbano consistente e que visasse a conservao dos recursos naturais. Essa explorao desordenada criou na sociedade uma necessidade de desenvolver tecnologias e mtodos que viessem a auxiliar na compreenso da dinmica natural e ao sobre a natureza, de modo a mitigar e/ou recuperar os danos j causados pela ao humana (DEMARCHI et al, 2011, p. 235). E dentre as tecnologias utilizadas atualmente para o manejo correto do uso da terra, o planejamento ambiental, delimitao de reas de proteo ambiental, conservao tanto do solo quanto dos recursos hdricos, dentre outros, esto o Sensoriamento Remoto e o Geoprocessamento. Segundo Jensen (2009), o termo sensoriamento remoto pode ser definido como a medio ou aquisio de informao de alguma propriedade de um objeto ou fenmeno, por um dispositivo de registro que no esteja em contato fsico ou ntimo com o objeto ou fenmeno em estudo, podendo ser dividido em orbital, quando as informaes so coletadas por sensores localizados em rbitas ao redor do planeta, realizando a coleta de dados e informaes sobre a superfcie terrestre em intervalos de tempo e espao previamente estabelecidos, cujos produtos principais so as imagens de satlite; ou sub-orbital, quando esse processo realizado por equipamentos aerotransportados no localizados em rbitas, cujos produtos principais so as fotografias areas (PIROLI, 2010a) Os produtos referentes s varreduras feitas, seja por sistemas orbitais ou sub-orbitais, so produtos brutos, com os quais, sem o tratamento, de nada servem para os objetivos descritos por Demarchi et al (2011). Portanto, h a necessidade de realizar um processamento das imagens digitais, a fim de prepar-las para utilizao. Segundo Novo (1992), as tcnicas para esse processo podem ser classificadas em trs conjuntos: pre-processamento, realce e classificao. Dentre os conjuntos, o mais prtico, referente anlise propriamente dita, o conjunto das tcnicas de classificao, que
visam o reconhecimento automtico de objetos da cena a partir da anlise quantitativa dos nveis de cinza. Os objetos so classificados em diferentes categorias em funo de algum critrio de deciso objetivo. (NOVO, 1992, p. 218)
De acordo com Rosa (2009), a classificao de imagens diz respeito interpretao das mesmas com auxlio de um computador, tratando-se essencialmente, da atribuio de um significado especfico a um pixel ou a um conjunto de pixels, em funo de suas propriedades numricas. Esse processo de classificao se caracteriza pela atribuio aos conjuntos de pixels que possuem caractersticas espectrais comuns entre si, uma assinatura espectral que nos diz que aquele conjunto de pixels representa um tipo especfico de uso da terra, como gua, pastagem, reflorestamento, rea urbana etc. As tcnicas de classificao de imagens podem ser divididas em no-supervisionada e supervisionada. A primeira no requer qualquer informao sobre classes de interesse, somente examinando sem auxlio do analista, os agrupamentos espectrais do alvo e dividindo- os em classes. Esse tipo de classificao trabalha com uma a lgica conhecida como anlise de agrupamento (clustering), sendo til quando no se possui informaes sobre a rea imageada, sendo as classes definidas no algoritmo de classificao (ROSA, 2009). Uma das tcnicas de classificao no supervisionada a opo CLUSTER, que usa uma tcnica de seleo dos pixels pelos picos dos histogramas, e quando os picos foram identificados, todos os possveis valores so associados ao pico mais prximo, e as classes tendem a cair no ponto mdio entre os picos (EASTMAN, 2006). A classificao supervisionada consiste na identificao prvia das classes de informao (tipos de cobertura do solo), chamadas reas de treinamento, que nada mais so do que representaes dos do comportamento mdio das classes que sero mapeadas automaticamente (NOVO, 1992). Esse tipo de classificao utilizada quando se possui algum conhecimento sobre as classes que devem ser representadas na imagem pelo computador. Uma das principais tcnicas utilizadas para a realizao de classificaes supervisionadas a MAXVER (mxima verossimilhana), que consiste na classificao da imagem ponto a ponto, a partir de classes fornecidas pelo usurio. (ROSA, 2009). Segundo Novo (1992), importante que as amostras de treinamento (ou training sites) sejam bastante homogneas e que representem as classes de interesse, ou o resultado pode ser inadequado ao esperado para a classificao. O MAXVER um mtodo pixel a pixel, que considera a ponderao das distncias entre as mdias dos nveis digitais das classes cujas amostras de treinamento foram definidas, utilizando parmetros estatsticos e ajuste segundo uma distribuio gaussiana. (INPE, 2009) Para que possamos identificar se as classificaes realizadas, seja por tcnicas no supervisionadas ou supervisionadas, devemos embat-las com a chamada verdade terrestre, que se caracteriza pela real utilizao do solo na rea de estudo. Esse processo feito a partir de ndices de acurcia, ou exatido, que realizam uma comparao entre as matrizes de pixels da classificao temtica e os da verdade terrestre. Segundo Rosenfield e Fitzpatrick-Lins (1986), dentre os diversos mtodos existentes para essa avaliao, o ndice Kappa o mais recomendado por utilizar todas as clulas da matriz ao invs de somente os elementos diagonais, o que garante uma maior acurcia em relao aos outros mtodos devido medio da probabilidade de um pixel estar corretamente classificado, em relao probabilidade de estar incorretamente classificado (DEMARCHI et al, 2010). O ndice Kappa possui intervalos determinados que caracterizam a acurcia das classificaes realizadas em relao verdade terrestre, determinados por Landis e Koch (1977) e adaptados por Piroli (2010b), apresentadas a seguir.
Todos estes conceitos baseiam nossa abordagem em relao ao tema proposto, que tem como objetivo a comparao entre os mtodos de classificao supervisionada Mxima Verossimilhana (MAXVER) e a classificao no supervisionada CLUSTER, embatendo-os com a verdade terrestre para a estimativa do ndice Kappa, e analisar qual dos dois mtodos mais eficaz na representao dos usos presentes na rea de estudo.
2. Metodologia de Trabalho
A microbacia do Ribeiro Duas guas est inserida dentro do municpio de Botucatu (SP), sendo um afluente do Crrego gua da Lcia, fazendo parte da bacia do Rio Capivara (Figura 1). A microbacia possui uma rea de 1.363,73 hectares, e, segundo Jorge (2000), uma vegetao natural de Cerrado, sendo formada por Argissolos Vermelhos-Amarelos distrficos (CARREGA, 2006) e clima, Cfa segundo a classificao climtica de Kppen- Geiger, com caractersticas de clima temperado chuvoso. Para a confeco deste trabalho, foram utilizadas cartas topogrficas digitalizadas de escala 1:50.000 que abrangem a rea de estudo, de seguintes nomenclaturas: Botucatu (folha SF-22-R-IV-3) e Barra Bonita (folha SF-22-Z-B-VI-1), teis para a delimitao da microbacia do Ribeiro Duas guas, assim como para a digitalizao da rede de drenagem. (IBGE,1973) As cartas topogrficas foram georreferenciadas no datum horzontal SIRGAS-2000, nas bandas 1, 2 e 3 pelo software Idrisi 15 The Andes Edition, sendo montado um mosaico das duas cartas, para a confeco do limite da microbacia.
Figura 1. Localizao da microbacia do Ribeiro Duas guas em Botucatu-SP
Foram utilizadas imagens do programa SPOT (Sattelite Pour lObservation de la Terre), srie SPOT 5, datadas de 10/04/2009 a 27/06/2010. O programa foi planejado e projetado como um sistema operacional e comercial de observao da Terra, tendo suas atividades iniciadas em 1986 com o SPOT 1, operando hoje em dia com as sries SPOT 2, SPOT 4 e SPOT 5 (ROSA, 2009). A srie SPOT 5, origem das imagens aqui utilizadas, possui uma rbita circular, heliossncrona e polar, com perodo de visita de 26 dias e horrio de passagem s 10:30 da manh, operando com 3 sensores: HRS, VEGETATION-2 E HRG, este ltimo a fonte de nossas imagens. A partir das imagens, foi feito um mapa da verdade terrestre dos tipos de uso presentes na microbacia do Ribeiro Duas guas, e depois foram realizadas as classificaes que nos propomos em analisar. Primeiro, a classificao supervisionada MAXVER foi realizada (mdulo Maxlike) com cinco amostras de cada uso como training sites (mdulo Makesig), e tambm foi realizada uma diviso do uso Reflorestamento em 5 classes desse uso, a fim de conseguirmos uma maior acurcia em relao classificao. Esse procedimento foi feito pois, na rea de estudo, havia diversos talhes de reflorestamento em diferentes estgios de crescimento. Segundo Novo (1992), a vegetao sofre alteraes ao longo do tempo em relao ao seu comportamento espectral, como resultado de alteraes sazonais ou em decorrncia de seu estagio fenolgico, dentre outros processos de modificao naturais. Logo depois de realizado o procedimento de classificao com diversas classes, foi feita uma reclassificao da imagem obtida para que a mesma tivesse exatamente o nmero de classes correspondente verdade terrestre, resultando em cinco classes, sendo elas: Mata Nativa, Citrus, Culturas Anuais, Pastagem e Reflorestamento. A partir das classes obtidas na classificao supervisionada, foi escolhido o mesmo nmero para que o software fizesse a classificao no supervisionada CLUSTER, com cinco classes referentes aos mesmos usos. Nesse mtodo, o prprio software reconhece os padres de agrupamento dos pixels coincidentes, e os agrupa por definio prpria em classes distintas.. Ao fim dos processos de classificao, foi realizado o ndice Kappa, processo realizado pelo Idrisi no mdulo Errmat, inserindo-se o arquivo raster da verdade terrestre e as classificaes realizadas, MAXVER e CLUSTER.
3. Resultados e discusses
Como resultados, obtivemos as imagens referentes verdade terrestre presente na rea de estudo, mostrada a seguir.
Figura 2. Verdade terrestre de microbacia do Ribeiro Duas guas
Em relao aos usos presentes na microbacia, os mesmos se encontram quantificados na tabela a seguir.
Tabela 1. rea das classes de uso do solo da Microbacia do Ribeiro Duas guas Classes rea (ha) rea (%)
Mata Nativa Citrus Culturas Anuais Pastagem Reflorestamento
432.85 52.09 112.44 177.05 589.30
31,74 3,82 8,25 12,98 43,21 Total 11.363,73 100,00
Nota-se, a partir da tabela 1, que o principal uso o reflorestamento, ocupando cerca de 43% do total da microbacia, enquanto que a mata nativa ocupa a segunda maior rea, com cerca de 31% do total. Notamos que a rea de mata nativa est presente principalmente nas reas de proteo permanente seguindo os cursos que formam a rede de drenagem, mas tambm em uma grande rea no extremo norte da microbacia. As outras reas em que est presente a mata nativa so em encostas no centro-sul da microbacia, onde se encontram algumas nascentes da drenagem. A partir da separao da imagem real em trs bandas, foram feitas as classificaes MAXVER e CLUSTER, as quais demonstraram uma diferena considervel entre si em relao localizao das culturas presentes na rea.
Figura 3. Classificao Supervisionada CLUSTER
Figura 4. Classificao Supervisionada MAXVER
Podemos notar a diferena entre as classificaes, sendo visivelmente mais apurada a MAXVER, porm somente observando-as no podemos inferir que uma ou outra so melhores para a representao do uso da terra da rea de estudo. Para isso, foi utilizado o mdulo Errmat do Idrisi para a confeco e clculo do ndice Kappa, um ndice que mede a acurcia da classificao em relao verdade terrestre. Quando realizado o ndice para a comparao da verdade terrestre com a classificao CLUSTER, obtivemos um ndice Kappa igual a 0,13, o que caracteriza, segundo Landis e Koch (1977 adaptado por Piroli, 2010b), a classificao como ruim, ou seja, que no atende s verdadeiras utilizaes presentes na rea. J quando realizamos o mesmo clculo para a classificao MAXVER, obtivemos um ndice Kappa igual a 0,55, considerada pelo mesmo autor como boa, atendendo em partes realidade presente na rea. Isso se deve ao mtodo utilizado para a classificao MAXVER, que utiliza de intervalos definidos pelo usurio em training sites para a definio da classificao de um pixel em uma ou outra classe. O intervalo de pixels analisados reduz a induo ao erro de confuso pelo software, apurando a classificao.
Na matriz de erro, o erro de omisso indica a probabilidade de uma unidade amostral de referncia estar corretamente classificada e o erro de incluso representa a probabilidade que um pixel classificado no mapa, represente a categoria no terreno. Erros de incluso ocorrem quando um ponto identificado como de uma classe, quando na realidade pertence a outra classe, enquanto que os erros de omisso ocorrem quando um ponto identificado como pertencente a outra categoria, quando, na realidade, membro de uma determinada classe (PIROLI, 2010b, p. 42)
4. Concluses
Para a microbacia em estudo, o resultado foi que a classificao MAXVER a mais indicada para realizarmos a anlise do uso da terra por meio digitais, pela mais acurcia que esta demonstrou em relao classificao CLUSTER. Entretanto, evidenciamos que ambas podem ter o mesmo resultado, se no considerado o mtodo adequado para a realizao das mesmas, mas a primeira, por possuir a interferncia do usurio com a definio das reas de treinamento para a classificao, sugere uma maior qualidade do que a segunda, que se baseia na reflectncia simplesmente, e que est a merc de confuses em relao aos valores dos pixels que so afetados seja pelo estado fenolgico da planta, ou pelo tipo de cultura/uso ali presente.
Referncias Bibliogrficas
ALKIMIM, A. F. de; CASTRO, A. C.; DEMATT, J. A. M.; FRANSCESCHINI, M. H. D.; GASPAR, J.. Uso de Imagens SPOT na identificao, quantificao e planejamento de reas de Proteo Permanente e Reserva Legal. In: XV Simpsio Brasileiro de Sensoriamento Remoto, Curitiba, 2011. Anais do XV Simpsio Brasileiro de Sensoriamento Remoto SBSR. Curitiba: INPE, 2011. Disponvel em: <http://www.dsr.inpe.br/sbsr2011/files/p1386.pdf>. Acesso em: 13 nov. 2012 CARREGA, E. F B. Delimitao de unidades ambientais na Bacia do Rio Capivara, Botucatu (SP). 2006. 98 f.Dissertao (Mestrado em Agronomia/ Energia na Agricultura) Faculdade de Cincias Agronmicas, Universidade Estadual Paulista, Botucatu, 2006. CARREGA, E. F B. Diagnstico integrado de sntese da Bacia do Rio Capivara, Botucatu (SP). 2010. 260 f.Dissertao (Doutorado em Agronomia/ Energia na Agricultura) Faculdade de Cincias Agronmicas, Universidade Estadual Paulista, Botucaideratu, 2006. DEMARCHI, J. C.; PIROLI, E. L.; ZIMBACK, C. R. L.. Anlise temporal do uso do solo e comparao entre os ndices de vegetao NDVI e SAVI no municpio de Santa Cruz do Rio Pardo - SP usando imagens Landsat-5. Ra'e ga (UFPR), v. 21, p. 234-271, 2011. EASTMAN, J. R.. Idrisi 15: The Andes Edition. Worcester, MA: Clark University, 2006. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATSTICA. Superintendncia de Cartografia. Plano Cartogrfico do Estado de So Paulo. MIcrobacia do Ribeiro Duas guas. Folhas: Botucatu (SF-22-R-IV-3) e Barra Bonita (SF-22-Z-B-VI-1). So Paulo, Escala 1:50.000, 1973. INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS. Spring: Tutorial d Geoprocessamento: Classificao de Imagens. Disponvel em: <http://www.dpi.inpe.br/spring/portugues/tutorial/classific.html>. Acesso em 09 nov. 2012. JENSEN, J. R.. Sensoriamento remoto do ambiente: uma perspectiva em recursos terrestres. Traduo: Jos Carlos Neves Epiphanio (coord.) et al. So Jos dos Campos: Parntese, 2009. JORGE, L. A. B. Comportamento sazonal de fragmentos de vegetao natural na bacia do Rio Capivara, em Botucatu SP. Revista rvore, Viosa MGv. 24, n. 4, p.389 396, Viosa, MG, 2000. LANDIS, R.; KOCH, G. G. The measurement of observer agreement for categorical data. Biometrics, v.33, n.1, p.159-174, Mar. 1977. NOVO, E. M. L. de M.. Sensoriamento remoto: princpios e aplicaes. So Paulo: Edgard Blcher, 1992. PIROLI, E. L.. Introduo ao geoprocessamento. Ourinhos: Unesp/Campus Experimental de Ourinhos, 2010a. 46p. PIROLI, E. L.. Disciplina de geoprocessamento: prticas em Idrisi verso Taiga. Ourinhos: Unesp/Campus Experimental de Ourinhos, 2010b. 56p. ROSA, R.. Introduo ao sensoriamento remoto. Uberlndia: EDUFU, 2009. ROSENFIELD, G. H.; FITZPATRICK-LINS, K. A coefficient of agreement as a measure of thematic classification accuracy. Photogrammetric Engineering and Remote Sensing, v.52, n.2, p.223-227, Fev. 1986.