Escolar Documentos
Profissional Documentos
Cultura Documentos
Manaus - AM
2014
Denys Dionísio Bezerra Silveira
Manaus - AM
2014
Denys Dionísio Bezerra Silveira
Otimização em Grafos e Dinâmica do Carbono na Floresta Amazônica/ Denys
Dionísio Bezerra Silveira. – Manaus - AM, 2014-
32 p. : il.; 30 cm.
CDU 02:141:005.7
Resumo
O sensoriamento remoto teve um grande crescimento nas últimas décadas. Dentre as
diversas tecnologias incorporadas recentemente, o LiDAR (Light Detection And Ranging)
é, provavelmente, aquela que mais é estudada no ramo científico, devido a capacidade de
se obter dados geospaciais de alta acurácia. A aplicação desta nova tecnologia é vasta
e um importante uso da mesma é em pesquisas ambientais, principalmente para inferir
características e compará-las com aquela obtidas em inventário florestal. Contudo, a nuvem
de pontos resultante desta tecnologia é muito grande, tornando-se um cenário típico de
aplicação de Big Data. Esta pesquisa de iniciação científica propõe-se a estudar técnicas
de otimização capazes de diminuir a quantidade destes dados, bem como estudar técnicas
baseados em Data Mining utilizando como entrada dados provenientes de um sobrevoo de
um drone que possui o equipamento LiDAR acoplado.
1 Introdução
1.1 Motivação
Muito se tem discutido sobre a preservação dos recursos naturais e a efetuação
de atividades econômicas ecologicamente sustentáveis. Com a realização de diversas
conferências internacionais e o estabelecimento do protocolo de Quioto no Japão, é notável
a preocupação em agir de forma eficaz a fim de controlar a destruição do meio ambiente.
Entretanto, apenas determinar metas e projeções de redução do desmatamento e de
queimadas não são suficientes para se alcançar o objetivo estipulado pela Convenção-
Quadro da ONU sobre Mudança do Clima (UNFCCC).
Segundo Laplane e Franco (4), a dinâmica contínua de expansão da fronteira baseada
no esgotamento de recursos naturais, desigualdades e pobreza devem ser substituídos por
uma nova lógica de uso dos elementos da natureza e da terra. Isso deve incluir a criação de
incentivos positivos para a redução da pressão sobre as florestas em pé e reconhecimento e
apoio aos responsáveis pela conservação dos estoques de floresta remanescentes. Ainda
segundo os autores, é necessário agregar conhecimento aos processos produtivos e induzir
agentes econômicos e sociais a mudarem o seu comportamento de modo a promover a
educação, inovação e criatividade. Sob esta perspectiva surgiu o programa REDD+ (do
inglês Reduce Emissions for Deforestion and Degradation), considerado uma extensão do
conceito do REDD, que abrange também incentivos positivos aos países em desenvolvimento,
comprometidos na redução de emissão de carbono.
A ideia principal do esquema REDD é a diminuição compensada de emissões, isto é,
países em desenvolvimento detentores de florestas tropicais recebem compensação financeira
internacional por promover a redução da emissão de carbono oriunda do desmatamento (4).
Embora o conceito do REDD seja interessante, existe um grande problema quanto a parte
financeira do sistema. Para que o financiador possa investir, é preciso ter credibilidade
quanto a quantidade do estoque de carbono preservado e as incertezas relacionadas, o
que só é possível com um relatório de monitoramento bem elaborado. Convencer as
organizações de que a estimativa de redução ou aumento de estoque de carbono é um
modelo confiável exige metodologias robustas, de modo que a estimava seja condizente com
a realidade (5). É com base esta afirmativa que o uso da tecnologia LiDAR encontra-se em
pleno crescimento. Com base na coleta de dados espaciais, aliados com o poder de análise
em uma região mais vasta do que utilizando técnicas tradicionais o LiDAR proporciona
novas formas de estudos na área ambiental, além das tradicionais onde o operador necessita
de dados em campo para obter a estimativa de carbono.
1.2. Justificativa 11
1.2 Justificativa
Como visto anteriormente, o veículo aéreo não-tripulado equipado com a tecnologia
LiDAR possui a capacidade de registrar as coordenadas x, y e z de uma superfície-alvo. O
problema de operar com esses dados é que a quantidade dos mesmos é maciça, tornando
qualquer operação uma tarefa relativamente difícil computacionalmente. Por exemplo,
Hochreiter e Waldhouser (6) exemplificam esta dificuldade no experimento que os autores
realizaram utilizando um equipamento LiDAR acoplado a um avião. Segundo os mesmos,
cada ponto imageado e armazenado em uma mídia física ocupa 10 bytes. Utilizando
uma resolução moderada de 5 pontos por metro quadrado, a nuvem de pontos gerada
pelo equipamento ocupa aproximadamente 5 terabytes em espaço físico, o que significa
que em apenas um sobrevoo 5 · 1011 pontos são registrados. Além disso, os profissionais
que trabalham com inventário florestal precisam operar com várias nuvens de pontos
provenientes de vários sobrevoos diferentes, o que definitivamente inviabiliza o uso de
técnicas computacionais custosas. Deste modo, a área de otimização combinatória pode
ser aplicada a este contexto, com a finalidade de reduzir esta massa de dados, tornando
disponível dados que realmente possam oferecer uma estimativa de biomassa consistente,
de modo que o custo computacional utilizado por outros métodos algorítimicos seja
amortizado.
1.3 Objetivos
Conforme visto a justificativa do projeto, a dimensão do produto do LiDAR é muito
grande, o que torna qualquer operação avançada sobre estes dados um procedimento de
alto custo computacional. Entretanto, a maioria da região da nuvem de pontos não são
representativas, o que permite retirar boa parte dos dados sem afetar significantemente a
estimativa de carbono. É dito que uma região de floresta é significativa para o modelo
quando esta região contém as árvores emergentes (mais altas) e dominantes (mais largas),
devido a quantidade de biomassa ser maior nessa região e consequentemente, ser mais
significativa em estocagem do carbono. Deste modo, o objetivo geral do projeto de pesquisa
é estudar e aplicar técnicas de Combinação Combinatória, com apoio aos diversos modelos
teóricos existentes (teoria dos grafos, programação linear e outros), de modo que forneça
um modelo computacional confiável e capaz de diminuir gama de dados provenientes do
estudo de regiões florestais com base na tecnologia LiDAR. Como o projeto possui um
grande escopo em nível de doutorado, os objetivos específicos foram restringidos neste
projeto de iniciação científica, de modo que o escopo fosse adequado para o trabalho de
pesquisa. Foram priorizados os estudos referentes ao cenário de aplicação, com participação
em cursos no INPA abordando o sensoriamento remoto e entendimento do problema a ser
tratado e revisão da literatura nos conceitos relativos à área de computação.
12 Capítulo 1. Introdução
3. Buscar através do processo de revisão da literatura como a grandeza dos dados pode
ser diminuída aplicando técnicas de otimização, citando os algoritmos utilizados para
a localização da solução ótima.
Figura 1 – Foto da aula prática de biomassa realizada durante o curso internacional. Fonte:
elaborada pelo autor.
2.3. Visitas à estação experimental ZF-2 15
1
O CADAF é o projeto resultado do acordo bilateral entre o Brasil e o Japão, onde o objetivo principal
é o estudo em larga escala da dinâmica do Carbono na Floresta amazônica.
17
3 Referencial teórico
Considera-se com frequência uma imagem como uma função multivalorada, não-
negativa de duas variáveis reais; o valor desta função em um determinado ponto será
denominado de escala de cinza (“gray-level”) da figura neste ponto (7). Contudo, a natureza
da imagem é contínua, o que diverge do princípio discreto do computador. Para que haja
a possibilidade de manipular imagens em artefatos discretos, é preciso utilizar processos
de digitalização, que se divide em amostragem e quantização. Na primeira abordagem,
o armazenamento da figura ocorre através de finitas amostras de pontos e na segunda,
por discretização dos valores da função contínua. Geralmente, as amostras estão contidas
no plano cartesiano e ambos os conceitos podem ser subdivididos em outros. Utiliza-se
fundamentalmente nesta pesquisa a teoria dos grafos, ramo da matemática que estuda o
conjunto de conexões entre pares de objetos e se baseiam no uso de estruturas denominadas
grafos (8). Um grafo G = (V, E) consiste de um conjunto de vértices V junto com um
conjunto E de pares de arestas. Essa estrutura possui extrema importância, pois permite
ser usada para representar qualquer relação entre componentes. Por exemplo, um grafo
pode modelar uma rota rodoviária, onde as cidades são vértices e as arestas são as estradas
que interligam estas cidades (9). Observando a versatilidade proporcionada pela estrutura,
pode-se modelar a imagem como um grafo de adjacência de pixel, estrutura cujo conjunto
de vértices é o conjunto de elementos de imagem e cujas arestas são dadas pela relação de
adjacência entre os elementos. Tal elemento simboliza um pixel, que é a menor unidade
18 Capítulo 3. Referencial teórico
de representação de uma imagem digital. Abaixo, tem-se uma figura ilustrando a relação
mencionada.
1
um,Z (f ) = , i, j ∈ f e i 6= j
min d(i, j)
Utilizando este modelo, várias abordagens podem ser utilizadas para a localização de
parcelas ótimas disponíveis na literatura, como Simulated Annealing, algoritmos evolutivos
e outras técnicas de otimização que podem ser exatas ou aproximadas.
4 Cenário de aplicação
Com a base de dados presente, a primeira tarefa foi descobrir se apenas as co-
ordenadas X, Y e Z dos pontos eram suficientes para registrar todas as características
da área estudada. Com base nos trabalhos de Kraus (14), foi constatado que o fato era
possível. Tendo base esta revisão da literatura, o autor decidiu estudar o comportamento
dos dados e validar a hipótese colocando as informações do LiDAR em um gráfico. Para
isso, foi utilizado o programa GNUPlot, um programa livre para elaboração de gráficos.
Para representar os dados de forma efetiva, foi utilizada uma escala de cores em função da
altitude dos pontos coletados. Foi definido que os pontos com cor mais azulada seriam de
menor altitude, enquanto os de tons avermelhadores teriam altitude maior. A angulação
da imagem em torno do eixo X , Y e Z foram rotacionadas de modo que apresentasse
melhor o cenário de estudo. Para os gráficos gerados, os critérios abordados foi a rotação
da imagem em torno do eixo X em 120◦ , 60◦ em Y e em relação ao eixo Z diferenciado
para cada imagem gerada. A primeira utiliza 0◦ de rotação, a segunda 30◦ e a terceira 60◦ .
A seguir, tem-se os gráficos gerados através do programa GNUPlot 1 utilizando a base de
dados LiDAR obtida.
Figura 6 – Visualização da base de dados com rotação do eixo Z em 30◦ , fornecendo visão
em vista aérea e lateral.
Figura 7 – Visualização da base de dados com rotação do eixo Z em 60◦ , fornecendo visão
em vista aérea e lateral.
abaixo, pode-se observar que a parcela de floresta analisada está sendo cortada por duas
estradas transversais de terra, o que corresponde ao encontro das estradas, indicado pelas
representações gráficas em azul, devido à natureza da estrada possuir altitude menor que
os dosséis das árvores.
Portanto, a primeira hipótese é válida, logo existe a possibilidade de aplicar técnicas
computacionais baseadas apenas nas coordenadas de cada ponto da superfície no espaço,
utilizando a latitude, a longitude e a altitude. A segunda hipótese efetuada, com base
na primeira, é a possibilidade de utilizar métodos baseados em Mineração de Dados e
Otimização Combinatória para a redução da dimensionalidade da base de dados. Como
explicitado no referencial teórico, Chehata et al. (12) utiliza o método de clusterização
k − means para separar os pontos mais elevados dos pontos menos elevados. Como o
modelo atual considera as árvores mais frondosas as mais representativas para o mesmo,
5.1. Algoritmo de Determinação da Altura Média 27
Figura 8 – Fotografia obtida durante a coleta de dados pelo equipamento LiDAR. Fonte:
INPA
do objeto de estudo, o modelo digital de terreno representa toda a elevação do terreno onde
os objetos estão presentes, desconsiderando os obstáculos (16). Nesse caso, para calcular
a altura média das árvores através dos dados, basta calcular a diferença entre os pontos
presentes no Modelo Digital de Superfície e do Modelo Digital de Terreno (15). Baseado
neste princípio, foi projetado um algoritmo para a determinação da altura média da região
com base nos dados LiDAR.
fim
end
fim
Retorne a média dos elementos de AlturasM ediasp
Algoritmo 1: Algoritmo de Determinação da Altura Média da Vegetação
A ideia principal do algoritmo é relativamente simples. Primeiramente, divide-se
todo o espaço de pontos presentes no arquivo em diversas regiões uniformes, guardando-os
em uma estrutura computacional apropriada. A seguir, para cada subregião, define-se um
conjunto de pontos presentes na área denominados seed-points, de modo que eles sejam os
mais dispersos possíveis entre si, com a finalidade de maximizar o alcance da busca local
por pontos na região do modelo digital de terreno (pontos com menores altitudes menos
variantes) e dos pontos contidos no modelo digital de superfície (pontos com maiores
altitudes menos variantes). Se a diferença dos valores dos dois modelos forem maior que um
limiar de altitude definido pelo usuário, eles são incluídos na estrutura AlturasM ediasp .
Finalmente, o algoritmo retorna a média dos valores contidos na estrutura citada.
Este algoritmo está sendo continuamente desenvolvido e melhorado, e será apresen-
tado em um momento futuro.
29
6 Considerações finais
Referências
5 GRASSI, G. et al. Applying the conservativeness principle to redd to deal with the
uncertainties of the estimates. Environmental Research Letters, v. 3, n. 3, p. 5005, 2008.
Citado na página 10.
9 SKIENA, S. The Algorithm Design Manual. [S.l.]: Springer, 1998. (Computer Science:
Algorithm Design). ISBN 9780387948607. Citado na página 17.
11 JUNTTILA, V. et al. Strategies for minimizing sample size for use in airborne
lidar-based forest inventory. Forest Ecology and Management, Elsevier, v. 292, p. 75–85,
2013. Citado 2 vezes nas páginas 19 e 20.
12 CHEHATA, N.; DAVID, N.; BRETAR, F. Lidar data classification using hierarchical
k-means clustering. In: ISPRS Congress Beijing 2008. [S.l.: s.n.], 2008. v. 37, p. 325–330.
Citado 2 vezes nas páginas 20 e 26.