Você está na página 1de 34

Denys Dionísio Bezerra Silveira

Otimização em Grafos e Dinâmica do Carbono


na Floresta Amazônica

Manaus - AM
2014
Denys Dionísio Bezerra Silveira

Otimização em Grafos e Dinâmica do Carbono na


Floresta Amazônica

Relatório técnico final de projeto de iniciação


científica, com bolsa concedida através da
Fundação de Amparo à Pesquisa do Estado
do Amazonas, apresentado como requisito
obrigatório definido pelo termo do programa.

Universidade Federal do Amazonas


Instituto de Computação

Orientador: Rosiane de Freitas Rodrigues

Manaus - AM
2014
Denys Dionísio Bezerra Silveira
Otimização em Grafos e Dinâmica do Carbono na Floresta Amazônica/ Denys
Dionísio Bezerra Silveira. – Manaus - AM, 2014-
32 p. : il.; 30 cm.

Orientador: Rosiane de Freitas Rodrigues

Relatório Final de Iniciação Científica – Universidade Federal do Amazonas


Instituto de Computação
, 2014.
1. Otimização. 2. Dinâmica do Carbono. I. Rosiane de Feitas Rodrigues. II.
Universidade Federal do Amazonas. III. Otimização em Grafos e Dinâmica do
Carbono na Floresta Amazônica

CDU 02:141:005.7
Resumo
O sensoriamento remoto teve um grande crescimento nas últimas décadas. Dentre as
diversas tecnologias incorporadas recentemente, o LiDAR (Light Detection And Ranging)
é, provavelmente, aquela que mais é estudada no ramo científico, devido a capacidade de
se obter dados geospaciais de alta acurácia. A aplicação desta nova tecnologia é vasta
e um importante uso da mesma é em pesquisas ambientais, principalmente para inferir
características e compará-las com aquela obtidas em inventário florestal. Contudo, a nuvem
de pontos resultante desta tecnologia é muito grande, tornando-se um cenário típico de
aplicação de Big Data. Esta pesquisa de iniciação científica propõe-se a estudar técnicas
de otimização capazes de diminuir a quantidade destes dados, bem como estudar técnicas
baseados em Data Mining utilizando como entrada dados provenientes de um sobrevoo de
um drone que possui o equipamento LiDAR acoplado.

Palavras-chaves: Otimização, Grafos, Dinâmica do Carbono, Floresta Amazônica.


Lista de ilustrações

Figura 1 – Foto da aula prática de biomassa realizada durante o curso internacional.


Fonte: elaborada pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . 14
Figura 2 – Ilustração de um grafo de adjacência de pixel. Fonte (7). . . . . . . . . 18
Figura 3 – Foto do VANT utilizado no cenário de aplicação (modelo md4-1000).
Fonte: (1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Figura 4 – Software utilizado na elaboração e controle do trajeto. Fonte: (1) . . . 22
Figura 5 – Visualização da base de dados com rotação do eixo Z em 0◦ , fornecendo
visão em vista aérea. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Figura 6 – Visualização da base de dados com rotação do eixo Z em 30◦ , fornecendo
visão em vista aérea e lateral. . . . . . . . . . . . . . . . . . . . . . . . 26
Figura 7 – Visualização da base de dados com rotação do eixo Z em 60◦ , fornecendo
visão em vista aérea e lateral. . . . . . . . . . . . . . . . . . . . . . . . 26
Figura 8 – Fotografia obtida durante a coleta de dados pelo equipamento LiDAR.
Fonte: INPA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Lista de tabelas

Tabela 1 – Cronograma previsto das atividades realizadas no período de pesquisa. 13


Tabela 2 – Cronograma realizado das atividades realizadas no período de pesquisa. 14
Tabela 3 – Tabela de atributos presentes na base de dados . . . . . . . . . . . . . 24
9

1 Introdução

Com o passar dos anos, a tecnologia aplicada ao sensoriamento remoto evoluiu


ao ponto de permitir a coleta de dados em alta acurácia com maior eficiência. Dentre as
novas tecnologias que surgiram recentemente, o LiDAR (Light Detection and Ranging)
ocupa uma posição de destaque dentre as tecnologias utilizadas no sensoriamento remoto.
A tecnologia de sensoriamento remoto LiDAR consiste de um transmissor laser, e um
receptor que converte a energia emitida e recebida (através do pulso de laser refletido no
objeto) em impulsos elétricos, possuindo a finalidade de medir a distância entre um sensor
e um alvo específico (2). Quando aplicado com os métodos de georreferenciamento, o sensor
torna-se capaz de inferir o posicionamento da coordenada do ponto no espaço, o que oferece
uma gama de aplicabilidade em diversas áreas. Existem diferentes pesquisas em torno da
tecnologia LiDAR, dentre as quais envolvem a utilização de técnicas computacionais para
inferir a quantidade de biomassa existente em uma região de floresta. Pode-se afirmar que
a quantidade de carbono existente na biomassa de uma determinada região de floresta
pode ser calculado utilizando um modelo estatístico baseado em regressão linear, onde as
variáveis são o diâmetro da altura do peito do tronco e, opcionalmente, a altura média das
árvores, a fim de tornar o cáculo de biomassa mais preciso (3). Portanto, a estimativa da
altura média das árvores de um fragmento de floresta depende de um modelo teórico que
considera apenas o diâmetro do tronco e a altura média, sendo o último elemento difícil
de se obter aplicando técnicas tradicionais de inventário florestal. Como o uso do avião
proveniente de projetos realizados em conjunto com órgãos estrangeiros é impossibilitado
por razões legais, o INPA (Instituto Nacional de Pesquisas da Amazônia) adquiriu, através
do projeto CADAF (Carbon Dinamics of Amazon Forest) dois VANTs equipados com
a tecnologia LiDAR, com o intuito de realizar estudos através dos dados coletados. A
pesquisa em torno do LiDAR com aplicabilidade na floresta amazônica está em pleno
desenvolvimento, tornando possível pensar em utilizar novos modelos para ratificar ou
discutir o modelo vigente. Este projeto de iniciação científica vem sendo realizado dentro de
um escopo maior, onde se busca utilizar técnicas computacionais avançadas de otimização
para tornar possível calcular a quantidade de carbono existente em uma região de floresta,
com base nos dados produzidos pelo LiDAR.
10 Capítulo 1. Introdução

1.1 Motivação
Muito se tem discutido sobre a preservação dos recursos naturais e a efetuação
de atividades econômicas ecologicamente sustentáveis. Com a realização de diversas
conferências internacionais e o estabelecimento do protocolo de Quioto no Japão, é notável
a preocupação em agir de forma eficaz a fim de controlar a destruição do meio ambiente.
Entretanto, apenas determinar metas e projeções de redução do desmatamento e de
queimadas não são suficientes para se alcançar o objetivo estipulado pela Convenção-
Quadro da ONU sobre Mudança do Clima (UNFCCC).
Segundo Laplane e Franco (4), a dinâmica contínua de expansão da fronteira baseada
no esgotamento de recursos naturais, desigualdades e pobreza devem ser substituídos por
uma nova lógica de uso dos elementos da natureza e da terra. Isso deve incluir a criação de
incentivos positivos para a redução da pressão sobre as florestas em pé e reconhecimento e
apoio aos responsáveis pela conservação dos estoques de floresta remanescentes. Ainda
segundo os autores, é necessário agregar conhecimento aos processos produtivos e induzir
agentes econômicos e sociais a mudarem o seu comportamento de modo a promover a
educação, inovação e criatividade. Sob esta perspectiva surgiu o programa REDD+ (do
inglês Reduce Emissions for Deforestion and Degradation), considerado uma extensão do
conceito do REDD, que abrange também incentivos positivos aos países em desenvolvimento,
comprometidos na redução de emissão de carbono.
A ideia principal do esquema REDD é a diminuição compensada de emissões, isto é,
países em desenvolvimento detentores de florestas tropicais recebem compensação financeira
internacional por promover a redução da emissão de carbono oriunda do desmatamento (4).
Embora o conceito do REDD seja interessante, existe um grande problema quanto a parte
financeira do sistema. Para que o financiador possa investir, é preciso ter credibilidade
quanto a quantidade do estoque de carbono preservado e as incertezas relacionadas, o
que só é possível com um relatório de monitoramento bem elaborado. Convencer as
organizações de que a estimativa de redução ou aumento de estoque de carbono é um
modelo confiável exige metodologias robustas, de modo que a estimava seja condizente com
a realidade (5). É com base esta afirmativa que o uso da tecnologia LiDAR encontra-se em
pleno crescimento. Com base na coleta de dados espaciais, aliados com o poder de análise
em uma região mais vasta do que utilizando técnicas tradicionais o LiDAR proporciona
novas formas de estudos na área ambiental, além das tradicionais onde o operador necessita
de dados em campo para obter a estimativa de carbono.
1.2. Justificativa 11

1.2 Justificativa
Como visto anteriormente, o veículo aéreo não-tripulado equipado com a tecnologia
LiDAR possui a capacidade de registrar as coordenadas x, y e z de uma superfície-alvo. O
problema de operar com esses dados é que a quantidade dos mesmos é maciça, tornando
qualquer operação uma tarefa relativamente difícil computacionalmente. Por exemplo,
Hochreiter e Waldhouser (6) exemplificam esta dificuldade no experimento que os autores
realizaram utilizando um equipamento LiDAR acoplado a um avião. Segundo os mesmos,
cada ponto imageado e armazenado em uma mídia física ocupa 10 bytes. Utilizando
uma resolução moderada de 5 pontos por metro quadrado, a nuvem de pontos gerada
pelo equipamento ocupa aproximadamente 5 terabytes em espaço físico, o que significa
que em apenas um sobrevoo 5 · 1011 pontos são registrados. Além disso, os profissionais
que trabalham com inventário florestal precisam operar com várias nuvens de pontos
provenientes de vários sobrevoos diferentes, o que definitivamente inviabiliza o uso de
técnicas computacionais custosas. Deste modo, a área de otimização combinatória pode
ser aplicada a este contexto, com a finalidade de reduzir esta massa de dados, tornando
disponível dados que realmente possam oferecer uma estimativa de biomassa consistente,
de modo que o custo computacional utilizado por outros métodos algorítimicos seja
amortizado.

1.3 Objetivos
Conforme visto a justificativa do projeto, a dimensão do produto do LiDAR é muito
grande, o que torna qualquer operação avançada sobre estes dados um procedimento de
alto custo computacional. Entretanto, a maioria da região da nuvem de pontos não são
representativas, o que permite retirar boa parte dos dados sem afetar significantemente a
estimativa de carbono. É dito que uma região de floresta é significativa para o modelo
quando esta região contém as árvores emergentes (mais altas) e dominantes (mais largas),
devido a quantidade de biomassa ser maior nessa região e consequentemente, ser mais
significativa em estocagem do carbono. Deste modo, o objetivo geral do projeto de pesquisa
é estudar e aplicar técnicas de Combinação Combinatória, com apoio aos diversos modelos
teóricos existentes (teoria dos grafos, programação linear e outros), de modo que forneça
um modelo computacional confiável e capaz de diminuir gama de dados provenientes do
estudo de regiões florestais com base na tecnologia LiDAR. Como o projeto possui um
grande escopo em nível de doutorado, os objetivos específicos foram restringidos neste
projeto de iniciação científica, de modo que o escopo fosse adequado para o trabalho de
pesquisa. Foram priorizados os estudos referentes ao cenário de aplicação, com participação
em cursos no INPA abordando o sensoriamento remoto e entendimento do problema a ser
tratado e revisão da literatura nos conceitos relativos à área de computação.
12 Capítulo 1. Introdução

Os objetivos específicos do projeto são:

1. Estudo do cenário de aplicação, entendendo os conceitos do cenário a ser estudado.

2. Verificar se é possível englobar e modelar a nuvem de pontos como uma estrutura de


grafos e se for coerente a proposta, estudar as técnicas podem ser abordadas para
auxiliar a proposta do projeto.

3. Buscar através do processo de revisão da literatura como a grandeza dos dados pode
ser diminuída aplicando técnicas de otimização, citando os algoritmos utilizados para
a localização da solução ótima.

4. Estudar técnicas de mineração de dados para a redução da dimensionalidade através


de técnicas de agrupamento, separando as regiões factíveis das não-factíveis.
13

2 Cronograma e atividades desenvolvidas

Durante o primeiro semestre de pesquisa vidente, concentrou-se na revisão biblio-


gráfica e na participação de cursos e eventos promovidos pelo INPA, a fim de se conhecer
melhor o cenário do problema. Na segunda metade do período, foi dada maior ênfase ao
estudo do modelo teórico e de técnicas de otimização capazes de reduzir a quantidade de
dados gerados pelo equipamento LiDAR. Esta seção descreve o cronograma real e estimado,
além das diversas atividades realizadas durante o período.

2.1 Cronograma previsto


Considerando o escopo definido pelo objetivo do projeto, o autor deste relatório
definiu uma estimativa de cronograma baseado nas atividades no início do projeto. Abaixo,
tem-se o cronograma estimado das atividades do projeto.

Atividade prevista Mês


08 09 10 11 12 01 02 03 04 05 06 07
Revisão da literatura * * * *
Visitas à estação experimental ZF-2 * *
Análise dos dados de LiDAR * *
Escrita do relatório parcial * *
Estudo de técnicas de otimização * * *
Estudo de teoria dos grafos * *
Escrita do relatório final * *
Tabela 1 – Cronograma previsto das atividades realizadas no período de pesquisa.

2.2 Cronograma real


Em virtude do assunto tratado ser um problema bastante amplo e multidisciplinar,
a revisão da literatura demandou mais tempo que o previsto. Além da necessidade de
um estudo mais aprofundado, novas abordagens foram vistas a medida que o cenário de
aplicação era melhor compreendido. Pode-se citar como exemplo a inclusão do estudo de
técnicas de clustering para diminuir o tamanho dos dados produzidos pelo equipamento
LiDAR. Estas e outras mudanças podem ser vistas com maiores detalhes na tabela abaixo.
14 Capítulo 2. Cronograma e atividades desenvolvidas

Tabela 2 – Cronograma realizado das atividades realizadas no período de pesquisa.


Atividade realizada Mês
08 09 10 11 12 01 02 03 04 05 06 07
Revisão da literatura * * * * * * *
Visitas à estação experimental ZF-2 * * *
Estudo de teoria dos grafos * *
Análise dos dados de LiDAR * * *
Escrita do relatório parcial * *
Estudo de técnicas de mineração de dados * *
Estudo de combinação combinatória * * *
Escrita do relatório final *

2.3 Visitas à estação experimental ZF-2


Para a realização do estudo dos conceitos pertinentes à área de manejo florestal
foram realizadas duas visitas à estação experimental ZF-2. A primeira visita foi feita durante
o curso de imersão “Floresta Amazônica e suas múltiplas dimensões” para professores da
rede pública, realizado entre os dias 5 e 12 de outubro de 2013. Neste curso, realizado
por meio do Laboratório de Pedagogia e Educação Ambiental (LAPSEA) em conjunto ao
Laboratório de Manejo Florestal (LMF), os professores participaram de atividades teóricas
e práticas sobre as diversas particularidades da Amazônia. Na segunda visita, o bolsista
participou como convidado do “III Curso Internacional sobre Elaboração, Execução e
Monitoramento de Projeto de Carbono”, que reuniu diversos alunos e profissionais do
meio ambiente dos países latino-americanos. Em ambos os cursos, as aulas alternaram
entre trabalhos de campo na floresta e palestras ministradas no próprio alojamento. Foram
abordados vários temas interessantes, entre os quais se podem destacar o processo de
manejo florestal, mudanças climáticas, solo amazônico, sensoriamento remoto, Global
Position System (GPS) e biomassa.

Figura 1 – Foto da aula prática de biomassa realizada durante o curso internacional. Fonte:
elaborada pelo autor.
2.3. Visitas à estação experimental ZF-2 15

Durante o segundo curso realizado, o bolsista também participou do seminário


de encerramento do projeto CADAF 1 , intitulado “Dinâmica do Carbono da Floresta
Amazônica”, promovido entre os dias 28 e 30 de outubro, no auditório do Bosque da Ciência.
O evento contou com a presença dos pesquisadores brasileiros e japoneses envolvidos com o
projeto CADAF, tendo como principal objetivo apresentar os resultados finais do projeto de
pesquisa de dinâmica do carbono. No último dia do seminário, os pesquisadores japoneses
abordaram o uso da tecnologia LiDAR no escopo da pesquisa de dinâmica do Carbono,
comentando sobre os métodos utilizados, o funcionamento elementar desta nova tecnologia
e os desafios de utilizá-la concomitantemente com pesquisas de manejo florestal. Ficou
claro que os resultados obtidos com o LiDAR são interessantes, e que é preciso pesquisas
voltadas ao desenvolvimento de técnicas computacionais capazes de tratar com maior
eficiência a grande base de dados. É importante salientar que o bolsista nunca tinha
participado de um evento internacional até o presente curso e que a experiência de estar
em contato com outros pesquisadores foi excelente.
O último curso a qual o autor deste relatório participou esteve mais voltado na
compreensão e uso das tecnologias de sensoriamento remoto. Intitulado “II Curso de
Geotecnologia Aplicada ao Inventário Florestal”, o mesmo foi realizado entre os dias 3 e
11 de abril de 2014. Foram abordados concentos iniciais do sensoriamento remoto, uma
visão geral do georreferenciamento e sobre o uso de tecnologias como GPS e da ferramenta
ArcGis R
para elaboração de mapas de inventário florestal.
Todos os cursos foram bastante proveitosos, e além de aprimorar o conhecimento
sobre o cenário de aplicação, o contato com pesquisadores de outras áreas foi de suma
importância para a construção do conhecimento em uma pesquisa científica.

1
O CADAF é o projeto resultado do acordo bilateral entre o Brasil e o Japão, onde o objetivo principal
é o estudo em larga escala da dinâmica do Carbono na Floresta amazônica.
17

3 Referencial teórico

Esta seção descreve o referencial teórico adotado em torno da área de Ciência


da Computação. Diferentes tópicos para representação e modelagem do problema são
abordados nesta seção, sob o ponto de vista computacional.

3.1 Processamento de imagens baseados em grafos

Em outro ponto do projeto, os esforços foram concentrados na revisão da literatura


relacionada à modelagem de representação de imagens baseadas em grafos e de técnicas
de segmentação utilizando esta estrutura.

3.1.1 Imagens digitais como uma estrutura de grafo

Considera-se com frequência uma imagem como uma função multivalorada, não-
negativa de duas variáveis reais; o valor desta função em um determinado ponto será
denominado de escala de cinza (“gray-level”) da figura neste ponto (7). Contudo, a natureza
da imagem é contínua, o que diverge do princípio discreto do computador. Para que haja
a possibilidade de manipular imagens em artefatos discretos, é preciso utilizar processos
de digitalização, que se divide em amostragem e quantização. Na primeira abordagem,
o armazenamento da figura ocorre através de finitas amostras de pontos e na segunda,
por discretização dos valores da função contínua. Geralmente, as amostras estão contidas
no plano cartesiano e ambos os conceitos podem ser subdivididos em outros. Utiliza-se
fundamentalmente nesta pesquisa a teoria dos grafos, ramo da matemática que estuda o
conjunto de conexões entre pares de objetos e se baseiam no uso de estruturas denominadas
grafos (8). Um grafo G = (V, E) consiste de um conjunto de vértices V junto com um
conjunto E de pares de arestas. Essa estrutura possui extrema importância, pois permite
ser usada para representar qualquer relação entre componentes. Por exemplo, um grafo
pode modelar uma rota rodoviária, onde as cidades são vértices e as arestas são as estradas
que interligam estas cidades (9). Observando a versatilidade proporcionada pela estrutura,
pode-se modelar a imagem como um grafo de adjacência de pixel, estrutura cujo conjunto
de vértices é o conjunto de elementos de imagem e cujas arestas são dadas pela relação de
adjacência entre os elementos. Tal elemento simboliza um pixel, que é a menor unidade
18 Capítulo 3. Referencial teórico

de representação de uma imagem digital. Abaixo, tem-se uma figura ilustrando a relação
mencionada.

Figura 2 – Ilustração de um grafo de adjacência de pixel. Fonte (7).

Embora existam diversas formas de representação de imagens, a baseada em grafos


possui diversas vantagens. Uma delas é que a mesma possui representação matemática
simples e discreta, com métodos eficientes de provabilidade e desenvolvimento. Outro
benefício é que muitos problemas relativos ao processamento de imagens já são cobertos
pela teoria dos grafos, de forma que haja possibilidade de reutilizar algoritmos clássicos
para resolver problemas complexos (7).

3.1.2 Segmentação interativa

Segmentação é o processo de particionamento de uma imagem digital em múltiplos


elementos. Segundo Malmberg (7), pode-se dividi-la em duas tarefas. A primeira, definida
como reconhecimento, consiste na tarefa de determinar grosseiramente onde o objeto está
localizado na imagem, sendo uma abordagem considerada de alto nível. A segunda é a
delimitação, onde se determina a exata extensão do objeto, sendo uma tarefa de baixo
nível. Considerando estes fatos, normalmente emprega-se a segmentação semiautomática,
onde o indivíduo reconhece o elemento da imagem que quer particionar e o computador
realiza a delimitação. Assim, o processo se torna rápido, pois a tarefa de reconhecimento é
complexa e custosa para ser efetuada por um computador. Para realizar a segmentação
de uma imagem representada como um grafo, deve-se particionar o grafo em um número
de componentes conexos. Um particionamento pode ser descrito como rotulamento de
vértices ou como um corte em grafos. Um rotulamento de vértices L de G é um mapa onde
V → L (e.g., L = {objeto, background}). Um corte em grafo pode ser descrito como uma
configuração de arestas que, se elas forem removidas do grafo, separam o mesmo em dois
ou mais componentes conexos. Formalmente, usa-se a seguinte definição: Seja S ⊆ E e
G0 = (V, E − S). Se, ∀ev,w ∈ S, tal que v 6∼ w, então S é um grafo recortado de G. Embora
diferentes, os dois conceitos estão interligados à definição de fronteiras. Uma fronteira de
3.2. Otimização Combinatória 19

um rotulamento é a configuração de aresta ∂Ł = {ev,w ∈ E, tal que Ł(v) 6= Ł(w)}. Tal


relação pode ser descrita pelo seguinte teorema (7):
Para qualquer grafo G = (V, E) e um conjunto de arestas S ⊆ E, as seguintes
afirmações são equivalentes:
1. Existe um rotulamento de vértices Ł de G tal que S = ∂Ł
2. S é um corte em G.
Assim, facilmente conclui-se que os dois conceitos estão intimamente ligados, sendo
muito útil para a segmentação de imagens.

3.2 Otimização Combinatória


Em linhas gerais, um problema de otimização tem como objetivo maximizar ou
minimizar uma função objetivo definida sobre um certo domínio. A teoria clássica considera
este domínio sendo infinito. Entretanto, existem problemas especiais, classificados como
de otimização combinatória, onde o domínio é finito (10). Embora seja possível encontrar
a solução ótima realizando uma busca exaustiva pelo conjunto de soluções, o custo
computacional de se realizar isto é muito grande. Com base nesta afirmativa, a área de
combinação combinatória busca utilizar técnicas algorítmicas capazes de achar a solução
ótima exata ou aproximada sem utilizar a busca exaustiva.
Existem poucos trabalhos na literatura centrados na utilização de técnicas de
otimização para realizar a diminuição. Dentro desta área restrita, pode-se citar o trabalho
de Junttila et al. (11), que utiliza a minimização de número de parcelas atráves de critérios
maximizadores de relevância da área. Neste trabalho, assume-se que a área florestal pode
ser particionada em N áreas fixas, que correspondem às parcelas de inventário florestal.
Dentre as N parcelas disponíveis, n ≤ N parcelas são selecionadas de acordo com os
critérios adotados de otimização. Para o armazenamento das parcelas mais representativas,
é utilizado um vetor f de tamanho n que armazena os índices destas parcelas, i.e., cada
elemento fj , j = 1, · · · , n é um índice que referencia um conjunto de pontos das parcelas
ótimas.
Existem diversas formas de escolher uma configuração ótima de f . Uma delas
baseia-se na minimização da variância do erro, configurando-se uma minimização do erro
estatístico do modelo. Contudo, uma abordagem mais direta em relação as coordenadas
dos pontos registrados pelo LiDAR é o critério de uniformidade do espaço de covariância
em relação à área fixa. Este critério é baseado na função minimal-maximal, que maximiza
a mínima distância entre o espaço de covariância entre as parcelas. Esta função pode ser
obtida invertendo-se o valor mínimo da distância no espaço de covariância. A área de
estudo pode ser definida por uma matriz Z de dimensão N × q, onde q se refere ao número
20 Capítulo 3. Referencial teórico

de variáveis em Z. A distância euclidiana quadrática entre linhas i e j de Z é definida


pela função d(i, j) = qk=1 (Zi,k − Zj,k )2 . A definição da função minimal-maximal é (11):
P

1
um,Z (f ) = , i, j ∈ f e i 6= j
min d(i, j)

Utilizando este modelo, várias abordagens podem ser utilizadas para a localização de
parcelas ótimas disponíveis na literatura, como Simulated Annealing, algoritmos evolutivos
e outras técnicas de otimização que podem ser exatas ou aproximadas.

3.3 Agrupamento de pontos utilizando clustering


Diversas abordagens podem ser utilizadas para a realização de agrupamento de
pontos. Na literatura, Chehata et al. (12) e muitos outros pesquisadores abordaram o
método de clusterização k-means para abordar o problema em questão. Contudo, o método
não é uma boa escolha para este escopo. Como explicitado por Grigsby (13), o método
k-means possui três problemas que tornam o uso do método inadequado. Primeiramente,
o k-means assume que se sabe o número de objetos procurados, o que não ocorre neste
caso. Em segundo lugar, a configuração dos dados não é respeitada na construção dos
clusters pelo método. Por último, todos os pontos estão associados a algum cluster, o
que requer um pré-processamento e filtros robustos dos dados, o que não é possível de
se realizar dentro do cenário de aplicação. Outra abordagem utilizada, porém atrativa e
mais adequada para a resolução do problema é a clusterização por densidade de pontos.
Utilizando algoritmos de densidade baseada em clustering hierárquico como o DBSCAN
e o OPTICS, é possível separar os pontos de interesse dos demais, inclusive os pontos
afetados pelo ruído, o que torna interessante a sua aplicação no contexto da utilização
da tecnologia LiDAR. Ambos os algoritmos utilizam um determinado número mínimo de
pontos que estão a uma distância  para os membros do grupo de pontos de interesse e
determina a construção dos clusters por adjacência dos pontos de interesse (13). Portanto,
os algoritmos DBSCAN e OPTICS são indicados para serem usados em uma possível
redução da dimensionalidade dos dados do LiDAR.
21

4 Cenário de aplicação

Esta seção descreve o cenário de aplicação estudado, descrevendo os VANTs utili-


zados, a massa de dados produzida pelo equipamento LiDAR, assim como outros tópicos
relevantes para o conhecimento do cenário do projeto.

4.1 Utilização do VANT para obtenção dos dados


Para realizar a coleta de dados, o INPA utiliza um quadricóptero da marca
Microdrones R
, adaptado para ser capaz de transportar o equipamento LiDAR. Este
VANT possui autonomia de aproximadamente 35 minutos e consegue percorrer altitudes
elevadas, tendo sucesso em voos realizados a 500 metros de altitude (1). O equipamento é
bastante estável e resistente às diversas condições climáticas, sendo este o motivo primário
pela escolha deste modelo para realizar a pesquisa em uma região de floresta densa. Outra
característica marcante do equipamento é a funcionalidade de piloto automático, que
permite ao controlador planejar a rota de voo a ser percorrida e segui-la automaticamente
durante o trajeto. Para permitir o controle da localização do veículo, o VANT é equi-
pado com um GPS (Global Position System) de boa precisão, embora inferior aos outros
equipamentos GPS de alta precisão devido à restrição de altura e peso.

Figura 3 – Foto do VANT utilizado no cenário de aplicação (modelo md4-1000). Fonte:


(1).

Entretanto, devido ao peso adicional do equipamento LiDAR, o VANT demanda


mais energia para realizar o sobrevoo e portanto, a duração da bateria diminui para
20 minutos de autonomia. Além disso, a característica densa da floresta amazônica não
permite o alcance ideal do sinal de GPS, tornando a altitude máxima de operação máxima
do veículo limitada. Durante às visitas à estação experimental ZF-2, o autor deste relatório
pôde acompanhar todo o processo de sobrevoo do VANT, equipado com a tecnologia
LiDAR. Percebeu-se um grande cuidado com toda a operação do equipamento, desde o
transporte até a finalização do voo do veículo aéreo. A preocupação é compreensível, visto
que o VANT e o equipamento LiDAR que é acoplado ao sistema são extremamente caros e
22 Capítulo 4. Cenário de aplicação

de difícil aquisição e manutenção. O operador do VANT possui a sua disposição um controle


remoto avançado para o controle da trajetória. Embora o piloto automático seja capaz
de decolar e pousar o veículo, os operadores utilizam o controle manual até que o UAV
tenha alcançado 80 metros de altitude, devido a facilidade maior de alcance de sinal do
GPS fora da região de floresta. A visualização dos dados de voo, como altitude, velocidade
do vento, angulação do quadricóptero e intensidade do sinal de GPS é transmitido dos
sensores do equipamento através de um emissor de radiofrequência e um receptor acoplado
ao computador do operador e controlado pelo software mdCockpit R
disponibilizado junto
com o equipamento.

Figura 4 – Software utilizado na elaboração e controle do trajeto. Fonte: (1)

4.2 Base de dados


A base de dados é relativamente simples. Para armazenar informações interessantes
utilizando a tecnologia à laser, dados de cunho geoespacial e de temporização são arma-
zenados para serem utilizados por uma gama de aplicações. A tabela abaixo caracteriza
todos os campos armazenados pelo equipamento LiDAR.
Entretanto, para o escopo do projeto apenas os campos x, y, z (altitude) do ponto
são necessários, com a possibilidade de utilizar o campo de retorno da intensidade do laser
em um momento futuro. Portanto, a massa de dados decorrente do funcionamento pode
passar por uma redução do número de atributos, eliminando os campos não interessantes
dentro da base de dados preliminar. Os atributos são numéricos e simples, pois representam
a posição de um ponto no espaço. O problema em si dessa base de dados é a quantidade
4.2. Base de dados 23

de amostras a serem tratadas. É interessante mencionar que a base de dados utilizada


foi obtida com os pesquisadores de geotecnologia do Instituto Nacional de Pesquisas da
Amazônia (INPA), e é proveniente de um sobrevoo rápido e experimental em uma pequena
área contida na Estação Experimental de Silvicultura ZF-2. Contudo, a duração do voo
de teste foi menor que o usual, embora seja significativa e suficiente para realizar os
devidos testes. Entretanto, mesmo com uma quantidade menor de dados, a base de dados
utilizada possui aproximadamente 3 milhões de pontos, o que já proporciona um esforço
computacional considerado.
24 Capítulo 4. Cenário de aplicação

Nome do Campo Tipo


GPS Time (sec) Registra o tempo exato em segun-
dos através do GPS.
UTM Zone Informa a zona UTM do local ima-
geado.
X of UAV* (m) Campo relativo a posição do
VANT no eixo X.
Y of UAV* (m) Campo relativo a posição do
VANT no eixo Y.
Z of UAV* (m) Campo relativo a posição do
VANT no eixo Z.
Relative height (m) Distância vertical relativa entre o
veículo e o ponto.
Roll (degree) Angulação entre o eixo X e a po-
sição do VANT.
Pitch (degree) Angulação entre o eixo Y e a po-
sição do VANT.
Yaw (degree) Angulação entre o eixo Z e a posi-
ção do VANT.
Angle (degree) Ângulo entre o ponto registrado e
o equipamento.
Layer Number Identifica a camada de observação.
Distance (m) Distância euclidiana relativa entre
o veículo e o ponto.
X of scattering point (m) Posicionamento relativo do ponto
em relação a coordenada X.
Y of scattering point (m) Posicionamento relativo do ponto
em relação a coordenada Y.
Altitude of scattering point (m) Posicionamento relativo do ponto
em relação a coordenada Z.
Relative height of scattering point (m) Distância vertical relativa entre o
ponto origem e o ponto registrado.
X of point (m) Posicionamento absoluto do ponto
em relação a coordenada X.
Y of point (m) Posicionamento absoluto do ponto
em relação a coordenada Y.
Altitude of point (m) Posicionamento absoluto do ponto
em relação a coordenada Z.
Relative height of point (m) Distância vertical absoluta entre
um ponto médio e o ponto regis-
trado.
Tabela 3 – Tabela de atributos presentes na base de dados
25

5 Métodos utilizados e Resultados

Com a base de dados presente, a primeira tarefa foi descobrir se apenas as co-
ordenadas X, Y e Z dos pontos eram suficientes para registrar todas as características
da área estudada. Com base nos trabalhos de Kraus (14), foi constatado que o fato era
possível. Tendo base esta revisão da literatura, o autor decidiu estudar o comportamento
dos dados e validar a hipótese colocando as informações do LiDAR em um gráfico. Para
isso, foi utilizado o programa GNUPlot, um programa livre para elaboração de gráficos.
Para representar os dados de forma efetiva, foi utilizada uma escala de cores em função da
altitude dos pontos coletados. Foi definido que os pontos com cor mais azulada seriam de
menor altitude, enquanto os de tons avermelhadores teriam altitude maior. A angulação
da imagem em torno do eixo X , Y e Z foram rotacionadas de modo que apresentasse
melhor o cenário de estudo. Para os gráficos gerados, os critérios abordados foi a rotação
da imagem em torno do eixo X em 120◦ , 60◦ em Y e em relação ao eixo Z diferenciado
para cada imagem gerada. A primeira utiliza 0◦ de rotação, a segunda 30◦ e a terceira 60◦ .
A seguir, tem-se os gráficos gerados através do programa GNUPlot 1 utilizando a base de
dados LiDAR obtida.

Figura 5 – Visualização da base de dados com rotação do eixo Z em 0◦ , fornecendo visão


em vista aérea.

O VANT, além de transportar o equipamento LiDAR, possui uma câmera de


alta resolução acoplada, o que permite a utilização da mesma para realizar fotografias.
Utilizando esta funcionalidade, o bolsista utilizou as imagens fotográficas para observar
se o padrão dos gráficos correspondiam com a realidade. O resultado foi positivo, uma
vez que o padrão entre os dois tipos de dados casavam-se perfeitamente. Na fotografia
1
GNUPlot é um programa livre, utilizado para elaboração de gráficos, licenciado sob a licença GNU.
26 Capítulo 5. Métodos utilizados e Resultados

Figura 6 – Visualização da base de dados com rotação do eixo Z em 30◦ , fornecendo visão
em vista aérea e lateral.

Figura 7 – Visualização da base de dados com rotação do eixo Z em 60◦ , fornecendo visão
em vista aérea e lateral.

abaixo, pode-se observar que a parcela de floresta analisada está sendo cortada por duas
estradas transversais de terra, o que corresponde ao encontro das estradas, indicado pelas
representações gráficas em azul, devido à natureza da estrada possuir altitude menor que
os dosséis das árvores.
Portanto, a primeira hipótese é válida, logo existe a possibilidade de aplicar técnicas
computacionais baseadas apenas nas coordenadas de cada ponto da superfície no espaço,
utilizando a latitude, a longitude e a altitude. A segunda hipótese efetuada, com base
na primeira, é a possibilidade de utilizar métodos baseados em Mineração de Dados e
Otimização Combinatória para a redução da dimensionalidade da base de dados. Como
explicitado no referencial teórico, Chehata et al. (12) utiliza o método de clusterização
k − means para separar os pontos mais elevados dos pontos menos elevados. Como o
modelo atual considera as árvores mais frondosas as mais representativas para o mesmo,
5.1. Algoritmo de Determinação da Altura Média 27

Figura 8 – Fotografia obtida durante a coleta de dados pelo equipamento LiDAR. Fonte:
INPA

é possível reduzir a quantidade de pontos eliminando aqueles que não pertencem às


regiões mais altas e que ocupam maior área no espaço. Entretanto, Grigsby (13), aponta
diversas limitações do método k − means (vide seção Referencial Teórico). Outra conclusão
importante obtida neste projeto de pesquisa é a possibilidade de modelar os dados como
um grafo. Considerando que cada vértice v ∈ V represente um ponto captado pelo LiDAR
e que a aresta e ∈ E represente a relação de adjacência entre dois pontos, e que cada
vértice contenha um rótulo que identifique as coordenadas no espaço X, Y e Z, pode-se
utilizar como peso das arestas a dissimilaridade entre a coordenada Z dos dois pontos, i.e.,
a diferença entre os valores de altitude de dois pontos vizinhos mais próximos. Analisando
o referencial teórico, pode-se concluir também que é possível utilizar técnicas de otimização
no cenário de aplicação, reduzindo assim a gama de dados obtidos pelo LiDAR.

5.1 Algoritmo de Determinação da Altura Média


Dentre os diversos problemas práticos apresentados, o escolhido para este escopo
de projeto foi a determinação da altura média das árvores. Isso se deve ao fato que a
altura média de uma região de floresta é uma variável importante para o modelo usado
para o cálculo da biomassa. Para realizar tal cálculo, é necessário entender os conceitos
relacionados ao Modelo Digital de Terreno e Modelo Digital de Superfície. Como visto
anteriormente, o produto da tecnologia LiDAR é um conjunto de pontos (conhecido como
nuvem de pontos) da região analisada. Entretanto, uma forma de representar de forma
concisa e útil é prover uma representação de alta resolução da superfície dos objetos (que
neste cenário de estudo são os dosséis das árvores) na forma de um modelo digital de
superfície (Digital Surface Model) (15). Além do Modelo Digital de Superfície, é importante
obter também o Modelo Digital de Terreno (Digital Terrain Model). A diferença principal
entre os dois modelos é que enquanto o modelo digital de superfície representa a superfície
28 Capítulo 5. Métodos utilizados e Resultados

do objeto de estudo, o modelo digital de terreno representa toda a elevação do terreno onde
os objetos estão presentes, desconsiderando os obstáculos (16). Nesse caso, para calcular
a altura média das árvores através dos dados, basta calcular a diferença entre os pontos
presentes no Modelo Digital de Superfície e do Modelo Digital de Terreno (15). Baseado
neste princípio, foi projetado um algoritmo para a determinação da altura média da região
com base nos dados LiDAR.

Entrada: Base de dados devidamente filtrada resultante do sobrevoo do VANT


equipado com o equipamento LiDAR
Saída: Altura média da vegetação proveniente da base de dados
Estrutura Ep ←− pontos X, Y e Z do arquivo
enquanto Existir elemento em Ep faça
Pp ←− subregião de Ep
Insira k seed-points na região, de modo que a dispersão dos pontos seja a maior
possível em Pp
for cada seed-point do
Realiza uma busca local na adjacência do ponto
DT Mp ←− pontos com menores altitudes menos variantes
DSMp ←− pontos com maiores altitudes menos variantes
se (DSMp − DT Mp ) > limiar T então
p −DT Mp )
AlturasM ediasp ←− (DSMn|P p|

fim
end
fim
Retorne a média dos elementos de AlturasM ediasp
Algoritmo 1: Algoritmo de Determinação da Altura Média da Vegetação
A ideia principal do algoritmo é relativamente simples. Primeiramente, divide-se
todo o espaço de pontos presentes no arquivo em diversas regiões uniformes, guardando-os
em uma estrutura computacional apropriada. A seguir, para cada subregião, define-se um
conjunto de pontos presentes na área denominados seed-points, de modo que eles sejam os
mais dispersos possíveis entre si, com a finalidade de maximizar o alcance da busca local
por pontos na região do modelo digital de terreno (pontos com menores altitudes menos
variantes) e dos pontos contidos no modelo digital de superfície (pontos com maiores
altitudes menos variantes). Se a diferença dos valores dos dois modelos forem maior que um
limiar de altitude definido pelo usuário, eles são incluídos na estrutura AlturasM ediasp .
Finalmente, o algoritmo retorna a média dos valores contidos na estrutura citada.
Este algoritmo está sendo continuamente desenvolvido e melhorado, e será apresen-
tado em um momento futuro.
29

6 Considerações finais

De acordo com os resultados obtidos, torna-se visível que a aplicação de técnicas de


otimização combinatória, aliada com a área de teoria dos grafos e aplicações de mineração
de dados baseadas em agrupamento é viável e é ainda um tema relativamente recente,
demonstrando que existe muito espaço para a pesquisa em torno da tecnologia LiDAR
em uma abordagem computacional. É importante salientar que enquanto realizava a
revisão da literatura, o ator deste relatório científico pôde perceber que esta área de
aplicação é fortemente atrelada a área de engenharia florestal e matemática aplicada,
conferindo soluções fortemente estatísticas. Entretanto, é possível considerar o problema
em torno da dimensionalidade dos dados LiDAR de acordo com a perspectiva da área
de ciência da computação. Por exemplo, foi visto que a nuvem de pontos pode ser
modelada como uma estrutura baseada em grafos, o que confere a utilização da teoria dos
grafos para a modelagem do problema. Foi visto também que utilizando esta abordagem,
é possível realizar tarefas complexas com custos computacionais razoáveis, como por
exemplo, o reconhecimento e segmentação individual de árvores emergentes e dominantes.
Para a realização de trabalhos futuros, pretende-se refinar o modelo teórico existente
e aplicar experimentos, utilizando abordagens exatas e aproximativas para o problema.
Outra realização esperada para trabalhos futuros é uma abordagem mais consistente na
representação através de estruturas baseadas em grafos e compará-las com os modelos
utilizados na literatura, analisando a velocidade e precisão entre os resultados da literatura
com os resultados desta abordagem de resolução do problema.
31

Referências

1 MICRODRONES, C. Information for md4-1000. 2014. Disponível em: <http:


//microdrones.com/products/md4-1000/md4-1000-key-information.php>. Citado 3 vezes
nas páginas 5, 21 e 22.

2 MATHER, P. M. Computer Processing of Remotely-Sensed Images: An Introduction.


[S.l.]: Wiley Chichester et al., 1987. Citado na página 9.

3 HIGUCHI, M.; HIGUCHI, N. A Floresta Amazônica e suas múltiplas dimensões: uma


proposta de educação ambiental. [S.l.]: INPA; [Brasília]: CNPq, 2004. ISBN 9788590354925.
Citado na página 9.

4 GALVÃO A.C.F. E LOURENÇO, A.; MOUTINHO, P. REDD no Brasil, um enfoque


amazônico: fundamentos, critérios e estruturas institucionais para um regime nacional de
Redução de Emissões por Desmatamento e Degradação florestal - REDD. [S.l.]: Centro de
Gestão e Estudos Estratégicos, 2011. ISBN 9788560755394. Citado na página 10.

5 GRASSI, G. et al. Applying the conservativeness principle to redd to deal with the
uncertainties of the estimates. Environmental Research Letters, v. 3, n. 3, p. 5005, 2008.
Citado na página 10.

6 HOCHREITER, R.; WALDHAUSER, C. An evolutionary approach towards clustering


airborne laser scanning data. arXiv preprint arXiv:1401.4848, 2014. Citado na página 11.

7 MALMBERG, F. Image Processing using Graphs. 2009. Disponível em:


<http://www.cb.uu.se/~filip/ImageProcessingUsingGraphs/>. Citado 4 vezes nas
páginas 5, 17, 18 e 19.

8 ZIVIANI, N. Projeto de algoritmos: com implementações em Pascal e C. [S.l.]: Cengage,


2011. ISBN 9788522110506. Citado na página 17.

9 SKIENA, S. The Algorithm Design Manual. [S.l.]: Springer, 1998. (Computer Science:
Algorithm Design). ISBN 9780387948607. Citado na página 17.

10 KEIDI, M. F. Otimização Combinatória. 2014. Disponível em: <http:


//www.ic.unicamp.br/~fkm/problems/combopt.html>. Citado na página 19.

11 JUNTTILA, V. et al. Strategies for minimizing sample size for use in airborne
lidar-based forest inventory. Forest Ecology and Management, Elsevier, v. 292, p. 75–85,
2013. Citado 2 vezes nas páginas 19 e 20.

12 CHEHATA, N.; DAVID, N.; BRETAR, F. Lidar data classification using hierarchical
k-means clustering. In: ISPRS Congress Beijing 2008. [S.l.: s.n.], 2008. v. 37, p. 325–330.
Citado 2 vezes nas páginas 20 e 26.

13 GRIGSBY, S. Spatial clustering in python: Processing lidar points into objects.


Citado 2 vezes nas páginas 20 e 27.
32 Referências

14 KRAUS, K.; PFEIFER, N. Determination of terrain models in wooded areas with


airborne laser scanner data. ISPRS Journal of Photogrammetry and remote Sensing,
Elsevier, v. 53, n. 4, p. 193–203, 1998. Citado na página 25.

15 PALENICHKA, R. M.; ZAREMBA, M. B. Scale-adaptive segmentation and


recognition of individual trees based on lidar data. In: Image Analysis and Recognition.
[S.l.]: Springer, 2007. p. 1082–1092. Citado 2 vezes nas páginas 27 e 28.

16 ANDERSEN, H.-E.; MCGAUGHEY, R. J.; REUTEBUCH, S. E. Estimating forest


canopy fuel parameters using lidar data. Remote sensing of Environment, Elsevier, v. 94,
n. 4, p. 441–449, 2005. Citado na página 28.

Você também pode gostar