Escolar Documentos
Profissional Documentos
Cultura Documentos
Marcelo Becker
Métodos e Procedimentos
Dentre os modelos existentes para realização
da classificação e detecção de objetos, a rede
Figura 1: Robô TerraSentia e sua câmera.
YOLOv3 foi a escolhida para os primeiros
testes do projeto. A principal razão foi a Um novo dataset foi construído a partir desses
existência de implementações prontas para uso dados utilizando a ferramenta Computer Vision
feitas pela comunidade online e os bons Annotation Tool (CVAT). Ela possibilita a
resultados já apresentados em aplicações com marcação das imagens com caixas padrões,
utilizadas no treinamento para otimizar os EB = (ngpred – ngtpred)/npred (Equação 4)
parâmetros da rede. O dataset final tem um
EBOT = (ngpred – ngtpred)/nvtotal (Equação 5)
total de mil imagens, sendo 750 delas utilizadas
para treinamento e 250 para validação. NC = (ngt – ngtpred)/ngt (Equação 6)
Resultados A média dos cinco novos parâmetros em
relação ao dataset de validação está retratada
Alguns exemplos de predições da rede podem na Tabela 1.
ser vistos na Figura 2. Nela, as imagens a e b
representam exemplos onde a rede identificou mAP mP mC mEB mEBOT mNC
plantas não previstas nas caixas padrão e as
imagens c e d representam exemplos onde a 65,70% 93,88% 62,61% 31,48% 26,18% 25,71%
rede falhou em identificar as caixas padrão.
Tabela 1: média das métricas do modelo YOLOv3
Geralmente, em uma tarefa de detecção de
objetos, utiliza-se uma métrica chamada de Observando a Tabela 1, é possível concluir que
Mean Average Precision (mAP), responsável a precisão média (mP) do modelo é
por medir quanto as predições conseguiram se relativamente boa (93,88%). Apesar de apenas
aproximar das caixas padrão. O valor obtido 62,61% (mC) coincidirem com as caixas
para o mAP foi de 65,70%. Essa métrica, padrão, 31,48% (mEB) das predições eram
porém, não é completamente adequada, já boas e não coincidem com as caixas padrão.
que, devido à subjetividade do processo de Considerando o total de plantas em cada
marcação do dataset, nem todas as plantas imagem, 26,18% (mEBOT) das predições não
foram indicadas com caixas padrão em todas tem nenhuma referência anterior no dataset.
as imagens. No entanto, 25,71% (mNC) das caixas padrão
não foram identificadas pelo modelo.
Conclusões
No desenvolvimento de algoritmos de SLAM
com Deep Learning, este projeto propôs a
identificação de características no meio
agrícola. Os resultados indicam que o modelo
YOLOv3 realizou a tarefa de detecção de
objetos com sucesso. Para antigir melhores
resultados, recomenda-se a expansão e
diversificação do dataset, bem como a
Figura 2: Algumas predições da rede YOLOv3 (em participação de mais pesquisadores em sua
amarelo) e caixas padrão (em rosa). produção.
Para contornar esse problema, novas métricas Este projeto foi desenvolvido nas dependências
foram definidas. Nas 250 imagens de do Laboratório de Robótica Móvel (LabRoM,
validação, o número de caixas padrões (ngt) e o EESC-USP). Teve apoio da FAPESP
número de predições (npred) foram medidas. (processos nº 2020/11262-0 e nº 2018/10894-
Além disso, foram contadas o número de boas 2) e da empresa EarthSense pela doação de
caixas de predição (ngpred) e o número delas um exemplar do robô TerraSentia.
que coincidem com as caixas padrão (ngtpred). O
termo “boa predição” é definido pela inclusão
Referências Bibliográficas
da maioria dos pixels de uma planta. O número QIAN, Z. et al.Semantic SLAM with Autonomous
“total” de plantas identificáveis (nvtotal) pode ser Object-Level Data Association. 2020.
definido pela Equação 1 e as novas métricas REVICH, J. et al. Precision Farming - Cheating
pelas Equações 2 a 6. Malthus with Digital Agriculture. [S.l.],2016. 4–5/18
XIAO, L. et al. Dynamic-slam: Semantic monocular
nvtotal = ngt + (ngpred – ngtpred) (Equação 1) visual localization and mapping basedon deep
learning in dynamic environment.Robotics and
P = ngpred/npred (Equação 2) Autonomous Systems, v. 117, p. 1 –16, 2019. ISSN
C = ngtpred/npred (Equação 3) 0921-8890.