Jonathan Richetti2018

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ
CAMPUS CASCAVEL
CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA
MODELOS AGROMETEOROLÓGICOS, ESPECTRAIS E DE INTELIGÊNCIA ARTIFICIAL
PARA ESTIMAÇÃO DE PRODUTIVIDADE DE SOJA
JONATHAN RICHETTI
CASCAVEL
2018
UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ
CAMPUS CASCAVEL
CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA
Tese submetida à banca examinadora para a

obtenção do título de Doutor em Engenharia
Agrícola na área de concentração de Sistemas
Biológicos e Agroindustriais, com a temática
Geoprocessamento, Estatística Espacial e
Agricultura de Precisão.
Orientador: Prof. Dr. Jerry Adriani Johann

Coorientador: Prof. Dr. Miguel Angel Uribe
Opazo
Cascavel – Paraná – Brasil

Dezembro – 2018
Revisão do texto e das normas: Dhandara Capitani
ii
ii
BIOGRAFIA
Jonathan Richetti, nascido em 26 de janeiro de 1990, natural do município de

Cascavel, no Paraná, cursou o ensino fundamental e médio no Colégio Nossa Senhora
Auxiliadora, finalizando o ensino médio em 2007. É graduado Engenheiro Agrícola pela
Universidade Estadual do Oeste do Paraná com Menção Honrosa pela 3ª Colocação Geral
entre os Formandos 2012. Ingressou no Programa de Pós-Graduação em Engenharia
Agrícola no ano de 2013, finalizando o mestrado em 2015, mesmo ano em que entrou
novamente para o programa como aluno de doutorado. Em 2017 foi contemplado com bolsa
de doutorado sanduíche (PDSE Edital nº 19/2016 – processo nº 88881.131979/2016-01) na
Universidade da Flórida, sob orientação do professor emérito Dr. Kenneth Jay Boote. Durante
seu estágio no exterior, recebeu prêmio de melhor apresentação oral da Airborne and Remote
Sensing Community da American Society of America, categoria doutorandos durante a ASA-
CSSA-SSSA Annual Meeting, em Tampa, FL entre 22 e 25 de outubro de 2017 – Managing
Global Resources for a Secure Future.
iii
Dedico esta tese a minha esposa, Amanda Bordin
Richetti, que ajudou-me e apoiou-me durante o
doutorado, nos bons e não tão bons momentos.
iv
AGRADECIMENTOS
Agradeço
A Deus, por todas as oportunidades e conquistas durante esta caminhada;
À minha esposa, pelo amor, carinho e apoio;
Aos meus pais, Janio Richetti e Maria Aparecida Andriolo Richetti, pelo amor e apoio;
Aos meus orientadores, Dr. Jerry A Johann e Dr. Miguel Angel Uribe Opazo, da
Universidade Estadual do Oeste do Paraná, e Dr. Kenneth J. Boote e Dr. Jasmeet
Judge, da Universidade da Flórida;
Aos meus colegas e amigos do núcleo GeoScience na Universidade Estadual do
Oeste do Paraná;
Aos meus colegas e amigos do Center for Remote Sensing na Universidade da Flórida;
Aos meus familiares e amigos, pelo apoio e amizade;
À CAPES, pelo apoio financeiro na forma de bolsa de doutorado sanduíche.
v
RESUMO: Questões agrícolas globais e locais são levantadas frequentemente devido ao

constante crescimento da demanda por alimentos e flutuações no preço das commodities.
Pode-se obter informações sobre a produção agrícola de uma determinada região de diversas
maneiras. Dentre os diferentes métodos para estimar as produções agrícolas, estão os censos
e levantamentos subjetivos, que são os métodos utilizados pelos órgãos oficiais como IBGE
e CONAB. Estes métodos demandam tempo e recursos, fazendo com que as informações
demorem a ser disponibilizadas para consulta pública. Para melhorar a eficiência desse
processo, métodos claros e objetivos são necessários. Portanto, o objetivo da tese foi
desenvolver métodos objetivos para estimar a produtividade e a produção de soja no estado
do Paraná que possam ser aplicados também para previsão de safras agrícolas. Assim, esta
tese está dividida, fundamentalmente, em três artigos, cada um abordando um método para
estimativa de produtividade da cultura da soja com uso de dados de sensoriamento remoto e
técnicas de modelagem. O primeiro artigo aborda o uso de algoritmos de aprendizado de
máquinas e inteligência artificial em dados de sensoriamento remoto para estimar a
produtividade de soja no estado do Paraná. O segundo trata do uso de dados de
sensoriamento remoto para calibrar o modelo de crescimento CROPGRO em duas fazendas,
uma no Brasil e outra nos Estados Unidos. O terceiro apresenta a aplicação do modelo
agrometeorológico da FAO para estimar a produtividade de soja no estado do Paraná. Os
resultados do primeiro artigo apresentaram desempenhos com baixo erro médio (do inglês,
Mean Error – ME) de 3,52 kg ha-1, raiz quadrada do erro médio (do inglês Root Mean Square
Error – RMSE) de 373 kg ha-1 e índice de concordância de Wilmoott (dr) de 0,85 com os dados
obtidos de fazendas. Já o segundo artigo apresentou um ME de -3,4 kg ha-1 para
produtividade, com R2 de 89% no Paraná, Brasil. Já em Iowa, EUA, obteve-se um RMSE de
864 kg ha-1, e um dr de 0,98 para biomassa e RMSE de 904 kg ha-1 e outro dr de 0,89 para
peso de vagem. A segunda publicação mostrou que a determinação dos valores do índice de
área foliar e da interceptação da luz a partir de índices de vegetação de sensoriamento
remoto, como os dados do Índice de Vegetação por Diferença Normalizada (do inglês
Normalized Difference Vegetation Index – NDVI), podem ser usados para fins de calibração
do modelo da cultura. O terceiro artigo avaliou o software CyMP para estimar a produtividade
de soja no estado do Paraná de 2013 a 2016, obtendo diferenças a partir de 31 kg ha -1 entre
a produtividade estimada e a reportada pela CONAB.
PALAVRAS-CHAVES: Aprendizado de Máquina, Sensoriamento Remoto, Modelagem de

Cultura.
vi
AGROMETEOROLOGICAL, SPECTRAL, AND ARTIFICIAL INTELLIGENCE MODELS
FOR ESTIMATING SOYBEAN PRODUCTIVITY
ABSTRACT: Global and local agricultural issues are often raised due to the steady growth in
demand for food and the fluctuations in the commodity prices. Various forms can be used to
obtain information on the agricultural production of a particular region. Among the different
methods of estimating agricultural production, censuses and surveys are the methods used by
official institutes such as IBGE and CONAB. These methods are time consuming and labor
intensive, causing the information to be delayed. In order to improve estimates, clear and
accurate methods are needed. Therefore, the aim of this thesis is to present methods to
estimate the yield and production of soybeans in the state that also can be applied for
forecasting of agricultural yield. Thus, this thesis is divided, fundamentally, in three scientific
papers; each one approaches a method to estimate soybean yield using remote sensing data
and modeling techniques. The first paper presents the use of machine learning algorithms and
artificial intelligence in remote sensing data to estimate soybean yield in the state of Paraná.
The second one shows how remote sensing data can be used to calibrate the CROPGRO
growth model in two farms, one in Brazil and another in the United States. The third one
presents an application of the FAO agrometeorological model to estimate soybean yield in the
state of Paraná. The first paper presented performances with a mean error (ME) of 3.52 kg ha-
1
, root mean square error (RMSE) of 373 kg ha-1 and Wilmoott concordance index (dr) of 0.85
when compared with farm data. The second article shows an ME of -3.4 kg ha-1 and R2 of 89%
for yield in Paraná, Brazil. In Iowa, USA, a RMSE of 864 kg ha-1, dr of 0.98 for biomass and
RMSE, dr of 904 kg ha-1, and dr of 0.89 for pod weight were obtained. This study showed that
the determination of leaf area index and light interception values from remote sensing
vegetation indexes, such as the Normalized Difference Vegetation Index (NDVI) data can be
used for calibration purposes of the model. The third article evaluated the CyMP software to
estimate soybean yield in the state of Paraná from 2013 to 2016, obtaining differences starting
at 31 kg ha-1 between the estimated yield and reported yield by CONAB.
KEYWORDS: Machine Learning, Remote Sensing, Crop Modeling.
vii
SUMÁRIO
BIOGRAFIA ......................................................................................................................... iii
AGRADECIMENTOS ............................................................................................................ v
RESUMO .............................................................................................................................. vi
ABSTRACT ......................................................................................................................... vii
SUMÁRIO........................................................................................................................... viii
LISTA DE TABELAS............................................................................................................. x
LISTA DE FIGURAS ............................................................................................................ xi
1 INTRODUÇÃO ................................................................................................................... 1
1.1 Objetivos .............................................................................................................. 3
2 REVISÃO BIBLIOGRÁFICA .............................................................................................. 4
2.1 A Cultura da Soja ................................................................................................. 4
2.2 Sensoriamento Remoto ........................................................................................ 7
2.1.1 Modelo ECMWF......................................................................................... 8
2.2.2 MODIS ....................................................................................................... 9
2.2.3 Índices de Vegetação .............................................................................. 10
2.3 Modelos .............................................................................................................. 11
2.4 Índices de Acurácia ............................................................................................ 14
3 REFERÊNCIAS ................................................................................................................ 16
4 METODOLOGIA GERAL ................................................................................................. 20
5 ARTIGOS ......................................................................................................................... 21
5.1 Artigo I: Utilizando índice EVI baseado em fenologia e aprendizado de máquina

para estimativa de produtividade de soja no Estado do Paraná, Brasil ..................... 21
5.1.1 Introdução ................................................................................................ 21
5.1.2 Material e Métodos .................................................................................. 24
5.1.3 Resultados e Discussões ......................................................................... 30
5.1.4 Conclusões .............................................................................................. 36
Agradecimentos ................................................................................................ 37
Declaração de Divulgação ................................................................................ 37
viii
Referências ...................................................................................................... 37
5.2 Artigo II: Índice de Vegetação e Índice de Área Foliar para determinação de
parâmetros do Modelo CSM-CROPGRO-Soja para Estimativa de Produtividade .... 41
5.2.1 Introdução ................................................................................................ 41
5.2.4 Conclusões .............................................................................................. 51
Declaração de Divulgação ................................................................................ 52
Agradecimentos ................................................................................................ 52
Referências ...................................................................................................... 52
5.3 Artigo III: Estimativa de produtividade da soja no estado do Paraná com a

plataforma CyMP ...................................................................................................... 55
5.3.1 Introdução ................................................................................................ 55
5.3.4 Conclusão ................................................................................................ 63
Referências ...................................................................................................... 63
6. CONSIDERAÇÕES FINAIS ............................................................................................. 68
ix
LISTA DE TABELAS
Tabela 1 Estádios vegetativos (V) e reprodutivos (R) da cultura da soja ...................... 5

Tabela 2 Alguns produtos do sensor MODIS disponíveis ........................................... 10
Tabela 3 Principais índices de vegetação ................................................................... 11
Tabela 4 Abreviação e descrição das variáveis do EVI usadas como entrada nos
modelos de regressão de aprendizado de máquina .................................... 27
Tabela 5 Parâmetros ajustados para cada modelo usando os 5 preditores ótimos e todas
as 36 variáveis EVI como preditores ........................................................... 31
Tabela 6 Análise de Precisão de todos os MLAs com os cinco preditores de EVI ideais
e com os 36 preditores de EVI .................................................................... 32
Tabela 7 Comparação das estimativas de utilizando o EVI baseado em fenologia e o
MODIS EVI (baseado em não fenologia) com os algoritmos GBM e rF ...... 33
Tabela 8 Estatísticas descritivas da produtividade de soja (kg ha-1) real das fazendas e
dos algoritmos utilizados ............................................................................. 35
Tabela 9 Parâmetros do modelo ajustados com base em abordagens de calibração . 48
Tabela 10 Produtividade real (kg ha-1) e produtividade simulada pelo modelo com base
em três abordagens de calibração: baseada em LAI medido; LAI de
sensoriamento remoto ou LI de detecção remota, seguido por uma calibração
de produtividade ......................................................................................... 49
Tabela 11 Estatísticas das estimativas de produtividade (kg ha-1) nas fazendas do Brasil
e dos EUA por meio das diferentes calibrações .......................................... 50
Tabela 12 Estatísticas de biomassa e peso da vagem (kg ha-1) para cada abordagem
de calibração no campo americano ............................................................ 51
Tabela 13 Capacidade de retenção de água no solo (CAD) para diferentes tipos de solo
................................................................................................................... 57
Tabela 14. Estatística descritiva das estimativas de produtividade de soja (kg ha-1) para
os três anos safras em estudo .................................................................... 62
x
LISTA DE FIGURAS
Figura 1 Estádios fenológicos da soja e sua duração média: Estabelecimento,

Vegetativo, Enchimento de Grãos e Senescência. Fonte: Adaptado de Allen
et al. (1998). ................................................................................................. 4
Figura 2 Cinco maiores produtores de Soja. ................................................................. 6
Figura 3 Variação diária de preço da soja (R$/sc) de 13/03/2006 a 15/10/2018. .......... 6
Figura 4 Produto Interno Bruto (PIB) e sua relação com o agronegócio. Fonte: CEPEA
(2016). .......................................................................................................... 7
Figura 5 Série histórica de Produção e Área Colhida de soja do Brasil e do Paraná.
Fonte: CONAB (2016)................................................................................... 7
Figura 6 Distribuição espacial das Estações Virtuais do ECMWF. Fonte: Próprio autor.
..................................................................................................................... 9
Figura 7 Fluxograma geral dos artigos para estimar a produtividade de soja no estado
do Paraná. .................................................................................................. 20
Figura 8 Área de estudo do estado do Paraná no Brasil. Os círculos vermelhos
representam as 86 fazendas que foram observadas e as regiões verdes são
as áreas de cultivo de soja no estado durante a safra 2013/14 (SOUZA et al.,
2015; GRZEGOZEWSKI et al., 2016). ........................................................ 24
Figura 9 EVI baseado em fenologia usado neste estudo de quatro MLAs (GBM, GLM,
rF e GP) ...................................................................................................... 25
Figura 10 Estimativa de produtividade baseada em MODIS-EVI baseado em não-
fenologia como entradas para o MLA ......................................................... 26
Figura 11 Exemplo ilustrativo para incorporar a fenologia em EVI para criar uma variável
baseada em fenologia: EVI na data de semeadura. .................................... 27
Figura 12 RMSE normalizado entre produtividade estimada e observada de soja em
função do número de preditores utilizados. A linha horizontal mostra os
valores limite de nRMSE em 30%. ............................................................. 30
Figura 13 Gráfico de dispersão das produtividades observadas em comparação com as
produtividades estimadas com os cinco preditores selecionados pelo RFE
usando os algoritmos (a) GBM, (b) GLM, (c) rF e (d) GP. ........................... 33
Figura 14 Gráfico de dispersão das produtividades observadas nas fazendas em
comparação com as produtividades estimadas com todos os 36 preditores
utilizando algoritmos (a) GBM, (b) GLM, (c) rF e (d) GP. ............................ 34
Figura 15 Estimativa de produtividade de soja com o algoritmo GBM com todos os
preditores para todo o estado para safra 2013-2014................................... 35
xi
Figura 16 Estimativa de produtividade de soja com o algoritmo rF com cinco preditores
para todo o estado para safra 2013-2014. .................................................. 36
Figura 17 Localização das áreas em estudo nos EUA e no Brasil. ............................. 44
Figura 18 LAI (m² / m²) medido para as fazendas de soja no Brasil (círculos) e EUA
(triângulos). ................................................................................................. 45
Figura 19 Observações e simulações de séries temporais de peso de biomassa e peso
da vagem (kg ha-1) com base nos métodos de calibração para a fazenda nos
EUA. ........................................................................................................... 51
Figura 20 Mapa de localização do estado do Paraná com as Estações Virtuais (EV) do
ECMWF e localização das fazendas de produção de soja. Fonte: Souza et
al. (2015). ................................................................................................... 56
Figura 21. Fluxograma geral do trabalho. EVI: Índice de Vegetação Melhorado; DS: Data
de Semeadura; DC: Data de Colheita; CAD: Capacidade de Armazenamento
de Água; Prec.: Precipitação; ETo: Evapotranspiração de Referência; Temp.:
Temperatura; Yof: produtividade oficial; Yest: produtividade estimada. ........ 58
xii
1
1 INTRODUÇÃO
Questões agrícolas globais e locais são levantadas frequentemente devido ao

constante crescimento da demanda por alimentos e flutuações no preço das commodities
(SAKAMOTO et al., 2014). Estimativas de produtividade em escala regional e local são
importantes para o gerenciamento da micro e macroeconomia (JOHNSON, 2014). Portanto,
trabalhos que buscam melhorar a eficiência do sistema de informações agrícola e que
apresentam técnicas que aumentam a acurácia nas estimativas de produção, bem como
estudos que identificam formas de reduzir a especulação de mercado e ajudem no
gerenciamento das commodities são fundamentais. Apesar de essencial, tal monitoramento
agrícola demanda tempo e recursos.
O monitoramento da produção agrícola no Brasil é realizado pelo Instituto Brasileiro
de Geografia e Estatística (IBGE) e pela Companhia Nacional de Abastecimento (CONAB).
Estes órgãos oficiais estabelecem suas estimativas por meio de entrevistas com produtores,
cooperativas agrícolas, dados de financiamento agrícola e outras fontes. Em função do caráter
subjetivo e demorado desse tipo de estimativa, não é possível uma análise quantitativa dos
erros envolvidos. Outra limitação é a falta de informação quanto à distribuição espacial da
produção, o que vem melhorando desde 2004 com projetos como o já encerrado GeoSafras
da CONAB (JOHANN, 2012). No estado do Paraná, o órgão responsável pelo levantamento
dessas informações é o Departamento de Economia Rural do Estado do Paraná (DERAL),
que também utiliza metodologia similar à dos órgãos nacionais na quantificação das
produções do estado, sendo o DERAL o fornecedor de informações aos órgãos nacionais.
Nesse sentido, existe uma demanda para melhoria destas estimativas de produção,
especialmente no que diz respeito ao uso de mais objetivas.
Uma forma de identificar de forma mais objetiva as informações de produção agrícola
regionalmente é por meio de dados de sensoriamento remoto, que são utilizados para a
determinação de área plantada, ciclo da cultura e produtividade, obtendo, assim, a produção
final de uma determinada cultura em uma região. Brevemente, por exemplo, Becker et al.
(2017) utilizaram dados de sensoriamento remoto e técnicas de mineração de dados para
diferenciação da cultura de soja e milho no estado do Paraná, obtendo acurácia de 96,3%
índice kappa de 0,92. Da Silva et al. (2017) utilizaram imagens de satélite e algoritmos de
aprendizado de máquina para mapeamento de soja na região oeste do Paraná, obtendo
acurácia de 95,1% e índice kappa de 0,93. Johann et al. (2016) utilizaram imagens de
sensoriamento remoto orbital para determinação do ciclo da cultura da soja no estado do
Paraná, determinando datas de semeadura, pico vegetativo e colheita. Richetti et al. (2018)
utilizaram imagens orbitais e algoritmos de aprendizado de máquina para estimativa de
produtividade da soja no Paraná com erro médio de 3,5 kg ha-1. Essas técnicas e métodos
2
serão abordados com mais profundidade no Capítulo 2 desta tese (Revisão Bibliográfica).
Estes estudos mostram que é possível utilizar-se de métodos mais objetivos para agilizar e
melhorar a qualidade das informações sobre a produção agrícola em uma escala regional.
Uma melhoria nas informações de produção agrícola representaria uma mudança significativa
nas estimativas realizadas oficialmente, contribuindo, desta forma, na melhoria do
planejamento da cadeia produtiva de uma região e também do país. Essa melhoria,
consequentemente, minimizaria as atuais especulações do mercado que normalmente ditam
os preços dos produtos agrícolas.
Neste sentido, esta tese explorou métodos objetivos para melhorar as estimativas de
safra de soja no Paraná. Três abordagens com uso de dados de sensoriamento remoto e
técnicas de modelagem foram utilizadas, dando origem a três artigos. O primeiro aborda o
uso de algoritmos de aprendizado de máquinas em sensoriamento remoto para estimar a
produtividade de soja. O segundo trata do uso do sensoriamento remoto para calibrar um
modelo complexo de crescimento em duas fazendas, uma no Brasil e outra nos Estados
Unidos. O terceiro apresenta a aplicação do modelo agrometeorológico da FAO (ALLEN et
al., 1998) implementado no software Crop-Yield Modeling Plataform (CyMP – PALOSCHI,
2016) para estimar a produtividade de soja no estado do Paraná.
3
1.1 Objetivos
O objetivo geral desta tese foi avaliar três metodologias para estimar a produtividade
de soja no estado do Paraná.
Os objetivos específicos foram:
 Compreender como técnicas de aprendizado de máquina podem ser utilizadas
para estimar a produtividade da soja utilizando variáveis preditoras obtidas do perfil
espectro-temporal do índice de vegetação EVI;
 Comparar o desempenho de quatro algoritmos de aprendizado de máquina
amplamente utilizados, como o estocástico Gradient Boosting Model (GBM),
General Linear Model (GLM), Random Forest (rF) e Gaussian Process (GP) em
estimar a produtividade de soja com dados observados em fazendas;
 Implementar os algoritmos ótimos para obter a produtividade de soja para todo o
estado do Paraná;
 Avaliar se o modelo CROPGRO-Soybean pode ser calibrado com dados biofísicos
obtidos por sensoriamento remoto, testando três métodos de calibração dos
parâmetros: usando índice de área foliar medido em campo e derivado de
sensoriamento remoto e a interceptação de luz derivada de sensoriamento remoto;
ao final, comparar resultados com dados de fazendas para avaliar a viabilidade e
a precisão desses métodos;
 Utilizar o software CyMP para estimar a produtividade e a produção de soja por
pixel no estado do Paraná e comparar as estimativas obtidas com dados oficiais.
4
2 REVISÃO BIBLIOGRÁFICA
2.1 A Cultura da Soja
A soja (Glycine max (L.) Merrill) é uma planta herbácea, incluída na classe
Dicotyledoneae, ordem Rosales, família Leguminosae, subfamília das Papilionoideae,
gênero Glycine L. e é, atualmente, a cultura mais importante, economicamente, para o Brasil
e também para o estado do Paraná. A cultura da soja ocupa aproximadamente 50% da área
total destinada à produção de grãos no mundo e ao longo dos últimos 50 anos, a produção
mundial aumentou oito vezes, como resultado do aumento substancial da produtividade média
e da expansão da área cultivada. Hoje, maior parte da soja cultivada comercialmente é
destinada para a alimentação animal e humana, como um alimento rico em proteínas, para a
produção de óleo (para alimentação e uso industrial), entre outros (STEDUTO et al., 2012). A
produtividade da soja é, como de todas as culturas, dependente de alguns fatores, desde a
concentração de gás carbônico e radiação solar que a planta recebe, até a disponibilidade
nutricional e hídrica (BOOTE et al., 1998). Estas necessidades variam conforme a cultura se
desenvolve; por exemplo, Steduto et al. (2012) dividem a cultura em cinco estádios de
desenvolvimento: estabelecimento, vegetativo, florescimento, enchimento dos grãos e
senescência ou colheita (Figura 1).
Figura 1 Estádios fenológicos da soja e sua duração média: Estabelecimento, Vegetativo,

Enchimento de Grãos e Senescência.
Fonte: Adaptado de Allen et al. (1998).
5
Além desta classificação geral da cultura, Fehr e Caviness (1977) apresentaram uma
classificação mais detalhada, dividindo a cultura em diversos estádios vegetativos e
reprodutivos (Tabela 1). Cada um destes estádios apresenta necessidades fisiológicas
diferentes; por exemplo, a necessidade hídrica é maior em dois períodos de desenvolvimento
da soja, no estabelecimento ou germinação (VE e VC), e na floração, ou seja, no
estabelecimento e no enchimento dos grãos (FARIAS et al., 2007). Portanto, para a correta
estimativa da produtividade da cultura é essencial o entendimento de suas fases fenológicas.
Tabela 1 Estádios vegetativos (V) e reprodutivos (R) da cultura da soja

Estádio Denominação Descrição
VE Emergência Os cotilédones estão acima da superfície do solo
VC Cotilédone desenvolvido Cotilédones totalmente abertos
V1 Primeiro nó As folhas unifolioladas estão completamente abertas
V2 Segundo nó Primeira folha trifoliolada aberta
V3 Terceiro nó Segunda folha trifoliolada aberta
Vn Enésimo nó “Enésimo” nó ao longo da haste principal com trifólio
aberto
R1 Início do florescimento Uma flor aberta em qualquer nó da haste principal
R2 Florescimento pleno Maioria das inflorescências da haste principal com
flores abertas
R3 Início da frutificação Vagens com 0,5 a 1,5 cm de comprimento no terço
superior da haste principal
R4 Frutificação plena Maioria das vagens no terço superior da haste principal
com comprimento de 2 a 4 cm (“canivete”)
R5.1 Início da granação Até 10% da granação máxima na maioria das vagens
localizadas no terço superior da haste principal
R5.2 Maioria das vagens no terço superior da haste principal
entre 10 e 25% da granação máxima
R5.3 Média granação Maioria das vagens no terço superior da haste principal
com 25 a 50% da granação máxima
R5.4 Maioria das vagens no terço superior da haste principal
entre 50 e 75% da granação máxima
R5.5 Final da granação Maioria das vagens no terço superior da haste principal
com 75 a 100% da granação máxima
R6 Semente formada ou 100% de granação. Maioria das vagens no terço
granação plena superior contendo sementes verdes em seu volume
máximo (“vagem gorda”)
R7.1 Maturidade fisiológica Até 50% de folhas e vagens amarelas
R7.2 Entre 50 e 75% de folhas e vagens amarelas
R7.3 Acima de 75% de folhas e vagens amarelas
R8.1 Desfolha natural Até 50% de desfolha
R8.2 Acima de 50% de desfolha. Aproxima-se o ponto de
colheita
R9 Maturidade a campo 95% de vagens com a cor da vagem madura
Fonte: Miguel e Câmara (2006)
O entendimento da cultura da soja é de grande interesse, pois o mercado de soja

mundial movimenta bilhões de dólares por ano e o Brasil tem influência direta nesse mercado,
despontando como segundo maior produtor do mundo (FAOSTAT, 2016). A produção de soja
brasileira corresponde a 30% da produção mundial (Figura 2).
6
120
Produção de Soja (milhões de ton)

100
80
60
40
20
0
Estados Unidos Brasil Argentina Ucrânia Índia
Figura 2 Cinco maiores produtores de Soja.

Fonte: FAOSTAT (2016)
As variações na produção são responsáveis pelas variações de preço no mercado

(Figura 3), sendo que quanto maior a produção global menor são os preços; porém, a
tendência de aumento médio existe. Os preços também são influenciados por previsões e
estimativas oficiais e de órgãos de pesquisa e especulações do próprio mercado. Observa-se
que o preço praticado no mercado aumentou desde 2006:
R$ 120
R$ 100
R$ 80
R$ 60
R$ 40
R$ 20
R$ 0
13/03/2006
21/07/2006
28/11/2006
09/04/2007
13/08/2007
19/12/2007
02/05/2008
04/09/2008
12/01/2009
21/05/2009
24/09/2009
03/02/2010
14/06/2010
18/10/2010
23/02/2011
04/07/2011
08/11/2011
15/03/2012
20/07/2012
27/11/2012
09/04/2013
13/08/2013
16/12/2013
29/04/2014
02/09/2014
08/01/2015
19/05/2015
22/09/2015
01/02/2016
09/06/2016
13/10/2016
17/02/2017
29/06/2017
03/11/2017
15/03/2018
20/07/2018
Figura 3 Variação diária de preço da soja (R$/sc) de 13/03/2006 a 15/10/2018.

Fonte: CEPEA/ESALQ.
O mercado agrícola brasileiro, responsável por mais de 20% do Produto Interno Bruto
(PIB), tem impacto direto na economia nacional (CEPEA, 2016). Essa importância é
observada historicamente, em 1995 o PIB advindo do agronegócio (Agro-PIB) gerou 0,8
bilhões de reais (24% do PIB nacional) e em 2015 gerou 1,3 bilhões d reais (21% do PIB
nacional) (Figura 4).
7
30
6
25
Valores (bilhões de R$) 5
Percentual (%)
20
4
15
3
2 10
1 5
0 0
Percentual do PIB (%) Agro-PIB (R$) PIB (R$)
Figura 4 Produto Interno Bruto (PIB) e sua relação com o agronegócio.

Fonte: CEPEA (2016).
A produção total de soja na safra 2017/2018 no Brasil foi de 112 milhões de toneladas;
o Paraná foi responsável por 16,4% dessa produção, sendo o segundo maior estado produtor
de soja no Brasil, atrás apenas do Mato Grosso (CONAB, 2018). O Paraná produziu em
2017/2018 um total de 18 milhões de toneladas de soja, produção superior à China, 4º maior
produtor mundial de soja. Além disso, o Paraná não apresenta expansão de área, seu
crescimento de produção deve-se à melhora da produtividade (Figura 5). Portanto, métodos
claros e objetivos para determinar a produção de soja são importantes.
40000 140000
Área Plantada (mil ha)
35000
Produção (mil t)
120000
30000 100000
25000
80000
20000
60000
15000
10000 40000
5000 20000
0 0
Área Plantada (mil ha) Área Plantada - PR (mil ha)

Produção (mil t) Produção - PR (mil t)
Figura 5 Série histórica de Produção e Área Colhida de soja do Brasil e do Paraná.

Fonte: CONAB (2016).
2.2 Sensoriamento Remoto
Campbell e Wynne (2011) definem sensoriamento remoto como sendo a prática de

obter informações sobre as superfícies terrestre e aquática da Terra, utilizando imagens
obtidas a partir de uma perspectiva elevada, usando radiação eletromagnética em uma ou
mais regiões do espectro eletromagnético, refletida ou emitida a partir da superfície da Terra.
Desde a coleta de informações diretas de localização e altitude a índices de vegetação,
8
proporcionam a obtenção de informações indiretas, que são normalmente disponibilizadas em

forma de imagens de satélite (RICHETTI, 2015). Nas próximas seções exemplos de fontes de
dados de sensoriamento remoto que podem ser utilizados na agricultura são apresentados.
Isto é, dados agrometeorológicos, com o exemplo do Centro Europeu de Previsão do Tempo
de Médio Prazo (do inglês European Centre for Medium-Range Weather Forecasts -
ECMWF), sensores orbitais como o Sensor Espectroradiométrico de Resolução Moderada
(do inglês Moderate Resolution Imaging Spectroradiometer - MODIS) e diferentes índices
construídos a partir das informações extraídas por sensoriamento remoto.
2.1.1 Modelo ECMWF
O ECMWF é o Centro de Previsão do Tempo de Médio alcance Europeu. Trata-se de

uma organização intergovernamental com 34 países, com base em Reading, no oeste de
Londres – Reino Unido (WOODS, 2006). Os objetivos do centro são, em linhas gerais,
desenvolvimento e operação de modelos globais e assimilação de sistemas de dados
dinâmicos, termodinâmicos e composição dos fluídos da terra e a interação das partes do
sistema-Terra, de modo a preparar previsões, contribuir para o monitoramento das partes
relevantes do planeta, realizar pesquisas técnicas e científicas para melhorar a qualidade das
previsões e coletar e armazenar dados. Os dados são coletados por meio de um sistema que
engloba dados de estações meteorológicas espalhadas pelo mundo, radares meteorológicos,
satélites, entre outras fontes. Estes dados são coletados a cada 6 horas. Os dados globais,
em uma resolução espacial de um grau de longitude e latitude são obtidos, processados e
depois organizados em forma de uma grade de 25 km (0,25), sendo disponibilizados
gratuitamente no website (disponível em: <http://apps.ecmwf.int/datasets/>). Os dados desde
1979 estão disponíveis no modelo ERA INTERIN, que é modelo de reanálise em escala
reduzida, isto é, com a grade de 0,25 (DEE et al., 2011).
Diversas variáveis agrometeorológicas estão disponíveis no sistema, por exemplo:
radiação fotosintéticamente ativa na superfície (PAR – W m-2 s-1), evaporação da água (E –
m), temperatura a 2 m (T2 – K), temperatura de ponto de orvalho a 2 m (D2 – K), radiação
termal de superfície (STR – W m-2 s-1), precipitação total (TP – m), radiação solar na superfície
(SSR – W m-2 s-1), albedo (AL – 0 a 1) e velocidade do vento a 10 m (WIND - m s-1). A lista
completa das variáveis agrometeorológicas da ERA INTERIM está disponível no site
(disponível em: <http://www.met.reading.ac.uk/~marc/it/snap/varList/eraVars/>). Como
exemplo, apresenta-se a distribuição espacial das Estações Virtuais (EV) proveniente do
ECMWF para o estado do Paraná (Figura 6).
9
Figura 6 Distribuição espacial das Estações Virtuais do ECMWF.

Fonte: Próprio autor.
2.2.2 MODIS
O MODIS é um instrumento fundamental a bordo dos satélites Terra (originalmente

conhecidos como EOS AM-1) e Aqua (originalmente conhecido como EOS PM-1). A órbita de
Terra ao redor da Terra é cronometrada e passa pela linha do equador na direção norte sul
pela manhã, enquanto Aqua passa do pela linha do equador na direção sul norte à tarde. Os
satélites estão visualizando toda a superfície da Terra a cada 1 ou 2 dias, adquirindo dados
em 36 bandas espectrais. As resoluções espaciais do MODIS são 1000, 500 ou 250 m
dependendo da banda ou produto utilizado. Por exemplo, as bandas Vermelho e Infra-
Vermelho próximo possuem resolução espacial de 250 m (NASA LP DAAC, 2015).
Além das bandas, o MODIS possui produtos, que são desenvolvidos a partir das
bandas do sensor. Um exemplo bastante utilizado na agricultura são os índices de vegetação
nos produtos MOD13 e MYD13 das plataformas Terra e Aqua, respectivamente. Os índices
de vegetação MODIS fornecem comparações espaciais e temporais consistentes das
condições de vegetação global que podem ser usados para monitorar a atividade
fotossintética, a detecção fenológica e a derivação biofísica de parâmetros radiométricos e
estruturais da vegetação terrestre (HUETE et al., 1999).
10
Tabela 2 Alguns produtos do sensor MODIS disponíveis

Resolução Resolução
Nome Plataforma Produto
Espacial Temporal
MCD19A2 Combinado Profundidade Ótica de Aerossol 1000 Diário
MCD64A1 Combinado Anomalias térmicas 500 Mensal
MOD09GQ Terra Refletância 250 Diário
MYD09GQ Aqua Refletância 250 Diário
MOD13Q1 Terra Índices de Vegetação 250 Composição
MYD13Q1 Aqua Índices de Vegetação 250 Composição
Índice de Área Foliar e Fração da
MOD15A2H Terra Radiação Fotosintéticamente 500 Composição
Ativa
Índice de Área Foliar e Fração da
MYD15A2H Aqua Radiação Fotosintéticamente 500 Composição
Ativa
MOD16A3 Terra Evapotranspiração 500 Anual
MYD16A3 Aqua Evapotranspiração 500 Anual
MOD21 Terra Temperatura, Emissividade 1000 Diário
MYD21 Aqua Temperatura, Emissividade 1000 Diário
Fonte: (NASA LP DAAC, 2015)
2.2.3 Índices de Vegetação
Os índices de vegetação (IV) têm por objetivo avaliar a biomassa ou vigor vegetativo
de plantas. Estes índices são gerados a partir de várias combinações de valores espectrais
que são somados, divididos ou multiplicados de um modo a produzir um valor entre -1 e 1,
que indica a quantidade de biomassa ou o vigor vegetativo dentro de um pixel. Altos valores
do IV identificam pixels cobertos por proporções substanciais de vegetação saudável. A forma
mais simples de um IV é a razão entre dois valores digitais a partir de bandas espectrais
distintas. Algumas razões entre bandas são definidas aplicando conhecimentos de
comportamento espectral da vegetação viva (CAMPBELL; WYNNE, 2011). Assim, diversos
tipos de IV são apresentados na literatura (Tabela 3), sendo que grande parte dos índices se
baseiam nas diferenças de resposta apresentadas pela vegetação nas bandas do vermelho
e infravermelho próximo.
11
Tabela 3 Principais índices de vegetação

Índice Formulação Referência
Razão Simples 𝑁𝐼𝑅
𝑆𝑅 = Jordan, 1969
(Simple Ratio) 𝑅𝐸𝐷
Índice de Vegetação Diferencial
Normalizada (𝑁𝐼𝑅 − 𝑅𝐸𝐷) Rouse et al.,
𝑁𝐷𝑉𝐼 =
(Normalized Difference (𝑁𝐼𝑅 + 𝑅𝐸𝐷) 1974
Vegetation Index)
Índice de Vegetação Melhorada (𝑁𝐼𝑅 − 𝑅𝐸𝐷) Huete et al.,
𝐸𝑉𝐼 = 2,5 ∗
(Enhaced Vegetation Index) (1 + 𝑁𝐼𝑅 + 6 ∗ 𝑅𝐸𝐷 − 7,5 ∗ 𝐵𝐿𝑈𝐸) 1996; 1997
Índice de Vegetação
Transformado 𝑇𝑉𝐼 = (𝑁𝐷𝑉𝐼 + 0,5)0,5 Tucker, 1979
(Transformed Vegetation Index)
Índice de Vegetação por
Porcentagem de Infravermelho 𝑁𝐼𝑅
𝐼𝑃𝑉𝐼 = Crippen, 1990
(Infrared Percentage Vegetation (𝑁𝐼𝑅 + 𝑅𝐸𝐷)
Index)
Índice de Vegetação de
Diferenças Ponderadas
𝑊𝐷𝑉𝐼 = 𝑁𝐼𝑅 − 𝑎 ∗ 𝑅𝐸𝐷 Qi et al., 1994
(Weighted Difference Vegetation
Index)
Índice de Vegetação Resistente
à Atmosfera Verde 𝑁𝐼𝑅 − (𝐺𝑅𝐸𝐸𝑁 − 𝛾(𝐵𝐿𝑈𝐸 − 𝑅𝐸𝐷) Gietelson et al.,
𝐺𝐴𝑅𝐼 =
(Green Atmospherically 𝑁𝐼𝑅 + (𝐺𝑅𝐸𝐸𝑁 − 𝛾(𝐵𝐿𝑈𝐸 − 𝑅𝐸𝐷) 1996
Resistant Vegetation Index)
Índice de Vegetação de
Dinâmico de Larga-Faixa 𝛼 ∗ 𝑁𝐼𝑅 − 𝑅𝐸𝐷
𝑊𝐷𝑅𝑉𝐼 = Gietelson, 2004
(Wide-Dynamic Range 𝛼 ∗ 𝑁𝐼𝑅 + 𝑅𝐸𝐷
Vegetation Index)
Índice de Clorofila Verde 𝑁𝐼𝑅
𝐶𝑙𝐺𝑟𝑒𝑒𝑛 = −1 Gietelson, 2003
(Green Chlorophyll Index) 𝐺𝑅𝐸𝐸𝑁
Índice de Clorofila com Red- 𝑁𝐼𝑅
edge 𝐶𝑙𝑅𝑒𝑑−𝑒𝑑𝑔𝑒 = −1 Gietelson, 2003
𝑅𝐸𝐷𝐸𝑑𝑔𝑒
(Red-edge Chlorophyll Index)
Índice de Clorofila Terrestre
MERIS 𝑁𝐼𝑅 − 𝑅𝐸𝐷𝐸𝑑𝑔𝑒 Dash e Curran,
𝑀𝑅𝐶𝑙 =
(MERIS Terrestrial Chlorophyll 𝑅𝐸𝐷𝐸𝑑𝑔𝑒 − 𝑅𝐸𝐷 2004
Index)
Índice de Vegetação Ajustado 𝑁𝐼𝑅 − 𝑅𝐸𝐷
pelo Solo 𝑆𝐴𝑉𝐼 = ∗ (1 + 𝐿) Huete, 1988
(Soil Adjusted Vegetation Index) 𝑁𝐼𝑅 + 𝑅𝐸𝐷 + 𝐿
NIR: infravermelho próximo; RED: Vermelho; BLUE: Azul; GREEN: Verde; a: Intercepto; L: Constante
(0,5); REDEdge: refletância entre 680 nm a 730 nm; α e γ: coeficientes.
2.3 Modelos
O uso de modelos agrícolas é essencial, pois as estimativas de produtividade e

produção são de suma importância para o norteamento de políticas agrícolas, em seu
gerenciamento e planejamento. Essas estimativas podem ser realizadas diretamente,
coletando amostras antes da colheita no período de maturação de acordo com calendário, ou
indiretamente, pela utilização de ferramentas, métodos e técnicas de previsão como modelos
(DELRCOLLE et al., 1992).
Os modelos podem ser separados em três categorias quanto aos seus dados de
entrada: os modelos agrometeorológicos, modelos agro-espectrais e modelos espectrais
(GOMMES, 1998). Independentemente de serem estatísticos ou mecânicos. Os modelos
chamados agrometeorológicos levam em consideração apenas variáveis climáticas como
12
precipitação, temperatura, entre outros como dados de entrada no modelo, por exemplo, o
modelo FAO (STEDUTO et al., 2012). Os chamados modelos espectrais utilizam apenas
dados espectrais, como, por exemplo, os modelos apresentados por Mercante et al. (2010).
Logicamente, os chamados agro-espectrais utilizam ambas as fontes de dados. Além dessa
classificação, quanto aos dados de entrada e quanto a sua forma, destacam-se os modelos
de crescimento como o WOrld FOod STudies – WOFOST (WIT, 2007) e o Decision Support
System for Agrotechnology Transfer – DSSAT (JONES et al., 2003), que são modelos
mecânicos, que levam em consideração aspectos fisiológicos da cultura, por exemplo, os
grupos de maturidade da soja, se a cultivar é determinada ou indeterminada.
Para estimar a produção agrícola é comum o uso de modelos regressivos, baseados
em relações estatísticas dos dados, e modelos mecânicos, baseados em relações físicas solo-
planta-atmosfera. Estes modelos regressivos utilizam dados da cultura em métodos
estatísticos para obter a produtividade. Por exemplo, Mercante et al. (2010) utilizaram
modelos de regressões linear múltiplas com o índice de vegetação GVI para estimar a
produtividade da soja no oeste do Paraná, obtendo R² de até 0,80 para o melhor modelo.
Gusso et al. (2013) utilizaram dados do índice de vegetação EVI em modelo de regressão
para estimar a produtividade de soja no Rio Grande do Sul, obtendo R² de até 0,95. Já
modelos mecânicos utilizam-se de relações físico-químicas para determinar a relação entre
as variáveis de entrada e as saídas. Por exemplo, Paredes et al. (2015) utilizou o modelo FAO
(STEDUTO et al., 2012) para estimar a produtividade de soja no norte da China, obtendo raiz
do erro quadrático médio (RSME) de 320 kg ha-1. Chakrabarti et al. (2014) assimilaram dados
de imagem de satélite no modelo CERES-milho para estimar a produtividade de milho na
bacia La Plata no sul do Brasil com RMSE de 4,37% para o segundo ano.
Outros exemplos com modelagem são: Berka et al. (2003) geraram estimativas de
produtividade para 144 municípios do estado do Paraná, responsáveis por 90% da produção
de soja no estado, em cinco anos-safra no período de 1996/1997 a 2000/2001. O modelo
utiliza parâmetros agronômicos e dados meteorológicos para o cálculo da produtividade
máxima, a qual é penalizada quando ocorre estresse hídrico. Nos anos safras de 1997/1998,
1998/1999 e 1999/2000 não foram identificadas diferenças (p-valor > 0,05) entre as
estimativas do modelo e da SEAB. Junges e Fontana (2011) construíram uma regressão linear
múltipla, empregando variáveis agrometeorológicas e espectrais, para estimativa de
produtividade de grãos de trigo, em municípios pertencentes à região de atuação da
Cooperativa Cotrijal (norte do Rio Grande do Sul). Para isso, foram empregados dados de
produtividade (1991 a 2006), dados agrometeorológicos mensais (1991 a 2006) e dados
espectrais (imagens NDVI/MODIS, 2000 a 2006). Marcari et al. (2015) desenvolveram
modelos agrometeorológicos para previsão mensal da produtividade de cana-de-açúcar no
estado de São Paulo. Foram utilizados dados de 2000 a 2009 para construção dos modelos
13
por regressão múltipla e dados de 2010 a 2013 para validação dos modelos. Todos os
modelos foram significativos (p-valor < 0,05) e apresentaram MAPE de 0,15 a 7,52%.
Sakamoto et al. (2014) desenvolveram um método prático para a previsão da produção
de milho dos EUA em tempo quase real utilizando o Wide Dynamic Range Vegetation Index
(WDRVI – Índice de Vegetação Dinâmico de Grande Alcance) do Moderate Resolution
Imaging Spectroradiometer (MODIS), 7 dias antes da fase de espigamento do milho. Como
resultado, o método previu a produtividade de milho a nível nacional para 2013, 3,8% menor
do que os dados oficiais. Geipel et al. (2014) utilizaram um sistema de aeronaves não
tripuladas para capturar conjuntos de padrões de dados de imagens RGB para a previsão de
produtividade de grãos de milho. As imagens foram transformadas em simples VI-ortoimagens
de classificação culturas/não-cultura e 3D Crop Surface Models (Modelos de superfície da
cultura 3D) para a determinação de altura da cultura em diferentes resoluções espaciais. Três
modelos de regressão linear foram testados: (i) altura média não classificados, (ii) as alturas
médias classificadas e (iii) uma combinação das alturas médias classificadas para as culturas
com acordo as coberturas. Os modelos mostram coeficientes de determinação R² de até 0,74.
Dempewolf et al. (2014) desenvolveram uma metodologia para estimar a produção de trigo e
na Província de Punjab com imagens de satélite Landsat e MODIS cerca de seis semanas
antes da colheita. A produção de trigo foi obtida pela regressão dos valores de produtividade
relatados em série histórica com quatro índices de vegetação MODIS. Entre os quatro índices
avaliados, WDRVI forneceu previsões de produtividade mais consistentes e precisas em
relação ao NDVI, EVI2 e SAVI.
Adriane et al. (2007) apresentaram um modelo que estima a produtividade de soja,
baseado em dados meteorológicos (evapotranspiração relativa) e imagens de satélite (índice
de vegetação), na região de produção de soja no Rio Grande do Sul. Para diferentes regiões
e períodos o coeficiente de determinação R² variaram entre 0,52 a 0,84 quando o modelo foi
comparado com dados oficiais. Rojas (2007) desenvolveu um modelo de produtividade agro-
espectral para o milho utilizando um índice espectral, o Normalized Difference Vegetation
Index (NDVI - Diferença Normalizada Índice de Vegetação) derivado do sensor SPOT-
VEGETATION, dados meteorológicos obtidos a partir do European Centre for Medium-Range
Weather Forecast (ECMWF – Centro Europeu de Previsão Climática de Médio Alcance). Os
números oficiais produzidos pelo Governo do Quênia sobre a produtividade das culturas, a
área plantada e a produção foram utilizados no modelo. O modelo de regressão linear múltipla
foi desenvolvido por seis grandes províncias de cultivo de milho no Quênia. O modelo foi
validado pela comparação das produtividades em nível de província com os dados oficiais
disponibilizados pelo Governo do Quênia. Como resultado, o modelo apresentou um R² de
0,81 e um erro RMSE de 0,359 t.ha-1. Mabilana et al. (2012) ajustaram um modelo agro-
espectral para estimativa de produtividade do milho na província de Manica utilizando
variáveis agrometeorológicas do modelo do ECMWF e variáveis espectrais do MODIS. O
14
modelo regional foi o mais recomendado para estimativa de produtividades do milho, na

região, com R2 = 0,76 e RMSE normalizado de 9,46%.
2.4 Índices de Acurácia
Além de estimar as produtividades utilizando os modelos é necessário que os

resultados sejam quantificados quanto a sua qualidade. Portanto, neste subcapítulo algumas
métricas utilizadas para determinar a acurácia de modelos são apresentadas. Além de
estatísticas descritivas entre os resultados dos modelos e dados observados, comumente são
calculados os erros: erro médio absoluto (do inglês Mean Absolute Error – MAE – Equação
1), erro médio (do inglês Mean Error – ME – Equação 2), raiz quadrada do erro médio (do
inglês Root Mean Square Error – RMSE – Equação 3) e percentual do erro absoluto médio
(do inglês Mean Absolute Percentage Error – MAPE – Equação 4). Em relação aos erros,
quanto mais próximos de zero, melhores são as estimativas do modelo. O ME indica o quão
longe a média estimada está da média observada, indicando superestimação e subestimação;
já o MAE verifica algo similar, mas em termos absolutos. O RMSE é como a variação do erro
médio, já o MAPE é o MAE em termos percentuais.
Logo, há diversas métricas relacionada à acurácia do modelo que avaliam o grau de
proximidade de uma estimativa com seu valor verdadeiro, sendo uma avaliação da qualidade
geral do modelo. Diferentes métricas apresentam respostas em diferentes unidades e com
sensibilidades diferentes. Além disso, o índice de concordância melhorado de Willmott (dr –
Equação 5 – WILLMOTT et al., 2012) e o coeficiente de eficiência de Nash-Sutcliffe (E –
Equação 6 – NASH; SUTCLIFFE, 1970) são índices que variam de zero a um e indicam a
concordância entre valores observados e estimados, sendo maior concordância quando os
índices aproximam-se de um e menor quando próximos a zero.
𝑛
1
𝑀𝐴𝐸 = ∑|𝑌𝑒𝑠𝑡 − 𝑌𝑜𝑏𝑠 | Eq.(1)
𝑛
𝑖=1
𝑛
1
𝑀𝐸 = ∑(𝑌𝑒𝑠𝑡 − 𝑌𝑜𝑏𝑠 ) Eq.(2)
𝑛
𝑖=1
𝑛
1
𝑅𝑀𝑆𝐸 = √( ∑(𝑌𝑒𝑠𝑡 − 𝑌𝑜𝑏𝑠 )2 ) Eq.(3)
𝑛
𝑖=1
15
𝑛
1 |𝑌𝑒𝑠𝑡 − 𝑌𝑜𝑏𝑠 |
𝑀𝐴𝑃𝐸 = ∑ ( ∗ 100) Eq.(4)
𝑛 𝑌𝑜𝑏𝑠
𝑖=1
∑𝑛𝑖=1|𝑌𝑒𝑠𝑡 − 𝑌𝑜𝑏𝑠 |
𝑑𝑟 = 1 − Eq.(5)
2 ∗ ∑𝑛𝑖=1|𝑌𝑜𝑏𝑠 − ̅̅̅̅̅
𝑌𝑎𝑐𝑡 |
∑𝑛𝑖=1(𝑌𝑜𝑏𝑠 − 𝑌𝑒𝑠𝑡 )2
𝐸 =1− Eq.(6)
∑𝑛𝑖=1(𝑌𝑒𝑠𝑡 − ̅̅̅̅̅
𝑌𝑒𝑠𝑡 )²
em que: n é o número de áreas; Yest - produtividade estimada pelo modelo; Yobs - produtividade
observada em áreas agrícolas monitoradas ou proveniente de fonte oficial para comparação.
16
3 REFERÊNCIAS
ADRIANE, C.; BIANCHI, M.; FONTANA, D. C.; MELO, R. W. de. Estimativa do rendimento
de grãos da soja no Rio Grande do Sul usando um modelo agrometeorológico-espectral
regionalizado Regionalized agrometeorological-spectral model for soybean yield estimation in
Rio Grande do Sul, Brazil. Revista Brasileira de Agrometeorologia, v. 15, n. 3, p. 210-219,
2007.
ALLEN, R. G.; PEREIRA, L. S.; RAES, D.; SMITH, M. Crop evapotranspiration – Guidelines
for computing crop water requirements – Irrigation and drainage paper FAO-56. Rome,
FAO - Food ang Agriculture Organization, 1998a.
ALLEN, R. G.; PEREIRA, L. S.; RAES, D.; SMITH, M. FAO Irrigation and Drainage Paper
no 56 – Crop Evapotranspiration. Rome: FAO - Food ang Agriculture Organization, 1998b.
BECKER, W. R.; JOHANN, J. A.; RICHETTI, J.; SILVA, L. C. A. Data mining techniques for
separation of summer crop based on satellite images. Engenharia Agricola, v. 37, n. 4, p.
750-759, 2017.
BERKA, L. M. S.; RUDORFF, B. F. T.; SHIMABUKURO, Y. E. Soybean yield estimation by an

agrometeorological model in a GIS. Scientia Agricola, v. 60, n. 3, p. 433-440, 2003.
BOOTE, K. J.; JONES, J. W.; HOOGENBOOM, G. Simulation of Crop Growth: CROPGRO

Model. in Agricultural Systems Modeling and Simulation, 1st ed. CRC Press, 1998.
CAMPBELL, J. B.; WYNNE, R. H. Introduction to Remote Sensing. 5th ed. The Guilford
Press, 2011.
CEPEA. Relatório PIB do Agronegócio. Disponível em: <http://cepea.esalq.usp.br/pib/>.

Acesso em: 1 ago. 2016.
CHAKRABARTI, S.; BONGIOVANNI, T.; JUDGE, J.; ZOTARELLI, L.; BAYER, C. Assimilation
of SMOS soil moisture for quantifying drought impacts on crop yield in agricultural regions.
IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, v.
7, n. 9, p. 3867-3879, 2014.
CONAB. Acompanhamento da Safra Brasileira de Grãos. Brasília: CONAB, 2016.
CONAB. Acompanhamento da Safra Brasileira – Grãos. Brasília: CONAB, 2018.
DA SILVA, L. C.; RICHETTI, J.; BECKER, W. R.; VERICA, W. R.; PALUDO, A.; JOHANN, J.
A. Algoritmos de Aprendizado de Máquina para classificação de soja em imagens Landsat-8.
Acta Iguazu, v. 6, n. 3, p. 65-78, 2017. Disponível em: <http://e-
revista.unioeste.br/index.php/actaiguazu/article/view/17477/11797>. Acesso em: 10 ago.
2018.
DEE, D. P.; UPPALA, S. M.; SIMMONS, A. J.; BERRISFORD, P.; POLI, P.; KOBAYASHI, S.;
ANDRAE, U.; BALMASEDA, M. A.; BALSAMO, G.; BAUER, P.; BECHTOLD, P.; BELJAARS,
A. C. M.; VAN DE BERG, L.; BIDLOT, J.; BORMANN, N.; DELSOL, C.; DRAGANI, R.;
FUENTES, M.; GEER, A. J.; HAIMBERGER, L.; HEALY, S. B.; HERSBACH, H.; HÓLM, E. V.;
ISAKSEN, L.; KÅLLBERG, P.; KÖHLER, M.; MATRICARDI, M.; MCNALLY, A. P.; MONGE-
SANZ, B. M.; MORCRETTE, J.-J.; PARK, B.-K.; PEUBEY, C.; DE ROSNAY, P.; TAVOLATO,
C.; THÉPAUT, J.-N.; VITART, F. The ERA-Interim reanalysis: configuration and performance
of the data assimilation system. Quarterly Journal of the Royal Meteorological Society, v.
137, n. 656, p. 553-597, 2011. Disponível em: <http://doi.wiley.com/10.1002/qj.828>. Acesso
17
em: 21 nov. 2018.
DELRCOLLE, R.; MAAS, S. J.; GURRIT, M.; BARET, F.; DELÉCOLLE, R.; MAAS, S. J.;
GURRIT, M.; BARET, F. Remote sensing and crop production models : present trends.
Journal of Photogrammetry and Remote Sensing, v. 47, n. 1986, p. 145-161, 1992.
KING, L.; ADUSEI, B.; STEHMAN, S. V.; POTAPOV, P. V.; SONG, X.; KRYLOV, A.; BELLA,
C. DI; LOVELAND, T. R.; JOHNSON, D. M.; HANSEN, M. C. Wheat Yield Forecasting for
Punjab Province from Vegetation Index Time Series and Historic Crop Statistics. Remote
Sensing, v. 6, p. 9653-9675, 2014. Disponível em: <http://www.mdpi.com/2072-
4292/6/10/9653/>. Acesso em: 29 out. 2014.
EMBRAPA. Novo Mapa de Solos do Brasil. 1a. ed. Rio de Janeiro: EMBRAPA, 2011.
FAOSTAT. Production. Disponível em: <http://faostat3.fao.org/home/E>. Acesso em: 1 ago.

2016.
FARIAS, J. R. B.; NEPOMUCENO, A. L.; NEUMAIER, N. Circular Técnica 48 - Ecofisiologia

da Soja. Circulares Técnicas Embrapa, 2007. 9 p.
FEHR, W. R.; CAVINESS, C. E. Stages of Soybean Development. Iowa: Special Report n87.
p. 12, 1977. Disponível em: <http://lib.dr.iastate.edu/specialreports/87> Acesso em: 30 set.
2018.
GEIPEL, J.; LINK, J.; CLAUPEIN, W. Combined spectral and spatial modeling of corn yield
based on aerial images and crop surface models acquired with an unmanned aircraft system.
Remote Sensing, v. 11, n. i, p. 10335-10355, 2014.
GOMMES, R. Non-Parametric crop yield forecasting, a didactic case study for Zimbabwe.
Remote Sensing supoort to crop yoeld forecast and area estimates. Proceedings.... p. 79-84,
1998.
GRZEGOZEWSKI, D. M.; JOHANN, J. A.; URIBE-OPAZO, M. A.; MERCANTE, E.;

COUTINHO, A. C. Mapping soya bean and corn crops in the State of Paraná, Brazil, using EVI
images from the MODIS sensor. International Journal of Remote Sensing, v. 37, n. 6, p.
1257-1275, 2016. Disponível em:
<http://www.tandfonline.com/doi/full/10.1080/01431161.2016.1148285>. Acesso em: 10 set.
2017.
GUSSO, A.; DUCATI, J. R.; VERONEZ, M. R.; ARVOR, D.; GONZAGA, L. S. da. Spectral
model for soybean yield estimate using MODIS/EVI data. International Journal of
Geosciences, v. 4, p. 1233-1241, 2013. Disponível em: <http://www.scirp.org/journal/ijg>.
HUETE, A.; JUSTICE, C.; LEEUWEN, W. van. Modis Vegetation Index (MOD 13) Algorithm
Theoretical Basis. Environmental Sciences, 1999. MODIS - NASA. Disponível em:
<http://modis.gsfc.nasa.gov/data/atbd/atbd_mod13.pdf>. Acesso em: 15 jan. 2016.
JOHANN, J. A.; BECKER, W. R.; URIBE-OPAZO, M. A.; MERCANTE, E. Uso de imagens do

sensor orbital MODIS na estimação de datas do ciclo de desenvolvimento da cultura da soja
para o estado do Paraná - Brasil. Journal of the Brazilian Association of Agricultural
Engineering, v. 36, n. 1, p. 126-142, 2016.
JOHNSON, D. M. An assessment of pre- and within-season remotely sensed variables for

forecasting corn and soybean yields in the United States. Remote Sensing of Environment,
18
v. 141, p. 116-128, 2014. Elsevier Inc. Disponível em:

<http://linkinghub.elsevier.com/retrieve/pii/S0034425713003957>. Acesso em: 21 out. 2014.
JONES, J. W.; HOOGENBOOM, G.; PORTER, C. H.; BOOTE, K. J.; BATCHELOR, W. D.;
HUNT, L. A.; WILKENS, P. W.; SINGH, U.; GIJSMAN, A. J.; RITCHIE, J. T. The DSSAT
cropping system model. Journal of Agronomy, v. 18, p. 235-265, 2003. Disponível em:
<www.elsevier.com/locate/eja>. Acesso em: 15 ago. 2016.
JUNGES, A. H.; FONTANA, D. C. Modelo agrometeorológico-espectral de estimativa de

rendimento de grãos de trigo no Rio Grande do Sul. Revista Ceres, v. 58, n. 1, p. 9-16, 2011.
Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-
737X2011000100002&lng=pt&nrm=iso&tlng=en>. Acesso em: 17 ago. 2016.
KASSAM, A. H.; HIGGINS, G. M. The FAO agro-ecologival zone approach to determination of

land potential. Pedologie, v. 31, n. 2, p. 147-168, 1981. Disponível em: <http://www.bbv-
sbss.ugent.be/pedologie/pedologie_1981_2.pdf>. Acesso em: 21 fev. 2017.
MABILANA, H. A.; FONTANA, D. C.; FONSECA, E. L. da. Desenvolvimento de modelo

agrometeorológico espectral para estimativa de rendimento do milho na Província de Manica-
Moçambique. Revista Ceres, v. 59, n. 3, p. 337-349, 2012. Disponível em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-
MARCARI, M. A.; DE, G.; ROLIM, S.; DE, L. E.; APARECIDO, O. Agrometeorological models
for forecasting yield and quality of sugarcane. AJCS, v. 9, n. 11, p. 1049-1056, 2015.
MERCANTE, E.; LAMPARELLI, R. A. C.; URIBE-OPAZO, M. A.; ROCHA, J. V. Modelos de

regressão lineares para estimativa de produtividade da soja no oeste do Paraná, utilizando
dados espectrais. Engenharia Agrícola, v. 30, n. 3, p. 504-517, 2010. Disponível em:
<http://agris.fao.org/agris-
search/search/display.do?f=2011/XS/XS1013.xml;XS2010L00051>. Acesso em: 4 jan. 2017.
MIGUEL, G.; CÂMARA, S. Fenologia é ferramenta auxiliar de técnicas de produção. Visão

Agrícola, v. 3, n. 5, p. 63-66, 2006.
NASA LP DAAC. MODIS Products Table. Disponível em:

<https://lpdaac.usgs.gov/products/modis_products_table>. Acesso em: 14 maio 2015.
PALOSCHI, R. A. Software aplicado a modelos de estimativa de produtividade agrícola.

2016. 99 f. Dissertação (Mestrado em Engenharia Agrícola) - PGEAGRI - Programa de Pós-
Graduação em Engenharia Agrícola. Universidade Estadual do Oeste do Paraná, Cascavel,
2016.
PAREDES, P.; WEI, Z.; LIU, Y.; XU, D.; XIN, Y.; ZHANG, B.; PEREIRA, L. S.Performance
assessment of the FAO AquaCrop model for soil water, soil evaporation, biomass and yield of
soybeans in North China Plain. Agricultural Water Management, v. 152, p. 57-71, 2015.
Disponível em: <http://linkinghub.elsevier.com/retrieve/pii/S0378377414003916>. Acesso em:
7 ago. 2017.
RICHETTI, J. Uso de geotecnologias em modelos de estimativa de produtividade de soja

no estado do Paraná. 2015. 64 f. Dissertação (Mestrado em Engenharia Agrícola) -
PGEAGRI - Programa de Pós-Graduação em Engenharia Agrícola. Universidade Estadual do
Oeste do Paraná, Cascavel, 2015.
RICHETTI, J.; JUDGE, J.; BOOTE, K. J.; JOHANN, J. A.; URIBE-OPAZO, M. A.; BECKER,
19
W. R.; PALUDO, A.; DA SILVA, L. C. DE A. Using phenology-based enhanced vegetation

index and machine learning for soybean yield estimation in Paraná State, Brazil. Journal of
Applied Remote Sensing, v. 12, n. 2, p. 1, 2018. Disponível em:
<https://www.spiedigitallibrary.org/journals/journal-of-applied-remote-sensing/volume-
12/issue-02/026029/Using-phenology-based-enhanced-vegetation-index-and-machine-
learning-for/10.1117/1.JRS.12.026029.full>. Acesso em: 21 jun. 2018.
ROJAS, O. Operational maize yield model development and validation based on remote
sensing and agro-meteorological data in Kenya. International Journal of Remote Sensing,
v. 28, n. 17, p. 3774-3793, 2007.
SAKAMOTO, T.; GITELSON, A. A.; ARKEBAUER, T. J. Near real-time prediction of U.S. corn
yields based on time-series MODIS data. Remote Sensing of Environment, v. 147, p. 219-
231, 2014. Disponível em: <http://linkinghub.elsevier.com/retrieve/pii/S0034425714000790>.
Acesso em: 29 out. 2014.
SOUZA, C. H. W. de; MERCANTE, E.; JOHANN, J. A.; LAMPARELLI, R. A. C.; URIBE-

OPAZO, M. A. Mapping and discrimination of soya bean and corn crops using spectro-
temporal profiles of vegetation indices. International Journal of Remote Sensing, v. 36, n.
7, p. 1809-1824, 2015. Disponível em: <http://dx.doi.org/10.1080/01431161.2015.1026956>.
Acesso em: 29 jan. 2018.
STEDUTO, P.; HSIAO, T. C.; FERERES, E.; RAES, D. Crop Yield Response to Water -
Irrigation and Drainage Paper FAO-66. Rome: FAO, 2012.
WILLMOTT, C. J. On the validation of models. Physical Geography, v. 2, n. 2, p. 184-194,

1981. Disponível em:
<http://www.tandfonline.com/doi/citedby/10.1080/02723646.1981.10642213?scroll=top&nee
dAccess=true>. Acesso em: 29 jan. 2016.
WILLMOTT, C. J.; ROBESON, S. M.; MATSUURA, K. A refined index of model performance.

International Journal of Climatology, v. 32, n. 13, p. 2088-2094, 2012. Disponível em:
<http://doi.wiley.com/10.1002/joc.2419>. Acesso em: 27 jun. 2016.
WIT, A. de. Regional crop yield forecasting using probabilistic crop growth modelling
and remote sensing data assimilation. Wageningen: Wageningen University, 2007.
WOODS, A. Medium-Range Weather Prediction. New York: Springer, 2006.

20
4 METODOLOGIA GERAL
Como já mencionado a tese foi dividida em três artigos. Cada artigo aborda uma forma
de estimar a produtividade da soja utilizando-se de sensoriamento remoto. Apesar da
metodologia estar especificada em cada artigo, os três possuem pontos em comum. Em geral,
foi estudado o estado do Paraná, em todos os seus 399 municípios, agrupados em 10
mesorregiões. Utilizaram-se dados de fazendas monitoradas no Paraná e os dados de EVI
(Enhanced Vegetation Index) provenientes dos produtos MOD13Q1 e MYD13Q1, do tile
h13v11, com 250 metros de resolução espacial e resolução temporal combinada de 8 dias do
sensor MODIS (MODerate resolution Imaging Spectroradiometer) dos satélites TERRA (EOS-
AM) e AQUA (EOS-PM). Utilizaram-se também de dados agrometeorológicos de precipitação
(mm), temperatura mínima, média e máxima (ºC), evapotranspiração (mm) e radiação solar
(KJ m-2dia-1) do ECMWF. Como metodologia geral, estes dados foram aplicados em
algoritmos de aprendizado de máquina no primeiro artigo, no modelo CROPGRO soja no
software DSSAT (BOOTE et al., 1998; JONES et al., 2003; HOOGENBOOM et al., 2015) no
segundo artigo, e no modelo FAO (ALLEN et al., 1998; STEDUTO et al., 2012) no software
CyMP (PALOSCHI,2016), obtendo-se, assim, estimativas que foram comparadas com dados
observados de fazendas. Calculados os índices de acurácia (conforme seção 2.4 Índices de
Acurácia) obtiveram-se, por fim, as estimativas de produtividade e produção com
confiabilidade e margem de erro indicada pelos índices. Os procedimentos metodológicos
gerais foram aplicados nos artigos para a obtenção das estimativas – em resumo, Figura 7.
Figura 7 Fluxograma geral dos artigos para estimar a produtividade de soja no estado do
Paraná.
21
5 ARTIGOS
Neste terceiro capítulo, são apresentados os artigos desenvolvidos. Os conhecimentos

e informações apresentados nos capítulos anteriores proporcionam o entendimento e colocam
os trabalhos apresentados neste capítulo em perspectiva, de forma que as contribuições
científicas da tese sejam claras e objetivas. Logo, cada artigo é autocontido, isto é, são
estudos que podem ser lidos individualmente, apresentando introdução, material e métodos,
resultados, discussões, conclusões e referências. Apenas as figuras e tabelas mantêm a
contagem da tese, de forma que a busca destas seja facilitada.
5.1 Artigo I: Utilizando índice EVI baseado em fenologia e aprendizado de máquina para
estimativa de produtividade de soja no Estado do Paraná, Brasil
Esta é uma tradução do artigo: ‘Using Phenology-Based EVI and Machine Learning for
Soybean Yield Estimation’ publicado na Journal of Applied Remote Sensing, na edição de
abril-junho de 2018. DOI: 10.1117/1.JRS.12.026029.
Resumo: Estimativas regionais precisas e oportunas da produção agrícola são fundamentais

para os tomadores de decisão. Este estudo teve como objetivo compreender como diferentes
técnicas de aprendizado de máquina podem ser usados na estimativa da produtividade da
soja a partir do sensor de índice de vegetação melhorado (do inglês, Enhanced Vegetation
Index – EVI) baseado na fenologia da cultura. Especificamente, uma metodologia foi
desenvolvida para incorporar informações fenológicas alinhadas com a aquisição de EVI para
cada pixel e selecionar os cinco preditores mais significativos, dos 36 preditores
apresentados, por meio de uma seleção de atributos. Esses preditores foram então utilizados
em quatro algoritmos de aprendizado de máquina (MLA) para obtenção de estimativas de
produtividade de soja para fazendas no estado do Paraná, Brasil. O MLA ótimo foi então
implementado para todo o estado, obtendo-se a produtividade regional de soja. O Gradiante
Boost Model (GBM) com todos os 36 preditores teve bom desempenho com ME de
3,5 kg ha-1, um RMSE de 373 kg ha-1 e dr de 0,85. No entanto, o algoritmo de Random Forest
(RF), usando os cinco preditores selecionados, apresentou resultados semelhantes na
estimativa da produtividade, porém com um tempo computacional consideravelmente menor.
Tanto o GBM, como o RF forneceram produtividades regionais mais altas em comparação
com as produtividades oficiais, sendo que os modelos GBM e RF apresentaram produções
de 16,5 e 16,8 milhões de toneladas, respectivamente. O RF com cinco preditores EVI
forneceu os melhores resultados para as estimativas regionais de soja, considerando a
precisão e o desempenho computacional.
Palavras-chave: estimativa de produtividade orientada por dados; GBM; GLM; RF; GP;
aprendizagem de máquina.
5.1.1 Introdução
Informações confiáveis e oportunas sobre a produção agrícola são essenciais para

garantir a segurança alimentar mundial (SONG et al., 2017). Geralmente, os censos e
pesquisas são as principais ferramentas para realizar estatísticas agrícolas. O censo da
agricultura é um dos principais pilares de um sistema estatístico nacional e, em muitos países
em desenvolvimento, é por vezes o único meio de produzir informação estatística sobre a
estrutura e outros aspectos relevantes do setor agrícola (FAO, 2015a). No entanto, o tempo e
22
o custo dos levantamentos e censos são diretamente proporcionais ao tamanho da área

pesquisada. Os dados de sensoriamento remoto por satélite podem fornecer informações
oportunas, precisas e objetivas sobre a área cultivada por tipo de cultura e, por sua vez,
facilitar estimativas precisas da produção agrícola (KING et al., 2017). Além disso, as
observações por satélite, devido à sua natureza sinótica e repetitiva, têm a vantagem única
de fornecer informações espacialmente contíguas sobre o crescimento das culturas em
escalas locais, regionais e globais (SONG et al., 2017).
Dados de sensoriamento remoto têm sido usados para estimar a produtividade
agrícola, seja como dados de entrada, integração ou assimilação, seja em modelos baseados
em dados, como modelos estatísticos tradicionais e de aprendizado de máquina. Gusso et al.
(2013), por exemplo, utilizaram o Índice de Vegetação Melhorado (EVI) do
Espectrorradiômetro de Imagem de Resolução Moderada (MODIS) como entradas para um
modelo acoplado para estimar a produtividade da soja.
A produção de soja no sul do Brasil, a partir do modelo, apresentou diferenças de
menos de 15% quando comparada à estatística oficial. Yao et al. (2017) utilizaram o índice de
área foliar (do inglês, Leaf Area Index – LAI) do MODIS, dados agrometeorológicos de
estações terrestres e dados do solo como entradas para o Simulador de Produtividade do
Ecossistema Boreal (BEPS), para estimativas de produtividade de arroz nas Regiões Média
e Inferior de Rio Yangtze com erros inferiores a 10% em relação aos dados oficiais. Hajj et al.
(2016) utilizaram parâmetros integrados de sensoriamento remoto (LAI, datas de colheita e
irrigação), com dados in situ em um modelo de cultura que simula o crescimento da vegetação
para feno em diferentes cenários, concluindo que incorporar dados de sensoriamento remoto
melhora as estimativas. Os valores iniciais e máximos de LAI podem dispensar medições in
situ dispendiosas, garantindo a execução correta do modelo, com RMSE de 0,41 t ha-1, MAPE
de 22%. Li et al. (2017) utilizaram informações de LAI no modelo CERES de trigo empregando
filtros de partículas e estratégias quadridimensionais baseadas em decomposição ortogonal
na cidade de Hengshui, China, obtendo erros relativos inferiores a 8%. Chakrabarti et al.
(2014) utilizaram a umidade do solo de sensoriamento remoto da missão de umidade do solo
e salinidade oceânica (SMOS) no modelo DSSAT-CROPGRO utilizando o filtro Ensemble
Kalman, que estima respostas e parâmetros do modelo simultaneamente. A estrutura foi
implementada na bacia do Prata no Brasil, por dois anos, e o RMSE entre a produtividade
estimadas e observadas foi de 16,8%, durante a primeira safra, e 4,37% durante a segunda
safra.
Modelos baseados em dados, incluindo algoritmos estatísticos e de aprendizado de
máquina, podem ser usados para obter estimativas de produtividade com base em
informações de sensoriamento remoto. Por exemplo, Bolton & Friedl (2013) usaram os dados
de refletância de superfície ajustada da refletância bidirecional do MODIS para calcular o
Índice de Vegetação por Diferença Normalizada (NDVI), Índice de Vegetação Melhorada (EVI)
23
e Índice de Água por Diferença Normalizada (NDWI) e aplicaram a um modelo linear para
prever a produtividade de soja e milho na região central dos Estados Unidos, e concluíram
que ao incluir informações relacionadas à fenologia da cultura, por exemplo, a data de
emergência, as estimativas de produtividade melhoram. Alinhar as datas de aquisição do
MODIS EVI com a fenologia em cada pixel pode melhorar ainda mais as previsões de
produtividade.
Gonzalez-Sanchez et al. (2014) usaram regressão linear múltipla, árvores de
regressão M5-Prime, redes neurais multicamadas, regressão vetorial de suporte e métodos
de vizinhos mais próximos, tendo dados climáticos como entradas para predição de
produtividade. Jeong et al. (2016) testaram random forest e regressão linear múltipla para
estimativas globais e regionais de milho (grãos e silagem), batata e trigo com base em
informações climáticas e de manejo. Kim e Lee (2016) testaram o suport vector machine,
random forest entre outros, para estimar produtividade milho em Iowa, EUA, com base em
informações de sensoriamento remoto e clima como entradas. Bose et al. (2016) utilizaram
redes neurais spiking (SNNs) para análise espaço-temporal de imagens de séries temporais
de NDVI na China, obtendo um ME de 235 kg ha-1 para estimativa de produtividade e uma
precisão global de 95% para os mapeamentos. Fieuzal et al. (2017) apresentaram dois
métodos para estimar produtividades usando redes neurais artificiais no sudoeste da França.
Uma abordagem baseada em todos os dados de satélite adquiridos durante o ciclo agrícola e
uma abordagem em tempo real, em que as estimativas são atualizadas após cada imagem
ter sido adquirida de satélites (Formosat-2, Spot-4/5, TerraSAR- X e Radarsat-2) ao longo do
ciclo da cultura com erros relativos de até 6%. Apesar dos recentes algoritmos usados em
vários estudos, o impacto de diferentes algoritmos na estimativa de produtividade ainda não
é bem compreendido.
Este estudo tem como objetivo compreender como diferentes técnicas de aprendizado
de máquina influenciam a estimativa da produtividade da soja na extração de informações
máximas do EVI que é restrita pela fenologia. Os objetivos específicos deste estudo são (1)
desenvolver uma metodologia para incorporar informação fenológica alinhada com a
aquisição MODIS EVI para cada pixel; (2) comparar o desempenho de quatro algoritmos de
aprendizado de máquina amplamente utilizados, como o estocástico Gradient Boosting Model
(GBM), General Linear Model (GLM), Random Forest (rF) e Gaussian Process (GP), para
estimar a produtividade de soja no Paraná; e (3) implementar os algoritmos ótimos a partir do
objetivo 2 e obter a produtividade regional e a produção de soja para todo o estado do Paraná.
24
5.1.2 Material e Métodos
5.1.2.1 Área em Estudo
O estudo foi realizado no estado do Paraná, no Sul do Brasil, localizado entre os

paralelos 22° 29' S e 26° 43' S e os meridianos 48° 2' W e 54° 38' W (Figura 8), com área de
199.307.945 km². As regiões climáticas do Paraná incluem clima subtropical úmido, tropical
úmido e seco, clima subtropical úmido e clima oceânico temperado (APARECIDO et al., 2016).
Os solos do estado são predominantemente latossolos, argilosos e neo-solos (EMBRAPA,
2009). O estado do Paraná é responsável por quase 18% da produção brasileira, sendo que
o estado produz mais soja do que a China, o 4º maior produtor mundial (FAO, 2015b).
Normalmente, a soja é semeada de setembro a novembro e colhida de janeiro a abril. A safra
2013/2104 foi afetada por baixa precipitação e altas temperaturas, resultando em
produtividades menores em comparação aos anos anteriores no Paraná (CONAB, 2014).
Figura 8 Área de estudo do estado do Paraná no Brasil. Os círculos vermelhos representam

as 86 fazendas que foram observadas e as regiões verdes são as áreas de cultivo de soja
no estado durante a safra 2013/14 (SOUZA et al., 2015; GRZEGOZEWSKI et al., 2016).
5.1.2.2 Dados
Neste estudo, observações de produtividade (kg ha-1), e datas de semeadura e colheita

foram coletadas de 86 fazendas durante a safra em 2013/2014 (Figura 8). Além disso, foram
utilizadas 37 imagens de EVI, de 1º de setembro de 2013 a 15 de abril de 2014, dos produtos
MODIS Terra e Aqua, MOD13Q1 e MYD13Q1. Estes produtos possuem uma resolução
espacial de 250 m e, combinados, possuem uma resolução temporal de 8 dias. A área de
estudo abrangeu 1253 pixels MODIS e, com um tamanho médio de fazenda de 102 ha, cada
fazenda cobria cerca de dezesseis pixels MODIS.
25
As datas de semeadura e colheita para a região foram estimadas com base na série
temporal MODIS EVI conforme Johann et al. (2016). Johann et al. (2016) determinaram a
semeadura e as datas de colheita com base nas mudanças temporais no EVI para cada pixel
do MODIS. O pico da vegetação coincidiu com o valor máximo de EVI. O tempo em que o EVI
foi mínimo, anterior ao pico de vegetação, foi considerado como a data de semeadura e o
mínimo de EVI após o pico foi considerado como a data de colheita. Para este estudo, as
diferenças médias entre os valores estimados e os observados foram de 4 e 24 dias para as
datas de semeadura e colheita, respectivamente. Essas diferenças foram razoáveis, porque
os agricultores geralmente relatam o período da atividade (semeadura ou colheita) ou a data
de início da atividade.
5.1.2.3 Visão Geral da Metodologia
Para este estudo, os preditores de EVI baseados em fenologia foram criados pela
incorporação de datas de fenologia nos dados do MODIS EVI. Esses preditores foram
normalizados usando a Equação 7 e usados como entradas para os quatro algoritmos de
aprendizado de máquina. Além disso, a seleção de recursos baseada na seleção de recursos
recursivos (RFS) foi usada para determinar os preditores ótimos relacionados à produtividade.
𝑥 − min(𝑥)
𝑧= Eq.( 7)
max(𝑥) − min(𝑥)
em que, z é o valor normalizado e x é o valor preditor.
Os preditores de EVI baseados em fenologia selecionados foram usados nos
algoritmos de aprendizado de máquina para estimar a produtividade. As produtividades
estimadas foram medidas espacialmente e comparadas com as produtividades observadas
nas fazendas e dados governamentais oficiais, como mostrado no fluxograma da metodologia
na Figura 9.
Figura 9 EVI baseado em fenologia usado neste estudo de quatro MLAs (GBM, GLM, rF e
GP)
26
Para demonstrar o valor agregado do uso de EVI baseada em fenologia, as estimativas

de produtividade foram comparadas com as obtidas usando MODIS EVI (baseado em não
fenologia), como mostrado na Figura 10.
Figura 10 Estimativa de produtividade baseada em MODIS-EVI baseado em não-fenologia

como entradas para o MLA
5.1.2.4 EVI baseado em fenologia
Em vez de usar os produtos MODIS diretamente como entradas, os preditores EVI

foram criados a partir de dados de séries temporais MODIS considerando as informações
fenológicas como: a semeadura, o pico vegetativo, o meio de desenvolvimento da cultura e a
colheita. Como mostrado na Figura 11, para cada pixel a informação de EVI foi extraída em
uma data fenológica especificada, tornando as informações fortemente correlacionadas à
fenologia. Por exemplo, se fazendas adjacentes, cada uma consistindo em múltiplos pixels
MODIS, têm diferentes datas de semeadura: 8, 9, 16, 17, 18 e 24 de outubro, como na Figura
11, então a "semeadura EVI" para todos os pixels em uma fazenda foi obtida a partir do
produto MODIS adquirido mais próximo das datas de plantio, pixels da imagem adquirida em
8 de outubro para os campos plantados em 8 e 9 de outubro, pixels da imagem em 16 de
outubro para os campos plantados em 16 de outubro, 17 e 18, e pixels da imagem em 24 de
outubro para o campo plantado em 24 de outubro. Assim, o preditor ‘semeadura EVI’
apresenta os valores de EVI relação à data fenológica da área em questão em vez do valor
de EVI na data de aquisição do sensor. Utilizando essa metodologia, 36 variáveis de EVI
baseadas em fenologia (Tabela 4), ou seja, 5 em torno da semeadura, 10 em torno do pico
vegetativo, 12 em torno do desenvolvimento médio, 5 em torno da colheita e 4 do ciclo foram
criadas a partir do perfil EVI. Essas 36 variáveis serviram como entradas para a seleção de
características e para os algoritmos de aprendizado de máquina, como mostrado na Figura 9.
27
Tabela 4 Abreviação e descrição das variáveis do EVI usadas como entrada nos modelos de
regressão de aprendizado de máquina
ID Descrição das Variáveis
1 Ciclo (número de dias da semeadura a colheita)
2 EVI na semeadura
3 EVI uma cena após a semeadura
4 EVI duas cenas após a semeadura
5 EVI três cenas após a semeadura
6 Total EVI na semeadura (Soma dos IDs 2 a 5)
7 EVI da semeadura ao pico (Soma dos IDS 6, 17, 18, 19 e 20)
8 EVI uma cena antes da data central
9 EVI duas cenas antes da data central
10 EVI três cenas antes da data central
11 EVI uma cena depois da data central
12 EVI duas cenas depois da data central
13 EVI três cenas depois da data central
14 Total EVI no centro (Soma dos IDs 8 a 13)
15 Total parcial 1 EVI no centro (Soma dos IDs 8 e 11)
16 Total parcial 2 EVI no centro (Soma dos IDs 8, 9, 11 e 12)
17 EVI no pico
18 EVI uma cena antes do pico
19 EVI duas cenas antes do pico
20 EVI três cenas antes do pico
21 EVI uma cena depois do pico
22 EVI duas cenas depois do pico
23 EVI três cenas depois do pico
24 Total EVI no pico (Soma dos IDs 17 e 23)
25 Total EVI no pico 1 (Soma dos IDs 17, 18 e 21)
26 Total EVI no pico 2 (Soma dos IDs 17, 18, 19, 21 e 22)
27 EVI do pico a colheita (Soma dos IDs 17, 21, 22, 23 e 32)
28 EVI na colheita
29 EVI uma cena antes da colheita
30 EVI duas cenas antes da colheita
31 EVI três cenas antes da colheita
32 Total EVI na colheita (Soma dos IDs 28 a 31)
33 EVI uma cena depois da colheita
34 EVI total (soma de todos os EVI)
35 EVI total sem o total EVI do meio (Soma de todos os EVI menos ID 14)
36 EVI total sem o total EVI no pico (Soma de todos os EVI menos ID 24)
Figura 11 Exemplo ilustrativo para incorporar a fenologia em EVI para criar uma variável
baseada em fenologia: EVI na data de semeadura.
28
5.1.2.5 Eliminação Recursiva de Variáveis (RFE)
A seleção de variáveis facilita a visualização de dados e a compreensão de dados, e

melhora o desempenho da previsão (GUYON; ELISSEEFF, 2003). O RFE implementa uma
seleção inversa de preditores com base na classificação da importância do preditor. Os
preditores são classificados e os menos importantes são eliminados sequencialmente antes
da modelagem. O objetivo é encontrar um subconjunto de preditores que possa ser usado
para produzir um modelo preciso (KUHN, 2008). Neste estudo, o RFE com 5 repetições, cada
uma usando validação cruzada de 10 vezes, foi aplicado nas 36 variáveis (Tabela 4) do EVI
baseadas em fenologia para obter os melhores preditores classificados. O algoritmo usou rF
para estimar a produtividade. O RMSE mostrado entre as produtividades estimadas e
observadas (Equação 10) foi usado para classificar os preditores para o RFE. O RMSR
normalizado (Equação 11) é um número adimensional entre 0 e 1, o RMSR normalizado com
um limiar de 0,3, ou 30% foi usado como uma métrica para selecionar os preditores.
5.1.2.6 Algoritmos de Aprendizado de Máquina (MLA)
Quatro algoritmos de aprendizado de máquina: Gradient Boosting Model (GBM),

General Linear Model (GLM), Random Forest (rF) e Gaussian Process (GP), foram usados
para estimar a produtividade da soja.
(1) O GBM constrói modelos de regressão aditiva ajustando sequencialmente uma
função parametrizada simples (aprendizado básico) aos atuais "pseudo-resíduos" pelos
mínimos quadrados em cada iteração. Os pseudo-resíduos são o gradiente da perda funcional
sendo minimizado, com relação aos valores do modelo em cada ponto de treinamento
avaliado na etapa atual (FRIEDMAN, 2002). Os parâmetros de ajuste são o número de
iterações de reforço (N Trees), a profundidade máxima da árvore (profundidade de interação),
o encolhimento e o tamanho mínimo do nó terminal (nminobsinnode).
(2) O GLM é uma técnica de regressão linear ponderada iterativa que pode ser usada
para obter estimativas de máxima verossimilhança dos parâmetros com observações
distribuídas de acordo com alguma família exponencial e efeitos sistemáticos que podem ser
lineares por uma transformação adequada. Uma generalização da análise da variância é dada
para esses modelos usando log-verossimilhança. Esses modelos lineares generalizados
podem ser utilizados em diferentes distribuições (NELDER; WEDDERBURN, 1972). Não há
nenhum parâmetro de ajuste para este método.
(3) rF é uma técnica de árvore de regressão onde um número de baggs e trees
construídos aleatoriamente são gerados em paralelo. Como no bagging, um número de
árvores de decisão em amostras de treinamento bootstrap é construído. Ao construir essas
árvores, cada vez que uma divisão em uma árvore é considerada, uma amostra aleatória de
preditores é escolhida como candidatos divididos do conjunto completo de preditores (JAMES
29
et al., 2013). Cada classe prevista é votada e a predição da floresta é a classe que obtém o
maior número de votos, para classificação ou a média para a regressão (BREIMAN, 2001). O
parâmetro de sintonia utilizado foi o número de preditores selecionados aleatoriamente (mtry)
e o número de árvores (ntrees).
(4) GP é uma generalização da distribuição de probabilidade gaussiana. Enquanto
uma distribuição de probabilidade descreve variáveis aleatórias que são escalares ou vetores
(para distribuições multivariadas), um processo estocástico governa as propriedades das
funções. Deixando a sofisticação matemática de lado, pode-se pensar, vagamente, em uma
função como um vetor muito longo, cada entrada no vetor especificando o valor da função f(x)
em uma entrada particular x (RASMUSSEN; WILLIAMS, 2006). Não há nenhum parâmetro de
ajuste para este método.
Um conjunto de treinamento, consistindo em 70% dos dados (878 pixels), foi usado
para ajuste de parâmetro de cada um dos quatro MLA com 10 repetições, cada repetição
usando uma validação cruzada de 10 vezes. A combinação ideal de parâmetros para cada
modelo foi escolhida com base no RMSE mais baixo e R2 mais alto entre a produtividade
estimada e a observada em fazendas. Os modelos foram testados utilizando os 30% restantes
dos dados (375 pixels), que não foram utilizados para treinamento, e a análise de acurácia foi
realizada. Utilizou-se a versão R 3.3.4 (R CORE TEAM, 2017) com o pacote CARET (KUHN,
2008), e a semente foi ajustada para 153, para garantir resultados reprodutíveis.
5.1.2.7 Métricas de Acurácia
As métricas de precisão da diferença absoluta média (MAE), diferença média (ME),

diferença quadrática média da raiz (RMSE), RMSE normalizado (nRMSE), o índice de
concordância melhorado de Willmott (Willmott dr) (WILLMOTT et al., 2012), como mostrado
nas Equações 8 a 12, respectivamente, e a correlação de Pearson foram calculadas para
avaliar as diferenças entre o MLA e as produtividades observadas em kg ha-1 das fazendas.
𝑛
1
𝑀𝐴𝐸 = ∑|𝑌𝑒𝑠𝑡 − 𝑌𝑜𝑏𝑠 | Eq. (8)
𝑛
𝑖=1
𝑛
1
𝑀𝐸 = ∑(𝑌𝑒𝑠𝑡 − 𝑌𝑜𝑏𝑠 ) Eq. (9)
𝑛
𝑖=1
𝑛
1
𝑅𝑀𝑆𝐸 = √( ∑(𝑌𝑒𝑠𝑡 − 𝑌𝑜𝑏𝑠 )2 ) Eq.(10)
𝑛
𝑖=1
30
𝑅𝑀𝑆𝐸 − 𝑅𝑀𝑆𝐸𝑚𝑖𝑛
𝑛 𝑅𝑀𝑆𝐸 = Eq.(11)
𝑅𝑀𝑆𝐸𝑚𝑎𝑥 − 𝑅𝑀𝑆𝐸𝑚𝑖𝑛
∑𝑛𝑖=1|𝑌𝑒𝑠𝑡 − 𝑌𝑜𝑏𝑠 |
𝑑𝑟 = 1 − Eq.(12)
2 ∗ ∑𝑛𝑖=1|𝑌𝑜𝑏𝑠 − ̅̅̅̅̅
𝑌𝑜𝑏𝑠 |
em que: Yest - produtividade estimada; Yobs - produtividade observado; n é o número total de

pixels.
Para determinar a produção regional total (kg) no estado, a produtividade estimada
-1
(kg ha ) em cada pixel do MODIS foi multiplicada pela área do pixel (6,25 ha) para obter
produção para cada pixel. Esses valores de produção por pixel foram combinados para obter
a produção regional total. Além disso, o tempo computacional usando um núcleo de
processador Intel i5-2500 para cada MLA foi registrado.
5.1.3 Resultados e Discussões
5.1.3.1 Seleção de Atributos
A Figura 5 mostra o RMSE normalizado entre as produtividades estimados e

observados com o aumento do número de preditores de EVI de 1 a 36. Do nRMSE e limiar de
30% (Figura 12), os cinco preditores de ranking ótimo forneceram informações suficientes
para obter estimativas aceitáveis e foram usados no MLA. Além disso, um aumento adicional
no número de preditores para 10 aumentou o tempo computacional do MLA. Esses 5
preditores ótimos foram: EVI 16 dias antes do meio do ciclo, EVI 24 dias após o pico
vegetativo, a duração do ciclo (a duração do ciclo variou de 98 a 229 dias), EVI 24 dias antes
do meio do ciclo e EVI 16 dias após o pico vegetativo.
Figura 12 RMSE normalizado entre produtividade estimada e observada de soja em função

do número de preditores utilizados. A linha horizontal mostra os valores limite
de nRMSE em 30%.
31
5.1.3.2 Algoritmos de Aprendizado de Máquina
Para cada MLA, os parâmetros foram ajustados (Tabela 5) com base na validação
cruzada de 10 vezes com 5 repetições. Esses parâmetros foram utilizados para a
implementação dos modelos para estimar a produtividade da soja.
Tabela 5 Parâmetros ajustados para cada modelo usando os 5 preditores ótimos e todas as
36 variáveis EVI como preditores
Parâmetros com 5 preditores
MLA Parâmetros com todos os 36 preditores
selecionados
Interaction Interaction
3 10
Depth Depth
GBM N trees 100 N trees 400
Shrinkage 0,1 Shrinkage 0,1
Nminobsinnode 10 Nminobsinnode 10
GLM - - - -
mtry 3 mtry 17
rF
ntrees 550 ntrees 550
GP - - - -
-: sem parâmetros a serem ajustados. N Trees: número de árvores, Interaction Depth (profundidade de
interação): a profundidade máxima da árvore, nminobsinnode o tamanho mínimo do nó terminal;
mtry: número de preditores selecionados aleatoriamente; ntrees: número de árvores.
A Tabela 6 apresenta as métricas de desempenho ME, MAE, RMSE, dr de Willmott e

Pearson e os tempos de processamento para o MLA usado neste estudo. Em geral, todos os
MLAs apresentaram desempenho satisfatório com ME < 20 kg ha-1. O GBM, em média,
apresentou uma pequena superestimação de 0,31% da produtividade observada
(3.471 kg ha-1, como mostrado na Tabela 8), utilizando 5 preditores de EVI e apenas 0,10%
da produtividade observada com todos os 36 preditores. Todos os outros MLAs apresentaram
subestimações, com o modelo rF subestimando a produtividade em 0,20% da produtividade
observada com 5 preditores selecionados de EVI e em 0,24% da produtividade observada
com todos os 36 preditores. O MLA mais rápido (GLM) levou pouco mais de 1 s para calcular
e o mais lento (rF) levou pouco mais de 8 minutos, ao usar os cinco preditores ideais. Ao usar
todos os preditores, o mais rápido (GLM) demorou pouco mais de 2 segundos e o mais lento
(rF) quase 80 minutos. Em geral, o uso dos cinco preditores selecionados reduziu bastante o
tempo computacional, mas com alguma perda na precisão. No entanto, a rF mostrou uma
melhoria em todas as métricas, exceto MAE, e foi quase 10 vezes mais rápida ao usar apenas
os cinco preditores.
32
Tabela 6 Análise de Precisão de todos os MLAs com os cinco preditores de EVI ideais e com
os 36 preditores de EVI
GBM GLM rF GP
Estatísticas
Cinco EVI preditores
ME (kg ha-1) 10,73 -13,28 -7,06 -13,38
-1
MAE (kg ha ) 293,35 336,72 274,02 336,64
RMSE (kg ha-1) 403,38 461,75 390,16 461,73
dr Willmott 0,79 0,66 0,79 0,66
r pearson 0,68 0,54 0,70 0,54
Tempo PC (s) 168,88 1,08 486,50 51,39
Todos os 36 EVI preditores
ME (kg ha-1) 3,52 -18,13 -8,16 -17,50
MAE (kg ha-1) 259,13 353,68 252,41 343,01
RMSE (kg ha-1) 372,56 475,14 395,38 463,55
dr Willmott 0,85 0,70 0,80 0,71
r pearson 0,74 0,53 0,69 0,55
Tempo PC (s) 989,68 2,05 4683,89 46,63
Negrito representa melhor resultado. ME: erro médio; MAE; erro absoluto médio; RMSE: raiz quadrado
do erro médio; GBM: Gradient Boosting Model; GLM: General Linear Model; rF: Random Forest; GP:
Gaussian Process
As Figuras 12 e 13 mostram os gráficos de dispersão das produtividades estimadas

pelo MLA e as observadas nas fazendas, utilizando os cinco preditores de EVI e todos os 36
preditores do EVI, respectivamente. O rF com 5 preditores de EVI (Figura 12) e o GBM com
todos os 36 preditores de EVI (Figura 13) apresentaram a menor dispersão, conforme
demonstrado pelos menores valores de RMSE, ME e MAE quando comparados com os outros
MLAs. O GLM e GP apresentaram maior variabilidade em baixa produtividade e menor
variabilidade para produtividades maiores, não sendo capazes de estimar completamente as
mudanças de uma fazenda para a outra (Willmott dr de 0,5 e r <0,75 - Tabela 6). O rF com
cinco preditores de EVI e o GBM com 36 preditores de EVI melhor detectam essas alterações,
como visto em valores mais altos de r e dr, quando comparado a outros MLAs. Outros estudos
semelhantes, como Betbeder et al. (2016) e Gusso et al. (2017), encontraram valores
semelhantes de Pearson de 0,96 e 0,74, respectivamente.
33
Figura 13 Gráfico de dispersão das produtividades observadas em comparação com as

produtividades estimadas com os cinco preditores selecionados pelo RFE usando os
algoritmos (a) GBM, (b) GLM, (c) rF e (d) GP.
A Tabela 7 apresenta a comparação dos resultados de produtividade dos dois

melhores MLAs, GBM e rF, usando EVI baseado em fenologia e EVI não baseado em
fenologia. O ME foi reduzido em 6,43 kg ha-1 e o índice dr de Willmott foi aumentado em 0,13
no algoritmo GBM. Melhorias semelhantes também foram obtidas para o algoritmo rF.
Tabela 7 Comparação das estimativas de utilizando o EVI baseado em fenologia e o MODIS

EVI (baseado em não fenologia) com os algoritmos GBM e rF
GBM rF
Não baseado Baseado em Não baseado Baseado em
em Fenologia Fenologia em Fenologia Fenologia
ME (kg ha-1) 9,95 3,52 -11,97 -7,06
MAE (kg ha-1) 375,35 259,13 350,28 274,02
RMSE (kg ha-1) 553,82 372,56 525,33 390,16
dr Willmott 0,72 0,85 0,73 0,79
r pearson 0,58 0,74 0,64 0,70
Tempo PC (s) 2127,75 989,68 566,72 486,50
ME: erro médio; MAE; erro absoluto médio; RMSE: raiz quadrado do erro médio; GBM: Gradient
Boosting Model; rF: Random Forest.
34
Figura 14 Gráfico de dispersão das produtividades observadas nas fazendas em

comparação com as produtividades estimadas com todos os 36 preditores utilizando
algoritmos (a) GBM, (b) GLM, (c) rF e (d) GP.
5.1.3.3 Estimativa de Produtividade Regional
Tanto o GBM quanto o rF foram aplicados em todo o estado do Paraná. O GBM com
todos os 36 preditores de EVI apresentou maior desvio com um Coeficiente de Variação (CV)
5,8% maior que o rF com os cinco preditores de EVI. Porém, ambos possuem estatística
descritiva similar, exceto pela produtividade mínima estimada do GBM, que é quase 10 vezes
menor do que a produtividade estimada mínimo do rF (Tabela 8).
Tanto para o GMB (Figura 15) quanto para o rF (Figura 16), o Oeste do estado
apresentou as maiores produtividades. Observa-se um cinturão de soja com alta
produtividade de Oeste para Nordeste, especialmente na estimativa do modelo rF. Em ambos
os mapas, há um predomínio da produtividade entre 3000 e 3750 kg ha-1 para os dois MLAs,
com pixels amarelos, claros e verdes escuros, em todo o estado. O GBM apresentou mais
áreas com produtividade inferior a 3000 kg ha-1 na região nordeste extrema, mas se espalhou
35
por todo o estado enquanto a rF menos pixels apresentaram menos de

3000 kg ha-1, que também estão concentradas na região nordeste.
Tabela 8 Estatísticas descritivas da produtividade de soja (kg ha-1) real das fazendas e dos
algoritmos utilizados
Estatísticas Real (kg ha-1) GBM (kg ha-1) rF (kg ha-1)
Mínimo 991,7 147,5 1102
1st quartil 3223 3156 3223
Mediana 3471 3432 3383
3rd quartil 3917 3672 3596
Máximo 4512 4915 4451
Média 3471 3344 3401
Desvio Padrão 579,6 538,5 349,5
CV (%) 16,6 16,1 10,3
GBM: Gradient Boosting Model; rF: Random Forest.
Figura 15 Estimativa de produtividade de soja com o algoritmo GBM com todos os preditores
para todo o estado para safra 2013-2014.
36
Figura 16 Estimativa de produtividade de soja com o algoritmo rF com cinco preditores para
todo o estado para safra 2013-2014.
Comparando-se a média de 2950 kg ha-1 reportada por CONAB (2014), com o GBM
estima-se maior produtividade que a produtividade oficialmente reportada em 394 kg ha-1,
porém a diferença entre a produtividade média observada em 86 fazendas e a produtividade
estimada com o GBM foi de apenas 3,52 kg ha-1. Com o modelo GBM, a produção total
estimada do estado é de 16,6 milhões de toneladas produzidas pelo estado na safra
2013/2014, 1,7 milhões de toneladas acima do relatório oficial da CONAB (2014). A rF
superestimou a produtividade média oficialmente reportada em 451 kg ha-1, porém a diferença
entre a produtividade média real e a produtividade estimada por rF foi de apenas
-7,02 kg ha-1 das 86 fazendas. Com o modelo rF, a produção total estimada do estado é de
16,8 milhões de toneladas produzidas na safra 2013/2014, 2 milhões de toneladas a mais do
que o relatório oficial da CONAB (2014). Ambas as MLAs estimaram produtividades mais altas
do que as produtividades oficialmente reportadas. A rF apresentou resultados semelhantes
do GBM com menos preditores e menor tempo computacional.
Além disso, embora ambos os algoritmos tenham estimado uma produção maior do
que os dados oficialmente reportados, a produtividade estimada coincide bem com a
produtividade observada nas fazendas. Curiosamente, a produtividade média de 86 fazendas
foi 521 kg ha-1 maior do que a produtividade oficial. O algoritmo rF com cinco preditores de
EVI é recomendado para a estimativa da produtividade da soja no Paraná.
5.1.4 Conclusões
Neste estudo, um método foi desenvolvido para incorporar informações fenológicas

nos dados de EVI para estimativa de produtividade de soja, usando algoritmos de aprendizado
37
de máquina. A fenologia foi incorporada no MODIS EVI obtendo 36 preditores. Uma seleção
recursiva baseada na eliminação de preditores foi realizada para obter cinco preditores EVI
(EVI 16 dias antes do meio do ciclo; EVI 24 dias após o pico vegetativo; o comprimento do
ciclo; EVI 24 dias antes do meio do ciclo e EVI 16 dias após o pico vegetativo).
Quatro métodos de aprendizado de máquina foram implementados usando os 36
preditores de EVI e os cinco preditores de EVI no Paraná. O GBM apresentou melhor
desempenho com os 36 preditores do EVI, com ME de 3,52 kg ha-1, RMSE de 373 kg ha-1 e
dr de 0,85 quando comparado com os dados observados nas fazendas. No entanto, a rF
apresentou resultados semelhantes usando apenas os cinco preditores EVI e com tempo
computacional reduzido quando comparado aos modelos que utilizaram os 36 preditores.
A incorporação de fenologia nos dados EVI MODIS forneceu estimativas de
produtividade melhoradas em comparação com os dados de sensoriamento remoto sem a
incorporação de fenologia para o MLA. Portanto, o EVI baseado em fenologia pode ser usado
em MLA, obtendo estimativas regionais precisas da produtividade da soja. Além disso, o uso
da seleção de preditores reduziu consideravelmente o tempo computacional sem perder a
precisão ao usar o algoritmo rF.
Agradecimentos
Este trabalho foi apoiado pela Fundação CAPES (Coordenação de Aperfeiçoamento

de Pessoal de Nível Superior – Ministério da Educação – Brasil), no âmbito do subsídio
88881.131979/2016-01. Além disso, os autores são gratos aos agricultores por
compartilharem seus dados de gerenciamento e produção.
Declaração de Divulgação
Nenhum potencial conflito de interesse foi relatado pelos autores.
Referências
APARECIDO, L. E. O.; ROLIM, G. S.; RICHETTI, J.; SOUZA, P. S. de; JOHANN, J. A. Köppen,
Thornthwaite and Camargo climate classifications for climatic zoning in the State of Paraná,
Brazil. Ciencia e Agrotecnologia, v. 40, n. 4, p. 405-417, 2016. Disponível em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1413-70542016000400405&lng
=en&nrm=iso&tlng=en>. Acesso em: 10 abr. 2017.
BETBEDER, J.; FIEUZAL, R.; BAUP, F. Assimilation of LAI and dry biomass data from optical
and SAR Images into an Agro-Meteorological Model to Estimate Soybean Yield. IEEE Journal
of Selected Topics in Applied Earth Observations and Remote Sensing, v. 9, n. 6, 2016.
Disponível em: <http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7450615>. Acesso
em: 14 jul. 2017.
BOLTON, D. K.; FRIEDL, M. A. Forecasting crop yield using remotely sensed vegetation
indices and crop phenology metrics. Agricultural and Forest Meteorology, v. 173, p. 74-84,
2013. Disponível em: <http://linkinghub.elsevier.com/retrieve/pii/S0168192313000129>.
Acesso em: 1 nov. 2013.
38
BOSE, P.; KASABOV, N. K.; BRUZZONE, L.; HARTONO, R. N. Spiking neural networks for
crop yield estimation based on spatiotemporal analysis of image time series. IEEE
Transactions on Geoscience and Remote Sensing, v. 54, n. 11, 2016. Disponível em:
<http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7524771&tag=1>. Acesso em: 30 jun.
2017.
BREIMAN, L. Statistical modeling: the two cultures. Statistical Science, v. 16, n. 3, p. 199-
231, 2001. Disponível em: <http://cdn2.hubspot.net/hub/160602/file-18146220-
pdf/docs/statistical_modeling_the_two_cultures.pdf?__hstc=&__hssc=&hsCtaTracking=645a
8fc5-69f4-43d1-8ad6-f826f7e93e9a%7C6812cd7b-a690-4190-834d-50fb06d77c54>. Acesso
em: 27 jun. 2017.
7, n. 9, p. 3867-3879, 2014.
CONAB. Acompanhamento da safra brasileira de grãos, v. 1 - Safra 2013/14, n. 10 -

Décimo Levantamento. Brasília, 2014.
EMBRAPA. Sistema Brasileiro de Classificação de Solos. 2a. ed. Rio de Janeiro:

EMBRAPA, 2009.
FAO. World Programme for the Census of AgriCulture 2020. Volume 1 Programme,
concepts and definitions. Rome: FAO, 2015a.
FAO. Production Quantities by Country. 2015. Disponível em:

<http://faostat3.fao.org/browse/Q/QC/E>. Acesso em: 11 ago. 2015.
FIEUZAL, R.; MARAIS SICRE, C.; BAUP, F. Estimation of corn yield using multi-temporal
optical and radar satellite data and artificial neural networks. International Journal of Applied
Earth Observation and Geoinformation, v. 57, p. 14-23, 2017. Disponível em: <http://ac.els-
cdn.com/S0303243416302094/1-s2.0-S0303243416302094-main.pdf?_tid=c907a30e-5d0a-
11e7-a3ef-00000aacb362&acdnat=1498768837_cb306af48c6e287873ffad867e4bd9a6>.
Acesso em: 29 jun. 2017.
FRIEDMAN, J. H. Stochastic gradient boosting. Computational Statistics & Data Analysis,

v. 38, p. 367-378, 2002. Disponível em: <www.elsevier.com/locate/csda>. Acesso em: 27 jun.
2017.
GONZALEZ-SANCHEZ, A.; FRAUSTO-SOLIS, J.; OJEDA-BUSTAMANTE, W. Predictive

ability of machine learning methods for massive crop yield prediction. Spanish Journal of
Agricultural Research, v. 12, p. 313-328, 2014.

1257-1275, 2016. Disponível em:
<http://www.tandfonline.com/doi/full/10.1080/01431161.2016.1148285>. Acesso em: 18 out.
2017.
GUSSO, A.; ARVOR, D.; DUCATI, J. R. Model for soybean production forecast based on
prevailing physical conditions. Pesquisa Agropecuária Brasileira, v. 52, n. 2, p. 95-103,
2017. Disponível em: <http://www.scielo.br/pdf/pab/v52n2/1678-3921-pab-52-02-00095.pdf>.
Acesso em: 14 jul. 2017.
39
GUYON, I.; ELISSEEFF, A. An introduction to variable and feature selection. The Journal of
Machine Learning Research, v. 3, p. 1157-1182, 2003.
HAJJ, M. el; BAGHDADI, N.; CHEVIRON, B.; BELAUD, G.; ZRIBI, M. agricultural water
management integration of remote sensing derived parameters in crop models: application to
the PILOTE model for hay production. Agricultural Water Management, v. 176, p. 67-79,
2016. Disponível em: <http://ac.els-cdn.com/S0378377416301792/1-s2.0-
S0378377416301792-main.pdf?_tid=5cf60f8c-5d07-11e7-a661-
00000aab0f01&acdnat=1498767366_6a0f9c5822988c1b48863dc6d23a4f05>. Acesso em:
29 jun. 2017.
JAMES, G.; WITTEN, D.; HASTIE, T.; TIBSHIRANI, R. An introduction to statistical

learning with applications in R. 1a. ed. New York: Springer, 2013.
JEONG, J. H.; RESOP, J. P.; MUELLER, N. D.; FLEISHER, D. H.; YUN, K.; BUTLER, E. E.;
TIMLIN, D. J.; SHIM, K.; GERBER, J. S.; REDDY, V. R.; KIM, S. Random Forests for Global
and Regional Crop Yield Predictions. PLoS ONE, v. 11, n. 610, p. 1-15, 2016. Disponível em:
<http://dx.doi.org/10.1371/journal.pone.0156571.>. Acesso em: 28 jun. 2017.

Engineering, v. 36, n. 1, p. 126-142, 2016.
KIM, N.; LEE, Y.-W. machine learning approaches to corn yield estimation using satellite
images and climate data: a case of Iowa State. Journal of the Korean Society of Surveying,
Geodesy, Photogrammetry and Cartography, v. 34, n. 4, p. 383-390, 2016. Disponível em:
<https://www.researchgate.net/publication/309013221_Machine_Learning_Approaches_to_C
orn_Yield_Estimation_Using_Satellite_Images_and_Climate_Data_A_Case_of_Iowa_State>
. Acesso em: 28 jun. 2017.
C. DI; LOVELAND, T. R.; JOHNSON, D. M.; HANSEN, M. C. A multi-resolution approach to
national-scale cultivated area estimation of soybean. Remote Sensing of Environment, v.
195, n. 1, p. 13-29, 2017. Disponível em: <http://ac.els-cdn.com/S0034425717301505/1-s2.0-
S0034425717301505-main.pdf?_tid=bdb359de-6b07-11e7-be5c-
00000aab0f6c&acdnat=1500306845_723708eb585f0522ec8a1a0d2d195283>. Acesso em:
17 jul. 2017.
KUHN, M. Building predictive models in R using the caret package. Journal of Statistical
Software, v. 28, n. 5, p. 1-26, 2008. Disponível em: <http://www.jstatsoft.org/v28/i05/>. Acesso
em: 6 maio 2018.
LI, H.; CHEN, Z.; LIU, G.; JIANG, Z.; HUANG, C. Improving winter wheat yield estimation from
the CERES-Wheat Model to assimilate leaf area index with different assimilation methods and
spatio-temporal scales. Remote Sensing, v. 9, n. 3, 2017. Disponível em:
<www.mdpi.com/2072-4292/9/3/190/pdf-vor>. Acesso em: 29 jul. 2017.
NELDER, J. A.; WEDDERBURN, R. W. M. Generalized Linear Models. Journal of the Royal

Statistical Society - A, v. 135, n. 3, p. 370-384, 1972. Disponível em:
<http://www.jstor.org/stable/2344614>. Acesso em: 27 jun. 2017.
40
R CORE TEAM. R: a language and environment for statistical computing. Vienna, Austria:
Foundation for Statistical Computing, 2017.
RASMUSSEN, C. E.; WILLIAMS, C. K. I. Gaussian Processes for Machine Learning.

Cambridge: MIT Press, 2006.
SONG, X.; POTAPOV, P. V.; KRYLOV, A.; KING, L.; DI BELLA, C. M.; HUDSON, A.; KHAN,
A.; ADUSEI, B.; STEHMAN, S. V.; HANSEN, M. C. National-scale soybean mapping and area
estimation in the United States using medium resolution satellite imagery and field survey.
Remote Sensing of Environment journal, v. 190, n. 1, p. 383-395, 2017. Disponível em:
<http://ac.els-cdn.com/S0034425717300081/1-s2.0-S0034425717300081-
main.pdf?_tid=707e88c6-6b09-11e7-871e-
00000aab0f27&acdnat=1500307574_0451c3530a4339a29586459d66c6da81>. Acesso em:
17 jul. 2017.


YAO, F.; LIU, D.; ZHANG, J.; WANG, P. Estimation of rice yield with a process-based model
and remote sensing data in the middle and lower reaches of Yangtze River of China. Journal
of the Indian Society of Remote Sensing, v. 45, p. 477-484, 2017. Disponível em:
<https://link.springer.com/content/pdf/10.1007%2Fs12524-016-0596-z.pdf>. Acesso em: 29
jun. 2017.
41
5.2 Artigo II: Índice de Vegetação e Índice de Área Foliar para determinação de
parâmetros do Modelo CSM-CROPGRO-Soja para Estimativa de Produtividade
Esta é uma tradução do artigo: ‘Vegetation Index and LAI for Parameter Determination
of the CSM-CROPGRO-Soybean Model when used for Yield Estimation’ sob revisão no
International Journal of Applied Earth Observation and Geoinformation.
Resumo: Sistemas agrícolas são combinações complexas de muitos componentes

diferentes, que requerem diferentes tipos de dados para análise e modelagem. Os dados de
sensoriamento remoto são uma fonte alternativa de dados para regiões agrícolas que
possuem pouca ou nenhuma informação disponível. O objetivo deste estudo foi avaliar se o
modelo CROPGRO-Soybean pode ser calibrado com dados biofísicos obtidos por
sensoriamento remoto, testando três métodos de calibração dos parâmetros, usando índice
de área foliar medido em campo e derivado de sensoriamento remoto e a interceptação de
luz derivada de sensoriamento remoto; ao final, comparar resultados com dados de fazendas
para avaliar a viabilidade e a precisão desses métodos. Este estudo utilizou o Índice de
Vegetação por Diferença Normalizada (NDVI) do Espectrorradiômetro de Resolução
Moderada (MODIS) com índice de área foliar (do inglês Leaf Area Index – LAI) medido em
duas fazendas (Paraná, Brasil e Iowa, EUA) para calibrar os parâmetros da soja no modelo
CSM-CROPGRO. Três métodos de calibração foram realizados, incluindo LAI medido em
campo, LAI derivado de sensoriamento remoto e a interceptação de luz (do inglês Light
Interception – LI) derivada de sensoriamento remoto. Cada método foi testado usando a
ferramenta de análise de sensibilidade DSSAT. Os parâmetros das cultivares sensíveis ao
LAI e LI foram calibrados com um ME de -4,5 kg ha-1 (0,1%), R2 de 0,86 e RMSE médio de
206 kg ha-1 para todos os campos estudados. Em Iowa, EUA obtiveram-se um RMSE 864 kg
ha-1 e um dr de 0,98 para a série temporal de biomassa e RMSE de 904 kg ha-1 e dr de 0,89
para série temporal de peso de vagem. Com o objetivo de melhorar as estimativas do modelo
e adicionar uma variabilidade espaço-temporal, este artigo mostra que a determinação dos
valores de LAI e LI a partir de índices de vegetação de sensoriamento remoto, como NDVI,
pode ser usada para calibração do modelo CSM-CROPGRO para a cultura da soja.
Palavras-chave: sensoriamento remoto, interceptação de luz, coeficiente de extinção,

calibração do modelo de cultura
5.2.1 Introdução
A soja é uma das principais commodities agrícolas para o Brasil e os EUA em termos
de área plantada, produção e exportação. Compreender e estimar como a cultura responde a
diferentes condições ambientais e práticas de manejo de culturas requer um sistema
complexo, que combine componentes em vários processos biológicos, físicos e químicos
interagentes (JONES et al., 2017; TSUJI et al., 1998). O Sistema de Apoio à Decisão para
Transferência de Agrotecnologia (DSSAT) é um conjunto de modelos implementados em um
software que simula tal complexidade, pois incorpora modelos de diferentes culturas, incluindo
o modelo CROPGRO para soja (BOOTE et al., 1998; JONES et al., 2003; HOOGENBOOM et
al., 2015). Para o uso preciso do modelo CROPGRO para predição de produtividade, a
determinação dos parâmetros da cultivar é essencial. No entanto, a calibração de parâmetros
individuais de um modelo de cultura pode exigir muitos conjuntos de dados experimentais e
outros recursos (FUKUI et al., 2015; HOOGENBOOM et al., 2015; JÉGO et al., 2010; JONES
et al., 2003; KAJUMULA MOURICE et al., 2014; BOOTE et al., 1998; TSUJI et al., 1998). A
42
coleta de dados em campo pode ser desafiadora e a informação observada in situ pode não
estar disponível, especialmente para grandes áreas.
A coleta indireta de dados pode ser realizada para preencher possíveis lacunas de
dados de campo. Como os dados de sensoriamento remoto possuem um potencial
significativo para monitorar a dinâmica da vegetação (KASAMPALIS et al., 2018), devido à
sua cobertura sinótica e amostragem temporal frequente (ATZBERGER, 2013), tais dados
podem ser usados para propósitos de modelagem. Li et al. (2015) apontaram que a
combinação de modelos de sensoriamento remoto e de crescimento de culturas é ferramenta
eficaz para a estimativa de produtividade de grãos. Por exemplo, Chakrabarti et al. (2014)
assimilaram dados da umidade do solo de sensoriamento remoto (SMOS) no modelo DSSAT-
CROPGRO utilizando o filtro Ensemble Kalman, que estima variáveis e parâmetros
simultaneamente. Este modelo foi implementado na bacia do Prata no Brasil por dois anos e
o RMSE entre a produtividade de soja estimada e observada foi de 16,8% na primeira safra e
de 4,4% na segunda safra. Fang et al. (2011) integraram o Modelo de Sistema de Cultura –
CERES-Milho com LAI para estimar a produtividade de milho no estado de Indiana, EUA, e
concluíram que integrar os dados de LAI com o modelo facilita vários usos diferentes do
modelo e gera uma série de variáveis agronômicas e biofísicas, incluindo a produtividade da
cultura.
Campos et al. (2018) desenvolveram uma abordagem utilizando sensoriamento
remoto orbital para suplementar os modelos de crescimento de culturas a reproduzir
processos reais no campo, relacionando dados de sensoriamento remoto e parâmetros
biofísicos do dossel. Os autores propuseram um coeficiente de safra baseado em relações
usando dados de campo obtidos de 11 anos de soja irrigada e não irrigada e milho cultivado
no leste de Nebraska, e concluíram que a relação entre a produção de biomassa e a
refletância é significativa, indicando que o uso de dados de sensoriamento remoto para uma
análise quantitativa da produtividade e de biomassa das culturas é confiável. Portanto, a
integração de dados biofísicos provenientes de dados de sensoriamento remoto pode
melhorar as previsões de modelos de simulação de produção agrícola (DORAISWAMY et al.,
2005). As principais vantagens da incorporação de dados de sensoriamento remoto em
modelos de culturas são: a representação das informações espaciais ausentes e a descrição
mais precisa da condição atual da cultura ao longo de vários estágios do desenvolvimento
(KASAMPALIS et al., 2018). No entanto, técnicas baseadas em sensoriamento remoto para
calibrar modelos de crescimento de culturas, como o CROPGRO, não são totalmente
compreendidas. Usar o sensoriamento remoto para calibrar o modelo pode ser um recurso
para aplicá-lo em grandes áreas e viabilizar seu uso quando houver menos dados de campo
disponíveis.
Uma ligação entre o modelo CROPGRO e o sensoriamento remoto é LAI e a LI
(BOOTE et al., 1998; HOOGENBOOM et al., 2015). Ambos podem ser derivados de dados
43
de sensoriamento remoto e estão presentes como variáveis e saídas do modelo. O objetivo

deste estudo foi avaliar se o modelo CROPGRO-Soybean poderia ser calibrado com dados
biofísicos obtidos por sensoriamento remoto. Os objetivos específicos foram: (1) testar três
métodos para calibrar os parâmetros sensíveis a LAI usando LAI medido em campo, LAI
derivado de sensoriamento remoto e LI derivada de sensoriamento remoto; e (2) comparar
resultados com dados de campo para avaliar a viabilidade e a precisão desses métodos.
5.2.2.1 Área em Estudo
O estudo foi realizado em duas áreas, incluindo uma fazenda comercial na região oeste
do estado do Paraná (Sul do Brasil) e uma fazenda comercial no centro de Iowa (Norte dos
EUA) (Figura 17). No Brasil, foram utilizadas quatro áreas de soja, sob condições de sequeiro
e irrigados com 30 e 45 cm de espaçamento entre linhas. A fazenda brasileira está localizada
a 24°42'25,2"S 53°28'48,0"O, com clima subtropical úmido – Cfa (APARECIDO et al., 2016).
Para a fazenda brasileira, usaram-se os dados de clima do Centro Europeu de Clima de Médio
Prazo Previsões (ECMWF) ERA-Interim (UNIÃO EUROPEIA, 2014) chuva, temperaturas,
ponto de orvalho, velocidade do vento, e radiação solar para cada dia. O perfil do solo era um
solo Latossolo Vermelho presente no DSSAT. Para cada campo as medidas de LAI com seis
repetições foram tomadas em sete datas de amostragem a cada 16 dias utilizando o
Analisador de Dossel de Plantas LI-COR – LAI-2200C durante o estádio de crescimento de
2016-2017 (Figura 18). O maior valor de LAI no Brasil foi em 12 de dezembro de 2016 (75
dias após o plantio) no campo irrigado, com espaçamento de 45 cm. A soja foi semeada em
2 de outubro de 2016 e colhida em 4 de fevereiro de 2017 e a produtividade final de cada
campo foi medida via monitor de colheita.
44
Figura 17 Localização das áreas em estudo nos EUA e no Brasil.
A fazenda dos EUA estava sob condições de sequeiro com espaçamento de 45 cm,
localizada a 42°55'49,9"N 93°22 50,1" O com clima continental úmido – Dfa (KOTTEK et al.,
2006). Dados de clima provenientes da Missão de Medição de Precipitação Tropical (TRMM)
do Satélite Ambiental Operacional Geoestacionário (GOES) de chuva, para temperatura,
ponto de orvalho e velocidade do vento, e Previsão da NASA de Recursos Energéticos
Mundiais (NASA-Power) para radiação solar foram usados todos os dias. O solo era um solo
franco argiloso presente no DSSAT. Amostragem destrutiva, conforme Boote (1994) e
Bongiovanni et al. (2015), foi usada para determinar o LAI aproximadamente, a cada 6 dias,
com três repetições para cada data de amostragem (Figura 18). O maior valor de LAI foi
observado em 26 de agosto de 2016 (75 dias após o plantio).
Datas de semeadura e colheita, peso da vagem e biomassa seca total foram medidos
para a fazenda dos EUA. Infelizmente, a produtividade final da soja não foi deterninada, mas
foi estimada a partir da amostragem final da massa da vagem e da relação massa/semente
(DRACUP; KIRBY, 1996; SCHOBECK et al., 1986; SPAETH; SINCLAIR, 1985; BATCHELOR
et al., 1994). A soja foi semeada em 12 de junho de 2016 e colhida em 10 de setembro de
2016.
45
Não Irrigado - 45 cm Irrigado - 45 cm Irrigado - 30 cm

Não Irrigado - 45 cm Não Irrigado - 30 cm
10
LAI - Índice de Área Foliar
6
(m²/m²)
0
20 40 60 80 100 120
DAP - Dias Após Plantio (dias)
Figura 18 LAI (m² / m²) medido para as fazendas de soja no Brasil (círculos) e EUA
(triângulos).
5.2.2.2 Dados de Sensoriamento Remoto
O EVI e o NDVI do Moderate Resolution Imaging Spectroradiometer (MODIS), dos

produtos MOD13Q1 (da plataforma Terra) e MYD13Q1 (da plataforma Aqua) têm uma
resolução espacial de 250 m e uma resolução temporal de 8 dias (NASA LP DAAC, 2015). Os
valores extraídos das imagens de satélite foram a média de todos os pixels dentro das áreas
estudadas. Essas imagens compostas de 8 dias são geralmente muito confiáveis para rastrear
as mudanças nas condições da vegetação (KOUADIO et al., 2014). Além disso, LAI do
produto MCD15A3H do MODIS com uma resolução espacial de 500 m e uma resolução
temporal de 4 dias foram utilizados.
Os produtos MODIS foram extraídos para cada campo, criando assim uma série
temporal EVI, NDVI e LAI para cada campo. Os produtos MODIS foram obtidos on-line a partir
do Aplicativo para Extração e Análise de Amostras Prontas (AρρEEARS), cortesia do Centro
de Arquivamento Ativo Distribuído de Processos Terrestres (DAAC) EOSDIS da NASA,
USGS/Centro de Observação de Recursos Terrestres e Ciência (EROS) (disponível em:
<https://lpdaac.usgs.gov>).
5.2.2.3 Análise de Sensibilidade do modelo CSM-CROPGRO
O modelo CSM-CROPGRO computa a fotossíntese do dossel em intervalos horários

de tempo usando parâmetros de fotossíntese no nível de folha e cálculos de LI. Respostas
mecanísticas a fatores climáticos e análise fisiológica relacionada aos fatores de plantas são
possíveis, devido aos cálculos de fotossíntese foliar por hora, e respostas realistas ao
46
espaçamento entre fileiras e densidade de plantas são devidas à abordagem de sebes

(BOOTE et al., 1998).
O LAI faz parte da arquitetura de dossel e é uma importante variável no modelo. O
modelo prevê o LAI e utiliza-o para determinar a fotossíntese do dossel, a transpiração
potencial da planta e a evaporação potencial da água no solo (BOOTE et al., 1998). O modelo
CROPGRO possui 18 parâmetros de cultivo. A fim de entender quais dos parâmetros eram
mais sensíveis para determinar o LAI e LI, foi realizada uma análise de sensibilidade. Também
foi realizada uma análise de sensibilidade do impacto desses parâmetros na variabilidade da
produtividade de grãos. Os grupos de maturidade 5 e 3 padrões para o Brasil e os EUA,
respectivamente, foram usados como ponto de partida para a análise de sensibilidade. Esse
foi o pressuposto inicial, porque esses grupos de maturidade são típicos para as áreas de
estudo no Brasil e nos EUA. Neste estudo, foi utilizado o modelo DSSAT Cropping System
Version 4.6.5.001 (HOOGENBOOM et al., 2015).
5.2.2.4 Estimativas de Índice de Área Foliar (LAI) e Interceptação de Luz (LI)
Com base na equação de Beer-Lambert da extinção da luz (MONSI; SAEKI, 2005), foi
testada a relação entre o sensoriamento remoto MODI EVI, NDVI e LAI com LAI medido. As
informações dos índices de vegetação foram utilizadas para obter a LAI derivada de
sensoriamento remoto (RSD-LAI – Equação 13) e LI derivada de sensoriamento remoto (RSD-
LI – Equação 14) com a função do coeficiente de extinção (k) com base nos dias após o plantio
(DAP) ou um único valor k.
ln(1−(𝑉𝐼))
𝑅𝑆𝐷𝐿𝐴𝐼 = − 𝑘
Eq.(13)
𝑅𝑆𝐷𝐿𝐼 = 1 − 𝑒𝑥𝑝(−𝑘 ∗ 𝑅𝑆𝐷𝐿𝐴𝐼) Eq.(14)
Presume-se que o efeito da seca cause uma diminuição no coeficiente de extinção (k)
devido à inclinação e à queda das folhas. Da mesma forma, o índice de vegetação diminui
pelo efeito da seca.
5.2.2.5 Métodos de Calibração
Para testar como os dados de sensoriamento remoto podem ser usados para calibrar
o modelo, três métodos foram usados. A primeira calibração (Calibração I) teve como objetivo
utilizar o LAI medido em campo como dados temporais únicos para calibrar os parâmetros da
cultivar no modelo CROPGRO. A segunda calibração (Calibração II) usou o LAI derivado do
sensoriamento remoto (RSD-LAI). Já a terceira calibração (Calibração III) utilizou LI derivada
por sensoriamento remoto (RSD-LI).
Cada calibração foi realizada usando a ferramenta de análise de sensibilidade DSSAT,
que permite percorrer um determinado parâmetro com pequenos incrementos e,
47
subsequentemente, calcular as estatísticas de saídas observadas versus saídas simuladas.

Os seguintes parâmetros foram calibrados; Comprimento Crítico de Curto Dia (CSDL - [horas])
abaixo do qual o desenvolvimento reprodutivo não progride; tempo entre a primeira flor (R1)
e o final da expansão foliar (FL-LF - [dias fototérmicos]); tamanho máximo da folha cheia (três
folhas) (SIZLF - [cm²]); taxa máxima de fotossíntese foliar a 30ºC, 350 ppm CO2 e alta
luminosidade (LFMAX - [mg CO2 m-2s-1]); tempo necessário para a cultivar alcançar a carga
final da vagem sob condições ótimas (PODUR - [dias fototérmicos]). Primeiro, o CSDL foi
direcionado para a data da colheita; então, FL-LF, SIZLF e LFMAX foram calibrados com o
LAI medido em campo (para Calibração I), LAI derivado de sensoriamento remoto (para
Calibração II) e LI derivado por sensoriamento remoto (para Calibração III); então o PODUR
foi calibrado para a produtividade final observada. O erro médio (ME), erro absoluto médio
(MAE), raiz do erro quadrático médio (RMSE) e coeficiente de determinação (R²) foram
utilizados para avaliar as diferentes estimativas de produtividade. Além disso, o índice de
concordância de Willmott (dr – WILLMOTT et al., 2012) foi usado para determinar a precisão
das estimativas das séries temporais de peso e biomassa.
5.2.3.1 Estimativas de LAI e LI
Dos índices de vegetação testados, os melhores resultados foram obtidos com o NDVI.
Portanto, as Equações 15 e 16, para o Brasil e EUA, respectivamente, foram encontradas
para estimar os valores de k em função do DAP, com R² maiores que 0,7. Estas equações
foram utilizadas para estimar o LAI com a Equação 13.
𝑘 = 68,623 ∗ 𝐷𝐴𝑃−1,170 (R² = 0,71) Eq.(15)
𝑘 = 52,062 ∗ 𝐷𝐴𝑃−1,215 (R² = 0,75) Eq.(16)
Da mesma forma, a LI derivada remotamente (RSD-LI) foi estimada usando a equação

de interceptação de luz (Equação 14). No entanto, para o RSD-LI, o valor de coeficiente k
utilizado foi de 0,7063, que apresentou melhores resultados do que o uso de equações como
as Equações 15 e 16.
5.2.3.2 Calibração dos parâmetros do Modelo
Os dados de LAI medido, RSD-LAI e RSD-LI foram adicionados ao software DSSAT

como dados de séries temporais e uma análise de sensibilidade foi realizada comparando o
LAI ou LI simulado com o LAI medido, RSD-LAI ou RSD-LI. O RMSE foi usado para definir os
melhores valores dos parâmetros da cultivar.
48
Para CSDL foi utilizada a data de colheita; no entanto, todas as abordagens

apresentaram resultados semelhantes independentemente do método de calibração, uma vez
que a data da colheita foi a mesma (4 de fevereiro para a fazenda no Brasil e 10 de setembro
para a fazenda nos EUA). Usando LAI como alvo FL-LF, SIZFL e LFMAX foram calibrados,
obtendo os mesmos resultados para calibração I e II (medido LAI e RSD-LAI de NDVI,
respectivamente), mas diferentes resultados foram obtidos para calibração III (com RSD-LI de
EVI). Em contraste com um ponto de partida diferente, o Grupo de Maturidade 6 (GM 6) foi
usado. Contudo, os parâmetros FL-LF, SIZLF e LFMAX convergiram para valores
semelhantes (Tabela 9).
Tabela 9 Parâmetros do modelo ajustados com base em abordagens de calibração

-ciclo- - -Resolvendo para LAI/LI - - - Prod. -
Calibração CSDL1 FL-LF2 SIZLF2 LFMAX2 PODUR3
Campo brasileiro
Grupo de maturidade 5 12,83 18 180 1.03 10
Calibração I (LAI medido) 12,68 34 230 1.20 26
Calibração II (RSD-LAI do NDVI) 12,68 34 230 1.20 26
Calibração III (RSD-LI do EVI) 12,68 26 230 1.03 31
Calibração I (via GM 6) 13,14 34 230 1.20 26
Campo americano
Grupo de maturidade 3 13,40 26 180 1.03 10
Calibração I (LAI medido) 13,98 34 230 1.20 28
Calibração II (RSD-LAI do NDVI) 13,98 34 230 1.20 28
Calibração III (RSD-LI do EVI) 13,98 26 230 1.03 25
1
: alvo para data de colheita; 2 : alvo para LAI ou LI; 3 : alvo para produtividade;
Os parâmetros indicam que a cultivar utilizada no Paraná é de ciclo indeterminado,

pois FL-LF e PODUR tem maiores valores, indicando um período prolongado de crescimento
da área foliar e adição de vagens após o início do florescimento. LAI e LI são sensíveis aos
parâmetros LF-FL, SIZLF e LFMAX. Outros parâmetros não foram apropriados para
calibração utilizando o LAI, porque esses parâmetros não criaram diferenças no LAI ou na LI
isto é, os parâmetros não são sensíveis ao LAI e LI.
Para CSDL, os resultados foram intimamente relacionados com o ciclo da cultura que
deve ser calibrado independentemente utilizando a data de colheita. Isso é semelhante a
Dzotsi et al. (2013), que verificaram que o modelo de safra SALUS no DSSAT não foi sensível
a parâmetros associados à previsão do tempo de germinação e emergência, mas os
parâmetros mais influentes foram relacionados ao crescimento do índice de área foliar,
duração da cultura e graus dia. Além disso, as imagens de sensoriamento remoto são
baseadas nas características de interceptação de luz, transmissão e refletância da copa das
culturas, portanto, usar essa informação para determinar a interceptação da luz é
conceitualmente mais próxima da interceptação de luz prevista pelo modelo do que do LAI da
cultura (uma característica biológica prevista pelo modelo). Agricultores e produtores podem
usar a LI de maneira não destrutiva para avaliar suas área e melhor gerenciá-las.
49
5.2.3.3 Avaliando as abordagens de calibração e seu efeito na produtividade
Os métodos de calibração apresentaram diferentes produtividades simuladas (Tabela

10). Como as calibrações I e II produziram os mesmos parâmetros, os resultados foram os
mesmos. Assim, o uso de LAI medido ou RSD-LAI de NDVI apresentou os mesmos
resultados, indicando que o RSD-LAI pode ser utilizado para calibração do modelo, obtendo
produtividades similares quando utilizado LAI medido. No campo americano, não houve
mensuração para produtividade; portanto, a produtividade de grãos foi baseada no peso da
vagem, considerando um percentual de debulha de 69%. O valor de 69% foi determinado a
partir da média da porcentagem de debulhagem medida de dois experimentos em Iowa (em
1988 e 1990).
Tabela 10 Produtividade real (kg ha-1) e produtividade simulada pelo modelo com base em
três abordagens de calibração: baseada em LAI medido; LAI de sensoriamento remoto ou LI
de detecção remota, seguido por uma calibração de produtividade
Produtividade Produtividade Estimada (kg ha-1)
Fazendas
Real (kg ha-1) Sem Calibração* Calibração I Calibração II Calibração III
Não irrigado 30 cm 4166 3795 4127 4127 4136
Não irrigado 45 cm 3771 3750 4112 4112 4074
Irrigado 30 cm 4826 4607 4493 4493 4526
Irrigado 45 cm 4473 4562 4470 4470 4460
Campo Iowa 3295 3919 3304 3304 3318
*sem calibração significa que o grupo de maturidade 5 foi utilizado
Utilizando os métodos de calibração descritos anteriormente, os parâmetros das

cultivares sensíveis ao LAI e LI foram calibrados com um erro médio de -4,5 kg ha-1 (0,1%),
R2 de 0,86 e RMSE médio de 206 kg ha-1 para todos os campos estudados (Tabela 3). A
disponibilidade de medições ao longo do ciclo da cultura em Iowa, EUA, resultou em um
RMSE médio de 895 kg ha-1 e índice de concordância de Willmott de 0,98 para a série
temporal de biomassa e um RMSE médio de 941 kg ha-1 e índice de concordância de Willmott
de 0,87 para a série temporal do peso da vagem (Tabela 12). Com base nos resultados, a
utilização de dados de sensoriamento remoto (Calibração II e III) apresentou resultados
semelhantes ao uso de dados medidos a campo (Calibração I) e melhores resultados do que
o modelo não calibrado (Tabela 11). Como a Calibração III deriva dos mesmos dados (RSD-
LAI para RSD-LI), tem uma vantagem para os que desejam calibrar seu modelo para LI em
vez de LAI.
50
Tabela 11 Estatísticas das estimativas de produtividade (kg ha-1) nas fazendas do Brasil e dos
EUA por meio das diferentes calibrações
Sem Calibração Calibração I Calibração II Calibração III
ME 20,4 -5,0 -5,0 -3,4
MAE 264,8 145,0 145,0 133,8
RMSE 341,6 213,9 213,9 191,52
R2 0,60 0,85 0,85 0,89
ME: erro médio; MAE: erro médio absoluto; RMSE: raiz quadrado do erro médio; R²: coeficiente de
determinação
Mourice et al. (2014) apontaram que a falta de dados experimentais limitou a aplicação
de algum modelo de cultura com o DSSAT e outras plataformas de modelagem. Os métodos
de calibração apresentados neste estudo podem ser usados para calibrar facilmente os
parâmetros da cultivar no modelo CSM-CROPGRO com LAI de sensoriamento. Isto corrobora
com Bao et al. (2017), que compararam o desempenho dos modelos CSM-CERES-Maize e
EPIC e concluiu que conjuntos limitados de dados de variedades de milho podem ser usados
para calibração de modelo quando dados detalhados de estudos de análise de crescimento
não são prontamente disponíveis. Portanto, ao utilizar os métodos por sensoriamento remoto
(Calibração II ou III) os resultados obtidos são similares ao utilizar dados de campo para a
calibração (Calibração I) e melhores do que não calibrar o modelo (Tabela 11)
O uso dessas abordagens tornará o modelo mais útil para previsão de produtividade
em regiões maiores, onde as medidas de campo no solo não são viáveis e o sensoriamento
remoto pode ser facilmente adquirido. Os efeitos da metodologia de calibração podem ser
visualizados através da avaliação da série temporal da biomassa e do peso da vagem ao
longo do tempo. Não houve medições de biomassa e peso da vagem nos campos brasileiros.
Para o campo norte-americano, foi possível confirmar que o uso de dados RSD, como LAI e
LI, resultou em uma boa calibração da biomassa total e do peso da vagem em comparação
com o crescimento observado (Figura 19).
51
Biomassa (kg/ha) Peso de Vagem (kg/ha)

Biomassa - Sem Calibração (kg/ha) Peso de Vagem - Sem Calibração (kg/ha)
Biomassa - Calibração I (kg/ha) Peso de Vagem - Calibração I (kg/ha)
Biomassa - Calibração II (kg/ha) Peso de Vagem - Calibração II (kg/ha)
Biomassa - Calibração III (kg/ha) Peso de Vagem - Calibração III (kg/ha)
12000
Biomassa e Peso da Vagem (kg ha-1)
10000
8000
6000
4000
2000
0
20 40 60 80 100 120 140 160
Dias Após Plantio
Figura 19 Observações e simulações de séries temporais de peso de biomassa e peso da

vagem (kg ha-1) com base nos métodos de calibração para a fazenda nos EUA.
Para o peso da vagem, a melhor abordagem de calibração foi baseada na LI, enquanto
que para a predição de biomassa a melhor opção foi a calibração I baseada no IAF ou
calibração II com base no RSD-LAI, embora os índices de concordância de Willmott (dr) não
tenham sido muito diferentes para a biomassa da cultura (Tabela 12).
Tabela 12 Estatísticas de biomassa e peso da vagem (kg ha-1) para cada abordagem de
calibração no campo americano
Biomassa Peso da Vagem
Sem
Cal. I Cal. II Cal. III No Cal. Cal. I Cal. II Cal. III
Cal.
ME -1082 -553 -553 -684 -870 -604 -604 -556
MAE 1082 573 573 706 870 607 607 559
RMSE 1366 864 864 957 1180 960 960 904
dr Willmott 0,95 0,98 0,98 0,98 0,81 0,87 0,87 0,89
Cal.: Calibração ME: erro médio; MAE: erro médio absoluto; RMSE: raiz quadrado do erro médio.
5.2.4 Conclusões
Este estudo mostrou que os dados de sensoriamento remoto são uma alternativa
viável quando os dados in situ não estão disponíveis para a calibração do modelo. Calibrar o
modelo usando LAI ou LI derivado de sensoriamento remoto a partir de índices de vegetação
apresentou resultados semelhantes ao uso de LAI medido e melhores resultados que o
modelo sem calibração.
52
Declaração de Divulgação
Nenhum potencial conflito de interesse foi relatado pelos autores.
Agradecimentos
Este trabalho contou com o apoio da Fundação CAPES (Coordenação de

Aperfeiçoamento Pessoal de Educação Superior – Ministério da Educação – Brasil), sob o
subsídio 88881.131979/2016-01. Além disso, os autores agradecem aos agricultores por
compartilhar seus dados.
Referências
APARECIDO, L. E. O.; ROLIM, G. S.; RICHETTI, J.; SOUZA, P. S. de; JOHANN, J. A. Köppen,
Thornthwaite and Camargo climate classifications for climatic zoning in the State of Paraná,
Brazil. Ciencia e Agrotecnologia, v. 40, n. 4, p. 405-417, 2016. Disponível em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1413-70542016000400405&lng
=en&nrm=iso&tlng=en>. Acesso em: 17 abr. 2017.
ATZBERGER, C. Advances in remote sensing of agriculture: context description, existing

operational monitoring systems and major information needs. Remote Sensing, v. 5, p. 949-
981, 2013.
BATCHELOR, W.D.; JONES, J.W.; BOOTE, K.J.; HOOGENBOOM, G. Carbon-based model

to predict peanut pod detachment. Transactions of the ASAE, v. 37, p. 1639-1646, 1994.
DOI:10.13031/2013.28251.
BAO, Y.; HOOGENBOOM, G.; MCCLENDON, R.; VELLIDIS, G. A comparison of the

performance of the CSM-CERES-Maize and EPIC models using maize variety trial data.
Agricultural Systems, v. 150, p. 109-119, 2017. Disponível em:
<https://www.sciencedirect.com/science/article/pii/S0308521X16306588>. Acesso em: 15
jun. 2018.
BOOTE, K. J. Data Requirements for model evaluation and techniques for sampling crop
growth and development. DSSAT Version 3.5, v. 4. Honolulu: University of Hawaii,1994. p.
215-220.
BONGIOVANNI, T.; LIU, P. W.; NAGARAJAN, K.; PRESTON, P.; RUSH, P.; VAN EMMERIK,
T. H. M.; TERWILLEGER, R.; MONSIVAIS-HUERTERO, A.; JUDGE, J.; STEELE-DUNNE, S.;
DE ROO, R.; AKBAR, R.; BAAR, E.; WALLACE, M.; ENGLAND, A. AE514 - Field Observations
during the eleventh microwave water and energy balance experiment (MicroWEX-11) –
25/04/2012 a 06/12/2012. Proceedings. IFAS – University of Florida, 96 p. 2015. Disponível
em: <http://edis.ifas.ufl.edu.>. Acesso em: 14 ago. 2017.

BOOTE, K. J.; JONES, J. W.; HOOGENBOOM, G.; PICKERING, N. B. The CROPGRO model
for grain legumes. Understanding Options for Agricultral Production. 1a. ed. Dordrecht:
Kluwer Academic, 1998. p.99-128.
CAMPOS, I.; NEALE, C. M. U.; ARKEBAUER, T. J.; SUYKER, A. E.; GONÇALVES, I. Z. Water
productivity and crop yield: a simplified remote sensing driven operational approach.
Agricultural and Forest Meteorology, v. 249, p. 501-511, 2018. Disponível em:
53
<https://www.sciencedirect.com/science/article/pii/S0168192317302344>. Acesso em: 20

abr. 2018.
7, n. 9, p. 3867-3879, 2014.
DORAISWAMY, P. C.; SINCLAIR, T. R.; HOLLINGER, S.; AKHMEDOV, B.; STERN, A.;
PRUEGER, J. Application of MODIS derived parameters for regional crop yield assessment.
Remote Sensing of Environment, v. 97, n. 2, p. 192-202, 2005. Disponível em:
<http://linkinghub.elsevier.com/retrieve/pii/S0034425705001355>. Acesso em: 27 maio 2014.
DRACUP, M.; KIRBY, E.J.M. Pod and seed growth and development of narrow-leafed lupin in
a water limited mediterranean-type environment. Field Crops Research, v. 48, p. 209-222,
1996. DOI:10.1016/S0378-4290(96)00040-8.
DZOTSI, K. A.; BASSO, B.; JONES, J. W. Development, uncertainty and sensitivity analysis
of the simple SALUS crop model in DSSAT. Ecological Modelling, v. 260, p. 62-76, 2013.
Disponível em: <https://www.sciencedirect.com/science/article/pii/S0304380013001749>.
Acesso em: 15 jun. 2018.
EUROPEAN UNION. EC-JRC-MARS data created by MeteoConsult based on ECWMF

(European Centre for Medium Range Weather Forecasts) model outputs. Disponível em:
<http://spirits.jrc.ec.europa.eu/?page_id=2869>. Acesso em: 19 ago. 2015.
FANG, H.; LIANG, S.; HOOGENBOOM, G. Integration of MODIS LAI and vegetation index
products with the CSM–CERES–Maize model for corn yield estimation. International Journal
of Remote Sensing, v. 32, n. 4, p. 1039-1065, 2011. Disponível em:
<http://www.tandfonline.com/doi/abs/10.1080/01431160903505310>. Acesso em: 19 abr.
2017.
FUKUI, S.; ISHIGOOKA, Y.; KUWAGATA, T.; HASEGAWA, T. A methodology for estimating
phenological parameters of rice cultivars utilizing data from common variety trials. Journal of
Agricultural Meteorology, v. 71, n. 2, p. 77-89, 2015. Disponível em:
<https://www.jstage.jst.go.jp/article/agrmet/71/2/71_D-14-00042/_pdf>. Acesso em: 19 jan.
2018.
HOOGENBOOM, G.; JONES, J.W.; WILKENS, P.W.; PORTER, C.H.; BOOTE, K.J.; HUNT,
L.A.; SINGH, U.; LIZASO, J.I.; WHITE, J.W.; URYASEV, O.; OGOSHI, R.; KOO, J.; SHELIA,
V.; TSUJI, G.Y. Decision Support System for Agrotechnology Transfer (DSSAT): Version
4.6. Washington: DSSAT Foundation, 2015. Disponível em: <www.DSSAT.net>. Acesso em:
18 mai. 2017.
JÉGO, G.; BOURGEOIS, G.; MORRISON, M. J.; DRURY, C. F.; TRAMBLAY, N.; TRAMBLAY,
G. Calibration and performance evaluation of soybean and spring wheat cultivars using the
STICS crop model in Eastern Canada. Field and Crops Research, v. 117, p. 183-196, 2010.
JONES, J. W.; ANTLE, J. M.; BASSO, B.; BOOTE, K. J.; CONANT, R. T.; FOSTER, I.;
GODFRAY, H. C. J.; HERRERO, M.; HOWITT, R.D E.; JANSSEN, S.; KEATING, B. A.;
MUNOZ-CARPENA, R.; PORTER, C. H.; ROSENZWEIG, C.; WHEELER, T. R. Brief history
of agricultural systems modeling. Agricultural Systems, v. 155, p. 240-254, 2017. Disponível
em: <https://www.sciencedirect.com/science/article/pii/S0308521X16301585>. Acesso em: 8
mar. 2018.
54
KAJUMULA MOURICE, S.; RWEYEMAMU, C. L.; TUMBO, S. D.; AMURI, N.; MOURICE, S.
K. Maize cultivar specific parameters for Decision Support System for Agrotechnology Transfer
(DSSAT) application in Tanzania. American Journal of Plant Sciences, v. 5, n. 5, p. 821-
833, 2014. Disponível em: <http://www.scirp.org/journal/ajps>. Acesso em: 19 jan. 2018.
KASAMPALIS, D.; ALEXANDRIDIS, T.; DEVA, C.; CHALLINOR, A.; MOSHOU, D.; ZALIDIS,
G.Contribution of Remote Sensing on crop models: a review. Journal of Imaging, v. 4, n. 4,
p. 52, 2018. Disponível em: <http://www.mdpi.com/2313-433X/4/4/52>. Acesso em: 20 abr.
2018.
KOTTEK, M.; GRIESER, J.; BECK, C.; RUDOLF, B.; RUBEL, F. World Map of the Köppen-
Geiger climate classification updated. Meteorologische Zeitschrift, v. 15, n. 3, p. 259-263,
2006.
KOUADIO, L.; NEWLANDS, N. K.; DAVIDSON, A.; ZHANG, Y. Assessing the Performance of
MODIS NDVI and EVI for Seasonal Crop Yield Forecasting at the Ecodistrict Scale. Remote
Sensing, v. 6, p. 10193-10214, 2014. DOI: 10.3390/rs61010193.
LI, Z.; JIN, X.; ZHAO, C.; WANG, J.; XU, X.; YANG, G.; LI, C.; SHEN, J. Estimating wheat yield
and quality by coupling the DSSAT-CERES model and proximal remote sensing. European
Journal of Agronomy, v. 71, p. 53-62, 2015. Disponível em:
<http://www.sciencedirect.com/science/article/pii/S1161030115300216>. Acesso em: 19 abr.
2017.
MONSI, M.; SAEKI, T. On the factor light in plant communities and its importance for matter
production. Annals of Botany, v. 95, n. 3, p. 549-567, 2004. Disponível em:
<http://doi.org/10.1093/aob/mci052>. Acesso em: 25 jun. 2017.

SCHOBECK, M.W.; HSU, F.C.; CARLSEN, T.M. Effect of pod number on dry matter and
nitrogen accumulation and distribution in soybean. Crop Science, v. 26, n. 4, p. 783-788.
1986. DOI:10.2135/cropsci1986.0011183X002600040033x
SPAETH, S.C.; SINCLAIR, T.R. Linear increase in soybean harvest index during seed-filling.
Agronomy Journal, v. 77, n. 2, p. 207-2011. 1985.
doi:10.2134/agronj1985.00021962007700020008x
TSUJI, G. Y.; HOOGENBOOM, G.; THORNTON, P. Understanding options for agricultural

production. London: Kluwer Academic Publishers, 1998.

55
5.3 Artigo III: Estimativa de produtividade da soja no estado do Paraná com a plataforma
CyMP
Resumo: A determinação rápida e acurada de dados de produção em escala regional é

fundamental para o agronegócio. Este trabalho teve como objetivo avaliar o software Crop
yield Modeling Plataform (CyMP) para estimar a produtividade e a produção de soja no estado
do Paraná para os anos-safras 2013-14, 2014-15 e 2015-16. Para isto, utilizaram-se dados
agrometeorológicos do ECMWF, dados de solo do novo mapa de solos do Brasil da
EMBRAPA e dados de EVI do sensor MODIS. Os dados do sensor MODIS foram utilizados
para determinação das datas de semeadura e colheita no estado. Os dados
agrometeorológicos e do solo foram utilizados nos modelos de evapotranspiração FAO-56 e
de estimativa da produtividade FAO-33 para geração do balanço hídrico e da produtividade
da soja, respectivamente, no estado. Todos os procedimentos foram realizados no software
CyMP e os resultados de produtividade e produção foram comparados com os valores
fornecidos pela CONAB. Comparando os resultados das produtividades estimadas com os
dados oficiais, obteve-se diferença entre a média estimada e a média oficial a partir de 31 kg
ha-1 e a produção a partir de 3,5 milhões de toneladas.
Palavras-chave: modelo agrometeorológico, FAO-56, FAO-33
5.3.1 Introdução
Informações de produção agrícola são fundamentais para o gerenciamento de

qualquer setor do agronegócio e a soja é a principal commodity do agronegócio brasileiro.
Estimar sua produção de forma rápida e confiável é essencial; contudo, o método tradicional,
baseado em pesquisas e censos, é demorado e subjetivo (JOHANN et al., 2016). O
sensoriamento remoto provê dados acurados e confiáveis de maneira rápida, que podem ser
utilizados em escala regional e nacional (SONG et al., 2017).
Resumidamente, utilizam-se dados de sensoriamento remoto em modelos
estocásticos baseados em modelos de regressão e aprendizado de máquina ou em modelos
determinísticos, ou seja, baseados em relações físicas determinadas, para estimativa de
produtividade de grãos. Richetti et al. (2018) utilizaram o índice de vegetação melhorado EVI
do sensor MODIS em algoritmos de aprendizado de máquina gerando modelos que estimam
a produtividade e a produção de soja no estado do Paraná, obtendo erro médio de
3,52 kg ha−1, raiz quadrado do erro médio (do inglês, Mean Error – ME) de 373 kg ha−1 índice
de concordância de Willmott (dr) de 0.85 para o melhor modelo testado. Chaves et al. (2018)
também utilizaram dados MODIS e dados do IBGE em modelos geoestatísticos para estimar
área plantada e produtividade de soja no Mato Grosso do Sul, obtendo exatidão global e índice
kappa de 0,92 e 0,84, respectivamente, para mapeamento e dr 0,92 para produtividade. Jin
et al. (2018) resumiram os recentes desenvolvimentos em modelagem de culturas,
sensoriamento remoto e assimilação de dados.
Os modelos agrometeorológicos são modelos para estimar a produtividade utilizando
dados agrometeorológicos como precipitação, evapotranspiração e temperatura. Rojas et al.
(2005) desenvolveram um sistema de monitoramento utilizando modelos agrometeorológicos
56
no leste da África para sorgo, milho, milheto, arroz, cevada e trigo. Marcai et al. (2015)
utilizaram modelos agrometeorológicos regressivos baseados em precipitação, radiação solar
e evapotranspiração de referência para cana-de-açúcar em São Paulo e obtiveram erros
absolutos porcentuais de até 8% e R² a partir de 0,67. Jegó et al. (2010) utilizaram o modelo
STICS (Brisson et al., 1998) para estimar produtividade de soja no Canadá, obtendo raiz
quadrada do erro médio normalizado de 26%.
O objetivo deste trabalho foi utilizar o software CyMP para estimar a produtividade e a
produção de soja no estado do Paraná. Especificamente, (1) estimar produtividade de soja
(kg ha-1) por pixel para os anos-safras 2013-14, 2014-15 e 2015-16, e (2) estimar a produção
total do estado para os mesmos anos-safras.
5.3.2.1 Área em estudo
O estudo foi conduzido no estado do Paraná, Sul do Brasil, localizado entre os

paralelos 22°29' S e 26°43'S e meridianos 48°2'W e 54°38'W (Figura 20) com área de
199307,9 km². O clima paranaense é majoritariamente subtropical Cfa (APARECIDO et al.,
2016) com solo predominante latossolo argiloso (EMBRAPA, 2009). A semeadura no estado
ocorre entre setembro e novembro com colheita de janeiro a abril. Dados de produtividade de
120 fazendas foram coletados nos anos safras 2013-2014, 2014-2015 e 2015-2016 e foram
utilizados para análise de acurácia do modelo (Figura 20).
Figura 20 Mapa de localização do estado do Paraná com as Estações Virtuais (EV) do

ECMWF e localização das fazendas de produção de soja.
Fonte: Souza et al. (2015).
57
5.3.2.2 Dados Climáticos e do Solo
Para a estimativa de produtividade, o software CyMP requer dados de precipitação

(mm), evapotranspiração de referência (mm) e temperatura (ºC). Estes foram obtidos do
European Centre for Medium-Range Weather Forecasts (ECMWF – Centro Europeu de
Previsão do Tempo de Médio Alcance).
Os dados do solo foram utilizados para determinação da capacidade de
armazenamento de água do solo (CAD), que é o intervalo de umidade do solo entre a
capacidade de campo (CC%) e o ponto de murcha permanente (PMP%). Tais dados
dependem do tipo de solo de cada região. Assim, foram utilizadas informações da CAD
geradas, conforme Farias et al. (2000) e Embrapa (1998) (Tabela 13). A partir dos tipos de
solo obtidos do Novo Mapa de Solos do Brasil (EMBRAPA, 2011), definiu-se o valor de CAD
para o estado do Paraná.
Tabela 13 Capacidade de retenção de água no solo (CAD) para diferentes tipos de solo
Tipos de Solo CAD (mm)
Neossolo Quartzarênico
50
Neossolo Flúvico de textura arenosa.
Latossolo Vermelho-Amarelo
Latossolo Vermelho (menos de 35% de argila) 70
Neossolo Litólico
Luvissolos
Argissolos
Nitossolos
100
Latossolos (exceto Latossolo Vermelho com menos de 35% de argila)
Cambissolos
Neossolo Flúvico de textura média a argilosa.
FONTE: Adaptada de Embrapa (1999); Farias et al. (2000).
5.3.2.3 Dados Espectrais
Para determinação das datas de semeadura e colheita foram utilizadas imagens do

índice de vegetação melhorado (do inglês Enhaced Vegetation Index – EVI) dos produtos
MODIS Terra (MOD13Q1) e Aqua (MYD13Q1). Estes produtos, combinados, apresentam
uma resolução espacial de 250 m e resolução temporal de 8 dias. As datas de semeadura e
de colheita foram estimadas com base nas séries temporais do MODIS EVI conforme Johann
et al. (2016). Estes determinaram as datas de semeadura e de colheita com base nas
mudanças temporais no EVI para cada pixel do MODIS. O pico da vegetação coincidiu com o
valor máximo de EVI. O tempo em que o EVI foi mínimo, anterior ao pico de vegetação, foi
considerado como a data de semeadura e o mínimo de EVI após o pico foi considerado como
a data de colheita.
58
5.3.2.5 Estimativa de Produtividade
Para cada ano-safra, o mapeamento de soja foi utilizado de forma que todos os
procedimentos fossem realizados apenas nas áreas com cultura. Os mapas foram gerados
por Souza et al. (2015) e Grzegozewski et al. (2016). O CyMP estima as datas conforme
Johann et al. (2016). Os dados de precipitação (mm), ETo (mm) e temperaturas (ºC) do
ECMWF e CAD (mm) do solo foram re-amostrados para imagens com resolução espacial de
250 m. As estimativas de produtividade (Yest – kg ha-1) foram então comparadas com a
produtividade oficial do estado (Yof – kg ha-1). Para determinar a produção regional total (kg)
no estado, a produtividade (kg ha-1) foi multiplicada pela área do pixel (6,25 ha). Esses valores
de produção por pixel foram somados para obter a produção total e então comparados com
dados oficiais (Figura 211).
Figura 21. Fluxograma geral do trabalho. EVI: Índice de Vegetação Melhorado; DS: Data de
Semeadura; DC: Data de Colheita; CAD: Capacidade de Armazenamento de Água;
Prec.: Precipitação; ETo: Evapotranspiração de Referência; Temp.: Temperatura;
Yof: produtividade oficial; Yest: produtividade estimada.
5.3.2.6 Modelagem
No software CyMP utilizado está implementado o balanço hídrico da FAO-56 (ALLEN

et al., 1998a), o Zoneamento Ecológico (KASSAM; HIGGINS, 1981) para produtividade
potencial, e o modelo FAO-33 (STEDUTO et al., 2012) para estimar a produtividade atingível.
O balanço hídrico FAO-56 (ALLEN et al., 1998a) é dado pelo esgotamento hídrico na
zona radicular. Assim, considera-se um sistema formado por determinada camada de solo e
59
analisam-se as entradas e saídas de água deste sistema. Basicamente, o esgotamento

hídrico é a quantidade de água que falta no solo para atingir-se a capacidade de campo
(Equação 17), sendo, portanto, a diferença entre entradas e saídas do solo. O valor resultante
dessa diferença é a quantidade água faltante ou excedente no sistema em determinado
período de tempo; logo, em caso de falta de água, maior o esgotamento e maior o estresse
hídrico.
𝐷𝑟,𝑖 = 𝐷𝑟,𝑖−1 − 𝑃𝑖 + 𝑅𝑂𝑖 − 𝐼𝑖 − 𝐶𝑅𝑖 + 𝐸𝑇𝑐,𝑖 + 𝐷𝑃𝑖 Eq.(17)
em que: 𝐷𝑟,𝑖 é o esgotamento na zona radicular no final do período i (mm); 𝐷𝑟,𝑖−1 é o

esgotamento na zona radicular no período anterior i-1 (mm); 𝑃𝑖 é precipitação no período i
(mm); 𝑅𝑂𝑖 é o escoamento superficial no tempo i (mm); 𝐼𝑖 é a irrigação no tempo i (mm); 𝐶𝑅𝑖
é a ascensão capilar do solo no tempo i (mm); 𝐸𝑇𝑐,𝑖 é a evapotranspiração da cultura no tempo
i (mm); 𝐷𝑃𝑖 é a percolação profunda abaixo da zona radicular no tempo i (mm).
Os valores de ascensão capilar, percolação profunda, escoamento superficial e
irrigação foram desconsiderados neste trabalho, pela impossibilidade de determiná-los e pelo
estado não possuir área de irrigação considerável. Para determinar a evapotranspiração da
cultura (ETc) utilizaram-se os valores de Kc (ALLEN et al., 1998) e os valores de
evapotranspiração de referência (ET0) (Equação 18).
𝑬𝑻𝒄 = 𝑲𝒄 𝑬𝑻𝟎 Eq.(18)
em que: ETc é a evapotranspiração da cultura (mm); Kc é o fator da cultura (adimensional);

ET0 é a evapotranspiração de referência (mm).
Os valores da evapotranspiração real (ETa) são difíceis de serem determinados.
Entretanto, podem ser medidos utilizando-se um tanque classe A, ou por métodos empíricos.
As características climáticas de cada local influenciam nos valores médios da
evapotranspiração atual. Uma das formas de se calcular a ETa é por meio do fator ks de
estresse hídrico da cultura (Equação 19). O fator ks quantifica a redução da evapotranspiração
em relação à disponibilidade hídrica do solo (Equação 20).
𝑬𝑻𝒂 = 𝒌𝒔 𝑬𝑻𝒄 Eq. (19)
em que: ETa é a evapotranspiração real (mm); ks é o fator de estresse hídrico da cultura.
𝟏 𝒔𝒆 𝑫𝒓,𝒊 < 𝑹𝑨𝑾

𝒌𝑺 = { 𝑻𝑨𝑾−𝑫𝒓,𝒊 Eq. (20)
𝑻𝑨𝑾−𝑹𝑨𝑾
𝒔𝒆 𝑫𝒓,𝒊 ≥ 𝑹𝑨𝑾
em que: TAW é o total de água disponível em determinada profundidade do solo (mm); RAW
é a água prontamente disponível para a cultura (mm); 𝑫𝒓,𝒊 esgotamento (mm) obtido pela
Equação 22.
60
O total de água disponível no solo (TAW) é a capacidade de armazenamento de água

do solo multiplicada pela profundidade desejada, ou seja, a capacidade de água disponível
(CAD) multiplicada pela profundidade efetiva das raízes da cultura (Equação 21).
𝑇𝐴𝑊 = 𝐶𝐴𝐷 ∗ 𝑍𝑟 Eq.(21)
em que Zr é a profundidade efetiva do sistema radicular (ALLEN et al., 1998).
O valor do esgotamento ( 𝐷𝑟,𝑖 ) é dependente do valor da TAW e do valor do

esgotamento anterior,𝐷𝑟,𝑖−1 (Equação 22).
𝑇𝐴𝑊, 𝑠𝑒𝐷𝑟,𝑖−1 > 𝑇𝐴𝑊.

𝐷𝑟,𝑖 = { Eq.(22)
𝐷𝑟,𝑖−1 , 𝑠𝑒𝐷𝑟,𝑖−1 ≤ 𝑇𝐴𝑊
Já a água prontamente disponível (RAW) representa a quantidade de água que a

planta não necessita de nenhum esforço para sua utilização, e é calculada multiplicando-se o
valor de TAW pelo coeficiente p (p = 0,5), que é o coeficiente de esgotamento que representa
a dificuldade que a planta terá para extrair a quantidade de água não prontamente disponível
do solo. Com esses dados, foi possível calcular o esgotamento na zona radicular em cada
decêndio. Desta forma, o balanço hídrico para a cultura da soja (BHFAO, Equação 23), que é
o valor oposto do esgotamento na zona radicular em cada período i foi determinado.
𝐵𝐻𝐹𝐴𝑂 = 𝐷𝑟,𝑖 ∗ (−1) Eq.(23)
O modelo de estimativa de produtividade (Equação 24) apresentado pela FAO

considera que a redução relativa da produtividade está relacionada com a correspondente
redução relativa da evapotranspiração (STEDUTO et al., 2012).
𝒀 𝑬𝑻
(𝟏 − 𝒀𝒂 ) = 𝑲𝒚 (𝟏 − 𝑬𝑻𝒂 ) Eq.(24)
𝒙 𝒄
em que: Yx e Ya são os valores, respectivos, de produtividade potencial e produtividade

atingível, (kg ha-1); ETc e ETa são os valores de evapotranspiração da cultura e real,
respectivamente (mm); Ky é o fator de sensibilidade hídrica, que representa a sensibilidade a
estresses hídricos (adimensional).
O fator Ky assume a essência das complexas relações entre a produtividade de uma
cultura e sua necessidade de água, envolvidos nos processos biológicos, químicos e físicos
(STEDUTO et al., 2012). Estes são específicos para cada cultura e variam de acordo com o
estádio da cultura, para soja Ky = 0,8, sendo que:
 Ky > 1: a cultura é muito sensível ao déficit hídrico com reduções de produtividade
proporcionais ao estresse hídrico sofrido;
61
 Ky < 1: a cultura é tolerante ao déficit hídrico, recuperando-se parcialmente de estresses

hídricos sofridos; sendo assim, apresentam reduções de produtividade menores
proporcionalmente em relação a redução de água disponível;
 Ky = 1: a produtividade é diretamente proporcional ao déficit hídrico.
Para estimar a produtividade potencial, também chamado de produção bruta de
matéria seca da cultura padrão (Yx, kg ha-1), utiliza-se o método de Kassam (1977), que se
baseia em níveis de radiação, temperatura e dias nublados e limpos. Determina-se a
produtividade potencial pelo somatório das produtividades potenciais brutas (PPR, kg ha-1)
para a cultura (Equação 25). Os cálculos foram realizados diariamente.
𝒀𝒙 = ∑ 𝑷𝑷𝑹 Eq.(25)
A produtividade potencial bruta é determinada pela produtividade potencial bruta para

cultura padrão (PPR, kg ha-1, Equação 26) e o índice de colheita (Cc = 0,2625, adimensional).
Este índice de colheita é responsável pela calibração do modelo na região em estudo.
𝑃𝑃𝑅 = 0,265455 ∗ 𝐶𝑐 ∗ 𝑃𝑃𝐵𝑝 Eq.(26)

O valor de PPBp é a soma entre a produtividade potencial bruta para dias nublados (PPBn,
Equação 27) e a produtividade potencial bruta para dias limpos (PPBc, Equação 28).
𝑃𝑃𝐵𝑛 = (31,7 + 0,219 ∗ 𝑄0 ) ∗ 𝑐𝑡𝑛 ∗ 0,6 Eq.(27)
𝑃𝑃𝐵𝑐 = (107,2 + 0,36 ∗ 𝑄0 ) ∗ 𝑐𝑡𝑐 ∗ 0,6 Eq.(28)
As produtividades potenciais brutas (PPBn e PPBc) são dependentes das correções

de temperatura, para dias nublados (ctn, Equação 29) e para dias limpos (ctc, Equação 30),
e da radiação no topo da atmosfera (Q0, Equação 31).
0,583 + 0,014 ∗ 𝑇 + 0,0013 ∗ 𝑇 2 − 0,000037 ∗ 𝑇 3 , 𝑠𝑒 16,5 ≤ 𝑇 ≤ 37

𝑐𝑡𝑛 = { Eq.(29)
−0,0425 + 0,035 ∗ 𝑇 + 0,00325 ∗ 𝑇 2 − 0,0000925 ∗ 𝑇 3 , 𝑠𝑒 16,5 > 𝑇 > 37
−0,0425 + 0,035 ∗ 𝑇 + 0,00325 ∗ 𝑇 2 − 0,0000925 ∗ 𝑇 3 , 𝑠𝑒 16,5 ≤ 𝑇 ≤ 37

𝑐𝑡𝑐 = { Eq.(30)
−1,085 + 0,07 ∗ 𝑇 + 0,0065 ∗ 𝑇 2 − 0,000185 ∗ 𝑇 3 , 𝑠𝑒 16,5 > 𝑇 > 37
𝜋
𝑄0 = 97,3 ∗ 𝐷𝑅 ∗ ( ∗ ℎ𝑛 + 𝑠𝑒𝑛(𝑙𝑎𝑡) ∗ 𝑠𝑒𝑛(𝛿)) + cos((𝛿) + cos(𝑙𝑎𝑡)) ∗ cos(𝛿) ∗ 𝑠𝑒𝑛(ℎ𝑛) Eq.(31)
180
em que: T é a temperatura média (ºC); Q0 é a radiação no topo da atmosfera (MJ m-2); DR é

a distância relativa Sol-Terra (UA, Equação 32); lat é a latitude do local (); hn é a hora do
nascer do sol (°, Equação 33); 𝛿 é a declinação solar (°, Equação 34);
360
𝐷𝑅 = 1 + 0,033 ∗ cos ( ) Eq.(32)
365∗𝛿
62
180
ℎ𝑛(°) = acos (− tan((𝑙𝑎𝑡) ∗ tan(𝛿)) ∗ 𝜋
) Eq.(33)
360
𝛿(°) = 23,45 ∗ 𝑠𝑒𝑛 (365 ∗ (𝐷𝐽 − 80)) Eq.(34)
em que: DJ é o dia Juliano.
5.3.2.7 Software CyMP
No software CyMP – Crop-yield Modeling Plataform (PALOSCHI, 2016) foram

implementadas as estimativas de ciclo, datas de semeadura, pico vegetativo e colheita
(JOHANN et al., 2016) a partir do perfil espectro-temporal de um índice de vegetação, do
balanço hídrico FAO-56 (ALLEN et al., 1998b), do modelo de zoneamento ecológico
(Ecological Zone Approach) para produtividade potencial (KASSAM; HIGGINS, 1981) e do
modelo FAO para estimar a produtividade (STEDUTO et al., 2012) por pixel. O software
recebe como dados de entrada apenas variáveis do tipo TIF ou IMG e seus dados de saída
são imagens do mesmo padrão.
5.3.3.1 Estimativas de Produtividade e Produção
A produtividade de soja foi estimada para os três anos safras (Tabela 14) com médias
diferindo dos valores oficiais em 567 kg ha-1, 1171 kg ha-1 e 31 kg ha-1, para os anos safras
2013-2014, 2014-2015 e 2015-2016, respectivamente. Segundo a CONAB (2016), o Paraná
apresentou produtividades médias de 2.950 kg ha-1, 3.293 kg ha-1 e 3.393 kg ha-1, para os três
anos-safras estudados.
Tabela 14. Estatística descritiva das estimativas de produtividade de soja (kg ha-1) para os
três anos safras em estudo
Estatísticas 2013-14 (kg ha-1) 2014-15 (kg ha-1) 2015-16 (kg ha-1)
Mínimo 676 627 721
1º Quartil 2077 1805 2989
Mediana 2381 2089 3333
Média 2383 2122 3362
3º Quartil 2665 2419 3696
Máximo 4528 5035 5376
Desvio Padrão 481 441 553
Coeficiente de Variação (CV) 20,17% 20,76% 16,45%
Já Richetti et al. (2018) estimaram a produtividade de soja no estado do Paraná

utilizando imagens de satélite e algoritmos de aprendizado de máquina e obtiveram um ME
63
de 3,52 kg ha-1, RMSE de 373 kg ha-1 e d de 0,85 para o ano de 2013-2014. Betbeder et al.
(2016) estimaram produtividade da soja na França e obtiveram R² = 0,83. Já Gusso et al.
(2017), ao estimarem produtividade de soja no Mato Grosso, encontraram valores de r = 0,91.
Utilizando-se as imagens de produtividade estimada pelo CyMP, determinou-se a
produção total de soja para o estado do Paraná com 11,3 milhões de toneladas, enquanto a
produção apresentada pela CONAB foi de 14,8 milhões de toneladas para o ano safra 2013-
14. Já para o ano safra 2014-2015, o software estimou a produção em 8 milhões toneladas,
enquanto a CONAB apresentou 17,2 milhões de toneladas. Finalmente, para o ano safra
2015-2016 o software estimou a produção em 13,8 milhões de toneladas e a CONAB estimou
em 18,5 milhões de toneladas. Já Richetti et al. (2018) estimaram a produção de soja de 16,6
milhões de toneladas na safra 2013-2014 no Paraná.
5.3.4 Conclusão
No presente estudo o software CyMP foi avaliado em três anos safras para a estimativa
de produtividade de soja no estado do Paraná. Compararam-se os resultados estimados com
valores observados em fazendas monitoradas e em relação aos dados oficiais. Quando
comparadas as produtividades estimadas com os dados oficiais, obtiveram-se diferenças
entre a média estimada e a média oficial a partir de 31 kg ha-1 e a produção a partir de 3,5
milhões de toneladas.
Referências
ADRIANE, C.; BIANCHI, M.; FONTANA, D. C.; MELO, R. W. de. Estimativa do rendimento de
grãos da soja no Rio Grande do Sul usando um modelo agrometeorológico-espectral
regionalizado Regionalized agrometeorological-spectral model for soybean yield estimation in
Rio Grande do Sul, Brazil. Revista Brasileira de Agrometeorologia, v. 15, n. 3, p. 210-219,
2007.
ALLEN, R. G.; PEREIRA, L. S.; RAES, D.; SMITH, M. Crop evapotranspiration – Guidelines
for computing crop water requirements – Irrigation and drainage paper FAO-56. Rome,
FAO - Food ang Agriculture Organization, 1998a.
ALLEN, R. G.; PEREIRA, L. S.; RAES, D.; SMITH, M. FAO Irrigation and Drainage Paper
no 56 – Crop Evapotranspiration. Rome: FAO - Food ang Agriculture Organization, 1998b.
BECKER, W. R.; JOHANN, J. A.; RICHETTI, J.; SILVA, L. C. A. Data mining techniques for
separation of summer crop based on satellite images. Engenharia Agricola, v. 37, n. 4, p.
750-759, 2017.
BERKA, L. M. S.; RUDORFF, B. F. T.; SHIMABUKURO, Y. E. Soybean yield estimation by an

agrometeorological model in a GIS. Scientia Agricola, v. 60, n. 3, p. 433-440, 2003.

BRISSON, N.; MARY, B.; RIPOCHE, D.; JEUFFROY, M.H.; RUGET, F.; GATE, P.;
64
DEVIENNE-BARRET, F.; ANTONIOLETTI, R.; DURR, C.; NICOULLAUD, B.; RICHARD, G.;
BEAUDOIN, N.; RECOUS, S.; TAYOT, X.; PLENET, D.; CELLIER, P.; MACHET, J.M.;
MEYNARD, J.M.; DELÉCOLLE, R. STICS: a generic model for the simulation of crops and
their water and nitrogen balance. I. Theory and parameterization applied to wheat and corn.
Agronomie, v. 18, p. 311-346, 1998.
CAMPBELL, J. B.; WYNNE, R. H. Introduction to Remote Sensing. 5a. ed. The Guilford
Press, 2011.
CEPEA. Relatório PIB do Agronegócio. Disponível em: <http://cepea.esalq.usp.br/pib/>.

7, n. 9, p. 3867-3879, 2014.
CONAB. Acompanhamento da Safra Brasileira de Grãos. Brasília: CONAB, 2016.
CONAB. Acompanhamento da Safra Brasileira – Grãos. Brasília: CONAB, 2018.
DA SILVA, L. C.; RICHETTI, J.; BECKER, W. R.; VERICA, W. R.; PALUDO, A.; JOHANN, J.
A. Algoritmos de Aprendizado de Máquina para classificação de soja em imagens Landsat-8.
Acta Iguazu, v. 6, n. 3, p. 65-78, 2017. Disponível em: <http://e-
revista.unioeste.br/index.php/actaiguazu/article/view/17477/11797>. Acesso em: 10 ago.
2018.
DEE, D. P.; UPPALA, S. M.; SIMMONS, A. J.; BERRISFORD, P.; POLI, P.; KOBAYASHI, S.;
ANDRAE, U.; BALMASEDA, M. A.; BALSAMO, G.; BAUER, P.; BECHTOLD, P.; BELJAARS,
A. C. M.; VAN DE BERG, L.; BIDLOT, J.; BORMANN, N.; DELSOL, C.; DRAGANI, R.;
FUENTES, M.; GEER, A. J.; HAIMBERGER, L.; HEALY, S. B.; HERSBACH, H.; HÓLM, E. V.;
ISAKSEN, L.; KÅLLBERG, P.; KÖHLER, M.; MATRICARDI, M.; MCNALLY, A. P.; MONGE-
SANZ, B. M.; MORCRETTE, J.-J.; PARK, B.-K.; PEUBEY, C.; DE ROSNAY, P.; TAVOLATO,
C.; THÉPAUT, J.-N.; VITART, F. The ERA-Interim reanalysis: configuration and performance
of the data assimilation system. Quarterly Journal of the Royal Meteorological Society, v.
137, n. 656, p. 553-597, 2011. Disponível em: <http://doi.wiley.com/10.1002/qj.828>. Acesso
em: 21 nov. 2018.
DELRCOLLE, R.; MAAS, S. J.; GURRIT, M.; BARET, F.; DELÉCOLLE, R.; MAAS, S. J.;
GURRIT, M.; BARET, F. Remote sensing and crop production models : present trends.
Journal of Photogrammetry and Remote Sensing, v. 47, n. 1986, p. 145-161, 1992.
C. DI; LOVELAND, T. R.; JOHNSON, D. M.; HANSEN, M. C. Wheat Yield Forecasting for
Punjab Province from Vegetation Index Time Series and Historic Crop Statistics. Remote
Sensing, v. 6, p. 9653-9675, 2014. Disponível em: <http://www.mdpi.com/2072-
4292/6/10/9653/>. Acesso em: 29 out. 2014.
EMBRAPA. Novo Mapa de Solos do Brasil. 1a. ed. Rio de Janeiro: EMBRAPA, 2011.
FAOSTAT. Production. Disponível em: <http://faostat3.fao.org/home/E>. Acesso em: 1 ago.

2016.
FARIAS, J. R. B.; NEPOMUCENO, A. L.; NEUMAIER, N. Circular Técnica 48 - Ecofisiologia

da Soja. Circulares Técnicas Embrapa, 2007. 9 p.
65
FEHR, W. R.; CAVINESS, C. E. Stages of Soybean Development. Iowa: Special Report n87.
p. 12, 1977. Disponível em: <http://lib.dr.iastate.edu/specialreports/87> Acesso em: 30 set.
2018.
GEIPEL, J.; LINK, J.; CLAUPEIN, W. Combined spectral and spatial modeling of corn yield
based on aerial images and crop surface models acquired with an unmanned aircraft system.
Remote Sensing, v. 11, n. i, p. 10335-10355, 2014.
GOMMES, R. Non-Parametric crop yield forecasting, a didactic case study for Zimbabwe.
Remote Sensing supoort to crop yoeld forecast and area estimates. Proceedings.... p. 79-84,
1998.

1257-1275, 2016. Disponível em:
<http://www.tandfonline.com/doi/full/10.1080/01431161.2016.1148285>. Acesso em: 14 jul.
2017.
HUETE, A.; JUSTICE, C.; LEEUWEN, W. van. Modis Vegetation Index (MOD 13) Algorithm
Theoretical Basis. Environmental Sciences, 1999. MODIS - NASA. Disponível em:
<http://modis.gsfc.nasa.gov/data/atbd/atbd_mod13.pdf>. Acesso em: 8 jul. 2016.
JÉGO, G.; BOURGEOIS, G.; MORRISON, M. J.; DRURY, C. F.; TRAMBLAY, N.; TRAMBLAY,
G. Calibration and performance evaluation of soybean and spring wheat cultivars using the
STICS crop model in Eastern Canada. Field and Crops Research, v. 117, p. 183-196, 2010.

Engineering, v. 36, n. 1, p. 126-142, 2016.
JOHNSON, D. M. An assessment of pre- and within-season remotely sensed variables for

forecasting corn and soybean yields in the United States. Remote Sensing of Environment,
v. 141, p. 116-128, 2014. Elsevier Inc. Disponível em:
<http://linkinghub.elsevier.com/retrieve/pii/S0034425713003957>. Acesso em: 21 out. 2014.
JUNGES, A. H.; FONTANA, D. C. Modelo agrometeorológico-espectral de estimativa de

rendimento de grãos de trigo no Rio Grande do Sul. Revista Ceres, v. 58, n. 1, p. 9-16, 2011.
Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-
KASSAM, A. H.; HIGGINS, G. M. The FAO agro-ecologival zone approach to determination of

land potential. Pedologie, v. 31, n. 2, p. 147-168, 1981. Disponível em: <http://www.bbv-
sbss.ugent.be/pedologie/pedologie_1981_2.pdf>. Acesso em: 10 dez. 2017.
66
MABILANA, H. A.; FONTANA, D. C.; FONSECA, E. L. da. Desenvolvimento de modelo

agrometeorológico espectral para estimativa de rendimento do milho na Província de Manica-
Moçambique. Revista Ceres, v. 59, n. 3, p. 337-349, 2012. Disponível em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-
MARCARI, M. A.; DE, G.; ROLIM, S.; DE, L. E.; APARECIDO, O. Agrometeorological models
for forecasting yield and quality of sugarcane. AJCS, v. 9, n. 11, p. 1049-1056, 2015.
MERCANTE, E.; LAMPARELLI, R. A. C.; URIBE-OPAZO, M. A.; ROCHA, J. V. Modelos de

regressão lineares para estimativa de produtividade da soja no oeste do Paraná, utilizando
dados espectrais. Engenharia Agrícola, v. 30, n. 3, p. 504-517, 2010. Disponível em:
<http://agris.fao.org/agris-
search/search/display.do?f=2011/XS/XS1013.xml;XS2010L00051>. Acesso em: 12 out.
2017.
MIGUEL, G.; CÂMARA, S. Fenologia é ferramenta auxiliar de técnicas de produção. Visão

Agrícola, v. 3, n. 5, p. 63-66, 2006.

PALOSCHI, R. A. Software aplicado a modelos de estimativa de produtividade agrícola.

2016. 99 f. Dissertação (Mestrado em Engenharia Agrícola) - PGEAGRI - Programa de Pós-
Graduação em Engenharia Agrícola. Universidade Estadual do Oeste do Paraná, Cascavel,
2016.
PAREDES, P.; WEI, Z.; LIU, Y.; XU, D.; XIN, Y.; ZHANG, B.; PEREIRA, L. S.Performance
assessment of the FAO AquaCrop model for soil water, soil evaporation, biomass and yield of
soybeans in North China Plain. Agricultural Water Management, v. 152, p. 57-71, 2015.
Disponível em: <http://linkinghub.elsevier.com/retrieve/pii/S0378377414003916>. Acesso em:
7 ago. 2017.
RICHETTI, J. Uso de geotecnologias em modelos de estimativa de produtividade de soja

no estado do Paraná. 2015. 64 f. Dissertação (Mestrado em Engenharia Agrícola) -
PGEAGRI - Programa de Pós-Graduação em Engenharia Agrícola. Universidade Estadual do
Oeste do Paraná, Cascavel, 2015.
RICHETTI, J.; JUDGE, J.; BOOTE, K. J.; JOHANN, J. A.; URIBE-OPAZO, M. A.; BECKER,
W. R.; PALUDO, A.; DA SILVA, L. C. DE A. Using phenology-based enhanced vegetation
index and machine learning for soybean yield estimation in Paraná State, Brazil. Journal of
Applied Remote Sensing, v. 12, n. 2, p. 1, 2018. Disponível em:
<https://www.spiedigitallibrary.org/journals/journal-of-applied-remote-sensing/volume-
12/issue-02/026029/Using-phenology-based-enhanced-vegetation-index-and-machine-
learning-for/10.1117/1.JRS.12.026029.full>. Acesso em: 21 jun. 2018.
ROJAS, O. Operational maize yield model development and validation based on remote
sensing and agro-meteorological data in Kenya. International Journal of Remote Sensing,
v. 28, n. 17, p. 3774-3793, 2007.
ROJAS, O.; REMBOLD, F.; ROYER, A.; NEGRE, T. Real-time agrometeorological crop yield
monitoring in Eastern Africa. Agronomy for Sustainable Development, v. 25, p. 63-77, 2005.
SAKAMOTO, T.; GITELSON, A. A.; ARKEBAUER, T. J. Near real-time prediction of U.S. corn
yields based on time-series MODIS data. Remote Sensing of Environment, v. 147, p. 219-
231, 2014. Disponível em: <http://linkinghub.elsevier.com/retrieve/pii/S0034425714000790>.
67
Acesso em: 29 out. 2014.

STEDUTO, P.; HSIAO, T. C.; FERERES, E.; RAES, D. Crop Yield Response to Water -
Irrigation and Drainage Paper FAO-66. Rome: FAO, 2012.

WIT, A. de. Regional crop yield forecasting using probabilistic crop growth modelling
and remote sensing data assimilation. Wageningen: Wageningen University, 2007.
WOODS, A. Medium-Range Weather Prediction. New York: Springer, 2006.

68
6. CONSIDERAÇÕES FINAIS
Esta tese apresentou três metodologias para estimativa da produtividade da soja no

estado do Paraná, cada uma abordada em um artigo.
No primeiro utilizaram-se técnicas de aprendizado de máquina para estimativa de
produtividade de soja. Quatro algoritmos, GBM, GLM, rF e GP, foram utilizados com 36
preditores extraídas do perfil espectro-temporal de EVI e com cinco dos 36 preditores
selecionadas por meio de técnica recursiva. O algoritmo GBM apresentou melhores
resultados utilizando os 36 preditores de EVI, obtendo ME 3,52 kg ha-1, RMSE de 373 kg ha-
1
e dr de 0,85 quando comparando as estimativas de produtividade com as observadas nas
fazendas. Isto mostra a potencialidade das técnicas de aprendizado de máquina na
agricultura.
Já o segundo artigo apresenta uma forma de utilizar sensoriamento remoto para
calibrar parâmetros do modelo de crescimento CROPGRO. Modelos de crescimento como o
CSM-CROPGRO são bastante complexos e comumente exigem grande quantidade de dados
para avaliação e uso. Portanto, foi possível utilizar de dados de sensoriamento remoto para
estimar o índice de área foliar e a interceptação da luz e utilizá-los para calibrar o modelo. Por
fim, estimou-se a produtividade e os resultados da calibração mostraram um ME de -3,4 kg
ha-1 para produtividade com R2 de 0,89 no Paraná – Brasil. Em Iowa – EUA, um RMSE de
864 kg ha-1, índice de concordância de Willmott de 0,98 para biomassa e RMSE de
904 kg ha-1 com índice de concordância de 0,89 para peso de vagem.
O terceiro artigo utilizou o software CyMP para estimar a produtividade de soja no
estado do Paraná. Quando comparadas as produtividades estimadas com os dados oficiais,
obteve-se diferença entre a média estimada e a média oficial: o modelo subestimou a
produtividade a partir de 31 kg ha-1 e a produção a partir de 3,5 milhões de toneladas.
Em geral, conclui-se que os métodos para estimar a produtividade de soja no estado
do Paraná podem ser aplicados e, também, é possível utilizá-los em sistemas de previsão de
safras que permitem avaliar cenários otimistas, neutros e pessimistas quanto às variáveis
agrometeorológicas e às espectrais obtidas via sensoriamento remoto.
Como trabalhos futuros propõem-se o uso dos modelos obtidos no primeiro artigo para
previsão de safra no estado do Paraná; aplicar os algoritmos para outras culturas, como milho
e trigo; aplicar a calibração para o DSSAT em escala regional para o estado do Paraná;
aprofundar os conhecimentos do sistema DSSAT para estimativa e previsão de safras para
milho e trigo; rever os resultados obtidos no software CyMP e aplicá-lo na estimativa e
previsão de soja e de outras culturas, como milho e trigo.

Jonathan Richetti2018

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Jonathan Richetti2018

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ

CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA

MODELOS AGROMETEOROLÓGICOS, ESPECTRAIS E DE INTELIGÊNCIA ARTIFICIAL

PARA ESTIMAÇÃO DE PRODUTIVIDADE DE SOJA

CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA

MODELOS AGROMETEOROLÓGICOS, ESPECTRAIS E DE INTELIGÊNCIA ARTIFICIAL

PARA ESTIMAÇÃO DE PRODUTIVIDADE DE SOJA

Tese submetida à banca examinadora para a

Orientador: Prof. Dr. Jerry Adriani Johann

Cascavel – Paraná – Brasil

Jonathan Richetti, nascido em 26 de janeiro de 1990, natural do município de

RESUMO: Questões agrícolas globais e locais são levantadas frequentemente devido ao

PALAVRAS-CHAVES: Aprendizado de Máquina, Sensoriamento Remoto, Modelagem de

KEYWORDS: Machine Learning, Remote Sensing, Crop Modeling.

BIOGRAFIA ......................................................................................................................... iii

ABSTRACT ......................................................................................................................... vii

LISTA DE FIGURAS ............................................................................................................ xi

1.1 Objetivos .............................................................................................................. 3

2 REVISÃO BIBLIOGRÁFICA .............................................................................................. 4

2.1 A Cultura da Soja ................................................................................................. 4

2.2 Sensoriamento Remoto ........................................................................................ 7

2.1.1 Modelo ECMWF......................................................................................... 8

2.2.2 MODIS ....................................................................................................... 9

2.2.3 Índices de Vegetação .............................................................................. 10

2.3 Modelos .............................................................................................................. 11

2.4 Índices de Acurácia ............................................................................................ 14

4 METODOLOGIA GERAL ................................................................................................. 20

5.1 Artigo I: Utilizando índice EVI baseado em fenologia e aprendizado de máquina

5.1.1 Introdução ................................................................................................ 21

5.1.2 Material e Métodos .................................................................................. 24

5.1.3 Resultados e Discussões ......................................................................... 30

5.1.4 Conclusões .............................................................................................. 36

Declaração de Divulgação ................................................................................ 37

5.2.1 Introdução ................................................................................................ 41

5.2.2 Material e Métodos .................................................................................. 43

5.2.3 Resultados e Discussões ......................................................................... 47

5.2.4 Conclusões .............................................................................................. 51

Declaração de Divulgação ................................................................................ 52

5.3 Artigo III: Estimativa de produtividade da soja no estado do Paraná com a

5.3.1 Introdução ................................................................................................ 55

5.3.2 Material e Métodos .................................................................................. 56

5.3.3 Resultados e Discussões ......................................................................... 62

5.3.4 Conclusão ................................................................................................ 63

6. CONSIDERAÇÕES FINAIS ............................................................................................. 68

Tabela 1 Estádios vegetativos (V) e reprodutivos (R) da cultura da soja ...................... 5

Figura 1 Estádios fenológicos da soja e sua duração média: Estabelecimento,

Questões agrícolas globais e locais são levantadas frequentemente devido ao

2.1 A Cultura da Soja

Figura 1 Estádios fenológicos da soja e sua duração média: Estabelecimento, Vegetativo,

Tabela 1 Estádios vegetativos (V) e reprodutivos (R) da cultura da soja

O entendimento da cultura da soja é de grande interesse, pois o mercado de soja

Produção de Soja (milhões de ton)

Figura 2 Cinco maiores produtores de Soja.

As variações na produção são responsáveis pelas variações de preço no mercado

Figura 3 Variação diária de preço da soja (R$/sc) de 13/03/2006 a 15/10/2018.

Percentual do PIB (%) Agro-PIB (R$) PIB (R$)

Figura 4 Produto Interno Bruto (PIB) e sua relação com o agronegócio.

Área Plantada (mil ha) Área Plantada - PR (mil ha)

Figura 5 Série histórica de Produção e Área Colhida de soja do Brasil e do Paraná.

2.2 Sensoriamento Remoto

Campbell e Wynne (2011) definem sensoriamento remoto como sendo a prática de

proporcionam a obtenção de informações indiretas, que são normalmente disponibilizadas em