Escolar Documentos
Profissional Documentos
Cultura Documentos
Ederson Garcia
ederson.garcia@maxit.com.br
Luiz Camolesi Jr
camolesi@ft.unicamp.br
Resumo: A pesquisa pelo aumento na produtividade é constante nas empresas agrícolas que produzem cana de
açúcar, assim como é crescente o apelo pela preservação do meio ambiente. Este artigo apresenta, através do processo
de descoberta de conhecimento em bases de dados, um método sistemático de classificação dos fatores que impactam a
produtividade de forma que o agricultor possa identificar e atacar os pontos que causam os maiores impactos e que
podem trazer os maiores retornos. Neste processo foi utilizada a técnica de Árvore de Decisão em que são
apresentados os fatores que mais influenciam na produtividade agrícola. Na experimentação foram usados os dados da
safra 2014/2015 de quatro usinas da região de São Jose do Rio Preto.
1. Introdução
O agronegócio é um importante setor para a economia do Brasil. A cana-de-açúcar, por sua
vez, possui uma cadeia de produção que é um dos destaques do agronegócio brasileiro e que segundo o
Procana, a cadeia foi responsável por aproximadamente 2% do PIB nacional e por 31% do PIB da
agricultura no Brasil em 2012, tendo empregado cerca de 4,5 milhões de pessoas.
Segundo o (CEPEA; 2014) “O Agronegócio é um setor estratégico para a economia brasileira
e, especialmente em 2015, pode ser o grande condicionante do seu desempenho. Representando 23%
do PIB brasileiro, ele pode ser o único setor com crescimento mais expressivo diante da indústria
claudicante e dos serviços em processo de exaustão.”
O setor passa por dificuldades econômicas e por isso é necessário investir no aumento da
produtividade, em que o objetivo é a eficiência em produzir mais no mesmo espaço físico. Neste
sentido, órgãos como o BNDES, FINEP e FAPESP têm investido em tecnologias inovadoras através
de programas como o PAISS (FINEP), o Inova Agro (BNDES), entre outros.
Este artigo aborda como o processo de descoberta de conhecimento em base de dados pode
ajudar a entender os fatores de impacto na produtividade e ajudar a melhorar os processos produtivos
envolvidos.
1.1 Objetivo
Com o aumento da preocupação com a preservação do meio ambiente, aliada a necessidade da
produção de açúcar, álcool e energia elétrica, uma das alternativas é o investimento no aumento da
produtividade agrícola, isto é, produzir mais cana-de-açúcar na mesma área física, ou em uma área
menor ter a mesma produção. Com isso, faz-se uma racionalização do uso dos recursos naturais e
também uma diminuição dos custos com terras pelos produtores rurais.
Por exemplo, no local onde se tem uma usina de tamanho médio que moi 2.000.000 de
toneladas de cana por safra com uma produtividade média de 75 toneladas por hectare são necessários
aproximadamente 26.667 alqueires de terra. Se a produtividade aumentar em 5% para 78,8 toneladas
por hectare, serão necessários aproximadamente 25.397alqueires, isto é, 1.270 hectares podem ser
usados para outros fins. Por outra perspectiva, pode-se produzir na mesma área 100.000 toneladas de
cana a mais com praticamente os mesmos gastos fixos. Eleva-se, desta forma, os lucros em mais que
5% pois os custos fixos se mantem praticamente os mesmos.
O objetivo deste artigo é descrever a pesquisa realizada que aplicou o processo de descoberta
de conhecimento em base de dados (Knowledge Discovery in Databases - KDD) para auxiliar o
produtor rural a aumentar sua produtividade sem a necessidade de se aumentar a área plantada. O
2
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
1.2 Metodologia
A metodologia utilizada nesta pesquisa é baseada no processo de descoberta de conhecimento
em base de dados, conhecido como Knowledge Discovery in Databases (KDD), o qual é dividido em
cinco etapas principais: Seleção dos dados brutos; Pré-processamento dos dados selecionados;
Transformação dos dados pré-processados; Mineração dos dados transformados e Interpretação e
Avaliação dos padrões encontrados pela mineração.
Para aplicação desta pesquisa foi selecionada a empresa Noble Agri sendo uma organização de
grande porte que conta com quatro usinas de açúcar e álcool no Brasil situadas na região noroeste do
estado de São Paulo, nas cidades de Meridiano, Sebastianópolis do Sul, Potirendaba e Catanduva.
Para seleção dos dados usados no processo, foram realizadas seções com a equipe da
organização envolvida no cotidiano da produção agrícola, para recolhimento de experiências sobre os
fatores (variáveis) de influência na produtividade agrícola. Como resultado, foram apontados diversos
fatores (variáveis) com diferentes graus de impactos e facilidade de manejo, descartando-se aqueles
que não podem ser operados. Por exemplo, a precipitação pluviométrica impacta fortemente na
produtividade da cana, porém não é possível seu manejo, por outro lado, a aplicação de insumos de
forma adequada impacta na produtividade e é possível de ser manejada.
Com as variáveis selecionadas, analisaram-se quais destas estariam contempladas nos sistemas
de informação em uso. A organização utiliza-se do sistema ERP de gestão agrícola e deste foram
analisadas quais as tabelas de dados e colunas possuíam dados relevantes. Para acesso a estes dados foi
desenvolvido um extrator desses dados e modelado uma base de dados para os dados pré-processados.
Partindo dos dados pré-processados, foi realizada a mineração de dados aplicando-se a técnica
de Árvore de Decisão utilizando-se do algoritmo J48 do Weka (HALL et al., 2009). O J48 é uma
implementação em Java do algoritmo C4.5 (QUINLAN, 1993) que gera Árvores de Decisão a partir de
um conjunto de dados de treinamento. A cada nó, o algoritmo determina o atributo que é mais
3
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
eficientemente para subdividir o conjunto das amostras em subconjuntos homogêneos. Para determinar
o atributo mais eficiente o critério usado pelo J48 é o ganho da informação definido em (QUINLAN,
1993; HALL et al., 2009).
4
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
São Paulo essa época ocorre entre abril e dezembro ou de maio a novembro, dependendo da
quantidade de cana à ser processada.
A usina possui uma capacidade de processamento limitada, por isso a área agrícola precisa
colher de forma constante e continua durante todo o período da safra. Dessa forma a entrega de
matéria-prima precisa manter sempre a usina perto de seu limite de processamento, durante o período
de safra. Se o processo é interrompido por falta de matéria-prima, tem-se um custo alto, pois as
pessoas estão disponíveis para o trabalho, mas a indústria está parada, além de interromper a
fabricação de energia elétrica, açúcar e álcool.
Na etapa da colheita existem diversas medidas importantes para o gerenciamento da área
agrícola, entre elas destacam-se a produção de cana, a qualidade da cana (que é a medida do teor de
sacarose da cana) e a produtividade da cana que é a produção dividida pela área. No centro oeste de
São Paulo a medida de área mais comum é o hectare que equivale a 10.000 m sendo a produtividade
expressa por TCH (Tonelada de Cana por Hectare).
O ATR (Açúcar Total Recuperável) é uma das principais medidas de qualidade da cana-de-
açúcar. ATR é resultado de uma análise laboratorial que mede a qualidade da cana. O ATR representa,
resumidamente, a quantidade de quilos de açúcar que é possível extrair em uma tonelada de cana.
Portanto, se temos uma área em que a cana analisada está representando o ATR de 135, tem-se que,
com uma tonelada dessa cana é possível fabricar 135 quilogramas de açúcar.
Assim, o ATR representa quantos quilos de açúcar é possível extrair de uma tonelada de cana e
é calculado por meio da fórmula: 9,5263 x PC + 9,05 x ARC, onde os valores de PC e ARC são
fórmulas que envolvem valores obtidos através de análises de laboratório da cana-de-açúcar. As
normas dessas análises são determinadas pelo CONSECANA-SP (Conselho dos Produtores de Cana-
de-Açúcar, Açúcar e Álcool do Estado de São Paulo). Dessas análises são extraídas várias medidas
como BRIX, POL, PC, FIBRA, AR, ATR. (CONCECANA; 2007).
Cada variedade de cana tem sua curva de maturação padrão para o primeiro corte e para os
demais e, de acordo com essa curva, a variedade de cana pode ser precoce, normal ou tardia. Na Figura
2 é apresentada a curva de maturação da variedade de cana RB83-5486, para o primeiro corte de 12
meses.
Com base na curva de maturação e na produtividade é feito o planejamento de colheita para
todos os talhões, considerando as restrições de capacidade diária de moagem da usina, capacidade das
5
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
frentes de corte e transporte, área com aplicação de maturador, distância, período de colheita, e demais
restrições consideradas no planejamento.
Diversos fatores influenciam na qualidade da cana. Alguns desses fatores estão relacionados
com as características das variedades, época de colheita, idade da cana, etc. A princípio, a aplicação de
insumos e fertilizantes não afetam a qualidade da cana e sim a quantidade de cana produzida. Por isso
é comum empresas trabalharem com a curva de maturação da variedade para tirar o melhor rendimento
das variedades plantadas.
ATR
Mês
Parte da materia-prima entregue à industria tem origem nos fornecedores. Por isso, os fornecedores de
tem um papel importante no processo de colheita, pois ele compõem a produção que será entregue a
industria. Os fornecedores recebem de acordo com a quantidade de cana entregue e também de acordo
com a qualidade da cana entregue (ATR).
Desse modo, quanto maior a sua produção em toneladas de cana e melhor sua qualidade em
(ATR), maior será o valor pago ao fornecedor. Como o pico de maturação ocorre nos meses de julho,
agosto e setembro para a maioria das variedades de cana e para evitar que todo fornecedor entregue
nesse periodo, foi criado o ATR relativo. Assim, o fornecedor recebe pela média do ATR da usina, ao
invés de receber pela média do ATR.
3. Descoberta de Conhecimento em Bases de Dados
A busca por padrões em bases de dados é objeto de pesquisa desde a década de 90 quando
criaram um algoritmo para buscar dados em relações de produtos comprados em uma mesma compra e
6
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
7
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
Etapa Objetivo
1 Seleção de dados Buscar os dados relevantes à tarefa de análise
2 Limpeza de dados Eliminar dados inconsistentes e/ou com ruídos.
3 Integração de dados Compatibilizar os dados de múltiplas origens
Transformar os dados para o formato apropriado para a
4 Transformação de dados
tarefa de mineração
Extrair conhecimento através de mecanismos inteligentes
5 Mineração dos dados.
de extração
Identificar se o padrão extraído é realmente um
6 Avaliação dos padrões.
conhecimento, baseado em medidas de interesse.
Apresentar o conhecimento minerado usando técnicas
7 Apresentação do Conhecimento
adequadas de representação.
4. Trabalhos Relacionados
Existem alguns poucos trabalhos relativos à utilização da mineração de dados aplicados à
agricultura para geração de Árvores de Decisão. Podemos citar: Cintra (2012) que utiliza lógica fuzzy
para criar uma Árvore de Decisão com predição de alerta de ferrugem no café em plantações no Brasil;
Girolamo, (2014) que usa redes neurais artificiais e Árvore de Decisão para criar uma predição de
infestação de ferrugem no café; e Giasson (2013) que avalia cinco algoritmos de Árvores de Decisão e
três tipos de modelos digitais de elevação para mapeamento digital de solos na Bacia do Lageado
Grande (RS).
A utilização de mineração de dados na cultura de cana-de-açúcar tem alguns poucos trabalhos
como em (SOUZA et al. 2010), que faz uma análise dos atributos do solo e da produtividade da cultura
de cana-de-açúcar com o uso da geoestatística e Árvore de Decisão. Ainda, Garcia e Vieira (2008) que
apresentam uma técnica de mineração de dados multi-relacional para um problema semelhante ao
apresentado, contudo a relação desse trabalho estava voltada para o confronto de ganhos e perda em
relação ao esperado.
8
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
Os critérios específicos para seleção dos dados levaram em conta especialmente a questão da
completude, uma das premissas básicas para que a etapa de mineração de dados seja bem sucedida.
A seguir, são apresentados cada um dos critérios específicos empregados na seleção dos dados.
Somente dados dos locais que tiveram produtividade válida (acima de 10 Toneladas de
Cana por Hectare (TCH) e abaixo de 300 TCH).
Somente dados dos locais com o valor do ATR válido entre 20 e 200.
Na tabela de histórico de produção que contem a sumarização da colheita dia-a-dia haviam
95.005 registros, depois de sumarizados por talhão, ficou com 18.973 registros da base de dados e após
a aplicação destes critérios, foram excluídos 1.373 (7,2% do total). Considerados os pontos com maior
riqueza e uniformidade de dados.
Somente parâmetros cujas frequências tenham valor válido, isto é, diferente de nulo e
diferente de “A Definir” maior que 50% em relação a base toda.
9
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
Como resultados destes critérios, foram selecionados 27 parâmetros para comporem a análise
dos dados, que estão descritos da Tabela 1. A aplicação destes critérios específicos, dos 27
parâmetros, resultou na seleção de 14 parâmetros, 13 parâmetros foram excluídos da análise por terem
menos de 50% de frequência com valores válidos (diferente de nulo e diferente de “A Definir”).
Permaneceram os parâmetros: ambiente de produção, ciclo de desenvolvimento, empresa,
espaçamento, estágio, frente de Transporte, grupo de estágio, grupo do tipo de propriedade, sistema de
colheita, tipo de propriedade, tipo de maturação, unidade administrativa, unidade industrial, variedade
de cana. Este último critério eliminou aproximadamente 48% dos parâmetros, considerados sem
valores consistentes para o processo de mineração de dados.
Classificação do ambiente de solo variando
Modo como foi cultivada a cana,
Ambiente Produção de A a F de acordo com sua produtividade Sistema Cultivo
Cultivo Convencional, sem cultivo...
potencial.
Tipo do ciclo de desenvolvimento da cana,
Ciclo Desenvolvimento se cana de ano, cana de ano e meio, cana Sistema Drenagem Modo de drenagem do local
de meiose...
Classe de declividade do solo de acordo Modo de irrigação do local,
Classe Declividade Sistema Irrigação
com seu % de inclinação do solo gotejamento, não irrigado...
Empresa Empresa responsável pelo talhão Textura Textura do Solo, areiosa, argilosa...
Espaçamento entre linhas de plantação de Tipo de maturação da cana,
Espaçamento Tipo Maturação
cana precoce, tardia...
Classificação do tipo de solo,
Estágio de corte da cana, variando entre
Estágio Tipo Solo latossolo, latossolo roxo,
planta 12 meses, 2º corte, 3º corte...
eutrófico...
Tipo de terraceamento feito,
Frente Frente que transportou a cana Tipo Terraço
embutido, base larga...
Agrupamento de estágios, como Cana Topografia do terreno, ondulada,
Grupo Estágio Topografia
Planta, Cana Soca, reforma... suave, plana...
Agrupamento do tipo de propriedade, Trafegabilidade do local, boa,
Grupo Tipo Propriedade Trafegabilidade
Própria, Fornecedor... ruim...
Distribuição das regiões
Distribuição das áreas de acordo com um
Modulo ADM Unidade ADM administrativos de acordo com um
responsável
responsável
Procedência Muda Descrição da origem da muda da área Unidade Industrial Usina que processou a cana
10
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
Seleção, Limpeza,
Transformação,
sumarização e Carga
ARFF
Carregamento no
WEKA
11
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
Histograma do ATR
FAIXAS DE ATR
Baixo >= 21.62 < 124.10
Médio Baixo >= 124.10 < 137.20
Médio Alto >= 137.20 < 146.90
Alto >=146.90 <= 190.60
O TCH também foi discretizado com a mesma técnica e está apresentado na Figura 7.
12
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
6. Resultados
Tipo
Propriedade
13
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
Ao apresentar esses resultados aos colaboradores, a principal indagação é o porquê dos locais
geridos pela empresa (“Parceria” e “Arrendado”) terem pior ATR em relação aos locais geridos pelos
fornecedores? (“Cana Spot Esteira”, “Fornecedor Campo”, Fornecedor Esteira” e “Cana Spot
Campo”). Uma das suposições levantadas para esse comportamento é de que como a empresa precisa
ter um fluxo continuo e constante de entrega de matéria prima (cana-de-açúcar) para a industria e a
curva de maturação da cana de açúcar tem seus picos de valores de ATR nos meses de Julho, Agosto e
Setembro, os fornecedores tendem a entregar suas canas nesses meses, as canas próprias da usina são
entregues nos meses em que tem baixa demanda de cana de fornecedores, desse modo há um
detrimento da qualidade da cana própria em favor da entrega da cana de fornecedor. Mesmo o
fornecedor recebendo pelo ATR Relativo ele tende a entregar nessses meses.
Considerando esse cenário percebido, para melhorar o ATR global das usinas nesse caso, um
plano de ação possivel é fazer o planejamento da colheita da safra, englobar os dados dos fornecedores
de modo a se ter um melhor ATR global independentemente se a cana é própria ou de fornecedor,
dessa forma o ATR global seria maior e como os fornecedores ganham por ATR relativo todos
ganhariam.
Alterando-se os parâmetros do algorítmo para aumentar o nivel da árvore, tem-se uma árvore
de dois níveis conforme apresentado na Figura 9
Grupo Tipo
Propriedade
14
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
se um segundo nivel por empresa sendo que as empresas 1 e 2 tendem a ter “ATR Baixo”, a empresa 3
tende a ter “ATR Médio Baixo” e a empresa 4 tende a ter “ATR Médio Alto”.
6.2 – Resultados - TCH
Com o intuito de verificar os influenciadores do TCH, foi realizada a classificação usando o
TCH como atributo alvo. Para esse processamento também foi usado o algoritmo J48 do WEKA para
gerar a Árvore de Decisão.
Abaixo a árvore gerada pelo J48 para o atributo alvo TCH.
Estágio = 15meses: TCH Alto (364.0/216.0)
Estágio = 18meses: TCH Alto (1277.0/441.0)
Estágio = 2º Corte: TCH Alto (2522.0/1657.0)
Estágio = 3º Corte: TCH Normal Abaixo (2027.0/1401.0)
Estágio = 4º Corte: TCH Normal Abaixo (1088.0/736.0)
Estágio = 5º Corte: TCH Normal Abaixo (1257.0/764.0)
Estágio = 6º Corte: TCH Baixo (892.0/526.0)
Estágio = 7º Corte: TCH Normal Abaixo (718.0/426.0)
Estágio = 9º Corte: TCH Normal Abaixo (223.0/159.0)
Estágio = 2º Corte Bisada: TCH Alto (217.0/88.0)
Estágio = 3° Corte Bisada: TCH Normal Acima (115.0/70.0)
Estágio = 4º Corte Bisada: TCH Normal Abaixo (143.0/94.0)
Estágio = 8º Corte: TCH Normal Abaixo (299.0/202.0)
Estágio
15
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
“TCH Alto”, 3o Corte Bisada e 6o Corte Bisada tendem a ter “TCH Médio Alto”, 3o e 4o Corte tendem
a ter “TCH Médio Baixo” e 6o Corte tende a ter um “TCH Baixo”.
Esse comportamento já é um comportamento conhecido e esperado em relação ao TCH, isto é,
a cana-de-açúcar produz mais por hectare nos primeiros cortes (15 e 18 meses), depois esse
rendimento vai caindo gradativamente com o passar dos anos e cortes, até não ser mais viavel
economicamente e ser necessário renovar a plantação e plantar novamente.
Diante disto, foi realizado um segundo processamenti, retirando-se o estágio de corte ara se
perceber o comportamento dos dados. Na Figura 11 é apresentada a árvore com dois niveis do TCH
sem o parametro do estágio.
É possivel notar que o algorítmo gerou uma árvore com dois níveis, primeiramente
classificando por grupo de tipo de propriedade, assim como ocorreu com o ATR, e para os grupos do
tipo de propriedade “Cana Spot” tendem a ter um “TCH Alto”, para os grupo de Fornecedor tendem a
ter um “TCH Médio Alto”, para os grupo “Própria”, abre-se um novo nó na árvore para Tipo de
Maturação, sendo a Precoce com “TCH Alto”, a super precoce com “TCH Médio Alto” e a Média e
Tardia com “TCH Médio Baixo”.
Grupo Tipo
Propriedade
7. Considerações Finais
Neste artigo foi apresentada a utilização de técnicas específicas de mineração de dados para
descoberta de conhecimento dentro do domínio da produtividade da cana de açúcar.
16
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
Quanto aos dados selecionados para o estudo, procurou-se contemplar uma amostra
significativa dos dados, contemplando várias usinas e os diversos parâmetros possíveis de serem
usados para a classificação da produtividade. Também é intuito desse trabalho auxiliar as usinas a
melhorarem seus dados, trabalhando para ajudar a completude de seus dados na origem do
acontecimento dos fatos, com isso pode-se gerar outros processos de descoberta de conhecimento
acrescentando os parâmetros com dados completos afim de se ter um resultado mais acurado.
Outro elemento que deve ser considerado é que a descoberta de conhecimento é um processo
inerentemente exploratório e iterativo, característica que demanda muitos ajustes e, consequentemente,
novas iterações e experimentos em busca padrões em meio aos dados. Por este motivo, ainda serão
realizadas novas avaliações para consolidação de resultados e novas descobertas.
Durante esta pesquisa notou-se como as técnicas de mineração de dados podem prover
subsídios valiosos para a tomada de decisão no que diz respeito à gestão das lavouras de cana de
açúcar com intuito de melhorar a produtividade dos canaviais. Como complemento a esse trabalho,
temos a iniciativa para novos estudos acrescentando dados da influência das aplicações de insumos
(fertilizantes e herbicidas), além da influência do clima (precipitação e tempo de radiação solar) e a
influência de pragas e plantas daninhas. Além disso, temos a influência das safras como resultado de
uma análise temporal dos dados.
Agradecimentos
Agradecemos as instituições que apoiaram essa pesquisa: FAPESP, processo 13/50657-6;
FT/Unicamp, EsalqTec – Incubadora Tecnológica da Esalq/USP; Noble Agr, pelos dados e discussões
valiosas e Maxit-Sistemas pelos recursos humanos e equipamentos.
Referências Bibliográficas
AGRAWAL, R.; IMIELINSKI, T; SWAMI, A. Mining association rules between sets of items in large
databases. ACM SIGMOD Int'l Conf. on Management of Data, p. 207-216, 1993.
CEPEA, ESALQ. USP: Perspectivas para o Agronegócio em 2015; Piracicaba-SP, 2014. Disponível
em <http://www.cepea.esalq.usp.br/> . Acesso em 23 de Março de 2015
17
XI CONGRESSO NACIONAL DE EXCELÊNCIA EM GESTÃO
13 e 14 de agosto de 2015
DI GIROLAMO NETO, C.; RODRIGUES, LHA; MEIRA, C.A.A. Modelos de predição da ferrugem
do cafeeiro (Hemileia vastatrix Berkeley & Broome) por técnicas de mineração de dados. Embrapa
Informática Agropecuária-Artigo em periódico indexado (ALICE), 2014.
GARCIA, EDERSON; VIEIRA, MARINA TERESA PIRES. Estudo de caso de mineração de dados
multi-relacional: aplicação do algoritmo connetionblock em um problema da agroindústria.
In: Proceedings of the 23rd Brazilian symposium on Databases. Sociedade Brasileira de Computação,
p. 224-237, 2008
QUINLAN, J.R. C4.5: programs for machine learning. Sydney, Austrália: Morgan Kaufmann
Publishers, 1993.
TAN, P.; STEINBACH, M.; KUMAR, V. (2009). Introdução ao Data Mining – Mineração de Dados.
Rio de Janeiro: Editora Ciência Moderna. 900 p.
WEKA– Data Mining Software in Java. Disponível no site da University of Waikato (2015).
Disponível em <http://www.cs.waikato.ac.nz/ml/weka> Acesso em 23 de Março de 2015
18