Você está na página 1de 10

Utilizao da tcnica de rvore de deciso para identificao

de espcies de aves do estado do Rio Grande do Sul Brasil


Jeane Paz1, Viviani Lopes Bastos1, Daniel Notari2, Scheila de Avila e Silva2,4
1

Universidade de Caxias do Sul, Centro de Cincias Biolgicas e da Sade, Rua


Francisco Getlio Vargas, 1130, CEP 95070-560, Caxias do Sul, RS, Brasil

Universidade de Caxias do Sul, Instituto de Biotecnologia, Rua Francisco Getlio


Vargas, 1130, CEP 95070-560, Caxias do Sul, RS, Brasil
3

Universidade de Caxias do Sul, Centro de Cincias Exatas e da Tecnologia, Rua


Francisco Getlio Vargas, 1130, CEP 95070-560, Caxias do Sul, RS, Brasil

Universidade de Caxias do Sul, Campus Universitrio de Vacaria, Av. Dom Frei


Cndido Maria Bampi, 2800, CEP 95200-000, Vacaria, RS, Brasil
{jeane_paz}@yahoo.com.br, vlbastos@ucs.br, dlnotari@gmail.com,
sasilva6@ucs.br

Abstract. The knowledge about the biodiversity of a given area is important


for its conservation and management. The specie classification requires
specific background by the researcher in addition to the analysis of several
morphological characteristics. Thus, data mining approaches can assist in
this assignment by reducing the number of features which should be analyzed.
Furthermore, it can be supportive for beginner researchers. The present paper
describes the application of decision trees in the species classification. In
total, 213 records of species, each one with 15 visual attributes have been
used in the our experiments. The attributes ventral stripe color, head color,
bel underside of wings and details of tail were those used to build the decision
tree.
Resumo. A conservao e manejo de uma rea relacionam-se com o
conhecimento da biodiversidade local. A identificao de uma espcie requer
conhecimento prvio por parte do pesquisador, alm da anlise de mltiplas
caractersticas morfolgicas. A minerao de dados contribui neste processo
reduzindo o nmero de caractersticas a serem analisadas e/ou auxiliar
pesquisadores principiantes. O presente trabalho prope a aplicao da
tcnica de rvores de deciso na classificao das espcies de Aves da ordem
Falconiformes. Foram utilizados 213 exemplos e 15 atributos visuais, sendo
os que apresentaram maior capacidade de classificao foram: cor das listras
ventrais, cor da cabea, parte inferior da asa e detalhes da cauda.

1. Introduo
A anlise do volume de dados disponveis, nas diversas reas do conhecimento,
possibilita a extrao de informaes para a fundamentao de novas inferncias e
contribuies a partir de dados j existentes e disponveis. A Biologia tambm se insere
neste cenrio, uma vez que a quantidade de dados gerados experimentalmente pode
servir como fonte para novas inferncias, por meio da combinao de dados e aplicao
de tcnicas computacionais para descoberta de informaes [MARX, 2013]. Este tipo de

pesquisa est transformando reas clssicas, como a taxonomia, a biologia comparativa,


a biologia molecular, a gentica, entre outras [MARX, 2013]. A minerao de dados
uma alternativa eficaz para extrair informaes a partir de grandes volumes de dados,
descobrindo relaes ocultas, padres e gerando regras para predizer e correlacionar
dados. O resultado destas anlises podem tornar mais rpido o processo de tomada de
deciso ou proporcionar um maior grau de confiana. A principal vantagem desta
abordagem que no so necessrias hipteses, sendo que o conhecimento extrado
dos dados sem conhecimento prvio [GALVO e MARIN, 2009].
O Brasil um pas com elevado ndice de biodiversidade e, paralelamente,
tambm apresenta altos ndices de espcies ameaadas de extino [FERREIRA et al.,
2005]. Com a crescente expanso da populao mundial, as aes antrpicas tornaramse intensas, afetando a dinmica dos ecossistemas [BORSATO et al., 2004]. A
conservao e manejo adequado de uma determinada rea dependente do
conhecimento a respeito da diversidade de espcies e suas caractersticas [MARINI e
GARCIA, 2005]. Neste contexto, as aves so importantes na avaliao da qualidade
ambiental e na determinao de reas para a conservao. Isto se deve ao fato destas
ocuparem diferentes hbitats, nveis trficos e apresentarem sensibilidade s
modificaes ambientais [VALADO, 2013]. Dentre os seres vivos de um ecossistema,
as aves atuam no s na polinizao de flores [MARTINS e BATALHA, 2006] como
tambm na disperso de sementes. Certos frutos, como por exemplo o da aroeira
vermelha, aumentam a porcentagem e velocidade de germinao aps suas sementes
passarem pelo trato digestivo de alguma ave [D'AVILA et al., 2010; GUERTA et al.,
2011]. Adicionalmente, elas tambm exercem o papel de controle biolgico na
populao de alguns invertebrados e at mesmo de outros vertebrados, alm de serem
fonte de alimento para outros predadores [SICK, 1997]. Apesar de as aves serem um
grupo amplamente estudado, conhecer e sistematizar sua biologia um assunto ainda
relevante e com muitas questes a serem respondidas, uma vez que informaes sobre
certas espcies so escassas ou ausentes [MAGALHES et al., 2007].
Na rea da taxonomia, a minerao de dados pode ser utilizada como um
facilitador da classificao de espcies. Esta tarefa geralmente exige pacincia, bem
como o porte de guias e chaves de classificao eficientes. Neste caso, a presena ou
ausncia de conhecimento prvio de taxonomia por parte do pesquisador influencia
diretamente a eficincia e eficcia do trabalho realizado [CAVARZERE et al., 2013].
Assim, a minerao de dados contribui no trabalho do pesquisador uma vez que a
classificao resultante provm da anlise de atributos que possuem caractersticas mais
discriminatrias para um grupo especfico. Deste modo, o trabalho dos pesquisadores
pode ser otimizado, uma vez que a fonte de pesquisa reduzida [GALVO e MARIN,
2009]. Considerando este contexto, o presente artigo utilizou a tcnica de aprendizagem
de mquina de rvores de deciso para a realizao de minerao de dados
caractersticos de aves Falconiformes do estado do Rio Grande do Sul. Assim, pretendese contribuir para a identificao destas aves em campo por meio da extrao de
informaes que possam auxiliar na reduo da utilizao de chaves complexas de
classificao em trabalho de campo.

2. Trabalhos Relacionados
As tcnicas de minerao de dados vm sendo aplicadas em reas como
medicina, finanas, comrcio, marketing, telecomunicaes, meteorologia, agropecuria,
bioinformticas, entre outras. At o momento de concluso deste artigo, no foram

encontrados artigos que tratassem da aplicao de rvores de deciso especificadamente


em aves falconiformes. Assim, os trabalhos relacionados tratam de minerao de dados
relacionados com as reas biolgicas e da sade. Na rea mdica, a aplicao das
tcnicas de minerao apresentam inmeros exemplos, como no controle de infeces
hospitalares (DAO et al., 2008), diminuio de erros em diagnsticos de hipertenso
(DVILA HERNNDEZ e CORALES, 2012), determinao de variveis psicossociais
que influenciam no consumo de nicotina em adolescentes (MONTAO-MORENO et
al., 2014), entre outros.
Alm destes trabalhos, STEINER et. al (2006) mostram uma aplicao de no
diagnstico diferencial da ictercia, comparando as tcnicas de: Programao Linear,
Funo Discriminante Linear de Fisher, Modelo de Regresso Logstica, rvores de
Deciso e Redes Neurais Artificiais com dois conjuntos de dados: um com os dados
originais e outro conjunto com a eliminao de seis dos atributos originais. Os resultados
com maior exatido foram obtidos com o segundo conjunto de dados, os quais variaram
entre 75% com as rvores de deciso at 96% com as Redes Neurais Artificiais e
Programao Linear. Assim, os autores ilustram o potencial das tcnicas de minerao
de dados como ferramenta auxiliar para a tomada de deciso em tarefas desempenhadas
por especialistas. Por outro lado, VIANNA et al. (2010) utilizaram rvores de deciso
em dados provenientes da integrao de dados de trs diferentes sistemas de informao:
(i) Sistema de Informaes sobre Mortalidade (SIM); (ii) Sistema de Informaes sobre
Nascidos Vivos (SINASC) e (iii) do Sistema de Investigao da Mortalidade Infantil
(SIMI) para obter o perfil da mortalidade infantil no Estado do Paran, no perodo de
2000 a 2004. As 4.230 regras obtidas foram analisadas por 22 especialistas dos Comits
Regionais de Sade do estado do Paran que selecionaram quatro regras de maior
relevncia e frequncia e com menor taxa de erro. Nesta anlise, destaca-se que 55% dos
bitos poderiam ser evitveis se houvesse uma adequada ateno gestao, parto e ao
recm-nascido. O sexo predominante para bitos foi o masculino (58%) e a idade
prevalente da me ficou no intervalo de 16-35 anos (87%).
Na rea de bioinformtica, h trabalhos sobre anlise da expresso gnica
(TORRES-AVILS, 2014), as rvores de deciso foram utilizadas por DE AVILA e
SILVA et al. (2011). Neste trabalho, os autores estabeleceram perfis para as sequncias
promotoras da bactria Escherichia coli por meio da comparao das regras obtidas das
simulaes de redes neurais com as obtidas com as rvores de deciso. Assim,
contribuindo para o processo in silico de reconhecimento de sequncias reguladoras. Na
rea ambiental, TSAI et al. (2013) utilizaram rvores de deciso e redes bayesianas para
extrair informaes sobre em deslizamentos induzidos por chuvas fortes e relacionaram
os dados. Para isso, os autores utilizaram 11 atributos formados por fatores topogrficos
e vegetativos. As regras criadas foram aplicadas para predizer potenciais regies com
risco de deslizamentos, mostrando uma acurcia geral de 95% tanto para os resultados
com as rvores de deciso, quanto com as redes bayesianas. Alm deste trabalho,
BOSCHI et al. (2011), analisaram o comportamento espao-temporal da precipitao
pluvial no Estado do Rio Grande do Sul, entre os decnios de 1987-1996 e 1997-2006,
por meio de tcnicas de minerao de dados. Outro exemplo, de utilizao de rvores de
deciso na anlise de cobertura vegetal de solo apresentado por LATORRE et al.,
2007, o qual aplicaram a metodologia na anlise de rea florestal amaznica.
Na rea da agricultura e pecuria, um exemplo da utilizao das rvores de
deciso na compreenso de manifestaes epidmicas da ferrugem do cafeeiro. Para
realizar a classificao da taxa de infeco, foram utilizados atributos meteorolgicos,

carga de frutos do cafeeiro e espaamento entre as plantas de 264 exemplos retirados de


lavouras no perodo de 1998 a 2006. A rvore apresentou uma exatido de 73% para
novos exemplos, sendo os atributos mais significativos para a classificao foram a
temperatura mdia no perodo de molhamento foliar, carga pendente dos frutos, mdia
da temperatura mxima diria no perodo de incubao e umidade relativa do ar. Alm
deste trabalho, MAIA et al. (2013), utilizaram as rvores de deciso para avaliar o
conforto termal de cavalos, a qual apresentou 74 % de exatido e 6 regras importantes
para os especialistas de domnio.

3. Metodologia
O presente trabalho utilizou uma abordagem computacional para a obteno dos
objetivos propostos. Assim, a metodologia utilizada foi um subconjunto das etapas de
um sistema de Business Intelligence com nfase em dados biolgicos, sendo que esta
metodologia pode ser generalizada para outras espcies biolgicas. As quatro etapas
principais realizadas esto ilustradas na Figura 1.

Figura 1. Etapas da metodologia adotada

A quantidade de informao sobre as caractersticas de cada espcie de aves


rica em livros e artigos cientficos, porm muito pobre e carente de fontes confiveis na
internet. Foram utilizados ento, como base para obteno de dados, guias de campo e
livros sobre ornitologia [SICK, 1997; NAROSKY e YZURIETA, 2003]. Assim, este
trabalho aponta para a necessidade da criao de um banco de dados com acessibilidade
pela internet para a realizao de pesquisas relacionadas computao aplicada, uma vez
que foi necessria a construo de uma base de dados que foram utilizados na etapa 1.
Na etapa 1, os dados foram coletados no perodo fevereiro de 2013 a novembro
de 2013. Eles constituram-se fundamentalmente de Aves (Reino Animalia) da ordem
Falconiformes e todas suas respectivas famlias, totalizando 213 exemplos. A escolha
pela anlise dos Falconiformes justifica-se pelo de fato desta ordem ter sua diversidade
sensvel s perturbaes que geram a perda do hbitat [PETERSEN et al., 2011]. Alm
disso, a falta de informaes sobre o tamanho populacional das espcies e da tolerncia
aos distrbios ambientais so fatores que dificultam o estabelecimento de programas
prioritrios para a proteo das aves de rapina [RODA e PEREIRA, 2006]. Deste modo,
uma ferramenta auxiliar na classificao biolgica importante.
A segunda etapa consistiu na separao dos dados em atributos, que consistiram
em: (i) tamanho (altura em centmetros); (ii) cor da vista ventral; (iii) presena de listras
ventrais; (iv) cor das listras ventrais; (v) cor da vista dorsal; (vi) cor da cabea; (vii)
descrio de detalhes na nuca; (viii) descrio de detalhes na garganta; (ix) cor dos
cales; (x) descrio da parte inferior da asa; (xi) descrio de detalhes da cauda (sendo
este divido em dois atributos pela presena de mltiplas caractersticas); (xii) descrio
de detalhes nos ombros; (xiii) descrio de detalhes no traseiro; (xiv) descrio de
detalhes do peito. Estes 15 atributos foram escolhidos devido ao fato de a identificao
em campo ser realizada por meio da observao de caractersticas externas, utilizando
registros fotogrficos, ou com a captura de espcies para avaliao de dados mais

especficos como altura, peso e sexo. Para algumas espcies nem todos os atributos
possuam valores, sendo nestes casos utilizada a expresso Ausente.
Na etapa 3, a minerao de dados foi realizada utilizando a ferramenta WEKA.
Para alcanar os objetivos propostos, o algoritmo escolhido foi o J48, o qual uma
implementao em Java do algoritmo C4.5 [WITTEN et al., 2011]. Uma rvore de
deciso tem a funo de dividir um conjunto de treinamento, at que cada subconjunto
obtido deste particionamento contenha casos de uma nica classe [LATORRE et al.,
2007]. Uma rvore de deciso representada por nodos que simbolizam os atributos,
sendo estes conectados por arcos. Os arcos so provenientes dos nodos e recebem os
valores possveis para cada atributo. O primeiro nodo chamado raiz, pois dele derivam
os outros nodos, chamados de folha, que representam o conjunto das diferentes classes
de um conjunto de treinamento. Assim, esta estrutura hierrquica de ns internos
responsvel pela tomada de deciso. O ltimo nodo representa o objetivo da rvore,
sendo que estes no possuem n descendente. No caso deste trabalho, o nodo final era a
espcie de cada ave. A diviso em cada n interno da rvore baseia-se no critrio de
ganho de informao obtido na escolha do atributo para subdiviso [WITTEN et al.,
2011].
Para a obteno de dados estatisticamente vlidos, optou-se pela metodologia k
fold cross-validation. Esta tcnica consiste em particionar os dados de entrada em k
partes iguais e realizar o treinamento com k-1 partes e testar a classificao com a k
parte faltante [DE AVILA E SILVA et al., 2011]. Este processo de treino e validao
realizado k vezes, sendo em cada repetio utilizado um conjunto de treino e teste
diferente. Dentre os parmetros utilizados, destaca-se que o fator de confidncia foi de
0,25 e o nmero mnimo de padres classificados por folha foi 10. Assim, foi possvel
gerar uma rvore com regras mais generalistas. A aplicabilidade das regras biolgicas
geradas com a rvore de deciso foram validadas por um especialista de domnio e
consulta de literatura especfica.

4. Resultados e Discusso
Considerando que o levantamento e taxonomia de espcies necessita de uma vasta
quantidade de dados disponibilidade do pesquisador, o principal objetivo deste trabalho
foi implementar uma soluo auxiliar para a identificao de espcies. Com os dados
fornecidos, foi gerada uma rvore de 102 folhas, a qual apresentada de forma parcial
na Figura 2. Optou-se por remover regras redundantes a fim de facilitar a anlise e
discusso dos resultados. O tamanho da rvore um indicativo do alto grau de entropia
dos dados, uma caracterstica dos dados biolgicos [MARX, 2013]. Apesar desta
caracterstica entrpica, a rvore de deciso gerada classificou corretamente 89% dos
exemplos apresentados e um erro mdio quadrtico de aproximadamente 6%.
A rvore de deciso apresentada na Figura 2, mostra que o nodo raiz formado
pelo atributo cor das listras ventrais. Assim, apenas utilizando a cor das listras ventrais
possvel identificar a espcie Accipiter bicolor. Caso no haja listras ventrais, a
segunda informao que deve ser analisada a cor da cabea (Figura 2). Com base na
rvore de deciso obtida, foi possvel descrever regras do tipo SE-ENTO com
validao na literatura relacionada, as quais so apresentadas na Figura 3.
As regras apresentadas na Figura 3 apresentaram validao na literatura
disponvel da rea, sendo que a regra (a) est de acordo com os dois guias para
identificao de aves em campo [NAROSKY e YZURIETA, 2003; SICK, 1997].

Figura 2. rvore de Deciso gerada com os dados selecionados

A regra (b) est em conformidade com a descrio de JOENCK e


AZEVEDO (2006), os quais avistaram um exemplar desta espcie com a seguinte
morfologia: colorao da plumagem clara/branca no mento, na regio ventral e
lateral do pescoo (com algumas esparsas penas estriadas de colorao marromclaro), colorao acinzentada no dorso, (incluindo as asas) e na cabea (da fronte
at a nunca). A regra (c) possui descrio compatvel com o trabalho de SILVA e
OLMOS (2007), que avistaram esta espcie, descrevendo-a como morfo-escura.

Outra informao em conformidade com a literatura foi a diferena entre macho e


fmea da espcie Rostrhamus sociabilis, conforme regas (d) e (e). A regra (f), a
qual classifica a espcie Busarellus nigricollis, apresenta as caractersticas
analisadas por AMARAL (2002) na identificao e diferenciao desta espcie de
outras pertencentes famlia Accipitridae. Neste caso, ressalta-se a colorao bege
escura e ferrugnea do corpo, cabea branca, com uma mancha negra no papo e pela
cauda extremamente curta.

Figura 3. Regras SE-ENTO obtidas a partir da rvore de Deciso com


validao na literatura

Outras regras validadas pelo especialista de domnio e pelos guias de campo


esto apresentadas na Figura 4. No entanto, no foram encontrados relacionados para a
validao das regras at o momento da concluso deste artigo.

Figura 4. Regras SE-ENTO obtidas a partir da rvore de Deciso com


validao de especialista de domnio

Outras informaes obtidas a partir da Figura 2 referem-se s espcies Buteo


albicaudatus e Harpia harpyja. Nestes casos, observa-se que no foi possvel ter uma
regra especfica que os destacassem das demais, ou seja, h muitas regras diferentes para
a mesma espcie. A classificao destas espcies baseada em um mesmo atributo com
diferentes descries, sendo esta divergente com a literatura especfica da rea
[NAROSKY e YZURIETA, 2003; SICK, 1997]. Tambm possvel verificar na Figura
2 que alguns atributos so restritos a um grupo de espcies. Por exemplo, a cor das
listras ventrais marrom abrange 3 espcies (Accipiter striatus, Heterospizias
meridionalis, Rostrhamus sociabilis fmea); o mesmo sendo percebido no caso da cor
das listras ventrais alaranjadas (Harpyhaliaetus coronatus, Buteo magnirostris, Circus
cinereus). A cor das listras brancas, associadas com o detalhe da garganta ausente,
tambm se limitou a 3 espcies especficas (Spizaetus tyrannus, Milvago chimango,
Falco femoralis).
Apesar de terem sido analisados 15 atributos, nem todos foram considerados para
gerar a rvore de deciso. Os atributos com maiores ganhos de informao foram: cor
das listras ventrais, cor da cabea, parte inferior da asa, detalhes da cauda, vista ventral,
vista dorsal e detalhe da garganta. Por outro lado, atributos importantes na identificao
de aves em campo, por exemplo, o tamanho da ave, no foi um atributo com ganho de
informao suficiente para ser includo na rvore de deciso. Assim, aps a seleo de
atributos pela tcnica de rvores de deciso, a prxima etapa seria a aplicao das regras
obtidas por um especialista durante uma atividade de campo.

5. Consideraes Finais
A minerao de dados na biologia um desafio, uma vez que os dados so ruidosos e h
necessidade de combinar informaes disponveis em diferentes bases de dados [MARX,
2013]. O problema inicial de aplicao da metodologia foi a falta de repositrios on-line
para levantamento dos dados. No existe um repositrio oficial, organizado e acurado,
que fornea caractersticas de espcies de aves do Rio Grande do Sul ou at do Brasil.
Assim, ressalta-se a importncia da existncia de um banco de dados para acesso aos
dados, de modo que facilite a pesquisa aplicada. Alm disso, a aplicao de tcnicas
computacionais para a resoluo de problemas em outras reas mostra-se como uma
importante contribuio para a rea de computao, uma vez que a multidisciplinaridade
uma caracterstica de reas relacionadas tecnologia da informao.
Os atributos das aves que apresentaram maior capacidade de classificao,
hierarquicamente, foram: cor das listras ventrais, cor da cabea, parte inferior da asa e os
detalhes da cauda. Pode-se tambm observar a cor das listras, a vista ventral ou dorsal,
ou os detalhes da garganta. Como no foi possvel encontrar artigos para validao de
todas as regras obtidas, a prxima etapa deste trabalho ser a utilizao destas regras
para realizao de um estudo a campo para afirmar sua eficcia.
O processo de minerao de dados pode contribuir rea da biologia auxiliando
na identificao dos padres de espcies. Contudo, vale destacar que dependendo do
objetivo proposto devem-se aplicar tarefas e mtodos especficos. Esta ferramenta pode
ser aplicada na taxonomia de espcies de qualquer reino, desde que se obtenham dados
suficientes que diferenciem as espcies e permitam uma boa acurcia nos resultados. A
minerao de dados mostra-se como uma ferramenta auxiliar ao pesquisador, no entanto,
no substitui a necessidade do pesquisador e profundo domnio de explorao.

References
Amaral, C. Ocorrncia do gavio-belo Busarellus nigricollis no estado de Santa Catarina.
Ararajuba, v. 10, n.2, p.245-245, 2002.
Borsato, V. A.; Souza-filho, E. E. Ao antrpica, alteraes nos geossistemas,
variabilidade climtica: contribuio do problema. Revista Formao, v. 2, n. 11, p.
213-223, 2004.
Boschi, R. S; Oliveira, S. R. de M; Assad, E. D. Tcnicas de minerao de dados para
anlise da precipitao pluvial decenal no Rio Grande do Sul. Eng. Agrc., v. 31, n. 6,
2011.
Cavarzere, V.; Alves, F.; et al. Evaluation of methodological protocols using point
counts and mist nets: a case study in southeastern Brazil. Pap. Avulsos Zool., v. 53, n.
26, 2013.
Dao, T. K.; Zabaneh, F.; Holmes, J.; et al. A ractical data mining method to link hospital
microbiology and an infection control database. AJIC, v. 36, n. 3, 2008.
Dvila Hernandez, F.; SANCHEZ CORALES, Yovannys. Tcnicas de minera de datos
aplicadas al diagnstico de entidades clnicas. RCIM, Ciudad de la Habana, v. 4, n. 2,
2012.
DAvila, G.; Gomes-Jr., A.; Canary, A. C.; Bugoni, L. The role of avian furgivores on
germination qnd potential seed dispersal of the Brazilian Pepper Schinus
terebinthifolius. Biota Neotrop., v. 10, n. 3, 2010.
de Avila e Silva, S.; Gerhardt, G. J.L.; Echeverrigaray, S. Rules extraction from neural
networks applied to the prediction and recognition of prokaryotic promoters. Genet.
Mol. Biol., v. 34, n. 2, 2011.
Ferreira, R. C.; Machado, A. A.; Caxambu, M. G.; Ide, A. L. Levantamento de espcies
de aves e das espcies vegetais forrageadas na estao ecolgica do cerrado em
Campo Mouro PR. Atualidades ornitolgicas, n. 127, p. 28, 2005.
Guerta, R.S.; Lucon, L. G.; Motta-junior, J. C.; Vasconcellos, L. A. S.; Bird frugivory
and seed germination of Myrsine umbellate and Myrsine lancifolia (Myrsinaceae)
seeds in a cerrado fragment in southeastern Brazil. Biota Neotrop., v. 11, n. 4, 2011.
Galvo, N. D.; Marin, H. F. Tcnica de minerao de dados: uma reviso da literatura.
Acta Paul Enferm, v. 22, n. 5, 2009.
Joenck, C. M.; Azevedo, M. A. G. Novos registros de Leptodon cayanensis
(Acciptridae) no Rio Grande do Sul e Santa Catarina, Brasil [New records of
Leptodon cayanensis in Rio Grande do Sul and Santa Catarina, Brazil]. Revista
Brasileira de Ornitologia, v.14. p. 423-425, 2006.
Latorre, M. L.; Carvalho, J. R. O. A.; Santos, J. R. Integrao de dados de
sensoriamento remoto multi resolues para a representao da cobertura da terra
utilizando campos contnuos de vegetao e classificao por rvores de deciso.
Revista Brasileira de Geofsica, v. 25, n. 1, p. 63-74, 2007.
Magalhes, V. S. et al. Biologia de aves capturadas em um fragmento de Mata Atlntica,
Brasil. Rev. Bras. Zool., v. 24, n. 4, 2007.
Maia, A. P. de A. et al. A decision-tree-based model for evaluating the thermal comfort
of horses. Sci. Agric., v. 70, n. 6, 2013.

Martins, F. Q.; Batalha, M. A. Pollination systems and floral traits in cerrado woody
species of the upper Taquari region (central Brasil). Brazilian Journal of Biology, v.
66, n. 2A, p. 543-552, 2006.
Marx, V. Biology: The big challenges of big data. Nature, v.498, p. 255260, 2013.
Montao-Moreno, J. J., Gervilla-Garca, E., Cajal-Blasco, B. et al. Data mining
classification techniques: an application to tobacco consumption in teenagers. Anal.
Psicol., 2014, vol.30, no.2, p.633-641. ISSN 0212-9728.
Narosky, T.; Yzurieta, D. Gua para la identificacin de las aves de Argentina y
Uruguay, Buenos Aires: Vazquez Mazzini, 2003. 346 p.
Petersen, E. S.; Petry, M. V.; Krger-Garcia, L. Revista Brasileira de Ornitologia, v. 19,
n. 3, p. 376-384, 2011.
Roda, S. A.; Pereira, G. A. Distribuio recente e conservao das aves de rapina
florestais do Centro Pernambuco. Revista Brasileira de Ornitologia, v. 14, n. 4, p.
331-344, 2006.
Sick, H.; Pacheco, J. F. Ornitologia brasileira. Rio de Janeiro: Nova Fronteira. p. 909,
1997.
Silva e Silva, R.; Olmos, F. Adendas e registros significativos para a avifauna dos
manguezais de Santos e Cubato, SP. Revista Brasileira de Ornitologia, v. 15, n. 4, p.
551-560, 2007.
Steiner, M. T. A. et al. Abordagem de um problema mdico por meio do processo de
KDD com nfase anlise exploratria dos dados. Gest. Prod., v. 13, n. 2, 2006.
Torres-Avils, F., Romeo, J. S., Lpez-Kleine, L. Data mining and influential analysis of
gene expression data for plant resistance gene identification in tomato (Solanum
lycopersicum). Electronic Journal of Biotechnology, n. 17, p.79-82, 2014.
Tsai, F.; Lai, J. S.; Chen, W. W.; Lin, T. H. Analysis of topographic and vegetative
factors with data miningfor landslide verification. Ecological Engineering, n. 61, p.
669-677, 2013
Valado, R. M. As aves da Estao Ecolgica Serra das Araras, Mato Grosso, Brasil.
Biota Neotrop., v. 12, n. 3, 2012.
Vianna, R. C. X. F. et al. Minerao de dados e caractersticas da mortalidade infantil.
Cad. Sade Pblica, v. 26, n. 3, 2010.
Witten I. H.; Eibe F.; Hall, M.A. Data Mining, practical Machine Learning Tools and
Techniques. 3 ed. Morgan Kaufman Publishers, 2011.