Escolar Documentos
Profissional Documentos
Cultura Documentos
Journal of Machine Learning Research 14 (2013) 2349-2353 Submitted 3/13; Published 8/13
Resumo
Este artigo tem como objetivo apresentar o anteprojeto de simulações de empréstimos e previsões
usando Orange. A Orange é uma suíte de aprendizado de máquina e mineração de dados para análise
de dados por meio de script Python e programação visual. Aqui nós relatamos sobre a parte de scripting,
que caracteriza a análise interativa dos dados e o conjunto componente-baseado de procedimentos da
mineração de dados. Na seleção e design de componentes, nós nos concentramos na flexibilidade de
sua reutilização: nossa principal intenção é permitir que o usuário escreva scripts simples e claros em
Python, que são baseados em implementações C++ de tarefas computacionalmente intensivas. Orange
destina-se tanto para usuários experientes e programadores, bem como para os alunos de mineração de
dados.
1. Introdução
Orange é um programa que possibilita a mineração de dados de uma forma frutífera e divertida através
de seu [software] de código aberto, <https://github.com/biolab/orange3>, que trabalha com
aprendizado de máquina (machine learning) e visualização de dados (data visualization). Pode ser
utilizado tanto por usuários iniciantes quanto especialistas. Seus fluxos de trabalho são baseados em
análise de dados interativos atrelados a uma grande opção de ferramentas, incluindo uma variedade
de técnicas de visualização, exploração, pré-processamento e modelagem de dados. Pode ser usado
através de uma interface de usuário agradável e intuitiva ou, para usuários mais avançados, como um
módulo para a linguagem de programação Python. Considerando que através da mineração de dados
busca-se, entre outras relações, identificar padrões de similiridade ou de não conformidade nos
O RA N G E: Ferramenta de Mineração de Dados em P Y T H O N
conjuntos de dados, o Orange oferece diversos recursos de base estatística para o processamento dos
dados.
O software é desenvolvido pelo [Laboratório de Bioinformática] dentro da Faculdade de Informação
e Computação na Universidade de Ljubljana localizada na Eslovênia, e por ser de código aberto conta
com a colaboração desta comunidade. Em 2018, a ferramenta completa seu vigésimo primeiro ano de
história e este longo tempo é motivo de destaque, pois atesta a maturidade, segundo seus criadores,
desta iniciativa dentro de um ambiente efêmero como o de desenvolvimento e lançamento de
softwares.
Com recursos disponíveis para o uso do software, a interface do Orange se assemelha a de outros
programas comumente utilizados. As Funções e Ferramentas agrupam recursos a partir das
possibilidades de uso.
Como se pode ver na imagem abaixo, através dos grupos de Funções é possível acessar recursos
como:
[File] criar novos arquivos; abrir arquivos; abrir e os congelar; recarregar o último fluxo de trabalho;
ver o arquivo mais recente aberto; abrir relatório; salvar ou salvar como; ver informações sobre
fluxos de trabalho; e sair do programa;
[Edit] desfazer ou refazer uma ação; refazer uma ação adicionando anotação; duplicar seleções; ou
mesmo selecionar tudo;
[Model]: predições;
Contudo, para trabalhar com dados textuais é preciso adicionar (na barra superior, Options, Add-
ons) os grupos de Ferramentas Textable e Text Mining, apresentados na imagem abaixo, que
oferecem recursos para:
Cada grupo de Ferramentas oferece um conjunto de recursos. São muitas aplicações como dados,
modelos e visualização entre outras.
O RA N G E: Ferramenta de Mineração de Dados em P Y T H O N
3. Objetivo
Variável Descrição
ID do empréstimo ID única do empréstimo
Gênero M/F
Dependentes Número de dependentes
Status do empréstimo Empréstimo aprovado(S/N)
4. Metodologia
5. Referências
Janez Demšar; Tomaž Curk; Aleš Erjavec; Črt Gorup; Tomaž Hočevar; Mitar Milutinovič;
Martin Možina; Matija Polajnar; Marko Toplak; Anže Starič; Miha Stajdohar; Lan Umek; Lan
Žagar; Jure Žbontar; Marinka Žitnik; Blaž Zupan (2013). "Orange: data mining toolbox in
Python" (PDF). JMLR. 14 (1): 2349–2353. Acesso em 25/06/2018. Disponível em
<http://jmlr.org/papers/volume14/demsar13a/demsar13a.pdf>
Orange. Acesso em 28/06/2018. Disponível em <https://orange.biolab.si/>
Orange Change Log. Acesso em 25/06/2018. Disponível em
<https://github.com/biolab/orange3/blob/master/CHANGELOG.md>
Orange Download. Acesso em 25/06/2018. Disponível em
<https://orange.biolab.si/download/windows/>
Orange Toolbox. Acesso em 28/06/2018. Disponível em <https://orange.biolab.si/toolbox/>