Você está na página 1de 35

06/07/2020 Ead.

br

FUNDAMENTOS DE
BIG DATA
Esp. Heber Marques Gimenes

INICIAR

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 1/35
06/07/2020 Ead.br

introdução
Introdução

Nesta unidade abordaremos o conteúdo sobre Business Intelligence, explorando,


também, na prática, seus conceitos e algumas de suas ferramentas mais importantes,
ferramentas de suma importância para a análise de dados

Na sequência, estudaremos dois modelos de análise de dados e ltragem. Essas


ferramentas são o Data Science e Data Mining, que facilitam muito o trabalho dos
pro ssionais de tecnologia, empresários e estão em alta no mercado hoje em dia.

Aprenderemos sobre eco-sistema de análise em Data Science e Data Mining, esses


dois conceitos são importantes para a análise de dados, no relacionamento da
informação a ser pesquisada com a tomada de decisões e ainda abordaremos os
tipos de tarefa descritiva e preditiva.

Por m, ainda nessa unidade, vamos conhecer algumas ferramentas de análise em


BI.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 2/35
06/07/2020 Ead.br

Eco-sistema de Análise de
Dados – Business
Intelligence

Neste tópico abordaremos alguns conceitos sobre Business Intelligence, sua visão
geral de funcionalidade e ainda conheceremos as principais ferramentas de BI
utilizadas atualmente.

Visão Geral do Business Intelligence


Primeiramente, apresentamos o seguinte questionamento: O que você pensa o
conceito Business Intelligence (BI)?

A tradução literal do termo Business Intelligence é: a inteligência para o negócio, ou


seja, utilizar a tecnologia para incrementar e melhorar o negócio.

Sendo assim, o BI é o conjunto de conceitos e métodos utilizados na análise de


dados, importados ou já disponíveis em outro sistema para melhor direcionamento
das decisões empresariais.

Apesar de ser uma de nição simples, não podemos perder de vista que o BI se
caracteriza por um grande volume de dados, o que não poderia ser analisado sem o

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 3/35
06/07/2020 Ead.br

suporte das ferramentas, e, esse grande volume permite analisar e gerar


indicadores.

É Importante destacar, que na prática, as ferramentas de BI são aplicadas e as


análises realizadas em uma cópia do banco de dados da empresa, devido ao grande
volume de dados.

Comparando o BI com os outros softwares, os softwares ERP (Enterprise Resource


Planning) geram relatórios com os dados da movimentação com aquilo que
aconteceu, já o BI tem a inteligência de gerar os dados da movimentação do que
aconteceu, mas também mostrando causas, explicações e padrões para aqueles
dados encontrados.

Com isso, esse conceito se encaixa muito bem nos dias de hoje, em que as
instituições têm que ser proativas, ter reações rápidas ao mercado, e, ainda ter
informações e indicadores exatos ao seu próprio negócio, muitas vezes necessitando
mudar a forma de produzir, trabalhar ou entregar um serviço.

Segundo TURBAN, SHARDA, ARONSON e KING (2009, p. 24)

“As organizações privadas ou públicas têm consciência do atual ambiente


de negócios e suas pressões. Elas usam diferentes ações para responder às
pressões. A TLS da Toyota, por exemplo, usa o BI para aprimorar a
comunicação e dar apoio aos executivos em sua tarefa de saber
exatamente o que acontece em cada área de operação, quase em tempo
real. Ela também usa o sistema para ter uma melhor colaboração com seus
parceiros comerciais. Através disso, pode cortar gastos e melhorar a
satisfação do cliente. Outras ações realizadas pelos gerentes podem
incluir:
• Emprego de planejamento estratégico
• Uso de modelos de negócios novos e inovadores
• Reestruturação de processos de negócios
• Participação em alianças de negócios
• Aprimoramento dos sistemas de informações corporativos
• Aprimoramento das relações de parceria”

No trecho citado, vemos que a Empresa Toyota se utilizou dos recursos do BI em


várias áreas, desde a produção até terceiros que se relacionam com a empresa. Com

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 4/35
06/07/2020 Ead.br

isso, obtiveram redução em seus custos e ainda conheceram melhor o seu negócio,
com informações reais e atuais, pois essas informações são atualizadas em tempo
real, chegando a um melhor entendimento e atendimento aos seus clientes e
redução de custos.

Portanto, conhecendo os seus resultados e ainda sabendo o porquê dos resultados,


podemos mudar as atitudes visando a melhora dos indicadores.

Ainda sobre as de nições BI, segundo TURBAN, SHARDA, ARONSON e KING


(2009, p. 24) “O processo do BI baseia-se na transformação de dados em
informações, depois em decisões e nalmente em ações”.

Figura 4.1 – Tomada de decisão.


Fonte: 123rf.

Após entendermos, sobre os conceitos e funcionamento do BI vamos dar um novo


passo, e para isso vamos para a seguinte questão:: Mas como o BI faz as extrações
das informações?

No trecho a seguir, podemos veri car todas as suas fases:

Segundo CRUZ, Bruno C. MIRANDA, Bruno G. C. TURCHETE, Fellipe B (p. 18) “Tudo
começa com coleção de dados, Data Warehousing, a integração de dados de uma
ou mais fontes e assim, cria um repositório central de dados, um Data Warehouse –

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 5/35
06/07/2020 Ead.br

os armazéns de dados. Com essa imensidão de dados, Data Mining, aplica-se à


mineração desses dados, o processo de explorar grandes quantidades de dados à
procura de padrões consistentes para detectar relacionamentos e novos
subconjuntos de dados a serem mapeados e extraírem informações privilegiadas.
Análises, Analytics, de minerações gera relatórios, Reporting, detalhados para
fortalecer o esclarecimento do cenário. Reengenharia de processos de negócios
(BPR) trata se de uma estratégia de gestão de negócios para a análise e desenho dos
uxos de trabalho e dos processos de negócios visando a reestruturação
organizacional, com o foco no design de baixo para cima de processos de negócios
dentro de uma organização. E Benchmarking, a busca das melhores práticas com o
propósito de maximizar o desempenho.”

Na gura 4.2, temos todos os conceitos e processos utilizados pelo BI, iniciando pelo
Data Miningaté chegar aos resultados apresentados aos colaboradores que terão
acesso as essas informações.

Figura 4.2 – Componentes e ferramentas do BI.

Portanto, o BI  entrou na vida das empresas, para ocupar um lugar que estava vago,
pois, anteriormente tínhamos os resultados apenas pela ótica do que já aconteceu e
que nem sempre poderia ser mudado.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 6/35
06/07/2020 Ead.br

Com a chegada do BI, a lacuna de como as coisas aconteceram foi preenchida com as
análises de informações. Por exemplo, podemos entender a decisão de compra de
um determinado produto por um cliente. Com isso, podemos ter mais insumos para
produção do nosso produto, ou ainda no caso de comércio, trabalharmos com
quantidades de estoque, próximo da realidade não deixando que sobre ou que falte.

Considerando os dados nanceiros dessa movimentação de compra, podemos


levantar mais informações quanto aos recebíveis e em programação para uma
sazonalidade, em todos os casos podemos chegar a uma decisão correta e mais
direcionada em nosso negócio com a ajuda do BI.

Ferramenta de Business Intelligence


Agora, iremos conhecer uma ferramenta chamada Pentaho a m de vislumbrarmos
mais de perto o que está sendo no mercado.

O Pentaho é uma ferramenta de extração, organização e geração de relatórios e


consultas de banco de dados, que foi desenvolvido por um grupo de programadores
do Estados Unidos, que tinham como objetivo de desenvolver uma ferramenta capaz
de gerar e uni car os dados facilitando o tratamento das informações. O produto foi
criado pela Pentaho Corporation, empresa que foi vendida a Hitachi em 2015.

A aplicação tem duas versões:

Paga: Conta com todo suporte da empresa


Livre: Não conta com suporte da empresa, mas a ajuda necessária pode-se
obter em fóruns.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 7/35
06/07/2020 Ead.br

Figura 4.3 – Tela site Pentaho


Fonte: Site About Pentaho

O Pentaho é dividido em módulos, que são:

Pentaho Data Integration - PDI (Kettle),


Pentaho Analysis View (Mondrian), Pentaho Reporting (Reporting),
Pentaho Dashboards e
Weka (Data Mining).

Neste sentido, segundo DIAS (2014 p.43) “Módulos do Pentaho

Pentaho Data Integration - PDI (Kettle): utiliza as técnicas de ETL, para


obtenção dos dados. Ela é capaz de se conectar com vários bancos de
dados como Oracle, PostgreSQL, SQLServer, MySql, entre outros.
Responsável em popular o DW, migração da base de dados e integração
entre as aplicações;
Pentaho Analysis View (Mondrian): conhecida como Mondrian, permite
operações slice-and-dice, drill-down, entre outras, além da exploração
grá cas de cubos OLAP.
Pentaho Reporting (Reporting): esta ferramenta é capaz de gerar
relatórios de alta qualidade com grande simplicidade;
Pentaho Dashboards: permite a criação de painéis de controle, sendo
possível reunir numa mesma tela os principais indicadores de um
departamento ou de toda a empresa;
Weka (Data Mining): permite a criação de testes de hipóteses na área de
dados, utilizando a mineração de dados.”

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 8/35
06/07/2020 Ead.br

Na gura abaixo apresentamos a suíte do pentaho, composta por vários softwares


livres.

Figura 4.4 – Pentaho

A solução é constituída por algumas ferramentas: PAC, PUC, PME, PRD, PSW.

Pentaho Administration Console (PAC): temos a funcionalidade login, tela


para con gurações de conexões com o banco.
Pentaho User Console (PUC): Interface do usuário, onde estarão
disponíveis as consultas e onde o usuário nal poderá con gurar a suas
consultas de acordo com o seu nível.
Pentaho Metada Editor (PME) : Para que o usuário nal consiga con gurar
as suas pesquisar customizadas, é nessa ferramenta que são feitas as
con gurações de metadados para consulta.
Pentaho Report Design (PRD): Essa ferramenta permite que sejam
con gurados os padrões das consultas e relatórios que os usuários irão
utilizar em suas consultas no PUC. A con guração parte da seleção do
banco, em seguida layout dos relatórios.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 9/35
06/07/2020 Ead.br

saiba mais
Saiba mais
Assim, vimos alguns conceitos e funcionalidades
sobre o Pentaho, para aprofundamento do
aprendizado podemos realizar o download da
versão livre e começar a utilizá-lo!

ACESSAR

Figura 4.5 – Pentaho


Fonte: https://sourceforge.net

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 10/35
06/07/2020 Ead.br

atividade
Atividade
Segundo DIAS (2014 p.43) “Módulos do Pentaho • Pentaho Data Integration - PDI (Kettle):
utiliza as técnicas de ETL, para obtenção dos dados. Ela é capaz de se conectar com vários
bancos de dados como Oracle, PostgreSQL, SQLServer, MySql, entre outros. Responsável
em popular o DW, migração da base de dados e integração entre as aplicações [...]”

DIAS, Franciele D. Ferramentas olap: Um estudo baseado no sistema pentaho. Assis, 2014

Considerando o módulo Pentaho, assinale a alternativa correta:

a) Mondrian.
b) PUC.
c) PME.
d) PRD.
e) PAC.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 11/35
06/07/2020 Ead.br

Eco-sistema de Análise de
Dados - Visão Geral Sobre
Data Data Mining

Agora é hora de aprendermos sobre duas ferramentas de Business Intelligence:


Data Mining e Data Warehouse.  

Data Mining
A tradução do termo Data Mining é mineração de dados, mas o que signi ca minerar
dados?

É uma busca não comum de informação em um grande volume de dados. Essas


buscas visam encontrar padrões - por meio de cálculos matemáticos, inteligência
arti cial, processamentos automáticos - para depois juntá-los e a partir daí criar uma
coleção dos dados encontrados, considerando essa nova informação como padrão.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 12/35
06/07/2020 Ead.br

Figura 4.6 – Data Mining.


Fonte: https://br.freepik.com/vetores-gratis/conceito-de-processamento-de-dados-
grandes-sala-de-servidores-acesso-ao-token-de-tecnologia-blockchain_3629651.htm

Vamos a um exemplo prático: Uma loja on-line de artigos esportivos vendeu camisas
de um determinado time. Essa empresa quer enviar e-mails para os clientes que
compraram as camisas, oferecendo outros produtos relacionados a esse time, pois
está na nal de um grande campeonato. Então, a loja deve atrelar a uma opção de
compra de vários clientes, dentro de um período de tempo, e disparar promoções
dos outros produtos.

Neste exemplo, utilizamos a mineração de dados para tomar decisões em relação ao


negócio.

Segundo MANEGA (2002, p. 2) temos:

“[...]A partir de fontes de dados (bancos de dados, relatórios, logs de acesso,


transações, etc) efetua-se uma limpeza (consistência, preenchimento de
informações, remoção de ruído e redundâncias, etc). Disto nascem os
repositórios organizados (Data Marts e Data Warehouses), que já são úteis
de diversas maneiras. Mas é a partir deles que se pode selecionar algumas
colunas para atravessarem o processo de mineração.”

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 13/35
06/07/2020 Ead.br

Neste sentido, temos que ter em mente que o processo descrito apresentado,
contempla vários passos, desde a de nição do banco a ser “minerado” até as
informações geradas pelos padrões encontrados no banco, é partindo desse ponto
que iniciamos a mineração. A gura 4.7, mostra de uma forma visual os passos da
mineração.

Figura 4.7 – Passos Data Mining.


Fonte: MANEGA (2002, p. 2)

Após todos os processos, o que teremos? Valiosos dados de conhecimento que


nortearão a tomada de decisão.

Assim, podemos imaginar o valor desses dados! Dependendo da situação da


empresa eles têm valor de alavancar negócios, elevando os lucros a outra patamar.
Por outro lado, se os padrões não forem de nidos corretamente, como essas
informações seriam extraídas?

Por essa razão a ltragem, para de nição de padrões, é feita sobre uma forma muito
rigorosa, se baseando em cálculos matemáticos, se utilizando de inteligência
arti cial, mas mesmo assim correndo algum risco de humano na parametrização.

Na gura 4.8 podemos analisar o nível de abstração para chegarmos a um objeto, a


melhor qualidade da informação para ltragem.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 14/35
06/07/2020 Ead.br

Quanto maior o grau de abstração, maior a melhoria no nível de sabedoria,


qualidade da informação, até chegarmos no nível de tomada de decisão por parte da
empresa, conforme observarmos na gura 4.9.

Tarefas Descritivas e Preditivas

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 15/35
06/07/2020 Ead.br

Agora, vamos falar sobre os tipos de tarefas, aplicadas ao Data Mining, essas tarefas
são classi cadas em:

Descritivas

As tarefas descritivas, são as que tem um valor como padrão, ou seja, esse
valor é utilizado para a mineração dos dados.

Segundo CAMILO e SILVA (2009) “é a tarefa utilizada para descrever os


padrões e tendências revelados pelos dados. A descrição geralmente
oferece uma possível interpretação para os resultados obtidos. A tarefa de
descrição é muito utilizada em conjunto com as técnicas de análise
exploratória de dados, para comprovar a in uência de certas variáveis no
resultado obtido.”

Preditivas

Essa tarefa trabalha tentando simular o valor futuro do atributo. Ela se


baseia em estatísticas e cálculos a m de prever qual será o próximo valor.

Segundo CAMILO e SILVA (2009) “a tarefa de predição é similar às tarefas


de classi cação e estimação, porém ela visa descobrir o valor futuro de um
determinado atributo.

Exemplos:
• Predizer o valor de uma ação três meses adiante;
• Predizer o percentual que será aumentado de tráfego na rede se a
velocidade aumentar;
• Predizer o vencedor do campeonato baseando-se na comparação das
estatísticas dos times. Alguns métodos de classi cação e regressão podem
ser usados para predição, com as devidas considerações.”

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 16/35
06/07/2020 Ead.br

atividade
Atividade
Toda a seleção e de nição dos padrões é feita sobre uma grande quantidade de requisitos,
e se baseia em cálculos matemáticos e ainda se utiliza de IA (inteligência Arti cial).

Neste sentido, assinale a alternativa correta, quanto ao nível de abstração.

a) Quanto maior abstração temos mais informações.


b) Quanto menor abstração temos menos informações.
c) Quanto maior abstração temos menos informações.
d) Quanto ao nível de abstração quantidade de informações será igual.
e) Quanto ao nível de abstração não in uencia na qualidade da informação gerada
como padrão.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 17/35
06/07/2020 Ead.br

Eco-sistema de Análise de
Dados

Como já vimos o funcionamento de Data Science/Data Mining, neste tópico iremos


conhecer ferramentas de Data Science e alguns conceitos dessas ferramentas.

Falaremos de algumas ferramentas open source, então é interessante que você


baixe e instale as ferramentas a m de aprofundar os conhecimentos!

RapidMiner
O RapidMiner é o nosso primeiro exemplo de ferramenta de Data Mining, como já
falamos é uma ferramenta open source. Pode ser baixada pelo endereço eletrônico
https://rapidminer.com/products/, encontramos os produtos do RapidMiner.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 18/35
06/07/2020 Ead.br

Figura 4.10 – Site RapidMiner


Fonte: https://rapidminer.com/products/

Esta é uma ferramenta bem visual, facilitando a manipulação de dados e criação de


work ows. Na gura 4.11, podemos observar um exemplo de work ow.

Figura 4.11 – Tela grá ca work ow


Fonte:  https://static.imasters.com.br/wp-content/uploads/2017/05/rapidminer-
work ow.png

A ferramenta apresentada, permite criar rapidamente modelos preditivos, sem a


necessidade de codi cação e transformação dos dados.

Suas funcionalidades disponíveis são:

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 19/35
06/07/2020 Ead.br

RapidMiner Studio:  Aplicado no desenho de Work ows, desde o início do


processo de mineração na importação das informações até os resultados
RapidMiner Server: Utilizado para gerenciar seus modelos, compartilhar
com outros usuários.
RapidMiner Radoop: Utilizado para compilar e executar work ows
armazenados no Hadoop.

No exemplo, ao executar a ferramenta, acessamos o seu estúdio e criamos um


modelo visual em que podemos fazer a extração dos dados. Sendo ainda, é possível
gerenciar os modelos criados e compila-los em Hadoop.

Weka
A outra ferramenta que iremos conhecer é a Weka, ferramenta desenvolvida em
Java podendo ser utilizada em ambientes: Windows, Linux e Mac. A aplicação é de
autoria da universidade de Waikato na Nova Zelândia. É um software open source
cujo o projeto tem por objetivo, disseminar as técnicas de machine learning por meio
do uso da ferramenta auxiliando na resolução dos problemas existentes.

Figura 4.12 – Weka.


Fonte: https://www.cs.waikato.ac.nz/ml/weka/

Da mesma forma da outra ferramenta citada, esta tem uma interface grá ca, que
podemos fazer as con gurações de banco de dados, escrever e executar métodos de
processamentos e visualizar os resultados.

No link abaixo podemos baixar e estudar a ferramenta e a documentação


 http://www.cs.waikato.ac.nz/ml/weka/.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 20/35
06/07/2020 Ead.br

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 21/35
06/07/2020 Ead.br

atividade
Atividade
É uma ferramenta bem visual, facilitando a manipulação de dados, criação de work ows.
Observe a gura apresentada, em que podemos observar um exemplo de work ow.

Figura 4.13 - Exemplo de work ow


Fonte: https://static.imasters.com.br/wp-content/uploads/2017/05/rapidminer-
work ow.png

Considerando a a rmação apresentada, assinale a alternativa correta em relação às


ferramentas do Rapidminer.

a) Workfow.
b) RapidMiner Studio.
c) Modelos preditivos.
d) Weka.
e) Hadoop.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 22/35
06/07/2020 Ead.br

Eco-sistema de Análise de
Dados

Agora, continuaremos a falar sobre as ferramentas disponíveis no mercado de


desenvolvimento de softwares sobre Data Science.

Orange
A ferramenta Orange, foi desenvolvida pela Universidade de Ljubljana, feita em
Python, C++ C e Cython, e sua principal característica é a mineração de dados e
geração de relatórios.

É baseada em um pacote de programação visual, podendo ser criado um work ow


através da ferramenta visual, seus widgets podem ser programáveis pelos usuários e
ou poderão ser utilizados os já disponíveis na ferramenta.

Algumas características:

Dados: podem ser carregados, salvos, tem suporte a operações com junção
e seleção.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 23/35
06/07/2020 Ead.br

Visualização: parte grá ca desenvolvida com componentes de criação


grá ca.
Modelos: regressão linear, random
Avaliação: matriz da confusão
Não supervisionado: cálculos de distâncias, mapa de distância.

Figura 4.14 – Tela Orange com dados.


Fonte: https://orange.biolab.si/

Figura 4.15 – consultas geradas.


Fonte: https://orange.biolab.si/

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 24/35
06/07/2020 Ead.br

Knime
O software Knime, da mesma forma que os outros citados anteriormente, foi
desenvolvido em uma universidade, a Konstanz, na Alemanha.

Desenvolvido para a análise, com módulos de integração e transformação de dados


em relatórios e grá cos, hoje em dia conta com mais de 15.000 usuários pelo mundo
em diversas áreas, desde indústrias, empresas de edição, indústrias automobilísticas
e um grande grupo de pesquisas. Tem integração com Weka, entre outros.

A seguir conheça algumas telas para ambientação. Disponível para consulta, e


download no link https://www.knime.org/, e lembrando que se trata de um software
livre.

Figura 4.16 – Site Knime.


Fonte: https://www.knime.com/

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 25/35
06/07/2020 Ead.br

Figura 4.17 – Dados processados pelo Knime


Fonte: https://dadosedecisoes.com.br/5-ferramentas-open-source-data-science/

reflita
Re ita
“Abstrair, no sentido que usamos aqui, é representar uma
informação através de correspondentes simbólicos e genéricos.
Este ponto é importante: como acabamos de ver, para ser genérico,
é necessário "perder" um pouco dos dados, para só conservar a
essência da informação.”

Fonte: NAVEGA (2002, p. 02).

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 26/35
06/07/2020 Ead.br

saiba mais
Saiba mais
Para saber mais sobre o assunto de Data Mining,
acesse o conteúdo do artigo do site Dev Media,
maior site do Brasil em conteúdo para
programadores, que traz muitas informações
sobre Data Mining.

O artigo traz por exemplo que podemos aplicar o


conceito de Data Mining e muito mais!

ACESSAR

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 27/35
06/07/2020 Ead.br

atividade
Atividade
Em conhecimento em relação as ferramentas para mineração de dados, algumas
ferramentas que são utilizadas em todo o mundo, que na sua maioria foram desenvolvidas
dentro de universidades.

Em relação às características das ferramentas que conhecemos, assinale a alternativa


correta.

a) Foram desenvolvidas por alunos.


b) As ferramentas são open source.
c) Ferramentas pagas.
d) Os ltros para pesquisa são estáticos.
e) Todos feitos em Java.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 28/35
06/07/2020 Ead.br

indicações
Material
Complementar

LIVRO

Business Intelligence: Um enfoque


gerencial para a inteligência do negócio
Editora: Bookman

Autor: Efraim Turban, Ramesh Sharda, Jay E. Aronson e


David King – tradução de Fabiano Bruno Gonçalves.

ISBN: 978-0-13-234761-7

Comentário:  Nesta obra os autores trazem muita


informação importante para quem quer trabalhar e
aprender sobre o BI, trazendo casos práticos, dentre eles
uma aplicação da Toyota Motors, com a ajuda do BI a
empresa pode melhorar sua questão de logística, custo e
satisfação do cliente.

Vale muita a pena essa leitura!

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 29/35
06/07/2020 Ead.br

FILME

Vingadores – Era de Ultron


Ano:2015

Comentário: Nesse lme, os vingadores retiram uma caixa


do Ultron, para ver que ele estava desenvolvendo, e no caso
seria a sua raça superior, e o homem de ferro e o Hulk, estão
acessando a caixa contendo o robô, e acabam o
reprogramando através dos dados pesquisados pelo Jarvs
(computador do Homem de Ferro), no caso ele faz uma
busca e importa esses dados para o robô. Essa busca feita foi
uma grande mineração de dados na internet para ser
transferido para o robô que depois vem a ser o personagem
Visão.

TRAILER

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 30/35
06/07/2020 Ead.br

conclusão
Conclusão

Nesta unidade, estudamos alguns conceitos imprescindíveis: Data Mining, a


mineração de dados em uma grande base, buscando informações que possam gerar
 parâmetros, para ser utilizados como base nas pesquisas das informações e ltros
apresentados como um histórico, também em forma de grá cos e outros
documentos visuais para auxílio na tomada de decisões.

Vimos também os conceitos do Data Science que também é utilizado

para a pesquisa de informações, geração de grá cos e dados para auxílio das

empresas.

E ainda vimos algumas ferramentas e seus conceitos para busca de dados: Redminer,
Orange Weka. e Knime.

Muito obrigado pela companhia e bom estudos!

referências
Referências
Bibliográ cas

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 31/35
06/07/2020 Ead.br

TURBAN, Efraim; et al. Business Intelligence: Um enfoque gerencial para a


inteligência do negócio. Porto Alegre: Bookman, 2009.

DIAS, Franciele D. Ferramentas olap: Um estudo baseado no sistema pentaho. Assis,


2014

DIAS, Franciele D. Ferramentas olap: Um estudo baseado no sistema pentaho.


Disponível em: <https://cepein.femanet.com.br/BDigital/arqTccs/1111320138.pdf>
Acesso em: 04 Mai. 2019.

CRUZ, Bruno C. MIRANDA, Bruno G. C. TURCHETE, Fellipe B. Conceitos de


business intelligence por meio de estudos de caso: ferramentas pentaho e qlikview.
Disponível em: <http://lyceumonline.usf.edu.br/salavirtual/documentos/2704.pdf >
Acesso em: 04 Mai. 2019.

NAVEGA, Sergio. Princípios essenciais do data mining. Disponível em:


<http://www.intelliwise.com/reports/i2002.pdf> Acesso em: 04 Mai. 2019.

CAMILO, Carlos de O. SILVA, João C. Mineração de Dados: Conceitos, Tarefas,


Métodos e Ferramentas Disponível em:
<http://www.portal.inf.ufg.br/sites/default/ les/uploads/relatorios-tecnicos/RT-
INF_001-09.pdf > Acesso em: 04 Mai. 2019.

Disponível em: <https://dadosedecisoes.com.br/5-ferramentas-open-source-data-


science/> Acesso em: 04 Mai. 2019.

PENTAHO bi - Conhecendo a Plataforma, Arquitetura e Infraestrutura. Site


Devmedia. Disponível em: <https://www.devmedia.com.br/pentaho-bi-conhecendo-
a-plataforma-arquitetura-e-infraestrutura/31502> Acesso em: 04 Mai. 2019.

RAPIDMINER. Disponível em: <https://rapidminer.com/products/> Acesso em: 04


Mai. 2019.

KNIME. Disponível em: <https://www.knime.com/> Acesso em: 04 Mai. 2019.

IMASTER.Disponível em: <https://static.imasters.com.br/wp-


content/uploads/2017/05/rapidminer-work ow.png> Acesso em: 04 Mai. 2019.

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 32/35
06/07/2020 Ead.br

DADOS E DECISÕES. 5 Ferramentas open source para data science e big data.
Disponível em: <https://dadosedecisoes.com.br/5-ferramentas-open-source-data-
science/> Acesso em: 04 Mai. 2019.

IMPRIMIR

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 33/35
06/07/2020 Ead.br

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 34/35
06/07/2020 Ead.br

https://unp.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 35/35

Você também pode gostar