Você está na página 1de 23

Pós

PósGraduação
Graduação

DATA MINING

Fonte:https://www.newgenapps.com/blog/6-tips-on-successful-data-mining/
Agenda da Webnar:
- Roteiro de Estudos:
• Big Data: o que é?
• Conceitos básicos de Data Mining.
• KDD: a Descoberta do Conhecimento.
• As etapas do processo de Mineração e
Análise de Dados;
Métodos de Mineração de Dados;
DATA MINING


• Principais ferramentas da Mineração de
Dados.

- Discussão do Caso.
- Dúvidas.
Fonte: www.ispartnersllc.com/blog/best-techniques-data-mining/
Big Comunicação Digital
Data
DATA MINING

DATA MINING
Fonte: sdtimes.com
Big Data
Conceitos:

Big Data são altos volumes e variedades de informações que exigem novas
modalidades de processamento a fim de permitir uma visão aprimorada sobre
essas informações, auxiliando a tomada de decisões e automação de processos
(GARTNER, 2021).

Big Data é um conjunto de dados imenso e complexo, especialmente pelo fato


DATA MINING

de vir da muitas fontes de dados. O volume desse conjunto não permite que o
software tradicional de processamento capaz de gerenciá-lo. O Big Data é
utilizado para resolver problemas de negócios que a empresa não conseguiria
resolver antes.(ORACLE, 2021).
Big Data

Os 5 Vs…
DATA MINING

Fonte: www.livti.com.br/blog/big-data-para-qualquer-negocio/v-big-data/
Data Comunicação Digital
Mining
DATA MINING

Fonte: www.adaoncloud.com/mx/blog/2020/02/21/que-es-el-data-mining-y-para-que-sirve-en-marketing-digital/
DATA MINING
Data Mining
Conceitos:

Data Mining é um modo de procurar relações interessantes ocultadas em um


grande conjunto de dados, tais como padrões de agrupamentos e aproximações
de funções (KING, 2003).

Data Mining é um conjunto de técnicas utilizadas para explorar exaustivamente


DATA MINING

e trazer à superfície relações complexas em um conjunto grande de dados


(MOXTON, 2004).

O objetivo do Data Mining é descobrir o conhecimento que está oculto nas


grandes quantidades de informações armazenadas nos bancos de dados
(ELMASRI & NAVATHE, 2002).
Data Mining
Conceitos:

Data Mining é uma das fases do processo de descoberta do conhecimento em


bases de dados (DCBD): KDD, “Knowledge Discovery in Databases” (FAYYAD
et al., 1996).
O processo de descoberta de conhecimento em bases de dados (DCBD) ou
DATA MINING

KDD (Knowledge Discovery in Databases), possui o Data Mining como sua


principal etapa (AMO, 2003).

Para que o conhecimento seja descoberto, técnicas de Data Mining (mineração


de dados) devem ser aplicadas nas bases de dados (AMO, 2003).
Knowledge
Comunicação Digital
Discovery KDD DATA MINING
in
DATA MINING

Databases

Fonte: Autor.

DATA MINING
KDD - Knowledge Discovery in Databases
Divisão do KDD, segundo Fayyad et. al (1996):

1. : Preparação dos Dados: consiste em incluir o conhecimento relevante e definir quais


as metas que o processo precisa atingir.
2. Limpeza dos Dados: consiste em retirar os dados que possam distorcer a análise.
3. Seleção de Dados: consiste em escolher o conjunto de dados em que o
processo será aplicado.
DATA MINING

4. Data Mining: consiste em decidir qual tarefa de Data Mining será aplicada.
5. Incorporação do conhecimento anterior: consiste em interpretar o
modelo extraído afim de certificar seu conteúdo.
6. Interpretação dos resultados: o resultado obtido auxilia as
tomadas de decisões baseadas no conhecimento alcançado.
Etapas do Processo
KDD é "um processo de identificação de novos padrões válidos, úteis e
compreensíveis“ (FAYYAD et al., 1996).
DATA MINING

Fonte: www.researchgate.net/figure/Figura-1-Processo-de-KDD-O-processo-de-KDD-consiste-em-uma-sequencia-de-etapas-que-devem_fig1_308995146
Tarefas da
Mineraçã
Comunicação Digital
o
DATA MINING

de Dados

DATA MINING
Fonte: artia.com/blog/como-montar-uma-lista-de-tarefas/
Tarefas da Mineração de Dados
As tarefas mais comuns segundo Larose (2005) são:

Descrição (Description): utilizada para descrever os padrões


e tendências revelados pelos dados, oferece uma possível
interpretação para os resultados obtidos.

Classificação (Classification): visa identificar a qual classe um determinado


registro pertence.
DATA MINING

Estimação (Estimation) ou Regressão (Regression): é similar à classificação, é


usada quando o registro é identificado por um valor numérico e não um
categórico. Assim, pode-se estimar o valor de uma determinada variável
analisando-se os valores das demais.
Tarefas da Mineração de Dados
Ainda segundo Larose (2005):

Predição (Prediction): é uma tarefa similar às tarefas de classificação e


estimação, porém ela visa descobrir o valor futuro de um atributo.

Agrupamento (Clustering): visa identificar e aproximar os registros similares.


DATA MINING

Associação (Association): A tarefa de associação consiste em identificar quais


atributos estão relacionados. É uma das mais conhecidas devido aos bons
resultados obtidos nas análises dos "Carrinhos de Compras", onde são
identificados quais produtos são levados juntos pelos consumidores.
Métodos de
Mineração
Comunicação Digital
de Dados
DATA MINING

DATA MINING
Fonte: conceitos.com/metodo/
DATA MINING Métodos de Mineração de Dados

Fonte: slideplayer.com.br/slide/47437/
Métodos de Mineração de Dados

Métodos de Mineração de Dados são divididos em (CIOS et al., 2007) aprendizados:

• Supervisionado e Preditivo: ensina o modelo o que ele deve fazer e prevê o resultado
ou comportamento, respectivamente.

• Não-supervisionado e Descritivo: o algorítmo aprende por si e busca a compreensão


DATA MINING

dos dados e informações em tempo real e imediato, não futuro. Respectivamente


também.

Alguns métodos preditivos podem ser descritivos e vice-versa (FAYYAD, 1996).

Fonte: scriptutex.pt/2018/10/08/arquitetura-de-informacao-e-usabilidade/
Métodos de Mineração de Dados

Alguns métodos de Mineração de Dados:

• Árvores de Decisão (Decision Trees).


• Redes Neurais (Neural Networks).
• Classificação por Regras de Associação (Classification by Association Rule).
• Algoritmo Genético (Genetic Algorithm).
DATA MINING

• Conjuntos Aproximados (Rought Set).


• Regressão Linear e não-Linear.

Fonte: scriptutex.pt/2018/10/08/arquitetura-de-informacao-e-usabilidade/
Ferramentas de
Mineração de
Comunicação Digital
Dados
DATA MINING

Fonte: blog.academiain1.com.br/cgi-sys/suspendedpage.cgi

DATA MINING
Ferramentas de Mineração de Dados
Ter ciência das informações armazenadas nas bases de dados pelas empresas
estimulou o desenvolvimento de ferramentas capazes de facilitar a extração do
conhecimento por meio de uma variedade de técnicas, com diferentes tipos de
algoritmos voltados para a Mineração de dados (REZENDE, 2005):
• Weka • Apache Hadoop
• RapidMiner • Oracle Data Mining
• Tanagra • Statwing
• Knime • Chartio
DATA MINING

• DataMelt • Pentaho
• OpenRefine
• R
• Orange
• Tableau Public
• Trifacta Wrangler
Dúvidas? Dúvidas?
DATA MINING

Fonte: comunique-se.com.br/blog/agencias-na-era-da-comunicacao-digital/

Dúvidas?
Fonte: https://capitalsocial.cnt.br/duvidas-recursos-humanos-pme/
Bibliografia
AMO, S. Curso de data mining: programa de mestrado em ciência da computação. Uberlândia: Universidade Federal de Uberlândia,
2003. Disponível em: <www.deamo.prof.ufu.br/CursoDM.html>. Acesso em: 03 fev. 2021.
CAMILO, C. O.; SILVA, J. C. da. Mineração de dados: conceitos, tarefas, métodos e ferramentas. [Goiânia: UFMG,] 2009. Disponível
em: <ww2.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf>. Acesso em: 03 fev. 2021.
CIOS, K. J; PEDRYCZ, W; SWINIARSKI, R. W; KURGAN, L. A. Data Mining - A
Knowledge Discovery Approach. Springer, 2007.
ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados: fundamentos e aplicações. 3. ed. Rio de Janeiro: LTC, 2002.
FAYYAD, U; PIATETSKY-SHAPIRO, G; SMYTH, P. From Data Mining to Knowledge Discovery in Databases. American Association
for Artificial Intelligence, 1996.
GARTNER. Gartner Group. Zero-Latency Enterprise (ZLE). Disponível em: <www.gartner.com/en/information-
technology/glossary/zle-zero-latency-enterprise>. Acesso em 03 fev. 2021.
HAN, J; KAMBER, M. Data Mining: Concepts and Techniques. Elsevier, 2006.
LAROSE, D. T. Discovering Knowledge in Data: An Introduction to Data Mining.
John Wiley and Sons, Inc, 2005.
KING, D. Numerical machine learning. Georgia: Tech College of Computing, 2003. Disponível em:
<www.cc.gatech.edu/kingd/datamine/datamine.html>. Acesso em: 03 fev. 2021.
MOXTON, B. Defining data mining. DBMS Data warehouse supplement site, 2004. Disponível em:
<www.dbms.mfi.com/9608d53.html>. Acesso em: 02 fev. 2021.
ORACLE. Oracle. O que é Big Data? Disponível em: <www.oracle.com/br/big-data/what-is-big-
data/#:~:text=Big%20data%20definido,-
O%20que%20%C3%A9&text=Aqui%20est%C3%A1%20a%20defini%C3%A7%C3%A3o%20do,com%20velocidade%20cada%20vez
%20maior>. Acesso em 03 fev. 2021.
REZENDE, S.O. Mineração de dados. Congresso da sociedade Brasileira de Computação, 25. 2005, São Leopoldo, Rs. A
Pós Graduação
DATA MINING

Adriano Arrivabene
Contatos
• Lattes: lattes.cnpq.br/7405822718918138
• LinkedIn: linkedin.com/in/adriano-arrivabene-
2a236568

OBRIGADO
!

Você também pode gostar