Você está na página 1de 45

FATEC ITAPETININGA – V SEMANA DE TECNOLOGIA

Inteligência de Negócios

Prof. J. Octavio C. Pineda


Mestre em História da Ciência – PUC-SP
Professor da UNIP – Graduação e Lato Sensu
Profissional de T.I. com 25 anos de experiência
INTELIGÊNCIA DE NEGÓCIOS : INTRODUÇÃO
DADO, INFORMAÇÃO E CONHECIMENTO

O que é Informação?

Definição Princípios

Segundo a Teoria da Informação, Uma mensagem pode ser


de Claude Shannon: recodificada de forma que a
extensão dos elementos
constituintes seja inversamente
“Informação é o que diminui proporcional à sua freqüência.
uma incerteza”
O decréscimo em extensão é
chamado de “redundância”.
A informação pode ser quantificada
por modelo estatístico: o que é Este método que permite a
incomum contem mais informação compressão da informação, tanto
que o comum. transmissão como armazenamento.
INTELIGÊNCIA DE NEGÓCIOS : INTRODUÇÃO
DADO, INFORMAÇÃO E CONHECIMENTO

Componentes da Mensagem segundo a Teoria da Informação

informação redundância

O objetivo da compactação de mensagens é fazer com que


o tamanho das mensagens se aproxime tanto quanto
possível do tamanho da informação que a mensagem
contém.
INTELIGÊNCIA DE NEGÓCIOS : INTRODUÇÃO
DADO, INFORMAÇÃO E CONHECIMENTO

O que é Informação?

Limites da Teoria da Informação Limitação da Teoria da Informação

Só funciona para informação “fria”, sem Para levar em consideração a


levar em conta o significado (semântica) semântica, não existem modelos
matemáticos, apenas modelos
cognitivos, como o Modelo DIKIW –
Data, Information, Knowledge,
Intelligence, Wisdom
INTELIGÊNCIA DE NEGÓCIOS : INTRODUÇÃO
DADO, INFORMAÇÃO E CONHECIMENTO

Cognição

É o processo que nos leva a A atribuição de significado se dá pela


“conhecer”, ou seja, a “construir o adição de camadas de abstração.
conhecimento”.

Dificuldade: a Interpretação é tanto


Envolve atenção, percepção, memória, mais complexa e incerta quanto mais
raciocínio, juízo, imaginação com elevado é o nível de abstração.
atribuição de significado crescente ao
longo do processo.
Todo texto é plurissignificativo, e sua
interpretação depende de linguagem e
cultura.
INTELIGÊNCIA DE NEGÓCIOS : INTRODUÇÃO
DADO, INFORMAÇÃO E CONHECIMENTO

Semântica e Interpretação R. Carlos – As Curvas da Estrada de


Santos
ColdPlay – Viva la Vida
Se você pretende Só ando sozinho
I used to rule the world Saber quem eu sou, E no meu caminho
Seas would rise when I gave the word Eu posso lhe dizer. O tempo é cada vez
Now in the morning I sleep alone Entre no meu carro menor...
Sweep the streets I used to own E na estrada de Santos
Você vai me conhecer. Preciso de ajuda!
I used to roll the dice Por favor me acuda!
Feel the fear in my enemy's eyes Você vai pensar que eu Eu vivo muito só...
Listen as the crowd would sing Não gosto nem mesmo
"Now the old king is dead! Long live the king!" de mim Se acaso numa curva
E que na minha idade Eu me lembro do meu
One minute I held the key Só a velocidade mundo,
Next the walls were closed on me Anda junto a mim. Eu piso mais fundo.
And I discovered that my castles stand Corrijo num segundo.
Upon pillars of salt and pillars of sand Não posso parar!

Mensagem comum: estados mentais alterados de forma sucessiva, sintomas de


distúrbio bipolar (depressão e euforia), vícios (?)
INTELIGÊNCIA DE NEGÓCIOS : INTRODUÇÃO
DADO, INFORMAÇÃO E CONHECIMENTO

Processo Cognitivo
Ambiente: origem dos Estímulos Os anos ensinam muito do
que os dias jamais saberão.
Registro: Estímulos captados e
transformado em Dados Ralph Waldo Emerson

Classificação: Dado transformado em


Informação, com significado
agregado.

Síntese: Informação consolidada


transformada em Conhecimento.

Ação: Conhecimento fundamenta


decisão de Inteligência.

Missão: Sabedoria que justifica Ações.


INTELIGÊNCIA DE NEGÓCIOS : INTRODUÇÃO
DADO, INFORMAÇÃO E CONHECIMENTO

Níveis Cognitivos  Exemplo Empresarial:

 Exemplo Científico: Ambiente: clientes, competidores, governo,


economia, tendências, tecnologia
Ambiente: Universo - os estímulos são
eventos físicos verificáveis. Dados: cotações, vendas, compras,
pagamentos, recebimentos, tributos
Dados: massa, energia, tempo, velocidade
Informação: crédito, inadimplência,
Informação: interação entre matéria e lucratividade, fluxo de caixa, índices
energia, transformações físicas econômicos, KPI’s

Conhecimento: Teoria da Relatividade Conhecimento: processos, produtos,


mercado, sucessos e fracassos
Inteligência: bomba atômica, usinas
nucleares Inteligência: estratégias, ajustes de rumo,
mudanças de abordagem
Sabedoria: segurança, guerra, geração de
energia Sabedoria: missão, visão, valores
INTELIGÊNCIA DE NEGÓCIOS : INTRODUÇÃO
DADO, INFORMAÇÃO E CONHECIMENTO

Semântica Semântica nos Níveis Cognitivos

Atribuição de Significado  A Semântica depende de fatores


lingüísticos e culturais – é por isso que os
sistemas de tradução são tão deficientes
 Diferença entre Ouvir e Escutar
 Cada nível cognitivo acrescenta uma
 Diferença entre Olhar e Ver camada de significado à camada anterior

 Captação de Estímulos x  Cada nível de significado procura


Interpretação e Entendimento sintetizar os significados dos níveis
anteriores, melhorando seu entendimento
 Literal x Figurado, Concreto x
 O nível mais alto, o da Sabedoria,
Abstrato sintetiza tudo sobre a empresa em 3
declarações: Missão, Visão e Valores
INTELIGÊNCIA DE NEGÓCIOS : INTRODUÇÃO
DADO, INFORMAÇÃO E CONHECIMENTO

Níveis de Responsabilidade, Necessidade de Informação, Tipos de


Sistemas de Informação e Níveis Cognitivos

Sabedoria

Inteligência Corporativa
• OLAP Inteligência
sintético
• Mineração de Dados
+ agregação
Estratégico
coletivo
estatística Gestão Conhecimento
• ERP
Tático • Sistemas Integrados
analítico • KM Informação
+ detalhe
individual Automação
granular Operacional • Frente de Loja
• Chão-de-Fábrica Dados
• Call Center

Estímulos
INTELIGÊNCIA DE NEGÓCIOS
BANCOS DE DADOS, OLTP E OLAP

Modelo Relacional

 Origem na Teoria dos Conjuntos (Matemática)

 Baseia-se na organização dos dados em


tabelas, onde cada instância é uma linha (ou
tupla), e cada coluna é uma atributo (fato sobre
a linha)

Edgar F. Codd (1923-2003)


Criou o Modelo Relacional em 1970,
trabalhando para a IBM.
Definiu:
• OLTP, normalização e desnormalização
• Definiu OLAP em 1993
INTELIGÊNCIA DE NEGÓCIOS
BANCOS DE DADOS, OLTP E OLAP

Sistemas Transacionais Sistemas de BI/DW/DM


 OLTP  OLAP
 Modelo Relacional  Desnormalização
 Normalização – formas  Criado/atualizado pelo
normais 1ª, 2ª e 3ª processo ETL (extract,
 Exceções à regras: transform, load)
redundâncias controladas  Cubo OLAP - Star Schema,
Snowflake Schema
INTELIGÊNCIA DE NEGÓCIOS
OLAP NO MODELO RELACIONAL

Objetivos Desnormalização

 Sistemas de Apoio a Decisão  1FN: é respeitada sempre


 Desempenho em Consultas  2FN: é respeitada às vezes
Complexas  3FN: é violada por princípio
 Processo de Mapeamento e
Consolidação dos Dados,
antecipando necessidades de Cubo OLAP
consulta  Dimensões
 Critérios de agregação
 Técnica: Desnormalização,
inserindo redundância para  Fatos
agilizar consultas  Dados Numéricos, totalizados ou
não
INTELIGÊNCIA DE NEGÓCIOS
OLAP – FONTES, ATUALIZAÇÃO E UTILIZAÇÃO

Banco Relacional Dashboard


/ Portal

ERP, CRM, KM...


Data Warehouse

Data Mining

ETL
Fin
Produção Comercial
Cubo OLAP

Arquivos Diversos
Relatórios

Data Marts
INTELIGÊNCIA DE NEGÓCIOS
OLAP – DIMENSÕES E FATOS

Dimensões Fatos
 São os aspectos que serão  São os dados que servirão de base de
considerados nas consultas, por
exemplo: totalização, por exemplo:
 Tempo (Ano, Trimestre, Mês)  Valor de Venda

 Local (Região, Estado, Cidade)  Quantidade de Incidentes


 Produto (Família, Tipo, Item)  Quantidade de Eleitores
 Pessoa (Diretor, Gerente, Func.)  Tempo Decorrido (Intervalos)

 Representam critérios de
Agregação dos Fatos a Analisar  Em geral são dados numéricos, dos
quais se podem obter estatísticas:
Obs: toda dimensão deve ter domínio  SUM() – Soma
discreto; se não tiver, transformar em  AVG() – Média Aritmética
faixas de valores, ex: faixas de idades
até 18, 19 a 35, de 36 a 50 e acima  MIN() – Menor Valor
de 51  MAX() – Maior Valor

 COUNT() – Contagem de Valores


UNIP : SEMINÁRIO ESPECIAL DE INTELIGÊNCIA DE NEGÓCIOS
PROJETO DE DADOS PARA OLAP

Star Schema Cubo OLAP


(esquema da estrela)  Representação gráfica de uma
 Modelo básico de construção estrela ou floco de neve com 3
dimensões (eixos) fechada e
preenchida
Snowflake Schema
(esquema do floco de neve)
 Modelo similar ao Estrela, porém
Recuperação de Dados
mais normalizado  Graficamente, os valores dos Fatos
são encontrados no cruzamento
(intersecção) dos valores
desejados nas Dimensões do cubo
 Usa-se SQL ou MDX (Multi-
Dimensional Expressions)
INTELIGÊNCIA DE NEGÓCIOS
PROJETO DE DADOS PARA OLAP

Star Schema Snowflake Schema

 Modelo básico de construção  Modelo de construção mais


 A “estrela” é a representação elaborado
gráfica do modelo:  Cada Grau de Dimensão usa
 Os Fatos no meio uma tabela para apontar aos
 As Dimensões nas fatos
extremidades
 Cada dimensão usa uma
tabela para apontar aos fatos
INTELIGÊNCIA DE NEGÓCIOS
STAR SCHEMA

Ano | Trimestre | Mês


 Normalização no nível
de Dimensão
(uma tabela para cada
dimensão)

Quantidade de Incidentes | Quantidade de Acidentes


INTELIGÊNCIA DE NEGÓCIOS
STAR SCHEMA

Exemplo:

Quantas Televisões vendidas em


2009 por marca e país:

SELECT
P.Brand,
S.Country,
SUM (F.Units_Sold)
FROM
Fact_Sales F
INNER JOIN Dim_Date D
ON F.Date_Id = D.Id
INNER JOIN Dim_Store S
ON F.Store_Id = S.Id
INNER JOIN Dim_Product P
ON F.Product_Id = P.Id
WHERE
D.Year = 2009 AND P.Product_Category = ‘TV’
GROUP BY
P.Brand, S.Country
INTELIGÊNCIA DE NEGÓCIOS
SNOWFLAKE SCHEMA

Trimestre
 Normalização no nível
de Elementos de
Dimensão (uma tabela
para cada grau de
dimensão)

TEMPO
Quantidade de Incidentes | Quantidade de Acidentes

Região
INTELIGÊNCIA DE NEGÓCIOS
SNOWFLAKE SCHEMA

Exemplo:
Quantas Televisões vendidas
em 2009 por marca e país:

SELECT
P.Brand,
S.Country,
SUM (F.Units_Sold)
FROM
Fact_Sales F
INNER JOIN Dim_Date D
ON F.Date_Id = D.Id
INNER JOIN Dim_Store S
ON F.Store_Id = S.Id
INNER JOIN Dim_Geography G
ON S.Geography_Id = G.Id
INNER JOIN Dim_Product P
ON F.Product_Id = P.Id
INNER JOIN Dim_Product_Category C
ON P.Product_Category_Id = C.Id
INNER JOIN Dim_Brand B
ON P.Brand_Id = B.Id
WHERE
D.Year = 2009 AND P.Product_Category = ‘TV’
GROUP BY
P.Brand, S.Country
INTELIGÊNCIA DE NEGÓCIOS
CUBO OLAP

 Construção Dimensões a considerar:


 Determinar os objetivos da  Local: região, país, unidade
consulta  Tempo: ano, trimestre, mês
 Determinar os aspectos a
 Competência: divisão, depto, grupo
considerar (dimensões)
 Determinar as grandezas a serem
medidas (fatos) Fatos:
 Quantidade de Incidentes
 Exemplo:  Quantidade de Acidentes
Objetivo:
uma mineradora multinacional
quer fazer um inventário de
ocorrências ambientais para
acompanhar a eficácia das
medidas de prevenção de
acidentes.
INTELIGÊNCIA DE NEGÓCIOS
CUBO OLAP – DIMENSÕES

 LOCAL  COMPETÊNCIA
Região País Unidade Divisão Departamento Grupo
África África do Sul Georgetown Mineração Extração E
África Moçambique Maputo Mineração Extração F
África Moçambique Mocuba Mineração Extração G
América Canadá Quebec Mineração Processamento P
América Canadá Montreal Transporte Ferroviário C
América Brasil Carajás Transporte Ferroviário D
América Brasil Serra do Cachimbo Transporte Marítimo M
Transporte Marítimo N
 TEMPO Ano Trimestre Mês
2004 1 Janeiro
2004 1 Fevereiro
2004 1 Março
2004 2 Abril
2004 2 Maio
2004 2 Junho
2004 3 Julho
UNIP : SEMINÁRIO ESPECIAL DE INTELIGÊNCIA DE NEGÓCIOS
CUBO OLAP – FATOS

 Fatos (Tabela “Cubo”)


Região País Unidade Ano Trimestre Mês Divisão Departamento Grupo Incidentes Acidentes
África África do Sul Georgetown 2004 1 Janeiro Mineração Extração E1 2 0
África África do Sul Georgetown 2004 1 Janeiro Mineração Extração E2 4 2
África África do Sul Georgetown 2004 1 Janeiro Mineração Extração E3 5 3
África África do Sul Georgetown 2004 1 Janeiro Mineração Processamento P 7 4
África África do Sul Georgetown 2004 1 Janeiro Transporte Ferroviário F1 9 6
África África do Sul Georgetown 2004 1 Janeiro Transporte Ferroviário F2 2 0
África África do Sul Georgetown 2004 1 Janeiro Transporte Marítimo M1 0 3
África África do Sul Georgetown 2004 1 Janeiro Transporte Marítimo M2 3 4
África África do Sul Georgetown 2004 1 Fevereiro Mineração Extração E1 2 2
África África do Sul Georgetown 2004 1 Fevereiro Mineração Extração E2 3 1
África África do Sul Georgetown 2004 1 Fevereiro Mineração Extração E3 6 0
África África do Sul Georgetown 2004 1 Fevereiro Mineração Processamento P 2 0
África África do Sul Georgetown 2004 1 Fevereiro Transporte Ferroviário F1 9 1

Obs: exemplo didático – fatos e dimensões juntos, cubo não normalizado


INTELIGÊNCIA DE NEGÓCIOS
CUBO OLAP – VISÃO BIDIMENSIONAL

 Cruzamento do Fato Incidentes nas Dimensões Local e Tempo

2004
1 2 3
Jan Fev Mar Abr Mai Jun Jul Ago Set
África do Sul Georgetown 3 1 2 3 4 5 3 1 2
África Maputo 3 4 5 1 0 2 3 4 5
Moçambique
Mocuba 6 5 8 3 9 2 6 5 8
Quebec 1 8 9 3 6 2 1 8 9
Canadá
Montreal 7 8 3 5 1 4 7 8 3
América
Carajás 5 7 3 2 8 5 5 7 3
Brasil
Serra do Cachimbo 7 8 1 5 4 4 7 8 1
INTELIGÊNCIA DE NEGÓCIOS
CUBO OLAP – VISÃO BIDIMENSIONAL

 Consultas ao Cubo – Exemplos

 Quantos Incidentes em Ago/2004 em Mocuba? 5


SELECT SUM(Incidentes) FROM Cubo WHERE Ano=‘2004’ AND Mês=‘Ago’ AND Unidade=‘Mocuba’ ;

 Quantos Incidentes em Mai/2004 no Canadá? 6 + 1 = 7


SELECT SUM(Incidentes) FROM Cubo WHERE Ano=‘2004’ AND Mês=‘Mai’ AND País =‘Canadá’ ;

 Média de Incidentes em Georgetown no 3º trimestre de 2004? ( 3 + 1 + 2 ) / 3 = 2


SELECT AVG(Incidentes) FROM Cubo WHERE Ano=‘2004’ AND Trimestre=3 AND Unidade=‘Georgetown’ ;

 Quantos Incidentes no Brasil no 3º trimestre de 2004? = 5 + 7 + 3 + 7 + 8 + 1 = 31


SELECT SUM(Incidentes) FROM Cubo WHERE Ano=‘2004’ AND Trimestre=3 AND País =‘Brasil’ ;

 Maior Ocorrência de Incidentes na África e na América em Mar/2004? MAX(2;5;8;9;3;3;1) = 9


SELECT MAX(Incidentes) FROM Cubo WHERE Ano=‘2004’ AND Mês=‘Mar’ ;
INTELIGÊNCIA DE NEGÓCIOS
OLAP – CONSTRUÇÃO, ATUALIZAÇÃO E UTILIZAÇÃO

Ciclo de Vida

 Desenho da Solução  Utilização

 Determinar necessidades de  Executar Extração, Transformação


informação e Carga dos Dados
(ETL – Extract, Transform, Load)
 Projetar
Sistema: Dimensões,
Fatos, Esquema  Exploração dos Dados

 Mapear Fontes de Dados e


Transformações
INTELIGÊNCIA DE NEGÓCIOS
OLAP – CONSTRUÇÃO, ATUALIZAÇÃO E UTILIZAÇÃO

ETL
Extract, Transform, Load

 Extrair:
obter dados das fontes
mapeadas

 Transformar: modificar dados


segundo padrões definidos
(taxonomia)

 Carregar: popular o Data Mart


no DW
INTELIGÊNCIA DE NEGÓCIOS
OLAP – ETL (MS INTEGRATION SERVICES)
INTELIGÊNCIA DE NEGÓCIOS
OLAP – CONSTRUÇÃO, ATUALIZAÇÃO E UTILIZAÇÃO

Exploração dos Dados

 Consultas ao Cubo  Relatórios

 Especificaçãode Dimensões,  Pré-definidos


ou Ad-hoc, podendo
Fatos e Escalas ser agendados e gerados
periodicamente
 Navegação:
 Drill Up: ir ao nível de agregação  Podem ser publicados em Portais,
superior numa dimensão, ex: de enviados por e-mail ou mesmo
mês para trimestre impressos
 Drill Down: ir ao nível de agregação
inferior numa dimensão, ex: de
Estado para cidade
INTELIGÊNCIA DE NEGÓCIOS
OLAP – ANÁLISE (MS EXCEL)
INTELIGÊNCIA DE NEGÓCIOS
OLAP – DASHBOARD (OPENI)
UNIP : SEMINÁRIO ESPECIAL DE INTELIGÊNCIA DE NEGÓCIOS
OLAP – PORTAL (MS SHAREPOINT)
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING = MINERAÇÃO DE DADOS

Definições

Processo de exploração de grandes Tecnologia que permite a exploração,


volumes de dados em busca de análise e visualização de dados de
informação oculta na forma de: bancos de dados muito grandes num
 Padrões consistentes alto grau de abstração, sem uma
 Regras de associação
hipótese específica em mente.
 Relacionamentos sistemáticos
entre variáveis Abstração => Estatística => Síntese

Parte do processo de KDD (Knowledge


Discovery in Databases): descoberta de
conhecimentos úteis previamente
desconhecidos
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING = MINERAÇÃO DE DADOS

Definições

Extração não-trivial de conhecimento


novo, implícito e acionável a partir de
grandes conjuntos de dados.

Às vezes, ela revela


conhecimento que já
deveríamos saber sobre
nosso negócio.
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING

Disciplinas Empregadas Técnicas

 Estatística Análise de Ligações


 Inteligência Artificial Regras de Associação, Padrões
Seqüenciais, Padrões Temporais
 Reconhecimento de Padrões
Modelagem Preditiva
 Algoritmos de Aprendizagem
Redes Neurais, Regressão, Árvores de
 Teoria da Informação Decisão
Segmentação de Banco de Dados
Agrupamento, k-means
Detecção de Desvios
Visualização, Estatítica
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING

Utilização de Algoritmos
(MS SQL Server 2008
Analysis Services)  Previsão de Seqüência
 Árvores de Decisão
 Previsão de Atributo Discreto  Análise de Seqüência
 Árvores de Decisão
 Naive-Bayes  Identific. de Grupos Comuns
 Clustering  Árvores de Decisão
 Rede Neural  Clustering

 Previsão de Atributo Discreto  Identif. de Grupos Semelhantes


 Árvoresde Decisão  Análise de Seqüência
 Regressão  Clustering
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING - EXEMPLOS DE ALGORITMOS

Árvores de Decisão

É um algoritmo de classificação e
regressão.Faz previsões baseadas nas
relações entre atributos num conjunto de
dados. O algoritmo usa alguns atributos
para prever um atributo tido como
previsível.
Por exemplo, em um cenário em que se
deseja prever a tendência dos clientes em
adquirir uma bicicleta, se 9 de 10 clientes
jovens comprarem uma bicicleta, mas
apenas 2 de 10 clientes mais velhos
fizerem o mesmo, o algoritmo infere que
idade é um bom indicador para a compra
de bicicletas.
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING - EXEMPLOS DE ALGORITMOS

Naive Bayes

É um algoritmo de classificação, que


calcula a probabilidade de cada atributo
em função de um atributo previsível.

Por exemplo: para reduzir custos, uma


loja deseja enviar folhetos promocionais
apenas aos clientes que provavelmente
irão responder, baseados em dados
demográficos e da resposta às
campanhas anteriores, mais
especificamente, se comprou o item
promocional ou não.
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING

Aplicações

Vendas e Marketing Gestão de Risco

 Hábitos do consumidor: vendas  Crédito ao consumidor: prevenção


cruzadas de fraudes
 Melhor serviço ao consumidor
 Otimização de Mala-Direta Retenção e Fidelização
 Sugestão de itens baseada em
semelhanças com outros  Identifica padrões de abandono de
consumidores clientes e prediz possíveis defecções
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING

Aplicações

Pesquisa Científica Outros

 Pesquisa médica: alimentos e  Investigações de Autoria de


longevidade Documentos: vocabulário de
pretensos autores

Criminalística  Investimentos: análises do mercado


(validade controversa)
 Investigações policiais: perfil
psicológico/região geográfica e
criminalidade
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING

Limitações e Requisitos

 Não é bola de cristal  Resultados descobertos devem ser


 Pressupõe amplo conhecimento do validados no mundo real – eliminar
negócio da empresa possibilidade de correlações estarem
 Pressupõe conhecimento de métodos associadas a relacionamento trivial
analíticos e estatística aplicada ignorado (ex: atributos quer variam da
mesma forma, como idade e data do
 Quando bem empregada, aponta
nascimento)
relacionamentos entre variáveis e
tendências sem necessariamente  Não elimina a necessidade de se

explicá-las trabalhar com bons analistas de


negócios e gerentes: ao contrário,
necessita muito deles
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING X OLAP

Semelhanças Diferenças

 Grande Volume de Dados  Análise OLAP pressupõe a relevância


 Uso massivo de poder computacional das dimensões nas análises – verifica
 Dados precisam ser preparados hipóteses
 Abstração, Síntese, Estatística  DM não necessita de hipóteses pré-
definidas: usa técnicas para descobrir
 São Instrumentos Complementares
padrões – descoberta do não-óbvio
 Análise OLAP fornece detalhamento
em níveis (drill up/down)
 DM necessita de interpretação e
busca de causas para ser
compreendido
INTELIGÊNCIA DE NEGÓCIOS
DATA MINING - EXEMPLOS

Wal-Mart nos EUA (mito?) Vestibular da PUC-RJ

Procurando estabelecer correlações entre Procurando correlações entre sexo,


produtos vendidos e dias da semana, emprego, nota e matrícula, descobriu que as
descobriu que as vendas de cerveja mulheres aprovadas no vestibular com notas
cresciam na mesma proporção que as de altas que tinham emprego geralmente não
fraldas. se matriculavam na universidade.

Explicação: pais, e não mães, costumam Explicação: mulheres em idade de prestar


comprar fraldas para os bebês; homens vestibular (jovens), se trabalham é porque
procuram minimizar as idas ao SM, precisam, e devem ter feito inscrição no
procurando ir sempre às sexta-feiras, dia vestibular de universidades públicas, que
em que precisam comprar cerveja para o são gratuitas; se tiveram notas altas, devem
fim-de-semana. ter passado também no vestibular da escola
pública, e deram preferência ao ensino
gratuito.
FATEC ITAPETININGA – V SEMANA DE TECNOLOGIA

Inteligência de Negócios

FIM

Prof. J. Octavio C. Pineda - op@sinapse.info

Você também pode gostar