Você está na página 1de 55

Sistemas de Apoio Deciso

(SAD) - Senado

DW OLAP BI

Ilka Kawashita
ikawashi@gmail.com

Material preparado :Prof. Marcio Vitorino


Sumrio

n OLAP
n Data Warehouse (DW/ETL)
n Modelagem Multidimensional
n Data Mining
n BI - Business Intelligence

Prof.: Ilka Kawashita


ikawashi@gmail.com
Introduo
n Aplicaes do negcio: constituem as aplicaes que
do suporte ao dia a dia do negcio da empresa, que
garantem a operao da empresa, tambm chamadas
de sistemas de produo;
n Aplicaes sobre o negcio: so as aplicaes que
analisam o negcio, ajudando a interpretar o que
ocorreu e a decidir sobre estratgias futuras para a
empresa - compreendem os Sistemas de Apoio
Deciso.
n Consultas tpicas de um SAD so:
q Listar a evoluo das vendas nos ltimos 10 anos;
q Listar o fornecedor que no teve mais do que 20% de atrasos
nas ltimas 100 entregas.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Evoluo do Ambiente de Data
Aplicao A

Warehouse
Aplicao B

Aplicao C

Aplicao D

Aplicao E

Prof.: Ilka Kawashita


Aplicao F
ikawashi@gmail.com
4
Aplicao A REL 1

Aplicao B REL 2

Aplicao C REL 3

Aplicao D REL 4

REL 5
Aplicao E

Prof.: Ilka Kawashita REL 6


Aplicao F
ikawashi@gmail.com
5
Aplicao A REL 1

Aplicao B REL 2

Aplicao C REL 3

Aplicao D REL 4

REL 5
Aplicao E

Prof.: Ilka Kawashita REL 6


Aplicao F
ikawashi@gmail.com
6
Aplicao A SAD 1

Aplicao B SAD 2

Aplicao C SAD 3

Aplicao D SAD 4

SAD 5
Aplicao E

Prof.: Ilka Kawashita


Aplicao F
ikawashi@gmail.com
7 SAD 6
Aplicao A SAD 1

Aplicao B SAD 2

Aplicao C SAD 3

Aplicao D SAD 4

SAD 5
Aplicao E

Prof.: Ilka Kawashita


Aplicao F
ikawashi@gmail.com
8 SAD 6
Aplicao A SAD 1

Aplicao B SAD 2

Aplicao C SAD 3

Aplicao D SAD 4

SAD 5
Aplicao E

Prof.: Ilka Kawashita


Aplicao F
ikawashi@gmail.com
9 SAD 6
Aplicao A SAD 1

Tecnologia de
Data
Aplicao B SAD 2
Warehousing

Aplicao C SAD 3

Aplicao D SAD 4

SAD 5
Aplicao E

Prof.: Ilka Kawashita


Aplicao F
ikawashi@gmail.com
10 SAD 6
Aplicao A

Aplicao B

Aplicao C

DW
Aplicao D

Aplicao E

Prof.: Ilka Kawashita


Aplicao F
ikawashi@gmail.com
11
DW

Conjunto de dados no voltil


Organizado por assuntos
Integrado

Varia com passar do tempo


Suporte para processo de tomada de
deciso da empresa

Prof.: Ilka Kawashita


ikawashi@gmail.com
DW - No Voltil

n Em um DW no existem alteraes de dados,


somente a carga inicial e as consultas
posteriores.

n Ele definido assim, pois as operaes a nvel


de registro em modo on-line como so os
sistemas transacionais, exigem um controle e
um processamento muito grande, fugindo do
objetivo principal do DW.

Prof.: Ilka Kawashita


ikawashi@gmail.com
DW - Organizados por Assuntos

DW armazena informaes sobre temas


especficos importantes para o negcio da
empresa, como:
Produtos,
Atividades,

Contas,

Clientes, etc.

Em contrapartida, o ambiente operacional


organizado por aplicaes funcionais.

Prof.: Ilka Kawashita


ikawashi@gmail.com
DW - Integrao
n Defini a representao nica para os dados
provenientes dos diversos sistemas que
formaro a base de dados do DW.
n A maior parte do trabalho na construo de um
DW est na anlise dos sistemas operacionais e
dos dados que eles contm. Como no existem
padres de codificao, cada analista pode
definir a mesma estrutura de dados de vrias
formas, fazendo com que dados que
representam a mesma informao sejam
representados de diversas maneiras dentro dos
sistemas utilizados pela empresa ao longo dos
anos.

Prof.: Ilka Kawashita


ikawashi@gmail.com
DW - Variao no Tempo

n Segundo W.H.Inmon:

Todos os dados no DW so precisos em


algum instante no tempo, como eles podem
estar corretos somente em um determinado
momento, dito que esses dados "variam
com o tempo".

Prof.: Ilka Kawashita


ikawashi@gmail.com
Aplicao A

DM
Aplicao B

Aplicao C

DW DM

Aplicao D

DM
Aplicao E

Prof.: Ilka Kawashita


Aplicao F
ikawashi@gmail.com
17
Data Mart

n Coleo de assuntos de uma rea


n Organizado para apoio deciso
n Necessidades de departamento/ setor

Prof.: Ilka Kawashita


ikawashi@gmail.com
Conceito de Data Warehouse

n Data Warehouse, pode ser definido como um banco de


dados especializado, o qual integra e gerencia o fluxo de
informaes a partir dos bancos de dados corporativos e
fontes de dados externas Organizao. Um DW oferece os
fundamentos e os recursos necessrios para um Sistema de
Apoio a Deciso (SAD) eficiente, fornecendo dados
integrados e histricos que servem desde alta direo,
que necessita de informaes mais resumidas, at as
gerncias de baixo nvel, onde os dados detalhados
ajudam a observar aspectos mais tticos da
Organizao.

Prof.: Ilka Kawashita


ikawashi@gmail.com
OLTP x OLAP
n A caracterstica simples mais distintiva dos aplicativos OLTP (On-line Transaction
Processing) que o banco de dados est sendo constantemente atualizado.
Como os dados esto mudando constantemente, o sistema no pode ajudar no
apoio a decises.
n De um ponto de vista prtico, OLAP (On-line Analytic Processing) sempre
envolve consultas interativas aos dados, seguindo um caminho de anlise
atravs de mltiplos passos, como, por exemplo, aprofundar-se sucessivamente
por nveis mais baixos de detalhe de um quesito de informao especfico. OLAP
envolve capacidades analticas, incluindo a derivao de taxas, varincias, etc., e
envolvendo medidas ou dados numricos atravs de muitas dimenses, devendo
suportar modelos para previses, anlises estatsticas e de tendncias.
Modelagem Multidimensional

Modelagem Dimensional

Modelagem Relacional

22
ETL (Extrao, Transformao e Carga (Load)
Projeto de um DW
n Kimball aponta um conjunto pontos fundamentais no projeto
da estrutura de DW (tipo estrela). So os seguintes os
chamados pontos de deciso, que constituem definies a
serem feitas e correspondem, de fato, a etapas do projeto:
q Os processos, e por conseqncia, a identidade das tabelas de fatos;
q A granularidade de cada tabela de fatos;
q As dimenses de cada tabela de fatos;
q Aos fatos, incluindo fatos pr-calculados;
q Os atributos das dimenses;
q Como acompanhar mudanas graduais em dimenses;
q As agregaes, minidimenses e outras decises de projeto fsico;
q Durao histrica do banco de dados;
q Urgncia com que se d a extrao e carga para o DW.

n Esta metodologia segue a linha top-down, pois comea


identificando os grandes processos da empresa.
Prof.: Ilka Kawashita
ikawashi@gmail.com
Estratgias de Implementao
n Estratgia Evolucionria
n Inmon:
q Histrico de sucesso das aplicaes;
q Usurio final no ter condies de expressar
suas necessidades com clareza antes da primeira
interao;
q A gerncia no se comprometer antes da
primeira interao;
q H necessidade de, rapidamente, obter
resultados visveis.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Desenvolvimento de DW - Inmon

Prof.: Ilka Kawashita


ikawashi@gmail.com
Estratgias de Implementao

Figura 1
Metodologia de design de DW do Kimball

Figura 2
Metodologia de design de DW do Inmon

Prof.: Ilka Kawashita


ikawashi@gmail.com
Estratgias de Implementao

INMON KIMBALL
Avalia o que o ambiente Orientada s necessidades
operativo tem a oferecer do usurio final

Fcil mapeamento Mapeamento lento


(Identificar fontes)

Limitao de viso Viso mais ampla

Prof.: Ilka Kawashita


ikawashi@gmail.com
Povoando um DW

n Filtragem,Transformao e Integrao dos


Dados Extrados
q Conflitos Semnticos e Estruturais:
n Diferenas de unidades;
n Diferenas de preciso;
n Diferenas em cdigo ou expresses;
n Diferenas de granularidade;
n Diferenas de abstrao.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Modelagem Dimensional (DW)

n Modelo Estrela
GEOGRAFIA
Cod_geografia integer PRODUTO
Nome varchar(10) Cod_produto integer
Populao integer
Estado char(2) Nome varchar(10)
Regio char(2)
VENDAS
Categoria char(4)
Familia char(4)
Cod_produto integer
Cod_tempo integer
Cod_geografia integer
Cod_canal integer
TEMPO
Cod_tempo integer Quantidade decimal(16,0)
Faturamento decimal(16,2) CANAL
Dia integer
Ms integer Cod_canal integer
Ano integer
Dia_semana char(3) Tipo varchar(10)

Prof.: Ilka Kawashita


ikawashi@gmail.com
Modelagem Dimensional (DW)
n Modelo Estrela (Star): No centro do modelo estrela,
encontra-se uma tabela fato que contm somente as chaves
e dados (valores) atmicos. A tabela fato geralmente
muito grande e pode ter milhes de linhas.
n Em volta da tabela fato encontram-se uma srie de tabelas
dimenso que servem para dar sentido informao base
da tabela fato. Algumas tabelas dimenso contm dados
que podem ser adicionados s consultas com JOINS,
enquanto outras dimenses como Regio no contm
dados, e servem somente para indexar dados.
n O princpio bsico do modelo estrela a introduo de
redundncia de dados para melhorar desempenho.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Modelagem Dimensional (DW)
n Modelo Flocos de Neve (Snowflake):
q Incorpora tabelas dimensionais principais, que tm uma

conexo lgica direta em fact tables atravs de suas chaves


primrias, e tabelas menores como 'extenses', que so
usadas para armazenar descries e decodificao para
chaves e cdigos nas tabelas maiores.
q As tabelas dimensionais principais parecem tabelas

dimensionais em estrela, exceto pelo fato das colunas atributo


conterem chaves para as tabelas extenses em lugar de
descries de texto. As tabelas 'extenses' so conectadas
com a tabela dimensional principal (ou com outras tabelas
'extenses') atravs de suas chaves primrias, e contm texto
decodificado e descries de valores chave ou codificados,
armazenados na tabela dimensional principal.
Prof.: Ilka Kawashita
ikawashi@gmail.com
Embora aceitvel, a normalizao de dimenses no recomendvel por
razes de desempenho e facilidade de uso:
A quantidade de tabelas torna a apresentao do modelo mais complexa.
Otimizadores do SGBD tm mais dificuldade com esquema complexo.
A economia de espao em disco insignificante em relao ao DW
completo.
Diminui a habilidade de usurios de navegar na dimenso.
Modelagem Multidimensional
n Tabela de Fatos
q Tabela central do projeto dimensional. Armazena
medies numricas do negcio.
q Possui chaves de mltiplas partes.
q Cada chave uma chave externa para uma
tabela de dimenso.
q Cada uma das medies obtida na interseo
de todas as dimenses.
q Em consultas a tabela de fatos so usados
centenas, milhares ou at milhes de registros
para a construo da resposta.
Prof.: Ilka Kawashita
ikawashi@gmail.com
Modelagem Multidimensional

n Dimenso:
n Representao dos contextos relevantes
para a anlise de um fato.
q Exemplo:
n Fato: Vendas.
n Dimenses: Clientes, Produtos, Tempo, Locais, ...
n Uma dimenso pode
q conter membros;
q ser organizada em hierarquias.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Modelagem Multidimensional
n Membros:
q Exemplos:
n dimenso Tempo:
q dia, semana, horrio.

n dimenso Locais:
q bairro, cidade, estado.

Hierarquias:

I) TEMPO II) GEOGRAFIA

ANO REGIAO

TRIMESTRE ESTADO

MES

DIA
Agregados
n Normalmente, a modelagem dimensional
utilizando o esquema estrela apenas representa
os fatos no nvel de granularidade mais baixa
(a partir do qual possvel gerar as
combinaes ou diferentes perspectivas de
anlise).
n No entanto, torna-se evidente a vantagem (por
razes de desempenho) de pr-calcular e
armazenar fatos sumrio, contendo agregaes
segundo diferentes combinaes de dimenses.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Agregados

Produto Tempo Geografia


Consultas
Marca Ano Pas Vendas por
Produto,
Categoria Ano e
Trimestre Regio
Regio

Produto Ms Estado
Prof.: Ilka Kawashita
ikawashi@gmail.com
Agregados

Categoria
Venda
s Regio
Trimestre
XPTO

XPTA

XPTN Regio
Marca

Ano
Prof.: Ilka Kawashita
ikawashi@gmail.com
Agregados

Tempo de
Resposta

BD3
BD4
BD2
BD1

BD1

BD2

BD3

BD4
Prof.: Ilka Kawashita
ikawashi@gmail.com
Agregados

n Fatores:
q Custo de Criao;
q Custo de Manuteno;
q Frequncia de Manuteno;
q Frequncia de Utilizao;
q Tempo de Gerao.
n Nem sempre vivel armazenar todos os
agregados.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Modelo Dimensional
n Visualizao:
q Uma viso multidimensional usualmente representada por um cubo.
Adequado visualizao de at 3 dimenses.
q Anlise tridimensional bastante utilizada.
q Hipercubo: cubo com mais de 3 dimenses.
Modelo Dimensional

Prof.: Ilka Kawashita


ikawashi@gmail.com
Modelo Dimensional
n Funcionalidades:
q Roll-up (agregao): os dados so resumidos com generalizao
crescente (dia, ms, ano).
q Drill-down (desmembramento): nveis crescentes de detalhes
so revelados (ano, ms, dia).
q Drill Across: ocorre quando o usurio pula um nvel intermedirio
dentro de uma mesma dimenso. Por exemplo: a dimenso
tempo composta por ano, semestre, trimestre, ms e dia. O
usurio estar executando um Drill Across quando ele passar de
ano direto para trimestre ou ms.
q Drill Throught: ocorre quando o usurio passa de uma
informao contida em uma dimenso para uma outra. Por
exemplo: Estou na dimenso de tempo e no prximo passo
comeo a analisar a informao por regio.
q Pivot (pivoteamento): rotao do cubo (hipercubo).
q Slice-and-Dice(fatiar e cortar em cubos): realizar a operao de
projeo nas dimenses.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Roll-up
Drill-down

46
Pivot

47
Slice-and-Dice
Banco de Dados Multidimensional

n Originalmente, o conceito de banco de dados


multidimensional surgiu no MIT ligado a pesquisas em
econometria. Um banco de dados multidimensional ao invs
de armazenar os dados como registros em tabelas,
armazena os dados em arrays multidimensionais.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Banco de Dados Multidimensional

MOLAP

ROLAP

Prof.: Ilka Kawashita


ikawashi@gmail.com
Data Mining
n As ferramentas de Minerao de Dados, so especializadas em procurar
padres nos dados. Essa busca pode ser efetuada automaticamente pelo
sistema ou interativamente com um analista, responsvel pela gerao de
hipteses.
n Diversas ferramentas distintas, como redes neurais, induo de rvores de
deciso, sistemas baseados em regras e programas estatsticos, tanto
isoladamente quanto em combinao, podem ser ento aplicadas ao
problema.
n Em geral, o processo de busca interativo, de forma que os analistas
revem o resultado, formulam um novo conjunto de questes para refinar a
busca em um dado aspecto das descobertas, e realimentam o sistema com
novos parmetros.
n Ao final do processo, o sistema de Minerao de Dados gera um relatrio
das descobertas, que passa ento a ser interpretado pelos analistas de
minerao.
n Somente aps a interpretao das informaes obtidas encontramos
concluses ou regras, este processo conhecido por Knowledge Discovery
in Database (KDD) ou descoberta de conhecimento em banco de dados.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Data Mining
n Objetivos:
q Explanatrio: explicar algum evento ou medida
observada, tal como porque a venda de sorvetes caiu no
Rio de Janeiro;
q Confirmatrio: confirmar uma hiptese. Uma companhia
de seguros , por exemplo, pode querer examinar os
registros de seus clientes para determinar se famlias de
duas rendas tem mais probabilidade de adquirir um plano
de sade do que famlias de uma renda;
q Exploratrio: analisar os dados buscando relacionamento
novos e no previstos. Uma companhia de carto de
crdito pode analisar seus registros histricos para
determinar que fatores esto associados a pessoas que
representam risco para crditos.
Prof.: Ilka Kawashita
ikawashi@gmail.com
Business Intelligence (BI)

n O termo BI surgiu na dcada de 80, cunhado pelo


Gartner Group, e tem como principais caractersticas:
q Extrair e integrar dados de mltiplas fontes ;
q Fazer uso da experincia ;
q Analisar dados contextualizados ;
q Trabalhar com hipteses;
q Procurar relaes de causa e efeito;
q Transformar os registros obtidos em informao til para o
conhecimento empresarial.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Business Intelligence (BI)
n Business Intelligence o processo de analisar informaes brutas
acumuladas da empresa e a partir delas obter insights valiosos.
n Business Intelligence permite que os responsveis pelas decises
tenham as informaes certas, na hora certa e no lugar certo,
capacitando-os a tomar melhores decises corporativas.
n As aplicaes de BI incluem:
q Sistemas de suporte deciso;
q Consultas e relatrios (padronizadas e ad-hoc);
q Anlises OLAP (On-Line Analytical Processing);
q Anlises estatsticas;
q Previses;
q Data Mining.

Prof.: Ilka Kawashita


ikawashi@gmail.com
Business Intelligence (BI)

Prof.: Ilka Kawashita


ikawashi@gmail.com