Você está na página 1de 33

26/10/2013

Banco de dados
Suporte a deciso Business Intelligence
Este curso lida com um conjunto de tecnologias que
do suporte as decises gerenciais por meio do
informaes internas e externas s organizaes.
Essas tecnologias tem um profundo impacto na
estratgia corporativa, na performance e na
competitividade. Esse conjunto de tecnologias so
coletivamente conhecidas como

Curso Preparatrio - ITnerante


Prof. Thiago Cavalcanti

BUSINESS INTELLIGENCE

Ementa

Ementa

Mdulo 01 Solues de suporte deciso:

Mdulo 02 Solues de suporte deciso:

Inteligncia de negcios
Business inteligence (BI)

Data Warehouses e Data Marts.


Processo de Data Warehousing.
Modelagem multidimensional.
Extrao, transformao e carga (ETL).

Recuperao e visualizao de dados


OLAP
Painis e dashboards
Data Mining

ERP
Qualidade de dados.
Gesto de contedo (ECM).

Prof. Thiago Cavalcanti

Ementa - Entendendo os mdulos

Prof. Thiago Cavalcanti

Tire suas dvidas


rcthiago@gmail.com
www.itnerante.com.br
Lista: timasters@yahoogroups.com.br

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

26/10/2013

Definio: Howard Dresner

BUSINESS INTELLIGENCE

Um conjunto de conceitos,
mtodos e recursos
tecnolgicos que habilitam a
obteno e distribuio de
informaes geradas a partir
de dados operacionais,
histricos e externos, visando
proporcionar subsdios para a
tomada de decises
gerenciais e estratgicas.
Gartner Group, 1989

Prof. Thiago Cavalcanti

Motivao

Prof. Thiago Cavalcanti

Informao

Operacional x Analtico
Diferentes necessidades, estruturas e clientes

Objetivos fundamentais de BI/DW (Kimball)


Fazer a informao acessvel mais facilmente
Apresentar a informao consistente (credibilidade)
Adaptado a mudanas
Apresentar a informao de forma temporal
Um bastio de segurana que protege os ativos de
informao
Servir como base de autoridade e de confiana para uma
melhor tomada de deciso
Ser aceito pela comunidade organizacional para considerar
bem-sucedido

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Conceitos (Efrain Turban)

Objetivos fundamentais de BI

Business Intelligence (BI) um termo abrangente


que combina arquiteturas, ferramentas, bancos
de dados, ferramentas de anlise, aplicaes e
metodologias
Principais objetivo do Bl

Acesso a dados confiveis


Aumento da transparncia e compreenso do
negcio
Suporte para a tomada de deciso

Permitir o acesso interativo (por vezes em tempo real)


aos dados
Permitir a manipulao de dados
Dar aos gestores e analistas a capacidade de realizar
anlise adequada

baseado na transformao dos dados em


informao, em seguida, informaes em
decises e, finalmente, em aes
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

26/10/2013

Conceito

Questo 01 STN 2013 - ESAF

BI representa a habilidade de
se estruturar, acessar e explorar
informaes, normalmente
guardadas em um DW/DM
(Data Warehouse/Data Mart),
com o objetivo de desenvolver
percepes, entendimentos,
conhecimento, os quais podem
produzir um melhor processo
de tomada de deciso.
Carlos Barbieri

Q. 28- O processo de Business Intelligence (BI) baseia-se


em:
(a) transformao de dados em informaes, depois em
conhecimento e finalmente em decises.
(b) obteno de dados a partir de informaes,
transformao em decises e finalmente transformao
em produtos.
(c) transformao de dados em relaes, depois em
interfaces e finalmente em aes.
(d) tomada de decises, gerao de informaes e
avaliao da relevncia dos dados.
(e) transformao de dados em informaes, depois em
decises e finalmente em aes.

Prof. Thiago Cavalcanti

Componentes de Sistemas de BI

Prof. Thiago Cavalcanti

Data Warehouse
O armazm de dados e suas variantes so a
pedra fundamental (pedra angular) de qualquer
sistema de BI de mdio a grande porte
Originalmente, incluiu apenas dados histricos
que foram organizados e resumidos, para que os
usurios finais pudessem facilmente ver ou
manipular dados e informaes
Hoje, incluem tambm dados atuais para que eles
possam fornecer apoio deciso em tempo real

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Business Analytics (Anlise de negcios)

Business Performance Management (BPM)

Os usurios finais podem trabalhar com os dados e informaes em


um armazm de dados usando uma variedade de ferramentas e
tcnicas
Estas se enquadram em duas categorias principais:

Uma carteira emergente de aplicativos e metodologias que


contm evoluo da arquitetura e ferramentas de BI em
seu ncleo

1.

2.

Relatrios e consultas
Anlise de negcios incluem relatrios estticos e dinmicos, todos
os tipos de consultas, a descoberta de informaes, viso
multidimensional, drill down, ...
Esses relatrios tambm esto relacionados com BPM (introduzido
no prximo slide)
Dados, texto e minerao Web e outras ferramentas matemticas e
estatsticas sofisticadas
A minerao de dados um processo de busca de relaes
desconhecidas ou informaes em grandes bases de dados ou
armazns de dados, utilizando ferramentas inteligentes como a
computao neural, tcnicas de anlise preditiva, ou mtodos
estatsticos avanados

Prof. Thiago Cavalcanti

BPM amplia o monitoramento, medio e comparao das


vendas, lucro, custos, rentabilidade e outros indicadores de
desempenho, introduzindo o conceito de gesto e feedback
Abrange processos tais como planejamento e previso de
princpios fundamentais de uma estratgia de negcios
Em contraste com as tradicionais DSS, EIS, e BI, que suportam a
extrao bottom-up de informao a partir dos dados, BPM
proporciona uma aplicao top-down da estratgia corporativa

Normalmente combinada com a metodologia Balanced


Scorecard (BSC) e dashboards
Tambm conhecido como gerenciamento de desempenho
corporativo (CPM - Corporate)
Prof. Thiago Cavalcanti

26/10/2013

A interface com o usurio

A interface com o usurio

Dashboards (painis) fornecem uma viso


abrangente e visual das medidas de desempenho
corporativo (tambm conhecido como
indicadores chave de desempenho - KPI),
tendncias e excees
Integram informaes de vrias reas de negcio
Apresentam grficos que mostram o
desempenho real em comparao com as
mtricas desejadas, assim, um painel apresenta
uma viso geral da sade da organizao

Alm dos painis, outras ferramentas que transmitem


informaes so portais corporativos, cockpits digitais
e outras ferramentas de visualizao
Muitas ferramentas de visualizao, que vo desde
apresentao do cubo multidimensional a realidade
virtual, so parte integrante dos sistemas de BI
BI surgiu de EIS, portanto recursos visuais para os
executivos foram transformados em software de BI.
Tecnologias como sistemas de informaes geogrficas
(SIG) desempenham um papel crescente no apoio
deciso

Prof. Thiago Cavalcanti

Questo 02 - STN 2013 - ESAF


29- So componentes do Business Intelligence (BI):
(a) Data warehouse (DW). Anlise de estratgias. Ferramentas para
manipular e analisar os dados. Business Performance Control (BPC).
(b) Data mining (DM). Anlise de negcios. Scorecards para manipular
e analisar os dados. Business Performance Management (BPM).
(c) Data warehouse (DW). Anlise de negcios. Ferramentas para
manipular e analisar os dados. Business Performance
Management (BPM).
(d) Data warehouse (DW). Avaliao estratgica e ttica de negcios.
Ferramentas para manipular e analisar os dados.Business Corporate
Management (BCM).
(e) Data storeware (DSW). Anlise de negcios. Scorecards para
manipular e analisar os dados. Business Performance
Management (BPM).

Prof. Thiago Cavalcanti

Ferramentas computadorizadas para SAD


Data management
Reporting status
tracking
Visualization

Strategy and
performance
management

Database and database menagement system (DBMS)


Extraction, transformation and load (ETL)
Data warehouse (DW), real time DW and Data mart
Online analytical preocessing (OLAP)
Geographical information system (GIS)
Dashboards
Apresentaes Multidimensionais
Business performance management (BPM)
Corporate peformance management (CPM)
Dashboards e scorecards

Business analytics

Data mining
Web mining and text mining
Web analytics

Social networking

Web 2.0

New tools for massive


data mining

Prof. Thiago Cavalcanti

Fornecedores

Grandes empresas de software adquirir outros para construir um portflio


completo de ofertas.
A SAP adquiriu a Business Objects, a IBM adquiriu a Cognos em 2008 e SPSS
em 2009, a Oracle adquiriu a Hyperion.
Novas empresas esto surgindo agora no texto, Web, e anlise de dados.
Alm disso, as empresas esto colaborando umas com as outras empresas
para a construo de parcerias. Por exemplo, SAS e Teradata firmaram um
parceria para oferecer armazenamento de dados e capacidades analticas de
previso em conjunto.

Prof. Thiago Cavalcanti

Questo 03 - FCC - SEFAZ-SP - Agente Fiscal de


Rendas - Tecnologia da Informao 2009 Prova 3

A rea de BI - Business Intelligence est


diretamente envolvida com os projetos de
implementao das aplicaes de
(a) B2B, B2C e BSC.
(b) EAI, B2B e B2C.
(c) EAI, CRM e ERP.
(d) CI, KMS e BSC.
(e) CRM, PRM e ERP.

Reality Mining

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

26/10/2013

BI2  Barbieri  ndice :O

Gerncia de Conhecimento (KMS)


Objetiva estabelecer uma aproximao
integrada e colaborativa para capturar, criar,
organizar e usar todos os ativos de informao
de uma empresa.
Enquanto Business Intelligence (BI) mais
compartimentada, objetiva e focada em
estruturas definidas, a KMS trabalha o ativo
de informaes, independentemente da sua
forma, estrutura e domnio.

Prof. Thiago Cavalcanti

Viso geral de um KMS

Prof. Thiago Cavalcanti

Inteligncia Competitiva
Os sistemas de inteligncia competitiva:
Tm por objetivo prover as organizaes de um
processo sistemtico de coleta e anlise de
informaes sobre as atividades correlatas e
tendncias de mercado.
Visam absorver o maior nmero de informaes
que possibilitem melhoria no processo de tomada
de deciso e de desenvolvimento empresarial.
Romani et al

Prof. Thiago Cavalcanti

Conceito de Inteligncia Competitiva

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Atividades de um processo de CI

Prof. Thiago Cavalcanti

26/10/2013

ERM Enterprise Relationship Management

Balanced Scorecard (BSC)


Balanced Scorecard ou
mtodo de avaliao de
desempenho
empresarial foi criado por
Robert Kaplan e David
Norton nos anos 90.
Uma vez definida a
estratgia corporativa, o
BSC a traduz em objetivos,
indicadores, metas e planos
de ao, constituindo a
base de um processo de
monitoramento e
gerenciamento.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

BSC Viso geral

Data Warehouse

Prof. Thiago Cavalcanti

Conceito de Data Warehouse


Inmon: uma coleo de dados orientados por
assunto, integrados, variveis com o tempo e no
volteis, para dar suporte ao processo de tomada de
deciso
Kimball: um conjunto de ferramentas e tcnicas de
projeto, que quando aplicadas s necessidades
especficas dos usurios e aos bancos de dados
especficos permitir que planejem e construam um
Data Warehouse
Laudon&Laudon: Banco de dados, com ferramentas de
consulta e relatrio, que armazena dados atuais e
histricos extrados de vrios sistemas operacionais e
consolidados para fins de analises e relatrios
administrativos
Prof. Thiago Cavalcanti

Caractersticas de um DW

Orientao
por Assunto

Integrao

Variao no
Tempo

No
Volatilidade

Granularidade

Credibilidade
dos dados

Prof. Thiago Cavalcanti

26/10/2013

Orientado por assunto

Orientado por assunto

Refere-se ao fato do Data Warehouse


armazenar informaes sobre temas
especficos importantes para o negcio da
empresa
Exemplos tpicos de temas so: produtos,
atividades, contas, clientes

Em contrapartida, o ambiente operacional


organizado por aplicaes funcionais
Por exemplo, em uma organizao bancria, estas
aplicaes incluem emprstimos, investimentos e
seguros
Prof. Thiago Cavalcanti

Integrado

Prof. Thiago Cavalcanti

Integrado

Refere-se consistncia de nomes, das unidades, das


variveis, ... no sentido de que os dados foram
transformados at um estado uniforme
Por exemplo, considere-se sexo como um elemento de
dado. Uma aplicao pode codificar sexo como M/F,
outra como 1/0 e uma terceira como H/M

Conforme os dados so inseridos para o Data


Warehouse, eles so convertidos para um mesmo
padro
Sexo codificado apenas de uma forma
Da mesma maneira, se um elemento de dado medido
em centmetros em uma aplicao, em polegadas em
outra, ele ser convertido para uma representao
nica ao ser colocado no Data Warehouse

Prof. Thiago Cavalcanti

No voltil

Prof. Thiago Cavalcanti

No voltil

Significa que o Data Warehouse permite apenas a


carga inicial dos dados e consultas a estes dados
Aps serem integrados e transformados, os dados so
carregados em bloco para o Data Warehouse, para
que estejam disponveis aos usurios para acesso
No ambiente operacional, ao contrrio, os dados so,
em geral, atualizados registro a registro, em mltiplas
transaes
Esta volatilidade requer um trabalho considervel para
assegurar integridade e consistncia atravs de atividades
de rollback, recuperao de falhas, commits e bloqueios

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

26/10/2013

Variante no tempo

Variante no tempo

Refere-se ao fato do dado em um Data Warehouse referir-se a


algum momento especfico, significando que ele no atualizvel
Enquanto que o dado de produo atualizado de acordo com
mudanas de estado do objeto em questo, refletindo, em geral, o
estado do objeto no momento do acesso
Em um Data Warehouse, a cada ocorrncia de uma mudana, uma
nova entrada criada, para marcar esta mudana
O tratamento de sries temporais apresenta caractersticas
especficas, que adicionam complexidade ao ambiente do Data
Warehouse
Deve-se considerar que no apenas os dados tm uma
caracterstica temporal, mas tambm os metadados, que incluem
definies dos itens de dados, rotinas de validao, algoritmos de
derivao, etc.
Sem a manuteno do histrico dos metadados, as mudanas das
regras de negcio que afetam os dados no Data Warehouse so
perdidas, invalidando dados histricos

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Granularidade

Requisitos bsicos para um Data Warehousing

A granularidade de dados refere-se ao


nvel de sumarizao dos elementos e de
detalhe disponveis nos dados,
considerado o mais importante aspecto
do projeto de um Data Warehouse.
Um nvel de granularidade muito alto:

DW: Organizados em assuntos


DW: capacidade de integrao
DW: deve ser flexvel o suficiente para
atender s exigncias de mudana
rapidamente.
Dados: considerados no voltil e deve ser
carregado em massa.
Dados: existem em vrios nveis de
granularidade.

O espao em disco e o nmero de ndices


necessrios se tornam bem menores,
H, porm, uma diminuio da possibilidade
de utilizao dos dados para atender a
consultas detalhadas
Prof. Thiago Cavalcanti

Questo 04 - ESAF - 2010 - MPOG - Analista de PO


Tecnologia da Informao - Prova 2
Um ambiente Datawarehouse:
(a) uma coleo de dados volteis, invariantes em termos
locais, integrados e orientados a um assunto, direcionados a
decises operacionais.
(b) ao ser projetado segundo a abordagem bottom-up,
fundamenta-se nas necessidades de informao de todos os
nveis gerenciais da empresa.
(c) para ser implementado, requer a remoo de metadados e
a integrao de dados existentes em um banco de dados.
(d) ao ser projetado, segundo a abordagem top-down, no
comporta necessidades de informaes gerenciais.
(e) uma coleo de dados no-volteis, invariantes em
termos temporais, integrados e orientados a um assunto,
utilizados no suporte a decises gerenciais.
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Tipos de DW
A indstria atualmente
reconhece pelo menos
trs tipos diferentes de
Data Warehouses:
Data Mart
Data Warehouse
Empresarial (EDW)
Armazenamento de
Dados Operacionais
(ODS)

Data mart

EDW

ODS

Staging area

BD Operacional

Prof. Thiago Cavalcanti

26/10/2013

Data Mart

Data Mart (Segundo date)

Tem um pblico mais focado e normalmente


consiste em um subconjunto do EDW

Um Data Mart especializado e voltil

O subconjunto pode ser definida pela rea


geogrfica (por exemplo, apenas os dados da
Alemanha), a linha de produtos (por exemplo,
apenas produtos para o cabelo), ou rea funcional
(por exemplo, de produo)

Dependente ou independente

Especializado: possui uma estrutura baseada em


um ambiente, tema, situao, rea, setor ou
aplicao especfica
Enquanto o EDW se baseia em vrias fontes de diversas
aplicaes, fontes e situaes para facilitar um suporte
a deciso gerencial.

Voltil: dados so alterados frequentemente


Enquanto os do DW, por guardarem histrico, s so
alterados quando uma carga foi feita de forma errada,
mas no frequentemente como em um data mart (que
baseado em aplicaes)

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Armazenamento de dados operacionais (ODS)

EDW Enterprise Data Warehouse

O armazenamento de dados operacionais se


concentra em um prazo mais curto para a
anlise e para o subconjunto definido por
tempo

um DW de larga escala usado pela


organizao como um todo
Congrega informaes de diversas fontes de
dados

Por exemplo, apenas os dados desta semana

Um ODS consolida dados de vrios sistemas


de origem e fornece uma viso quase em
tempo real e voltil dos dados atuais.

CRM
KMS

SCM

EDW
PLM

BPM
BAM

Prof. Thiago Cavalcanti

Processo de Data Warehousing

Prof. Thiago Cavalcanti

Principais componentes
As fontes de dados (Data sources)
Extrao e transformao de dados (Data
extraction and transformation)
Carga de dados (Data loading)
Banco de dados abrangente (Comprehensive
database)
Metadados (Metadata)
Ferramentas de middleware (Middleware
tools)

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

26/10/2013

Questo 05 - ESAF - 2012 - Receita Federal - Analista


Tributrio da RF - Prova 2 - rea Informtica

Componentes da arquitetura da MicroStrategy

So componentes principais de um processo de data warehousing:


(a) Fontes de dados. Extrao de dados. Carregamento de dados.
Banco de dados abrangente. Metadados. Ferramentas de middleware.
(b) Fontes de usurios. Extrao de relaes. Carregamento de dados.
Banco de dados focalizado. Metadados. Ferramentas de upperware.
(c) Fontes de dados. Extrao de dados. Monitoramento de dados.
Banco de dados abrangente. Mtodos de dados. Usurios
demiddleware.
(d) Fontes de dados homogneos. Manipulao de dados.
Carregamento de programas. Banco de dados equivalente. Polidados.
Ferramentas de middleware.
(e) Fontes de dados. Transformao de dados. Carregamento de sites
de dados. Banco de dados abrangente. Meta-relaes. Ferramentas
de middlehousing.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Questo 06 - ESAF - 2013 - MF - Analista de Finanas


e Controle - Gesto em Infraestrutura de TI

Arquitetura de DW - Turban

A arquitetura de data warehouse de trs camadas contm as seguintes camadas:


(a) Primeira camada: sistema operacional com os dados e o software para aquisio.
Segunda camada: especificao de dados.
Terceira camada: servidor de monitoramento e cliente.
(b) Primeira camada: sistema aplicativo.
Segunda camada: data warehouse.
Terceira camada: clientes preferenciais.
(c) Primeira camada: sistema operacional com arquiteturas diferenciadas.
Segunda camada: data center.
Terceira camada: servidor de aplicao e cliente.
(d) Primeira camada: sistema operacional com os dados e o software para aquisio.
Segunda camada: data warehouse.
Terceira camada: servidor de aplicao e cliente.
(e) Primeira camada: sistema aplicativo com os dados e o software para aquisio.
Segunda camada: data warehouse.
Terceira camada: relatrios e telas de operao.
Arquitetura bsica de DW

Prof. Thiago Cavalcanti

Arquitetura de DW/BI do Kimball

Prof. Thiago Cavalcanti

Arquitetura de DW/BI do Kimball

H quatro componentes separados e distintos


a serem considerados no ambiente de DW/BI:
Sistemas operacionais de origem
Sistema de ETL
rea de apresentao de dados
Aplicaes de business intelligence

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

10

26/10/2013

Fontes de dados operacionais

Sistemas de ETL

Capturam as transaes do negcio


Esto do lado de fora do armazm de dados (DW)

Sistema ETL do ambiente de DW / BI consiste

Prioridades: o desempenho e a disponibilidade

Pouco ou nenhum controle sobre o contedo e o formato dos dados


Consultas pequenas, registro a registro
Parte do fluxo de transao normal e severamente restringidos em suas
demandas sobre o sistema operacional
No so consultados nas formas amplas e inesperadas que os sistemas de
DW/BI

Mantm poucos dados histricos

So aplicaes de propsito especfico, sem qualquer compromisso com o


compartilhamento de dados comuns

Um bom DW pode aliviar os sistemas de origem de grande parte da


responsabilidade de representar o passado.

Ex: produto, cliente, geografia ou calendrio com outros sistemas operacionais


da organizao
Um sistema amplamente adotado entre aplicativos Enterprise Resource
Planning (ERP) ou sistema de gerenciamento de dados mestre operacional
poderiam ajudar a resolver essas deficincias

De uma rea de trabalho


Da instanciao das estruturas de dados
De um conjunto de processos

O sistema de ETL tudo que existe entre os sistemas


operacionais de origem e rea de apresentao do
DW/BI
Extrao
o primeiro passo no processo de obteno de dados
para o ambiente de DW
Significa ler e entender os dados de origem e copiar os
dados necessrios para o sistema de ETL para posterior
manipulao
Neste ponto , os dados pertence ao DW

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Sistemas de ETL

Sistemas de ETL

Transformao

Carga

Limpeza dos dados

Corrige erros de ortografia


Resolve de conflitos de domnio
Lida com elementos faltante ou anlise em formatos padro
Combina dados de vrias fontes
Trabalha a de-duplicao de dados

O sistema de ETL agrega valor aos dados com esta limpeza


e conformidade as tarefas, alterando os dados e
melhorando a qualidade
Alm disso, essas atividades podem ser desenvolvidas para
criar metadados de diagnstico , acabam levando a
reengenharia de processos visando melhorar a qualidade
dos dados nos sistemas de origem ao longo do tempo
Prof. Thiago Cavalcanti

A etapa final do processo de ETL: a estruturao fsica


e carregamento de dados em modelos
multidimensionais
A principal misso do sistema de ETL entregar as
tabelas de dimenso e de fatos na etapa de entrega,
esses subsistemas so crticos
Quando as tabelas dimenso e o fato em um modelo
dimensional foram atualizadas, indexadas, fornecidas
com agregados adequados, e ainda qualidade
assegurada, a comunidade empresarial notificada
de que os novos dados foram publicados

Prof. Thiago Cavalcanti

rea de apresentao de dados

Aplicaes de business intelligence

Dados do sistema DW/BI deve ser

O ltimo componente principal da arquitetura


de DW/BI do Kimball
Refere-se gama de recursos fornecidos para
usurios de negcios para alavancar a rea de
apresentao para a tomada de deciso
analtica
Por definio, todas as aplicaes de BI que
consultam os dados esto na rea de
apresentao do DW/BI

Dimensionais
Atmicos (complementado por melhoram o
desempenho de agregados)
Centrados no processos de negcios
Aderentes arquitetura de barramento Enterprise
Data Warehouse (EDW)

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

11

26/10/2013

Arquiteturas alternativas de DW/BI

Arquiteturas alternativas de DW/BI

Independent Data Mart Architecture

Hub-and-Spoke Corporate Information Factory


Inmon Architecture

Prof. Thiago Cavalcanti

Arquiteturas alternativas de DW/BI


Hybrid Hub-and-Spoke and Kimball
Architecture

Prof. Thiago Cavalcanti

Alternativas de Arquiteturas
12%

Kimball (26%)

Inmon (39%)

17%

4%

Prof. Thiago Cavalcanti

Elementos bsicos do DW

Prof. Thiago Cavalcanti

Questo 07 - CESGRANRIO - 2010 - ELETROBRS Analista de Sistemas - FUNCIONAL SAP-ERP


Numa grande multinacional, os dados relativos aos sistemas
transacionais so lidos, transformados e carregados para posterior
apresentao sob a forma dimensional. O departamento de TI
reservou uma rea de armazenamento especfica s informaes lidas
e transformadas, denominada staging area. A respeito dessa rea de
dados, afirma-se que
(a) a staging area armazena os dados exatamente como esto
representados no sistema transacional.
(b) as tabelas da staging area no devem sofrer modificaes
estruturais ao serem carregadas para a presentation area.
(c) os dados a contidos esto prontos para serem inquiridos para
gerao de consultas e relatrios gerenciais.
(d) os dados, na staging area, podem ser armazenados tanto de forma
normalizada como na forma de arquivos flat.
(e) cada tabela existente na staging area equivale a uma tabela
normalizada na presentation area.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

12

26/10/2013

Operational Data Storage (ODS)

Staging Area

Ou Staging Area (SA) representa um


armazenamento intermedirio dos dados,
promovendo a integrao dos dados do ambiente
operativo antes de sua atualizao no DW
Inicialmente, um ODS era considerado um
repositrio temporrio que armazenava apenas
informaes correntes antes de serem carregadas
para o DW, similar a uma cpia dos ambientes de
sistemas transacionais em uma empresa
Atualmente, alguns autores passaram a
denomin-lo Dynamic Data Storage (DDS)
Prof. Thiago Cavalcanti

Operational Data Storage (ODS)

ODS

Prof. Thiago Cavalcanti

Data Staging Area (Kimball)


tanto uma rea de armazenamento como
um conjunto de processos, e normalmente
denomina-se ETL (Extract Transformation Load)
O principal requisito de arquitetura que ela
no esteja acessvel aos usurios e que no
fornea servios de consulta nem de
apresentao

Prof. Thiago Cavalcanti

Questo 08 - TRT - 11 Regio (AM) - Tcnico


Judicirio Tecnologia da Informao - 2012

No mbito dos DWs, representa um


armazenamento intermedirio que facilita a
integrao dos dados de ambiente operativo
antes da sua atualizao no DW. Trata-se de
(a) ODS.
(b) ETL.
(c) Data Mart.
(d) Star Schema.
(e) Fact Table.
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Polmica entre Kimball e Inmon


Ralph Kimball

Bill Inmon

Pai do conceito de star


schema
BOTTOM-UP
Estilo mais simples e
incremental

Pai do conceito de DW
TOP-DOWN
A nfase sempre foi um
grande depsito central
de informaes

Prof. Thiago Cavalcanti

13

26/10/2013

Inmon

Kimball

Prof. Thiago Cavalcanti

Diferenas essenciais entre as abordagens

Prof. Thiago Cavalcanti

Questo 09 - CESPE - 2009 - TCU - Analista de


Controle Externo - Tecnologia da Informao
Com base nas figuras I e II ao lado, e nos
conceitos de datawarehousing, julgue os itens
subsequentes.
[135] Na figura II, que corresponde viso de
Kimball, o datawarehousing visto como uma
constituio de data marts, cujo foco entregar
objetivos do negcio para departamentos na
organizao.
[136] Na figura I, o datawarehouse criado com
base em um enfoque subject-by-subject. Dessa
forma, o desenvolvimento de um datawarehouse
poderia comear com dados de uma loja online,
por exemplo, e outros subjects seriam
adicionados ao datawarehouse conforme as
necessidades. Nesse enfoque, o data mart a
criao de uma subject area do datawarehouse.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

O ciclo de vida de um DW

Modelagem multidimensional
Ambos os modelos 3NF e multidimensionais podem
ser representados em diagramas ER pois so
constitudos por tabelas relacionais
A principal diferena entre os modelos na 3NF e o
multidimensional o grau de normalizao

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

14

26/10/2013

Motivao

Requisitos bsicos

Um modelo dimensional contm as mesmas


informaes que um modelo normalizado
Os pacotes de dados oferecem um formato
com as seguintes preocupaes:
Facilidade de compreenso ao usurio
Desempenho da consulta
Resilincia mudana.

Imagine um executivo que descreve o seu


negcio como, "Ns vendemos produtos em
vrios mercados e medimos o nosso
desempenho ao longo do tempo."
Projetistas multidimensionais devem ouvir
atentamente a nfase no produto, mercado e
tempo.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Modelo conceitual dimensional

Tabela Fato

Tabelas Fato

Armazena as medies de desempenho


decorrentes de eventos dos processos de
negcios de uma organizao

Servem para o armazenamento, medidas (quase


sempre) numricas associadas a eventos de
negcio

Tabelas Dimenso
Representa entidades de negcios e constituem
as estruturas de entrada que servem para
armazenar informaes como tempo, geografia,
produto, cliente
As tabelas dimenso tm uma relao 1:N com a
tabela fato

Representa uma medida de negcios

Uma tabela fato contm vrios fatos,


correspondentes a cada uma das suas linhas
Cada linha corresponde a um evento de medio

Os dados em cada linha esto a um nvel


especfico de detalhe, referido como o gro
Ex: uma linha por produto vendido numa operao de
venda

Prof. Thiago Cavalcanti

Fatos para medies

Prof. Thiago Cavalcanti

Tabela Fato

Uma nica linha da tabela fato tem uma relao


um-para-um com o evento de medio, como
descrito pela granularidade da tabela fato
Uma tabela fato corresponde a um evento fsico
observvel, e no s exigncias de um relatrio
especfico
Dentro de uma tabela fatos, apenas fatos
consistentes com a granularidade definida so
permitidos
Por exemplo, em uma transao de vendas no varejo,
a quantidade de um produto vendido e seu preo so
bons fatos

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

15

26/10/2013

Tabelas dimenso (Contexto descritivo)

Dimenses para o contexto descritivo

So companheiros integrais para uma tabela


de fatos
Contm o contexto textual associado a um
evento de medio dos processos de negcios
Descrevem o "quem, o que, onde, quando,
como e porqu" associado ao evento

Contm os atributos descritivos usados pelas


aplicaes de BI para filtrar e agrupar os fatos
Com a granularidade de uma tabela de fato definida,
todas as possveis dimenses podem ser identificados.
Sempre que possvel, a dimenso deve ter um valor
nico associado a uma determinada linha da tabela
fato
Tabelas dimenso so chamados a "alma" do DW, pois
eles contm os pontos de entrada e rtulos
descritivos que permitem ao sistema de DW/BI para
ser aproveitado para a anlise de negcios
Um esforo necessrio para o desenvolvimento e o
gerenciamento da tabelas de dimenso, pois elas so
os condutores da experincia de BI do usurio

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Um exemplo de tabela dimenso

Sobre as tabelas

Dimenses fornecem os pontos de entrada


para os dados, e as etiquetas finais e os
agrupamentos em todas as anlises de DW/BI

O dilema de designer
Uma quantidade numrica um fato ou um
atributo de dimenso?
uma deciso difcil!

Observaes numricos continuamente


valorizadas so quase sempre os medidas da
tabela fato
Observaes numricos discretas e extradas de
uma lista pequena, quase sempre so atributos
de dimenso
Prof. Thiago Cavalcanti

Fatos e dimenses: Juntos no Star Schema

Prof. Thiago Cavalcanti

Tabela fato e dimenses juntas

Cada processo de negcio representado por


um modelo dimensional que consiste em:
Uma tabela fato contendo medies numricas
do evento
Cercada por um conjunto de tabelas dimenso
que contm o contexto no momento em que
ocorreu o evento.

Esta caracterstica de estrutura estrela (star


schema) muitas vezes chamado de juno
estrela (star-join), um termo que remonta aos
primrdios de bancos de dados relacionais
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

16

26/10/2013

Um simples relatrio

Questo 10 - CESGRANRIO - 2011 - Petrobrs Analista de Sistemas Jnior - Engenharia de Software


O modelo dimensional, implementado em sistemas
de Data Warehouse, tornou-se uma importante
ferramenta de anlise de negcios. Nesse modelo,
(a) apenas dados sumarizados so usados.
(b) as linhas das tabelas dimenso representam as
medidas de negcio.
(c) as tabelas fato expressam relacionamentos de
muitos para muitos entre as tabelas dimenso.
(d) as tabelas fato apresentam dados em diferentes
granularidades.
(e) os fatos mais teis so textuais, provendo
informao ao usurio final.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Processo de design multidimensional

Processo de negcio

Eventos de processos de negcios podem


gerar ou capturar as mtricas de
desempenho que se traduzem em fatos em
uma tabela de fatos
A maioria das tabelas de fatos concentram-se
nos resultados de um nico processo de
negcio
A escolha do processo importante!

Selecionar o processo de negcio


Definir a granularidade
Identificar as dimenses
Identificar os fatos

Define um objetivo de concepo especfica e


permite que a granularidade, as dimenses e os
fatos sejam declarados
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Passo 1: Selecionando o processo de negcio

Granularidade

O primeiro passo decidir o processo de negcio para o


modelo, combinando a compreenso dos requisitos de
negcio com a anlise dos dados de origem disponveis

Declarar a granularidade um passo fundamental em um projeto


dimensional
Estabelece exatamente o que uma nica linha da tabela fato
representa

O primeiro projeto de BI/DW deve se concentrar no processo


de negcio que o mais crtico para os usurios de negcios
Viabilidade abrange uma srie de consideraes, incluindo a
disponibilidade e qualidade dos dados, e ainda a capacidade
organizacional

Nosso exemplo: Suponha que os gestores querem entender


melhor as compras dos clientes
O processo de negcio que voc est modelando baseado nas
transaes de vendas de varejo
Esta informao permite que os usurios de negcios analisar,
por exemplo, quais produtos esto vendendo em que as lojas
em que dias em que condies promocionais

Prof. Thiago Cavalcanti

Torna-se um contrato vinculativo sobre o design


Deve ser declarada antes de escolher dimenses ou fatos, porque
cada dimenso candidata ou fato relevante deve ser consistente com
a granularidade

A atomicidade do gro refere-se ao nvel mais baixo no qual os


dados so capturados por um determinado processo de negcio
Kimball encoraja a comear pelos dados de gros atmicos, porque
resiste ao ataque de consultas de usurios imprevisveis
Sumarizao roll-up so importantes para o ajuste de desempenho,
mas eles pressupem perguntas comuns do negcio
Cada proposta de granularidade da tabela fato resultada em uma
tabela fsica separada, diferentes granularidades no devem ser
misturados na mesma tabela fato

Prof. Thiago Cavalcanti

17

26/10/2013

Passo 2: Declare a granularidade

Passo 3: Identificando as dimenses

Qual o nvel de detalhe dos dados devem ser


disponibilizados no modelo dimensional?
Voc deve desenvolver modelos dimensionais
que representem as informaes mais
detalhadas, atmicas capturadas por um
processo de negcio
Um sistema de DW/BI exige quase sempre os
dados expressos no mais baixo possvel de
granularidade

A declarao cuidadosa da granularidade determina a


dimenso primria da tabela fato
Em seguida, adiciona-se mais dimenses para a tabela fato,
se essas dimenses adicionais tiverem apenas um valor
para cada combinao das dimenses principais

No porque as consultas querem ver linhas


individuais, mas porque as consultas precisam cortar
os detalhes de formas muito precisas

Se a dimenso adicional viola a granularidade, fazendo com que


linhas adicionais da tabela fato sejam geradas, a dimenso
precisa ser desclassificado ou a granularidade precisa ser revista

As dimenses descritivas aplicam ao nosso caso:


Data, produto, loja, promoo, caixa, e forma de pagamento
Alm disso, o nmero do bilhete de transao includa como
uma dimenso especial, dita dimenso degenerada para
nmeros de transao

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Passo 4: Identificando os fatos

Revisitando a tabela fato

Uma tabela fato contm as medidas numricas


produzidos por um evento de medio operacional no
mundo real
No nvel mais baixo de granularidade, uma linha da
tabela fato corresponde a um evento de medio
(fato) e vice-versa
Alm das medidas numricas, uma tabela fato sempre
contm chaves estrangeiras para cada uma das suas
dimenses associadas, bem como as chaves de
dimenso degenerados opcionais
As tabelas fatos so o principal alvo de computaes e
agregaes dinmicas decorrentes das consultas

A quarta e ltima etapa do projeto a determinao cuidadosa dos fatos


que aparecero na tabela fato
Mais uma vez, a declarao de granularidade ajuda a ancorar o raciocnio

Ao considerar os fatos em potencial, voc pode descobrir novamente


ajustes precisam serem feitos tanto para granularidade quanto para a
escolha das dimenses
Os dados coletados pelo sistema incluem a quantidade de vendas por
unidade regular, o desconto, preos lquidos pagos, valores da vendas em
dlares
O valor da vendas igual quantidade de vendas multiplicado pelo preo
unitrio. Da mesma forma, o valor do desconto a quantidade de vendas
multiplicado pelo valor do desconto unitrio
Alguns sistemas sofisticados tambm fornecem um custo dlar padro para o
produto entregue para a loja pelo vendedor.
Presumindo que este fato custo prontamente disponvel e no requer uma
iniciativa baseado em atividade heroica de custo adicional, voc pode incluir o
valor de custo estendido na tabela de fatos

Prof. Thiago Cavalcanti

Tcnicas para a tabela fato

Prof. Thiago Cavalcanti

Composio bsica de uma tabela fato

Atributos
Medidas: Aditivas, semi-aditivas e no-aditivas
Nulos na tabela fato
Fatos conformes (Conformed Facts)

Tipos de tabela fato


Tabela fato de transaes (Transaction Fact Tables)
Tabela de Snapshot Peridicos
Tabela de Snapshot Acumulativos

Tabela fato sem fato (Factless Fact Tables)


Tabela fato consolidada (Consolidated Fact
Tables)
Prof. Thiago Cavalcanti

Nota fiscal
Taxonomia da tabela fato:
Fatos transaes
Fatos peridicos
Fatos acumulados

Vendas no Dia
Valor-GastoRealizado
Prof. Thiago Cavalcanti

18

26/10/2013

Questo 11 - CESGRANRIO - 2008 - Petrobrs Analista de Sistemas Jnior - Processos de Negcios


A empresa passou a sortear cupons de desconto para alguns clientes, os quais
do direito a um desconto nas compras em uma determinada data. A
informao sobre que clientes possuem cupons para que datas mantida de
forma independente e consolidada no processo de extrao, transformao e
carga, resultando em um campo, na tabela fato, indicando se a venda foi
realizada com o desconto ou no. A soluo parecia atender bem s
demandas dos usurios do data warehouse, at que um deles tentou realizar
uma consulta para saber quais clientes no haviam realizado compras,
mesmo tendo um cupom de desconto para a data. Este tipo de demanda
tipicamente ser resolvido introduzindo, no data warehouse, uma
(a) tabela de fatos complementares (complimentary fact table).
(b) tabela de fatos sem dimenso (dimensionless fact table).
(c) tabela de fatos sem fatos (factless fact table).
(d) dimenso multivalorada (multivalued dimension).
(e) dimenso degenerada (degenerated dimension).

Prof. Thiago Cavalcanti

Flags e indicadores como atributo textuais


Dimenso Junk

Atributos nulos nas dimenses


Dimenses data (PK:AAAAMMDD) e calendrios
Papis de dimenses
D
Dimenso Snowflake
D

Chaves:
Chave artificial (substituta) da dimenso (Surrogate
Keys)
Chave natural, durvel e supernatural

Dimenso degenerada
(Des)Normalizao
Dimenses achatadas (Denormalized Flattened
Dimensions)

Mltiplas hierarquias nas dimenses (Multiple


Hierarchies in Dimensions)

Questo 12 - CESPE - 2012 - TCE-ES - Auditor de


Controle Externo - Tecnologia da Informao

Acerca de data warehousing e OLAP, julgue os


itens seguintes.
[134] Na modelagem multidimensional da
tabela fato, a chave da dimenso tempo deve
ser sempre representada como parte da chave
primria

Dimenso Outrigger

Estrutura da tabela dimenso

Prof. Thiago Cavalcanti

Tcnicas bsicas para tabelas dimenso

Tcnicas bsicas para tabelas dimenso

D
F

Prof. Thiago Cavalcanti

Questo 13 - CESPE - 2010 - TRT - 21 Regio (RN) Analista Judicirio - Tecnologia da Informao

As 10 Regras Essenciais para a Modelagem de Dados Dimensional


Prof. Thiago Cavalcanti

Exemplo do modelo dimensional clssico

Acerca de sistemas de suporte a deciso e data


warehousing, julgue os itens a seguir.
[1] Em um data warehouse, cada linha em uma
tabela fato corresponde a uma medida,
representada por um valor aditivo, em que
necessariamente essas medidas no
compartilham a mesma granularidade.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

19

26/10/2013

Revisando: Star Schema x Snow Flake

Esquemas multidimensionais

Star Schema

Dimenso

Esquema estrela: abordagem que recomenda a


no normalizao das tabelas dimenso

Dimenso

Dimenso
conforme

Dimenso
normalizada

Dimenso

Fato

Fato

Dimenso

Dimenso
normalizada

Dimenso

Dimenso

Questo 14 - CESGRANRIO - 2006 - Petrobrs Analista de Sistemas Pleno - Engenharia de Software

Dimenso
normalizada

Fato

Esquema de flocos de neve: abordagem que


recomenda a normalizao das tabelas dimenso.

Prof. Thiago Cavalcanti

Dimenso
normalizada

Dimenso

Fato

Dimenso

Snow Flake

Dimenso
desnormalizada

Dimenso
normalizada

Dimenso
conforme

Dimenso

Prof. Thiago Cavalcanti

Star Schemas e OLAP Cubes

Bases de dados de sistemas de informaes gerenciais so


projetadas, muitas vezes, em um esquema denominado
estrela que:
(a) uma arquitetura fsica que permite definir somente
estruturas unidimensionais de dados.
(b) composta por uma tabela central, denominada
de dimenso, e vrias tabelas perifricas a ela relacionadas,
denominadas fatos.
(c) apresenta tabelas perifricas que se encontram
desnormalizadas.
(d) faz com que a expanso e a evoluo da base de dados
necessite de grande atividade de manuteno.
(e) um esquema onde o nmero de junes realizadas
relativamente maior que o realizado em bases de dados
relacionais convencionais.
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Star Schemas e OLAP Cubes

Consideraes sobre OLAP

Esquemas estrela so estruturas multidimensionais implantados em


um SGBD relacional (RDBMS)

Aqui esto algumas coisas para manter em mente se voc


implantar dados em cubos OLAP:

Consistem em uma tabela fato ligados um conjunto de tabelas de


dimenses associadas atravs de relaes de chave
primria/estrangeira

O cubo de processamento analtico on-line (OLAP) uma estrutura


multidimensional implementada em um banco de dados
multidimensionais, que pode ser equivalente em contedo, ou mais
frequentemente derivado de um esquema em estrela relacional
Um cubo OLAP contm atributos dimensionais e fatos, mas acessado
atravs de linguagens com mais capacidade analtica do que SQL,
como XMLA e MDX
Cubos OLAP so includos nesta lista de tcnicas bsicas porque um
cubo OLAP muitas vezes o ltimo passo na implantao de um
sistema de DW/BI dimensional, ou pode existir como uma estrutura
agregada com base em um esquema estrela relacional mais atmico

Prof. Thiago Cavalcanti

Um esquema em estrela hospedado em um BD relacional


uma boa base fsica para a construo de um cubo OLAP, e
geralmente considerado como uma base mais estvel para
backup e recuperao
Cubos OLAP eram tradicionalmente conhecidos por vantagens
extremas de desempenho comparados com RDBMSs, mas essa
distino tornou-se menos importante com avanos
tecnolgicos
Estruturas de dados de cubo OLAP so as mais variadas entre
os diferentes fornecedores de SGBDs relacionais, assim, os
detalhes da implantao final muitas vezes dependem do
fornecedor foi escolhido
Normalmente, mais difcil de portar aplicaes de BI entre as
diferentes ferramentas OLAP do que portar aplicaes de BI
entre diferentes bancos de dados relacionais.
Prof. Thiago Cavalcanti

20

26/10/2013

Tabela fato agregada ou cubos OLAP?

Mitos da modelagem multidimencional

Tabelas fato agregadas so formadas pela agregao de valores numricos


de dados atmicos da tabela de fatos construdas apenas para acelerar o
desempenho da consulta
Estas tabelas devem estar disponveis para a camada de BI, ao mesmo tempo
em que as tabelas fatos atmica de modo que as ferramentas de BI possam
escolher qual o nvel agregao apropriada no momento da consulta
Este processo, conhecido como navegao agregada, deve ser aberto para
que todas as ferramentas de relatrio, ferramenta de consulta, e aplicaes
de BI
Um projeto de tabelas agregadas deve comportar-se como ndices de banco
de dados, que aceleram o desempenho da consulta, mas no so encontrados
diretamente pelas aplicaes de BI ou usurios empresariais
Tabelas de fatos agregados contm chaves estrangeiras para dimenses
encolhidas, bem como os fatos agregados criados a partir da soma das
medidas de tabelas de fatos mais atmicas

Mito 1: so apenas para dados de resumo


Mito 2: so departamentais e no da empresa
Mito 3: no so escalveis
Mito 4: so apenas para uso previsvel
Mito 5: no podem ser integrados

Cubos OLAP agregados com medidas resumidas so frequentemente


construdos da mesma forma que os agregados relacionais, mas os cubos
OLAP so feitos para serem acessados diretamente pelos usurios
corporativos

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Motivao
O processo de ETL o processo mais crtico e
demorado na construo de um DW

Extrao, transformao e
carga (ETL)
Um ambiente de DW devidamente projetado possui um trade off entre
o trabalho na sala de aplicaes de BI e o trabalho do sistema de ETL.
O primeiro deve ser feito repetidas vezes pelos usurios de negcios,
enquanto o segundo feito uma vez pela equipe de ETL

Prof. Thiago Cavalcanti

O processo de ETL

ETL e as ferramentas de limpeza de dados


consomem um tero do oramento num projeto
de DW
80% do tempo de desenvolvimento de um DW
consiste no processo de ETL

Prof. Thiago Cavalcanti

Requisitos de ETL (10)


1. Necessidades de negcio
2. Conformidade (Contexto legal)
3. Qualidade dos dados
4. Segurana
5. Integrao dos dados (MDM)
6. Latncia do dados
7. Arquivamento e Lineage
8. Interfaces de entrega de BI
9. Habilidades disponveis
10.ETL Legado
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

21

26/10/2013

Questo 15 - FCC - 2011 - TRE-PE - Analista Judicirio


- Anlise de Sistemas
Um processo importante que ocorre em relao
formao de um data warehouse a obteno dos
dados de uma ou mais bases de dados da origem.
Deve ser rigoroso para evitar a deformao e/ou a
perda dos dados quando passados da fonte original
para o destino. Trata- se de
(a) MINING.
(b) DATA MART.
(c) MOLAP.
(d) STAR.
(e) ETL.

Questo 16 - CESGRANRIO - 2010 - Petrobrs Analista de Sistemas Jnior - Processos de Negcios


No contexto de Data Warehouses, o processo de Extrao, Transformao e
Carga (ETC)
(a) revela-se como uma das etapas importantes do processo de criao do
data warehouse, j que sua funo obter automaticamente os
conhecimentos necessrios para a padronizao dos dados em modelos
multidimensionais.
(b) produz, ao seu trmino, uma srie de tabelas (chamadas fatos) que se
caracterizam por possurem dados normalizados at a 3 forma normal.
(c) apresenta, como algumas de suas tarefas, filtragem, integrao,
converso, condensao e derivao dos dados de entrada, que podem ser
originrios de diversas fontes, inclusive externas aos sistemas OLTP da
organizao.
(d) leva em considerao o modelo conceitual de dados das fontes de dados,
que geralmente expresso como modelo entidade-relacionamento.
(e) considera somente os dados provenientes de sistemas OLTP como vlidos
para o processo e, caso exista a necessidade de considerao de dados
externos, estes devem ser importados para os sistemas legados

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Componentes do ETL

Subsistemas de ETL (34 subsistemas)

Descrevem as etapas do processo tem quatro


componentes principais:

Extrao
Limpeza e conformidade
Entrega
Gesto

Extrao
Coleta de dados brutos a partir dos sistemas de origem e, geralmente,
gravao em disco no ambiente de ETL antes de qualquer reestruturao dos
dados. Subsistemas de 1 a 3 devem apoiar o processo de extrao (3)

Limpeza e conformidade
O envio de dados de origem atravs de uma srie de etapas de
processamento no sistema de ETL para melhorar a qualidade dos dados
recebidos a partir da fonte , e a fuso de dados a partir de duas ou mais
fontes de criar e aplicar dimenses conformes e mtricas conformadas .
Subsistemas de 4 a 8 descrevem a arquitetura necessria para suportar os
processos de limpeza e conformidade (5)

Entrega
A estruturao fsica e carregamento dos dados em modelos dimensionais de
destino no servidor de apresentao. Subsistemas de 9 a 21, fornecem a
capacidade de entrega dos dados (13)

Gesto
Gesto dos sistemas e processos relacionados do ambiente de ETL de uma
forma coerente. Subsistemas de 22 a 34 descrevem os componentes
necessrios para apoiar o gerenciamento contnuo do sistema de ETL (13)

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Extrao: Trazendo os dados para o DW

Extrao: Trazendo os dados para o DW

1. Sistema de extrao

2. Data profiling (perfil de dados)

Obviamente, a extrao de dados dos sistemas de


origem um componente fundamental da
arquitetura de ETL.
O sistema de ETL deve esperar dados a partir de
uma ampla variedade de sistemas que envolve
deferentes tipos de dados e outros desafios
inerentes.

Prof. Thiago Cavalcanti

Tcnica de anlise dos dados para descrever o seu


contedo, consistncia e estrutura
Fornece a equipe de ETL uma orientao de
quanto a limpeza de dados importante para o
projeto
Toda vez que voc executar uma consulta SELECT
DISTINCT investigativo em um campo do banco de
dados, voc est traando o perfil de dados

Prof. Thiago Cavalcanti

22

26/10/2013

Extrao: Trazendo os dados para o DW

Limpeza e Conformidade de dados

3. Sistema de captura das alteraes nos dados

1.
2.
3.
4.
5.

Capacidade de transferir apenas as alteraes relevantes


da fonte de dados desde a ltima atualizao
Isolar os dados de origem mais recente chamado de
captura de dados de alterao (CDC)
A ideia por trs do CDC bastante simples: basta transferir
os dados que foram alterados desde a ltima carga.
Existem vrias maneiras de capturar as alteraes de
dados de origem, cada eficazes na situao adequada,
incluindo:

Sistema de limpeza de dados


Esquema de eventos de erro
Dimenso de auditoria
Sistema de deduplicao
Sistema de conformidade

Colunas de auditoria (Audit Columns)


Extrao de tempo (Timed Extracts)
Comparao diferencial total (Full Diff Compare)
Log do banco de dados (Database Log Scraping)
Monitorar a fila de mensagens (Message Queue Monitoring)
Prof. Thiago Cavalcanti

Fluxo do processo de conformidade

Prof. Thiago Cavalcanti

Entrega: Prepare-se para Apresentao


1.
2.
3.
4.

Gesto da alterao lenta da dimenso


Gerador de chave substituta
Gerencia de hierarquia
Gerencia de dimenses especiais
Date/Time Dimensions, Junk(lixo) Dimensions, MiniDimensions, Shrunken Subset Dimensions, Small
Static Dimensions

5. Construtores da tabela fato


6. Pipeline da chave substituta
7. Construo da tabela ponte para dimenso
multivaloradas
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Entrega: Prepare-se para Apresentao

Gerenciando o ambiente de ETL

8. Gerenciador de dados atrasados


9. Sistema de gerenciamento das dimenses
10.Sistemas provedor dos fatos
11.Construo dos agregados
12.Construo do cubo OLAP
13.Gerencia da propagao de dados

Para atingir este objetivo, o sistema de ETL deve


trabalhar constantemente para cumprir trs
critrios:

Prof. Thiago Cavalcanti

Confiabilidade - Os processos de ETL deve sempre ser


executado consistentemente. Eles devem fornecer
dados em tempo hbil, confiveis e em qualquer
nvel de detalhe
Disponibilidade - O DW deve cumprir seus acordos de
nvel de servio (SLAs). O armazm deve estar pronto
e disponvel, como prometido
Gerenciamento - Um DW de sucesso nunca est
pronto. Ele cresce constantemente e muda
juntamente com o negcio. Os processos de ETL
tambm precisam evoluir
Prof. Thiago Cavalcanti

23

26/10/2013

Gerenciando o ambiente ETL

Gerenciando o ambiente ETL

1. Agendador de Jobs

7. Sistema de ordenao

Job definition, Job scheduling, Metadata capture,


Logging, Notification

8. Analisador de ancestrais e dependncia

2. Sistema de backup

9. Sistemas para problemas de escala

3. Sistema de recuperao e restart

10.Sistema de paralelismo/pipeline

4. Sistema de controle de verso

11.Sistema de segurana

5. Sistema de migrao de verso

12.Gerenciamento de conformidade

6. Workflow Monitor

13.Gerenciar repositrio de Metadados


Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Processo de ETL
Desenvolva um plano
1.
2.
3.
4.

Desenvolva um plano de alto nvel


Escolha a ferramenta de ETL
Desenvolva um conjunto de estratgias padro
Drill Down by Target Table

Desenvolver o documento de especificao do ETL


A primeira carga dos dados
7.
8.

ETL na prtica

Popular as tabelas dimenso com os dados histricos


Executar a carga histrica da tabela fato

O processo incremental do ELT


7.
8.
9.
10.

Processamento incremental da tabela dimenso


Processamento incremental da tabela fato
Carga das tabelas agregadas e dos cubos OLAP
Operao e automao do sistema de ETL
Prof. Thiago Cavalcanti

Utilizao do ETL

Prof. Thiago Cavalcanti

Informatica Power Center

No BCB utilizado em
Migraes de dados
Organizao de dados
Sincronizao de dados
Criao de Datamarts e Warehouses
Converso de tecnologia de banco de dados

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

24

26/10/2013

Processo de construo
1. Importao de definies
Sources
Targets

2. Construo de mapas
3. Configurao dos workflows
4. Execuo dos workflows
5. Acompanhamento das execues

Power Center - Ferramentas


Designer Usado para criar mapeamentos que, logicamente, definem o
que deve ser feito e como. Mapeamentos de definem as fontes, as
destinos e as transformaes que se pretende executar nos dados por
meio de um ambiente grfico de drag and drop.

Workflow Manager Usado para criar, agendar e executar fluxos de


trabalho. Um fluxo de trabalho um conjunto de instrues que
descrevem como e quando executar as tarefas relacionadas com a
extrao, transformao e carregamento de dados.

Workflow Monitor Usado para monitorar graficamente o status de


fluxos de trabalho regulares e execuo para cada servidor Power Center.
Voc pode ver quais as tarefas que tiveram xito ou falha.

Repository Manager Usado para criar e administrar o repositrio de


metadados. Voc pode criar usurios e grupos, atribuir privilgios e
permisses para eles e criar pastas que contem os metadados.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Power Center - Ferramentas


Designer - Definio abstrata de Origens e
Destinos. S existe a definio das tabelas

Workflow Manager Configurao de


caminhos e Conexes

Workflow Monitor Acompanhamento e


verificao de Erros em Execues

Repository Manager Manipulao de


objetos, verses, deploys, cpias
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Fluxo de produo

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

25

26/10/2013

Ementa
Mdulo 01 Solues de suporte deciso
Inteligncia de negcios
Business inteligence (BI)

Questes

Prof. Thiago Cavalcanti

Business Intelligence (BI)

Prof. Thiago Cavalcanti

Questo 18 - ESAF - 2013 - DNIT - Analista


Administrativo - Tecnologia da Informao

O componente final do processo de Business


Intelligence
(a) Business balance management (BBM).
(b) Executive office team (EOT).
(c) Business performance management (BPM).
(d) Priority statement board (PSB).
(e) Business advisory management (BAM).

Prof. Thiago Cavalcanti

Data Warehouses e Data Marts


Processo de Data Warehousing
Modelagem multidimensional
Extrao, transformao e carga (ETL)

Prof. Thiago Cavalcanti

Questo 17 - CETRO - 2013 - ANVISA - Analista


Administrativo - rea 5 - Prova
Quanto aos bancos de dados de suporte deciso,
assinale a alternativa correta.
(a) So, principalmente (embora no totalmente),
apenas de leitura (read-only).
(b) So, principalmente, livres de qualquer tipo de
redundncia.
(c) Sua principal preocupao a integridade.
(d) Por questes de eficincia no armazenamento,
no so indexados.
(e) No devem ser muito grandes devido
constante manuteno exigida e s transaes
comerciais que no devem ser acumuladas com o
tempo.
Prof. Thiago Cavalcanti

Questo 19 - ESAF - 2013 - MF - Analista de Finanas


e Controle - Gesto em Infraestrutura de TI
Assinale a opo correta relativa a Business
Intelligence (BI)
(a) A cultura organizacional deve ser transformada
pela alta administrao antes das iniciativas de BI.
(b) O BI transforma a tomada de decises em
processos mais orientados a processos.
(c) A cultura organizacional irrelevante para as
iniciativas de BI.
(d) O BI transforma a tomada de decises em
processos orientados inteligncia dos dirigentes.
(e) O BI no pode ser simplesmente um exerccio
tcnico da rea de Tecnologia da Informao.
Prof. Thiago Cavalcanti

26

26/10/2013

Questo 20 - FCC - 2013 - TRT - 9 REGIO (PR) Tcnico Judicirio - Tecnologia da Informao

Data Warehouses e Data Marts


A revista ClubeDelphi publicou o seguinte artigo(acima): As lacunas que completam corretamente o texto esto
expressas em
a) I
II
III
IV
Data Warehouse Data Mart CPM Dashboard
b) I
II
III
IV
SGBD Data Mining Data Warehouse
OLAP
c) I
II
III
IV
OLAP Business Intelligence Date Mining Dashboard
d) I
II
III
IV
Data Warehouse
Date Mining Business Intelligence
OLAP
e) I
II
III
IV
OLAP
Data Mart
Date Werehousing Business Intelligence

Prof. Thiago Cavalcanti

Questo 21 - CESGRANRIO - 2011 - Transpetro Analista de Sistemas Jnior


Os conceitos e aplicaes de data warehouse e vises de bancos de
dados relacionais de sistemas transacionais possuem pontos em
comum, e, por conta deles, eventualmente so erroneamente
considerados sinnimos. Uma das diferenas entre vises de bancos
de dados relacionais e data warehouses reside no fato de que vises
relacionais de bancos de dados transacionais
(a) implementam como uma de suas componentes a dimenso tempo,
que nem sempre est presente em data warehouses.
(b) permitem a combinao dinmica de seus dados, em diferentes
perspectivas, pela aplicao de operaes pivoting e roll up.
(c) podem ser indexadas, ao contrrio de data warehouses, que, por
sua caracterstica multidimensional, so armazenados em rvores AVL.
(d) podem, diferentemente de data warehouses, ser implementadas
com tcnicas top down e bottom up.
(e) possuem estados com contedo dinmico, j que elas dependem
dos estados das relaes que referenciam, diferentemente de data
warehouses, de natureza no voltil.
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Questo 22 - CESPE - 2012 - MPE-PI - Analista


Ministerial - Informtica - Cargo 6
Acerca de conceitos bsicos, arquiteturas e
aplicaes de data warehouse e datamining e
tcnicas de modelagem e otimizao de bases de
dados multidimensionais, julgue os itens que se
seguem.
[82] Um cubo de dados a representao
multidimensional dos dados no agregados na qual
necessrio que as dimenses tenham o mesmo
tamanho.
[84] Um data warehouse um repositrio de
informaes de uma fonte nica, armazenadas sob
diversos esquemas, em um s local, e que fornecem
dados consolidados
Prof. Thiago Cavalcanti

Questo 23 - CESGRANRIO - 2011 - Petrobrs Analista de Sistemas Jnior - Engenharia de Software

Questo 24 - CESGRANRIO - 2012 - Petrobrs Analista de Sistemas Jnior - Engenharia de Software

Entre os requisitos que devem ser levantados na


construo de um data warehouse se inclui a
latncia de dados, que descreve a(o)
(a) rapidez de entrega dos dados ao usurio final
(b) rapidez da carga inicial do data warehouse
(c) rapidez da perda de validade do dado
(d) tempo total de uma consulta
(e) tempo entre consultas do usurio

Data warehouses so
(a) tipicamente multidimensionais
(b) materializados sob demanda
(c) extratos dos bancos de dados subjacentes
(d) vises parciais dos bancos de dados
subjacentes
(e) vises normalizadas dos bancos de dados
subjacentes

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

27

26/10/2013

Questo 25 - CESGRANRIO - 2010 - EPE - Analista de


Gesto Corporativa - Tecnologia da Informao

Questo 26 - CESPE - 2008 - TCU - Analista de


Controle Interno Tecnologia da Informao

Em uma reunio tcnica sobre a construo de


um Data Mart de vendas de uma empresa,
discute-se o nvel de detalhamento dos dados
dentro do banco de dados. Essa caracterstica
conhecida como
(a) composio.
(b) integrao.
(c) volatilidade.
(d) independncia.
(e) granularidade.
Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Questo 26 - CESPE - 2008 - TCU - Analista de


Controle Interno Tecnologia da Informao

Questo 27 - CESPE - 2010 - BASA- Tcnico Cientfico Tecnologia da Informao - Anlise de Sistemas

Julgue o item abaixo


[1] Os dados de controle de processamento da
camada #B sero acessveis a poucos
funcionrios servidores da organizao de
monitoramento e controle. A fim de agilizar o
processo de extrao, transformao e carga dos
dados operacionais, estes devem ser
armazenados de forma denormalizada na
camada #B.

Os data warehouses so sistemas


computacionais que armazenam os dados
corporativos de forma consolidada,
disponibilizando informaes com maior
eficincia, consistncia e segurana para a
tomada de deciso dos gestores. Acerca dos
data warehouses, julgue os itens que se seguem.
[1]Um Data Mart uma reunio de vrios data
warehouses, a fim de fornecer viso mais ampla
dos dados.

Prof. Thiago Cavalcanti

Questo 28 - FCC - 2009 - TJ-PA - Analista Judicirio Anlise de Sistemas - Desenvolvimento

As principais distines entre um data mart e


um data warehouse so as de que um data mart

(a) orientado por evento e integrado.


(b) orientado por assunto e no voltil.
(c) especializado e orientado a evento.
(d) integrado e no voltil.
(e) especializado e voltil.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Questo 29 - CESPE - Tcnico Programao e


Controle de Tecnologia da Informao Serpro 2013
Com relao a gerenciamento eletrnico de
documentos (GED) e datawaehouse, julgue os
itens que se seguem.
[91] A arquitetura de datawarehouse originou-se da
arquitetura de software, que abrange desde a
definio da estratgia de negcio at a sua
implementao.
[92] Denomina-se de anlise dimensional o
processo de anlise mediante o qual dados
originrios so selecionados das bases
operacionais e modelados no ambiente de
datamining, de acordo com as perspectivas ou
vises elegidas para a realizao.
Prof. Thiago Cavalcanti

28

26/10/2013

Questo 30 - INSTITUTO CIDADES - 2009 - UNIFESP Analista de Tecnologia da Informao

Questo 31 - INSTITUTO CIDADES - 2009 - UNIFESP Analista de Tecnologia da Informao

Acerca de Data Warehouse, marque a alternativa correta:


(a) Data Warehouse (ou armazm de dados, ou depsito de
dados no Brasil) um sistema de computao utilizado para
armazenar informaes relativas s atividades de uma
organizao em sistema operacionais, de forma consolidada.
(b) O Data Warehouse possibilita a anlise de grandes
volumes de dados, coletados dos sistemas transacionais
(OLTP).
(c) Por definio, os dados em um Data Warehouse so
volteis, ou seja, mudam. Os dados esto disponveis para
leitura e escrita e podem ser alterados.
(d) As ferramentas OLAP (Online Analytical Processing) tem
como funo de desfragmentar os dados de um data
warehouse, possibilitando uma estrutura adequada tanto para
as pesquisas como para a apresentao das informaes.

Ainda acerca de Data Warehouse, marque a alternativa INCORRETA:


(a) Esse sistema surgiu como conceito acadmico durante a dcada de
1950.
(b) Atualmente, por sua capacidade de sumarizar e analisar grandes
volumes de dados, o Data Warehouse o ncleo dos sistemas de
informaes gerenciais, e de apoio deciso das principais solues de
business intelligence do mercado.
(c) Um repositrio de metadados uma ferramenta essencial para o
gerenciamento de um Data Warehouse no momento de converter
dados em informaes para o negcio.
(d) O histrico das atualizaes normalmente mantido pelo prprio
banco de dados, mas define um elemento de metadado, indicando as
datas de atualizao dos dados, podendo ajudar o usurio a verificar a
atualidade dos dados e a consistncia da dimenso tempo do Data
Warehouse.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Questo 32 - CESPE - 2010 - MPU - Analista de


Informtica - Perito

Questo 33 - CESPE - 2010 - MPU - Analista de


Informtica - Perito

Acerca de data warehousing, data mining e


OLAP (online analytical processing), julgue os
itens que se seguem.
[1] Dados para a formao de data
warehouses podem ser provenientes de e-mails,
conversas de telefone, documentos, planilhas. A
abordagem lingustica utiliza a anlise
de strings de caracteres para classificar o texto
em determinadas categorias, que so definidas
previamente de acordo com o objetivo da
empresa.

Acerca de data warehousing, data mining e


OLAP (online analytical processing), julgue os
itens que se seguem.
[1] Na modelagem de data warehouses, o uso
de taxonomia facetada como mtodo de
descrio multidimensional e agrupamento da
informao por meio de seus assuntos ou
atributos permite a anlise de dados no
estruturados em sua forma original.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Questo 34 - CESGRANRIO - 2010 - ELETROBRS Analista de Sistemas - FUNCIONAL SAP-ERP


Os dados armazenados em um data warehouse, que
fornecem informaes para um ambiente multidimensional
para tomada de decises de uma empresa, no esto
normalizados. Essa redundncia de dados, criada
propositalmente, tem como objetivo
(a) oferecer segurana na obteno da informao para o
ambiente multidimensional.
(b) melhorar o desempenho de consultas complexas sobre o
data warehouse.
(c) permitir a distribuio das informaes por data marts
departamentais.
(d) facilitar a agregao de dados atmicos.
(e) relacionar, com maior acuidade, os dados atmicos com os
transacionais.
Prof. Thiago Cavalcanti

Modelagem multidimensional

Prof. Thiago Cavalcanti

29

26/10/2013

Questo 35 - CESPE - 2010 - TRE-MT - Tcnico


Judicirio - Programao de Sistemas

Questo 36 - CESPE - 2010 - TRT - 21 Regio (RN) Analista Judicirio - Tecnologia da Informao

Com relao aos conceitos de modelagem dimensional, assinale a opo correta.


(a) Na abordagem utilizada por Kimball, todos os dados de uma empresa so reunidos
em um repositrio central, caracterizado por um projeto dimensional, e que pode ser
consultado diretamente.
(b) A abordagem de Inmon consolida todas as informaes de uma empresa em um
repositrio central chamado data warehouse corporativo. Essa abordagem
caracterizada por um projeto na terceira forma normal, no qual os dados so
consultados diretamente por aplicativos de data warehouse.
(c) Na abordagem de Kimball, os data marts so adaptados s necessidades e pontos
de vista de um grupo de negcios especfico, suportando a modelagem dimensional, e
so consultados por aplicativos de data warehouse.
(d) A abordagem de data marts autnomos tem foco empresarial e atende s
necessidades dentro de uma rea de assunto. Seu desenvolvimento necessita explorar
o uso de elementos de dados comuns em toda a empresa.
(e) Se, em um sistema transacional usando-se um esquema estrela, um cliente,
identificado por Codigo_do_cliente 1010, modificar o seu endereo da empresa sede,
ento, para fins analticos, no ser possvel acompanhar a histria de endereos
desse cliente, pois, nessa abordagem, depende-se de Codigo_do_cliente para
identificar uma linha exclusiva na dimenso cliente, de tal forma que no possvel
armazenar vrias verses do cliente.

Acerca de sistemas de suporte a deciso e data warehousing, julgue


os itens a seguir.
[70] Em um data warehouse, cada linha em uma tabela fato
corresponde a uma medida, representada por um valor aditivo,
em que necessariamente essas medidas no compartilham a
mesma granularidade.
[71] Em um modelo do tipo estrela (star schema), devido ligao
entre as tabelas dimensionais e suas respectivas fontes de
dados, as dimenses so dependentes de cdigos operacionais
de produo. Desse modo, nessas tabelas, convenciona-se usar
como chave primria as mesmas utilizadas no ambiente de
produo origem dos dados.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Questo 37 - CESPE - 2013 - INPI - Analista de


Planejamento Desv. e Manuteno de Sistemas

Questo 38 - CESGRANRIO - 2010 - ELETROBRS Analista de Sistemas - FUNCIONAL SAP-ERP

Acerca de normalizao de dados, julgue o item


seguinte.
[1] Ao se realizar uma modelagem para Data
Warehouse, a forma normalizada Snow
Flake permite que as dimenses sejam modeladas
na 3FN (terceira forma normal). Dessa forma, todo
modelo Snow Flake na 3FN estar necessariamente
tambm na forma normal BCNF (boyce- codd), visto
que ambas so baseadas no conceito de
dependncia transitiva.

Um data mart do departamento de vendas de uma grande empresa possui uma tabela
fato com cinco mtricas associadas a oito diferentes dimenses. O analista de TI est
em dvida sobre que modelagem utilizar. Considerando-se as opes snowflake e star
schema, qual a desvantagem de se utilizar, nessa situao, a modelagem snowflake?

Prof. Thiago Cavalcanti

(a) A modelagem star schema no contempla a possibilidade de armazenamento de


atributos para cada dimenso, minimizando a quantidade de memria utilizada.
(b) Uma maior quantidade de joins entre as tabelas de dimenses e as tabelas de
hierarquia associadas ser realizada, ocasionando queda de desempenho no processo
de agregao das mtricas.
(c) As chaves estrangeiras, relativas s dimenses armazenadas na tabela fato, devem
corresponder s hierarquias existentes nessas dimenses, ocasionando maior
quantidade de registros na tabela fato.
(d) Na modelagem snowflake, a manuteno dos dados dimensionais se torna mais
dispendiosa, tendo em vista que as tabelas dimensionais no esto normalizadas.
(e) Diferentemente da modelagem star schema, na modelagem snowflake, as chaves
estrangeiras na tabela fato no apontam para o nvel mais baixo (atmico) da
hierarquia das dimenses associadas.

Prof. Thiago Cavalcanti

Questo 39 - FUNCAB - 2010 - PRODAM-AM Analista de Tec. da Informao - Banco de Dados

Questo 40 - FEPESE - 2010 - SEFAZ-SC - Auditor Fiscal


da Receita Estadual - Tecnologia da Informao

Sejam as seguintes assertivas sobre esquemas multidimensionais para a


modelagem de dados para Data Warehouses:

Assinale a alternativa correta a respeito de Data


Warehouse (DW) e modelagem multidimensional.
(a) Um esquema multidimensional, composto por fatos e
dimenses, no pode ser modelado em um banco de
dados relacional.
(b) Uma dimenso definida em uma modelagem
multidimensional deve estar associada a um nico fato.
(c) Operaes OLAP podem ser executadas tanto para fins
analticos quanto para fins de atualizao de dados.
(d) O volume de dados de um DW geralmente superior
ao volume de dados de um BD transacional.
(e) Um Data Mart um componente de um DW que no
possui dados histricos.

I. O esquema snowflake uma variao do esquema estrela no qual as


tabelas dimensionais de um esquema estrela so organizadas em uma lista de
tabelas no normalizadas.
II. O esquema estrela consiste em uma tabela de fato com uma nica tabela
para cada dimenso.
III. O esquema onde um conjunto de tabelas de fatos compartilha algumas
tabelas de dimenso conhecido por hipercubo .
Marque a alternativa correta em relao s assertivas acima.
(a) Apenas a assertiva I verdadeira.
(b) Apenas a assertiva II verdadeira.
(c) Apenas a assertiva III verdadeira.
(d) Todas as assertivas so verdadeiras.
(e) Todas as assertivas so falsas.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

30

26/10/2013

Questo 41 - CESPE - 2012 - MPE-PI - Analista


Ministerial - Informtica - Cargo 6

Extrao, transformao e
carga (ETL)

Prof. Thiago Cavalcanti

Acerca de fundamentos de administrao de dados,


fundamentos de banco de dados e conceitos envolvidos
em data warehouse, julgue os itens seguintes.
[65] Na construo de um data warehouse, o processo
extract, transform and load (ETL), normalmente, o
menos crtico e o mais rpido. Esse processo envolve a
extrao dos dados, na sua transformao, e,
eventualmente, influencia na limpeza desses dados.
[66] Em modelo de banco de dados, a normalizao
estabelece um conjunto de regras que tem por objetivo
maximizar as anomalias de modificao dos dados e
aumentar a flexibilidade em sua utilizao.
Prof. Thiago Cavalcanti

Questo 42 - CESGRANRIO - 2010 - ELETROBRS Analista de Sistemas Jnior - Engenharia de Software

Questo 43 - FCC - 2012 - TST - Analista Judicirio Anlise de Sistemas

Os dados transacionais de uma grande empresa esto


dispostos em bases heterogneas. Para que dados
carregados no data warehouse sejam considerados
adequados formao de tabelas fato e dimensionais, a
etapa de transformao pode realizar procedimentos de
limpeza nesses dados. Que problema NO resolvido por
esse tipo de procedimento?

O processo de ETL em uma Data Warehouse


possui vrias fases. Em uma destas fases
efetuada a
(a) extrao dos dados dos sistemas de origem.
(b) introduo de novos produtos no mercado.
(c) validao das interfaces de usurio.
(d) criao de diagramas estticos e
comportamentais das classes e atributos.
(e) definio dos custos e prazos.

(a) Existncia de valores no previstos.


(b) Filtragem de dados a serem carregados.
(c) Ausncia de dados.
(d) Inconsistncia de dados.
(e) Duplicao de dados.
Prof. Thiago Cavalcanti

Questo 44 - CESPE/UnB Banco da Amaznia S.A. 2012

Considerando a figura acima, que representa um esquema bsico do processo de


desenvolvimento de um armazm de dados (data warehouse), julgue os itens que se seguem.
[110] O processo de extrao, transformao e carga (ETL) ilustrado permite extrair dados de
diversas fontes de dados e migr-los para o data warehouse, mantendo sua estrutura e
normalizao originais.
[111] Os modelos de dados usados no data warehouse so frequentemente constitudos por
modelos dimensionais, em que um mesmo dado pode ser fisicamente gravado mais de uma vez.
Entre as razes de esses modelos serem utilizados, destaca-se o aumento do desempenho em
consultas a grandes volumes de dados associados a realizaes de uma dimenso do modelo.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Questo 45 - CESPE - 2011 - Correios - Analista de


Correios - Analista de Sistemas Desen. de Sistemas

Acerca de solues de suporte a deciso, julgue os


itens seguintes.
[1] As ferramentas de software ETL (extract
transform load) tm como funo a extrao de
dados de diversos sistemas, a transformao desses
dados de acordo com as regras de negcio e a carga
dos dados em um data mart ou um DW.
[2] Em um ambiente data warehouse (DW),
possvel a anlise de grandes volumes de dados, os
quais ficam disponveis para serem alterados e
manipulados pelo usurio.
Prof. Thiago Cavalcanti

31

26/10/2013

Questo 46 - CESGRANRIO - 2009 - Casa da Moeda Desenvolvimento de Sistemas

Questo 47 - CESGRANRIO - 2009 - Casa da Moeda


Banco de Dados

Uma empresa deseja criar uma base de dados para apoio


tomada de deciso. As informaes corporativas encontramse em 4 bancos de dados distintos e possuem representaes
diferentes para atributos de uma pessoa fsica. Por exemplo,
em determinado banco de dados, uma pessoa fsica do sexo
masculino representada por um atributo com valor M,
enquanto que em outro banco de dados, com valor 1.
Em que etapa de um procedimento de ETL para essa base de
dados deve ocorrer uma padronizao desse tipo de valor?
(a) Extrao.
(b) Deleo.
(c) Transformao.
(d) Paralelismo.
(e) Carga.

Observe as fontes de dados a seguir.


I - Tabela de um banco de dados relacional.
II - Arquivo XML.
III - Arquivo TXT flat.
Utilizando procedimentos de ETL (Extract, Transform e Load)
para carga de um DW, possvel ler dados das fontes
(a) I, apenas.
(b) II, apenas.
(c) III, apenas.
(d) I e III, apenas.
(e) I, II e III.

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Perguntas

Muito obrigado!

Prof. Thiago Cavalcanti

Prof. Thiago Cavalcanti

Banco de dados
Suporte a deciso Business Intelligence
Curso Preparatrio - ITnerante
Prof. Thiago Cavalcanti

Toda a educao, no momento, no


parece motivo de alegria, mas de
tristeza. Depois, no entanto, produz
naqueles que assim foram exercitados
um fruto de paz e de justia.
Prof. Thiago Cavalcanti
Hebreus (12:11)

32

26/10/2013

Gabarito
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.

E
C
D
E
A
D
D
A
[135] F [136] F
C
C
[134] C
[1] F
C
E
C

17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.

A
C
E
D
E
[82] C [84] C
A
A
E
[1] Certo
Falso
E
[91] E [92] C
B
A
[1] F

33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.

[1] C
B
A
[70] F [71] F
[1] F
B
B
D
[65] F [66] F
B
A
[110] F [111] C
[1] C [2] F
C
E

Prof. Thiago Cavalcanti

33