Você está na página 1de 68

Fundamentos e

Aplicaes de BI

Graduao Tecnolgica:
Tecnologia da Informao

Autor: Prof. Carlos Eduardo Gertners de Magalhes

Fundamentos e Aplicaes de BI

SUMRIO
SUMRIO .......................................................................................................................... 2
LISTA DE FIGURAS......................................................................................................... 3
UNIDADE I INTRODUO AO BUSINESS INTELLIGENCE ................................. 4
1.1-Histrico ................................................................................................................... 4
1.2-Evoluo ................................................................................................................... 5
1.3-Objetivos de BI......................................................................................................... 7
1.4-Dado versus Informao versus Conhecimento versus Deciso ............................ 10
UNIDADE II FERRAMENTAS DE BUSINESS INTELLIGENCE ........................... 11
2.1-BPM........................................................................................................................ 11
2.2-BAM ....................................................................................................................... 12
2.3-Data Warehouse...................................................................................................... 13
2.4-Metadados............................................................................................................... 19
2.5-Data Mart................................................................................................................ 25
2.6-Data Mining............................................................................................................ 31
2.7-EIS .......................................................................................................................... 34
2.8-OLAP...................................................................................................................... 35
2.9-ETL......................................................................................................................... 39
2.10-DSS....................................................................................................................... 41
2.11-rvore de Deciso ................................................................................................ 42
2.12-Redes Neurais ....................................................................................................... 45
2.13-Geradores de Consultas e Relatrios .................................................................... 48
2.14-GIS e GPS............................................................................................................. 51
UNIDADE III ESTUDOS DE CASO ........................................................................... 55
ANEXO 1 Bibliografia/Webliografia ............................................................................ 68

Fundamentos e Aplicaes de BI

LISTA DE FIGURAS
Figura 1: Principais componentes do DW ........................................................................ 14
Figura 2: Indicao de agregao de algumas dimenses ................................................ 29
Figura 3: Sugesto de consulta baseado em alguns itens da dimenso............................. 29
Figura 4: Exemplo de um Modelo Multimensional Estrela.............................................. 30
Figura 5: Estrutura de uma rvore de deciso................................................................... 42
Figura 6: Exemplos de Treino........................................................................................... 43
Figura 7: rvore de deciso baseada no exemplo do treino. ............................................ 43
Figura 8: Relao entre elementos da rvore, atributos, valores e classificaes............. 44
Figura 9: rvore de deciso quando Aspecto=Sol e Vento=Fraco .................................. 44
Figura 10: rvore de deciso quando Aspecto=Sol ou Vento=Fraco .............................. 45

Fundamentos e Aplicaes de BI

UNIDADE I INTRODUO AO BUSINESS


INTELLIGENCE
1.1-Histrico
O conceito prtico, de Business Intelligence (BI), foi usado pelos povos antigos. A
sociedade do Oriente Mdio antigo utilizavam os princpios bsicos do BI quando
cruzavam informaes obtidas junto natureza em benefcio de suas aldeias. Analisar o
comportamento das mars, os perodos chuvosos e de seca, a posio dos astros, entre
outras eram formas de obter informaes que seriam utilizadas para tomar decises
importantes, permitindo a melhoria de vida de suas respectivas comunidades.
evidente que o mundo em que vivemos mudou desde ento, porm o conceito
permanece inalterado. A necessidade de cruzar informaes para a realizao de uma
gesto empresarial eficaz atualmente uma realidade to encravada em nossa sociedade
quanto no passado.
Business Intelligence ou Inteligncia de negcios refere-se ao processo de coleta,
organizao, anlise, compartilhamento e monitoramento de informaes que oferecem
suporte a gesto de negcios.
A Inteligncia Empresarial, ou Business Intelligence, um termo do Gartner Group. O
conceito surgiu na dcada de 80 e descreve as habilidades das corporaes para acessar
dados e explorar as informaes (normalmente contidas em um Data Warehouse/Data
Mart), analisando-as e desenvolvendo percepes e entendimentos a seu respeito, o que
as permite incrementar e tornar mais pautada em informaes a tomada de deciso.
As organizaes tipicamente recolhem informaes com a finalidade de avaliar o
ambiente empresarial, completando estas informaes com pesquisas de marketing,
industriais e de mercado, alm de anlises competitivas. Organizaes competitivas
acumulam "inteligncia" medida que ganham sustentao na sua vantagem competitiva,
podendo considerar tal inteligncia como o aspecto central para competir em alguns
mercados.
Cada sistema de BI determina uma meta especfica, tendo por base o objetivo
organizacional ou a viso da empresa, existindo em ambos objetivos, sejam eles de longo
ou curto prazo.
O grande desafio de todo indivduo que gerencia qualquer processo a anlise dos fatos
relacionados a seu dever. Ela deve ser feita de modo que, com as ferramentas e dados
disponveis, o gerente possa detectar tendncias e tomar decises eficientes e no tempo
correto. Com essa necessidade surgiu ento o conceito de Business Intelligence.

Fundamentos e Aplicaes de BI

A histria do Business Intelligence que conhecemos hoje, comea na dcada de 70,


quando alguns produtos de BI foram disponibilizados para os analistas de negcio. O
grande problema era que esses produtos exigiam intensa e exaustiva programao, no
disponibilizavam informao em tempo hbil nem de forma flexvel, e alm de tudo
tinham alto custo de implantao.
Com o surgimento dos bancos de dados relacionais, dos PCs e das interfaces grficas
como o Windows, aliados ao aumento da complexidade dos negcios, comearam a
surgir os primeiros produtos realmente direcionados aos analistas de negcios, que
possibilitavam rapidez e uma maior flexibilidade de anlise.

1.2-Evoluo
O atual interesse pelo BI vem crescendo assustadoramente na medida em que seu
emprego possibilita s organizaes realizar uma srie de anlises e projees, de forma a
agilizar os processos relacionados s tomadas de deciso.
QUADRO EVOLUTIVO DO BI
Perodo
Idade Antiga

O que aconteceu?
. Povos do Oriente Mdio cruzavam informaes da
natureza, mars, etc. para analisarem a viabilidade
do cultivo de determinadas espcies, perodos de
pesca abundante, etc.
. Rainha Elizabeth I, determinou que a base da
fora inglesa fosse informao e comrcio e
ordenou ento ao filsofo Francis Bacon que
inventasse um sistema dinmico de informao, o
qual foi amplamente aplicado pelos ingleses.
. Evoluo dos computadores que deixaram de
ocupar salas enormes, na medida em que
diminuram de tamanho.
. As empresas passaram a perceber os dados como
uma possvel e importante fonte geradora de
informaes decisrias e que renderiam eventuais
lucros.
. poca dos cartes perfurados.
. Predominncia das linguagens de programao:
COBOL, ASSEMBLY e FORTRAN.
. Evoluo das formas de armazenamento e acesso
a dados DASD e SGBD.
DASD  Direct Access Storage Device
dispositivo de armazenamento de acesso direto (ex.:
HD).
SGBD  Sistema Gerenciador de Banco de Dados.
. Desenvolvido o EIS.
EIS  Executive Information System ou Sistema
de Informao Executiva.
. Desenvolvimento e evoluo das linguagens de
programao CLIPPER e PASCAL.
. Incio da aplicao do termo Business
Intelligence.

Sculo XVI

Dcada de 60

Dcada de 70

Dcada de 80

Fundamentos e Aplicaes de BI

Dcada de 90

. Incio do uso do termo CPD nas empresas.


. Desenvolvimento do Data Warehouse.
. O setor corporativo passou a se interessar pelas
solues de BI.
. Evoluo dos conceitos de DSS (Decision Support
System sistema de suporte deciso), Planilhas
Eletrnicas, Geradores de Consultas e de
Relatrios, Data Marts, Data Mining, Ferramentas
OLAP, entre outras.
. Estreitamento das conexes entre o BI e o ERP.
ERP  Enterprise Resource Planning. Ou SIGE
(Sistemas Integrados de Gesto Empresarial). So
sistemas de informao que integram todos os
dados e processos de uma organizao em um
nico sistema. A integrao pode ser vista sob a
perspectiva funcional (sistemas de: finanas,
contabilidade, recursos humanos, fabricao,
marketing, vendas, compras, etc.) e sob a
perspectiva sistmica (sistema de processamento de
transaes, sistemas de informaes gerenciais,
sistemas de apoio deciso, etc.). Os ERPs em
termos gerais, so uma plataforma de software
desenvolvida
para
integrar
os
diversos
departamentos de uma empresa, possibilitando a
automao e armazenamento de todas as
informaes de negcios.
. Surgimento do termo e-business.
e-business  Electronic Business, negcio
eletrnico. o termo que se utiliza para identificar
os negcios efetuados por meios eletrnicos,
geralmente na Internet. Muitas vezes associado ao
termo comrcio eletrnico. Conjunto de sistemas de
uma empresa que se interligam e interagem com os
sistemas de diversas outras empresas servindo
como a infra-estrutura do e-Commerce (comrcio
eletrnico). E-business tem como aplicao a
criao de sistemas capazes de prover comunicao
entre empresas agilizando os processos de compra e
venda entre as mesmas. Existem inclusive sistemas
que fazem pedidos automticos para outras
empresas de acordo com o seu estoque de produtos,
facilitando assim todo o processo de fabricao e
venda. Melhorar a disponibilidade de produtos de
acordo com a demanda pelos mesmos.

A partir do ano 2000

Fundamentos e Aplicaes de BI

1.3-Objetivos de BI
Analisar os dados corporativos de maneira simples, no formato correto e no tempo certo,
para que a empresa possa tomar decises melhores e mais rpidas.
Essa soluo tem como finalidade transformar dados em informao e informao em
conhecimento.
Cenrio encontrado em muitas empresas antes de usar BI
. Diferentes Bases de Dados (ERP, Sistemas Internos, etc.).
. Integridade dos dados no nvel Operacional.
. Dificuldade em atender o nvel Ttico/Estratgico.
Nvel Estratgico  aquele que geralmente executado com uma viso mais mediata,
isto , mais a longo prazo e, dada sua natureza e seu grau de importncia para a
organizao, representa um impacto mais amplo, profundo e duradouro sobre a
mencionada organizao. importante frisar que, como o planejamento estratgico, na
maioria das organizaes, elaborado pelo seu mais alto escalo hierrquico, o mesmo
dever contemplar uma srie de decises que devero ser tomadas nos demais nveis
hierrquicos da organizao.
Ex: Misso: o motivo principal da existncia de uma organizao, demonstrando seu
verdadeiro papel perante as sociedades interna e externa, onde ela atua.
Nvel Ttico  Traduzir as decises estratgicas em aes efetivas a serem
implementadas pelos mais diversos setores da organizao. Desta forma, o nvel ttico
tem seu foco mais especfico. No nvel ttico, existe um menor nvel de incerteza para as
tomadas de decises. O tempo de planejamento no nvel ttico, a mdio prazo.
Ex: Poltica de Recrutamento e Seleo de Pessoal.
Nvel Operacional  Os esforos so direcionados para cada processo ou projeto da
organizao. So aplicadas em setores especficos e apresentam impactos limitados. O
tempo de planejamento no nvel operacional a curto prazo. As decises operacionais
so eminentemente tcnicas, isto , sem um forte alcance de cunho poltico-social.
Ex: Levantamento da Necessidade de Treinamento.
. Criao de Ilhas de informao (Relatrios/Planilhas).
. Os dados dos relatrios/planilhas no batem entre si.
. Reunies com decises inconsistentes.

Fundamentos e Aplicaes de BI

Comentrios provveis de ocorrer sem o uso do BI


. Mascaram problemas existentes.
. No detalham de onde veio a informao.
. Dificuldade em otimizar os resultados.
otimizar  Dar a uma mquina, a uma empresa o rendimento timo, criando as
condies mais favorveis ou tirando o melhor partido possvel.
. Dificuldade no acompanhamento de resultados.
. Dificuldade no redirecionamento estratgico.

Alguns benefcios ao usar BI


. Analisar com facilidade todos os dados da empresa;
. No depender da gerao de relatrios para a tomada de deciso;
. Agilidade e preciso na tomada de decises;
. Consistncia na avaliao de desempenho da empresa;
. Otimizao de resultados;
. Agilidade e preciso na definio, acompanhamento e realinhamento estratgico;
. Analisar e antecipar mudanas no mercado;
. Analisar e descobrir novos nichos de mercado;
. Analisar e antecipar movimentos e aes dos competidores;
. Analisar e descobrir novos potenciais competidores;
. Aprender com os sucessos e as falhas anteriores;
. Avaliar o impacto de novas tecnologias, produtos ou processos que afetem o seu
negcio;
. Analisar polticas, leis ou mudanas regulamentais que possam afetar o seu negcio;
. Analisar e reformular seus processos e prticas de negcio;
. Integridade e unicidade de conceitos e informaes;
. Maior eficincia operacional e administrativa;
. Aumento da competitividade da empresa.

Fundamentos e Aplicaes de BI

Exemplo do que se pode conseguir com o BI


Resultado de uma pesquisa em 50 empresas de portes variados e em diferentes regies do
Brasil.
1. Est satisfeito com as polticas de tratamento individual?
Antes BI (%)
timo
38
Bom
40
Razovel
10
Pssimo
12

Aps BI (%)
78
20
2
0

2. Nossos produtos e servios esto sendo bem aceitos pelo mercado consumidor?
Antes BI (%)
Aps BI (%)
timo
49
84
Bom
35
12
Razovel
8
4
Pssimo
8
0
3. O tempo de atendimento aos novos prospects reduziu?
prospects = futuros clientes.
Antes BI (%)
timo
15
Bom
47
Razovel
22
Pssimo
16

Aps BI (%)
57
40
2
1

4. O tempo de resposta para questionamentos de clientes est dentro do previsto?


Antes BI (%)
Aps BI (%)
timo
13
69
Bom
65
25
Razovel
16
6
Pssimo
6
0

Fundamentos e Aplicaes de BI

1.4-Dado versus Informao versus Conhecimento versus


Deciso
O BI, na sua essncia, trata apenas da tomada de deciso eficaz. No entanto, de
fundamental importncia, sabermos de onde partiu determinada deciso no mbito da
Empresa.
Dado a personificao simplista de uma coisa que no nos traz nenhum sentido ou
que nos gera um sentido duplo. Exemplo: Se colocarmos no quadro a sequncia
24/05/1975 muitas concluses podemos analisar:
. uma sequncia de nmeros?
. Cdigo para determinada ao?
. Uma data (para os pases que utilizam a forma Ocidental de representao)?
. Somente nmeros separados por uma barra invertida.
No possvel ter certeza do que vem a ser esta sequncia de nmeros se no temos mais
informaes sobre ele.
No entanto, se um outro detalhe adicionado ao exemplo: a data de nascimento da
Maria. Assim conseguimos identificar e eliminar as duas primeiras e a ltima alternativa
acima. Agora SABEMOS... Este o conhecimento!
Dessa forma sabmos que a Maria nasceu no dia 24/05/1975.
O outro passo, mais importante e o intuito deste trabalho, a DECISO! O que ser feito
com ela ser de responsabilidade dos gestores (tomadores) de deciso... Pode-se mandar
um presente, um carto.
Quando no se aplica os conceitos, tcnicas e sistemas de Business Intelligence, os
gestores e tomadores de deciso possuem apenas a sequncia de nmeros...
impraticvel tomar uma deciso somente com isso.
Ou ter a informao completa e consequentemente possuir o conhecimento, no entanto,
no tomar uma deciso.
Nos 2 casos citados acima, aconteceram falhas, pois quando no se tinha o
conhecimento, no tomou-se a iniciativa da deciso e quando tinha o conhecimento,
simplesmente o mesmo foi descartado.

10

Fundamentos e Aplicaes de BI

UNIDADE II FERRAMENTAS DE BUSINESS


INTELLIGENCE
2.1-BPM
BPM  Business Performance Management. uma forma de orientar seus negcios
ativamente na direo que voc deseja, de forma rpida e precisa, em vez de
passivamente criticar os resultados depois dos fatos j terem ocorrido. Esse termo denota
uma abordagem de anlise global para a tomada de decises nos negcios, com o
objetivo de melhorar a capacidade de entendimento dos negcios e gerenciar sua
performance em todos os nveis, incluindo acionistas, gerentes, staff (grupo de trabalho),
clientes e fornecedores dentro de um ambiente de gerenciamento integrado.
A importncia de se obter os indicadores mais rapidamente e com maior preciso de
subsidiar o processo de tomada de deciso em tempo real. Existem 2 tipos de BPM: o
Business Performance Measurement (medidas) e o Business Performance Management
(gerenciamento).
As BPM de medidas so aquelas aplicaes que utilizam KPIs (Key Performances
Indicators ou indicadores chaves de desempenho) para medir a performance, ou que
utilizam a informao comparativa do mercado (comparaes com os concorrentes),
OLAP navegao entre vrias mtricas de performance em dimenses de negcio e
oferecem apoio na fase de anlise do ciclo de negcio.
As BPM de gerenciamento so aquelas que apiam a modelagem ou explorao de
cenrios e levam o usurio um passo alm, possibilitando a considerao das implicaes
de cursos alternativos de aes (em vez de simplesmente explorar o que aconteceu e
porque). Podem suportar modelagem preditiva, fecham as pontas entre os sistemas
operacionais e analticos e permitem o gerenciamento da performance da empresa.
Modelagem Preditiva  uma ferramenta de negcio extremamente poderosa e uma
fonte de vantagem competitiva para as empresas que fazem uso intensivo dessa
ferramenta. Entendimento profundo do seu negcio. O processo de criao de modelos
preditivos extremamente rico na gerao de insights de negcio. Um bom modelo
preditivo implica na separao dos fatores que melhor explicam uma questo de negcio
e, portanto, implica em um profundo conhecimento das variveis que explicam o
comportamento medido.
um conceito que une gesto de negcios e tecnologia da informao com foco na
otimizao dos resultados das organizaes atravs da melhoria dos processos de
negcio. So utilizados mtodos, tcnicas e ferramentas para analisar, modelar, publicar,
otimizar e controlar processos envolvendo recursos humanos, aplicaes, documentos e
outras fontes de informao.

11

Fundamentos e Aplicaes de BI

2.2-BAM
A revoluo do BI e do BPM acabou gerando mais uma forma de controle chamada de
BAM (Business Activity Monitoring - monitoramento da atividade de negcio). Esse tipo
de controle sempre foi perseguido pelas empresas e existia de uma forma ou de outra.
Com sua evoluo, ela comea a aparecer cada vez mais nas empresas.
A idia simples: coloque uma interface parecida com a de controle de velocidade dos
carros no computador de algum e a conecte com vrios dados crticos de desempenho
em tempo real de suas operaes, tais como vendas por hora, produtividade, eficincia,
etc. A racionalidade da coisa est em que o executivo precisa ter acesso informao
quando ela acontecer, exatamente como os controles de um carro, como a velocidade, que
voc precisa adaptar as condies da estrada, por exemplo.
BAM um software que pode exteriorizar em tempo real informaes de negcio que so
importantes de alguma maneira. Voc pode organizar os BAMs em 3 tipos bsicos:
Mtricas de Processo

BAM passivo

BAM ativo

So tecnologias de integrao de processos que mostram informao em


tempo real como parte do processo do mecanismo de integrao. Assim voc
no s pode criar como meta processos acima dos processos existentes na
empresa, como exteriorizar suas informaes em tempo real e at mesmo
calcular hipteses usando os dados fornecidos. Elas no oferecem uma
verdadeira capacidade de deciso, mas somente monitorao sobre um
processo.
o que vemos atualmente nas empresas. So servidores de integrao que
permitem mostrar as informaes em tempo real de uma forma simples para
os usurios finais. Os usurios podem observar o estado de seus negcios e
fazer as mudanas necessrias, embora elas no sejam implementadas pelo
sistema BAM.
Este tipo de sistema mais complexo. Usando essa tecnologia, voc no s
pode monitorar ou calcular usando os dados oferecidos em tempo real, mas
tambm tomar aes usando lgicas pr-programadas. Por exemplo,
estabelecer uma regra que faz pedidos para seu fornecedor to logo o estoque
esteja abaixo de um certo limite.

O objetivo do Monitoramento de Atividades de Negcio (BAM) fornecer um


gerenciamento com conscientizao imediata da mudana dos eventos de negcios em
todo o processo, para que as decises apropriadas e oportunas possam ser tomadas. Em
tempo real, o monitoramento das atividades de negcios acionadas por eventos, fornecem
alertas, que podem requerer aes imediatas com a mudana dos indicadores de
performance chave.
As informaes provenientes do Monitoramento de Atividades de Negcio proporcionam
insights (percepes) aos executivos envolvidos nos processos analisados, permitindo
uma constante adequao e planejamento estratgico.
Por meio da utilizao de informaes em tempo real possivel remover atrasos no
gerenciamento e execuo de processos de negcio empresariais crticos, o BAM.

12

Fundamentos e Aplicaes de BI

2.3-Data Warehouse
uma coleo de dados derivados dos dados operacionais para sistemas de suporte
deciso. Estes dados derivados so, muitas vezes, referidos como dados gerenciais,
informacionais ou analticos.
Os bancos de dados operacionais (OLTP) armazenam as informaes necessrias para as
operaes dirias da empresa, so utilizados por todos os funcionrios para registrar e
executar operaes pr-definidas, por isso seus dados podem sofrer constantes mudanas
conforme as necessidades atuais da empresa. Por no ocorrer redundncia nos dados e as
informaes histricas no ficarem armazenadas por muito tempo, este tipo de banco de
dados no exige grande capacidade de armazenamento (com algumas excees).
J um DW armazena dados analticos, destinados s necessidades da gerncia no
processo de tomada de decises. Isto pode envolver consultas complexas que necessitam
acessar um grande nmero de registros, por isso importante a existncia de muitos
ndices criados para acessar as informaes da maneira mais rpida possvel. Um DW
armazena informaes histricas de muitos anos e por isso deve ter uma grande
capacidade de processamento e armazenamento dos dados que se encontram de duas
maneiras: detlhados e resumidos.
Algumas diferenas entre banco de dados OLTP e banco de dados DW:
Caractersticas
Objetivo
Uso
Tipo de
processamento
Unidade de trabalho
Nmero de usurios
Tipo de usurio
Interao do usurio

Banco de Dados OLTP


Operaes dirias do negcio
Operacional
OLTP

Banco de Dados DW
Analisar o negcio
Informativo
OLAP

Incluso, alterao, excluso


Milhares
Operadores
Somente pr-definida

Volume
Histrico
Granularidade
Redundncia
Estrutura
Manuteno
desejada
Acesso a registros
Atualizao
Integridade
Nmero de ndices
Inteno dos ndices

Megabytes gigabytes
60 a 90 dias
Detalhados
No ocorre
Esttica
Mnima

Carga e consulta
Centenas ou dezenas
Comunidade gerencial
Pr-definida e ad-hoc.
ad-hoc  um tipo de coleta de
dados, ou seja, para resolver
determinado problema ou realizar
uma tarefa especfica.
Gibabytes terabytes
5 a 10 anos
Detalhados e resumidos
Ocorre
Varivel
Constante

Dezenas
Contnua (tempo real)
Transao
Poucos/simples
Localizar um registro

Milhares
Peridica (em batch)
A cada atualizao
Muitos/complexos
Aperfeioar as consultas

13

Fundamentos e Aplicaes de BI

Com base nestes conceitos podemos concluir que o DW no um fim, mas o meio pelo qual as empresas
dispem para analisar informaes histricas, podendo utiliz-las para a melhoria dos processos atuais e
futuros.
DW so construdos para que tais dados possam ser armazenados e acessados de forma que no sejam
limitados por tabelas e linhas estritamente relacionais. Os dados de um DW podem ser compostos por um
ou mais sistemas distintos e sempre estaro separados de qualquer outro sistema transacional, ou seja, deve
existir um local fsico onde os dados desses sistemas sero armazenados.

Figura 1: Principais componentes do DW

Supply Chain  Cadeia de fornecimento. O Supply Chain Management (SCM) a


gesto da cadeia de fornecimento. A competio no mercado global no ocorre entre
empresas, mas entre cadeias de fornecimento. A gesto da logstica e do fluxo de
informaes em toda a cadeia permite aos executivos avaliar, pontos fortes, e pontos
fracos na sua cadeia de fornecimento, auxiliando a tomada de decises que resultam na
reduo de custos, aumento da qualidade, entre outros, aumentando a competitividade do
produto e/ou criando valor agregado e diferenciais em relao a concorrncia. o grupo
de fornecedores que supre as necessidades de uma empresa na criao e no
desenvolvimento dos seus produtos.
CRM  Customer Relationship Management. Gesto de Relacionamento com o Cliente.
Foi criada para definir toda uma classe de ferramentas que automatizam as funes de
contato com o cliente, essas ferramentas compreendem sistemas informatizados e
fundamentalmente uma mudana de atitude corporativa, que objetiva ajudar as
companhias a criar e manter um bom relacionamento com seus clientes armazenando e
inter-relacionando de forma inteligente, informaes sobre suas atividades e interaes
com a empresa.

14

Fundamentos e Aplicaes de BI

O Data Warehouse (DW) consiste em organizar os dados corporativos de maneira


integrada, com uma nica verso da verdade, histrico, varivel com o tempo e gerando
uma nica fonte de dados, que ser usada para abastecer os Data Marts (DM).
Isso permite aos gerentes e diretores das empresas tomarem decises embasadas em fatos
concretos, cruzando informaes de diversas fontes. Isso agiliza a tomada de deciso e
diminui os erros.
Antes da popularizao dos DW e das ferramentas ERP, uma verdadeira integrao de
dados era apenas um sonho sistemas trocavam dados na forma que atendesse s
necessidades de cada um deles, sendo por isso chamado sistemas integrados, sem que
essa integrao sequer se aproximasse do que se v hoje nos ERP, cujos fornecedores tm
sistematicamente dado a seus produtos caractersticas que os tornam facilmente
fornecedores de dados aos warehouses.
ERP e a tecnologia de DW podem suprir estas insuficincias, integrando dados, provendo
dados histricos e permitindo a recuperao de forma sinttica ou analtica.
A integrao dos dados permite a um executivo ter uma viso corporativa dos dados.
Uma vez que o warehouse j esteja construdo, a prxima etapa ser sua explorao, no
sentido de buscar, utilizar, as informaes nele contidas. Esse trabalho, que chamado
data mining, permite descobrir padres importantes, relaes de causa e efeito que
vinham passando despercebidas, tendncias a longo prazo etc., de forma a permitir a
melhoria dos processos.
As formas de extrao mais comuns no mercado para DW so relatrios, consultas, EIS
(Executive Information Systems), ferramentas que utilizam OLAP e as ferramentas de
Data Mining. A nova tendncia a integrao com o ambiente web, permitindo maior
agilidade em consultas estticas e dinmicas.
Os sistemas de base de dados tradicionais utilizam a normalizao no formato de dados
para garantir consistncia dos dados e uma minimizao do espao de armazenamento
necessrio. Entretanto, algumas transaes e consultas em bases de dados normalizadas
podem se tornar lentas devido s operaes de juno entre tabelas. Um Data Warehouse
utiliza dados em formato no normalizado. Isto aumenta o desempenho das consultas e,
como benefcio adicional, o processo torna-se mais intuitivo para os usurios comuns.
Essa maneira de reordenar os dados chama-se Modelagem Dimensional, e o resultado da
modelagem o Modelo Dimensional, ou MD.
Geralmente o data warehouse no armazena informaes sobre os processos correntes de
uma nica atividade de negcio e sim cruzamentos e consolidaes de vrias unidades de
negcios de uma empresa.

15

Fundamentos e Aplicaes de BI

A possibilidade de manipular dados e formas de apresentao de maneira rpida um dos


pontos fortes de um data warehouse. Essa caracterstica faz com que os relatrios sejam
mais comumente utilizados em tela e no impressos. O analista de informao ou pessoa
que precisa dos dados, pode ento navegar nas informaes por diversas maneiras e ao
final pode imprimir e at mesmo salvar aquela viso para uma futura consulta.
O banco de dados Teradata foi projetado para trabalhar com Data Warehouse. Existem
produtos direcionados para a rea de DW em relao a empresas que desenvolvem banco
de dados relacionais. Exemplo de empresas que apresentam produtos deste tipo so:
Oracle, IBM DB2 e Microsoft SQL Server.
As ferramentas para data warehouse consistem em dois tipos: transformao e limpeza de
dados; e ferramentas de acesso para usurios finais. Estas ferramentas asseguram que o
data warehouse contm integridade de dados, consistncia atravs do tempo, alta
eficincia e baixo custo de operao. O elemento importante de um data warehouse que
os dados so armazenados em diferentes nveis de detalhamento (granularidade).
Caractersticas de um data warehouse
Orientado ao assunto: os dados so organizados de acordo com o assunto ao invs da
aplicao. Por exemplo, um companhia de seguros utilizando um data warehouse poderia
organizar seus dados por consumidor, prmio e franquia, ao invs de diferentes produtos
(automvel, vida, etc.). Os dados so organizados por assunto, contendo somente as
informaes necessrias para o processo de suporte deciso.
Integrado: quando os dados residem em vrias aplicaes diferentes no ambiente
operacional, a codificao dos dados normalmente inconsistente. Por exemplo, em uma
aplicao o gnero pode estar codificado como "m" e "f" e em uma outra, como 0 e 1.
Quando os dados so movidos de um ambiente operacional para o data warehouse, estes
assumem uma conveno de cdigo consistente - neste caso, o campo gnero
transformado em "m" e "f".
Variao em relao ao tempo: O data warehouse contem um lugar para o
armazenamento de dados que tm 5, 10 anos ou mais, para serem utilizados em
comparaes, tendncias e previses. Estes dados no so atualizados.
No-volatilidade: Os dados no so atualizados ou modificados em nenhum momento
uma vez que estes entram no data warehouse, so somente acessados.

16

Fundamentos e Aplicaes de BI

Processos em data warehousing


A primeira fase do processo de data warehousing consiste em "isolar" a sua informao
operacional atual, preservando a segurana e integridade de aplicaes de OLTP crticas
ao mesmo tempo em que permite o acesso a base de dados. O data warehouse resultante
pode consumir centenas de gigabytes, terabytes - de espao em disco. O que necessrio
ento so tcnicas eficientes para armazenar e acessar grandes quantidades de
informao. Alm disso, grandes organizaes analisaram que somente sistemas de
processamento paralelo podem oferecer largura de banda suficiente para estas aplicaes.
Logo, o data warehouse acessa dados de uma variedade de bancos de dados operacionais
heterogneos. Os dados so ento transformados e enviados para o data warehouse em
um modelo selecionado. A transformao de dados e o processo de movimentao so
executados toda vez que uma atualizao nos dados do depsito requerida, logo deve
haver alguma forma de automatizao para gerenciar e executar estas funes.
A limpeza dos dados um importante aspecto da criao de um data warehouse eficiente,
pois a remoo de certos aspectos dos dados operacionais, tal como informaes de
transao de baixo-nvel, que retarda muitas consultas. O estgio de limpeza deve ser o
mais dinmico possvel para acomodar todos os tipos de consulta, mesmo aquelas que
requerem informaes de baixo-nvel. Os dados devem ser extrados de fontes de
produo em intervalos regulares de tempo e concentrados de maneira central, mas o
processo de limpeza deve remover duplicaes e conciliar diferenas entre vrios estilos
de colees de dados.
Uma vez que os dados tenham sido limpos ento so transferidos para o data warehouse,
que tipicamente um grande banco de dados em um sistema de alta performance, tanto
SMP - Symmetric Multi-Processing ou MPP - Massively Parallel Processing. Um
absurdo poder de computao tambm um importante aspecto do data warehousing,
pela complexidade envolvida no processamento e consultas e pela vasta quantidade de
dados que a organizao deseja utilizar no depsito.

Critrios para data warehouse


Desempenho de carregamento - Data warehouses requerem o carregamento incremental
de novos dados em bases peridicas entre janelas de tempo estreitas; o desempenho do
processamento de carregamento deve ser medido em centenas de milhares de linhas e
gigabytes por hora, e no deve restringir artificialmente o volume de dados requerido
para o negcio.
Processamento de carga - Muitas etapas devem ser tomadas para o carregamento de
dados novos ou modificados dentro do data warehouse, incluindo converses de dados,
filtragem, reformatao, checagem de integridade, armazenamento fsico, indexao e
modificao dos metadados. Estas etapas devem ser executadas como um simples e nica
unidade de trabalho.
Gerenciamento de qualidade dos dados - A mudana para o gerenciamento baseado em
fatos exige a mais alta qualidade de dados possvel. O warehouse deve assegurar
consistncia local, consistncia global, e integridade referencial mesmo com as fontes

17

Fundamentos e Aplicaes de BI

no confiveis e o enorme tamanho do banco de dados. Embora o carregamento e a


preparao sejam etapas necessrias, no so suficientes. A taxa de desempenho das
consultas a medida de sucesso para aplicaes de data warehouse. Quanto mais
consultas forem atendidas, mais os analistas so motivados a realizar mais consultas.
Desempenho das consultas - O gerenciamento baseado em fatos e a anlise ad-hoc no
devem ser retardados ou inibidos pela performance do RDBMS de data warehouse;
consultas grandes e complexas para operaes comerciais essenciais devem ser
completadas em segundos, no dias.
Escalabilidade em relao ao tamanho do data warehouse - O tamanho dos data
warehouses est crescendo a taxas estonteantes. So encontrados tamanhos de GBytes,
TBytes e dependendo da empresa em PBytes. O SGBD no deve ter nenhum tipo de
limitao na arquitetura, devendo inclusive suportar o gerenciamento modular e paralelo.
Outra caracterstica que deve o SGBD deve suportar a disponibilidade contnua nos
eventos de falha de pontos e deve tambm prover mecanismos fundamentalmente
diferentes para recuperao. Deve tambm suportar dispositivos de armazenamento em
massa tais como discos pticos. Por ltimo, o desempenho das consultas no deve ser
dependente do tamanho do banco de dados, e sim na complexidade das mesmas.
Escalabilidade macia a usurios - O acesso aos dados no warehouse no deve mais ser
limitado a uma elite de poucos. O servidor de RDBMS deve suportar centenas, at
milhares de usurios concorrentes enquanto mantem um desempenho de consultas
aceitvel.
Data warehouse disponvel em rede - Data warehouse raramente existem isolados.
Mltiplos sistemas de data warehouse cooperam em uma rede maior de data warehouses.
O servidor deve incluir ferramentas que coordenam os movimentos de subconjuntos de
dados entre warehouses. Os usurios devem estar aptos a visualizar e trabalhar com
mltiplos warehouses de um simples workstation cliente. Gerentes de warehouse devem
gerenciam e administrar a rede de warehouses de uma simples locao fsica.
Administrao do warehouse - A enorme escala e a natureza cclica atravs do tempo do
data warehouse exige flexibilidade e facilidade administrativa. O SGBD deve prover
controles para a implementao de limites de recursos e priorizao de consultas para
servir s diferentes necessidades de classes de usurios e atividades. O SGBD deve
tambm prover um monitoramento e reconfigurao da carga de trabalho de maneira que
os recursos do sistema possam ser otimizados para o mximo desempenho.
Anlise dimensional integrada - O poder de vises multidimensionais amplamente
aceito, e o suporte dimesional deve ser inerente a este SGBD para fornecer o mais alto
desempenho para as ferramentas de OLAP relacionais. O SGBD deve suportar a criao
rpida e fcil de resumos pr-computados, comuns em grandes data warehouses. Deve
tambm prover as ferramentas de manuteno para automatizar a criao destas
agregaes pr-computadas. O clculo dinmico de agregados deve ser consistente com
as necessidades de desempenho interativas.

18

Fundamentos e Aplicaes de BI

Funcionalidade de consultas avanadas - Usurios finais requerem avanados clculos


analticos, anlises comparativas e sequenciais, e acesso consistente para dados
resumidos e detalhados. O SGBD deve prover um conjunto completo de operaes
analticas, incluindo operaes estatsticas e sequenciais de ncleo.

2.4-Metadados
Definidos como dados dos dados, constituem peas fundamentais num DW. Isso
porque em um DW, alm do banco de dados, gera-se uma documentao muito maior
que nos banco de dados tradicionais. feito o levantamento dos relatrios a serem
gerados, de onde vm os dados para alimentar o DW, os processos de extrao,
tratamento e rotinas de carga de dados. Tudo isso, acrescido das regras de negcios da
empresa, das mudanas ocorridas ao longo do tempo e da frequncia de acesso aos dados,
gera os metadados.
Os metadados mantm as informaes sobre o que est onde num DW. Eles podem
surgir de vrios locais durante o decorrer do projeto.
Podem ser encontrados em vrios locais durante o desenvolvimento de um DW.
Alguns tipos de metadados:
Repositrios de ferramentas CASE  Normalmente os dados contidos em
ferramentas CASE so estruturados, o que facilita a integrao automtica entre a
origem dos metadados e o repositrio do ambiente de DW. Pode-se extrair
informaes sobre a origem dos dados, o fluxo dos dados (os processos que
utilizam e transportam os dados), o formato dos dados e as definies de
negcios.
Documentao do desenvolvimento dos sistemas operacionais (OLTP)  O tipo
de metadados potencialmente disponvel idntico ao item acima. A diferena
que normalmente a documentao de desenvolvimento dos sistemas no est
estruturada, o que pode dificultar o entendimento das origens e fluxos dos dados.
Cdigo fonte dos sistemas operacionais (OLTP)  Quando no existe uma
documentao eficiente dos sistemas operacionais, possvel extrair as
informaes sobre eles atravs dos programas fontes. Como vasculhar todos os
programas de um ou vrios sistemas operacionais a procura de regras um
trabalho demorado e oneroso, possvel simplesmente utiliz-los como forma de
esclarecer dvidas que a documentao no contempla, tambm cobre os mesmos
tipos de informaes das fontes anteriores.
Entrevistas  Apesar de no ser uma fonte estruturada de informaes,
entrevistar profissionais da empresa que entendam do negcio, como gerentes e
analistas, de vital importncia. Destas entrevistas pode se obter regras e
informaes que no esto explcitas na documentao dos sistemas, como
requisitos para teste dos dados e indicadores de qualidade dos dados.
O prprio ambiente do DW  Informaes tais como frequncia de acesso s
informaes, em que nvel de agregao, tempo de resposta de cada consulta,

19

Fundamentos e Aplicaes de BI

auditoria de acesso de informaes por usurios, so informaes interessantes de


se manter, que podem ser geradas pelo prprio sistema ao longo de sua utilizao,
podendo ser usadas, dentre outros propsitos, para a criao de estruturas de
metadados.
Antes do Data Warehouse ser acessado eficientemente, necessrio saber, pelo menos,
quais os dados que esto disponveis e onde eles esto localizados, caso contrrio ser
como tentar encontrar um telefone sem o auxlio de uma lista telefnica. De forma
simples podemos dizer que o significado dos dados est nos METADADOS. Os
metadados permitiro ao usurio transformar os dados "crus" em informaes que gerem
conhecimento e tragam vantagem competitiva.
Metadados o principal componente do Data Warehouse.
Metadado a descrio do dado, do ambiente onde ele reside, como ele manipulado e
para onde distribudo.
Metadado uma documentao.
Metadado uma abstrao do dado. o dado de alto nvel que descreve o dado de baixo
nvel. Metadado o instrumento que transforma dado "cru" em conhecimento. Por
exemplo, o metadado, na forma de definio de campo, que informa que uma dada
cadeia de bits um endereo de cliente, parte de uma imagem fotogrfica ou parte do
cdigo de um programa de computador.
Como normalmente as aplicaes de mbito operacional da empresa so desenvolvidas
em tempos diferentes por pessoas diferentes, no raro o surgimento de dados
inconsistentes ou redundantes. Alm disso, as organizaes costumam apresentar um
outro problema comum: elas tm mltiplas fontes de dados. Cada uma dessas fontes tem
seu prprio conjunto de regras pr-definidas, convenes para nomes, e formatos de
arquivos, etc. Neste caso, praticamente impossvel para o usurio, e mesmo para o
administrador, saber que fonte de dados usar, em diferentes circunstncias.
A Importncia dos Metadados
O papel dos metadados est ampliando o modo como as organizaes desenvolvem uma
estratgia de Data Warehousing que pode resultar na criao de arquivos de dados
operacionais, Data Warehouses integrados e mltiplos Data Marts. Os metadados devem
isolar o usurio da complexidade de acessar informaes distribudas, enquanto facilita a
atualizao e sincronizao de vrios bancos de dados. Se isso no funcionar, os usurios
voltaro a se encontrar com os problemas que o Data Warehouse pretendia resolver, ou
seja, diferentes respostas para a mesma questo e a resultante falta de confiana na
informao obtida.

20

Fundamentos e Aplicaes de BI

Sem uma administrao de dados efetiva, um Data Warehouse no atingir o seu objetivo
de integrao dos dados. Nesse sentido o metadado constitui o principal recurso para a
administrao de dados no Data Warehouse e constitui um componente formal
extremamente importante no processo de Data Warehousing.
Sem metadados, os dados no tm significado. Sem metadados, localizar informaes
contidas em um Data Warehouse torna-se uma tarefa muito difcil, semelhante a procurar
o telefone de uma pessoa sem a ajuda de uma lista telefnica.
Sem metadados, usurios de negcios sero como turistas deixados em uma nova cidade
sem qualquer informao sobre essa cidade, e os administradores do Data Warehouse
sero como os administradores da cidade que no tm idia do tamanho dessa cidade e
em que velocidade ela est crescendo. Um Data Warehouse sem metadados adequados
um armrio cheio de papis, mas sem pastas ou etiquetas.
Metadados, no s descrevem o contedo do Data Warehouse, como tambm, fornecem
ao usurio informaes teis para o julgamento da qualidade do contedo. Tambm pode
descrever cada fato contido no Warehouse, em termos de quando ele foi atualizado pela
ltima vez, a fonte do fato e como ele gerado.
A falta de uma abordagem integrada para consolidar, gerenciar e manter os metadados
atualizados pode gerar muitos riscos para a credibilidade de um projeto de Data
Warehouse: informaes incorretas, qualidade dos metadados, perda de produtividade,
performance inconstante, dificuldade para atualizao e crescimento.
Metadados faltantes ou no-confiveis levam a uma situao familiar onde um
departamento diz ao diretor que os lucros da empresa esto crescendo 10%, enquanto um
outro diz que baixaram 15%. Cada departamento est usando suas prprias cifras,
coletadas de acordo com seus prprios procedimentos e interpretadas pelas suas prprias
aplicaes.
No difcil chegar a concluso que os metadados so importantes em um Data
Warehouse. Mas existem algumas perguntas bsicas que tambm devem ser respondidas
pelos metadados:
. Que tabelas, atributos e chaves o Data Warehouse contm ?
. Qual a origem de cada conjunto de dados ?
. Que transformao lgica foi usada na carga do dado ?
. Como o metadado tem mudado ao longo do tempo ?
. Quais aliases5 existem e como eles se relacionam ?
. Quais so as referncias-cruzadas entre termos tcnicos e de negcios ?
. Com qual freqncia os dados so carregados ?
. Qual o volume de dados existente ?

21

Fundamentos e Aplicaes de BI

Tipo de Informao Considerada Metadado


Um repositrio de metadados uma ferramenta essencial no gerenciamento de um Data
Warehouse, no momento de converter dados em informaes para o negcio. Entre outras
coisas, um repositrio de metadados bem construdo deve conter informaes sobre a
origem do dado, regras de transformao, nomes e aliases, formatos de dados etc. Ou
seja, este "dicionrio" deve conter muito mais do que descrio sobre colunas e tabelas,
deve conter informao que adicione valor ao dado. Metadados so utilizados
normalmente como um dicionrio de informaes e sendo assim, devem incluir, entre
outras coisas:
Fonte dos dados Qualquer elemento de dado necessita que sua origem seja identificada,
seja ela um sistema ou um processo. importante que a fonte do dado seja nica para que
no haja confuso.
Destino dos dados To importante quanto saber a origem do dados saber o seu
destino, principalmente quando esse dado usado como fonte para outras operaes. Esta
informao tambm deve ser nica.
Formato dos dados O formato dos dados incluem informaes do tipo: tamanho do
campo e tipo do dado. Nomes e aliases Cada dado deve ter um nome, que deve ser um
nome tcnico ou relativo uma rea de negcios. Os aliases podem ser usados em
qualquer caso. Simplicidade, consistncia e reviso constante so chaves para a criao e
manuteno de nomes. Os aliases tornam o Data Warehouse muito mais amigvel e
entendvel, principalmente para os usurios de negcios, por permitir, por exemplo,
que uma tabela seja chamada de "Produtos vendidos por filial" ao invs de PR-FIL.
Tambm bastante til quando diferentes departamentos desejam usar seus prprios
nomes para identificar um mesmo dado.
Definies de negcios Estas definies so o corao dos metadados. necessrio que
um entendimento de cada elemento de dado seja suportado dentro de um contexto de
negcio. Tambm importante garantir a consistncia dessas informaes, para que os
usurios possam encontrar rapidamente uma definio para a informao que precisam.
As definies devem ser objetivas e devem evitar referncias a outros metadados, a fim
de facilitar seu entendimento.
Regras de transformao Estas regras so consideradas as regras de negcio de uma
forma codificada. Cada regra deve estar ligada a um elemento de metadado. Se uma regra
utilizada em mais de uma aplicao, deve-se garantir que o resultado seja o mesmo em
todas essas aplicaes.
Atualizao dos dados Normalmente, o histrico das atualizaes mantido pelo
prprio banco de dados, mas ter um elemento de metadado que possa, por exemplo,
identificar a ltima atualizao de um dado pode ser muito til para usurios que querem
determinar o estado de atualidade desse dado ou examinar a consistncia de uma
dimenso tempo em um Data Warehouse.

22

Fundamentos e Aplicaes de BI

Requisitos de teste Metadados o local certo para manter os critrios de julgamento de


um dado ou validao de uma tabela por uma rotina de teste. Deve-se manter um padro
para esses procedimentos de teste.
Indicadores de qualidade Pode haver a necessidade de indicadores para indicar a
qualidade de um elemento de dado. A fonte do dado, a quantidade de processamento
aplicado ele e muitos outros fatores podem afetar a qualidade do dado. O uso do dado
tambm pode ser considerado para a criao de indicadores de qualidade.
Processos automticos (triggers) comum a existncia de procedimentos automticos
que procuram manter a consistncia do banco de dados durante as atualizaes. Esses
triggers devem estar liberados para a consulta de usurios e desenvolvedores, a fim de
evitar a criao de uma situao que possa "disparar" um processo fora do seu contexto
normal de utilizao.
Gesto das informaes Est associada com propriedade e responsabilidade sobre os
dados. Deve-se ter definida e acessvel a informao de quem responsvel pelos dados e
pela entrada de metadados em um Data Warehouse.
Acesso e segurana Quanto maior o acesso s informaes em um Data Warehouse,
maior deve ser o cuidado com a segurana dessas informaes. Os metadados devem
conter informaes suficientes para identificao de quem pode ler, atualizar, excluir ou
inserir informaes no banco de dados. Tambm deve haver informaes sobre quem
controla esses direitos de acesso.

Quais so as Fontes de Metadados?


Basicamente, existem duas grandes fontes de metadados: a formal e a informal. Estas
fontes compreendem os metadados tcnicos e de negcios de uma organizao. As fontes
de metadados formais so aquelas que j foram discutidas e documentadas.
Normalmente, estes metadados so armazenados em ferramentas ou documentos que so
mantidos, distribudos e reconhecidos por toda a organizao. Estas fontes formais de
metadados alimentam tantos os metadados tcnicos como os de negcios.
Os metadados informais consistem do conhecimento corporativo, polticas e orientaes
que no esto em um formato padro. Este o tipo de informao que as pessoas "apenas
sabem" e que faz parte do "conhecimento da empresa". Embora no seja formalmente
documentado, este conhecimento to importante quanto as fontes formais de
metadados.
Frequentemente, os metadados informais fornecem algumas das informaes mais
importantes j que tendem a estar relacionados aos negcios. importante notar que,
normalmente, muitos dos metadados de negcios so informais. Para se atingir um
resultado, necessrio que este metadado seja capturado, documentado, formalizado e
refletido no Data Warehouse, transformando, dessa maneira, um metadado informal em
um metadado formal.

23

Fundamentos e Aplicaes de BI

Como as empresas no so iguais, muito difcil especificar onde os metadados


informais podem ser encontrados, mas de maneira geral as fontes poderiam ser: gesto
dos dados, regras de negcios, definies de negcios, transformaes e sumarizaes.

Metadados Tcnicos x Metadados de Negcios


Existem dois tipos de metadados que podem estar no repositrio: tcnicos e de negcios.
Metadados tcnicos fornecem aos desenvolvedores e usurios tcnicos de sistemas de
suporte deciso, a confiana de que o dados est correto. Alm disso, metadados
tcnicos so crticos para a manuteno e o crescimento contnuos de um Data
Warehouse. Sem metadados tcnicos, a tarefa de analisar e implementar mudanas em
um DSS significativamente mais difcil e consome mais tempo.
Os metadados de negcios so a ligao entre o Data Warehouse e os usurios de
negcios. Esses dados fornecem uma espcie de mapa aos usurios para que eles possam
acessar os dados, tanto no Data Warehouse como nos Data Marts. Os usurios de
negcios so basicamente executivos ou analistas de negcios e com isso tendem a ser
menos tcnicos, portanto, eles precisam ter o DSS definido para eles em termos de
negcios. Os metadados de negcios mostram em termos de negcios, que relatrios,
queries, e dados esto no Data Warehouse, localizao dos dados, confiabilidade dos
dados, contexto dos dados, regras de transformao que foram aplicadas e quais as
origens desses dados.
Os projetos de Data Warehouse e Data Mart necessitam ter um repositrio de metadados
como parte de seus objetivos principais, desde o incio do projeto. Esse repositrio
precisa ser construdo com uma tecnologia confivel e considerando os usurios de
negcios. Alm disso, os metadados necessitam de mecanismos para os usurios notcnicos poderem navegar e acessar as informaes no repositrio.
O repositrio de metadados ajuda significativamente o DSS a tornar as informaes em
Data Warehouse e Data Mart mais visveis, entendveis e acessveis aos usurios. Em
resumo, um repositrio pode viabilizar ou no um Data Warehouse.
Metadados para Diferentes Usurios
Os Metadados para Usurios de Negcios mostram onde os usurios de negcio podem
encontrar as informaes, como elas podem ser acessadas, quanto tempo isso levar, e
qual a qualidade esperada quando elas forem obtidas. O usurio de negcio sem acesso
aos metadados sente-se como um turista em uma nova cidade sem um mapa de
orientao, nesse caso os metadados atuam com um centro de informaes tursticas que
daro informaes completas sobre como proceder para chegar aos vrios lugares de
interesse.

24

Fundamentos e Aplicaes de BI

Os Metadados para Administradores de Dados podem facilitar a tarefa dos


administradores atravs de uma viso especial dos metadados que inclui, entre outras
coisas, perfis e medidas de crescimento. Estas informaes so importantes para que o
administrador possa assegurar que os metadados estejam atualizados e exatos.
Os Metadados para Usurios Tcnicos afetam a habilidade dos desenvolvedores e
analistas para manter e expandir Data Warehouses. Sem esses dados atualizados, eles no
sero capazes de manter e expandir esses Data Warehouses que podem se transformar em
conflitantes ilhas de informao. O analista (desenvolvedor) comea entrevistando
usurios para entender suas necessidades e os metadados mostraro ao analista como e
onde encontrar as informaes necessrias para suprir essas necessidades.

2.5-Data Mart
Um Data Mart um Data Warehouse reduzido que fornece suporte deciso de um
pequeno grupo de pessoas.
Algumas organizaes so atradas aos Data Marts no apenas por causa do custo mais
baixo e um tempo menor de implementao, mas tambm por causa dos correntes
avanos tecnolgicos.
So elas que fornecem um SAD (Sistemas de Apoio Deciso) customizado para grupos
pequenos, de tal modo que um sistema centralizado pode no estar apto a fornecer. Data
Marts podem servir como veculo de teste para companhias que desejam explorar os
benefcios do Data Warehouse.
O Data Warehouse pode ser uma deciso estratgica, mas no pode ser encarado com
imediatismo, ou seja no apenas algo que se realiza aos poucos, mas tambm um
processo contnuo de atualizao e consolidao dos dados corporativos. Por isso, os
investimentos em um sistema desse tipo no devem nem podem ser feitos de uma nica
vez, mas de forma gradual ao longo do tempo.
preciso ter em mente que as diferenas entre Data Mart e Data Warehouse so apenas
com relao ao tamanho e ao escopo do problema a ser resolvido. Portanto, as definies
dos problemas e os requisitos de dados so essencialmente os mesmos para ambos.
Enquanto um Data Mart trata de problema departamental ou local, um Data Warehouse
envolve o esforo de toda a companhia para que o suporte decises atue em todos os
nveis da organizao. Sabendo-se as diferenas entre escopo e tamanho, o
desenvolvimento de um Data Warehouse requer tempo, dados e investimentos gerenciais
muito maiores que um Data Mart.
Os Data Marts atendem as necessidades de unidades especficas de negcio ao invs das
necessidades da corporao inteira. Eles otimizam a entrega de informao de suporte
deciso e se focam na sumarizada e/ou dados exemplificativos ao invs do histrico de
nveis atomizados. Eles podem ser apropriados e gerenciados por pessoal fora do
departamento de informtica das corporaes.

25

Fundamentos e Aplicaes de BI

A criao de um Dataa Warehouse requer tempo, dinheiro e considervel esforo


gerencial.
H um consenso entre os fornecedores de solues de Data Warehouse. A idia
comear pequeno, mas pensando grande. E o que est acontecendo. Na maioria dos
casos, as empresas que optam pelo Data Warehouse iniciam o processo a partir de uma
rea especfica da empresa para depois ir crescendo aos poucos. Mesmo no caso de Full
Warehouse ou Data Warehouse completos o processo costuma ser organizado a partir
dos Data Marts.
A variao de custo e durao de um projeto de Data Warehouse depende do tamanho e
da infra-estrutura da base de dados a ser trabalhada e tambm da necessidade de poder
de fogo (do quo estratgico e eficiente tem que ser o sistema para o cliente). Acima de
tudo, a empresa tem que saber identificar quais so os tipos de informaes mais valiosas.
Por muitos anos, todos os sistemas que extraam dados de sistemas legados e os
armazenavam de maneira utilizvel para suporte deciso eram chamados Data
Warehouse. Ao longo dos ltimos anos, uma distino tem sido feita entre os
corporativos Data Warehouses e os departamentais Data Marts, mesmo que geralmente o
conceito ainda continue sendo chamado de data warehousing.
Debates na indstria em geral indicam que aproximadamente 70 a 80 por cento de todos
os Data Warehouses atualmente em produo so, de fato, Data Marts.
A crescente popularidade desses mal definidos Data Marts em cima da popularidade dos
grandes sistemas de Data Warehouses corporativos baseada em muitos bons motivos:
. Os Data Marts tm diminudo drasticamente o custo de implementao e
manuteno de sistemas de apoio deciso e tm os posto ao alcance de um nmero
muito maior de corporaes;
. Eles podem ser prototipados muito mais rpido, com alguns pilotos sendo
construdos entre 30 e 120 dias e sistemas completos sendo construdos entre 3 e
seis meses;
. Os Data Marts tm o escopo mais limitado e so mais identificados com grupos de
necessidades dos usurios, o que se traduz em esforo/time concertrado.
Os departamentos autnomos e as pequenas unidades de negcio frequentemente
preferem construir os seu prprio sistema de apoio deciso via Data Marts. Muitos
departamentos de informtica esto vendo a efetividade deste approach e esto agora
construindo o Data Warehouse por assunto ou um Data Mart por vez, gradualmente
ganhando experincia e garantindo o suporte dos fatores chave de gerenciamento,
possibilitando, ento, benefcios concertos muitas vezes ao ano. Comeando com planos
modestos e os desenvolvendo na medida em que se adquire mais conhecimento sobre as
fontes de dados e as necessidades dos usurios, faz com que as organizaes justifiquem
os Data Marts na medida que progridem.

26

Fundamentos e Aplicaes de BI

Algumas vezes, projetos que comeam como Data Warehouse se transformam em Data
Marts. Quando as organizaes acumulam grandes volumes de dados histricos para
suporte deciso que se mostram pouco ou nunca utilizados, elas podem reduzir o
armazenamento ou arquivamento de informao e contrair o seu Data Warehouse em um
Data Mart mais focado. Ou elas podem dividir o warehouse em vrios Data Marts,
oferencendo tempos de resposta mais rpidos, acesso mais fcil e menos complexidade
para os usurios finais.
As questes de planejamento, projeto e implementao so as mesmas encontradas em
qualquer fase da implementao de um DW, pois uma parte dos especialistas argumenta
que o DW uma evoluo natural de um Data mart que comeou localizado e cresceu
para atender um escopo maior. Essa viso tem defesa menos tcnica e mais intuitiva do
que sua contra-parte: o Data mart criado a posteriori do DW, pois ele seria montado
com dados extrados do DW para atender especificamente um setor da organizao.
Numa viso comparativa dos dados, onde consideramos os quesitos escopo, integrao,
tempo, agregao, anlise e dados volteis, percebemos que a diferena est no escopo,
pois enquanto o DW feito para atender uma empresa como um todo, o data mart
criado para atender um sub-conjunto da empresa. Repare que atender um sub-conjunto da
empresa pode significar reunir dados de outros setores, j que, na prtica, raramente um
nico setor possui ou gera toda informao que precisa. Vem dessa observao a defesa
da tese de que o Data mart construdo aps o DW.
Algumas caractersticas do Data Mart:
. Dados agregados;
. No possui necessariamente um histrico das informaes;
. Esquema estrela (fatos e dimenses);
. Pode ser reconstrudo a partir dos dados existentes no DW;
. Pequeno volume de dados;
. Otimizado para consultas pontuais.

27

Fundamentos e Aplicaes de BI

Geralmente so dados referentes a um assunto em especial (ex: Vendas, Estoque,


Controladoria) ou diferentes nveis de sumarizao (ex: Vendas Anual, Vendas Mensal,
Vendas 5 anos), que focalizam uma ou mais reas especficas. Seus dados so obtidos do
DW, desnormalizados e indexados para suportar intensa pesquisa. Data marts extraem e
ajustam pores de DWs aos requisitos especficos de grupos/departamentos. As questes
de planejamento, projeto e implementao so as mesmas encontradas em qualquer fase
da implementao de um DW, pois uma parte dos especialistas argumenta que o DW
uma evoluo natural de um Data mart que comeou localizado e cresceu para atender
um escopo maior. Essa viso tem defesa menos tcnica e mais intuitiva do que sua
contra-parte: o Data mart criado a posteriori do DW, pois ele seria montado com dados
extrados do DW para atender especificamente um setor da organizao. Numa viso
comparativa dos dados, onde consideramos os quesitos escopo, integrao, tempo,
agregao, anlise e dados volteis, percebemos que a diferena est no escopo, pois
enquanto o DW feito para atender uma empresa como um todo, o data mart criado
para atender um sub-conjunto da empresa. Repare que atender um sub-conjunto da
empresa pode significar reunir dados de outros setores, j que, na prtica, raramente um
nico setor possui ou gera toda informao que precisa. Vem dessa observao a defesa
da tese de que o Data mart construdo aps o DW.
Os Data Marts podem surgir de duas maneiras. A primeira top-down e a segunda a
botton-up.
Top-down: quando a empresa cria um DW e depois parte para a segmentao, ou seja,
divide o DW em reas menores gerando assim pequenos bancos orientados por assuntos
aos departamentos.
Botton-up: quando a situao inversa. A empresa, por estratgia sua, prefere primeiro
criar um banco de dados para somente uma rea. Com isso os custos so bem inferiores
de um projeto de DW completo. A partir da visualizao dos primeiros resultados parte
para outra rea e assim sucessivamente at resultar em um Data Warehouse.
No DW podemos ter o modelo de dados hbrido ou pode ser completamente relacional, j
no DM o modelo totalmente dimensional. A complexidade de tratamento das
informaes no DW maior, porque temos de olhar toda a estrutura da empresa, j no
DM fica mais fcil, pois estamos olhando apenas uma parte dela. Portanto, cabe a cada
empresa avaliar a sua demanda e optar pela melhor soluo. Segundo estimativas,
enquanto um Data Mart custa em torno de US$ 100 mil a US$ 1 milho e leva cerca de
120 dias para estar pronto, um DW integral comea em torno dos US$ 2 milhes e leva
cerca de um ano para estar com a sua primeira verso em produo.
Modelagem Multidimensional
uma tcnica de concepo e visualizao de um modelo de dados de um conjunto de
medidas que descrevem aspectos comuns de negcios. utilizada especialmente para
sumarizar e reestruturar dados e apresent-los em vises (camada de apresentao) que
suportam a anlise dos valores desses dados.

28

Fundamentos e Aplicaes de BI

Um modelo multidimensional formado por 3 elementos bsicos:


. Fatos
. Dimenses
. Medidas (varives)
Fatos: uma coleo de itens de dados composto de medidas. utilizado para analisar o
processo de negcio de uma empresa, refletindo assim a evoluo dos negcios do dia-adia desta empresa. Ele implementado em tabelas denominadas tabelas de fato (fact
tables) e representado por valores numricos;
Dimenses: so os elementos que participam de um fato e que determinam o contexto de
um assunto de negcios. As dimenses podem ser compostas por membros que podem
conter hierarquias. Membros so as possveis divises ou classificaes de uma
dimenso. Por exemplo, a dimenso tempo, pode ser dividida nos seguintes membros:
ano, trimestre e ms, e a dimenso localizao em: cidade, estado e pas;

Figura 2: Indicao de agregao de algumas dimenses

Figura 3: Sugesto de consulta baseado em alguns itens da dimenso

29

Fundamentos e Aplicaes de BI

Medidas (variveis): so os atributos numricos que representam um fato, ou seja,


representam o desempenho de um indicador de negcios relativo s dimenses que
participam desse fato. Uma medida determinada pela combinao das dimenses que
participam de um fato e esto localizados como atributos de um fato. Por exemplo, o
valor em reais das vendas, o nmero vendido de unidades de produtos e a quantidade em
estoque.

Figura 4: Exemplo de um Modelo Multimensional Estrela

Etapas na Modelagem Multidimensional num projeto de Data Warehouse ou Data Mart


Escolha do processo de negcio
. Departamental ou corporativo;
. Pedidos, seguros, inventrio, vendas, entregas.
Escolha da granularidade do Processo de Negcio
. Nvel mais detalhado das medidas da tabela de fatos;
. Transaes individuais ou posies peridicas;
. Cada item de uma nota fiscal de venda, um carto de embarque em um vo,
posio diria de um produto em estoque, posio mensal de uma conta bancria.
Escolha das dimenses para cada tabela de fatos
. Como descrever os dados do negcio?
. Data (tempo), produto, cliente, tipo de transao.

30

Fundamentos e Aplicaes de BI

Escolha das medidas para a tabela de fatos


. Que medidas devem ser acompanhadas?
. Granularidade definida pelas dimenses relacionadas;
. Quantidade solicitada, Custo em reais;
. Percentuais no devem ser armazenados informar nmeros ou uma
denominao.

2.6-Data Mining
Um dos grandes problemas dos especialistas em anlise de informao a transformao
de dados em informao. Como fazer isso de uma forma automatizada e no menor tempo
possvel? Uma das respostas para isso a combinao de estatstica convencional com
tcnicas de inteligncia artificial, que resulta em uma tcnica muito comentada hoje, o
Data Mining. Os processos de Data Mining so extremamente complexos, alm de serem
trabalhos que dificilmente sero resolvidos apenas por um especialista em Data Mining.
Em qualquer projeto de Data Mining obrigatrio a existncia de um profissional com o
conhecimento do negcio, pois ele possui domnio total do assunto. Isso para evitar que
o resultado da modelagem no tenha a menor utilidade para apoiar uma deciso.
Descobrir conhecimento novo escondido em grandes massas de dados.
O Data Mining apresenta 4 fases: preparao, minerao, anlise e aplicao.
A fase de preparao consiste de atividades que vo desde a construo de um banco de
dados separado para os dados sujeitos ao Mining at a atividade de carregar o banco de
dados para o processo de Mining. A preparao dos dados a serem utilizados num projeto
vai variar de acordo com o algoritmo de Mining escolhido. Dependendo deste algoritmo,
os dados sero formatados de maneiras diferentes. Este processo de preparao de dados
determinante para o sucesso do Data Mining e costuma consumir muito tempo e
recurso.
A fase de minerao responsvel por criar os modelos de Data Mining, definir
amostras ou populao e selecionar dados para teinar o modelo. Alm disso, nesta fase
que dever ser definida a formatao requerida pelas ferramentas. Por exemplo, redes
neurais exigem dados na forma dicotmica (sim/no) e rvore de deciso demanda
agrupamentos, como bom, mdio e ruim. Por fim, nesta fase sero criados os previsores
ou atributos-chave para a anlise do negcio. Alguns modelos bsicos de garimpagem de
dados podem ser utilizados na fase de anlise tais como:
. Agregao: tem como objetivo a obteno de agrupamentos baseados na similaridade
apresentada pelos dados.
. Classificao: so processos utilizados para se definir grupos ou classes de elementos,
baseado em certos parmetros pr-estabelecidos. Vrias abordagens so usadas para
definir modelos de referncia (redes neurais, rvores de deciso, baseados em regras),

31

Fundamentos e Aplicaes de BI

sendo que algumas permitem a definioexplcita da classe (rvore de deciso) e outras o


seu modelo implcito(redes neurais).
. Padres Sequenciais: so processos que visam identificao de fatos que implicamem
outros fatos, em momentos diferentes de tempo.
. Regras de associao: so regras que so formadas com informaes existentes na base
de dados. So relacionamentos que na grande parte das vezes no so conhecidos pelo
detentor do negcio.
Estes modelos de garimpagem de dados podem ser usados de forma integrada, realizando
anlises em cascata, com operadores aplicados sobre resultados de outros. Depois de
definido e testado o modelo, ocorre a fase de aplicao, que se d pela utilizao daqueles
algoritmos ajustados em situaes reais de sistemas. Alguns produtos permitem que seja
produzido um cdigo fonte, resultante dos modelos e algoritmos definidos e compilados,
que poder ser incorporado em sistemas tradicionais e invocado para a execuo das
anlises requeridas.
Existem vrias tcnicas de Data Mining que podem ajudar as empresas a encontrar
informaes para fomentar a sua toma de deciso. Outras tcnicas como Anlise de
Conglomerados, Mtodos Preditivos com Sries Temporais, rvore de Deciso, Redes
Neurais e Algoritmos Genticos tambm so importantes. Resta aos especialistas
identificar a melhor tcnica para o seu problema.
Anlise de Conglomerados  Procura identificar conjuntos de grupos dentro de um
conjunto de dados, e depois agrupa-los de acordo com similaridades entre si. Os mtodos
de formao de conglomerados podem ser do tipo Hierrquico e do tipo NoHierrquico. As tcnicas do tipo Hierrquico so classificadas como Aglomerativas (so
formados novos conglomerados que no mais se separam) e Divisivas (os conglomerados
vo se dividindo em novos conglomerados). Podemos exemplificar o uso da Anlise de
Conglomerados considerando uma empresa que classifica seus clientes como Especiais e
Padres. Isso considerando seus hbitos e comportamentos, entre outras variveis.
Mtodos Preditivos com Sries Temporais  Mtodos que fazem prognstico baseado
em diversas sries de tempo. De acordo com os dados coletados das sries temporais as
anlises podem ser aperfeioadas.
Algoritmos Genticos  AG. uma tcnica de procura utilizada na cincia da
computao para achar solues aproximadas em problemas de otimizao e busca.
Algoritmos genticos so uma classe particular de algoritmos evolutivos que usam
tcnicas inspiradas pela biologia evolutiva como hereditariedade, mutao, seleo
natural e recombinao (ou crossing over). A evoluo geralmente se inicia a partir de
um conjunto de solues criado aleatoriamente e realizada por meio de geraes. A
cada gerao, a adaptao de cada soluo na populao avaliada, alguns indivduos so
selecionados para a prxima gerao, e recombinados ou mutados para formar uma nova

32

Fundamentos e Aplicaes de BI

populao. A nova populao ento utilizada como entrada para a prxima iterao do
algoritmo.

O poder das aplicaes de Data Mining aliado as anlises visuais permite novas
iniciativas de marketing focalizadas no relacionamento com o consumidor.
. Prospeco Prioriza a abordagem junto a determinados clientes em potencial, com
base nas experincias registradas com os clientes atuais.
. Aquisio Ajuda no design de campanhas de marketing, considerando as melhores
tcnicas a serem adotadas junto a targets especficos.
. Cross-Selling Identifica nos clientes atuais aqueles que seriam prospectos para uma
outra linha de produtos ou para um upgrading.
. Expanso Aponta dentro dos clientes atuais, aqueles com potencial para aumento de
consumo, facilitando o design de campanhas promocionais para aumento de share
interno.
share = fatia de mercado, participao no mercado, poro no mercado.
. Reteno Identifica e reala clientes abordados de maneira deficiente pelos
concorrentes e desenha campanhas para atrao e reteno dos mesmos.
Os mitos sobre data mining
O data mining uma ferramenta de anlise poderosa que permite aos executivos avanar
da descrio do comportamento histrico do cliente para predio do futuro. Descobrir
padres que revelam mistrios sobre o comportamento do cliente. Os resultados do data
mining pode ser usados para aumentar lucros, reduzir despesas, identificar fraude e
oportunidades de negcios, oferecendo nova vantagem competitiva. Existem alguns mito
sobre o data mining:
Mito
O data mining fornece predies imediatas como
bola de cristal.
O data mining ainda no vivel para aplicaes de
negcios.
O data mining exige um banco de dados dedicado e
distinto.
Somente aqueles com formao avanada podem
fazer o data mining.
O data mining apenas para grandes empresas que
possuem pilhas de dados de clientes.

Realidade
O data mining um processo com vrias etapas que
exige projeto e uso proativos e calculados.
A tecnologia atual est pronta para escolher
aproximadamente qualquer negcio.
Devido aos avanos na tecnologia de banco de
dados, um banco de dados dedicado no
necessrio, embora seja desejvel.
Ferramentas baseadas na Web mais recentes
permitem que gerentes de todos os nveis
educacionais realizem o data mining.
Se os dados refletem exatamente o negcio ou seus
clientes, uma empresa pode usar o data mining.

Erros comuns em data mining:


1. Selecionar o problema errado para data mining.

33

Fundamentos e Aplicaes de BI

2. Ignorar o que seu patrocinador pensa sobre o que data mining e o que realmente pode
e no pode fazer.
3. No dedicar tempo suficiente para preparao dos dados. Exige mais esforo do que
normalmente deduzido.
4. Olhar apenas resultados reunidos e no os registros individuais. O IMS DB2 da IBM
consegue destacar registros individuais de interesse.
5. Ser negligente quanto ao controle de procedimento e resultados do data mining.
6. Ignorar descobertas suspeitas e ir adiante rapidamente.
7. Executar algoritmos de mining de modo repetido e cego. importante pensar bastante
sobre o prximo estgio da anlise de dados. O data mining uma atividade com muita
participao ativa.
8. Acreditar em tudo que se ouve sobre os dados.
9. Acreditar em tudo que se ouve sobre sua prpria anlise de data mining.
10. Medir resultados de maneira diferente daquela que seu patrocinador usa para medir os
dele.
Text Mining  a aplicao de data mining em arquivos de texto no estruturados ou
menos estruturados. Raramente os documentos tm uma estrutura interna slida, e quanto
tm, frequentemente est focada no formato do documento ao invs do contedo do
documento. O text mining ajuda as empresas a:
. Encontrar o contedo escondido dos documentos, incluindo relaes adicionais teis.
. Relacionar documentos ao longo de prvias divises despercebidas (ex.: descobrir que
os clientes em suas divises distintas de produto tm as mesmas caractersticas).
. Agrupar documentos por assuntos em comum (ex.: todos os clientes de uma companhia
de seguros que tm reclamaes semelhantes e cancelaram suas aplices).
O text mining no semelhante a um mecanismo de busca na Web. Com o text mining,
queremos descobrir novos padres, pedaos de informao que podem no ser bvios ou
conhecidos.

2.7-EIS
O EIS (Executive Information Systems) um sistema voltado a atender as necessidades
dos altos executivos de uma empresa. Atravs dele, so obtidas informaes gerenciais de
forma rpida e simples. Em geral, o EIS modelado para ser bastante amigvel, uma vez
que seus usurios so pessoas ocupadas e que no tem muito tempo. As informaes
devem ser organizadas de forma resumida porque as decises desse nvel administrativo
no se atm a detalhes, mas ao todo. A esse executivo, por exemplo, no interessa saber
quantas canetas foram usadas na empresa durante um certo perodo, mas sim o valor total
dessas despesas de material.
O EIS pode ser construdo tendo como base vrios sistemas transacionais, mas o ideal
que o sistema acesse um Data Warehouse porque a busca facilitada na medida em que
feita numa nica base de dados. As principais caractersticas desse sistema so: podem
ser customizados de acordo com o estilo de cada executivo; contm recurso grficos que
permitem s informaes serem apresentadas graficamente de vrias formas; so fceis

34

Fundamentos e Aplicaes de BI

de usar e requerem pouco treinamento para tal; permite o acesso rpido e fcil a
informaes detalhadas.
Alm disso, o usurio tambm pode alterar o nvel de detalhamento das informaes
utilizando, para isso, uma ferramenta OLAP. Por exemplo: partindo de um relatrio que
contm todas as informaes sobre as vendas realizadas em 2007 em todos os escritrios
da empresa instalados no estado de So Paulo, um diretor poder analisar as vendas
realizadas em cada cidade do estado.
Os conceitos de EIS e SAD so muitas vezes confundidos. Apesar de estarem
relacionados, o EIS e O SAD tratam de problemas diferenciados, e tipicamente, atendem
a pblicos-alvo diferentes.
Um EIS projetado especificamente para o uso pelos executivos, sendo que a maioria
das aplicaes disponveis do tipo display-only (podendo consultar e imprimir sem
permitir a manipulao de dados). Alm disso, um EIS permite a visualizao de
excees por meio de vrios nveis de detalhe (drill-down). Por outro lado, um SAD
tipicamente projetado para o nvel intermedirio de gerncia. Os ingredientes bsicos de
tais sistemas incluem dados e modelos que descrevem o relacionamento dos dados
(exemplo: rendimento = receitas despesas).
Comparativos Sistemas Tradicionais versus EIS:
Sistemas Tradicionais
Muita informao e muito atraso.
Eficiente para dados resumidos e consolidados.
Pouco efetivos para decises prioritrias.
Grande volume de papel com pouca contribuio
para atividade dos executivos.

EIS
Sistema direcionado e disponibilidade imediata.
Eficiente para anlise de tendncias e excees.
Dados direcionados aos fatores crticos de sucesso.
Facilidade para ao gerencial e tomada de deciso.

2.8-OLAP
As ferramentas OLAP (Online Analytical Processing) tem como funo a navegao nos
dados de um data warehouse, possuindo uma estrutura adequada tanto para as pesquisas
como para a apresentao das informaes.
Nas ferramentas de navegao OLAP possvel navegar entre diferentes granularidades
(detalhamento) de um cubo de dados. Atravs de um processo chamado Drill o usurio
pode aumentar (Drill down) ou diminuir (Drill up) o nvel de detalhamento dos dados.
Por exemplo um relatrio pode estar consolidado por Pases. Fazendo um Drill down os
dados passam a ser apresentados por estados, cidades, bairros e assim sucessivamente at
o menor nvel possvel. O processo contrrio Drill up faz com que os dados sejam
consolidados em nveis superiores.
Outra possibilidade apresentada pela maioria das ferramentas de navegao OLAP a de
rearranjar colunas e linhas. possvel trocar a ordem de colunas e linhas bem como
suprim-las ou exibir aquelas que estejam ocultadas na visualizao dos dados.

35

Fundamentos e Aplicaes de BI

uma ferramenta de front end.


A funcionalidade de uma ferramenta OLAP caracterizada pela anlise multidimensional
dinmica dos dados, apoiando o usurio final nas suas atividades. Elas permitem uma
srie de vises, tais como as consultas ad-hoc, so consultas com acesso casual nico e os
dados so tratados segundo parmetros nunca antes utilizados. Isso significa que o
prprio usurio gera as consultas de acordo com suas necessidades de cruzamento de
mtodos que o levam a obter as respostas desejadas.
Outra tcnica possvel atravs do OLAP a slice-and-slice que permite analisar as
informaes sob diferentes prismas. O Drill Down/Up consiste em fazer uma explorao
em diferentes nveis de detalhamento do dado, como, por exemplo, analisar uma
informao tanto diariamente quanto anualmente, partindo da mesma base de dados. No
que se refere gerao de queries (consultas) no OLAP, ela se d de uma maneira
simples, amigvel e transparente para o usurio final, o qual precisa ter um conhecimento
mnimo de informtica para obter as informaes que deseja.
Antes do desenvolvimento da tecnologia OLAP, as empresas tinham que utilizar outras
ferramentas menos amigveis para gerar relatrios em que a dificuldade era a de procurar
os dados que estavam em vrios arquivos. Dessa forma, se o objetivo era a de construir
um relatrio para avaliar quais eram os clientes mais rentveis num determinado
semestre, por exemplo, eram necessrios dois trabalhos: primeiro encontrar os dados e
depois construir o relatrio no formato desejado (perda de tempo).
Com o SGBD (Sistemas Gerenciadores de Banco de Dados), com o avano das
linguagens de programao, facilitou a vida dos analistas de sistemas. Os dados eram
acessados de forma mais simples, mais os usurios comuns (gerentes, diretores e
profissionais da rea de marketing, vendas, etc.) ainda dependiam de um tcnico de
informtica para poder gerar relatrios. Com o surgimento das ferramentas OLAP, o
cenrio foi modificado na medida em que estas permitiam o acesso fcil aos dados pelos
usurios finais. A anlise das informaes passou a ser dinmica, rpida, e o prprio
usurio podia fazer a consulta que desejasse, sem depender de um tcnico ou de um
analista de sistemas para isso.
OLAP considerado uma categoria de software que permite a analistas, gerentes e
executivos obterem respostas dentro dos dados, atravs de uma rpida,consistente e
interativa forma de acesso a uma ampla variedade de possveis vises. As ferramentas
OLAP permitem que o negcio de uma empresa possa ser visualizado e manipulado de
forma multidimensional, agrupando as informaes em vrias dimenses como: produtos,
fornecedores, departamentos, localizaes, clientes, recursos, etc.

36

Fundamentos e Aplicaes de BI

A criao de tabelas cruzadas, exploso de informaes e as criaes de dimenses esto


entre as funes mais tradicionais das ferramentas OLAP. As ferramentas OLAP
trabalham de modo interativo, permitindo que a partir de uma resposta o usurio faa
outros questionamentos, ou seja, o usurio consegue analisar o porqu dos resultados
obtidos. A interao do usurio final com o DW, utilizando as ferramentas de OLAP, se
d atravs de questionamentos, como por exemplo:
. Qual o total de vendas de casacos de l, nos trimestres do ano de 2007, nas lojas da
regio sul do pas?
. Qual foi o lucro lquido que os 10 maiores clientes no estado de RS geraram durante o
primeiro semestre de 2007?
. Quais so as 10 cidades do Brasil que proporcionam maior lucratividade por habitante
em 2007?
. Quais so os 10 produtos que proporcionam menor lucro durante os meses de dezembro
de 2006, janeiro de 2007 e fevereiro 2007?
As respostas a estas questes so baseadas em fatos histricos que vo mostrar uma
tendncia de comportamento das variveis selecionadas. A partir destas respostas
possvel formular outras questes at que o nvel de informao desejada seja atendido.
Respondendo rapidamente a estas perguntas que a empresa vai conquistar um
diferencial positivo concorrncia, tendo condies de criar aes rpidas para sua rea
de atuao.
As ferramentas que disparam uma instruo SQL de um cliente qualquer para o servidor
e recebem o micro-cubo de informaes de volta para ser analisado na workstation
chamam-se DOLAP (Desktop On Line Analytical Processing).
Os ganhos com essa arquitetura so o pouco trfego que se d na rede, visto que todo o
processamento OLAP acontece na mquina cliente, e a maior agilidade de anlise, alm
do servidor de banco de dados no ficar sobrecarregado, sem incorrer em problemas de
escalabilidade.
A desvantagem que o tamanho do micro-cubo no pode ser muito grande, caso
contrrio, a anlise passa a ser demorada.
As ferramentas ROLAP (Relational On Line Analytical Processing) possuem uma
engenharia de acesso aos dados e anlise OLAP com uma arquitetura um pouco diferente.
Nesse caso, a consulta enviada ao servidor de banco de dados relacional e processada
no mesmo, mantendo o cubo no servidor.
Nesse caso o processamento OLAP se dar somente no servidor. A principal vantagem
dessa arquitetura que ela permite analisar enormes volumes de dados, em contra
partida, uma grande quantidade de usurios acessando simultaneamente poder causar
srios problemas de performance no servidor causando, inclusive o travamento do
mesmo.

37

Fundamentos e Aplicaes de BI

A arquitetura MOLAP (Multidimensional On Line Analytical Processing) processa-se da


seguinte forma: com um servidor multidimensional, o acesso aos dados ocorre
diretamente no banco, ou seja, o usurio trabalha, monta e manipula os dados do cubo
diretamente no servidor. Isso traz grandes benefcios aos usurios no que diz respeito
performance, mas tem problemas com escalabilidade, alm de ter um custo alto para
aquisio.
A arquitetura denominada HOLAP (Hybrid On Line Analytical Processing), ou
simplesmente processamento hbrido, consiste em nova forma de acessar os dados que
nada mais do que uma mistura de tecnologias na qual h uma combinao entre
ROLAP e MOLAP. A vantagem que com a mistura de tecnologias pode-se extrair o
que h de melhor de cada uma, ou seja, a alta performance do MOLAP com a
escalabilidade melhor do ROLAP.
Atualmente, todas as ferramentas com arquitetura OLAP j esto portadas para web.
Nada do que diz respeito Business Intelligence e distribuio de informao pode ser
concebido sem pensar na web. A facilidade em distribuir as informaes, a flexibilidade e
agilidade so muito grandes.
Termos usados na arquitetura OLAP:
. Consultas ad-hoc: o prprio usurio gerar consultas de acordo com suas necessidades de
cruzar as informaes de uma forma no vista e com mtodos que o levem a encontrar
aquilo que procura.
. Slice and Dice/Pivot Table: Essa caracterstica das ferramentas OLAP de exterma
importncia. Com ela ns podemos analisar nossas informaes de diferentes prismas
limitados somente pela nossa imaginao. Utilizando esta tecnologia conseguimos ver a
informao sobre ngulos que anteriormente inexistiam sem a confeco de um DW e a
utilizao de uma ferramenta OLAP.
. Gerao de Queries: A gerao de queries no OLAP se d de uma maneira simples,
amigvel e transparente para o usurio final, que precisa apenas ter um conhecimento
mnimo de informtica para obter as informaes que deseja.
As exigncias do usurio devem ditar que tipo de arquitetura ir atend-lo melhor. Como
sempre, a arquitetura deve estar bem desenhada para que isso acontea da melhor forma
possvel.
XMLA  eXtensible Markup Language for Analysis ou Linguagem de Marcao
Extensvel para Anlise. uma especificao de esquema XML para conexo com
servidores OLAP, que define a formatao do resultado do processamento de expresses
multidimensionais em envelopes de servios Web.

38

Fundamentos e Aplicaes de BI

MDX  Foi introduzido pela Microsoft com o Microsoft SQL Server OLAP Services
por volta de 1998. Mais recentemente, o MDX apareceu como parte do XML for
Analysis API (XMLA). A adoo entre desenvolvedores de aplicao e provedores de
ferramentas OLAP tem sido crescente. O MDX se tornou um padro para expresses
multidimensionais, abaixo um exemplo da sintaxe MDX:
SELECT {[Measures].[Unit Sales], [Measures].[Store Sales]} ON COLUMNS,
{[Product].members} ON ROWS
FROM [Sales]
WHERE [Time].[1997].[Q2]

2.9-ETL
Extrao, Transformao e Carga (Extract, Transform and Load).
Ferramentas de ETL so fundamentais para preparar os dados que sero armazenados no
DW.
uma ferramenta de back end (retaguarda).
Cinco possveis operaes de DW.
Primeira  Extrao dos dados que podem estar em fontes internas (sistemas
transacionais, bancos de dados, etc.) ou externas (em sistemas fora da empresa).
Segunda  Fazer a limpeza e transformao dos dados. Nesta etapa so corrigidas
algumas imperfeies contidas na base de dados transacional com objetivo de fornecer
ao usurio dados conciso, no redundantes e com qualidade, permitindo uma anlise
baseada nos valores mais prximos dos reais.
Terceira  Processo de transformao do dado. Normalmente, os dado vm de vrios
sistemas e por isso necessrio padronizar os diferentes formatos num nico.
Quarta  Processo de carga do DW que em geral feita a partir de um banco de dados
temporrio, no qual os dados armazenados j passaram pela limpeza e integrao.
Quinta  Etapa de atualizao dos dados (refresh). So feitas atualizaes na base de
dados transacional. Essas atualizaes sero passadas para o DW, de forma organizada.
A etapa de ETL uma das mais crticas de um projeto de DW, pois envolve a fase de
movimentao dos dados.
Alguns fatores a serem analisados antes de comear a fase de extrao dos dados:
. A extrao de dados do ambiente operacional para o ambiente de Data Warehouse
demanda uma mudana na tecnologia. Os dados so transferidos de banco de dados
hierrquicos para uma nova estrutura de SGBD relacional para Data Warehouse;

39

Fundamentos e Aplicaes de BI

. A seleo de dados do ambiente operacional pode ser muito complexa, pois muitas
vezes necessrio selecionar vrios campos de um sistema transacional para compor um
nico campo no Data Warehouse;
. Tem diversos sistemas antigos que no tem o modelo de dados, e em outros casos,
mesmo que existam no esto documentados.
. Os dados so reformatados. Por exemplo: um campo data da base de dados OLTP do
tipo DD/MM/AAAA pode ser passado para a base de dados OLAP no formato ano/ms
como AAAA/MM;
. Quando h vrios arquivos de entrada, a escolha das chaves dever ser feita antes que os
arquivos sejam intercalados. Isso significa que, se diferentes estruturas de chaves so
usadas nos diferentes arquivos de entrada, ento, opta-se por apenas uma dessas
estruturas;
. Os arquivos devem ser gerados obedecendo a mesma ordem das colunas estipuladas no
ambiente de Data Warehouse;
. Pode haver vrios resultados. Dados podem ser produzidos em diferentes nveis de
resumo pelo mesmo programa de gerao das cargas;
. Valores default devem ser fornecidos. s vezes pode existir um camp no Data
Warehouse que na possui fonte de dados, ento a soluo definir um valor padro para
estes campos.
O DW espelha as informaes histricas necessrias, enquanto o ambiente operacional
focaliza as informaes pontuais correntes.
Uma ferramenta ETL muito til, principalmente se os sistemas OLTP (transacionais)
so muitos, pois ela uma poderosa fonte de gerao de metadados, e que contribuiro
muito para a produtividade da sua equipe. Em alguns casos, importante o auxlio de
profissionais externos para a escolha. O fato verdadeiro que os benefcios sero bastante
vistosos e a produtividade aumentar consideravelmente.

40

Fundamentos e Aplicaes de BI

As ferramentas de ETL mais utilizadas no mercado so o Data Stage da IBM, o ETI da


ETI Corporation, Sagent da Group 1 Software, Informtica Power Conect da Informtica,
DTS da Microsoft, Pentaho (Open Source), Talend (Open Source), Sunopsis e o Oracle
Warehouse Builder da Oracle. Todos tem os seus diferenciais e cada um poder ser
utilizado dependendo do caso de cada empresa. Algumas ferramentas tem a curva de
aprendizado mais suave, outras um pouco mais ngrime, mas em certos casos mesmo
sendo uma ferramenta de difcil aprendizado exigindo maiores investimentos em pessoal,
sero compensados com a performance e flexibilidade da mesma. H outras ferramentas
que tem custo zero de aquisio pois, vem embutida junto com um SGBD (Sistema
Gerenciador de Banco de Dados), mas em contrapartida so bastante limitadas no tocante
a extrao de dados e exigem uma maior codificao dos processos de ETL, em relao
as outras e por fim tem as open source que, dependendo do porte do projeto, podem
atender satisfatoriamente.
Ferramentas ETL free: Mondrian, OpenI, Jpivot, Pentaho, Bee Project, Spago BI.

2.10-DSS
Os Decision Support Systems (Sistemas de Apoio Deciso) surgiram a partir dos
sistemas transacionais existentes nas empresas. So solues que auxiliam no processo
decisrio, utilizando modelos para resolver problemas no estruturados. Inicialmente
necessrio definir quais dados, gerados nos sistemas transacionais, sero armazenados no
Data Warehouse, para depois partir para a modelagem dimensional e a criao fsica do
modelo, no qual as especificidades do Sistema Gerenciador de Banco de Dados (SGBD)
e da ferramenta OLAP escolhidos sero consideradas para otimizar as consultas futuras.
O passso seguinte carregar os dados no DW, definindo as origens dos dados
(identificao dos sistemas legados onde foram gerados, o que facilita a sua localizao),
e depois so feitas as rotinas de extrao de dados, que podem ser desenvolvidas por
programadores em qualquer linguagem de programao. Concluda essa etapa, deve ser
feita a checagem da consistncia dos dados. Qualquer erro nos dados poder determinar o
fracasso da anlise futura.
Outros elementos importantes so a confeco e o armazenamento dos metadados (dados
de controle do DW, responsveis pelos mapeamentos dos dados de cada etapa de
implementao do DSS). As ferramentas OLAP so utilizadas para visualizar e analisar
os dados.
Os Sistemas de Apoio Deciso so aparentemente simples, mas exigem um profundo
conhecimento tcnico e de negcios para serem elaborados e utilizados com sucesso.

41

Fundamentos e Aplicaes de BI

2.11-rvore de Deciso
uma tcnica que a partir de uma massa de dados (Data Mart ou Data Warehouse) cria e
organiza regras de classificao e deciso em formato de diagrama de rvores, que iro
classificar suas observaes ou predizer resultados futuros.
Se seus dados estiverem divididos em classes dicotmicas (busca entre duas alternativas),
por exemplo, infectados contra no-infectados, uma rvore de deciso pode ser
construda para criar regras que classifiquem casos j existentes ou casos novos, com
preciso.
Comea com um nico grupo que rene todos os casos em estudo. Na medida em que a
rvore vai se expandindo, esta base dividida em mdulos que representam categorias
das variveis analisadas. Cada galho da rvore formado por esses ndulos que vo se
abrindo em subgrupos mutuamente exclusivos.
Cada ndulo e cada galho apresentam uma proporo de obteno da resposta em estudo.
Uma rvore de deciso uma representao de uma tabela de deciso sob a forma de uma
rvore. Tem a mesma utilidade da tabela de deciso. Trata-se de uma maneira alternativa
de expressar as mesmas regras que so obtidas quando se constri a tabela.
Trata-se de um modelo prtico de uma funo recursiva que determina o valor de uma
varivel e, baseando-se neste valor, executa-se uma ao. Esta ao pode ser a escolha de
outra varivel ou a sada. As rvores de deciso so treinadas de acordo com um conjunto
de exemplos previamente classificados e, posteriormente, outros exemplos so
classificados de acordo com essa mesma rvore.
A construo de uma rvore de deciso parte da descrio de um problema do qual deve
ser especificado as variveis, aes e a seqncia lgica para a tomada de deciso. Depois
de construda teremos uma viso grfica da tomada de deciso.

Figura 5: Estrutura de uma rvore de deciso

42

Fundamentos e Aplicaes de BI

As variveis so representadas pelas condies mostradas na estrutura acima, as sadas


so as aes a serem tomadas. A seqncia lgica se trata da ordem que sero dispostas
as condies devido ao seu grau de relevncia pr-definido no incio da criao do
modelo.
Os ramos da rvore correspondem a cada possibilidade lgica que levam prxima
possibilidade ou ao a ser tomada. Nem sempre a combinao das condies descritas
leva a uma ao definitiva, quando isto ocorre o decisor tem o papel de optar pela ao a
ser tomada.
Exemplo:
Supondo que o objetivo decidir se vou Jogar Tnis. Para tal, h que ter em conta certos
parmetros do ambiente, como o Aspecto do Cu, a Temperatura, a umidade do ar e o
vento. Cada um destes atributos representado por uma varivel do modelo. Por
exemplo, para a temperatura, os valores podem ser Ameno, Fresco ou Quente. A deciso
Sim (ir jogar tnis) ou No (no ir jogar tnis) o resultado da classificao.
Para construir a rvore de Deciso de Jogar Tnis so tidos em conta exemplos (dias)
passados.

Figura 6: Exemplos de Treino.

Atravs do exemplo citado possvel construir a seguinte rvore de deciso:

Figura 7: rvore de deciso baseada no exemplo do treino.

43

Fundamentos e Aplicaes de BI

A relao entre os elementos da rvore (ns e folhas) e os atributos, valores e


classificaes pode ser entendida na seguinte imagem:

Figura 8: Relao entre elementos da rvore, atributos, valores e classificaes

A classificao de um exemplo de acordo com a esta rvore feita da seguinte forma:


O atributo Aspecto tem o valor Sol e a Umidade tem o valor Elevada. O exemplo
classificado com No, ou seja quando esteve sol e umidade elevada no se jogou tnis.
Os atributos Temperatura e Vento no so considerados, pois so desnecessrios para
classificar este exemplo.
Com rvores de Deciso possvel representar a conjuno e disjuno de atributos. A
rvore de deciso que representa a classificao para os dias em que o Aspecto Sol e
que o Vento est Fraco encontra-se na seguinte figura.

Figura 9: rvore de deciso quando Aspecto=Sol e Vento=Fraco

44

Fundamentos e Aplicaes de BI

A rvore de deciso que representa os dias em que o Aspecto Sol ou o Vento est
Fraco:

Figura 10: rvore de deciso quando Aspecto=Sol ou Vento=Fraco

2.12-Redes Neurais
Rede Neural uma tecnologia cada vez mais usada em Data Mining.
Sua grande vantagem est basicamente em sua habilidade de aprendizagem a partir das
experincias, no ficando restritas a uma ordem pr-fixada. Elas consistem em algoritmos
e procedimentos computacionais que imitam a capacidade de aprendizagem do crebro.
Esta tcnica formada de ndulos cujo processamento se assemelha ao dos neurnios.
No considerada uma tcnica estatstica por no apresentar a robustez de uma.
No oferece estimadores definidos e o comportamento de uma rede neural, com certa
massa de dados, nem sempre se repetir com outra.
Os ndulos so conectados como uma rede e funcionam paralelamente. A primeira fase
ndulos composta de ndulos de entrada. Eles recebem o input das variveis fornecidas
pelo banco de dados, transformam-no de acordo com uma funo (chamada funo de
ativao), produzindo informao de sada que ser enviada prxima fase de ndulos.
Esta, por sua vez, receber diversas informaes dos ndulos de entrada como seu input.
Esta fase formada pelos ndulos ocultos, que, em redes neurais mais complexas, podem
formar diversas camadas. Por fim, tem-se os ndulos de sada. Estes processam as
informaes recebidas e produzem uma resposta, mas no a enviam para outro ndulo,
pois j o resultado final da rede. Se a rede de classificao, o ndulo de sada j o
final. Para o caso de modelos de previso, o ndulo de sada j representa um valor
preditivo.
importante salientar que no existe uma tcnica universalmente melhor que todas. O
sucesso do Data Mining depende muito da experincia e sensibilidade do pesquisador, o
qual ter que identificar qual a melhor ferramenta a ser utilizada, de acordo como tipo de
resposta procurada e com o modo em que se encontram seus dados. Por isso, os exemplos

45

Fundamentos e Aplicaes de BI

de aplicaes dos mtodos relacionados neste trabalho podem se repetir. A tcnica de


redes neurais pode ser aplicada em Data Mining para resolver problemas relacionados a:
. Marketing;
. Modelos Preditivos (modelos que baseados em prognsticos, predizer);
. Vendas;
. Finanas;
. Energia;
. Produo.
Pode-se dizer que redes neurais artificiais consistem em um modo de abordar a soluo
de problemas de inteligncia artificial. Neste caso, em lugar de tentar programar um
computador digital de modo a faz-lo imitar um comportamento inteligente (saber jogar
xadrez, compreender e manter um dilogo, traduzir lnguas estrangeiras, resolver
problemas de matemtica tais como se encontram nos primeiros anos dos cursos de
engenharia, etc.) procura-se construir um computador que tenha circuitos modelando os
circuitos cerebrais e espera-se ver um comportamento inteligente emergindo, aprendendo
novas tarefas, errando, fazendo generalizaes e descobertas, e frequentemente
ultrapassando seu professor. Da mesma forma, estes circuitos neurais artificiais podero
se auto-organizar, quando apresentados a ambientes diversos, criando suas prprias
representaes internas e apresentar comportamentos imprevisveis. E, melhor ainda, (ou
pior) ter um comportamento que nem sempre pode-se prever e compreender, tal como
hoje no compreendemos mecanismos do nosso prprio crebro.
Funcionamento das redes neurais artificiais
As redes neurais artificiais so criadas a partir de algoritmos projetados para uma
determinada finalidade. impossvel criar um algoritmo desse sem ter conhecimento de
modelos matemticos que simulem o processo de aprendizado do crebro humano.
Basicamente, uma rede neural se assemelha ao crebro em dois pontos: o conhecimento
obtido atravs de etapas de aprendizagem e pesos sinpticos so usados para armazenar o
conhecimento. Uma sinapse o nome dado conexo existente entre neurnios. Nas
conexes so atribudos valores, que so chamados de pesos sinpticos. Isso deixa claro
que as redes neurais artificiais tm em sua constituio uma srie de neurnios artificiais
(ou virtuais) que sero conectados entre si, formando uma rede de elementos de
processamento.
Tendo uma rede neural montada, uma srie de valores podem ser aplicados sobre um
neurnio, sendo que este est conectado a outros pela rede. Estes valores (ou entradas)
so multiplicados no neurnio pelo valor do peso de sua sinapse. Ento, esses valores so
somados. Se esta soma ultrapassar um valor limite estabelecido, um sinal propagado
pela sada (axnio) deste neurnio. Em seguida, essa mesma etapa se realiza com os
demais neurnios da rede. Isso quer dizer que os neurnios vo enfrentar algum tipo de
ativao, dependendo das entradas e dos pesos sinpticos.
Existem vrias formas de se desenvolver uma rede neural. Ela deve ser montada de
acordo com o(s) problema(s) a ser(em) resolvido(s). Em sua arquitetura so determinados
o nmero de camadas usadas (as camadas so formadas por neurnios), a quantidade de
neurnios em cada camada, o tipo de sinapse utilizado, etc.

46

Fundamentos e Aplicaes de BI

O aprendizado
O processo de aprendizagem das redes neurais realizado quando ocorrem vrias
modificaes significantes nas sinapses dos neurnios. Essas mudanas ocorrem de
acordo com a ativao dos neurnios. Se determinadas conexes so mais usadas, estas
so reforadas enquanto que as demais so enfraquecidas. por isso que quando uma
rede neural artificial implantada para uma determinada aplicao, necessrio um
tempo para que esta seja treinada.
Existem, basicamente, 3 tipos de aprendizado nas redes neurais artificiais:
Supervisionado: neste tipo, a rede neural recebe um conjunto de entradas padronizados e
seus correspondentes padres de sada, onde ocorrem ajustes nos pesos sinpticos at que
o erro entre os padres de sada gerados pela rede tenham um valor desejado;
No-supervisionado: neste tipo, a rede neural trabalha os dados de forma a determinar
algumas propriedades dos conjunto de dados. A partir destas propriedades que o
aprendizado constitudo;
Hbrido: neste tipo ocorre uma "mistura" dos tipos supervisionado e no-supervisionado.
Assim, uma camada pode trabalhar com um tipo enquanto outra camada trabalha com o
outro tipo.

Aplicaes para redes neurais


As redes neurais artificiais podem ser aplicadas para resolver uma grande quantidade de
problemas. Um bom exemplo de aplicao so softwares de reconhecimento de voz, que
precisam aprender a conhecer a voz de determinadas pessoas. Redes neurais tambm so
usados em rbos que desarmam bombas. Se voc j usou um scanner para retirar um
texto de um jornal, por exemplo, saiba que o software de OCR, que responsvel por
isso, precisa aprender a reconhecer caracteres da imagem. Logo, ele certamente possui
algoritmos de rede neural. Existem at alguns softwares que aprendem a identificar
SPAMs em e-mails e apag-los (e conseguem uma margem aceitvel de acertos). Mas no
geral as redes neurais so usadas principalmente em aplicaes mais complexas, como
em usinas, mercado financeiro, etc.

47

Fundamentos e Aplicaes de BI

2.13-Geradores de Consultas e Relatrios


Os geradores de consultas e relatrios so considerados a primeira gerao de
ferramentas para o acesso a dados, as quais permitem a realizao de consultas ad-hoc.
Ao contrrio de ter que aprender uma linguagem de consulta, tal como SQL, os usurios
utilizam menus e botes para especificar os elementos de dados, condies, critrios de
agrupamentos e outros atributos, atravs de operaes simples e facilitadas pelo ambinete
grfico.
Consultas e relatrios normalmente disponibilizam informaes do tipo mdias,
totalizaes, desvios padro e outras funes bsicas de anlise.
As atividades mais antigas e OLAP e BI esto usando relatrios e consultas.
Normalmente esto relacionados pois o resultado de uam consulta um relatrio, e um
relatrio pode designar uma consulta. O usurio pode produzir seus prprios
relatrios/panoramas e analisar tendncias e desempenho diariamente.
Relatrios de rotina
So gerados automaticamente e distribudos periodicamente aos assinantes em listas de
discusso. Alguns exemplos so nmeros de vendas semanais, unidades produzidas por
dia e por semana, e horas trabalhadas mensalmente. Exemplo prtico, uma gerente de loja
recebe relatrios de desempenho da loja gerados semanalmente por um software de BI.
Aps a anlise de um destes relatrios, a gerente observou que as vendas de perifricos
para computador caram significativamente desde as semanas anteriores. Ela foi para
outro relatrio que mostrou que 3 discos rgidos mais vendidos surpreendentemente
diminuiram as vendas. Um novo acesso a outro relatrio revela que o mau tempo foi o
causador do problema.
Relatrios ad hoc (ou sob demanda)
So criados para um usurio especfico sempre que necessrio. Esses relatrios podem
ser semelhantes aos de rotinas, mas com intervalos de tempo diferentes ou apenas para
um subconjunto de dados. Um exemplo seria fornecer uma lista de todos os clientes que
adquiriram produtos de uma empresa por mais de R$ 5.000,00 por produto durante
janeiro de 2006.
Suporte multilngue
Muitos fornecedores oferecem suporte de relatrio para diversos idiomas (ex.: Microsoft
para 12 idiomas). Este suporte inclui toda a ajuda na interface (ex.: barras de menu,
grupos de caracteres, converso e formatao de moeda, atributos do negcio).
Exemplos de produtos do fornecedor para relatrio
Todos os fornecedores de software de BI oferecem recursos para criao, acesso e
manuteno de relatrios. Exemplos tpicos so:
. Crystal Reports um conjunto de ferramentas que ajuda a criar relatrios flexveis e
cheios de recrusos de maneira rpida e os integra s aplicaes do Windows e da Web.

48

Fundamentos e Aplicaes de BI

. MicroStrategy fornece ferramentas de criao e monitoramento de relatrio para


relatrios operacionais e de produo, como faturas e extratos, relatrios de lucro e perda,
e relatrios de desempenho. Esto disponveis relatrios personalizados, assim como
suporte multilingue (12 idiomas). Os relatrios possuem resoluo de impresso, tela
para grficos e tabelas de qualidade.
. Cognos 8 Business Intelligence gerador de relatrios inclui uma lista completa de tipos
de relatrio automtico, ajustveis a qualquer fonte de dados. Tambm fornece suporte
multilingue.
. Hyperion fornece um espectro completo de recursos para gerenciamento de relatrios
que combina tanto informaes operacionais como financeiras. possvel personalizar
relatrios em tela em grande quantidade para publicao para dezenas de milhares de
clientes atravs da Web com uma taxa de transferncia considervel. Um mdulo para
gerao de relatrio financeiro especializado, com formatao e inteligncia financeira
predefinidas, permite reunir e publicar de maneira rpida registros de relatrios de
qualidade da produo para o controle do gerenciamento e arquivamentos regulares. Para
relatrios e perguntas ad hoc, os usurios de negcios tambm podem criar seus prprios
relatrios interativos para monitoramento do seu desempenho e reconhecimento de
tendncias. A Hyperion tambm oferece gerao de relatrio interativo.
. A Microsoft inclui no seu Report Builder um recurso de fcil utilizao que permite a
criao ou modificao de relatrios sem a necessidade de escrever consultas SQL.

49

Fundamentos e Aplicaes de BI

Relatrios tpicos produzidos por OLAP


rea
Finanas/contabilidade

Recursos humanos

Previso de vendas e marketing

Gerenciamento de relacionamento com o


cliente

Vendas de produto

Operao e
fornecimento

Anlise de site

gesto

da

cadeia

de

Descrio
Relatrio e anlise de contas a receber e a pagar, relatrio
e anlise de balancete, anlise do fluxo de caixa, previso
e oramento financeiros, anlise de demonstrao de
resultados/lucro e perda, gerenciamento de risco.
Relatrio dos benefcios da administrao, realatrio e
anlise do plano de carreira, relatrio de conformidade,
relatrio e anlise de compensao, relatrio de gastos
com funcionrios, anlise de tendncia da fora de
trabalho, relatrio de gerenciamento de tempo e trabalho.
Anlise de canla, anlise de concorrncia, relatrio de
desempenho da equipe de vendas, relatrio e anlise do
fluxo de vendas.
Anlise de capanha; anlise de aquisio, reteno e
desgaste do cliente; anlise de venda cruazada para o
cliente; anlise da lucratividade do cliente; indicadores do
cliente; anlise de segmentao do cliente; anlise do
atendimento ao cliente; anlise de fidelidade.
Anlise de desempenho da categora/gerenciamento da
categoria, anlise de descontos e promoes, anlise de
fraude e preveno de perda, anlise do estoque, anlise d
merchandising, indicadores do produto.
Anlise da central de atendimento, planejamento da
produo e programao da manufatura, otimizao da
rede, anlise de cumprimento do pedido, controle de
qualidade, gerenciamento normativo, indicadores do
forncedor e anlise de fornecimento estratgico,
planejamento de oferta e demanda.
Anlise do comrcio eletrnico, anlise de navegao na
Web, anlise de trfego na Web, anlise de visitantes da
Web.

Alerta e entrega de relatrio


Diveros fornecedores de softwares de BI oferecem alerta e entrega de relatrio para
distribuir proativamente um grande nmero de relatrios e avisa um nmero
potencialmente grande de usurios (funcionrios internos e externos a empresa). Ex.: os
produtos de software podem distribuir centralmente e-mails para uma extensa populao
de usuarios, com anexo e em uma base programada. E ainda existem recursos adicionais
(pela MicroStrategy) como:
. Distribuio de relatrio atravs de qualquer ponto de contato. Uma empresa pode usar
e-mail, impressoras, servidores de arquivo e sites com contineres HTML, Excel, RTF,
PDF e ZIP para transportar o contedo do relatrio.
. Auto-assinatura e distribuio baseada em administrador. Uma empresa pode combinar,
de forma centralizada, distribuies de relatrio compulsrias com necessidades de
informao direcionada a cada indivduo.
. Entrega sob demanda, programada ou na ocorrncia do evento. Uma rempsa pode ativar
a distribuio de relatrio por quaisquer meios que sejam mais adequados ao usurio.
. Personalizao automtica de contedo. Uma empresa pode fazer um relatrio mais
relevante e seguro para todos os usurios. Relatrios personalizados economizam o
tempo dos usurios ao mostrar somente informaes e dados solicitados.

50

Fundamentos e Aplicaes de BI

Consultas ad hoc
Qualquer consulta que no pode ser determinada antes de ser feita ser considerada uma
consulta ad hoc. O usurio pode decidir inserir tal consulta aps receber um relatrio.
Consultas ad hoc permitem aos usurios solicitar, a partir do computador, informaes
que no esto disponveis nos relatrios peridicos e tambm gerar consultas novas ou
modificar as antigas, com flexibilidade significativa em termos de contedo, estrutura e
avaliaes. Essas respostas so necessrias para agilizar ou facilitar a tomada de deciso.
O sistema deve ser inteligente o suficiente para compreender o que o usurio deseja.
Sistemas simples de consulta ad hoc muitas vezes so baseados em menus. Sistemas mais
inteligentes usam SQL e abordagens de consulta atravs de exemplo. Sistemas mais
avanados so baseados na linguagem natural e alguns conseguem se comunicar com os
usurios usando reconhecimento de voz. As conusltas podem ser feitas em dados
estticos ou dinmicos (ou seja em tempo real).
SQL para consulta
Como a SQL no-procedural e razoavelmente fcil de usar, muitos usurios finais
conseguem us-la para criar suas prprias consultas e operaes de banco de dados. A
SQL pode ser usada para programas escritos em qualquer linguagem padro de
programao; por isso, facilita a integrao de softwares. As consultas tambm podem ser
realizadas em linguagens naturais. Frequentemente, os sistemas de consulta so
combinados com sistemas de relatrio.

2.14-GIS e GPS
Um Sistema de Informao Geogrfica (GIS) um sistema baseado em computador para
captura, armazenamento, modelagem, recuperao, verificao, integrao, manipulao,
anlise e exibio de dados citadoa geograficamente atravs do uso de mapas digitais.
A caracterstica mais distintiva do GIS que cada registro ou objeto digital tem uma
localizao geogrfica identificada. Ao integrar mapas aos bancos de dados orientados
espacialmente (localizao geogrfica) chamados de geocodificao e a outros bancos
de dados, os usurios podem gerar informaes para planejamento, resoluo de
problemas e tomada de deciso com isso aumentar sua produtividade e a qualidade das
suas decises. reas to heterogneas como varejo, bancos, transportes, agricultura,
gesto de recursos naturais, administrao pblica, controle do espao areo, militar,
prontido de emergncia e planejamento urbano tm usado o GIS com xito desde o
incio dos anos 70.
Aplicaes de GIS
Ajudam as empresas e os governos a saber onde precisamente esto seus caminhes,
funcionrios e recursos; para onde eles precisam ir para atender um cliente; e a melhor
maneira para deslocar-se. A Cooperativa de Crdito do Texas usa o GIS para ajudar a
decidir onde colocar outdoors e caixas automticos alm de identificar reas mais
receptivas para mala direta. A taxa de resposta caracterstica para essa cooperativa de
crdito varia de 2 e 10%, muito melhor do que a tradicional mdia de 1 a 2%.

51

Fundamentos e Aplicaes de BI

Para muitas empresas, a organizao inteligente de dados dentro de um GIS pode


oferecer uma estrutura de suporte a processos de tomada de deciso e de definio de
estratgias alternativas. Para algumas organizaes, o GIS e as anlises espaciais
relacionadas so a principal prioridade.. A Sears, investiu milhares de dlares em
tecnologia de GIS na rea logstica, levando a uma economia de US$ 52 milhes por ano.
Muitos bancos usam o GIS para suporte a atividades como:
. Determinao da localizao de agncias e caixas automticos;
. Anlise da faixa demogrfica (ex.: residncia, idade, nvel de renda) do cliente para cada
um dos produtos do banco;
. Anlise dos padres de volume e trfego das atividades comerciais;
. Anlise da rea geogrfica atendida pela agncia;
. Determinao de mercado potencial para atividades bancrias;
. Avaliao dos pontos fortes e fracos em relao aos da concorrncia;
. Avaliao do desempenho da agncia.
Os bancos tambm usam o GIS como planilhas geogrficas que permitem aos gerentes
modelar as atividades comerciais e realizar anlises de hipteses (ex.: se fecharmos uma
agncia ou unificarmos agncias? E se um concorrente abrir uma agncia?). Cada mapa
consolida pginas de anlise.

52

Fundamentos e Aplicaes de BI

Aplicaes de GIS
Empresa
Pepsi Cola Inc, Super Value, Acordia Inc

CIGNA (seguro de sade)

Western Auto (uma subsidiria da Sears)

Sears, Roebuck & Co./Kmart


Empresas de plano de sade

Wood Personnel Services (agncia de emprego)

Wilkening & Co. (servios de consultoria)


CellularOne Corporation

Sun Microsystems
Consolidated Rail Corporation

Secretaria de Defesa Civil Norte-Americana

Toyota e outroa fabricantes automotivos

Aplicao do GIS
Usam o GIS na seleo de locais para novos
restaurantes Taco Beli e Pizza Hut. Combinam
dados geogrficos e padres de trfego.
Usa o GIS para responder perguntas como: quantos
mdicos afiliados ao CIGNA esto disponveis em
um raio de 13 Km de uma empresa?
Integra dados ao GIS para criar um perfil
demogrfico detalhado da regio de uma loja a fim
de determinar a melhor combinao de produtos a
serem oferecidos na loja.
Uso GIS para dar suporte ao planejamento das rotas
rodovirias.
Controlam as incidncias de cncer e de outras
doenas a fim de determinar estratgias de
expanso e alocao de equipamentos caros nas
suas instalaes.
Mapeia regies onde moram trabalhadores
temporrios para localizar cidades para marketing e
recrutamento.
Planeja reas e rotas de vendas favorveis para seus
clientes, reduzindo as despesas de viagem em 15%.
Mapeia toda sua rede de celulares para identificar
grupos de desconexo de ligaes e enviar tcnicos
de maneira apropriada.
Gerencia propriedades alugadas em dezenas de
lugares no mundo todo.
Monitora a condio de mais de 32.000 km de
estrada de ferro e milhares de lotes de terra
adjacente.
Avalia danos causados por furaces, enchentes e
outros desastres naturais atravs da relao dos
vdeos dos danos com os mapas digitais das
propriedades.
Combinam GIS e GPS como ferramenta de
navegao para orientar motoristas aos seus
destinos atravs das melhores rotas.

GIS e tomada de deciso


O GIS oferece uma grande quantidade de informaes extremamente teis que podem ser
analisadas e utilizadas na tomada de deciso. O formato grfico de um GIS facilita a
visualizao de dados pelos gerentes. Gerente de pesquisa de mercado da Dow Elanco,
fabricante de defensivos agrcolas Posso colocar planilhas de 80 pginas com milhares
de linhas em um nico mapa. Levaria algumas semanas para compreender todas as
informaes da planilha, mas num mapa, a histria pode ser contada em segundos..
Aplicaes de GIS para melhorar a tomada de deciso nos setores pblicos e privado,
incluindo o envio de veculos de emergncia, superviso do trnsito, seleo de local para
instalaes, gerenciamento de risco de estiagem e controle de fauna e flora silvestres.

53

Fundamentos e Aplicaes de BI

Estados e municpios usam aplicaes de GIS relacionadas taxao e mapeamento de


proprieadedes, controle de enchentes, entre outros.
GIS relacionado ao BI. Anlises espaciais em reas como mapeamento de cliente,
mapeamento temtico, anlise da rea de comrcio e localizao de varejo.
GIS associado ao GPS
Os dispositivos GPS (Sistema de Posicionamento Global) so wireless e usam satlites
para permitir que os usurios detectem a posio na Terra dos itens nos quais os
dispositivos esto anexados (ex.: carros, pessoas, etc.) com uma preciso razovel. O
GPS em conjunto com o GIS est trazendo grandes progressos nas aplicaes de BI.
Exemplos de como o GIS em conjunto com o GPS ajuda as empresas a diferenciar seus
produtos, entregar servios e melhorar o desempenho:
. UltraEx, empresa da costa oeste dos EUA que especializada em entregas no mesmo
dia de itens como estoques de sangue emergenciais e peas de computador. Todos os
veculos tem receptores GPS e modems sem fio. Da aos despachantes uma viso
panormica de toda a frota, alm de possibilitar a localizao e a velocidade dos
carregamentos de forma online via Web.
. A cidade de Nova Iorque foi pioneira no uso do CompStat (Estatsticas de Computador)
que usa o GIS para mapear atividades criminais e disposio policial por data, hora e
local. Ao tonrar os comandantes dos distritos policiais responsveis pela prpria
estratgia de policiamento, o CompStat foi um dos principais fatores para a reduo de
aproximadamente 70% na taxa de crimes violentos da cidade na ltima dcada.
. A CSX Transportation Inc. equipou com GPS 3.700 locomotivas. Foi instalado
dispositivos de monitoramento via satlite em milhares de vages de carga para
rastreamento. Ao combinar GIS e GPS, uma empresa de transporte de cargas pode
identificar a posio de um vago ou caminhoem at 100 metros, a qualquer hora. Pode
identificar locomotivas que saram da sua rota e vages que foram deixados para trs ou
que foram enviados para a locomotiva errada.
. No National Environmentally Sound Production Agriculture Laboratory da
Universidade de Georgia, cientistas desenvolveram um tratou que controlado por um
giroscpio e GPS. Mau tempo e problemas de visibilidade no so mais uma
preocupao, pois o trator sabe aonde ir. Os cientistas desenvolveram dispositivos que
permitem ao sistema detectar pequenos obstculos usando um sistema de viso robtica e
mtodos de inteligncia artificial para interpretar o que o rob v.
. No comrcio de localizao (l-commerce) a propaganda direcionada a uma pessoa
cuja localizao conhecida (atravs de uma combinao de GIS e GPS). De forma
semelhante, sistemas mdicos de emergncia identificam, em segundos, a localizao de
um acidente de carro, e o GIS vinculado ajuda a orientar as ambulncias at o local do
acidente.

54

Fundamentos e Aplicaes de BI

UNIDADE III ESTUDOS DE CASO


Caso 1 - Anlise preditiva ajuda o Texas a arrecadar impostos
Em muitas entidades pblicas, h diferenas entre os impostos devidos e o total
arrecadado. O estado do Texas, nos EUA, no uma exceo. Para superar os problemas,
os cobradores de impostos com frequncia realizam auditorias que so dispendiosas e
tomam tempo. Alm disso, muitas auditorias so improdutivas, o que resulta em pouca ou
nenhuma recuperao do imposto por ser difcil determinar quem ser auditado. A fim de
tomar melhores decises relativas a auditoria e, assim aumentar a porcentagem de
auditorias produtivas, o Texas usa a analise preditiva.
Milhes de registros so armazenados no data warehouse do estado. Com o uso de
software baseado em data mining da spss.com, milhes de registros podem ser cruzados
para identificar orientaes promissoras. Especificamente, o sistema ajudou a identificar
milhares de empresas que mantinham operaes no estado sem cumprir com suas
obrigaes fiscais. Ele tambm ajudou os auditores fiscais a fazerem melhores selees
de alvos de auditoria. Uma vez que ganharam confiana no programa, os funcionrios
comearam a usa-lo amplamente, economizando mais de US$ 150 milhes ao ano.

Caso 2 O Business intelligence da France Telecom


Em um curto perodo de tempo, a France Telecom passou de nica provedora de
telecomunicaes da Frana, em um setor que estava regulamentado, para uma de muitas.
Com novos concorrentes entrando rapidamente no mercado de telecomunicaes, os
executivos da France Telecom sabiam que tinham de usar seus sistemas de informao
como uma importante arma estratgica. Eles deram incio a um reposicionamento com o
lema de tornar-se uma empresa de rede. Isso exigiu uma reconsiderao intensa a fim
de promover a padronizao dos sistemas de informao por toda a empresa e suas
subsidirias. Para tanto, os executivos comearam a migrar todas as aplicaes para uma
arquietura tcnica mais adequada aos recursos baseados na Web. No passado, a empresa
era organizada regionalmente, e cada unidade comercial regional gerenciava seu prprio
oramento de TI. Isso gerou a coexistncia de uma infinidade de tecnologias, verses de
software e outros elementos desiguais.

55

Fundamentos e Aplicaes de BI

A padronizao foi a primeira etapa do estabelecimento de uma base infra-estrutural para


uma grande iniciativa de data warehouse e BI. A empresa instituiu uma equipe de 4
pessoas para facilitar o centro de competncia de business intelligence (BICC). O
BICC foi encarregado de fiscalizar a implementao do data warehouse, garantindo que
diferentes unidades comerciais e equipes de BI compartilhassem melhores prticas, e
mantendo a consistncia em todos os projetos de BI. Algumas tarefas importantes foram
de responsabilidade do BICC. Primeiro, ele foi incumbido de providenciar servios de
consultoria e desenvolvimento, incluindo oferecer aos gerentes de projeto assistncia
sobre estratgias relativas ao projeto assistncia sobre estratgias relativas a projeto,
auditoria, instalao, etc. Segundo, o BICC ofereceu suporte a gerentes de projeto,
arquitetos, projetistas, desenvolvedores e operadores para uma linha direta e um
helpdesk. O suporte tambm incluiu um website na intranet para dar consultoria e dicas
de ferramentas de BI, consultoria em metodologia e documentao de instalao. Em
seguida, o BICC foi designado negociador da empresa junto aos fornecedores de BI. O
BICC centralizou a abertura de todos os arquivos de caso; pedidos de atualizaes de
produtos; certificaes de novas verses de software; e o acompanhamento, distribuio e
manuteno dos acordos de licena. Por fim, o BICC ajudou no suporte aos usurios
finais com ferramentas que os tornassem mais autnomos, incluindo um site na intranet
dedicado ao suporte ao usurio, treinamento online e ajuda interativa. O site na intranet
tambm foi usado para divulgar informaes de casos de sucesso de BI, isto , projetos
que resultaram em desempenho superior, alinhados com a estratgia e os objetivos da
empresa. Com esse intuito, para os executivos o site foi uma fonte de informaes sobre a
situao da iniciativa de BI e como ela oferece valor comercial.
Em resumo, o BICC da France Telecom foi desenvolvido para ajudar a organizao a
administrar o seu portflio de projetos de BI, padronizar abordagens analticas em toda a
empresa, treinar e educar os usurios finais, ajudar os usurios avanados, oferecer gesto
do conhecimento atravs de compartilhamento das melhores prticas, e cuidar de todas as
relaes e suporte ao fornecedor. O servio da France Telecom a mais de 91 milhes de
clientes em 220 pases dos 5 continentes teve uma melhoria significativa por meio de seu
DW e seus projetos de BI em andamento. Como exemplo do apoio da liderana executiva
ao BICC e suas iniciativas, o diretor de operaes dos sistemas de informaode relaes
com o cliente declarou: para conquistar novos clientes e criar fidelidade, agora
baseamos nossas aes em um processo de business intelligence, no qual a BI tem um
papel-chave de recuperar e analisar dados sobre nossos recursos corporativos.
Atualmente, a empresa tem 130.000 computadores, e em quase metade deles h software
de BI.

56

Fundamentos e Aplicaes de BI

Caso 3 BNSF usa BI para melhorar servio, agilidade, eficincia e lucratividade


Sediada em Fort Worth, Texas, a BNSF foi criada a partir da fuso das ferrovias
Burlington Northern e Santa F Pacific em 1995. A BNSF opera um das maiores redes
ferrovirias da Amrica do Norte: emprega 38.000 pessoas em 52.300 quilmetros de
linhas nos Estados Unidos e no Canad. As locomotivas Dash 9 da empresa usam um
sistema de controle com microprocessador integrado que oferece diagnsticos embutidos,
bem como outros sistemas que melhoram a economia de combustvel, reduzem as
emisses e aumentam a vida til do motor. A BNSF uma das maiores empresas de
transporte do mundo com trfico intermodal e tem a maior ferrovia para carregamento de
gros, alm de transportar carvo o suficiente para gerar mais de 10% da eletrecidade
produzida nos Estados Unidos.
O PROBLEMA
Os clientes da BNSF exigem uma abordagem integrada informao ao longo da cadeia
de fornecimento, para que no tenham de negociar separadamente com consolidadores,
corretores, barcos a vapor e transportadoras. Com aproximadamente 100.000 carros
sempre ativos em rotas na metade oeste dos Estados Unidos, uma mudana ambiental
como inundao ou nevasca em uma estrada principal provoca alteraes na rota e exige
notificaes a todos os clientes o mais rpido possvel, a fim de manter o cumprimento
dos prazos. Para isso, a BNSF precisava entender melhor seus clientes, utilizar seus
ativos de forma eficiente, aumentar a renda e reduzir os custos.
A previso e os oramentos, atividades importantes relativas administrao, eram feitas
usando uma quantidade excessiva de planilhas nas quais as informaes eram inseridas
mo. O resultado era um processo tedioso e demorado. A empresa depositava muita
confiana em mtricas no processo de tomada de decises, e precisava de um mtodo
poderoso para usar essas mtricas em diversos relatrios e de recursos que simplificassem
o processo.
A empresa tambm precisava oferecer uma fonte nica de informaes referentes aos
carregamentos, desde o momento do pedido at o recebimento do pagamento, para
reduzir os custos e lidar com o processo de faturamento de forma mais eficaz.
A SOLUO
Os princpios de negcio a que a BNSF obedece, como consequncia do uso expandido
do BI, incluem: 1) oferecer uma verso nica da verdade; 2) armazenar os detalhes; 3)
proporcionar maior valor atravs da produtividade; 4) permitir melhor anlise. Conforme
se desenvolvem aplicaes, esses princpios so guias para garantir que a empresa
fornea o mximo valor agregado.
Ferramentas, processos e metodologias que permitem facilmente aos clientes fazerem
inteface com a BNSF determinaram o desenvolvimento de bnse.com, uma sute de
ferramentas baseadas na Web usadas pelos clientes e integradas a seus sistemas.
Em 2002, a BNSF projetou o OnTrack, um sistema de previso e planejamento que usa o
Teradata Warehouse para armazenar os dados, tecnologia de front-end construda a partir
do Essbase da Hyperion, e algumas telas personalizadas desenvolvidas com Java. A
ferramenta de relatrios da Web IBM DB2 Alphablox e o suplemento do Excel da
Hyperion oferecem recursos de gerao de relatrios.

57

Fundamentos e Aplicaes de BI

O OnTrack permite rpidas situaes e se, e usa regras e definies de negcios para
acelerar o processo e oferecer flexibilidade (pelo modo e se).
O Corporate Dashboard fornece um local nico para que executivos e analista encontrem
informaes coordenadas e integradas e trabalhem em um painel comum. A BNSF
construiu os sistemas internamente usando dados extrados dos sistemas Teradata
Warehouse, DB2 e SAS, com o Essbase para a parte de OLAP e o Alphabox para
distribuio na Web. A ferramenta tem 3 visualizaes principais dentro do Corporate
Dashboard. Por meio da 1, que usa um cdigo de cores de sinal vermelho para apontar
rapidamente reas de exceo, um gerente geral pode chegar velozmente aos detalhes das
reas de exceo para delinear o local exato no qual ocorre o problema. Mais detalhes ou
correlaes com outros pontos de dados esto disponveis na visualizao em que o
usurio consegue rapidamente localizar os problemas, detalhar essas reas e obter vrias
visualizaes diferentes relacionadas a outros tipos de mtricas. Para uma anlise ainda
mais profunda, o usurio pode retalhar os elementos de dados do data warehouse e de
outras fontes para obter uma perspectiva realmente abrangente.
O sistema Revenue Single Source aprimora a capacidade de alterar conhecimentos de
embarque, elimina a redundncia e ajuda a processar os pagamentos com mais rapidez e
preciso. Ele est disponvel por meio de um sistema da Web que usa mecanismos
baseados em regras, busca padres para processamento e combina alertas de tolerncia e
notificao de eventos enquanto utiliza um data warehouse ativo. A adio de raciocnio
baseado em casos analisa a qualidade de uma deciso.
OS RESULTADOS
O sistema OnTrack oferece maior flexibilidade, permitindo que os geretnes de
oramentos criem suas previses e tambm planejem e faam previses no modo e se.
Ao mudarem uma varivel, os usurios criam uma previso alternativa que pode ser usda
para comparaes e contrastes, para que se chegue melhor previso. O novo sistema
mais automatizado e padronizado, o que facilita e agiliza seu uso. Funes padres e ad
hoc de relatrios foram ampliadas para 80 usurios avanados do OnTrack e os relatrios
so distribudos para 300 usurios.
O Corporate Dashboard permite um tempo menor de reao. A ferramente estabelece
uma base para a anlise preditiva e oferece uma percepo dos negcios concentrando-se
em indicadores-chave, apontando rapidamente as reas problemticas, simplificando a
navegao por essas reas, e resumindo os fatores de dados crticos que agilizam o tempo
de anlise e permitem mais tempo para avalidar e tomar decises.

58

Fundamentos e Aplicaes de BI

Caso 4 O data warehousing apia a estratgia corporativa da First American


Corporation
A First American Corporation alterou sua estratgia corporativa de uma abordagem
bancria tradicional par uma centrada em CRM. Com isso, foi possvel a ela deixar de ser
uma empresa que perdeu US$ 60 milhes, em 1990, para transformar-se em uma lder
inovadora em servios financeiros, uma dcada depois. A implementao bem-sucedida
desta estratgia no seria possvel sem o data warehouse VISION, que armazena
informaes sobre comportamento dos clientes, como produtos usados, preferncias de
compras e posies de valor do cliente. O VISION oferece:
. Identificao dos principais 20% de clientes rentveis
. Identificao de 40 a 50% dos clientes no-rentveis
. Estratgias de reteno
. Canais de distribuio de menor custo
. Estratgias para ampliar as relaes com clientes
. Fluxos de informao reprojetados
O acesso informao por meio de um data warehouse pode permitir alteraes
evolucionrias e revolucionrias. A First American Corporation obteve uma alterao
revolucionria, passando a ser uma das 16 principais entre as corporaes de servios
financeiros.
Caso 5 O data warehouse integrado e premiado da Bank of America
Em 2003, o Bank of America venceu o prmio Best Practices and Leadership (melhores
prticas e liderana) do Data Warehousing Institute. Uma das maiores redes de servios
financeiros nos Estados Unidos, o Bank of America chegou a uma economia operacional
significativa atravs da integrao dos seus data warehouses. O Teradata Warehouse a
plataforma para seu EDW (Enterprise Data Warehouse) integrado. O data warehouse
auxilia os tomadores de deciso a:
. Manter a privacidade do cliente.
. Fazer um bom uso das informaes do cliente para desenvolver produtos e identificar
tendncias.
. Antecipar as necessidades do cliente, ocasionando melhorias no servio ao cliente a nas
vendas.
. Diminuir custos, melhorar o uso e o desempenho e reagir rapidamente s mudanas das
demandas comerciais.
. Tomar decises melhores e mais rpidas.

59

Fundamentos e Aplicaes de BI

Caso 6 As coisas melhoram com o data warehouse da Coca-Cola


Diante das presses competitivas e da demanda dos consumidores, como uma empresa
envasadora bem-sucedida garante os lucros de suas mquinas de venda? A resposta para
Hokuriku Coca-Cola Bottling Company (HCCBC) um software de data warehousing e
anlise implementado pela Teradata Corp. A HCCBC construiu o sistema de em resposta
a um sistema de data warehousing desenvolvido por um rival, Mikuni. Esse sistema
coleta de cada mquina (numa loja) no apenas dados histricos, mas tambm dados
quase em tempo real, que podem ser transmitidos sede via conexo sem fio. A fase
inicial do projeto foi implantada em 2001. A abordagem ao data warehouse oferece
informaes detalhadas do produto, como data e hora de cada venda, quando um produto
termina, se algum deixou de receber troco, se a mquina est com defeito. Em cada
caso, um alerta disparado e a mquina de venda informa a central de dados
imediatamente por meio de um sistema de transmisso sem fio. (Note que a Coca-Cola
nos Estados Unidos usou modems por mais de uma dcada para conectar as mquinas aos
distribuidores.).
Em 2002, a HCCBC realizou um teste piloto e colocou todas as suas mquinas de vendas
em Nagano em uma rede sem fio, para coletar dados quase em tempo real de cada ponto
de venda (PDV).
Os resultados foram espantosos, pois fizeram uma previso precisa de demanda e
identificaram os problemas com rapidez. O total de vendas aumentou em 10%. Alm
disso, devido manuteno mais cuidados das mquinas, as horas extras e outros custos
diminuram em 46%. Cada vendedor pde ainda fazer a manuteno de mais 42% de
mquinas de venda.
O teste teve tanto xito que o planejamento comeou a ampli-lo para compreender a
empresa inteira (60.000 mquinas) usando um data warehousing ir ultrapassar as
fronteiras corporativas e atingir todas as empresas envasadoras da Coca-Cola, para que as
mais de um milho de mquinas de vendas do Japo estejam em rede. Isso resultar em
economias de custo e maior receita.
Caso 7 HP consolida centenas de data marts em um nico EDW
Em dezembro de 2005, a Hewlett-Packard Co. (HP) planejou consolidar seus 762 data
marts pelo mundo em um nico EDW. A HP adotou esta abordagem para obter uma idia
melhro de seus negcios e tambm para determinar como servir melhor sues clientes.
Mark Hurd, presidente e gerente-geral da HP, afirmou que havia uma fome de dados
analticos na empresa que, infelizmente, havia levado criao de muitos data marts.
Projetar e manter esses dados era muito caro, sendo que eles no produziam a viso
empresarial das informaes internas e de clientes desejada pela HP. Na metade de 2006,
a HP comeou a consolidar os dados dos data marts no novo data warehouse. Todos os
data marts dspares foram eliminados.

60

Fundamentos e Aplicaes de BI

Caso 8 O Egg plc arras a concorrncia quae em tempo real


O Egg plc (egg.com) o miaor banco online do mundo. Ele oferece servios de banco,
seguros, investimentos e hipotecas para mis de 3,6 milhes de clientes atravs de seu site
na Internet. Em 1998, o Egg escolheu a Sun Microsystems para criar uma infra-estrutura
confivel, escalonvel e segura para dar suporte aos seus mais de 2,5 milhes de
transaes dirias. Em 2001, o sistema recebeu um upgrade a fim de eliminar problemas
de latncia. Esse novo data warehouse de clientes (CDW) usou software da Sun, Oracle e
SAS. O warehouse inicial tinha cerca de 10 Tbytes de dados e usava um servidor de 16
CPUs. O sistema oferece acesso aos dados quase em tempo real. Ele proporciona tambm
servios de data warehouse e data mining aos usurios internos, alm de um conjunto
solicitado de dados dos clientes aos prprios clientes. Centenas de campanhas de vendas
e marketing so elaboradas com base nos dados quase em tempo real (em alguns
minutos). E, melhor ainda, o sistema permite que se tomem mais rapidamente decises
sobre clientes e classes de clientes especficos.
Caso 9 Data warehousing em tempo real na Overstock.com
Na primavera de 1999, o Dr. Patrick M. Byrne reconheceu o potencial de liquidar
estoques excedentes na Internet. Seis meses depois e sem financiamento externo, ele
lanou o website Overstock.com. A Overstock.com, Inc., uma varejista de ponta de
estoque online que vende mercadorias de marca com desconto na Internet. A empresa
oferece a seus clientes uma oportunidade conveniente de comprar saldos e a seus
fornecedores um canal alternativo de distribuio para liquidar o estoque. Criada sobre os
princpios de investimento de valor e negociao justa, a Overstock.com tornou-se
rapidamente a lder online de um mercado avaliado em US$ 60 bilhes nos Estados
Unidos. O nmero de produtos que a loja oferece cresceu de menos de 100, em 1999, a
mais de 14.000 itens alm dos aproximadamente 650.000 produtos de livros, msica e
vdeo em junho de 2005. A Overstock.com oferece os melhores valores em produtos de
marca para os consumidores.
Em abril de 2005, a Overstock.com selecionou a Teradata como provedora de EDW com
aplicaes analticas, incluindo CRM, data mining, BA (Business Analysis - Anlise de
Negcios), a sute de e-business da Teradata, modelos de dados lgicos e consultoria.
Este EDW integrou os dados da empresa em um repositrio nico para proporcionar uma
viso holstica dos negcios. O EDW da Teradata oferece uma tecnologia de banco de
dados paralelo, uma sute de utilitrios de acesso e gesto de dados e um portflio ( uma
coleo de todo o trabalho em andamento na organizao relacionado com o alcance dos
objetivos do negcio da empresa) de ferramentas de anlise que apresentam insights
(percepes) detalhados de negcios, alm de promoverem interaes com um alto grau
de relevncia para as necessidades dos clientes.

61

Fundamentos e Aplicaes de BI

Em agosto de 2005, a loja, sediada em Salt Lake City, comeou a conectar os usurios a
um data warehouse em tempo real. Ela usou ferramentas de gesto de dados transacionais
da GoldenGate Software, Inc. para extrair as informaes diretamente dos seus sistemas
comerciais para o warehouse. A Overstock.com adotou tambm a estrutura de servios
baseada na Web da Teradata para a integrao de aplicaes, visando substituir um
processo que usava ferramentas de ETL tradicionais para elaborar relatrios diretamente
a partir dos seus sistemas de retaguarda. Agora, o data warehouse recebe os dados de
acesso ao website em tempo real, dados financeiros e de vendas de produtos a cada 15
minutos e outras informaes de hora em hora. Quando lanamos alguma campanha,
podemos saber dentro de 15 minutos se elas esto produzindo uma alta na receita que
normalmente no aconteceria, diz Jack Garcella, vice-presidente de anlise e relatrios
de data warehousing. Com alguns terabytes de dados armazenados no EDW e milhes de
transaes efetivadas todos os dias, a Overstock.com precisava garantir que o warehouse
fosse atualizado constantemente. Ela selecionou o Sunopsis Dat Conductor, um produto
de ETL, para permitir o trabalho automtico e eficiente com grandes volumes de dados
provenientes dos sistemas de origem.
Caso 10 Bem & Jerrys se supera com a BA
Na fbrica da Bem & Jerrys (benjerry.com) em Waterbury, Vermont, tubos enormes
bombeiam mais de 94.000 litros de sorvete todos os dias. Durante o dia, caminhes
refrigerados fazem fila, recolhem o sorvete eo distribuem aos depsitos. Dali, o sorvete
enviado para mais de 60.000 mercados nos Estados Unidos em em outros 14 pases. Nos
mercados, o sorvete colocado em freezers e comercializado.
Na sede da empresa, a vida de cada litro de sorvete desde os ingredientes at a venda
acompanhada de perto. Depois que um litro rotulado e enviado a Bem & Jerrys
armazena seu nmero de rastreamento em um data warehouse da Oracle e posteriormente
analisa os dados. Usando software de BA, a equipe de vendas consegue verificar se o
Chocolate Chip Cookie Dough est ganhando terreno sobre o Cherry Garcia no cobiado
posto de lder de vendas. O departamento de marketing confere se as promoes e
propagandas da empresa esto gerando um aumento nas vendas. O pessoal de finanas
usa os nmeros de rastreamento em suas anlises para mostrar a renda gerada por cada
tipo de sorvete. Desde que a empresa comeou a usar o software, o departamento de
contabilidade reduziu o tempo que leva para encerrar o balano mensal. Tambm,
provavelmente o mais importante para uma empresa focada na fidelidade do cliente, a
equipe de assuntos do consumidor faz a correspondncia de cada litro com as centenas de
ligaes e e-mails recebidos toda semana para verificar se h alguma reclamao.

62

Fundamentos e Aplicaes de BI

Caso 11 TCF Financial Corp.: conduzindo OLAP, relatrios e data mining


Um dos maiores bancos regionais do centro-oeste dos Estados Unidos, o TCF Bank
(tcfbank.com) tem mais de 400 filiais em 6 estados e atende clientes de todos os nveis de
renda. O TCF Bank tambm opera o 4 maior sistema do pas de filiais de banco em
supermercados. A empresa se concentra em ser um local nico de parada para os clientes:
um dos poucos bancos dos EUA a abrir 12 horas/dia, 7 dias/semana, inclusive nos
feriados.
Os usurios dos principais grupos do banco (como varejo, emprstimos, hipotecas e
corretagem) descobriram que os relatrios de TI no supriam suas necessidades de
suporte deciso. Assim, eles tiveram de desenvolver processos personalizados para
baixar arquivos dos dados operacionais brutos, depois carregar os dados em planilhas
para analis-los melhor. O tempo necessrio para criar um relatrio grfico padro era at
um ms; seis semanas era o que se levava para gerar uma lista de marketing de clientes.
O departamento de gerenciamento de informaes TCF precisava criar um processo
melhor, que permitisse aos usurios obter a percepo dos clientes para revelar
oportunidades e oferecer-lhes novos servios de forma eficaz. O banco, desta forma,
adotou o PowerCenter e o PowerAnalyzer da Informatica Corp. em meados de 2002. Os
recursos de assistente de criao de relatrios, relatrios baseados em mtricas e drill
down do caminho de anlise do PowerAnalyzer foram fatores importantes na deciso
pela adoo, visto que suas funes eram fceis de usar. Tambm foram desenvolvidos
vrios relatrios iniciais de indicadores-chave para dashboards de usurios. Em uma
semana, 550 funcionrios do setor de emprstimos e executivos estavam usando este e
outros relatrios diariamente.
Com o novo sistema OLAP, que inclui uma aplicao de vendas cruzadas, o TCF
consegue identificar classes de clientes a quem abordar com produtos e servios
especficos correspondentes. Isso particularmente crucial na identificao das
necessidades de clientes novos. Alm do mais, so gerados relatrios e fornecido OLAP
para faciltar anlises adicionais.
Caso 12 Varejistas tornam estvel o progresso do BI
A maioria dos varejistas convencionais fica para trs de outros setores no uso de BI.
Excees notveis incluem Wal-Mart Stores Inc. e Sears. Outros varejistas continuam a
fazer progressos impressionantes. Seguem alguns exemplos:
. Hudsons Bay Co. fez 333 anos me maio de 2003. Apesar da idade, a Hudsons Bay
atualizou sues sistemas de informao a fim de dar aos executivos, gerentes de loja e
principais fornecedores mtodos para analisar resmas de dados de vendas e clientes. O
desafio enfrentado pela empresa determinar como transformar os dados em informaes
teis. A empresa usa 2 data warehouses e ferramentas de BI da Teradata para controlar as
vendas e tomar decises sobre estoque de venda de produto.
. Na Harry Rosen Inc., uma cadeia com 17 lojas de vesturio masculino, os executivos
usam as ferramentas de anlise de dados da Cognos Inc. integradas ao sistema de
merchandising. Mais de uma dzia de relatrios de venda e estoque para anlise de
vendas ajuda a empresa a identificar tendncia de vendas, gerenciar estoque e melhorar as
margens de lucro bruto.

63

Fundamentos e Aplicaes de BI

. A Reno-Depot, uma loja varejista canadense para reformas domsticas com mais de 20
lojas, usa informao de trfego de clientes, dados de vendas dos pontos de vendas, etc.
para desenvolver, prever e criar cronogramas de trabalho adequados. O software realiza
uma anlise das situaes de trabalho existentes, criando dinamicamente turnos com as
tarefas do trabalhador.
. A Coldwater Creek gera relatrios atravs da integrao de dados produzidos em
aplicaes muito diferentes usando data warehousing e o Microsoft SQL Server 2000. O
tempo de preparao de relatrios foi reduzido significativamente.
. Ao usar ferramentas de BI e anlise da Business Objects, a TruServ Corp. (controladora
da True Value Hardware e da Taylor Rental) reduziu seu estoque de zona vermelha (ou
seja, produtos que no foram vendidos em meio ano) em US$ 50 milhes em 2 anos
atravs da anlise das reservas de produto. O sistema tambm identificou produtos
encalhados nos 14 centros de distribuio da empresa que poderiam vender melhor em
outras partes do pas.
Outros varejistas esto buscando maneiras similares de obter uma vantagem competitiva.
Colocar o produto certo no local certo, na hora certa e com o preo certo uma das metas
dos varejistas. Fazer isso corretamente determina quem tem sucesso e quem falha.
Varejistas tradicionais esto aprendendo com os varejistas virtuais como realizar
investigaes analticas sobre desempenho do cliente. A J. Crew Group e a Nordstrom
Inc., por exemplo, usam o DigiMine para analisar as vendas online. A Nordstrom tinha
uma situao na qual compradores virtuais estavam a procura de piercings de umbigo
exatamente iguais ao que uma modelo usou em um anncio. A empresa conseguiu obter
rapidamente os piercings para suas lojas e seus clientes virtuais, mesmo no tendo o
produto antecipadamente.
Caso 13 Acidentes com veculos automotores e as distraes do motorista
A distrao do motorista est na posio central das preocupaes com segurana na
estrada. Um estudo publicado em1996 pela NHTSA (National Highway Traffic Safety
Administration) concluiu que aproximadamente 25 a 30% dos ferimentos causados por
acidentes de carro eram devido distrao do motorista. Em 1999, segundo o FARS
(Fatality Analysis Reporting System) desenvolvido pela NCSA (National Centre for
Statistics and Analysis), 11% dos acidentes fatias (ou seja, 4.462 mortes) eram devido
falta de ateno do motorista.

64

Fundamentos e Aplicaes de BI

Um estudo foi realizado para extrair os padres dos fatores de distrao e acidentes no
trnsito. O data mining foi a principal ferramenta para traar a correlao dos dados a
partir das informaes sobre acidentes fornecidas pelo FARS. Trs tcnicas de data
mining redes de Kohonen (os neurnios competem entre si para responder a um
estmulo apresentado. Durante o aprendizado, formam-se agrupamentos de neurnios
topologicamente organizados, onde cada grupo responsvel por responder a uma classe
de estmulos.), rvores de deciso e redes neurais para descobrir diferentes combinaes
de fatores de distrao que explicassem os altos ndices de acidentes foram usadas na
pesquisa. As redes de Kohonen detectaram clusters e revelaram padres de variveis de
entrada na coleta de dados. As rvores de deciso exploraram e classificaram a
consequncia de cada incidente em eventos sucessivos: as rvores de deciso sugeriram a
relao entre motoristas desatentos e condies fsicas/mentais. As tcnicas de data
mining foram aplicadas aos conjuntos de dados a fim de correlacionar falta de ateno e
outros fatores relacionados ao motorista em acidentes de trnsito. Por fim, um modelo de
rede neural foi treinado e testado para observar a eficcia do modelo. O Clementine, da
SPSS, foi usado para extrair os dados derivados do banco de dados do FARES em trs
modelos.
O sistema identificou 1.255 motoristas que estiveram envolvidos em acidentes no qual a
falta de ateno foi um dos fatores determinantes que levou ao acidente. Colises frontais
e traseiras e outros tipos de coliso, entre outras diversas variveis de sada foram
previstas com 78 e 77% de preciso.
Caso 14 Data mining para identificar o comportamento do cliente
Entender o comportamento do cliente importante no ajuste das estratgias de negcios,
no aumento dos lucros e na identificao de novas oportunidades. Muitas empresas tm
uma volumosa quantidade e impressionante variedade de recursos de dados e
informaes que prometem revelar muito mais sobre o comportamento do cliente do que
se pensava que era possvel. Muitas organizaes atingiram uma situao de dados
valiosos e utilizao ineficiente. Para a maioria dos ambientes de varejo, trs fontes de
dados do cliente so mais importantes para as tentativas de data mining visadas ao melhor
entendimento do comportamento:
. Dados demogrficos
. Dados de operao
. Dados de interao online
A anlise de acesso na Web pode ser usada para identificar quem comprou e quem no
comprou um produto, por que e quando.

65

Fundamentos e Aplicaes de BI

O processo de data mining no varejo tem trs aspectos diferentes:


1. Anlise da Web. Reunir estatsticas de website que rastreiam o comportamento online
do cliente: hits, pginas, volumes de vendas e assim por diante. Isso ajuda a ajustar o
website para atender as necessidades do cliente.
2. Anlise do cliente. Anlise do cliente acrescenta profundidade para entender as
interaes do cliente. Empresas renem dados de mltiplas fontes, incluindo interaes
em websites, dados de operao provenientes de compras off-line, e dados demogrficos.
Isso fundamental em CRM e gerenciamento de receita, pois um melhor entendimento
permite que uma empresa rena os clientes em grupos.
3. Otimizao. A otimizao assegura grande compensao. Padres sutis podem ser
detectados e usados para otimizar as interaes do cliente. Esse a meta do CRM e do
gerenciamento de receita.
Veja a J. Crew, grande varejista on-line e por catlogo de vesturio, calados e acessrios
masculinos e femininos. Ela tem tido imenso sucesso com anlise de otimizao.
Anteriormente, a empresa usava um procedimento manual incmodo para sugerir estilos
semelhantes e complementares para compradores virtuais. No segundo semestre de 2002,
a J.Crew implantou a anlise de otimizao. As sugestes do mecanismo analtico, que
so feitas automaticamente, geram o dobro de vendas que o sistema manual antigo.
Caso 15 A personalizao da medicina
A pesquisa tem percorrido um longo caminho na personalizao da sade. Nos
tratamentos clnicos, os mdicos esto tentando encontrar a melhor maneira de
personalizar o tratamento (ex.: escolher o tratamento quimioterpico mais apropriado
para um paciente com cncer com um marcador gentico especfico). Para uma melhor
personalizao do tratamento, a Mayo Clinic e a IBM esto aplicando reconhecimento de
padres e data mining aos registros dos pacientes.
Os dados so coletados de diferentes recursos nos hospitais da Mayo, incluindo arquivos
digitais dos pacientes, resultados laboratoriais, raios-x e eletrocardiogramas. Algoritmos
personalizados so aplicados nos dados para identificar padres baseados na idade,
histrico mdico, gentica e outros fatores. A anlise relata como os pacientes
responderiam a vrios tratamentos e como personalizar seu cuidado. Isso tambm ajuda
os pesquisadores no desenvolvimento de terapias. Ferramentas de reconhecimento de
padres so usadas para descobrir relaes entre protenas, cdigo gentico e respostas a
tratamentos especficos. As tecnologias de data mining so extremamente teis na
descoberta de correlaes e revelaes que anteriormente teriam sido ignoradas.
Mudar para registros clnicos eletrnicos traz consigo o problema constante de
responsabilidade dos dados. Somente pessoas essenciais devem ter acesso s informaes
do paciente, e o data mining precisa ser aplicado apenas em dados agregados. Na Mayo
Clinic, os pacientes podem decidir se seus dados clnicos podem ser usados para anlise.

66

Fundamentos e Aplicaes de BI

Caso 16 Uma mina no financiamento de terroristas


O ataque terrorista ao World Trade Center, em 11 de setembro de 2001, realou a
importncia de uma inteligncia de fontes abertas. A Lei Patriota dos EUA e a criao do
Departamento Norte-Americano de Segurana Nacional (DHS) anunciaram a possvel
aplicao de tecnologia da informao e tcnicas de data mining para detectar lavagem de
dinheiro e outras formas de financiamento terrorista. Os rgos policiais tm se
concentrado na investigao das atividades de lavagem de dinheiro atravs de operaes
normais por bancos e outras empresas de servios financeiros. Os preos no comrcio
internacional vieram tona desde que os ataques terroristas viraram o foco dos rgos
policiais.
O comrcio internacional tem sido usado pelos lavadores para mover dinheiro
silenciosamente para fora de um pas sem atrair a ateno do governo. Supervalorizar as
importaes e desvalorizar as exportaes so estratgias para realizar essa transferncia.
O modo de agir na supervalorizao pode ser a seguinte: um importador nacional e um
exportador estrangeiro podem formar um vnculo e supervalorizar as importaes, com
isso transferindo dinheiro do pas de origem, resultando em crimes relacionados a fraude
aduaneira, evaso de divisas e lavagem de dinheiro. O exportador estrangeiro pode ser
membro de uma organizao terrorista.

As tcnicas de data mining concentram-se na anlise de dados nas operaes de


importao e exportao do Departamento de Comrcio dos EUA e de outros organismos
relacionados ao comrcio. Os preos de importao que excederem os preos de
importao do quartil (dividir uma srie ordenada de observaes em quatro partes,
correspondentes a 25, 50 e 75% dessas observaes) mais alto e os preos de exportao
que forem inferiores aos preos de exportao do quartil mais baixo so rastreados. O
foco nos preos irregulares de transferncia entre corporaes que podem resultar no
deslocamento de rendas e impostos taxveis para fora dos Estados Unidos. Uma variao
de preo observada pode estar relacionado a sonegao fiscal/evaso de divisas, lavagem
de dinheiro ou financiamento terrorista. A variao de preo observada tambm pode ser
devido a um erro no banco de dados de comrcio dos EUA.

O total de dinheiro estimado levado para for dos EUA em2001 foi de US$ 156,22
bilhes. O data mining resultar em avaliao eficiente de dados, que por sua vez
auxiliar na cruzada contra o terrorismo. A aplicao de tecnologia da informao e
tcnicas de data ming s operaes financeiras pode contribuir com o aumento na
qualidade da informao do servio secreto.

67

Fundamentos e Aplicaes de BI

ANEXO 1 Bibliografia/Webliografia
. PRIMAK, Fbio. Decises com B.I. (Business Intelligence). Cincia Moderna, 2008.
. TURBAN, Efraim. Business Intelligence Um enfoque gerencial para a inteligncia do
negcio. Editora Bookman, 2009.
. CARVALHO, Lus Alfredo Vidal. Data Mining a Minerao de Dado no Marketing,
Medicina, Economia, Engenharia e Administrao. Editora Cincia Moderna, 2005.
http://pt.wikipedia.org
http://www.webartigos.com/articles/2437/1/business-intelligence/pagina1.html
http://www.riosoft.com.br
http://www.sato.adm.br/artigos/espaco_rh_pec_proc_decisorio.htm
http://www.priberam.pt/dlpo
http://www.wgsystems.com.br/blocos/modelagem_preditiva.html
http://pt.wikipedia.org/wiki/Ad_hoc
http://images.google.com/imgres?imgurl=http://www.devmedia.com.br/imagens/articles//
Dw12.PNG&imgrefurl=http://www.devmedia.com.br/articles/viewcomp.asp%3Fcomp%
3D12609&usg=__HlNnfGAfaNaBIprd4RsnE9RQde0=&h=395&w=713&sz=29&hl=ptBR&start=1&um=1&tbnid=dc74bhXnpH49OM:&tbnh=78&tbnw=140&prev=/images%
3Fq%3DDW%2Bbanco%2Bde%2Bdados%26hl%3DptBR%26lr%3D%26rls%3Dcom.microsoft:en-US%26um%3D1
http://www.baguete.com.br/artigosDetalhes.php?id=154
http://pt.wikipedia.org/wiki/Data_Warehouse
http://www.ead.fea.usp.br/semead/4semead/artigos/mqi/come.pdf
http://www.din.uem.br/~ia/mineracao/tecnologia/warehouse.html
http://imasters.uol.com.br/artigo/11178
http://www.fef.br/~eajardini/posgrad/2006/mba/MBA_DW_Fatos_Dimensoes_Medidas.
pdf
http://www.ccuec.unicamp.br/revista/infotec/informacao/inf54.htm
http://www.scribd.com/doc/17595470/Palestra-Modelagem-Dimensional
http://www2.stela.ufsc.br/aran/sad/sad_aula4.htm
http://www.fef.br/~eajardini/posgrad/2006/mba/MBA_DW_Fatos_Dimensoes_Medidas.
pdf
http://www.univem.edu.br/cursos/tc_admin/david_jailton_joao.pdf
http://mtcm18.sid.inpe.br/col/lac.inpe.br/worcap/2003/10.31.15.48/doc/ArtigoWorkap3.pdf
http://www.datawarehouse.inf.br/etl.htm
http://projetos.inf.ufsc.br/arquivos_projetos/projeto_593/TCC-Caruso-Rubik-Fileto20070227.doc
http://www.inf.unisinos.br/~cazella/dss/200601/ad_td.pdf
http://www.infowester.com/redesneurais.php
http://www.lncc.br/~labinfo/tutorialRN/frm1_arquitetura.htm

68