Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
Aplicaes de BI
Graduao Tecnolgica:
Tecnologia da Informao
Fundamentos e Aplicaes de BI
SUMRIO
SUMRIO .......................................................................................................................... 2
LISTA DE FIGURAS......................................................................................................... 3
UNIDADE I INTRODUO AO BUSINESS INTELLIGENCE ................................. 4
1.1-Histrico ................................................................................................................... 4
1.2-Evoluo ................................................................................................................... 5
1.3-Objetivos de BI......................................................................................................... 7
1.4-Dado versus Informao versus Conhecimento versus Deciso ............................ 10
UNIDADE II FERRAMENTAS DE BUSINESS INTELLIGENCE ........................... 11
2.1-BPM........................................................................................................................ 11
2.2-BAM ....................................................................................................................... 12
2.3-Data Warehouse...................................................................................................... 13
2.4-Metadados............................................................................................................... 19
2.5-Data Mart................................................................................................................ 25
2.6-Data Mining............................................................................................................ 31
2.7-EIS .......................................................................................................................... 34
2.8-OLAP...................................................................................................................... 35
2.9-ETL......................................................................................................................... 39
2.10-DSS....................................................................................................................... 41
2.11-rvore de Deciso ................................................................................................ 42
2.12-Redes Neurais ....................................................................................................... 45
2.13-Geradores de Consultas e Relatrios .................................................................... 48
2.14-GIS e GPS............................................................................................................. 51
UNIDADE III ESTUDOS DE CASO ........................................................................... 55
ANEXO 1 Bibliografia/Webliografia ............................................................................ 68
Fundamentos e Aplicaes de BI
LISTA DE FIGURAS
Figura 1: Principais componentes do DW ........................................................................ 14
Figura 2: Indicao de agregao de algumas dimenses ................................................ 29
Figura 3: Sugesto de consulta baseado em alguns itens da dimenso............................. 29
Figura 4: Exemplo de um Modelo Multimensional Estrela.............................................. 30
Figura 5: Estrutura de uma rvore de deciso................................................................... 42
Figura 6: Exemplos de Treino........................................................................................... 43
Figura 7: rvore de deciso baseada no exemplo do treino. ............................................ 43
Figura 8: Relao entre elementos da rvore, atributos, valores e classificaes............. 44
Figura 9: rvore de deciso quando Aspecto=Sol e Vento=Fraco .................................. 44
Figura 10: rvore de deciso quando Aspecto=Sol ou Vento=Fraco .............................. 45
Fundamentos e Aplicaes de BI
Fundamentos e Aplicaes de BI
1.2-Evoluo
O atual interesse pelo BI vem crescendo assustadoramente na medida em que seu
emprego possibilita s organizaes realizar uma srie de anlises e projees, de forma a
agilizar os processos relacionados s tomadas de deciso.
QUADRO EVOLUTIVO DO BI
Perodo
Idade Antiga
O que aconteceu?
. Povos do Oriente Mdio cruzavam informaes da
natureza, mars, etc. para analisarem a viabilidade
do cultivo de determinadas espcies, perodos de
pesca abundante, etc.
. Rainha Elizabeth I, determinou que a base da
fora inglesa fosse informao e comrcio e
ordenou ento ao filsofo Francis Bacon que
inventasse um sistema dinmico de informao, o
qual foi amplamente aplicado pelos ingleses.
. Evoluo dos computadores que deixaram de
ocupar salas enormes, na medida em que
diminuram de tamanho.
. As empresas passaram a perceber os dados como
uma possvel e importante fonte geradora de
informaes decisrias e que renderiam eventuais
lucros.
. poca dos cartes perfurados.
. Predominncia das linguagens de programao:
COBOL, ASSEMBLY e FORTRAN.
. Evoluo das formas de armazenamento e acesso
a dados DASD e SGBD.
DASD Direct Access Storage Device
dispositivo de armazenamento de acesso direto (ex.:
HD).
SGBD Sistema Gerenciador de Banco de Dados.
. Desenvolvido o EIS.
EIS Executive Information System ou Sistema
de Informao Executiva.
. Desenvolvimento e evoluo das linguagens de
programao CLIPPER e PASCAL.
. Incio da aplicao do termo Business
Intelligence.
Sculo XVI
Dcada de 60
Dcada de 70
Dcada de 80
Fundamentos e Aplicaes de BI
Dcada de 90
Fundamentos e Aplicaes de BI
1.3-Objetivos de BI
Analisar os dados corporativos de maneira simples, no formato correto e no tempo certo,
para que a empresa possa tomar decises melhores e mais rpidas.
Essa soluo tem como finalidade transformar dados em informao e informao em
conhecimento.
Cenrio encontrado em muitas empresas antes de usar BI
. Diferentes Bases de Dados (ERP, Sistemas Internos, etc.).
. Integridade dos dados no nvel Operacional.
. Dificuldade em atender o nvel Ttico/Estratgico.
Nvel Estratgico aquele que geralmente executado com uma viso mais mediata,
isto , mais a longo prazo e, dada sua natureza e seu grau de importncia para a
organizao, representa um impacto mais amplo, profundo e duradouro sobre a
mencionada organizao. importante frisar que, como o planejamento estratgico, na
maioria das organizaes, elaborado pelo seu mais alto escalo hierrquico, o mesmo
dever contemplar uma srie de decises que devero ser tomadas nos demais nveis
hierrquicos da organizao.
Ex: Misso: o motivo principal da existncia de uma organizao, demonstrando seu
verdadeiro papel perante as sociedades interna e externa, onde ela atua.
Nvel Ttico Traduzir as decises estratgicas em aes efetivas a serem
implementadas pelos mais diversos setores da organizao. Desta forma, o nvel ttico
tem seu foco mais especfico. No nvel ttico, existe um menor nvel de incerteza para as
tomadas de decises. O tempo de planejamento no nvel ttico, a mdio prazo.
Ex: Poltica de Recrutamento e Seleo de Pessoal.
Nvel Operacional Os esforos so direcionados para cada processo ou projeto da
organizao. So aplicadas em setores especficos e apresentam impactos limitados. O
tempo de planejamento no nvel operacional a curto prazo. As decises operacionais
so eminentemente tcnicas, isto , sem um forte alcance de cunho poltico-social.
Ex: Levantamento da Necessidade de Treinamento.
. Criao de Ilhas de informao (Relatrios/Planilhas).
. Os dados dos relatrios/planilhas no batem entre si.
. Reunies com decises inconsistentes.
Fundamentos e Aplicaes de BI
Fundamentos e Aplicaes de BI
Aps BI (%)
78
20
2
0
2. Nossos produtos e servios esto sendo bem aceitos pelo mercado consumidor?
Antes BI (%)
Aps BI (%)
timo
49
84
Bom
35
12
Razovel
8
4
Pssimo
8
0
3. O tempo de atendimento aos novos prospects reduziu?
prospects = futuros clientes.
Antes BI (%)
timo
15
Bom
47
Razovel
22
Pssimo
16
Aps BI (%)
57
40
2
1
Fundamentos e Aplicaes de BI
10
Fundamentos e Aplicaes de BI
11
Fundamentos e Aplicaes de BI
2.2-BAM
A revoluo do BI e do BPM acabou gerando mais uma forma de controle chamada de
BAM (Business Activity Monitoring - monitoramento da atividade de negcio). Esse tipo
de controle sempre foi perseguido pelas empresas e existia de uma forma ou de outra.
Com sua evoluo, ela comea a aparecer cada vez mais nas empresas.
A idia simples: coloque uma interface parecida com a de controle de velocidade dos
carros no computador de algum e a conecte com vrios dados crticos de desempenho
em tempo real de suas operaes, tais como vendas por hora, produtividade, eficincia,
etc. A racionalidade da coisa est em que o executivo precisa ter acesso informao
quando ela acontecer, exatamente como os controles de um carro, como a velocidade, que
voc precisa adaptar as condies da estrada, por exemplo.
BAM um software que pode exteriorizar em tempo real informaes de negcio que so
importantes de alguma maneira. Voc pode organizar os BAMs em 3 tipos bsicos:
Mtricas de Processo
BAM passivo
BAM ativo
12
Fundamentos e Aplicaes de BI
2.3-Data Warehouse
uma coleo de dados derivados dos dados operacionais para sistemas de suporte
deciso. Estes dados derivados so, muitas vezes, referidos como dados gerenciais,
informacionais ou analticos.
Os bancos de dados operacionais (OLTP) armazenam as informaes necessrias para as
operaes dirias da empresa, so utilizados por todos os funcionrios para registrar e
executar operaes pr-definidas, por isso seus dados podem sofrer constantes mudanas
conforme as necessidades atuais da empresa. Por no ocorrer redundncia nos dados e as
informaes histricas no ficarem armazenadas por muito tempo, este tipo de banco de
dados no exige grande capacidade de armazenamento (com algumas excees).
J um DW armazena dados analticos, destinados s necessidades da gerncia no
processo de tomada de decises. Isto pode envolver consultas complexas que necessitam
acessar um grande nmero de registros, por isso importante a existncia de muitos
ndices criados para acessar as informaes da maneira mais rpida possvel. Um DW
armazena informaes histricas de muitos anos e por isso deve ter uma grande
capacidade de processamento e armazenamento dos dados que se encontram de duas
maneiras: detlhados e resumidos.
Algumas diferenas entre banco de dados OLTP e banco de dados DW:
Caractersticas
Objetivo
Uso
Tipo de
processamento
Unidade de trabalho
Nmero de usurios
Tipo de usurio
Interao do usurio
Banco de Dados DW
Analisar o negcio
Informativo
OLAP
Volume
Histrico
Granularidade
Redundncia
Estrutura
Manuteno
desejada
Acesso a registros
Atualizao
Integridade
Nmero de ndices
Inteno dos ndices
Megabytes gigabytes
60 a 90 dias
Detalhados
No ocorre
Esttica
Mnima
Carga e consulta
Centenas ou dezenas
Comunidade gerencial
Pr-definida e ad-hoc.
ad-hoc um tipo de coleta de
dados, ou seja, para resolver
determinado problema ou realizar
uma tarefa especfica.
Gibabytes terabytes
5 a 10 anos
Detalhados e resumidos
Ocorre
Varivel
Constante
Dezenas
Contnua (tempo real)
Transao
Poucos/simples
Localizar um registro
Milhares
Peridica (em batch)
A cada atualizao
Muitos/complexos
Aperfeioar as consultas
13
Fundamentos e Aplicaes de BI
Com base nestes conceitos podemos concluir que o DW no um fim, mas o meio pelo qual as empresas
dispem para analisar informaes histricas, podendo utiliz-las para a melhoria dos processos atuais e
futuros.
DW so construdos para que tais dados possam ser armazenados e acessados de forma que no sejam
limitados por tabelas e linhas estritamente relacionais. Os dados de um DW podem ser compostos por um
ou mais sistemas distintos e sempre estaro separados de qualquer outro sistema transacional, ou seja, deve
existir um local fsico onde os dados desses sistemas sero armazenados.
14
Fundamentos e Aplicaes de BI
15
Fundamentos e Aplicaes de BI
16
Fundamentos e Aplicaes de BI
17
Fundamentos e Aplicaes de BI
18
Fundamentos e Aplicaes de BI
2.4-Metadados
Definidos como dados dos dados, constituem peas fundamentais num DW. Isso
porque em um DW, alm do banco de dados, gera-se uma documentao muito maior
que nos banco de dados tradicionais. feito o levantamento dos relatrios a serem
gerados, de onde vm os dados para alimentar o DW, os processos de extrao,
tratamento e rotinas de carga de dados. Tudo isso, acrescido das regras de negcios da
empresa, das mudanas ocorridas ao longo do tempo e da frequncia de acesso aos dados,
gera os metadados.
Os metadados mantm as informaes sobre o que est onde num DW. Eles podem
surgir de vrios locais durante o decorrer do projeto.
Podem ser encontrados em vrios locais durante o desenvolvimento de um DW.
Alguns tipos de metadados:
Repositrios de ferramentas CASE Normalmente os dados contidos em
ferramentas CASE so estruturados, o que facilita a integrao automtica entre a
origem dos metadados e o repositrio do ambiente de DW. Pode-se extrair
informaes sobre a origem dos dados, o fluxo dos dados (os processos que
utilizam e transportam os dados), o formato dos dados e as definies de
negcios.
Documentao do desenvolvimento dos sistemas operacionais (OLTP) O tipo
de metadados potencialmente disponvel idntico ao item acima. A diferena
que normalmente a documentao de desenvolvimento dos sistemas no est
estruturada, o que pode dificultar o entendimento das origens e fluxos dos dados.
Cdigo fonte dos sistemas operacionais (OLTP) Quando no existe uma
documentao eficiente dos sistemas operacionais, possvel extrair as
informaes sobre eles atravs dos programas fontes. Como vasculhar todos os
programas de um ou vrios sistemas operacionais a procura de regras um
trabalho demorado e oneroso, possvel simplesmente utiliz-los como forma de
esclarecer dvidas que a documentao no contempla, tambm cobre os mesmos
tipos de informaes das fontes anteriores.
Entrevistas Apesar de no ser uma fonte estruturada de informaes,
entrevistar profissionais da empresa que entendam do negcio, como gerentes e
analistas, de vital importncia. Destas entrevistas pode se obter regras e
informaes que no esto explcitas na documentao dos sistemas, como
requisitos para teste dos dados e indicadores de qualidade dos dados.
O prprio ambiente do DW Informaes tais como frequncia de acesso s
informaes, em que nvel de agregao, tempo de resposta de cada consulta,
19
Fundamentos e Aplicaes de BI
20
Fundamentos e Aplicaes de BI
Sem uma administrao de dados efetiva, um Data Warehouse no atingir o seu objetivo
de integrao dos dados. Nesse sentido o metadado constitui o principal recurso para a
administrao de dados no Data Warehouse e constitui um componente formal
extremamente importante no processo de Data Warehousing.
Sem metadados, os dados no tm significado. Sem metadados, localizar informaes
contidas em um Data Warehouse torna-se uma tarefa muito difcil, semelhante a procurar
o telefone de uma pessoa sem a ajuda de uma lista telefnica.
Sem metadados, usurios de negcios sero como turistas deixados em uma nova cidade
sem qualquer informao sobre essa cidade, e os administradores do Data Warehouse
sero como os administradores da cidade que no tm idia do tamanho dessa cidade e
em que velocidade ela est crescendo. Um Data Warehouse sem metadados adequados
um armrio cheio de papis, mas sem pastas ou etiquetas.
Metadados, no s descrevem o contedo do Data Warehouse, como tambm, fornecem
ao usurio informaes teis para o julgamento da qualidade do contedo. Tambm pode
descrever cada fato contido no Warehouse, em termos de quando ele foi atualizado pela
ltima vez, a fonte do fato e como ele gerado.
A falta de uma abordagem integrada para consolidar, gerenciar e manter os metadados
atualizados pode gerar muitos riscos para a credibilidade de um projeto de Data
Warehouse: informaes incorretas, qualidade dos metadados, perda de produtividade,
performance inconstante, dificuldade para atualizao e crescimento.
Metadados faltantes ou no-confiveis levam a uma situao familiar onde um
departamento diz ao diretor que os lucros da empresa esto crescendo 10%, enquanto um
outro diz que baixaram 15%. Cada departamento est usando suas prprias cifras,
coletadas de acordo com seus prprios procedimentos e interpretadas pelas suas prprias
aplicaes.
No difcil chegar a concluso que os metadados so importantes em um Data
Warehouse. Mas existem algumas perguntas bsicas que tambm devem ser respondidas
pelos metadados:
. Que tabelas, atributos e chaves o Data Warehouse contm ?
. Qual a origem de cada conjunto de dados ?
. Que transformao lgica foi usada na carga do dado ?
. Como o metadado tem mudado ao longo do tempo ?
. Quais aliases5 existem e como eles se relacionam ?
. Quais so as referncias-cruzadas entre termos tcnicos e de negcios ?
. Com qual freqncia os dados so carregados ?
. Qual o volume de dados existente ?
21
Fundamentos e Aplicaes de BI
22
Fundamentos e Aplicaes de BI
23
Fundamentos e Aplicaes de BI
24
Fundamentos e Aplicaes de BI
2.5-Data Mart
Um Data Mart um Data Warehouse reduzido que fornece suporte deciso de um
pequeno grupo de pessoas.
Algumas organizaes so atradas aos Data Marts no apenas por causa do custo mais
baixo e um tempo menor de implementao, mas tambm por causa dos correntes
avanos tecnolgicos.
So elas que fornecem um SAD (Sistemas de Apoio Deciso) customizado para grupos
pequenos, de tal modo que um sistema centralizado pode no estar apto a fornecer. Data
Marts podem servir como veculo de teste para companhias que desejam explorar os
benefcios do Data Warehouse.
O Data Warehouse pode ser uma deciso estratgica, mas no pode ser encarado com
imediatismo, ou seja no apenas algo que se realiza aos poucos, mas tambm um
processo contnuo de atualizao e consolidao dos dados corporativos. Por isso, os
investimentos em um sistema desse tipo no devem nem podem ser feitos de uma nica
vez, mas de forma gradual ao longo do tempo.
preciso ter em mente que as diferenas entre Data Mart e Data Warehouse so apenas
com relao ao tamanho e ao escopo do problema a ser resolvido. Portanto, as definies
dos problemas e os requisitos de dados so essencialmente os mesmos para ambos.
Enquanto um Data Mart trata de problema departamental ou local, um Data Warehouse
envolve o esforo de toda a companhia para que o suporte decises atue em todos os
nveis da organizao. Sabendo-se as diferenas entre escopo e tamanho, o
desenvolvimento de um Data Warehouse requer tempo, dados e investimentos gerenciais
muito maiores que um Data Mart.
Os Data Marts atendem as necessidades de unidades especficas de negcio ao invs das
necessidades da corporao inteira. Eles otimizam a entrega de informao de suporte
deciso e se focam na sumarizada e/ou dados exemplificativos ao invs do histrico de
nveis atomizados. Eles podem ser apropriados e gerenciados por pessoal fora do
departamento de informtica das corporaes.
25
Fundamentos e Aplicaes de BI
26
Fundamentos e Aplicaes de BI
Algumas vezes, projetos que comeam como Data Warehouse se transformam em Data
Marts. Quando as organizaes acumulam grandes volumes de dados histricos para
suporte deciso que se mostram pouco ou nunca utilizados, elas podem reduzir o
armazenamento ou arquivamento de informao e contrair o seu Data Warehouse em um
Data Mart mais focado. Ou elas podem dividir o warehouse em vrios Data Marts,
oferencendo tempos de resposta mais rpidos, acesso mais fcil e menos complexidade
para os usurios finais.
As questes de planejamento, projeto e implementao so as mesmas encontradas em
qualquer fase da implementao de um DW, pois uma parte dos especialistas argumenta
que o DW uma evoluo natural de um Data mart que comeou localizado e cresceu
para atender um escopo maior. Essa viso tem defesa menos tcnica e mais intuitiva do
que sua contra-parte: o Data mart criado a posteriori do DW, pois ele seria montado
com dados extrados do DW para atender especificamente um setor da organizao.
Numa viso comparativa dos dados, onde consideramos os quesitos escopo, integrao,
tempo, agregao, anlise e dados volteis, percebemos que a diferena est no escopo,
pois enquanto o DW feito para atender uma empresa como um todo, o data mart
criado para atender um sub-conjunto da empresa. Repare que atender um sub-conjunto da
empresa pode significar reunir dados de outros setores, j que, na prtica, raramente um
nico setor possui ou gera toda informao que precisa. Vem dessa observao a defesa
da tese de que o Data mart construdo aps o DW.
Algumas caractersticas do Data Mart:
. Dados agregados;
. No possui necessariamente um histrico das informaes;
. Esquema estrela (fatos e dimenses);
. Pode ser reconstrudo a partir dos dados existentes no DW;
. Pequeno volume de dados;
. Otimizado para consultas pontuais.
27
Fundamentos e Aplicaes de BI
28
Fundamentos e Aplicaes de BI
29
Fundamentos e Aplicaes de BI
30
Fundamentos e Aplicaes de BI
2.6-Data Mining
Um dos grandes problemas dos especialistas em anlise de informao a transformao
de dados em informao. Como fazer isso de uma forma automatizada e no menor tempo
possvel? Uma das respostas para isso a combinao de estatstica convencional com
tcnicas de inteligncia artificial, que resulta em uma tcnica muito comentada hoje, o
Data Mining. Os processos de Data Mining so extremamente complexos, alm de serem
trabalhos que dificilmente sero resolvidos apenas por um especialista em Data Mining.
Em qualquer projeto de Data Mining obrigatrio a existncia de um profissional com o
conhecimento do negcio, pois ele possui domnio total do assunto. Isso para evitar que
o resultado da modelagem no tenha a menor utilidade para apoiar uma deciso.
Descobrir conhecimento novo escondido em grandes massas de dados.
O Data Mining apresenta 4 fases: preparao, minerao, anlise e aplicao.
A fase de preparao consiste de atividades que vo desde a construo de um banco de
dados separado para os dados sujeitos ao Mining at a atividade de carregar o banco de
dados para o processo de Mining. A preparao dos dados a serem utilizados num projeto
vai variar de acordo com o algoritmo de Mining escolhido. Dependendo deste algoritmo,
os dados sero formatados de maneiras diferentes. Este processo de preparao de dados
determinante para o sucesso do Data Mining e costuma consumir muito tempo e
recurso.
A fase de minerao responsvel por criar os modelos de Data Mining, definir
amostras ou populao e selecionar dados para teinar o modelo. Alm disso, nesta fase
que dever ser definida a formatao requerida pelas ferramentas. Por exemplo, redes
neurais exigem dados na forma dicotmica (sim/no) e rvore de deciso demanda
agrupamentos, como bom, mdio e ruim. Por fim, nesta fase sero criados os previsores
ou atributos-chave para a anlise do negcio. Alguns modelos bsicos de garimpagem de
dados podem ser utilizados na fase de anlise tais como:
. Agregao: tem como objetivo a obteno de agrupamentos baseados na similaridade
apresentada pelos dados.
. Classificao: so processos utilizados para se definir grupos ou classes de elementos,
baseado em certos parmetros pr-estabelecidos. Vrias abordagens so usadas para
definir modelos de referncia (redes neurais, rvores de deciso, baseados em regras),
31
Fundamentos e Aplicaes de BI
32
Fundamentos e Aplicaes de BI
populao. A nova populao ento utilizada como entrada para a prxima iterao do
algoritmo.
O poder das aplicaes de Data Mining aliado as anlises visuais permite novas
iniciativas de marketing focalizadas no relacionamento com o consumidor.
. Prospeco Prioriza a abordagem junto a determinados clientes em potencial, com
base nas experincias registradas com os clientes atuais.
. Aquisio Ajuda no design de campanhas de marketing, considerando as melhores
tcnicas a serem adotadas junto a targets especficos.
. Cross-Selling Identifica nos clientes atuais aqueles que seriam prospectos para uma
outra linha de produtos ou para um upgrading.
. Expanso Aponta dentro dos clientes atuais, aqueles com potencial para aumento de
consumo, facilitando o design de campanhas promocionais para aumento de share
interno.
share = fatia de mercado, participao no mercado, poro no mercado.
. Reteno Identifica e reala clientes abordados de maneira deficiente pelos
concorrentes e desenha campanhas para atrao e reteno dos mesmos.
Os mitos sobre data mining
O data mining uma ferramenta de anlise poderosa que permite aos executivos avanar
da descrio do comportamento histrico do cliente para predio do futuro. Descobrir
padres que revelam mistrios sobre o comportamento do cliente. Os resultados do data
mining pode ser usados para aumentar lucros, reduzir despesas, identificar fraude e
oportunidades de negcios, oferecendo nova vantagem competitiva. Existem alguns mito
sobre o data mining:
Mito
O data mining fornece predies imediatas como
bola de cristal.
O data mining ainda no vivel para aplicaes de
negcios.
O data mining exige um banco de dados dedicado e
distinto.
Somente aqueles com formao avanada podem
fazer o data mining.
O data mining apenas para grandes empresas que
possuem pilhas de dados de clientes.
Realidade
O data mining um processo com vrias etapas que
exige projeto e uso proativos e calculados.
A tecnologia atual est pronta para escolher
aproximadamente qualquer negcio.
Devido aos avanos na tecnologia de banco de
dados, um banco de dados dedicado no
necessrio, embora seja desejvel.
Ferramentas baseadas na Web mais recentes
permitem que gerentes de todos os nveis
educacionais realizem o data mining.
Se os dados refletem exatamente o negcio ou seus
clientes, uma empresa pode usar o data mining.
33
Fundamentos e Aplicaes de BI
2. Ignorar o que seu patrocinador pensa sobre o que data mining e o que realmente pode
e no pode fazer.
3. No dedicar tempo suficiente para preparao dos dados. Exige mais esforo do que
normalmente deduzido.
4. Olhar apenas resultados reunidos e no os registros individuais. O IMS DB2 da IBM
consegue destacar registros individuais de interesse.
5. Ser negligente quanto ao controle de procedimento e resultados do data mining.
6. Ignorar descobertas suspeitas e ir adiante rapidamente.
7. Executar algoritmos de mining de modo repetido e cego. importante pensar bastante
sobre o prximo estgio da anlise de dados. O data mining uma atividade com muita
participao ativa.
8. Acreditar em tudo que se ouve sobre os dados.
9. Acreditar em tudo que se ouve sobre sua prpria anlise de data mining.
10. Medir resultados de maneira diferente daquela que seu patrocinador usa para medir os
dele.
Text Mining a aplicao de data mining em arquivos de texto no estruturados ou
menos estruturados. Raramente os documentos tm uma estrutura interna slida, e quanto
tm, frequentemente est focada no formato do documento ao invs do contedo do
documento. O text mining ajuda as empresas a:
. Encontrar o contedo escondido dos documentos, incluindo relaes adicionais teis.
. Relacionar documentos ao longo de prvias divises despercebidas (ex.: descobrir que
os clientes em suas divises distintas de produto tm as mesmas caractersticas).
. Agrupar documentos por assuntos em comum (ex.: todos os clientes de uma companhia
de seguros que tm reclamaes semelhantes e cancelaram suas aplices).
O text mining no semelhante a um mecanismo de busca na Web. Com o text mining,
queremos descobrir novos padres, pedaos de informao que podem no ser bvios ou
conhecidos.
2.7-EIS
O EIS (Executive Information Systems) um sistema voltado a atender as necessidades
dos altos executivos de uma empresa. Atravs dele, so obtidas informaes gerenciais de
forma rpida e simples. Em geral, o EIS modelado para ser bastante amigvel, uma vez
que seus usurios so pessoas ocupadas e que no tem muito tempo. As informaes
devem ser organizadas de forma resumida porque as decises desse nvel administrativo
no se atm a detalhes, mas ao todo. A esse executivo, por exemplo, no interessa saber
quantas canetas foram usadas na empresa durante um certo perodo, mas sim o valor total
dessas despesas de material.
O EIS pode ser construdo tendo como base vrios sistemas transacionais, mas o ideal
que o sistema acesse um Data Warehouse porque a busca facilitada na medida em que
feita numa nica base de dados. As principais caractersticas desse sistema so: podem
ser customizados de acordo com o estilo de cada executivo; contm recurso grficos que
permitem s informaes serem apresentadas graficamente de vrias formas; so fceis
34
Fundamentos e Aplicaes de BI
de usar e requerem pouco treinamento para tal; permite o acesso rpido e fcil a
informaes detalhadas.
Alm disso, o usurio tambm pode alterar o nvel de detalhamento das informaes
utilizando, para isso, uma ferramenta OLAP. Por exemplo: partindo de um relatrio que
contm todas as informaes sobre as vendas realizadas em 2007 em todos os escritrios
da empresa instalados no estado de So Paulo, um diretor poder analisar as vendas
realizadas em cada cidade do estado.
Os conceitos de EIS e SAD so muitas vezes confundidos. Apesar de estarem
relacionados, o EIS e O SAD tratam de problemas diferenciados, e tipicamente, atendem
a pblicos-alvo diferentes.
Um EIS projetado especificamente para o uso pelos executivos, sendo que a maioria
das aplicaes disponveis do tipo display-only (podendo consultar e imprimir sem
permitir a manipulao de dados). Alm disso, um EIS permite a visualizao de
excees por meio de vrios nveis de detalhe (drill-down). Por outro lado, um SAD
tipicamente projetado para o nvel intermedirio de gerncia. Os ingredientes bsicos de
tais sistemas incluem dados e modelos que descrevem o relacionamento dos dados
(exemplo: rendimento = receitas despesas).
Comparativos Sistemas Tradicionais versus EIS:
Sistemas Tradicionais
Muita informao e muito atraso.
Eficiente para dados resumidos e consolidados.
Pouco efetivos para decises prioritrias.
Grande volume de papel com pouca contribuio
para atividade dos executivos.
EIS
Sistema direcionado e disponibilidade imediata.
Eficiente para anlise de tendncias e excees.
Dados direcionados aos fatores crticos de sucesso.
Facilidade para ao gerencial e tomada de deciso.
2.8-OLAP
As ferramentas OLAP (Online Analytical Processing) tem como funo a navegao nos
dados de um data warehouse, possuindo uma estrutura adequada tanto para as pesquisas
como para a apresentao das informaes.
Nas ferramentas de navegao OLAP possvel navegar entre diferentes granularidades
(detalhamento) de um cubo de dados. Atravs de um processo chamado Drill o usurio
pode aumentar (Drill down) ou diminuir (Drill up) o nvel de detalhamento dos dados.
Por exemplo um relatrio pode estar consolidado por Pases. Fazendo um Drill down os
dados passam a ser apresentados por estados, cidades, bairros e assim sucessivamente at
o menor nvel possvel. O processo contrrio Drill up faz com que os dados sejam
consolidados em nveis superiores.
Outra possibilidade apresentada pela maioria das ferramentas de navegao OLAP a de
rearranjar colunas e linhas. possvel trocar a ordem de colunas e linhas bem como
suprim-las ou exibir aquelas que estejam ocultadas na visualizao dos dados.
35
Fundamentos e Aplicaes de BI
36
Fundamentos e Aplicaes de BI
37
Fundamentos e Aplicaes de BI
38
Fundamentos e Aplicaes de BI
MDX Foi introduzido pela Microsoft com o Microsoft SQL Server OLAP Services
por volta de 1998. Mais recentemente, o MDX apareceu como parte do XML for
Analysis API (XMLA). A adoo entre desenvolvedores de aplicao e provedores de
ferramentas OLAP tem sido crescente. O MDX se tornou um padro para expresses
multidimensionais, abaixo um exemplo da sintaxe MDX:
SELECT {[Measures].[Unit Sales], [Measures].[Store Sales]} ON COLUMNS,
{[Product].members} ON ROWS
FROM [Sales]
WHERE [Time].[1997].[Q2]
2.9-ETL
Extrao, Transformao e Carga (Extract, Transform and Load).
Ferramentas de ETL so fundamentais para preparar os dados que sero armazenados no
DW.
uma ferramenta de back end (retaguarda).
Cinco possveis operaes de DW.
Primeira Extrao dos dados que podem estar em fontes internas (sistemas
transacionais, bancos de dados, etc.) ou externas (em sistemas fora da empresa).
Segunda Fazer a limpeza e transformao dos dados. Nesta etapa so corrigidas
algumas imperfeies contidas na base de dados transacional com objetivo de fornecer
ao usurio dados conciso, no redundantes e com qualidade, permitindo uma anlise
baseada nos valores mais prximos dos reais.
Terceira Processo de transformao do dado. Normalmente, os dado vm de vrios
sistemas e por isso necessrio padronizar os diferentes formatos num nico.
Quarta Processo de carga do DW que em geral feita a partir de um banco de dados
temporrio, no qual os dados armazenados j passaram pela limpeza e integrao.
Quinta Etapa de atualizao dos dados (refresh). So feitas atualizaes na base de
dados transacional. Essas atualizaes sero passadas para o DW, de forma organizada.
A etapa de ETL uma das mais crticas de um projeto de DW, pois envolve a fase de
movimentao dos dados.
Alguns fatores a serem analisados antes de comear a fase de extrao dos dados:
. A extrao de dados do ambiente operacional para o ambiente de Data Warehouse
demanda uma mudana na tecnologia. Os dados so transferidos de banco de dados
hierrquicos para uma nova estrutura de SGBD relacional para Data Warehouse;
39
Fundamentos e Aplicaes de BI
. A seleo de dados do ambiente operacional pode ser muito complexa, pois muitas
vezes necessrio selecionar vrios campos de um sistema transacional para compor um
nico campo no Data Warehouse;
. Tem diversos sistemas antigos que no tem o modelo de dados, e em outros casos,
mesmo que existam no esto documentados.
. Os dados so reformatados. Por exemplo: um campo data da base de dados OLTP do
tipo DD/MM/AAAA pode ser passado para a base de dados OLAP no formato ano/ms
como AAAA/MM;
. Quando h vrios arquivos de entrada, a escolha das chaves dever ser feita antes que os
arquivos sejam intercalados. Isso significa que, se diferentes estruturas de chaves so
usadas nos diferentes arquivos de entrada, ento, opta-se por apenas uma dessas
estruturas;
. Os arquivos devem ser gerados obedecendo a mesma ordem das colunas estipuladas no
ambiente de Data Warehouse;
. Pode haver vrios resultados. Dados podem ser produzidos em diferentes nveis de
resumo pelo mesmo programa de gerao das cargas;
. Valores default devem ser fornecidos. s vezes pode existir um camp no Data
Warehouse que na possui fonte de dados, ento a soluo definir um valor padro para
estes campos.
O DW espelha as informaes histricas necessrias, enquanto o ambiente operacional
focaliza as informaes pontuais correntes.
Uma ferramenta ETL muito til, principalmente se os sistemas OLTP (transacionais)
so muitos, pois ela uma poderosa fonte de gerao de metadados, e que contribuiro
muito para a produtividade da sua equipe. Em alguns casos, importante o auxlio de
profissionais externos para a escolha. O fato verdadeiro que os benefcios sero bastante
vistosos e a produtividade aumentar consideravelmente.
40
Fundamentos e Aplicaes de BI
2.10-DSS
Os Decision Support Systems (Sistemas de Apoio Deciso) surgiram a partir dos
sistemas transacionais existentes nas empresas. So solues que auxiliam no processo
decisrio, utilizando modelos para resolver problemas no estruturados. Inicialmente
necessrio definir quais dados, gerados nos sistemas transacionais, sero armazenados no
Data Warehouse, para depois partir para a modelagem dimensional e a criao fsica do
modelo, no qual as especificidades do Sistema Gerenciador de Banco de Dados (SGBD)
e da ferramenta OLAP escolhidos sero consideradas para otimizar as consultas futuras.
O passso seguinte carregar os dados no DW, definindo as origens dos dados
(identificao dos sistemas legados onde foram gerados, o que facilita a sua localizao),
e depois so feitas as rotinas de extrao de dados, que podem ser desenvolvidas por
programadores em qualquer linguagem de programao. Concluda essa etapa, deve ser
feita a checagem da consistncia dos dados. Qualquer erro nos dados poder determinar o
fracasso da anlise futura.
Outros elementos importantes so a confeco e o armazenamento dos metadados (dados
de controle do DW, responsveis pelos mapeamentos dos dados de cada etapa de
implementao do DSS). As ferramentas OLAP so utilizadas para visualizar e analisar
os dados.
Os Sistemas de Apoio Deciso so aparentemente simples, mas exigem um profundo
conhecimento tcnico e de negcios para serem elaborados e utilizados com sucesso.
41
Fundamentos e Aplicaes de BI
2.11-rvore de Deciso
uma tcnica que a partir de uma massa de dados (Data Mart ou Data Warehouse) cria e
organiza regras de classificao e deciso em formato de diagrama de rvores, que iro
classificar suas observaes ou predizer resultados futuros.
Se seus dados estiverem divididos em classes dicotmicas (busca entre duas alternativas),
por exemplo, infectados contra no-infectados, uma rvore de deciso pode ser
construda para criar regras que classifiquem casos j existentes ou casos novos, com
preciso.
Comea com um nico grupo que rene todos os casos em estudo. Na medida em que a
rvore vai se expandindo, esta base dividida em mdulos que representam categorias
das variveis analisadas. Cada galho da rvore formado por esses ndulos que vo se
abrindo em subgrupos mutuamente exclusivos.
Cada ndulo e cada galho apresentam uma proporo de obteno da resposta em estudo.
Uma rvore de deciso uma representao de uma tabela de deciso sob a forma de uma
rvore. Tem a mesma utilidade da tabela de deciso. Trata-se de uma maneira alternativa
de expressar as mesmas regras que so obtidas quando se constri a tabela.
Trata-se de um modelo prtico de uma funo recursiva que determina o valor de uma
varivel e, baseando-se neste valor, executa-se uma ao. Esta ao pode ser a escolha de
outra varivel ou a sada. As rvores de deciso so treinadas de acordo com um conjunto
de exemplos previamente classificados e, posteriormente, outros exemplos so
classificados de acordo com essa mesma rvore.
A construo de uma rvore de deciso parte da descrio de um problema do qual deve
ser especificado as variveis, aes e a seqncia lgica para a tomada de deciso. Depois
de construda teremos uma viso grfica da tomada de deciso.
42
Fundamentos e Aplicaes de BI
43
Fundamentos e Aplicaes de BI
44
Fundamentos e Aplicaes de BI
A rvore de deciso que representa os dias em que o Aspecto Sol ou o Vento est
Fraco:
2.12-Redes Neurais
Rede Neural uma tecnologia cada vez mais usada em Data Mining.
Sua grande vantagem est basicamente em sua habilidade de aprendizagem a partir das
experincias, no ficando restritas a uma ordem pr-fixada. Elas consistem em algoritmos
e procedimentos computacionais que imitam a capacidade de aprendizagem do crebro.
Esta tcnica formada de ndulos cujo processamento se assemelha ao dos neurnios.
No considerada uma tcnica estatstica por no apresentar a robustez de uma.
No oferece estimadores definidos e o comportamento de uma rede neural, com certa
massa de dados, nem sempre se repetir com outra.
Os ndulos so conectados como uma rede e funcionam paralelamente. A primeira fase
ndulos composta de ndulos de entrada. Eles recebem o input das variveis fornecidas
pelo banco de dados, transformam-no de acordo com uma funo (chamada funo de
ativao), produzindo informao de sada que ser enviada prxima fase de ndulos.
Esta, por sua vez, receber diversas informaes dos ndulos de entrada como seu input.
Esta fase formada pelos ndulos ocultos, que, em redes neurais mais complexas, podem
formar diversas camadas. Por fim, tem-se os ndulos de sada. Estes processam as
informaes recebidas e produzem uma resposta, mas no a enviam para outro ndulo,
pois j o resultado final da rede. Se a rede de classificao, o ndulo de sada j o
final. Para o caso de modelos de previso, o ndulo de sada j representa um valor
preditivo.
importante salientar que no existe uma tcnica universalmente melhor que todas. O
sucesso do Data Mining depende muito da experincia e sensibilidade do pesquisador, o
qual ter que identificar qual a melhor ferramenta a ser utilizada, de acordo como tipo de
resposta procurada e com o modo em que se encontram seus dados. Por isso, os exemplos
45
Fundamentos e Aplicaes de BI
46
Fundamentos e Aplicaes de BI
O aprendizado
O processo de aprendizagem das redes neurais realizado quando ocorrem vrias
modificaes significantes nas sinapses dos neurnios. Essas mudanas ocorrem de
acordo com a ativao dos neurnios. Se determinadas conexes so mais usadas, estas
so reforadas enquanto que as demais so enfraquecidas. por isso que quando uma
rede neural artificial implantada para uma determinada aplicao, necessrio um
tempo para que esta seja treinada.
Existem, basicamente, 3 tipos de aprendizado nas redes neurais artificiais:
Supervisionado: neste tipo, a rede neural recebe um conjunto de entradas padronizados e
seus correspondentes padres de sada, onde ocorrem ajustes nos pesos sinpticos at que
o erro entre os padres de sada gerados pela rede tenham um valor desejado;
No-supervisionado: neste tipo, a rede neural trabalha os dados de forma a determinar
algumas propriedades dos conjunto de dados. A partir destas propriedades que o
aprendizado constitudo;
Hbrido: neste tipo ocorre uma "mistura" dos tipos supervisionado e no-supervisionado.
Assim, uma camada pode trabalhar com um tipo enquanto outra camada trabalha com o
outro tipo.
47
Fundamentos e Aplicaes de BI
48
Fundamentos e Aplicaes de BI
49
Fundamentos e Aplicaes de BI
Recursos humanos
Vendas de produto
Operao e
fornecimento
Anlise de site
gesto
da
cadeia
de
Descrio
Relatrio e anlise de contas a receber e a pagar, relatrio
e anlise de balancete, anlise do fluxo de caixa, previso
e oramento financeiros, anlise de demonstrao de
resultados/lucro e perda, gerenciamento de risco.
Relatrio dos benefcios da administrao, realatrio e
anlise do plano de carreira, relatrio de conformidade,
relatrio e anlise de compensao, relatrio de gastos
com funcionrios, anlise de tendncia da fora de
trabalho, relatrio de gerenciamento de tempo e trabalho.
Anlise de canla, anlise de concorrncia, relatrio de
desempenho da equipe de vendas, relatrio e anlise do
fluxo de vendas.
Anlise de capanha; anlise de aquisio, reteno e
desgaste do cliente; anlise de venda cruazada para o
cliente; anlise da lucratividade do cliente; indicadores do
cliente; anlise de segmentao do cliente; anlise do
atendimento ao cliente; anlise de fidelidade.
Anlise de desempenho da categora/gerenciamento da
categoria, anlise de descontos e promoes, anlise de
fraude e preveno de perda, anlise do estoque, anlise d
merchandising, indicadores do produto.
Anlise da central de atendimento, planejamento da
produo e programao da manufatura, otimizao da
rede, anlise de cumprimento do pedido, controle de
qualidade, gerenciamento normativo, indicadores do
forncedor e anlise de fornecimento estratgico,
planejamento de oferta e demanda.
Anlise do comrcio eletrnico, anlise de navegao na
Web, anlise de trfego na Web, anlise de visitantes da
Web.
50
Fundamentos e Aplicaes de BI
Consultas ad hoc
Qualquer consulta que no pode ser determinada antes de ser feita ser considerada uma
consulta ad hoc. O usurio pode decidir inserir tal consulta aps receber um relatrio.
Consultas ad hoc permitem aos usurios solicitar, a partir do computador, informaes
que no esto disponveis nos relatrios peridicos e tambm gerar consultas novas ou
modificar as antigas, com flexibilidade significativa em termos de contedo, estrutura e
avaliaes. Essas respostas so necessrias para agilizar ou facilitar a tomada de deciso.
O sistema deve ser inteligente o suficiente para compreender o que o usurio deseja.
Sistemas simples de consulta ad hoc muitas vezes so baseados em menus. Sistemas mais
inteligentes usam SQL e abordagens de consulta atravs de exemplo. Sistemas mais
avanados so baseados na linguagem natural e alguns conseguem se comunicar com os
usurios usando reconhecimento de voz. As conusltas podem ser feitas em dados
estticos ou dinmicos (ou seja em tempo real).
SQL para consulta
Como a SQL no-procedural e razoavelmente fcil de usar, muitos usurios finais
conseguem us-la para criar suas prprias consultas e operaes de banco de dados. A
SQL pode ser usada para programas escritos em qualquer linguagem padro de
programao; por isso, facilita a integrao de softwares. As consultas tambm podem ser
realizadas em linguagens naturais. Frequentemente, os sistemas de consulta so
combinados com sistemas de relatrio.
2.14-GIS e GPS
Um Sistema de Informao Geogrfica (GIS) um sistema baseado em computador para
captura, armazenamento, modelagem, recuperao, verificao, integrao, manipulao,
anlise e exibio de dados citadoa geograficamente atravs do uso de mapas digitais.
A caracterstica mais distintiva do GIS que cada registro ou objeto digital tem uma
localizao geogrfica identificada. Ao integrar mapas aos bancos de dados orientados
espacialmente (localizao geogrfica) chamados de geocodificao e a outros bancos
de dados, os usurios podem gerar informaes para planejamento, resoluo de
problemas e tomada de deciso com isso aumentar sua produtividade e a qualidade das
suas decises. reas to heterogneas como varejo, bancos, transportes, agricultura,
gesto de recursos naturais, administrao pblica, controle do espao areo, militar,
prontido de emergncia e planejamento urbano tm usado o GIS com xito desde o
incio dos anos 70.
Aplicaes de GIS
Ajudam as empresas e os governos a saber onde precisamente esto seus caminhes,
funcionrios e recursos; para onde eles precisam ir para atender um cliente; e a melhor
maneira para deslocar-se. A Cooperativa de Crdito do Texas usa o GIS para ajudar a
decidir onde colocar outdoors e caixas automticos alm de identificar reas mais
receptivas para mala direta. A taxa de resposta caracterstica para essa cooperativa de
crdito varia de 2 e 10%, muito melhor do que a tradicional mdia de 1 a 2%.
51
Fundamentos e Aplicaes de BI
52
Fundamentos e Aplicaes de BI
Aplicaes de GIS
Empresa
Pepsi Cola Inc, Super Value, Acordia Inc
Sun Microsystems
Consolidated Rail Corporation
Aplicao do GIS
Usam o GIS na seleo de locais para novos
restaurantes Taco Beli e Pizza Hut. Combinam
dados geogrficos e padres de trfego.
Usa o GIS para responder perguntas como: quantos
mdicos afiliados ao CIGNA esto disponveis em
um raio de 13 Km de uma empresa?
Integra dados ao GIS para criar um perfil
demogrfico detalhado da regio de uma loja a fim
de determinar a melhor combinao de produtos a
serem oferecidos na loja.
Uso GIS para dar suporte ao planejamento das rotas
rodovirias.
Controlam as incidncias de cncer e de outras
doenas a fim de determinar estratgias de
expanso e alocao de equipamentos caros nas
suas instalaes.
Mapeia regies onde moram trabalhadores
temporrios para localizar cidades para marketing e
recrutamento.
Planeja reas e rotas de vendas favorveis para seus
clientes, reduzindo as despesas de viagem em 15%.
Mapeia toda sua rede de celulares para identificar
grupos de desconexo de ligaes e enviar tcnicos
de maneira apropriada.
Gerencia propriedades alugadas em dezenas de
lugares no mundo todo.
Monitora a condio de mais de 32.000 km de
estrada de ferro e milhares de lotes de terra
adjacente.
Avalia danos causados por furaces, enchentes e
outros desastres naturais atravs da relao dos
vdeos dos danos com os mapas digitais das
propriedades.
Combinam GIS e GPS como ferramenta de
navegao para orientar motoristas aos seus
destinos atravs das melhores rotas.
53
Fundamentos e Aplicaes de BI
54
Fundamentos e Aplicaes de BI
55
Fundamentos e Aplicaes de BI
56
Fundamentos e Aplicaes de BI
57
Fundamentos e Aplicaes de BI
O OnTrack permite rpidas situaes e se, e usa regras e definies de negcios para
acelerar o processo e oferecer flexibilidade (pelo modo e se).
O Corporate Dashboard fornece um local nico para que executivos e analista encontrem
informaes coordenadas e integradas e trabalhem em um painel comum. A BNSF
construiu os sistemas internamente usando dados extrados dos sistemas Teradata
Warehouse, DB2 e SAS, com o Essbase para a parte de OLAP e o Alphabox para
distribuio na Web. A ferramenta tem 3 visualizaes principais dentro do Corporate
Dashboard. Por meio da 1, que usa um cdigo de cores de sinal vermelho para apontar
rapidamente reas de exceo, um gerente geral pode chegar velozmente aos detalhes das
reas de exceo para delinear o local exato no qual ocorre o problema. Mais detalhes ou
correlaes com outros pontos de dados esto disponveis na visualizao em que o
usurio consegue rapidamente localizar os problemas, detalhar essas reas e obter vrias
visualizaes diferentes relacionadas a outros tipos de mtricas. Para uma anlise ainda
mais profunda, o usurio pode retalhar os elementos de dados do data warehouse e de
outras fontes para obter uma perspectiva realmente abrangente.
O sistema Revenue Single Source aprimora a capacidade de alterar conhecimentos de
embarque, elimina a redundncia e ajuda a processar os pagamentos com mais rapidez e
preciso. Ele est disponvel por meio de um sistema da Web que usa mecanismos
baseados em regras, busca padres para processamento e combina alertas de tolerncia e
notificao de eventos enquanto utiliza um data warehouse ativo. A adio de raciocnio
baseado em casos analisa a qualidade de uma deciso.
OS RESULTADOS
O sistema OnTrack oferece maior flexibilidade, permitindo que os geretnes de
oramentos criem suas previses e tambm planejem e faam previses no modo e se.
Ao mudarem uma varivel, os usurios criam uma previso alternativa que pode ser usda
para comparaes e contrastes, para que se chegue melhor previso. O novo sistema
mais automatizado e padronizado, o que facilita e agiliza seu uso. Funes padres e ad
hoc de relatrios foram ampliadas para 80 usurios avanados do OnTrack e os relatrios
so distribudos para 300 usurios.
O Corporate Dashboard permite um tempo menor de reao. A ferramente estabelece
uma base para a anlise preditiva e oferece uma percepo dos negcios concentrando-se
em indicadores-chave, apontando rapidamente as reas problemticas, simplificando a
navegao por essas reas, e resumindo os fatores de dados crticos que agilizam o tempo
de anlise e permitem mais tempo para avalidar e tomar decises.
58
Fundamentos e Aplicaes de BI
59
Fundamentos e Aplicaes de BI
60
Fundamentos e Aplicaes de BI
61
Fundamentos e Aplicaes de BI
Em agosto de 2005, a loja, sediada em Salt Lake City, comeou a conectar os usurios a
um data warehouse em tempo real. Ela usou ferramentas de gesto de dados transacionais
da GoldenGate Software, Inc. para extrair as informaes diretamente dos seus sistemas
comerciais para o warehouse. A Overstock.com adotou tambm a estrutura de servios
baseada na Web da Teradata para a integrao de aplicaes, visando substituir um
processo que usava ferramentas de ETL tradicionais para elaborar relatrios diretamente
a partir dos seus sistemas de retaguarda. Agora, o data warehouse recebe os dados de
acesso ao website em tempo real, dados financeiros e de vendas de produtos a cada 15
minutos e outras informaes de hora em hora. Quando lanamos alguma campanha,
podemos saber dentro de 15 minutos se elas esto produzindo uma alta na receita que
normalmente no aconteceria, diz Jack Garcella, vice-presidente de anlise e relatrios
de data warehousing. Com alguns terabytes de dados armazenados no EDW e milhes de
transaes efetivadas todos os dias, a Overstock.com precisava garantir que o warehouse
fosse atualizado constantemente. Ela selecionou o Sunopsis Dat Conductor, um produto
de ETL, para permitir o trabalho automtico e eficiente com grandes volumes de dados
provenientes dos sistemas de origem.
Caso 10 Bem & Jerrys se supera com a BA
Na fbrica da Bem & Jerrys (benjerry.com) em Waterbury, Vermont, tubos enormes
bombeiam mais de 94.000 litros de sorvete todos os dias. Durante o dia, caminhes
refrigerados fazem fila, recolhem o sorvete eo distribuem aos depsitos. Dali, o sorvete
enviado para mais de 60.000 mercados nos Estados Unidos em em outros 14 pases. Nos
mercados, o sorvete colocado em freezers e comercializado.
Na sede da empresa, a vida de cada litro de sorvete desde os ingredientes at a venda
acompanhada de perto. Depois que um litro rotulado e enviado a Bem & Jerrys
armazena seu nmero de rastreamento em um data warehouse da Oracle e posteriormente
analisa os dados. Usando software de BA, a equipe de vendas consegue verificar se o
Chocolate Chip Cookie Dough est ganhando terreno sobre o Cherry Garcia no cobiado
posto de lder de vendas. O departamento de marketing confere se as promoes e
propagandas da empresa esto gerando um aumento nas vendas. O pessoal de finanas
usa os nmeros de rastreamento em suas anlises para mostrar a renda gerada por cada
tipo de sorvete. Desde que a empresa comeou a usar o software, o departamento de
contabilidade reduziu o tempo que leva para encerrar o balano mensal. Tambm,
provavelmente o mais importante para uma empresa focada na fidelidade do cliente, a
equipe de assuntos do consumidor faz a correspondncia de cada litro com as centenas de
ligaes e e-mails recebidos toda semana para verificar se h alguma reclamao.
62
Fundamentos e Aplicaes de BI
63
Fundamentos e Aplicaes de BI
. A Reno-Depot, uma loja varejista canadense para reformas domsticas com mais de 20
lojas, usa informao de trfego de clientes, dados de vendas dos pontos de vendas, etc.
para desenvolver, prever e criar cronogramas de trabalho adequados. O software realiza
uma anlise das situaes de trabalho existentes, criando dinamicamente turnos com as
tarefas do trabalhador.
. A Coldwater Creek gera relatrios atravs da integrao de dados produzidos em
aplicaes muito diferentes usando data warehousing e o Microsoft SQL Server 2000. O
tempo de preparao de relatrios foi reduzido significativamente.
. Ao usar ferramentas de BI e anlise da Business Objects, a TruServ Corp. (controladora
da True Value Hardware e da Taylor Rental) reduziu seu estoque de zona vermelha (ou
seja, produtos que no foram vendidos em meio ano) em US$ 50 milhes em 2 anos
atravs da anlise das reservas de produto. O sistema tambm identificou produtos
encalhados nos 14 centros de distribuio da empresa que poderiam vender melhor em
outras partes do pas.
Outros varejistas esto buscando maneiras similares de obter uma vantagem competitiva.
Colocar o produto certo no local certo, na hora certa e com o preo certo uma das metas
dos varejistas. Fazer isso corretamente determina quem tem sucesso e quem falha.
Varejistas tradicionais esto aprendendo com os varejistas virtuais como realizar
investigaes analticas sobre desempenho do cliente. A J. Crew Group e a Nordstrom
Inc., por exemplo, usam o DigiMine para analisar as vendas online. A Nordstrom tinha
uma situao na qual compradores virtuais estavam a procura de piercings de umbigo
exatamente iguais ao que uma modelo usou em um anncio. A empresa conseguiu obter
rapidamente os piercings para suas lojas e seus clientes virtuais, mesmo no tendo o
produto antecipadamente.
Caso 13 Acidentes com veculos automotores e as distraes do motorista
A distrao do motorista est na posio central das preocupaes com segurana na
estrada. Um estudo publicado em1996 pela NHTSA (National Highway Traffic Safety
Administration) concluiu que aproximadamente 25 a 30% dos ferimentos causados por
acidentes de carro eram devido distrao do motorista. Em 1999, segundo o FARS
(Fatality Analysis Reporting System) desenvolvido pela NCSA (National Centre for
Statistics and Analysis), 11% dos acidentes fatias (ou seja, 4.462 mortes) eram devido
falta de ateno do motorista.
64
Fundamentos e Aplicaes de BI
Um estudo foi realizado para extrair os padres dos fatores de distrao e acidentes no
trnsito. O data mining foi a principal ferramenta para traar a correlao dos dados a
partir das informaes sobre acidentes fornecidas pelo FARS. Trs tcnicas de data
mining redes de Kohonen (os neurnios competem entre si para responder a um
estmulo apresentado. Durante o aprendizado, formam-se agrupamentos de neurnios
topologicamente organizados, onde cada grupo responsvel por responder a uma classe
de estmulos.), rvores de deciso e redes neurais para descobrir diferentes combinaes
de fatores de distrao que explicassem os altos ndices de acidentes foram usadas na
pesquisa. As redes de Kohonen detectaram clusters e revelaram padres de variveis de
entrada na coleta de dados. As rvores de deciso exploraram e classificaram a
consequncia de cada incidente em eventos sucessivos: as rvores de deciso sugeriram a
relao entre motoristas desatentos e condies fsicas/mentais. As tcnicas de data
mining foram aplicadas aos conjuntos de dados a fim de correlacionar falta de ateno e
outros fatores relacionados ao motorista em acidentes de trnsito. Por fim, um modelo de
rede neural foi treinado e testado para observar a eficcia do modelo. O Clementine, da
SPSS, foi usado para extrair os dados derivados do banco de dados do FARES em trs
modelos.
O sistema identificou 1.255 motoristas que estiveram envolvidos em acidentes no qual a
falta de ateno foi um dos fatores determinantes que levou ao acidente. Colises frontais
e traseiras e outros tipos de coliso, entre outras diversas variveis de sada foram
previstas com 78 e 77% de preciso.
Caso 14 Data mining para identificar o comportamento do cliente
Entender o comportamento do cliente importante no ajuste das estratgias de negcios,
no aumento dos lucros e na identificao de novas oportunidades. Muitas empresas tm
uma volumosa quantidade e impressionante variedade de recursos de dados e
informaes que prometem revelar muito mais sobre o comportamento do cliente do que
se pensava que era possvel. Muitas organizaes atingiram uma situao de dados
valiosos e utilizao ineficiente. Para a maioria dos ambientes de varejo, trs fontes de
dados do cliente so mais importantes para as tentativas de data mining visadas ao melhor
entendimento do comportamento:
. Dados demogrficos
. Dados de operao
. Dados de interao online
A anlise de acesso na Web pode ser usada para identificar quem comprou e quem no
comprou um produto, por que e quando.
65
Fundamentos e Aplicaes de BI
66
Fundamentos e Aplicaes de BI
O total de dinheiro estimado levado para for dos EUA em2001 foi de US$ 156,22
bilhes. O data mining resultar em avaliao eficiente de dados, que por sua vez
auxiliar na cruzada contra o terrorismo. A aplicao de tecnologia da informao e
tcnicas de data ming s operaes financeiras pode contribuir com o aumento na
qualidade da informao do servio secreto.
67
Fundamentos e Aplicaes de BI
ANEXO 1 Bibliografia/Webliografia
. PRIMAK, Fbio. Decises com B.I. (Business Intelligence). Cincia Moderna, 2008.
. TURBAN, Efraim. Business Intelligence Um enfoque gerencial para a inteligncia do
negcio. Editora Bookman, 2009.
. CARVALHO, Lus Alfredo Vidal. Data Mining a Minerao de Dado no Marketing,
Medicina, Economia, Engenharia e Administrao. Editora Cincia Moderna, 2005.
http://pt.wikipedia.org
http://www.webartigos.com/articles/2437/1/business-intelligence/pagina1.html
http://www.riosoft.com.br
http://www.sato.adm.br/artigos/espaco_rh_pec_proc_decisorio.htm
http://www.priberam.pt/dlpo
http://www.wgsystems.com.br/blocos/modelagem_preditiva.html
http://pt.wikipedia.org/wiki/Ad_hoc
http://images.google.com/imgres?imgurl=http://www.devmedia.com.br/imagens/articles//
Dw12.PNG&imgrefurl=http://www.devmedia.com.br/articles/viewcomp.asp%3Fcomp%
3D12609&usg=__HlNnfGAfaNaBIprd4RsnE9RQde0=&h=395&w=713&sz=29&hl=ptBR&start=1&um=1&tbnid=dc74bhXnpH49OM:&tbnh=78&tbnw=140&prev=/images%
3Fq%3DDW%2Bbanco%2Bde%2Bdados%26hl%3DptBR%26lr%3D%26rls%3Dcom.microsoft:en-US%26um%3D1
http://www.baguete.com.br/artigosDetalhes.php?id=154
http://pt.wikipedia.org/wiki/Data_Warehouse
http://www.ead.fea.usp.br/semead/4semead/artigos/mqi/come.pdf
http://www.din.uem.br/~ia/mineracao/tecnologia/warehouse.html
http://imasters.uol.com.br/artigo/11178
http://www.fef.br/~eajardini/posgrad/2006/mba/MBA_DW_Fatos_Dimensoes_Medidas.
pdf
http://www.ccuec.unicamp.br/revista/infotec/informacao/inf54.htm
http://www.scribd.com/doc/17595470/Palestra-Modelagem-Dimensional
http://www2.stela.ufsc.br/aran/sad/sad_aula4.htm
http://www.fef.br/~eajardini/posgrad/2006/mba/MBA_DW_Fatos_Dimensoes_Medidas.
pdf
http://www.univem.edu.br/cursos/tc_admin/david_jailton_joao.pdf
http://mtcm18.sid.inpe.br/col/lac.inpe.br/worcap/2003/10.31.15.48/doc/ArtigoWorkap3.pdf
http://www.datawarehouse.inf.br/etl.htm
http://projetos.inf.ufsc.br/arquivos_projetos/projeto_593/TCC-Caruso-Rubik-Fileto20070227.doc
http://www.inf.unisinos.br/~cazella/dss/200601/ad_td.pdf
http://www.infowester.com/redesneurais.php
http://www.lncc.br/~labinfo/tutorialRN/frm1_arquitetura.htm
68