Você está na página 1de 19

-v---

CilpTIulo 3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 117

Hierarquia de entidades

-Infortnações de contato do fornecedor


:':;..E!l~ereç9 do fornecedor, -'~'
-Termos.de pagamento ..:. j-

-Remessa..

Nível 2: Nível 3:
...." ····p·"':c/rãbela de contatos de cliente

Tabela de contato do cliente

Nome de campo Tipo Comprimento


ID do cliente * Número 8 ,~;
- .• ~*' Nome do cliente Texto 20.
Endereço do cliente Texto 30
Telefone do cliente Número 12

Figura 3.12 Modelagem de dados. (Fonte: Desenho de Donald Amoroso.)

3.5 Data warehousing


Muitas empresas de médio e grande porte utilizam data warehousing para tornar
mais fácil e mais rápido processar, analisar e consultar dados.

As empresas mais bem-sucedidas são aquelas que podem responder rápida e flexi-
velmente às alterações e às oportunidades do mercado e a chave para essa resposta
é a utilização efetiva e eficiente dos dados e das informações, como mostrado no
caso do Harrah's, Isso é feito não apenas via o processamento de transações, mas
também por meio do processamento analítico, que envolve a análise dos dados acu-
mulados, frequentemente pelos usuários finais. O processamento analítico, também
conhecido como inteligência de negócio, inclui a mineração de dados, sistema de su-
porte à decisão (SSD), sistemas de informação da empresa (SIEs), aplicativos Web,
consultas e outras atividades de usuário final. Colocar informações estratégicas nas
mãos dos tomadores de decisão ajuda a produtividade e capacita os usuários a tomar
melhores decisões, o que resulta em maior vantagem competitiva. Um bom sistema
de entrega de dados deve ser capaz de suportar acesso fácil aos dados pelos próprios
usuários finais bem como tomada de decisão flexível, eficaz, precisa e rápida,
Há basicamente duas opções para conduzir um processamento analítico. Um
deles é trabalhar diretamente com os sistemas operacionais (a abordagem "vamos
utilizar o que temos"), usar ferramentas e componentes de software conhecidos
como ferramentas de front-end e middleware (consulte o Guia de Tecnologia 2). O
outro é utilizar um data warehouse.
A primeira opção pode ser ótima para empresas que não tem um grande núme-
ro de usuários finais executando consultas e conduzindo análises contra os sistemas
operacionais. Ele também é uma opção para departamentos que consistem princi-
palmente de usuários com as habilidades técnicas necessárias para um uso extenso
de ferramentas como planilhas e gráficos. Embora aqueles com menos habilidades
118 Porte 11 Infraestrutura de TI

técnicas possam utilizar ferramentas de consulta e de geração de relatórios, elas, em .'.


muitos casos, talvez não sejam eficazes, flexíveis ou fáceis de usar.
Mas o problema dessa abordagem é que as ferramentas só são eficazes com'
usuários finais que têm um nível de conhecimento médio ou alto dos bancos de :'
dados. Essa situação foi significativamente aprimorada com o uso de ferramentas:'
baseadas r"l'Neh. C('l),tl,;1n "~ '.br1fv ,ti "c'r",! ,,"['1 várias origens e em diferen-
tes forn.atos, será diíic.: "b' I . . L.,. ~L... ,,',liue. - .~
A segunda opção, um data warehouse, supera essas limitações e oferece um
processamento analítico aprimorado. Ela envolve três conceitos: i
1. Uma representação prática dos dados para os usuários finais )
1 *
2. Um ambiente baseado na Web que dá aos usuários capacidades de consulta e1
de geração de relatóriol
3. Um repositório baseado em servidor (o data warehouse) que possibilite segu- ;.:1

rança centralizada e controle sobre os dados ~

Um data warehouse é um repositório de dados organizado para ser prontamente ~


aceitável para as atividades de processamento analítico (como mineração de dados,
consultas, suporte à decisão e outros aplicativos). Os exemplos são gestão de recei-
tas, gestão de relacionamento com o cliente, detecção de fraudes e aplicativos de
gestão de folha de pagamento.
De acordo com a Teradata, os benefícios de um data warehouse corporativo
(enterprise data warehouse - EDW) se relacionam tanto aos negócios como à TI.
Melhores decisões de negócio podem ser tomadas devido a melhores informações.
As informações são entregues de forma mais efetiva. Várias áreas de uma organiza-
ção se beneficiam de um EDW (teradata.com, 2006):
• Marketing e vendas utilizam um EDW para lançamentos de produto, acesso a
informações sobre produtos, eficácia do programa de marketing e lucratividade
da linha de produtos.
• Clientes e parceiros de canal ganhos de lucratividade dos clientes, penetração
de mercado, mais clientes e desempenho do parceiro de canal.
• Determinação de preços e contratos podem melhor entender a determinação
de preços, otimizar o resultado bruto e monitorar diferenciais desses preços
entre as subsidiárias.
• As projeções são auxiliadas pela visibilidade imediata da demanda do cliente final.
• O desempenho das vendas determina a lucratividade das vendas e a produtivida-
de para todos os territórios e todas as regiões; e os resultados podem ser classifi-
cados pela geografia, produtos, grupo de vendas ou por territórios específicos.
• O financeiro recebe resultados diários, semanais ou mensais rapidamente; e
aprimora a gestão financeira por toda a organização. l
• A cadeia de suprimentos ganha um análise completa e rápida dos preços e vo- I
lume necessário de matérias-primas.
• Melhorias no serviço de atendimento ao cliente e aprimoramento nos pedidos
fornecem indicadores consistentes do serviço de atendimento ao cliente a todas
as instalações. I'
• Sistemas e processos de informação, por meio de capacidades de portal, forne-
cem a cada usuário acesso rápido e fácil a consultas, relatórios ou análises mais i
utilizadas. '
O processo de construção e uso de um data warehouse é mostrado na Figura 3.13.
Os dados de uma organização são armazenados nos sistemas operacionais (lado esquer-
do da figura). Utilizando um software especial para extração, transformação e carga
(extraction, transformation, load - ETL), os dados são processados e então armazena-
dos em um data warehouse. Nem todos os dados são necessariamente transferidos ao
data warehouse (muitas vezes, apenas um resumo dos dados é transferido). Os dados!
transferidos são organizados dentro do warehouse em uma forma fácil para os usuários
r~

~.
~.

~
""r-
1!i;;\:'.·····>··r

CapTIulo 3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 119

. Realização Materiais
de pedidos 1-----,
no ponto
e venda
Estoque,
t------I transa-
ões
ERP

::::====::: Contas,
1------1 transa-
ões
Legado

Estoque, ' ERP


despacho Armaze-
namento
___-----...Extranets, de dados
I------lintranets,
Figura 3.13 Estrutura e Documentos EDI
Web
~ visualizações do data wa- . externos •.

~. rehouse. (Fonte: Desenho Dados/sistemas


Finanças
de E. Turban.) operacionais

finais acessarem e localizarem. Os dados também são padronizados. Em seguida, eles


são organizados por assunto, como área funcional, fornecedor ou produto. Em compa-
ração, os dados operacionais são organizados de acordo com um processo de negócio,
como despacho, compras ou controle de estoque e/ou departamento funciona!. (Obser-
ve que os dados do ERP podem ser inseridos em um data warehouse e as decisões do
ERP e do SCM usam a saída a partir do data warehouse. Consulte Grant, 2003.)
Os data warebouses oferecem o armazenamento dos metadados. Metadados in-
cluem programas de software para interpretar dados, regras para organizar dados e
resumos de dados mais fáceis de indexar e pesquisar, especialmente com ferramentas
Web. O design e uso dos metadados podem envolver questões éticas, como a organiza-
ção dos metadados para que eles possam influenciar usuários de alguma forma.

Características de um data warehouse. As nove principais características de um


data warehousing são:
1. Organização. Os dados são organizados por tópico (por exemplo, por cliente,
fornecedor, produto, nível de preço e região) e só contêm as informações rele-
vantes para o suporte a decisões.
2. Consistência. Os dados em diferentes bancos de dados operacionais poderiam
ter diferentes codificações. Por exemplo, dados sobre sexos poderiam ser co-
dificados como O e 1 em um sistema operacional e "rn" e "f" em outro. No wa-
rebouse eles serão codificados de uma maneira consistente.
3. Tempo como uma variante. Os dados são mantidos por muitos anos para que
então possam ser utilizados para análise de tendências, previsões e compara-
ções ao longo do tempo.
4. Não voláteis. Uma vez inseridos no warehouse, os dados não são atualizados.
5. RelacionaI. Em geral, o data warehouse utiliza uma estrutura relaciona!.
6. Cliente/servidor. O data warehouse utiliza a arquitetura cliente/servidor princi-
palmente para fornecer ao usuário final um acesso fácil aos dados.
7. Baseado na Web. Os data warehouses atuais são projetados para fornecer um
ambiente eficiente de computação para aplicativos baseados na Web.
8. Integração. Dados a partir de várias origens são integrados. Web Services são
utilizados para dar suporte à integração.
9. Tempo real. Embora a disponibilidade da maioria dos aplicativos de data wa-
rehousing não ocorra em tempo real, é possível que eles tenham capacidades de
tempo real.
&

120 Parte ii Infraestrutura de TI

Alguns benefícios do uso de um data warehouse são ilustrados no Arquivo On-


line W3.1.

Construir e implementar um data warehouse pode ser difícil. Como o projeto de


.".C~I um data warehouse é muito grande e caro de construir, é importante entender os
TI/i .1·~~-:···~;... fatores de sucesso fundamentais na sua irnplementacão. Primeiro a alta verência dá
suporte ao data waren lUS,--? .:,"sundo. os usuários c:", .;uPO! re 30 ~"ld v , _" ciiouse?
Terceiro, os usuários querem acesso a uma ampla variedade de dados? E se quise-
rem, um único repositório ou um conjunto de data marts independente deverá ser
construído? Quarto, os usuários querem acesso aos dados e ferramentas de análise?
Quinto, os usuários entendem como o data warehouse resolve problemas do negó-
cio? Sexto, os usuários vêem o departamento de tecnologia da informação como
apoiador? Sétimo, a unidade tem um ou mais usuários avançados que conseguem
.entender as tecnologias do data warehouse?

, Arquitetura e ferramentas. Há várias arquiteturas básicas para o data warehou-


sing. Duas das comuns são as arquiteturas de duas e três camadas. Na arquitetura
de três camadas, os dados a partir do warehouse são processados duas vezes e arma-
zenados em um outro banco de dados multidimensional, organizado para análise e
apresentação multidimensional fácil ou replicado nos data marts. A arquitetura do
data warehouse determina as ferramentas necessárias para sua construção (consul-
te Kimball e Ross, 2002).
Há duas razões importantes para criar um data warehouse como um arrnaze-
namento de dados separado. Primeiro, o desempenho das consultas operacionais
degrada quando contraposto a consultas intensivas. É difícil modelar um banco de
dados que possa ser utilizado tanto para propósitos operacionais como analíticos. A
Figura 3.14 representa um EDW desenvolvido pela Teradata Corp. Essa abordagem
centralizada reduz o volume de dados que a equipe técnica tem de transferir, simpli-
ficando a administração e o gerenciamento dos dados; usuários também têm acesso
-a todos os dados no data warehouseem vez de ficaremlimitados aos data marts.

Usuárlos '""''''0"''' [I][I][JJ[IJ[IJ


Dados transacionais _ _"

Transformação

de dados r===~~t=~~=:t5~~::t:~==~~~~~
Data warehouse
"corporativo"

Usuarios tomadores
d,~ decisão ~
~.~1~~ ~_"
~
~
~ ~
~.g] Ô
Usuários Usuários Relatórios Mineradores Ciclo fechado/
estratégicos táticos usuários OLAP de dados baseado em evento

Figura 3.14 Data warehouse corporativo da Teradata Corp. (Fonte: Teradata Corporation [teradata.corn]. com perrnissâo.)
c~pnulo3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 121

Colocando o data warehouse na intranet. A disponibilização do conteúdo do


data warehouse aos tomadores de decisão por toda a empresa pode ser feita via
uma intranet. Usuários podem visualizar, consultar e analisar os dados e criar rela-
tórios utilizando navegadores Web. Esse é um método extremamente econômico e
eficaz de disponibilizar dados.

Adequabilidade. O data warehousing é mais apropriado para organizações em


que:
, Grandes volumes de dados precisam ser acessados pelos usuários finais (consul-
te o caso do Harrah's).
• Os dados operacionais são armazenados em diferentes sistemas.
• A administração utiliza uma abordagem baseada na informação.
• Há uma grande base de clientes diversificada (como em uma empresa de servi-
ços ou em um banco; por exemplo, o data warehouse de 26 terabytes da AT &T
é utilizado por 3.000 funcionários para análise de marketing).
• Os mesmos dados são representados diferentemente em diferentes sistemas.
• Os dados são armazenados em formatos altamente técnicos difíceis de decifrar.
• Extensa computação de usuário final é realizada (muitos usuários finais reali-
zando muitas atividades).
Algumas aplicações bem-sucedidas estão resumidas na Tabela 3.3. Há centenas
de outras aplicações bem-sucedidas relatadas (por exemplo, consulte histórias de
sucesso de clientes e estudos de caso nos sites de fornecedores como Hyperion Inc.,
Business Objects, Cognos Corp., Information Builders, NCR Corp., Oracle, Com-
puter Associates e Software A&G). Para mais detalhes, visite o Data Warehouse
Institute (tdwi.org).
Muitas organizações, vendo o sucesso de seus esforços de data warehouse, estão
tornando o data warehouse público. Uma organização que tornou público seu data
warehouse é a Wells Fargo. O esforço de desenvolvimento utiliza os recursos de um
warehouse da Teradata para fornecer uma ferramenta online que coleta e resume
transações para os consumidores - cartão de crédito, cartão de débito, pagamentos
online de contas, contas bancárias - e gera uma análise das sessões das operações
bancárias online. Os consumidores podem entender melhor seus padrões de consu-
mo e informaram um nível mais alto de satisfação do cliente.
A Travelocity continua a aumentar seus negócios utilizando um data warehou-
se público. Parte do sucesso da empresa reside no uso inovador do EDW para mar-
keting e CRM.

Os data warehouses frequentemente são complementados ou substituídos por data


marts, armazenamentos de dados operacionais e bancos de dados multidimensionais.

Data marts. O alto custo dos data warehouses restringe seu uso a grandes em-
presas. Uma alternativa utilizada por outras empresas é a criação de uma versão
reduzida e de custo mais baixo de um data warehouse chamado data mart. Um data
mart é um pequeno warehouse projetado para uma unidade estratégica de negócios
(UEN) ou para um departamento.
As vantagens dos data marts incluem: baixo custo (preços abaixo de US$ 100.000
versus US$ 1 milhão ou mais para data warehouses); tempo de preparação significa-
tivamente menor para implementação, normalmente menos de 90 dias; controle local
em vez de controle central, dando poder ao grupo de uso. Eles também contêm menos
informações que o data warehouse. Consequentemente, eles têm resposta mais rápida
e são mais facilmente entendidos e navegados do que um data warehouse corporativo.
Por fim, eles permitem que uma unidade de negócios construa seu próprio sistema de
suporte à decisão sem contar com um departamento de SI centralizado.
122 Parte 11 Infraestrutura de TI

. ;

Áreas funcionais de uso Uso estratégico


Companhia aérea Operações e marketing Escala da tripulação, alocação de aeronaves, menu de opções
de preços de passagens aéreas, análise de lucratividade das
rotas, programas de milhagem ~
Confecção de uniformes Distribuição e marketing Co(n8rci~li·7._·r"::~·r., ....
,,- "~~ic:;"J,-1•. ~c:.;.')( ;~

Operações bancárias Desenvolvimento de produtos,


operações e marketing moções de produto e de serviços, redução dos custos de SI
Cartao de crédito Desenvolvimento de produtos e Serviço de atendimento ao cliente, novos serviços de informa-
marketing ções pagos, detecção de fraudes
Contratos de defesa Desenvolvimento de produtos Transferência de tecnologia, produção de aplicativos militares
Negócios eletrônicos Distribuição e marketing Data warehouses com capacidades de persona!ização, prefe-
rências de marketing/compras permitindo vendas de maior
valor agregado (up-selling) e vendas cruzadas (cross-selling)
Governo Operações Relatór~os sobre áreas de crimes, segurança nacional
Assistência médica Operações Redução das despesas operacionais
Investimentos e seguros Desenvolvimento de produtos, Gestão de riscos, análise dos movimentos de mercado, análise
operações e marketing de tendências de cliente, gestão de portfólio
Produtos de higiene pessoal Distribuição e marketing Decisões de distribuição, promoções de produtos, decisões de
vendas, diretiva de determinação de preços
Rede varejista Distribuição e marketing Análise de tendências, análise de padrões de compra, diretiva
de determinação de preços, controle de estoque, promoções
de vendas, suporte à decisão sobre os canais de distribuição
Siderurgia Fábrica Análise de padrão (controle de qualidade)
Telecomunicações Desenvolvimento de produtos, Promoções de novos produtos e serviços, redução do orçamen-
operações e marketing to de SI, análise de lucratividade

Fontes: Park (1997), p. 19, Tabela 2, e Chenoweth et aI. (2006).

Há dois principais tipos de data marts:


1. Datámarts replicados (dependentes): Às vezés, e mais fácil trabalhar com um
pequeno subconjunto do data warehouse. Nesses casos, podemos replicar al-
guns subconjuntos do data warehouse em data marts menores, cada um dedica-
do a certa área, como mostrado na Figura 3.14 (página 120). Nessa situação, o
data mart é uma adição ao data warehouse.
2. Data marts independentes. Uma empresa pode ter um ou mais data marts inde-
pendentes sem ter um data warehouse. Data marts típicos são para aplicativos
de marketing, finanças e engenharia.

Armazenamentos de dados operacionais. Um armazenamento de dados opera-


cionais é um banco de dados para os sistemas de processamento de transações que
utiliza os conceitos do data warehouse para fornecer dados limpos. Ele leva os con-
ceitos e benefícios do data warehouse às partes operacionais do negócio com um
custo mais baixo. Ele é utilizado para decisões de curto prazo que envolvem apli-
cativos essenciais para o funcionamento do negócio em vez de decisões de médio
e longo prazo associadas com o data warehouse normal. Essas decisões dependem
muito mais de informações atuais. Por exemplo, um banco precisa saber tudo sobre
um dado cliente que está no telefone. O armazenamento de dados operacionais
pode ser visualizado como situado entre os dados operacionais (nos sistemas lega- •
dos) e o data warehouse.

Bancos de dados multidimensionais. Bancos de dados multidimensionais são ar-


mazenamentos de dados especializados que organizam fatos por dimensões, como
região geográfica, linha de produto, vendedor ou tempo (consulte Arquivo Online
Capfiulo 3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 123

,:)j0~ocle data warehousing:


• Expectativas não realistas
• Arquitetura imprópria
• Capacidades'de vendas dos fornecedores acima das especifica das
• Projeto-Ióqico insuficiente
e Falta de perícia de desenvolvimento
Objetivos de negócio incertos
• Falta.dé.patrocinio efetivo ao projeto

ImpíerT,entaiãO"do data wârehousing:

• Treinamento precário dos usuários


e Falha em alinhar os data warehouses e os data marts
• Falta de atenção às questões culturais
., Diretivas corporativas não.atualizadas

Operação do data warehousing:

• Manutenção ruim da tecnologia


• Falha em atualizar módulos
• Falta de integração
• Má qualidade dos dados
• Formato inadequado das informações

Fontes: Carbone (1999) e Jekic (2006).

W3.2). Os dados nos bancos de dados multidimensionais normalmente são pré-pro-


cessados e armazenados naquilo que é chamado cubos de dados (rnultidimensio-
nais). Um cubo de dados é mostrado no lado esquerdo da figura no Arquivo Online
W3.2. Cada célula no cubo representa algum atributo de uma combinação específi-
ca de dimensões (há três dimensões na figura). Fatos, como quantidades vendidas,
são colocados na interseção das dimensões. Uma dessas interseções poderia ser as
..• quantidades de máquinas de lavar vendidas na Divisão Central da empresa em ju-
lho de 2007.
Dimensões frequentemente têm uma hierarquia. Números de vendas, por
exemplo, poderiam ser apresentados por meio de uma base diária, mensal ou anual.
Eles também poderiam incluir uma dimensão organizacional que resumisse os da-
dos por loja, região e a empresa toda. Bancos de dados multidimensionais podem
ser incorporados a um data warehouse, às vezes como o núcleo, ou podem ser utili-
zados como uma camada adicional de armazenamento.
Carbone fornece exemplos e identifica várias razões das falhas (que são co-
muns para muitos outros grandes sistemas de informação). Elas estão resumidas na
Tabela 3.4. Sugestões de como evitar falhas do data warehouse são fornecidas em
datawarehouse. com, bitpipe. com e teradatauniversitynetwork. com.

3.b Bancos de dados de marketi!l9~m ação . _


Data warehouses e data marts servem os usuários finais em todas as áreas fun-
cionais. Entretanto, os aplica ti vos mais cruciais de data warehousing e de mine-
MKT ração estão no marketing, como visto no caso do Harrah's, naquilo que é cha-
mado de bancos de dados de marketing (também conhecidos como marketing de
banco de dados).
124 Parte 11 Infraestrutura de TI

Nesta seção, examinaremos como data warehouses, suas extensões e a minera-


ção de dados são utilizados e o papel que eles desempenham nas novas estratégias
de marketing, como o uso de bancos de dados de transações de marketing baseados
na Web no marketing interativo.

Muitos bancos de dados são estáticos: Eles simplesmente coletam e armazenam i, for-
mações sobre os clientes. Eles aparecem 'Ias, i: \'[',,(;5 '. ,_,;r :,. "," _.. ; u., .o"u;)~ de
operações, data warehouses e bancos de dados de marketing. O sucesso do marketing
de hoje requer um novo tipo de banco de dados direcionado à personalização em tem-
po real das mensagens de marketing. Esse banco de dados fornece o meio mais eficaz
de capturar informações sobre as preferências e necessidades dos clientes. Por sua vez,
empresas podem utilizar esse conhecimento para criar novos produtos e/ou produtos e
serviços personalizados. Esse banco de dados é chamado banco de dados de transações
de marketing (marketing transaction database - MTD). O MTD combina várias carac-
terísticas dos bancos de dados atuais e origens de dados de marketing a um novo banco
de dados que permite que profissionais de marketing se empenhem na personalização
em tempo real e tenham por alvo todas as interações com os clientes.

Capacidades do MTD. O MTD fornece funções dinâmicas, ou interativas, não


disponíveis com os tipos tradicionais de bancos de dados de marketing. Em termos
de marketing, uma transação ocorre com a troca das informações. Com uma mídia
interativa, cada exposição ao cliente torna-se uma oportunidade de conduzir uma
"transação" de marketing. A troca de informações (quer sejam coletadas ativamen-
, te por meio de registro ou por meio de solicitações do usuário ou monitorando
passivamente o comportamento dos clientes) permite que os profissionais de mar-
keting refinem continuamente seu entendimento de cada cliente e utilizem essas
informações para ter especificamente como alvo mensagens personalizadas de mar-
keting. Isso é feito mais frequentemente na Web.

Poucas empresas conseguem ter reEUfSOSfinanceiros para abordagens tradicionais


de marketing, o que inclui estratégias abrangentes e campanhas de marketing caras.
Os departamentos de marketing estão sendo reduzidos (assim como as abordagens
tradicionais de marketing), e novas abordagens como o marketing de um para um,
marketing veloz, marketing interativo e marketing de relacionamento estão sendo
empregadas (consulte Strauss et aI., 2003).
Os exemplos a seguir ilustram como as empresas utilizam a mineração de dados
e o warehousing para dar suporte às novas abordagens de marketing. Para outros
exemplos, consulte o Arquivo Online W3.3.

• Por meio de um registro online de casais que esperam filhos, a Burlington Coat
Factory monitora o crescimento das famílias. A empresa então relaciona o mate-
rial de mala-direta com as diferentes etapas do desenvolvimento de uma família ao
longo do tempo. A Burlington também identifica, diariamente, os melhores estilos
de vendas e marcas. Pesquisando detalhadamente os dados demográficos, padrões
do histórico de compras e tendências das vendas existentes nas lojas, a Burlington
determina onde abrir sua próxima loja e qual deve ser o estoque de cada uma .
• O Bank of America recebe diariamente mais de 100,000 chamadas telefônicas
$FlN
dos clientes. Analisando as atividades bancárias dos clientes, esse banco deter-
mina o que poderia ser interessante para eles. Portanto, quando um cliente tele-
fona para verificar o saldo, o banco tenta vender algo em que o cliente poderia
estar interessado.
\) No seu data warehouse, o Chicago Tribune armazena informações sobre o com-
portamento dos clientes à medida que eles acessam os vários sites desse jornal.
SRV A mineração de dados ajuda a analisar volumes de dados que vão desde os na-
vegadores utilizados até os hyperlinks clicados com mais frequência.
Cilpítulo 3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 125

Os data warehouses em muitas empresas incluem vários terabytes ou mais de da-


dos. Eles precisam utilizar um supercomputador para filtrar rapidamente os dados. A
Wal-Mart, a maior loja de descontos do mundo, tem um banco de dados gigantesco.

Sistemas de gerenciamento de dados baseados na Web


Gerenciamento de dados e atividades de inteligência de negócio - da aquisição de
dados (por exemplo, Atzeni et a!., 2002), por meio do warehousing, à mineração -
são frequentemente realizados com ferramentas Web ou estão inter-relacionados
às teenologias Web e aos negócios eletrônicos (consulte Liautaud, 2001). Usuários
com navegadores podem se conectar a um sistema, fazer consultas e obter relatórios
em um ambiente de tempo real. Isso é feito por meio de intranets e, para pessoas de
fora, via extranets (consulte remedy.com).
O desafio hoje em dia para o gerenciamento de dados e atividades de inteligên-
cia de negócio é a integração das informações. A razão por que isso é uma tarefa
desafiadora é que os atuais sistemas corporativos vão muito além dos limites do
centro de dados corporativos e incluem clientes, fornecedores, parceiros e mercados
eletrônicos. A integração das informações é uma abordagem baseada na tecnolo-
gia que combina, em uma plataforma comum, elementos essenciais dos sistemas de
gerenciamento de dados, dos sistemas de gerenciamento de conteúdo, dos data wa-
rehouses e de outros aplicativos corporativos (Roth et aI. ,2002). Web Services são
uma interface de programação comumente utilizada na integração de informações.
Fornecedores de software de comércio eletrônico (CE) estão fornecendo ferra-
mentas Web que conectam o data warehouse aos sistemas de realização de pedidos
do comércio eletrônico e aos sistemas de catálogos. O conjunto de ferramentas de
CE da Hitachi, chamado Tradelink (em hitachi.com), combina atividades de CE
como gestão de catálogos, aplicativos de pagamento, personalização em massa e
gestão de pedidos com sistemas ERP, data warehouses e data marts. A Oracle (con-
sulte Winter, 2001) e a SAP oferecem produtos semelhantes.
Sistemas de gerenciamentode dados baseados na Web têm múltiplos compo-
nentes que consistem em dados estruturados e não estruturados (consulte Figura
3.15) levando à capacidade de gerenciar conteúdo online e verificar níveis de esto-
...
que dos fornecedores .

O volume de dados no data warehouse pode ser bem grande. Embora a organiza-
ção dos dados seja feita para facilitar a pesquisa, ainda assim seria útil um sistema
de pesquisa para aplicativos específicos. Um agente inteligente pode aprimorar a
operação de um data warehouse. Esse aplicativo complementa a monitoração e a
varredura de dados estratégicos externos. O aplicativo do agente inteligente pode
atender tanto necessidades de informações ad hoc de consulta/geração de relatórios
aos gerentes como necessidades externas de dados de um sistema estratégico de
suporte à administração para empresas florestais na Finlândia.

Quantidades grandes e sempre crescentes de dados B2C sobre consumidores, produ-


tos, ete. podem então ser coletados. Tais dados vêm de várias fontes: dados internos
(por exemplo, dados de vendas, dados de folha de pagamento, etc.), dados externos
(como relatórios do governo e da indústria) e dados de sequência de cliques. Dados
de sequência de diques (também conhecidos como logs da Web) ocorrem dentro
do ambiente Web, quando clientes visitam um site. Eles fornecem uma trilha das
atividades dos usuários no site, incluindo seu comportamento e padrões de navega-
ção. Examinando dados de sequência de cliques, um negócio de comércio eletrônico
pode descobrir coisas como quais promoções são eficientes e quais segmentos da
população estão interessados em produtos específicos.
---------------------- •••••••••••••••• m
126 Parte 11 Infraestrutura de TI

Gerenciamento do
warehouse
Aplicativo
de ERP Banco de ------------ ...•
1 1
dados de I 1
transações ETL e I - - -I Aplicativo 1
online qualidade I 1
1 L~n:~tico

jY-
1
:_.F
. =~~~adO?1 1
t.,
1

-1-
I
-G
·~·I·~<'::'·~-·- OLni'
~
Consulta e
geração
de relatórios

Dados do
ponto
de venda

Entendimento
Portais
corporativos
de informações

Figura 3.15 Fontes de conteúdo para um portal corporativo de informações. (Fonte:


MerrillLynch,1998.)

Analisar logs Web rapidamente pode ser bem útil. Por exemplo, uma análi-
se rápida permite à administração estimar a eficácia de uma promoção de vendas
baseada na Web. Ferramentas populares são Web Trends (da NetIQ) e Mach5
Analyzer (da Machó.com).
Os dados da sequência de cliques podem revelar informações para responder
a questões como: Quais produtos o cliente pesquisou ou comprou? Quais itens o
cliente comprou junto com outros itens? Quais anúncios e promoções foram efi-
cazes? Quais foram ineficazes? Certos produtos são muito difíceis de encontrar?
Certos produtos são muito caros? Há um produto substituto que o cliente encontra
primeiro?
A Web é uma fonte incrivelmente rica de inteligência de negócio e muitas empre-
sas estão lutando para construir data warehouses que capturem o conhecimento con- .
tido nos dados da seqüência de diques a partir de seus sites. Analisando os padrões de
comportamento dos usuários contidos nesses data warehouses de sequência de cliques,
as empresas com visão podem expandir seus mercados, aprimorar relacionamentos
com os clientes, reduzir custos, simplificar operações, fortalecer seus sites e aperfeiçoar
suas estratégias de negócio. Há duas opções: Incorporar dados baseados na Web aos
data warehouses preexistentes ou construir novos data warehouses de seqüência de
diques que são capazes de mostrar tanto as atividades de e-business como os aspectos
não Web do negócio de uma maneira integrada (consulte Sweiger at el., 2002). Para
um aplicativo utilizado pela Victoria's Secret, consulte TI em ação 3.1.
Caprrulo 3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 127

. ... .-
Para comerciantes
. -.. .. - -
de contato direto com o consumidor, a
. .
;~
,

de consultores de moda examinam milhares de chama-


,..",,-

.,

"morte de um pedido" pode ocorrer a qualquer momen- das que vão desde pedidos e oportunidades de "agre-
to durante a transação. A "morte de um pedido" significa gar mais valor às vendas" (ou up-sell, isto é, vender aos
que os clientes (nu iam de ideia em algum ponto durante o clientes itens mais caros) até reclamações e soluções so-
processo Jd lealiLdi;dú do pedido. Mas, utilizando um data bre merchandise.
warehouse corporativo para capturar informações sobre os o O canal online da empresa produz um enorme volume de
clientes e ferramentas de suporte à decisão para analisar dados sobre os clientes, uma vez que ela aceita milhares
padrões de compras, a Victoria's Secret (victoriassecret.com) de pedidos diariamente tanto para produtos online como
mantém os pedidos ativos e trabalha para fornecer uma me- para produtos de catálogo. As atividades de cada cliente
lhor experiência de compra. no site são armazenadas no data warehouse.
Diferentemente de uma compra física, a venda direta
A Victoria's Secret coloca todos esses dados em ação
de produtos por meio de vitrines eletrônicas fornece um alto
de várias maneiras. A empresa cria mensagens de email com
volume de elementos de dados únicos e diversos em todas
um alvo específico, totalizando um envio de 150 milhões de
as etapas da vida de um pedido. Para transformar os dados
mensagens de email por ano. Essas mensagens incluem
.coletados em informações manipuláveis, essa empresa utili-
ofertas, produtos especiais, convites, anúncios e outras
za uma solução de data warehouse da Teradata (uma divisão
ações de marketing.
da NCR Corp.). O revendedor monitora todos os padrões de
A empresa analisa diariamente o status de cada produ-
compras e de contato.
to por cliente, por dia, para cada pedido. O data warehouse
O data warehouse armazena os dados coletados a partir
possibilita que a Victoria's Secret aprimore as previsões de
de vários fluxos de dados:
comportamento dos clientes e também permite que essa em-
o A principal origem de dados é o cliente. Além de ter aces- presa mantenha-se em dia com a equação do lucro de cada
so ao nome, endereço e histórico de compras de todos pedido. Para medir a receita de cada pedido, a Victoria's Se-
os clientes, a empresa também diferencia o originador do cret começa com o preço de um produto e subtrai as despe-
pedido dos destinatários dos produtos, com base no ar- sas de despacho, manuseio e impostos relacionados e tam-
mazenamento de cada endereço de remessa. bém os custos de um serviço especial, como correio expresso
o A empresa também armazena as informações de paga- e embalagens para presentes. Esse processo significa que o
mento dos clientes. A Victoria's Secret utiliza os dados de revendedor pode medir a lucratividade de cada cliente, pedi-
pagamento para monitorar os hábitos de consumo de do, catálogo e produto.
seus clientes.
o O terceiro fluxo de dados vem dos contatos diretos dos Fonte: Compilado de Amato-Mccoy (2003) e Jekic (2006).
clientes através das operações de mala-direta da empre-
sa. Por exemplos a empresa tem mais de 50 malas-diretas Para mais exploração: O que a Victoria's Secret tem em
de catálogos domésticos e internacionais (300 milhões mente por "manter um pedido ativo?" Essa frase se aplicaria
de catálogos por ano). a outras empresas? Por que ou por que não? Dê exemplos.
o O centro de atendimento telefônico do revendedor for- Por fim, descreva os vários fluxos de dados que alimentam o
nece um outro fluxo de dados. Diariamente, centenas data warehouse da Victoria's Secreto

3.8 Questões gerenciais


1. Questões de custolbenefício e justificativa. Algumas soluções de gerenciamen-
to de dados discutidas neste capítulo são muito caras e só são justificáveis em
grandes corporações. A eficácia em termos de custos dessas soluções para orga-
nizações menores pode ser uma realidade se elas tirarem proveito dos bancos
de dados existentes em vez de criar novos. Uma análise cuidadosa dos custos e
benefícios deve ser realizada antes de qualquer comprometimento com as no-
vas tecnoJogias ser feito.
2. Onde armazenar fisicamente os dados. Os dados devem ser distribuídos próxi-
mos dos seus usuários? Isso potencialmente poderia melhorar o desempenho
da entrada e a atualização dos dados, mas aumenta os riscos de replicação e
segurança. Ou os dados devem permanecer centralizados para controle mais
128 Parte 11 Infraestrutura de TI

fácil, segurança e recuperação após desastre? Essa alternativa oferece menos


comunicações e riscos de falha de ponto único.
3. Questões legais. A mineração de dados poderia sugerir que uma empresa envia
promoções ou catálogos eletrônicos ou impressos a somente uma faixa etária
ou sexo. Um homem processou a Victoria's Secret Corpo porque sua vizinha
recebeu um catálogo de TIHl a-direta com itens com grandes descontos e ele só
vo-
lume). Solucionar denúncias de discriminação pode ser bem caro .
. Interno ou externo? Uma empresa deve investir internamente na coleta, ar-
mazenamento e manutenção e depurar seus próprios bancos de dados das in-
formações? Ou deve adotar bancos de dados externos, onde os provedores são
responsáveis por todo o gerenciamento e acesso aos dados?
5. Recuperação após desastre. Os processos de negócio de uma organização, que
se tornou dependente dos bancos de dados, podem recuperar e apoiar opera-
ções depois de um desastre natural ou um desastre de um outro tipo dos siste-
mas de informação? (Consulte o Capítulo 16.) Como um data warehouse pode
ser protegido? A que custo?
6. Ética e segurança dos dados. Os dados competitivos da empresa estão seguros
contra espionagem ou sabotagem externa? Os dados confidenciais, como de-
talhes pessoais, estão seguros contra alterações ou acesso impróprio ou ilegal?
Uma pergunta relacionada é quem possui esses dados pessoais?
7. Ética: Pagar pelo uso de dados. Compiladores de informações de domínio
público, como a Lexis-Nexis, enfrentam o problema de pessoas que extraem
Ética
grandes seções de seu trabalho sem antes pagar direitos autorais. O Collection
of Information Antipiracy Act (Bills HR 2652 e HR 354 no Congresso norte-
-americano) pode fornecer maior proteção contra pirataria online. Esse e ou-
tros problemas da propriedade intelectual estão sendo debatidos no Congresso
norte-americano e decididos nos tribunais. (Consulte o Capítulo 17.)
8. Privacidade. Armazenar dados em um warehouse e conduzir mineração de da-
... ~ dos poderia resultar na invasão da privacidade individual. O que as empresas
Ética
farão para proteger as pessoas? O que as pessoas podem fazer para proteger
sua privacidade? (Consulte o Capítulo 17.)
... 9. O problema dos dados legados. Uma questão bem real, frequentemente co-
nhecida como o problema de aquisição de dados legados, é o que fazer com
o enorme volume de informações já armazenado em uma variedade de sis-
temas e formatos. Dados em bancos de dados mais antigos, talvez obsole-
tos, ainda precisam estar disponíveis para os sistemas de gerenciamento de
bancos de dados mais recentes. Muitos dos programas aplicativos legados
utilizados para acessar os dados mais antigos simplesmente não podem ser
convertidos em novos ambientes de computação sem custos consideráveis.
Basicamente, há três abordagens para resolver esse problema. Uma é criar
um [ront-end de banco de dados que possa agir como um tradutor do sistema
antigo para o novo. A segunda é integrar os aplicativos ao novo sistema para
que os dados possam ser acessados de forma transparente no formato origi-
nal. A terceira é migrar os dados para o novo sistema reformatando-os. Uma
nova abordagem promissora é o uso dos Web Services (consulte o Guia de
Tecnologia 6).
10. Disponibilização dos dados. Disponibilizar os dados com eficiência em uma em-
presa normalmente é um problema sério. A incapacidade de uma comunicação
efetiva e eficiente entre os diferentes grupos, em diferentes localizações geo-
gráficas, é um obstáculo sério a uma implementação adequada dos aplicativos
distribuídos, especialmente devido aos muitos sites remotos e à mobilidade dos
trabalhadores de hoje. A computação móvel e sem fio soluciona algumas dessas
dificuldades.
Capítulo 3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 129

Termos-chave
pados de sequência de cliques 101 Inconsistência de dados 108 Dicionário de dados 113
Qualidade dos dados 102 Isolamento de dados 108 Metadados 113
Gerenciamento de documentos 104 Integridade de dados 108 Diagrama de entidade-relacionamento
Sistema de gerenciamento de docu- Sistema de gerenciamento de bancos 114
mentos (SGD) 104 -de dados (daiobase management Tabelas de-dados 114 .
Banco de dados 106 system - DBMS) 111 Processamento analítico 117
Atributos 106 Visualização física 112 Data warehouse 118
Chave primária 706 '" Visualização lógica 112 Data mart 121
Chave secundária J 06 Modelo de dados 112 Annazenamento de dados operacio-
Chave estrangeira 106 Linguagem de definição de dados nais 122
Organização sequencial, direta ou ale- (data definition language - DDL) Banco de dados multidimensional
atória de arquivos 106 113 ]22
Método de acesso sequencial indexa- Esquema 113 Banco de dados de transações de
do (indexed sequential access me- Linguagem de manipulação de dados marketing (marketing transaction
thod - ISAM) 106 (data manipulation language- database - MTD) 124
Método de acesso direto de arquivo DML) 113 Data warehouses da sequência de
107 Structured Query Language (SQL) cliques 126
Redundância de dados 108 113

Destaques do capítulo Os números referem-se aos objetivos de aprendizagem

4) Dados são a base de qualquer sistema de informação e @ A Internet é uma fonte importante de dados e conheci-
precisam ser gerenciados por todo o ciclo de vida útil, o que mento. Outras fontes são bancos de dados, documentos em
Converte dados em informações úteis, conhecimento e uma papel, vídeos, mapas, imagens, etc.
base para suporte às decisões.
e Muitos fatores que influenciam a qualidade dos dados
a Dados existem em fontes cornputadorizadas internas e
devem ser reconhecidos e controlados.
externas e em outras fontes. Conhecimento e dados pes- €) Dados e documentos de hoje são gerenciados eletronica-
soais frequentemente estão armazenados nas mentes das mente: eles são digitalizados, armazenados e utilizados nos
pessoas. sistemas eletrônicos de gerenciamento.
130 Parte 11 Infraestrutura de TI

o O gerenciamento eletrônico de documentos, o controle gurança, redução dos custos de manutenção dos dados, e
automatizado de documentos, é fundamental para maior e- melhor acesso aos dados.
ficiência no manuseio dos documentos a fim de ganhar uma
(i) O modelo conceitual de dados é o nível mais alto para
vantagem competitiva.
modelar dados organizacionais.
O Data warehouses e data marts são necessários para dar
(1) O modelo lógico é uma visualização detalhada dos da- :
suporte efetivo à descoberta de inforrmcóes e sv oorte 3 to-
dos o.L ~·i·~. : . ;r:icL~:- _ .r; '. ,.) c:n1 entid ...
>:, de da-
mada de decisões. Dados relevantes s:,. ,;i·L.dUl.S G ulõd,i-
dos gerenciáveis (por exemplo, os dados dos clientes em
zados para acesso fácil pelos usuários finais.
preferências de produtos, contato dos clientes, localizações
o O processamento analítico online é um método de des- das lojas e vendas de produtos). *;
coberta de dados que utiliza abordagens analíticas.
(i) O modelo físico são as tabelas de banco de dados com
(;) O programa que gerencia os dados e fornece acesso ao relacionamentos e chaves primárias. Cada entidade detalha-
banco de dados chama-se sistema de gerenciamento de ban- da na visualização lógica torna-se uma tabela de banco de
cos de dados. dados no modelo físico.

O Os benefícios do uso de um DBMS incluem: utilização o Os diagramas de entidade-relacionamento são ferra-


estratégica aprimorada dos dados corporativos, menor mentas de geração de diagramas que ajudam o projetista
complexidade do ambiente de dados, menor redundância do banco de dados a desenhar uma planta dos dados na
de dados e integridade de dados aprimorada, melhor se- organização.

Exercício de em resa virtual


Gerenciamento de dados no The Wireless Cafe
Acesse o link The Wireless Cafe no site www.wiley.com/college/turban. (A disponibilidade
desse link é de inteira responsabilidade da editora original. Alertamos que pode ser retirado
do ar quando do lançamento de novas edições.) Lá você será solicitado a pensar sobre como
melhor gerenciar os vários tipos de dados que esse restaurante utiliza nas suas atividades.

Instruções para acessar The Wireless Cafe no site do a/uno:


1. Visite wiley.com/college/turban.
2: Selecione Turban/Leidner/McLeanlWetherbe's Information Technology for Management,
Sixth Edition.
3. Clique no site Student Resources, na barra de ferramentas à esquerda.
4. Clique no link para o site Virtual Company.
5. Clique em Wireless Cafe.

Recursos online (em inglês) ~IPLUSj


Mais recursos e ferramentas de estudo encontram-se na WileyPLUS. Você encontrará 1
I
materiais adicionais do capítulo e links úteis. Além disso, você encontra questionários
que fornecem feedback individualizado para cada capítulo.
I
Questões
1. Liste as principais
p..=ac.::....r=a.....:.r-=e:..,.:v.-.:..is-=-ã::.:.o-=--
origens de dados. 9. Quais são os problemas
_
que surgem a partir do ambien-
I
2. Liste alguns problemas sérios dos dados. te de arquivos?
3. O que é um terabyte? (Escreva o número.) 10. Discuta um banco de dados relaciona Ie como ele difere
4. Revise os passos do ciclo de vida dos dados e expli- de outros bancos de dados.
que-os. 11. Quais são os componentes de um sistema de geren-
5. Liste algumas categorias de dados disponíveis na In- ciamento de bancos de dados (databose managcment
ternet. system - DBMS)?
6. Defina qualidade dos dados. 12. Qual é a diferença entre visualizações físicas, lógicas e
conceituais dos dados?
7. Defina gerenciamento de documentos.
13. Como você pode extrair dados de um banco de dados?
8. Descreva a hierarquia de um sistema de gerenciamento
de arquivos. 14. Quais são os benefícios do uso de um DBMS')
Cilprrulo 3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 131

15. Qual é a diferença entre entidades e atributos? 17. Descreva um data mart.
16. Descreva um data warehouse. 18. Defina um banco de dados de transações de marketing .

.~Questões para discussão


L Compare a qualidade dos dados com a integridade dos 8. Como você migra do modelo de dados para os diagra-
dados. Como elas estão relacionadas? mas lógicos de entidade-relacionamento?
2. Dis("l''1 a inteligência de negócio e especifique uma dis- 9. Qual é a diferença entre visualizações físicas, lógicas e
tinção entre suporte à decisão e descoberta de informa- conceituais dos dados?
ções e de conhecimento. 10. Como as organizações utilizam seus data warehouses
3. Discuta os fatores que tornam o gerenciamento de do- para ganhar satisfação do consumidor?
cumentos tão valioso. Quais capacidades são especial- 11. Discuta as vantagens do banco de dados de marketing da
mente valiosas? Terabyte para uma grande corporação. Uma empresa de
4. Relacione a gerenciamento de documentos aos siste- pequeno porte precisa de um banco de dados de marke-
mas de geração de imagens. ting? Sob quais circunstâncias fará sentido utilizar um?
5. Discuta os principais propulsores e benefícios do data 12. Qual é a lógica do marketing direcionado e como o geren-
warehousing para os usuários finais. ciamento de dados pode ser utilizado nesse marketing?
6. Um data mart pode substituir ou complementar um 13. Diferencie bancos de dados operacionais, data wa-
data warehouse. Compare e discuta essas opções. rehouses e data marts de marketing.
7. Discuta os passos da construção de um modelo concei- 14. Discuta a interação entre as teorias de gestão e de mar-
tual de dados de alto nível. keting e o suporte de TI no caso do Harrah's.

~. Exercícios e p_ro--J-ie_t_o_s _
1. Revise a lista de dificuldades do gerenciamento de da- Preço do produto
dos na Seção 3.1. Explique como uma combinação de Dados do fornecedor do produto
data warehousing e de mineração de dados pode resol- Código do produto
ver ou reduzir essas dificuldades. Seja específico.
Nome do produto
2. Entreviste um trabalhador do conhecimento em uma
Tipo de produto
empresa que você trabalha ou uma a que você tem
Nome do fornecedor
acesso. Descubra os problemas de dados que a empresa
encontrou e as -Vledidas tomadas para resolvê-l os. Re- Termos de despacho do fornecedor
lacione os problemas às quatro categorias de Strong. 6. Para o exercício acima, determine quais tabelas estão
3. Crie uma pane típica dos atributos para os dados dos relacionadas entre si, determine as chaves primárias e
funcionários em uma organização comerciaJ. estrangeiras (conforme necessário), tipo de campo (tex-
4. Desenhe uma figura de como um sistema de gerencia- to, número, data) e comprimento de campo.
menlo de bancos de dados é montado incluindo todos 7. Em terad atastu.dentnetwork.com, leia e responda as
os seus componentes. perguntas para o caso: "Harrah's High Payoff from
5. Desenhe três tabelas de banco de dados de acordo com Customer lnforrnation" (Harrah's lucra alto com infor-
os atributos e as entidades do diagrama de entidade- mações dos próprios clientes). Relacione os resultados
-relacionamento: do Harrah's à maneira como outros cassinos utilizam os
Dados da disponibilidade de produtos dados dos clientes.
Código do produto 8. Acesse a Teradata Magazine Volume 6, Número 2 e
Nome do produto leia "The Big Payoff". Acesse então o teradatastuden-
tnetwork.com e leia o estudo de caso "Harrah's High
Número de itens
Payoff from Custorner Information". Que tipo de ga-
Localização dos itens
nhos a empresa tem a partir desse investimento no data
Número do depósito
warehousing?
Data de disponibilidade
9. Em teradatastudentnetwork.com, leia e responda as per-
Dados da descrição do produto guntas do exercício intitulado: "Data Warehouse Failu-
Código do produto res" (Fracassos do data warehouse). Como há oito ca-
Nome do produto sos descritos, escolha um e discuta a falha e potenciais
Características do produto correções.
132 Parte II Infraestrutura de TI

Exercícios e projetos em grup_o -'----


1. Em grupos, crie um modelo de dados para uma loja de tendências nas preferências dos consumidores a novos
animais de estimação a fim de incluir: produtos e encontrar precisamente os fatores de mar-
• Dados dos clientes keting que poderiam causar alterações nos níveis de
• Dados dos produtos vendas de certas marcas e mercados.
e Dados dos funcionários A Ocean Spray compra dados de marketing da InfoS-
• Dados financeiros "'~.' _.~l'_ !~'l:Si: 'o/lI ..' '"- (' i.) ~'lt-

1\,r\os dos fornecedores Iizando scanners de código de barras em uma amostra


" Dados de vendas de 2.500 lojas de âmbito nacional da A. C. Nielsen. Os
o Dados do estoque dados para cada produto incluem volume de vendas, fa-
" Dados do edifício tia de mercado, distribuição, informações sobre preços
• Outros dados (especifique) e sobre promoções (vendas, anúncios publicitários).
Crie atributos (4 ou mais por entidade) para cada enti- O volume diário de dados fornecido à Ocean Spray é
dade de dados. Crie relacionamentos entre as entidades avassalador (aproximadamente 100 a 1.000 vezes mais
e atribua nomes a esses relacionamentos. item de dados do que essa empresa costumava coletar
2. Prepare um relatório sobre o tópico "gerenciamento de por conta própria). Todos os dados são armazenados no
dados e a intranet". Especificamente, preste atenção ao data mart de marketing da empresa. Para analisar esse
papel do data warehouse, uso de navegadores para con- volume enorme de dados, a empresa desenvolveu um
sulta e mineração de dados. Cada grupo irá visitar um ou SSD. Para dar aos usuários finais acesso fácil aos dados,
dois sites de fornecedores, ler os artigos técnicos e exami- a empresa utiliza um sistema especialista - baseado no
nar produtos (Oracle, Red Bricks, Brio, Siemens Mixdorf processo de mineração de dados chamado CoverStory,
IS, NCR, SAS e Information Advantage). Também visite que resume as informações de acordo com as preferên-
o site Web do Data Warehouse Institute (tdwi.org). cias dos usuários. O CoverStory interpreta os dados
3. Com a mineração de dados é possível não apenas cap- processados pelo SSD, identifica tendências, descobre
turar informações armazenadas em tribunais distantes, relacionamentos de causa e efeito, apresenta centenas
como também manipulá-Ias e indexá-Ias. Isso pode de gráficos e fornece todas as informações exigidas pe-
beneficiar a aplicação da lei, mas invade a privacida- los tomadores de decisão. Esse sistema alerta os geren-
de. Em 1996, a Lexis-Nexis, um serviço de informações tes para os problemas e oportunidades fundamentais.
online, foi acusado de permitir acesso a informações
a. Encontre informações sobre essa empresa acessando
sigilosas sobre pessoas. A empresa argumentou que a
o site Web da Ocean Spray (oceanspray.com).
acusação era injusta, uma vez que ela só forneceu dados
residenciais básicos a advogados e à polícia. A Lexis- b. A Ocean Spray afirmou que ela não pode adminis-
-Nexis deveria ou não ser proibida de permitir acesso a trar o negócio sem o sistema. Por quê?
essas informações? Debata a questão. c. Quais dados a partir do data mart são utilizados pelo
4. A Ocean Spray Cranberries é uma grande cooperati- SSD?
va de plantadores e processa dores de frutas. A Ocean d. Acesse injores.com ou scanmar.nl e revise as infor-
Sp~ay precisava de dados para determinar a eficácia das mações de suporte a decisões de marketing. Como a
suas promoções e campanhas publicitárias e para que empresa está relacionada a um data warehouse?
pudesse responder estrategicamente às promoções dos e. Como a InfoScan coleta os dados? (Verifique o pro-
concorrentes. A empresa também queria identificar duto Data Wrench.)

Exercício na Internet
1. Conduza uma pesquisa sobre ferramentas e aplica tivos 5. Explore um site Web para aplicativos multimídia de
de gerenciamento de documentos visitando dataware. banco de dados. Visite sites como leisureplan.com,
com, documentum.com, mobius.com e aiirn.org/aim/ illustra.com ou adb.]r. Revise algumas demonstrações e
publications. prepare um relatório final.
2. Acesse os sites Web de um ou dois dos principais for- 6. Acesse microsofl.com/soILllions/BI/customerlbiwithin-
necedores de gerenciamento de dados, como a Oracle, reachJlemo.asp e consulte como a inteligência de ne-
IBM e Sybase e identifique as capacidades dos seus gócio é suportada pelas ferramentas da Microsoft. Es-
produtos mais recentes de inteligência de negócio. creva um relatório.
3. Acesse os sites Web de um ou dois dos principais forne- 7. Acesse teradatouniversitynetwork.com. Prepare um re-
cedores de data warehouse, como NCR ou SAS; descu- sumo dos recursos disponíveis aí. Ele é valioso para um
bra como seus produtos estão relacionados à Web. aluno? Para gerentes em treinamento?
4. Acesse o site Web do GartnerGroup igartnergroup. 8. Acesse websurvey.com, clearleaming.com, e tucows.com/
com). Examine algumas notas da pesquisa desse grupo webforms e prepare um relatório sobre a coleta de da-
relacionadas aos bancos de dados de marketing, data dos via Web.
warehousing e gerenciamento de dados. Prepare um re- 9. Visite injoscan.com. Localize todos os serviços relacio-
latório relativo ao estado da arte. nados ao warehouse dinâmico e explique o que ele faz.
CapRulo 3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 133

~
~Wà
GOV
ra ão dos dados da segurança nacional

~" . o CIO do u.s. Department of Homeland Security (DHS), Primeiro, é necessário identificar e desenvolver uma linha
i ~rgão norte-americano de combate ao terrorismo e res- de dados comum. Outro desafio importante na arena de
posta a desastres naturais, é responsável por determinar migração de dados é a segurança dos dados, especial-
r quais aplicativos e~lstentes e quals tipos de dados podem mente ao lidar com dados e aplicativos muito antigos.
~ ajudar a orqaruzaçao a cumprir seu objetivo, migrar os da- A Homeland Security também terá componentes de
í!>: dos para uma estrutura de última geração usável e segura análise de informações e de proteção da infraestrutura.
": e integrar as diferentes redes e padrões de dados das 22 Desenvolver esses componentes talvez seja o desafio mais
- agências federais, com 170.000 funcionários, que foram difícil para o DHS. Não apenas a Homeland Security terá
agrupados para formar o DHS. O problema real é que as de dar sentido a um volume gigantesco de informações
agências federais operaram historicamente de uma ma- secretas coletadas a partir de diferentes fontes, como
neira autônoma e os diferentes sistemas de TI não foram também precisará então transmitir essas informações às
~. projetados para interoperarem. Essencialmente, o DHS pessoas que podem atuar sobre elas de uma maneira efi-
precisa agrupar grandes e complexos "silos" de dados. caz (muitas delas estão fora do governo federal). A análise
O desafio da migração dos dados a partir dos siste- dos dados, incluindo mineração de dados, OLAP e mais,
• mas legados, dentro ou em várias agências, é o primeiro ajudará na rápida detecção de ataques planejados e tam-
~ desafio que o DHS deve enfrentar. O maior problema é bém a localizar terroristas.
o gigantesco número de aplicativos e bancos de dados Mesmo o governo federal reconhece que deficiências
que rapidamente tornam-se obsoletos em todas as áreas nos dados poderiam assolar o DHS. Mover informações
do governo. Uma melhoria na integração dos dados está para onde elas são necessárias e fazer isso quando elas
a caminho nos níveis local, estadual e federal. O governo são necessárias, é crucial e extremamente difícil. Mais ou
utiliza ferramentas do mundo corporativo. menos 650.000 autoridades estaduais e locais "operam em
Problemas sérios ocorreram porque cada agência tem um vácuo dos serviços de inteligência virtuais, sem acesso
um conjunto de regras de negócio próprio que determina adequado às listas de observação de terroristas forneci-
a maneira como os dados são descritos, coletados e aces- das pelo departamento de estado para as autoridades da
sados.Alguns dados não estão estrutura dos e organizados imigração e para autoridades consulares", de acordo com
nos bancos de dados relacionais e eles não podem ser fa- o relatório de outubro de 2002 de Hart-Rudman, intitula-
cilmente manipulados e analisados. Aplicativos comerciais do "Ame rica Still Unprepared - America Still in Danger"
são utilizados para a integração mais importante, princi- (América ainda despreparada - América ainda em perigo).
palmente tecnologias de data warehouse e data mart. A
Informatica, entre outros forriecedoresde software, desen-- Fontes: Compilado de Datz (2002), Foley (2003). Nazarov (2003). Thibode-
volveu soluções de integração de dados que permitem às au (2003), e Peters (2003).
organizações combinarem diferentes sistemas para dispo-
nibilizar o máximo -oossivel o acesso às informações por
toda uma organização. Esse software pode ser adequado
Questões para o Minicaso 1
a um projeto de larga escala (consulte informatica.com) 1. Liste os problemas e dificuldades dos dados (consulte
A ideia é decidir e criar uma arquitetura corporativa a Seção 3.1).
paraagências federais e estaduais envolvidas na segurança 2. Por que o data warehouse é benéfico?
nacional. A arquitetura ajudará a determinar o sucesso da 3. Que tipo de análise o governo pode realizar com o su-
defesa nacional. O primeiro passo na migração dos dados porte de TI7 Ouais ferramentas você sugere que sejam
é identificar todos os aplicativos e dados em uso. Após utilizadas?
identificar aplicativos e bancos de dados, o próximo passo 4. Como os produtos da Informatica.com podem ajudar?
é determinar quais utilizar e quais descartar. Depois que (Visite o site da empresa, informatica.com.)
uma organização sabe quais dados e aplicativos ela quer 5. Você sugeriria um sistema de gerenciamento de docu-
manter, começa o difícil processo da migração dos dados. mentos (SGD)? Para qual propósito?
------._-_._._------_ .._- .-- .. _------_ .. --- -- - _._._----.----_ _-------
..

MinicoSO 2
SRV
._------_._----_.

o problema tados Unidos, foi pega de surpresa nos anos 1980 quan-
do os consumidores passaram a comprar em lojas espe-
A Sears, Roebuck and Company, a maior cadeia de lojas cializadas e em lojas de descontos, fazendo com que a
de departamentos e o terceiro maior distribuidor nos Es- empresa perdesse rapidamente sua fatia de mercado. Em
134 Parte 11 Infraestrutura de TI

uma tentativa de mudar essa situação, a Sears empregou gerentes da Sears agora podem monitorar o impacto pre-
várias estratégias de resposta, desde a introdução de suas ciso das campanhas publicitárias, clima e outros fatores
próprias lojas especializadas (como a Sears Hardware) até sobre as vendas de itens específicos. Isso significa que
reestruturar suas lojas nos shopping centers. Recentemen- os consumidores dos produtos e outros especialistas da
te, a Sears começou a vender na Web. Ela interrompeu Sears podem examinar e ajustar, se necessário, quantida-
seu catálogo impresso de mais de 100 anos. Alcançar a des no estoque, merchandising e realização de pedidos,
transformação e a reestruturação exigiu a readaptação juntamente com uma miríade de outras variáveis, quase
dos sistor-r-s de in-for'-""ação. ··lejia~T)2':t2. p3"a ,-,.i2 =ossam resr~'" .: ,', 'cimente "
!>. Searstinha '18centrais de dados, uma ern cada urna as mudanças no ambiente. Os usuários do SPRStambém.
das 10 regiões geográficas e também uma para cada de- podem agrupar tipos bem divergentes de produtos, por
partamento de marketing, finanças e outros. O primeiro exemplo, mcinitorar as vendas de itens marcados como
problema foi criado quando o esforço de reorganização "presentes por menos de US$ 25". O pessoal da publi-
só alcançou sete regiões geográficas. Frequentes incon- cidade pode acompanhar os chamados" great items"
gruências entre os números contábeis e de vendas e in- (itens mais vendidos), a partir de departamentos comple- .
formações dispersas entre inúmeros bancos de dados for- ta mente diferentes, publicados nas capas dos boletins'
çavam os usuários a consultar múltiplos sistemas, mesmo promocionais. O SPRS permite extensa mineração de
quando eles precisavam de uma resposta a uma consulta dados, mas apenas análises relacionadas à localização e
simples. Além disso, os usuários descobriram que os da- código do produto.
dos já resumidos tornaram difícil conduzir uma análise no Em 1998, a Sears criou um grande banco de dados
nível desejado de detalhes. Por fim, erros eram pratica- de clientes, chamado LCI (Leveraging Customer Informa-
mente inevitáveis quando os cálculos estavam baseados tion), que continha informações das vendas relacionadas
em dados provenientes de várias origens. aos clientes (que não estavam disponíveis no SPRS).O LCI
permite registros de hora em hora das transações, por
exemplo, orientando a promoção de hora em hora (como
A solução 15% de desconto para os primeiros compradores).
Nos feriados de 2001, a Sears decidiu substituir a
Para resolver esses problemas, a Sears construiu um único promoção regular de desconto de 10% oferecendo um
data warehouse de informações de vendas. Ele substituiu desconto maior durante as primeiras horas de compras.
os 18 bancos de dados antigos carregados com dados re- Essanova promoção, baseada no SPRS,falhou e somente
dundantes, contraditórios, e às vezes, obsoletos. O novo quando o LCI foi utilizado é que o problema foi corrigido.
data warehouse é um repositório simples de dados rele- Isso motivou a Sears a combinar o LCI e o SPRSem uma
vantes para tomada de decisão, como dados confiáveis única plataforma, o que permitiu análises sofisticadas (em
para indicadores chave de desempenho, inventários de 2002).
vendas e margens de lucro. A Sears, famosa por abraçar a Em 2001, a Sears também teve as seguintes iniciati-
TI em uma escala impressionante, completou o .data wa- vas Web: uma central de comércio eletrônico para melho-
rehouse e seus esforços de reengenharia de TI em menos rias do lar, uma troca de suprimentos B2B para a indústria
de um ano - uma perfeita história de recuperação propor- varejista, um catálogo de brinquedos (wíshbook.com),
c~onadapela TI. um sistema de licitações eletrônicas e muito mais. Todas
Utilizando um servidor corporativo da NCR, o data essas iniciativas de marketing na Web alimentam o data
warehouse inicial de 1,7 terabytes (1,7 trilhões de bytes) warehouse com dados e o planejamento e controle estão
é parte de um projeto batizado de Strategic Performance baseados no acesso aos dados no data warehouse.
Reporting System (SPRS).Em 2003, o tamanho do data
warehouse havia aumentado para mais de 70 terabytes.
O SPRSinclui dados abrangentes de vendas; informações Os resultados
sobre o estoque nas lojas, em trânsito e nas centrais de
distribuição; e custo por item. Isso permitiu que a Sears A capacidade de monitorar vendas por item individual em
monitorasse as vendas por itens individuais (códigos de cada loja permite que a Sears crie um mercado local pre-
produto) em cada uma das 1.950 lojas (incluindo 810 lo- ciso. Por exemplo, a Sears mantém diferentes tonalidades
jas nos shopping centers) nos Estados Unidos e em 1.600 de tintas em diferentes cidades para atender as demandas
lojas internacionais e em pontos de venda por catálogo. locais. Portanto, as vendas e a fatia de mercado melhora-
Portanto, a margem diária por item em cada loja poderia ram. Além disso, o monitoramento dos dados baseados
ser facilmente calculada, por exemplo. Além disso, a Sears na Web das vendas no LCI ajuda a Sears a planejar o mar-
agora faz o ajuste fino das suas estratégias de compras, keting e as campanhas publicitárias na Web.
marketing e merchandising com uma precisão que antes O data warehouse era inicialmente utilizado diaria-
não era possível. mente por mais de 3.000 compradores, repositores de
O SPRSé aberto a todos os funcionários autorizados estoque, vendedores, planejadores estratégicos, analistas
que agora podem visualizar as vendas diárias a partir de de logística e de finanças e gerentes de lojas. Em 2004,
uma perspectiva multidimensional (por região, distrito, havia mais de 6.000 usuários, uma vez que os usuários
loja, linha de produtos e item individual). Os usuários po- descobriram que o sistema era muito benéfico. O tempo
dem especificar uma data inicial e final para relatórios de de resposta a consultas caiu de dias para minutos para so-
vendas especiais e todos os dados podem ser acessados licitações típicas. No geral, o impacto estratégico do data
por uma interface gráfica muito amigável ao usuário. Os warehouse SPRS-LCIé que ele oferece aos funcionários da
CilpRulo 3 Gerenciamento de Dados: Dados, Bancos de Dados e Warehousing 135

,- Sears uma ferramenta para uma melhor tomada de deci- Questões para o Minicaso 2
sões; e os lucros das vendas diretas da Searssubiram mais
de 20% por ano desde que o SPRS foi irnplernentado. 1. Quais foram as principais razões do SPRS?
2. Como o data warehouse resolveu os problemas da Sears?
3. Por que ele foi benéfico para integrar o banco de da-
Fontes: Compilado de Amato-McCoy (2002), 8eitler & Leary (1997), e co- dos dos clientes ao SPRS?
municados de imprensa da Sears (2001-2004)_ 4. Como o RFIDpoderia alterar as operações da Sears?

~te Referências
Alter, S. L., Decision Support Sysrems. Reading, MA: Addison Wesley, Marinos, G., "How Executives Around the World are Addressing Data
1980. Management", DMRevíew, janeiro de 2005.
Amato-McCoy, D. M .. "Victoria's Secret Works to Keep Orders Ali- Markus, M. L., et al., "A Design Theory for Systems that Support Erner-
ve", Stores, janeiro de 2003. gent Knowledge Processes", MlS Quarterly, setembro de 2002.
Beitler, S. S., and R. Leary, "Sears' Epic Transformation: Converting Merríll Lynch, 1998.
from Mainframe Legacy Systems to OLAP", Journal o] Data Wa- Moad, I., "Mining a New Vein", PC Week, 5 de janeiro de 1998.
rehousing, abril de 1997. Nazarov, A. R., "Inforrnation Seeks Partners to Gain Traction in Fed
Canada NewsWire, "European Court of Human Rights Saves Time and Market", CRN, 9 de junho de 2003.
Money for a News Wire", 29 de abril de 2003, AICS#922110. Orlov, L., and Ramos, L., "Organic Information Abstraction", Forrester
Carbone, P. L., "Data Warehousing: Many of the Common Failures", Big Idea, 12 de maio de 2004.
presen tation, mitre. orglsupportlpapersltech. ..9_OOld-warehoulse ; pre- Park, Y. T, "Strategic Uses afData Warehouses",foumal of Data Wa-
sentation.htm (3 de maio de 1999). rehousing, abril de 1997.
Chenoweth, T., Corral, K., and Demirkan, H., "The Seven Key In- Peters, K. M., "5 Homeland Security Hurdles", Govemment Executive,
terventions for Data Warehouse Success", Communications of the 35(2), fevereiro de 2003.
ACM, 49(1), janeiro de 2006. Roth, M. A., et al., "Information Integration: A New Generation of In-
D'Agostino, D., "Applications: Data Management at Work at the Na- formation Technology", IBM Systems Journal, dezembro de 2002.
tional Security Archive", CIO lnsight, 21 de abril de 2006. Sears (2001-2003).
Datz, T, "Integrating América", CIO, dezembro de 2002. Solomon, M., "It's All About the Data", Information Systems Manage-
Delcambre, L., et aI., "Harvesting Information to Sustain Forests", ment, verão de 2005.
Communications of lhe A CM, janeiro de 2003. Strauss, J. et al., E-Marketing. Upper Saddle River, NJ: Prentice Hall,
DM Review, "Deploy SQL Server 2005 with Confidence". 2003.
DM Review, "Data Quality", 23 de maio de 2006. Tannenbaum, A., "Identifying Meta Data Requirements", Journal of
D'MReview, "Review", 17 de abril de 2004. Data Warehousing, 7(2), primavera de 2002.
DM Review, "Realily lT: Data Quality-lt 15 All About Not Being Wor- Teradata, "Overview: Benefits of an Enterprise Data Warehouse for
se Than Anyone Else", 5 de maio de 2005. Manufacturers", Teradata.com, 2006. teradata.com/t/poge/Sô l Sõ/ in-
Evans, G., "The Big Payoff: Harrahs", Teradata, março de 2006. dex.html (acessado em setembro de 2006).
Ferrell, K., "Getting a Haüdle on Data", Teradota, março de 2006. Thibodeau, P., "DHS Sets Timeline for IT Integration". Computer
Foley, J., "Data Debate", Injormation Week, J9 de maio de 2003. World, 16 de junho de 2003.
Helmaan. P., "Beyond Internet Banking: Wells Fargo ls Taking the Volonino, L., R. Anzaldua, and J. Goc1win, Computer Forensics: Princi-
Data Warehouse Public", março de 2006. pies and Proctice, Chapter 10. Upper Saddle River. NJ: Prentice-Hall,
Herlein. S., "A Business Approach to Data Quality: Achieving and 2007.
Maintaining First-Class Organizational Data", Journal of Data Wa- Weiss, T R., "Online Retail Sales 00 the Rise", PC World, janeiro de
rehousing, 7(2), primavera de 2002. 2003.
Jekic, N., "Modeling Strategies and Alternatives for Data Warehousing Whitehouse.gov, "Presidem Signs Intelligence Reforrn and Terrorism
Projects", Communications of the ACM, 49(4), abril de 2006. Prevention Act", 17 de dezembro de 2004. whitehouse.gov/news/rele-
Kroenke, D. M., Dotabase Processing Fundamentais, 10th ed. Upper Sa- asesI2004112120041217-J.html (acessado em setembro de 2006).
ddle River , NJ: Prentice Hall, 2006. Wikipedia.org, "Database Management Systems", outubro de 2005.
Levinson, M., "Jackpot! Harrah's Entertainment", CIO Magazine, JOdi; en. wikiped ia. o rglw ik il R ela tiona I_d atabase_m an age me nt _S ySI em
fevereiro de 200l. (acessado em setembro de 2006).
Liautaud. B., EiBusiness lntelligence. Nova York: McGraw-Hill, 2001. Winter, R., Large Scale Dota worehousing with Oraele 9i Datubase. Spe-
Loshin, D., "Issues and Opportunities in Data Quality Management Co- cial Report. Waltham MA: Winter Corp., 2001.
ordination", DM Review, abril de 2004. Worthen, B., "IT versus Terror", CIO, 10 de agosto de 2006.
Loveman, G., "Diarnonds in the Data", Harvard Business Review, maio
de 2003.

Você também pode gostar