Você está na página 1de 58

FUNDAÇÃO GETÚLIO VARGAS

FGV Management

GABRIELA NETTO GUERRA

A IMPORTÂNCIA DO DATA
WAREHOUSE NO PROCESSO DE
TOMADA DE DECISÃO

Brasília – DF

2005
2

GABRIELA NETTO GUERRA

A IMPORTÂNCIA DO DATA
WAREHOUSE NO PROCESSO DE
TOMADA DE DECISÃO

Monografia a ser apresentada à Fundação Getúlio


Vargas – FGV Management, Núcleo de Brasília-DF,
como requisito parcial à obtenção do título de
Especialista em Administração Estratégica de
Sistemas de Informação.

Orientador: Prof. Alberto Luiz Gerardi, Mestre

Brasília – DF
2005
3

GABRIELA NETTO GUERRA

A IMPORTÂNCIA DO DATA WAREHOUSE NO PROCESSO DE


TOMADA DE DECISÃO.

Monografia, de Conclusão de Curso, aprovada como requisito parcial


para obtenção do título de Especialista em Administração Estratégica de
Sistemas de Informação da Fundação Getúlio Vargas – FGV
Management, Núcleo de Brasília-DF.

Brasília,

APROVADA POR:

___________________________________
Prof. Alberto Luiz Gerardi, Mestre.
Orientador
FGV Management, Núcleo de Brasília-DF.

___________________________________
Prof.
FGV Management, Núcleo de Brasília-DF.

___________________________________
Prof.
FGV Management, Núcleo de Brasília-DF.
4

AGRADECIMENTOS

Ao professor Alberto Gerardi, pela paciência e orientação despendidas a mim


no decorrer do trabalho.

Aos funcionários da FGV, colegas e professores do AESI XII, agradeço a


compreensão pelas ausências decorrentes de complicações no final de minha
gravidez. Aos colegas e professores, agradeço ainda a colaboração deram com suas
experiências para o meu crescimento profissional.

À minha família, meus pais e meus irmãos, pelo incentivo que me deram e
pelo auxílio que recebi nos momentos em que precisei durante o curso. E ao meu
filho Gabriel que em alguns momentos teve que ficar sob os cuidados do pai para
que eu pudesse dar continuidade ao curso.

Um agradecimento particularmente especial ao meu marido Gsttenyo que


desde o início foi o grande incentivador e a quem devo o ponta-pé inicial desta
jornada. Seu apoio e sua ajuda foram muito importantes durante todo este tempo.
5

LISTA DE FIGURAS

Figura 1 – Excesso de informações..………………………………………….........…...23


Figura 2 - Data warehouse orientado por assunto……………………………………...25
Figura 3 - Integração de dados em um data warehouse a partir de outras
aplicações…………………………………………………………………………………...26
Figura 4 - Manipulação de dados em um data warehouse………………………….…27
Figura 5 - Valores históricos de um data warehouse…………………………………..27
Figura 6 – Logotipo da Brasil Telecom…………………………………………………..45
Figura 7 – Logotipo da iG.........…………………………………………………………..47
Figura 8 – Logotipo da ANVISA…………………………………………………………..48
Figura 9 – Logotipo da Sefaz-SP.………………………………………………………..50
6

LISTA DE GRÁFICOS

Gráfico 1 – Gráfico demonstrando a satisfação de um grupo de usuários com a


implantação de um data warehouse ………………………………………….........…...53
7

LISTA DE QUADROS

Quadro 1 – Data Mart x Data Warehouse……………………………………………….30


Quadro 2 – Comparação entre SIG, SAD e SIE........................................................41
8

LISTA DE SIGLAS

BI – Business Inteligence
DM – Data Mart
DW – Data Warehouse
ERP - Enterprise Resource Planning
OLAP – On-line Analytical Processing
OLTP – On-line Transactional Processing
SAD - Sistemas de Apoio à Decisão
SGBD – Sistema de Gerenciamento de Bancos de Dados
SIE - Sistema de Informações Executivas
SIG - Sistema de Informações Gerenciais
SPT - Sistema de Processamento de Transações
TI – Tecnologia da Informação
9

SUMÁRIO

RESUMO..................................................................................................10
ABSTRACT..............................................................................................11
CAPÍTULO I - INTRODUÇÃO..................................................................12
1.1 DEFINIÇÃO DO PROBLEMA......................................................13
1.2 OBJETIVOS ................................................................................13
1.2.1 Objetivo geral.........................................................................13
1.2.2 Objetivos específicos .............................................................13
1.3 JUSTIFICATIVAS........................................................................14
CAPÍTULO II – REFERENCIAL TEÓRICO .............................................16
2.1 PROCESSO DE TOMADA DE DECISÃO...................................16
2.1.1 O que é Tomada de Decisão .................................................16
2.1.2 Elementos do Processo de Tomada de Decisão ...................17
2.1.3 O Poder e a Importância das Decisões .................................18
2.2 A EVOLUÇÃO DOS SISTEMAS DE APOIO À DECISÃO...........19
2.3 DATA WAREHOUSE ..................................................................23
2.3.1 Histórico.................................................................................23
2.3.2 Conceitos Básicos .................................................................24
2.3.3 Data Mart ...............................................................................29
2.3.4 Metadados .............................................................................31
2.3.5 Extração, Transformação e Carga dos Dados (ETL).............32
2.3.6 Data Mining............................................................................33
2.3.7 Principais Ferramentas Utilizadas em um Data Warehouse..34
2.3.8 OLTP x OLAP ........................................................................35
2.3.9 Data Warehouse x SIG x SAD x SIE .....................................38
CAPÍTULO III - METODOLOGIA .............................................................43
3.1 TIPO DE PESQUISA...................................................................43
3.2 AMOSTRA DA PESQUISA .........................................................43
3.3 INSTRUMENTO ..........................................................................44
CAPÍTULO IV – RESULTADOS E DISCUSSÃO.....................................45
CAPÍTULO V - CONCLUSÕES ...............................................................53
REFERÊNCIAS........................................................................................56
10

RESUMO

O contexto em que se vive atualmente demanda das organizações uma capacidade de analisar,
planejar e reagir rapidamente para poder acompanhar ou superar as exigências dos clientes. A todo o
momento, uma grande quantidade de informações, sobre os mais variados aspectos dos negócios da
empresa, é gerada, armazenada, passando a fazer parte da base de conhecimento. Entretanto,
esses dados estão espalhados por vários sistemas de difícil integração, sem qualidade e
indisponíveis para os gerentes e altos executivos que são os tomadores de decisões estratégicas das
organizações. Para suprir essa deficiência surgiu o Data Warehouse (DW), que se constitui de um
conjunto de arquiteturas e/ou sistemas de informação orientados a assunto, manipulando grande
volume de dados, principalmente históricos, e dão origem a consultas invariavelmente não
previsíveis, que tem por objetivo dar suporte a esses processos. O presente estudo tem por objetivo
apresentar o estado da arte da tecnologia de Data Warehouse, introduzindo os principais conceitos
na área, procurando enfatizar a importância de sua utilização para garantir agilidade e segurança na
tomada de decisão nas organizações.

Palavras-chave: Data Warehouse, Data Mart, Sistemas de Apoio a Decisão


11

ABSTRACT

Nowadays, the existing context demands from organizations a capacity of rapidly analyzes, plan and
react, so they can follow or surpass client’s requirements. In every moment, a great amount of
information about the most different aspects of the company business is generated, stored and
becomes part of the knowledge basis. However, these data are spread in several systems of difficult
integration, without quality and unavailable for the managers and high level businessmen that take
strategic decisions on organizations. To supply this deficiency, it came out the Data Warehouse (DW),
that is constituted by a group of architectures and/or subject oriented information system that exists in
platforms segregated from the transactional environment, manipulating a great volume of data, mainly
historical, and invariably originate unexpected searches, that aims to give support to these process.
This course presents the current state of Data Warehouse technology, introducing the main issues in
that area and discussing, trying to emphasize the importance of its utilization to guarantee agility and
security in decisions on organizations.

Key words: Data Warehouse, Data Mart, Decision Support Systems.


12

CAPÍTULO I

INTRODUÇÃO

Atualmente, em muitas empresas, o processo manual de produção de


informações gerenciais é demorado, dispendioso e cansativo, pois reúne uma
grande quantidade de dados que precisam ser coletados de diversas fontes e
convertidos em um formato apropriado que possibilite a sua análise. Por isso, a
criação de um ambiente de data warehouse surge como uma alternativa viável. Seu
princípio está na criação de um banco de dados especializado, capaz de manipular
grande volume de informações com bom desempenho, melhorando a gerência, o
controle e o acesso aos dados. A função do data warehouse é tornar as informações
corporativas, obtidas a partir de bancos de dados operacionais e de fontes de dados
externas à organização, acessíveis para entendimento e uso das áreas estratégicas.
Tendo isso em vista, o estudo visa analisar a tecnologia de data
warehouse no âmbito do processo decisório. Entende-se como relevante a
contextualização do fenômeno data warehouse no contexto da tomada de decisão
visto que a revolução da tecnologia da informação vem afetando diretamente as
estratégias empresariais.
Este estudo apresenta no Capítulo II uma pesquisa bibliográfica
abordando a relevância do data warehouse no processo de tomada de decisão.
Nesse capítulo é introduzido ainda o conceito de tomada de decisão, seu histórico e
sua evolução e finalizando, apresenta os conceitos e ferramentas relacionados ao
data warehouse.
No capítulo III são apresentados a metodologia e o método que se
aplicaram na pesquisa. Constam ainda a discussão dos resultados no Capítulo IV e,
finalmente, a conclusão no Capítulo V.
13

1.1 DEFINIÇÃO DO PROBLEMA

O requerimento de informações tem aumentado a cada dia que passa. Os


altos executivos necessitam constantemente de informações tempestivas e
confiáveis, normalmente construídas a partir de dados de diferentes origens, para
que as organizações possam sobreviver em um mundo competitivo.
O processo decisório está cada vez mais complexo, pois necessita
relacionar informações diversas que devem ser obtidas em curto espaço de tempo,
ao passo que os dados disponíveis foram gerados e armazenados para atender a
sistemas de controle operacionais e isolados, sejam em organizações
governamentais ou não.
Diante do contexto atual onde o foco é o Cliente, a organização tem que
se estruturar para oferecer soluções para o êxito das decisões e operações das
áreas gerenciais e estratégicas da organização, com inovação, qualidade e
segurança. Um Data Warehouse, criado com esta filosofia, está interagindo neste
novo mercado: o de informação para tomada de decisão nos níveis gerencial e
estratégico da organização. Diante disso, qual a importância de um Data Warehouse
no processo de tomada de decisão de uma organização?

1.2 OBJETIVOS

1.2.1 Objetivo geral

O presente estudo visa analisar a importância de um Data Warehouse no


processo de tomada de decisão, ressaltando os impactos positivos e negativos da
sua implantação em uma organização.

1.2.2 Objetivos específicos

O trabalho proposto tem como objetivos específicos:


Analisar as dificuldades existentes no processo de tomada de
decisão da organização;
Identificar e relacionar as principais ferramentas existentes que
visam dar suporte à tomada de decisão;
14

Apresentar conceitos básicos relacionados ao Data Warehouse,


sistemas de informação e processo decisório;
Identificar os ganhos obtidos pelas organizações que implantaram
um Data Warehouse;
Analisar como o Data Warehouse suporta o processo decisório.

1.3 JUSTIFICATIVAS

As empresas possuem áreas de TI muito diversificadas umas das outras.


Essas diferenças podem aumentar ainda mais quando envolvidas as infra-estruturas
de cada uma. Servidores, sistemas de armazenamento, estrutura de rede, softwares
operacionais e serviços diversos fazem da infra-estrutura uma identidade da
empresa, uma forma quase única como os recursos computacionais são utilizados e
como as informações trafegam na organização.
Uma boa infra-estrutura de TI deve amparar o tratamento,
armazenamento e trânsito das informações, de forma que todos os sistemas
informacionais da empresa e serviços funcionem sobre ela com rapidez e
integridade. O negócio da empresa depende dessa infra-estrutura que pode ser a
diferença entre o sucesso e o fracasso de um projeto. Lentidão das informações
para clientes internos, indisponibilidade para clientes externos, negação de acesso
para gerentes de negócio, falta de recursos de armazenamento para determinada
equipe, entre tantos outros problemas, podem ocasionar na descrença da área de TI
para o resto da empresa, e, o que é pior, a falta de credibilidade dos clientes
externos, incluindo a própria sociedade, no caso de uma instituição do governo.
Em grande parte das organizações as informações de suporte à decisão
são derivadas de sistemas de informações não integrados, tais como: sistemas
corporativos, gerenciais, estatísticos, e em muitos casos, através de planilhas
eletrônicas, ferramentas estatísticas e outras. Geralmente, esses sistemas utilizam
tecnologias de informação diferentes, sendo os dados coletados, preparados,
armazenados por diferentes indivíduos, em lugares, épocas e formatos diferentes.
Esses dados são voláteis ou mal persistidos, deixando de ser fontes históricas. O
acesso restrito e a documentação desatualizada ocasionam a retenção das
15

informações pelas pessoas envolvidas diretamente com o sistema, o que dificulta a


análise tempestiva (eventual e a tempo) para uma tomada de decisão imediata.
Com isso, o acesso aos dados corporativos torna-se difícil devido à falta
de integração dessas bases. A carência de uma base de conhecimento única leva
os analistas a malabarismos, quando da necessidade de geração de informações
para suporte à tomada de decisão, gerando retardo na resposta aos usuários.
Tendo em vista a dificuldade de acesso a essas informações, de acordo
com Navarro (1996), muitas organizações estão utilizando as tecnologias de Data
Warehouse como agente integrador de diversas fontes de informações. Segundo o
autor, o resultado consiste em ter informações disponibilizadas de forma agregada,
desagregada, resumida, sintetizada ou primitiva, com acesso rápido e fácil,
escalabilidade e segurança formando uma infra-estrutura de base de dados
apropriada para os Sistemas de Suporte à Decisão (DSS).
Portanto, tecnologias como o Data Warehouse estão se tornando
essenciais nas organizações. Tudo isso, apesar das variadas pesquisas e trabalhos
existentes sobre o assunto, e ainda o interesse do autor em trabalhar com Data
Warehouse servem para justificar e mostrar a relevância do tema.
16

CAPÍTULO II

REFERENCIAL TEÓRICO

Atualmente vive-se numa era onde o conhecimento e a informação são


bens valiosos para que uma organização se destaque em um mundo cada vez mais
competitivo. Neste contexto, o presente estudo descreve a abordagem conceitual
sobre o processo de tomada de decisão, destacando-se os elementos desse
processo e a importância e poder das decisões, a evolução dos sistemas de Apoio à
Decisão e por fim, o Data Warehouse.

2.1 PROCESSO DE TOMADA DE DECISÃO

O processo de tomada de decisões nas organizações está se


transformando rapidamente nos últimos anos, sobretudo pela velocidade do avanço
da tecnologia da informação e de comunicações.
Segundo Murakami (2003), pesquisas mostram que as decisões
envolvendo aspectos estratégicos de organizações estão falhando, em geral por
falta de instrumentos racionais e objetivos que auxiliem os executivos na tomada de
decisões.

2.1.1 O que é Tomada de Decisão

Um processo de Tomada de Decisão, segundo Thomaz (2000 apud


MURAKAMI, 2003, p.39), é um sistema complexo de relações em que há elementos
de natureza objetiva, próprios de ações, e elementos de natureza claramente
subjetiva, próprio do sistema de valores dos atores. Este sistema é indivisível e,
logo, qualquer metodologia de apoio ao processo de tomada de decisão não pode
negligenciar nenhum desses dois aspectos. O autor reforça que a objetividade é
17

importante num processo decisório, contudo, não se deve esquecer que a tomada
de decisão é uma atividade desempenhada por pessoas, portanto, a subjetividade
está sempre presente, ainda que não seja apresentada clara ou explicitamente. Com
isso, qualquer metodologia de apoio à decisão deve suportar a subjetividade
inerente ao processo decisório.
Segundo March (1994), a tomada de decisão é uma atividade que
interpreta uma ação como uma escolha racional. Neste caso, o termo racional é,
normalmente, interpretado como equivalente a “inteligente” ou “bem sucedido”, o que
descreve que as ações foram bem sucedidas. O autor define a racionalidade como
um particular e muito familiar conjunto de procedimentos para fazer escolhas.
O autor considera que um procedimento racional é aquele que segue uma
lógica da conseqüência.
Definitivamente, é preciso aceitar que a subjetividade está onipresente
nos processos de tomada de decisão.
Em 1954, Simon (1977) já defendia a idéia de que o modo mais adequado
para se estudar a resolução de problemas era simular essa situação com programas
computacionais. A partir de então, Simon vem pesquisando a associação dos
recursos computacionais ao comportamento do homem e tornou-se o primeiro
cientista a abordar o conceito de Inteligência Artificial.

2.1.2 Elementos do Processo de Tomada de Decisão

Russo e Schoemaker (1993) dividem o processo de tomada de decisão


em quatro elementos principais. Segundo os quais, “todo o bom tomador de
decisões deve, conscientemente ou inconscientemente, passar por cada um deles”.
São eles:
1. Estruturar: Significa definir o que deve ser decidido e determinar que
critérios o fariam preferir uma opção em relação a outra;
2. Colher informações: trata-se de procurar fatos reconhecíveis como as
estimativas razoáveis a respeito dos “não-reconhecíveis”, necessários para tomar
decisões;
3. Chegar a conclusões: segundo os autores, uma estruturação perfeita e
boas informações não garantem uma decisão correta. As pessoas não podem tomar
18

conscientemente boas decisões usando apenas critérios intuitivos, mesmo dispondo


de dados excelentes;
4. Aprender (ou deixar de aprender) com o feedback: significa que o
tomador de decisões deve manter o acompanhamento daquilo que se esperava que
acontecesse, resguardando-se sistematicamente das explicações egoístas e
assegurando-se de rever as lições produzidas pelo feedback na próxima vez que
surgir uma decisão semelhante.
A abordagem de Russo e Schoemaker (1993) em relação às demais
abordagens destaca-se especialmente na estruturação e o aprendizado com o
processo de feedback.
Outro elemento que determina a decisão a ser tomada é a intuição. Russo
e Schoemaker (1993) explicam que a intuição é o ato que o tomador de decisão
processa parte ou todas as informações que possui de maneira rápida e automática,
sem conscientizar-se de qualquer detalhe. Essas decisões raramente levam em
conta todas as informações disponíveis. Elas sofrem inconsistências. É importante
observar que decisões intuitivas são afetadas não só pelas evidências que deveriam
influenciar a escolha, mas também por fatores como fadiga, distrações ou
lembranças. Naturalmente tem uma vantagem: ela é rápida em relação à tomada de
decisões com métodos sistemáticos. A recomendação é que todos devem decidir
intuitivamente, porém para pequenas questões que não sejam estratégicas.

2.1.3 O Poder e a Importância das Decisões

Em virtude da globalização e do avanço das tecnologias da informação e


de comunicação, as informações estão se difundindo mais rapidamente e a
concorrência está cada vez mais acirrada.
Este novo cenário faz com que as decisões sejam cada vez mais
acuradas e rápidas. Para ajudar a melhorar a qualidade da tomada de decisões,
diversos estudos vêm sendo desenvolvidos na área de processo decisório.
Baseado em estudos, Simon (1977) afirma que tomar decisão é o trabalho
mais importante de qualquer executivo e também, o mais duro e mais arriscado. De
acordo com o autor, não basta que apenas o executivo tome as decisões mas que
esteja atento para que toda a organização que dirige tome-as de maneira efetiva. A
19

maior parte das decisões pelas quais é responsável não são suas mas sim de
subordinados.
Às vezes é melhor deixar de tomar a decisão do que tomar a decisão
errada. Decisões ruins podem prejudicar um negócio e uma carreira, às vezes de
forma irreparável. Tomar a decisão errada pode ser conseqüência do modo como
ela foi tomada, ou seja, as alternativas não estavam claramente definidas, a
informação certa não foi coletada, os custos e benefícios não foram pesados com a
devida precisão, afirmam Hammond, Keeney e Raiffa (1998).
Para Nutt (2002 apud MURAKAMI, 2003, p.36), o pior modo para se
alcançar uma decisão é impor suas idéias na organização. Baseado em estudos,
Nutt mostra que grande parte das decisões são impostas na organização. A maioria
tomou suas decisões por meio de persuasão ou por meio de determinação, que de
acordo com Nutt, cada uma dessas fórmulas é um atalho para o fracasso.

2.2 A EVOLUÇÃO DOS SISTEMAS DE APOIO À DECISÃO

Segundo Sprague e Watson (1991) no início da década de 70, várias


empresas e grupos de pesquisas iniciaram o estudo e desenvolvimento de Sistemas
de Apoio à Decisão. Estes passaram a ser considerados como sistemas
computacionais interativos que auxiliavam no processo decisório de problemas
considerados não estruturados. Porém, segundo os autores, na década seguinte,
vários pesquisadores e desenvolvedores de sistemas, ampliaram a definição destes
sistemas de modo a incluir qualquer sistema capaz de dar alguma contribuição ao
processo decisório, desde que possuam as seguintes características:
serem voltados para problemas menos estruturados e menos
especificados com os quais os gerentes deparam;
combinem o uso de modelos ou técnicas analíticas a funções
tradicionais de acesso e recuperação das informações;
concentrem-se especificamente em recursos que facilitem seu uso
para pessoas que não são da área de Tecnologia da Informação e
enfatizem a flexibilidade e a adaptabilidade de acomodar
mudanças no ambiente e na abordagem do processo decisório.
20

Os primeiros Sistemas de Apoio à Decisão (SAD), conforme Costa (1997)


surgiram nos anos 60 e 70, para dar suporte aos gerentes na solução de problemas
gerenciais não estruturados. Estes SADs eram muito caros, de uso muito específico
e difíceis de operar. Nesta época o mercado era estável para as empresas, havia
menos concorrência e existia a fidelidade dos clientes. O grande problema, naquele
período, era que as bases de dados dos sistemas computacionais não possuíam a
arquitetura necessária para a realização de pesquisas típicas de Sistemas de Apoio
à Decisão e, devido à falta de dados históricos, existia muita dificuldade para a
criação de relatórios e para se realizar as análises necessárias ao gerenciamento
dos negócios.
Neste período, os sistemas computacionais para o suporte à decisão
eram desenvolvidos na própria empresa ou por terceiros, conforme Bispo (1998).
Segundo o autor, estes sistemas eram desenvolvidos inicialmente para auxiliar a
resolver problemas gerenciais específicos na empresa, depois, eram aperfeiçoados
para englobar outros problemas gerenciais. Porém, nenhum destes sistemas
conseguiu dar um bom suporte ao dinâmico processo de tomada de decisão,
fornecendo as informações necessárias e no momento certo. Estes sistemas se
tornavam imensos, complexos e não conseguiam acompanhar as mudanças das
necessidades gerenciais. Tornavam-se difíceis de usar e de se fazer sua
manutenção. Além disso, requeriam um orçamento significativamente grande.
Somente nos anos 80, quando surgiram os primeiros Sistemas de
Gerenciamento de Banco de Dados (SGBD), é que se tornou possível um melhor
acesso aos dados disponíveis, à sua formatação e à construção de consultas e
relatórios de uma forma mais prática, rápida e barata. Porém, sempre que era
necessária uma análise mais sofisticada dos dados, esta análise era realizada de
forma “artesanal”, ou seja, os dados eram colecionados, depois formatados,
conforme necessário, e só então, eram feitas as análises necessárias, muitas vezes
fora de qualquer sistema computacional. Com a chegada ao mercado de novos
softwares, como as planilhas eletrônicas e os programas de visualização gráfica dos
dados, estas atividades se tornaram menos complexas. Mas, ainda faltava
desenvolver uma ferramenta que realmente auxiliasse os gerentes no processo de
tomada de decisão, que facilitasse a visão e a análise dos negócios e que lhes
fornecesse as informações de modo fácil, rápido e confiável.
21

Apesar dos avanços obtidos, ainda existia o grande problema de que a


modelagem dos dados era baseada na estrutura dos processos ao invés de na
estrutura dos negócios (BISPO, 1998). Isto facilitava bastante o gerenciamento das
atividades operacionais e dificultava o gerenciamento das atividades gerenciais. Era
difícil se elaborar um relatório que contivesse uma análise, cruzando informações de
sistemas diferentes, o que era frequentemente necessário aos gerentes. Quando era
necessário se obter este tipo de relatório, o mesmo era confeccionado
artesanalmente, o que se tornava lento, dispendioso e nem sempre confiável,
atrasando o processo decisório. Muitas vezes o setor de desenvolvimento de
sistemas se propunha a desenvolver sistemas que resolvessem tais problemas, mas
o desenvolvimento destes sistemas era tão dispendioso e demorado, que muitas
vezes quando ficavam prontos, já não atendiam mais as necessidades dos gerentes.
De acordo com Bispo (1998), nesta época começaram a surgir os
primeiros sistemas, especialmente desenvolvidos para os gerentes, os chamados
Sistemas de Informação para Executivos (SIE). Porém o gerenciamento das
empresas e negócios estava evoluindo mais rapidamente que estes sistemas.
No início da década de 90, segundo The e Weldon (1998 apud BISPO,
1998, p.13), surgiram as ferramentas CASE e as linguagens de quarta geração.
Estas ferramentas prometiam resolver os problemas dos usuários finais que
precisavam de informações rápidas e não tinham tempo disponível para desenvolver
sistemas que atendessem as suas necessidades, possibilitando o desenvolvimento
de sistema de forma mais rápida e simples. Enquanto que as linguagens de quarta
geração permitiam ao usuário elaborar relatórios e realizar consultas de uma
maneira mais rápida e prática. Porém, ambas as ferramentas não eram versáteis o
suficiente para conseguir atender a todas as necessidades gerenciais. Eram
fortemente baseadas na manipulação, navegação e estruturação dos dados, mas
eram pobres em análises sofisticadas. Para tentar suprir esta carência as planilhas
eletrônicas forneciam maneiras fáceis de gerar gráficos. Contudo, ainda não
conseguiam atender a todas as necessidades dos gerentes que gastavam mais
tempo manipulando dados e construindo modelos do que realizando as análises
necessárias.
Com o decorrer do tempo, as empresas foram crescendo, os negócios
foram aumentando, o que aumentou o volume de dados armazenado. Houve a
necessidade de se aumentar o número de gerentes ou de se dividir as tarefas de
22

gerenciamento em níveis gerenciais. Isso fez com que a necessidade de análise dos
dados crescesse e ainda criou a necessidade de respostas mais rápidas, confiáveis
e que melhor se adaptassem às necessidades do gerenciamento da empresa e dos
negócios.
A globalização, que devido à velocidade que as informações chegam ao
outro lado do planeta e as exigências cada vez maiores dos clientes, fez com que a
concorrência aumentasse espantosamente a nível mundial. Com isso, tem-se um
cenário onde existe intensa e constante pressão sobre os gerentes, para conhecer
melhor seus negócios e clientes. Como conseqüência, houve um aumento das
necessidades gerenciais, novos tipos de consultas e de análises nos dados
passaram a ser necessárias, e, portanto, novos sistemas que dessem um melhor
suporte ao processo decisório precisavam ser elaborados.
Ainda nesta década, surgiram diversos sistemas para dar suporte à
tomada de decisão nas organizações. Entre estas novas ferramentas, segundo
Bispo (1998), está a ferramenta para gestão integrada da empresa, o Enterprise
Resource Planning (ERP) e a nova geração de Sistemas de Apoio à Decisão: o Data
Warehouse, o OLAP e o Data Mining. A ferramenta ERP é utilizada para o
gerenciamento no ambiente operacional da empresa, enquanto as três novas
ferramentas estão sendo utilizadas no ambiente gerencial. Estas ferramentas
revelam-se muito úteis no gerenciamento moderno dos negócios e estão auxiliando
os gerentes a enfrentar os desafios dos novos tempos.

Com o surgimento das ferramentas Data Warehouse e OLAP, as


consultas e os relatórios passaram a ser elaborados pelos próprios usuários, sem
ser preciso ter um conhecimento mais profundo em tecnologia da informação. Bispo
(1998) destaca que, a elaboração dos mesmos torna-se mais rápida, barata,
confiável e facilmente adaptável aos modelos dos negócios. O uso dessas
ferramentas faz com que os gerentes gastem um tempo bem menor manipulando os
dados e construindo os modelos necessários para as análises, permitindo-lhes usar
melhor seu tempo para as análises necessárias e a geração de soluções para seus
problemas.
23

2.3 DATA WAREHOUSE

2.3.1 Histórico

Segundo Singh (2001), a década de 1990 trouxe um problema de


supersaturação ao mundo dos negócios e do governo. A capacidade para
armazenar e coletar dados conseguiu acompanhar esse crescimento, porém a
obtenção de informações úteis sobre esse volume de dados parece ter ultrapassado
a capacidade de analisá-los (figura 1).

Figura 1: Excesso de informações


Fonte: Singh (2001)

De acordo com o autor, o volume de dados está dobrando a cada dois


anos, significando que o problema será incrementado por uma ordem de magnitude
dentro de quatro ou cinco anos. À medida que a tomada de decisão dispõe cada vez
de menos tempo, as organizações que não utilizarem meios eficientes para analisar
as informações contidas nestes dados serão, cada vez menos competitivas.
Os métodos tradicionais de acesso e análise dos dados, baseados na
tecnologia de bancos de dados relacionais, embora consigam pesquisar e manipular
24

grandes volumes de dados, ainda não permitem analisar e entender, em tempo


hábil, esse imenso volume de dados, ou como ressalta Singh (2001), essa
supersaturação de dados.
Dentro deste contexto, uma nova geração de técnicas, produtos e
serviços que permitam a extração e manipulação automatizada de dados e
descoberta de conhecimento faz-se necessária.

2.3.2 Conceitos Básicos

De forma simples pode-se definir um Data Warehouse como sendo um


grande banco de dados derivado de outros bancos de dados operacionais cujo
propósito principal é dar suporte ao processo decisório. É considerado a evolução
dos SADs que surgiu a partir das facilidades providas pelas tecnologias de bancos
de dados cliente/servidor.
William H. Inmon, um dos precursores da ferramenta, a define da seguinte
forma: “Um Data Warehouse é um conjunto de dados baseado em assuntos,
integrado, não volátil, e variável em relação ao tempo, de apoio às decisões
gerenciais.” (INMON, 1997, p. 33). Segundo o autor, a ferramenta é:

2.3.2.1 Orientada por assunto

A primeira característica de um Data Warehouse é que ele é orientado


aos principais assuntos ou negócios da empresa como clientes, vendas, produtos,
apólices, tratamentos, seguros, viagens, etc., enquanto os sistemas de informações
tradicionais são orientados a processos como estoques, entradas e saídas de
materiais, compras e vendas, faturamento, contabilidade, etc. A Figura 2 mostra o
contraste entre os dois tipos de orientações.
25

Figura 2: Data warehouse orientado por assunto


Fonte: Sowek (2003)

Os sistemas operacionais estão preocupados com o desenho de


processos e de banco de dados. O Data Warehouse está focado exclusivamente na
modelagem de dados e desenho do banco de dados. Desenho de processos (como
é na forma clássica) não é parte de um ambiente de Data Warehouse, afirma Sowek
(2003).

2.3.2.2 Integrado

O mais importante aspecto do ambiente de Data Warehouse é que dados


criados dentro de um ambiente de Data Warehouse são integrados, ou seja, a
ferramenta trabalha de forma a padronizar os termos e as estruturas técnicas que
são utilizados nos sistemas de informações tradicionais. Por exemplo, nestes
diversos sistemas o sexo pode ser armazenado como: “m” ou “f”, “0” ou “1”, “x” ou
“y”, “macho” ou “fêmea”, “homem” ou “mulher” e outras formas. No Data Warehouse
apenas uma destas formas poderá aparecer padronizando esta referência.
26

Figura 3: Integração de dados em um data warehouse a partir de outras aplicações


Fonte: Sowek (2003)

Como mostra a figura 3, o uso da integração afeta sempre alguns


aspectos do projeto, as características físicas do dado, o dilema de ter mais de uma
fonte do dado, o uso de padrões de nomes inconsistentes, formatos de dados
inconsistentes, e assim por diante.

2.3.2.3 Não volátil

No ambiente operacional, os dados sofrem as alterações necessárias


como: incluir, alterar ou excluir dados; porém, no Data Warehouse os dados
permitem apenas duas operações: a inclusão e a consulta, os dados nunca são
alterados ou excluídos. A figura 4 ilustra este aspecto no Data Warehouse.
27

Figura 4: Manipulação de dados em um data warehouse


Fonte: Sowek (2003)

A figura acima mostra que atualizações - inclusão exclusão e alteração –


de registro são feitas regularmente no ambiente operacional. Mas a manipulação de
dados que ocorre no Data Warehouse é mais simples, pois, existem somente dois
tipos de operações - a carga inicial do dado, e o acesso ao dado.

2.3.2.4 Variável no tempo

A última característica é variável no tempo, ou seja, a estrutura dos dados


do Data Warehouse sempre contém algum elemento de tempo, enquanto nos
sistemas de informações tradicionais isso não acontece necessariamente.

Figura 5: Valores históricos de um data warehouse


Fonte: Sowek (2003)
28

A figura 5 mostra os valores históricos do dado no warehouse. Os valores


históricos dos dados no Data Warehouse são mostrados em várias maneiras. O
modo mais simples é que o dado no Data Warehouse representa os dados sobre um
horizonte de tempo distante - de 5 até 10 anos. O horizonte de tempo representado
pelo ambiente operacional é muito curto – de 60 a 90 dias.
O segundo modo que "histórico" é mostrado no Data Warehouse é na
estrutura chave. Sempre na estrutura chave do Data Warehouse existe -
explicitamente ou implicitamente - um elemento de tempo, assim como dia, semana,
meses, etc. O elemento de tempo está quase sempre no final da chave concatenada
criada no Data Warehouse.
A terceira maneira que "histórico" aparece no Data Warehouse, os dados
não podem ser atualizados. Dado no Data Warehouse e, para todos os propósitos
práticos, é uma série longa de snapshots. Naturalmente se os snapshots do dado
foram feitos incorretamente, eles não são corrigidos.

Um Data Warehouse é um sistema complexo que pode integrar diversos


componentes como: computadores pessoais, sistemas SAD e SIE, redes de
comunicação, servidores, mainframes e diferentes SGBD, assim como pessoas da
organização com conhecimentos, poder de decisão e objetivos diferentes.
Um termo bastante usado pelos usuários é o data warehousing que,
segundo Bispo (1998, p. 37): “é o processamento dos dados dos bancos de dados
fontes até o armazenamento final no Data Warehouse, assim como o
processamento dos dados durante as consultas e análises.”
Muitas vezes informações que poderão dar suporte à tomadas de
decisões estão armazenadas nas próprias bases de dados das empresas. Mas,
como na maioria dos casos esta base não está bem organizada, existe uma grande
dificuldade para que informações estratégicas cheguem até quem toma as decisões.
Esse talvez seja o principal motivo que está fazendo do Data Warehouse um dos
centros de atenção do mundo corporativo, pois esta tecnologia oferece organização,
gerenciamento e integração dos dados da corporação. Dessa forma não é preciso
confrontar várias aplicações em busca de uma inteligência nos negócios, basta usar
ferramentas analíticas apropriadas. As principais ferramentas que compõem o Data
Warehouse serão abordadas mais adiante.
29

O data warehouse, por ser uma solução tecnológica complexa, a qual


requer o envolvimento de toda a organização, muitas vezes torna-se inviável a sua
implantação. Com isso, inicialmente algumas empresas optam pelos data marts que
podem se tornar o pontapé inicial do desenvolvimento de um data warehouse. Os
data marts serão discutidos no próximo tópico.
A diminuição do tempo que os gerentes levam para obter as informações
necessárias aos seus processos decisórios, através da eliminação de tarefas
operacionais como a pesquisa e a identificação dos dados necessários, é um dos
grandes benefícios proporcionados pelo Data Warehouse. Como o ambiente de
negócios está se tornando cada vez mais dinâmico, é extremamente necessário que
as regras de negócios sejam incorporadas às aplicações, que as estruturas dos
sistemas computacionais se ajustem aos negócios e que o tempo de resposta
destes sistemas seja cada vez menor.

2.3.3 Data Mart

Os data marts (DM) podem ser considerados data warehouses


departamentalizados; filosoficamente, são bastante semelhantes àqueles, porém
com algumas características peculiares, como por exemplo menor volume de dados
e padrão de uso bastante previsível - necessitam tecnologia mais simples e barata,
face a esse menor volume e a esse padrão previsível, e tem poucos dados
detalhados. Segundo Kimbal (1998), os data marts são muito interessantes para
resolver certos problemas, mas não são necessariamente substitutos de um projeto
de data warehouse. O autor ressalta que um data mart não deve ser um pequeno
data warehouse, com a finalidade de ser rápido ou possuir dados ainda não
ajustados para o data warehouse.
Durante algum tempo, esses data marts independentes foram muito
populares. Mas, logo sua arquitetura se mostrou falha: quando uma corporação
construía vários desses data marts, o volume de redundância de dados (quase
sempre dados analíticos) crescia muito, como crescia o número de programas que
faziam a interface entre essas estruturas e os sistemas legados; também cresciam
os recursos de hardware envolvidos.
Os data marts têm muito apelo, porque eles podem ser construídos de
forma simples, rápida e barata - já se fala inclusive em "canned data marts", ou "data
30

marts enlatados", que seriam ferramentas extremamente simples e baratas,


destinadas a atender a necessidades bastante estruturadas (RADDING, 1999).
Já do ponto de vista da organização, o problema maior talvez seja o de
existirem áreas tomando decisões a partir de números diferentes, gerados em
função da redundância e da falta de integração dos dados - seja por erros, seja por
diferentes graus de atualização ou critérios de tratamento de dados (o exemplo
clássico, embora possa não ser o melhor para esse tema, é o arredondamento
versus truncamento de valores).
Constatada essa realidade, percebeu-se que os data marts
independentes não eram a solução, evoluindo-se então para o conceito de data
marts dependentes. Em uma arquitetura desse tipo, há um warehouse central que
alimenta os marts dependentes; é chamada também arquitetura "hub-and-spoke"
(cubo-e-raio), onde os marts são os raios e o warehouse, o cubo. Como vantagens
dessa estrutura, apresentam-se a integração de dados no cubo, a autonomia de
processos e nenhuma redundância de dados nos raios.
A tabela abaixo traz um breve comparativo entre data mart e data
warehouse:

Data Mart Data Warehouse


Departamental Corporativo
Alto nível de granularidade Baixo nível de granularidade
Pequena quantidade de dados históricos Grande quantidade de dados históricos
Tecnologia otimizada para acesso e análise Tecnologia otimizada para armazenamento
e gerenciamento de grandes volumes de
dados
Cada departamento tem uma estrutura Estrutura se adapta ao entendimento
diferente corporativo dos dados
Quadro 1 – Data Mart x Data Warehouse
Fonte: Inmon (1999)
31

2.3.4 Metadados

Os metadados são definidos como dados dos dados, informações das


informações. Dada a complexidade das informações de um Data Warehouse, a
documentação dos sistemas e dos bancos de dados tornou-se de vital importância.
Este tipo de registro já era tido como muito importante desde o surgimento dos
primeiros bancos de dados. Com o Data Warehouse, isto se tornou fundamental,
pois sendo um projeto gigantesco, se não houver uma documentação eficiente,
ninguém conseguirá entender mais nada.
Num projeto de Data Warehouse, deve-se gerar documentação sobre o
levantamento de dados, do banco de dados, relatórios a serem gerados, origem dos
dados que alimentam o DW, processos de extração, tratamento e rotinas de carga
dos dados, além de, possivelmente, regras de negócio da empresa e todas suas
mudanças.
Segundo Inmon (1998), os metadados englobam o DW e mantém as
informações sobre o que está armazenado. O autor ainda define quais informações
os metadados mantém:
Os dados referentes aos relatórios que são gerados pelas
ferramentas OLAP;
A estrutura dos dados segundo a visão do programador;
A estrutura dos dados segundo a visão do analista de SAD;
A fonte de dados que alimenta o Data Warehouse;
A transformação sofrida pelos dados no momento de sua migração
para o Data Warehouse;
O modelo de dados;
O relacionamento entre o modelo de dados e o Data Warehouse;
O histórico das extrações de dados;

Os metadados podem surgir de vários locais durante o decorrer do


projeto. Desde o material originado das entrevistas com os usuários até
documentação dos sistemas operacionais. Aliás, as entrevistas muitas vezes
tornam-se uma fonte preciosa de informações, pois muitos dados levantados não
estão (e não estariam) documentados em nenhum outro lugar.
32

Como pudemos ver, o volume de metadados gerado é muito grande.


Existem hoje algumas ferramentas que fazem única e exclusivamente o
gerenciamento dos metadados. Elas têm algumas características peculiares. Essas
ferramentas conseguem mapear o dado em todas as etapas de desenvolvimento do
projeto, desde a conceitual até a de visualização dos dados em ferramentas
OLAP/SIE.
A regra da boa implementação de um projeto de DW reza que devemos
sempre nos preocupar com os metadados, pois são eles que servirão de guia por
entre as brumas das tabelas, relatórios e dados quando estivermos perdidos.

2.3.5 Extração, Transformação e Carga dos Dados (ETL)

A etapa de ETL é uma das mais críticas de um projeto de DW, pois uma
informação carregada erroneamente trará conseqüências imprevisíveis nas fases
posteriores. O objetivo desta fase é fazer a integração de informações de fontes
múltiplas e complexas. Basicamente, divide-se esta etapa em três passos: extração,
transformação e carga dos dados. Embora existam hoje em dia ferramentas que
auxiliam na execução do trabalho, ainda assim é um processo trabalhoso, complexo
e também muito detalhado.
Carga. Num processo de ETL, primeiramente deve-se definir as origens
das fontes de dados e fazer a extração deles. As origens deles podem ser várias e
também em diferentes formatos, onde podem-se encontrar desde os sistemas
transacionais das empresas até planilhas, arquivos textos e também arquivos DBF
(dBase) ou do Microsoft Access.
Limpeza. Definidas as fontes, parte-se para o segundo passo que
consiste em transformar e limpar esses dados. A limpeza é necessária porque os
dados normalmente advém de uma fonte muitas vezes desconhecida, concebida há
muito tempo, contendo muito lixo e inconsistência. Por exemplo: se a empresa for de
cartão de crédito, o vendedor está mais preocupado em vender o produto (cartão) do
que com a qualidade de dados que está inserindo. Se o cliente não tiver o número
do RG na hora da venda, o vendedor cadastrará um número qualquer para agilizar a
venda. Se for feita uma consulta posterior, levando-se em conta o número do RG
dos clientes, no mínimo informações estranhas aparecerão (algo como RG número
33

99999999-99). Por isso, nessa fase do DW, faz-se a limpeza desses dados, para
haver compatibilidade entre eles.
Transformação. Uma vez que a origem dos dados pode ser de sistemas
diferentes, às vezes é necessário padronizar os diferentes formatos. Por exemplo:
em alguns sistemas a informação sobre o sexo do cliente pode estar armazenada no
seguinte formato: “M” para Masculino e “F” para Feminino. Porém, em algum outro
sistema pode estar armazenado como “H” para Masculino e “M” para Feminino e
assim sucessivamente. Quando esses dados são levados para o DW, deve-se ter
uma padronização deles, ou seja, quando o usuário for consultar o DW, ele não
pode ver informações iguais em formatos diferentes. Portanto, faz-se o processo de
ETL, esses dados são transformados e deixados num formato uniforme
normalmente sugerido pelo próprio usuário. No DW, terá somente M e F, fato esse
que facilitará a análise dos dados que serão recuperados pela ferramenta OLAP.
Apesar de existirem ferramentas de ETL como o Data Stage
(Ardent/Informix), o DTS (Microsoft) e o Sagent (da própria Sagent), às vezes é
necessário criar rotinas de carga para atender determinadas situações que poderão
ocorrer. Todos têm os seus diferenciais e cada um poderá ser utilizado dependendo
do caso de cada empresa. O mais importante é que uma ferramenta de ETL tem
grande valia, principalmente se os sistemas OLTP (transacionais) são muitos, pois
elas são uma poderosa fonte de geração de metadados, e que contribuirão muito
para a produtividade da equipe.

2.3.6 Data Mining

Data Mining (ou mineração de dados) utiliza técnicas estatísticas e de


aprendizado de máquinas (redes neurais) para construir modelos capazes de
predizer o comportamento de clientes. Hoje em dia, a tecnologia consegue
automatizar o processo de mineração, integrá-lo ao data warehouse e apresentá-lo
de forma relevante aos seus usuários.
O Data mining é a descoberta de conhecimento interessante, mas
escondido em grandes bases de dados. Bases de dados corporativas
freqüentemente contêm tendências desconhecidas, relações entre objetos, como
clientes e produtos, que são de importância estratégica para a organização.
34

Diferentes técnicas existem para analisar os dados dos clientes. Há


técnicas convencionais, como OLAP, ferramentas de consulta (query) e estatística, e
novas técnicas como data mining. O valor de data mining pode ser melhor
compreendido se comparado a técnicas convencionais. O Data mining difere de
técnicas estatísticas porque, ao invés de verificar padrões hipotéticos, utiliza os
próprios dados para descobrir tais padrões.
Muitas técnicas de data mining foram desenvolvidas no passado para
extrair informações de dados. Ou seja, data mining é a combinação de diferentes
técnicas de sucesso.

2.3.7 Principais Ferramentas Utilizadas em um Data Warehouse

Data warehouse é um conjunto de diversas tecnologias, como


ferramentas de extração e conversão, bancos de dados voltados para consultas
complexas, ferramentas inteligentes de prospecção e análise de dados e
ferramentas de administração e gerenciamento.
Bispo (1998) apresenta as principais ferramentas utilizadas em um Data
Warehouse:
1. Ferramenta para armazenamento: são os bancos de dados,
considerados o coração do Data Warehouse e parte imprescindível
do projeto.
2. Ferramenta para a extração de dados: busca, nas bases de dados
operacionais, os dados que vão ser armazenados no Data
Warehouse.
3. Ferramenta para a transformação de dados: ajusta os dados para o
formato do Data Warehouse. Este formato auxilia as futuras
pesquisas.
4. Ferramenta para o refinamento ou limpeza de dados: faz os ajustes
necessários nos dados, fazendo correções, desmembramento e
fusões de dados, quando necessário, visando melhorá-los para
facilitar as futuras pesquisas.
5. Repositórios de metadados: são bancos de dados onde são
armazenados os metadados.
35

6. Ferramenta para transferência de dados e replicação: pode ser


considerada um subconjunto da ferramenta de extração. Não faz
nenhum tipo de processamento ou transformação, apenas
transfere um dado de um lugar “A” para “B”. Geralmente, é utilizada
para facilitar e dar uma resposta mais rápida às consultas ou
análises, movendo os dados para um lugar apropriado e fazendo o
que for necessário para agilizar o serviço.
7. Ferramenta para gerenciamento e administração: o gerenciamento
é o monitoramento dos bancos de dados, por exemplo, quanto ao
desempenho, integridade e segurança de dados; enquanto a
administração é o monitoramento do suporte ao sistema, tais como,
os recursos humanos e os esquemas manutenção preventiva e
corretiva dos equipamentos.
8. Ferramentas para gerenciamento de consultas: fazem consultas
e/ou geram relatórios, extraindo os dados do Data Warehouse,
resumindo-os e apresentando-os em um formato apropriado.
9. Ferramentas para gerenciamento de relatórios: são semelhantes às
ferramentas do item anterior, porém elas estão voltadas à geração
de relatórios mais complexos contendo, por exemplo, dados
sintéticos e analíticos em conjunto, gráficos, e outros tipos de
visualização dos dados.

2.3.8 OLTP x OLAP

Nas corporações existem basicamente dois tipos de aplicações: as que


sustentam o negócio, e rodam nos sistemas transacionais, também chamados de
OLTP (On-line Transactional Processing), e as que analisam o negócio sob vários
ângulos, dando apoio à decisão e servindo de base para novas ações (OLAP). Em
termos gerais, as aplicações OLTP servem para registro das transações cotidianas
(conta corrente, controle de estoque, controle da produção, contabilidade, etc) e
constituem os principais alimentadores das soluções analíticas, as quais possibilitam
mudanças e correções de rumo na estratégia corporativa. A diferença fundamental é
que as aplicações OLTP permitem atualizações constantes de dados (ou seja, as
informações são modificadas diariamente), enquanto que as aplicações analíticas
36

(OLAP) possibilitam, normalmente, apenas acessos de leitura (porque lidam com


dados estáticos).
De acordo com Kimbal (1998), um sistema OLTP pode processar
milhares, ou até mesmo milhões, de transações por dia mas envolvem uma pequena
quantidade de dados, enquanto que um Data Warehouse normalmente processa
poucas transações por dia mas cada transação poderá conter milhares ou até
mesmo milhões de registros.
O termo OLAP é o acrônimo de “On-Line Analytical Processing”
(Processamento Analítico On-Line), que muitas vezes chega a ser confundido com
Data Warehouse, foi introduzido por E. F. Codd, o pai dos bancos de dados
relacionais, segundo Come (2001).
Em geral, as ferramentas mais utilizadas são as do tipo OLAP que
possibilitam aos usuários finais extrair os dados das bases já consolidadas e com os
quais geram relatórios capazes de responder às questões gerenciais. Elas surgiram
na década de 90, junto com os sistemas de apoio à decisão para permitir a extração
e análise dos dados contidos nos Data Warehouses e nos Data Marts.
A funcionalidade de uma ferramenta OLAP é caracterizada pela análise
multi-dimensional dinâmica dos dados, apoiando o usuário final nas suas atividades.
Neste tipo de análise, os dados são modelados em uma estrutura conhecida como
cubo que permite observar várias dimensões para uma mesma massa de dados. As
dimensões desse cubo representam os componentes dos negócios da empresa
como cliente, produto, fornecedor e tempo, que na prática, são os diversos ângulos
ou óticas sob as quais uma informação pode ser analisada.
Algumas características definem se uma ferramenta é ou não considerada
OLAP. São elas:
Consultas ad-hoc: segundo definição de Inmon (1997), são
consultas com acesso casual único e os dados são tratados
segundo parâmetros nunca antes utilizados. Isso significa que o
próprio usuário gera as consultas de acordo com suas
necessidades de cruzamento de dados e de uma forma diferente
da usual, com emprego de métodos que o levam a obter as
respostas desejadas.
Capacidade de análise avançada: uma ferramenta OLAP deve ser
capaz de prover operações mais sofisticadas tais como média,
37

média ponderada, normalização, “ranking”, etc. O objetivo é que


ela auxilie a tomada de decisões sobre o futuro, permitindo a
construção de cenários a partir de suposições e fórmulas aplicadas
nos dados históricos.
Suporte a múltiplos usuários: o desafio das ferramentas OLAP é
usar os recursos computacionais disponíveis da melhor maneira
possível de forma que os múltiplos acessos aos dados não afetem
o desempenho das consultas significativas.
Flexibilidade: que pode ser considerada sob as perspectivas de
visualização, definição, análise e interface. A flexibilidade de
visualização é o poder de escolher a forma através da qual a
informação será apresentada. Prover flexibilidade de definição
significa possibilitar que o usuário modifique o conteúdo de
descritores, formate a apresentação de células tanto numéricas
quanto de texto, defina fórmulas, etc. A possibilidade de definição
das operações que serão executadas em uma consulta pelo
usuário refere-se à flexibilidade de análise e flexibilidade de
interface é o que usualmente chamamos de interface intuitiva e
amigável.
Outra característica que deve estar presente em ferramentas OLAP
é a capacidade de efetuar “slice and dice” e “drill down / drill up”.
Pode-se dizer que slice diz respeito ao fatiamento do cubo, onde
por exemplo, apenas as vendas de uma região são analisadas.
Dice é a capacidade de rotacionar o cubo passando, por exemplo,
de uma análise do tipo “quantidade de vendas de determinada
região geográfica, discriminada por mês de um período” para
“quantidade de vendas de determinado mês, discriminada por
regiões geográficas”. Drill down/up é a capacidade de, a partir de
determinado nível de consolidação, obter-se resultados em níveis
acima (up) ou abaixo (down) dentro de uma hierarquia de
dimensões, como a partir de “vendas por semestre”, obter-se
“vendas anuais” (up) ou “vendas mensais” (down).
38

A diferença entre Data Warehouse e OLAP é que o primeiro armazena


grandes volumes de dados que podem ser usados pelas empresas para aplicações
OLAP e sistemas de apoio à decisão, ou seja, o Data Warehouse é a base para o
OLAP, explica Theodoratos e Sellis (1999 apud COME, 2001, p.19).

2.3.9 Data Warehouse x SIG x SAD x SIE

De acordo com Sprague e Watson (1991), Sistema de Informações


Gerenciais (SIG) é um conjunto de sistemas e atividades necessárias ao
gerenciamento, processamento e uso de informações como um recurso dentro da
empresa. Para o autor, o SIG elevou o foco das atividades dos sistemas de
informação, dando ênfase adicional na integração e planejamento das funções
desses sistemas. Dessa forma o SIG contribuiu com um novo nível de informações
que podiam atender algumas necessidades gerenciais, mas ainda estava bastante
voltada para fluxos de informações e arquivos de dados.
Para Hogue (1991 apud COME, 2001, p.20), os aplicativos podem ser
classificados em três categorias:
Sistema de Processamento de Transações – SPT
Sistema de Informações Gerenciais – SIG
Sistema de Apoio à Decisão – SAD

O autor afirma que tanto SPT como SIG são direcionados a fluxos de
informações estruturadas e acrescenta que servem de suporte para os processos
nos níveis baixo e médio da estrutura organizacional da empresa. Uma diferença
importante entre SAD e SPT/SIG é que no SAD a informação está disponível em
diversos formatos e em SPT/SIG as informações são bastante inflexíveis (COME,
2001).
Os Decision Support Systems, ou Sistemas de Apoio à Decisão (SAD),
surgiram a partir dos sistemas transacionais existentes nas empresas, segundo Next
Generation Center (2005). São soluções que auxiliam no processo decisório,
utilizando modelos para resolver problemas não estruturados.
Segundo Sprague e Watson (1991), os conceitos de SAD foram
desenvolvidos no início da década de 70 sob a denominação de “Sistemas de
Decisões Gerenciais”. Estes sistemas começaram a ser caracterizados como
39

sistemas computacionais iterativos que ajudavam os responsáveis pela tomada de


decisões a utilizar dados e modelos para resolver problemas não estruturados.
Sprague (1991) diz que alguns autores, no início da década de 90, ampliaram a
definição de SAD de modo a incluir qualquer sistema que pudesse contribuir para o
processo decisório, o que permite que o termo possa ser atribuído a todos os tipos
de processamento, menos o de transações. Os avanços da TI e seu uso no contexto
de uma empresa levaram do SPT ao SAD, passando pelo SIG. Por essa
perspectiva, o SAD complementa o SIG.
Dessa forma, segundo COME (2001), Data Warehouse é uma plataforma
que integra dados de qualidade melhorada para apoiar muitas aplicações e
processos de apoio à decisão (SAD e SIE) dentro da organização.
O termo SIE está relacionado à área de SAD. De acordo com Shaeffer
(1991 apud COME, 2001, p.21), sistemas SAD e SIE são muito similares no sentido
de fornecer informações para a tomada de decisão, entretanto, as aplicações SIE
permitem maior flexibilidade para tratar os dados num estilo mais aceitável para
tomadores de decisão.
O SIE ou em inglês Executive Information Systems (EIS) é, na verdade,
um software que objetiva fornecer informações empresariais a partir de uma base de
dados. Segundo Next Generation Center (2005), é uma ferramenta de consulta às
bases de dados das funções empresariais para a apresentação de informações de
forma simples e amigável, atendendo às necessidades dos executivos da alta
administração principalmente. Permite o acompanhamento diário de resultados,
tabulando dados de todas as áreas funcionais da empresa para depois exibi-los de
forma gráfica e simplificada, sendo de fácil compreensão para os executivos que não
possuem profundos conhecimentos sobre tecnologia. Em termos simples o SIE
permite a estes profissionais o acesso amigável a uma série de informações pela via
eletrônica, apresentadas de forma clara e visualmente atraente. A navegação é feita
através do uso do mouse ou do sistema "touchscreen" (tela sensível ao toque) o que
não requer habilidade, nem prática e nem necessidade de assistência. O principal
objetivo do SIE é oferecer ao seu usuário, em curto espaço de tempo, uma visão
gerencial da organização, mostrando como funcionam seus processos de trabalho e
como ela se relaciona com o mundo externo dos negócios, clientes e fornecedores
(NEXT GENERATION CENTER, 2005).
40

O Data Warehouse atua no ambiente de SIE tornando sua tarefa mais


fácil do que quando não há um alicerce de dados para operar, em outras palavras, o
Data Warehouse proporciona o alicerce de dados de que o analista de SIE precisa
para atender eficientemente ao processamento SIE.
O quadro que se segue compara os tipos de sistemas apresentados neste
tópico nos seguintes aspectos:
Usuário - classificação do usuário do sistema segundo os níveis
organizacionais (operacional, tático e estratégico);
Foco - principal função do sistema;
Característica - aspecto de destaque ou próprio daquele tipo de sistema;
Decisão - se o sistema apóia uma situação de decisão diretamente (as
informações são para uma situação de decisão específica), indiretamente (por
fornecer informações que podem levar a uma decisão); não está relacionado
à tomada de decisão;
Banco de dados - possui um banco de dados próprio para a aplicação,
compartilha o banco de dados com outras aplicações, acessa os diversas
bancos de dados da empresa, etc.;
Fonte de dados - se as fontes de dados para o sistema são internas ou
externas à organização;
Recurso gráfico - pode ser indispensável, desejável ou indiferente para o
foco de atuação do sistema;
Detalhamento das informações - detalhadas (trata cada operação
separadamente), agregadas (agrega operações segundo alguma lógica);
Tipo de informação - informação característica fornecida pelos diferentes tipos
de sistemas;
Aplicações típicas - exemplos de aplicações para as quais os sistemas são
utilizados.
41

DIMENSÃO SIG SAD SIE


Usuário Nível tático (gerente) Decisor Nível tático e
estratégico
(executivo)
Foco Processamento de Análise e suporte à Análise de tendências
informações por área decisão e exceções nos
funcional fatores críticos de
sucesso
Característica Informações agregadas Simulação Função drill-down
marcante por áreas funcionais
Decisão Indireta Direta Indireta
Banco de Dados Banco de dados comum Único para cada Acesso a todas as
aplicação bases de dados
Fonte de Dados Interno Interno/Externo Interno/Externo
Recurso gráfico Desejável Desejável Essencial
Detalhamento das Agregadas Agregadas Agregadas e
informações detalhadas
Tipo de informação Relatório de atividades Informações para Status dos
rotineiras agregadas por suporte a uma indicadores (fatores
áreas funcionais situação de decisão críticos de sucesso)
Aplicações típicas Controle da produção, Determinação do Monitoramento dos
monitoramento de preço do produto, fatores críticos de
vendas, etc. plano de sucesso.
manutenção, etc.
Quadro 2 - Comparação entre SIG, SAD e SIE
Fonte: Perottoni et al (2001)

Resumidamente os tipos de sistemas da informação tratados no quadro


acima têm as seguintes aplicações:
SIG agrupa os dados disponibilizados no SPT, mostrando a situação de
determinado tipo de operação ao considerar as várias vezes que o mesmo
ocorre em determinado período de tempo;
SIE busca nos bancos de dados do SPT, SIG e em fontes internas e externas
os dados necessários para calcular os indicadores;
42

SAD apóia decisões específicas sem substituir a interpretação humana;

Nas organizações, pode-se identificar os diferentes tipos de sistemas com


suas características essenciais, da mesma forma que são observados sistemas
híbridos, que possuem funções de mais de um tipo de sistema como, por exemplo,
SPT e SIG ou SAD e SIE.
De acordo com Perottoni et al (2001), ao tratar dos diferentes tipos de
sistemas, pode-se observar tendências, onde a prioridade passou da automatização
de operações, para o processo, para a integração da organização e, finalmente para
o cliente. Essas mudanças no direcionamento do foco do negócio levam a novas
necessidades em termos de sistemas de informações como, por exemplo, a
necessidade de conhecer melhor o negócio da organização como um todo, e
conseqüentemente o surgimento do data warehouse como um integrador dos
sistemas de informação existentes.
A integração dos sistemas de informações em uma organização não era
usual até pouco tempo atrás, sendo um privilégio de poucas. A nova economia, com
uma concorrência acirrada, muitas fontes de informação, dispersão geográfica, entre
outros aspectos, está exigindo que as empresas integrem seus sistemas e, além
disso, possam se conectar com parceiros, fornecedores e clientes. A integração
elimina a redundância de informações em diferentes sistemas, reduzindo a
possibilidade de erros, atrasos e re-trabalho.
43

CAPÍTULO III

METODOLOGIA

3.1 TIPO DE PESQUISA

Este estudo foi baseado em uma pesquisa bibliográfica e documental.


Bibliográfica porque para a fundamentação teórico-metodológica do trabalho foi
realizada pesquisa sobre os seguintes assuntos: o processo de tomada de decisão
incluindo a sua evolução e importância, data warehouse com conceitos e principais
ferramentas relacionadas a este tema. A pesquisa também foi documental porque
para atingir o objetivo geral deste estudo foi necessário investigar casos reais de
organizações que implantaram o data warehouse com o fim de identificar os ganhos
obtidos.
A pesquisa bibliográfica foi desenvolvida com base em material publicado
em livros, revistas, artigos, periódicos e publicações de acesso público e ainda em
sites de pesquisadores na internet. A pesquisa documental foi realizada em
documentos publicados pelas organizações estudadas e sites de organizações e
colaboradores estudiosos no assunto, dentre estes documentos encontram-se
pareceres e relatos sobre o processo de implantação do DW nas empresas.

3.2 AMOSTRA DA PESQUISA

Foram exploradas quatro organizações, das quais duas são públicas e


duas são privadas. Para isso foram utilizados revistas e periódicos, sites de
pesquisadores e de organizações na internet a fim de identificar os benefícios
obtidos à partir da implantação de um data warehouse.
44

3.3 INSTRUMENTO

Foi feita uma análise de conteúdo dos documentos e pareceres obtidos, a


partir de um levantamento de dados com o objetivo de identificar os resultados
positivos alcançados com a implantação da tecnologia de DW pelas organizações.
45

CAPÍTULO IV

RESULTADOS E DISCUSSÃO

Neste capítulo serão apresentados alguns exemplos de empresas que


implantaram o data warehouse e os resultados obtidos a partir de sua implantação.
Os dados foram coletados da literatura disponível e, através da análise destes
exemplos será possível obter-se uma visão da utilidade e da importância dessa
tecnologia. Seguem a seguir as quatro organizações que embasaram este estudo.

4.1 BRASIL TELECOM

4.1.1 A Empresa

Figura 6 – Logotipo da Brasil Telecom


Fonte: BO (2005)

No Brasil, o exemplo de data warehouse mais divulgado atualmente é o


da Brasil Telecom. Com sede em Brasília (DF), a Brasil Telecom atua nas operações
fixa e móvel, dados e voz, longa distância nacional e internacional, data center,
Internet grátis, banda larga e acesso discado em soluções convergentes. Com cerca
de 7 mil funcionários, mais de 10,7 milhões de linhas fixas instaladas e faturamento
de R$ 12,76 bilhões em 2004, a empresa é líder de mercado nos serviços de
telefonia fixa local, longa distância e banda larga em sua região original de atuação
(regiões Sul, Centro-Oeste e Estados do Acre, Rondônia e Tocantins). Quarta
entrante no mercado de telefonia móvel de sua região, a Brasil Telecom desde o
46

início se mostrou atenta ao concorrido mercado e, em menos de seis meses de


operação, conquistou a marca de mais de um milhão de clientes.

4.1.2 Problema

Como toda grande empresa, a Brasil Telecom sentia a necessidade de ter


informações gerenciais de uma maneira rápida, integrada, histórica e principalmente
de fácil acesso. Segundo BO (2005), a empresa precisava Integrar dados das dez
filiais, acompanhar a cadeia da receita, dar autonomia aos executivos para a
realização de consultas e pesquisas. E com a dificuldade de gerar relatórios
contendo as informações necessárias, decidiu-se que a melhor forma de facilitar o
acesso e a busca dessas informações era a construção de ambientes analíticos
projetados especificamente para gerar relatórios gerenciais.

4.1.3 Solução Tecnológica Adotada

Inicialmente, segundo Cielo (2005), surgiram os Data Marts. Estes


atendiam todas as áreas estratégicas da empresa e logo foram se disseminando por
toda a organização. Contudo, devido a falta de padronização e integração dos
dados, começaram a surgir problemas com a utilização dos Data Marts. Por isso
iniciou-se a construção de um Data Warehouse Corporativo, onde a principal
finalidade fosse a de atender todas as demandas de dados de todos os Data Marts
que fossem surgir daquele momento em diante, com tecnologia de ponta, modelado
para abranger toda a corporação, explica Cielo (2005).

4.1.4 Resultados

Os resultados mais significativos obtidos a partir do uso da tecnologia de


Data Warehouse na empresa vêm sendo obtidos com o aumento de receitas a partir
de campanhas de vendas e ações de fidelidade e retenção de clientes. Existem
também vários outros benefícios importantes que já estão sendo observados como
por exemplo, segundo BO (2005), a ferramenta DW ajuda a Brasil Telecom a
acompanhar toda a cadeia da receita: do momento em que é gerado o registro de
detalhes de chamada, passando pela tarifação, cobrança, pagamento, financeiro e
47

abrangendo as áreas fundamentais, com detalhamento total para os executivos.


Para isso, os usuários possuem autonomia para efetuar suas próprias consultas e
pesquisas sobre temas como campanhas, pesquisas de mercado, relatórios de
vendas e relatórios de cobrança, sem depender do pessoal da TI, afirma BO (2005)

4.2 INTERNET GROUP (iG)

4.2.1 A Empresa
Figura 7 – Logotipo da iG
Fonte: IG (2003)

O Internet Group (iG), primeiro provedor de acesso totalmente gratuito do


Brasil, foi lançado em 9 de janeiro de 2000 e desde então é considerado um grande
case de sucesso mundial da internet. Atualmente, a empresa conta com mais de 14,5
milhões de contas de e-mail e possui uma base de clientes de cerca de 7 milhões de
usuários. O iG é o líder de audiência e acesso da internet brasileira, de acordo com
Ibope eRatings. A pesquisa revela que o provedor aumentou sua vantagem sobre o
segundo colocado ao atingir 118 mil visitantes únicos em agosto e ter alcançado 7,537
milhões de usuários únicos nas residenciais do país. A empresa está presente em
mais de 365 cidades e registra entre 13 a 15 mil novas contas de e-mail, por dia.
Conforme a última pesquisa Ibope POP, o iG consolidou a liderança como provedor
de acesso mais utilizado nas residências do Brasil ao atingir 35% dos lares do país,
percentual maior que a somatória do segundo, terceiro e quarto colocados juntos. O
provedor é o líder em oito das nove regiões metropolitanas pesquisadas, sendo que
em seis delas a vantagem foi superior a nove pontos percentuais sobre o segundo
colocado.

4.2.2 Problema

Outra empresa privada que decidiu construir um Data Warehouse foi o


provedor de acesso iG. Segundo Coen (2005), isso facilitaria a organização e
posterior distribuição das informações para os gerentes do negócio. Além disso, eles
acreditam que com as informações concentradas é mais fácil analisar todo o ciclo do
48

negócio, avaliar o perfil do usuário e entender as razões que levaram os clientes a


cancelar serviços, por exemplo.

4.2.3 Solução Tecnológica Adotada

Um grande Data Warehouse começou a ser implementado em agosto do


ano de 2004 e foi concluído em dezembro. Entretanto, os executivos dizem que
houve diversos intervalos nesse processo, como o do final do ano, por exemplo.
Hoje, apenas analistas de mercado têm acesso às informações do BI. Atualmente, o
iG planeja outras fases do projeto, pois quer incluir novos tipos de informação para
expandir o seu sistema.

4.2.4 Resultados

Um dos principais benefícios obtidos, segundo Coen (2005), foi entender


os motivos que levam os clientes a cancelar serviços. Com o Data Warehouse foi
possível identificar as razões que levavam os clientes a abandonar os serviços da
empresa e reduzir esse número. De acordo com a empresa, o processo de pós-
venda também pôde ser melhorado, ou seja, é como quando um cliente compra um
carro. A empresa quer saber se ele está satisfeito e como pode ajudá-lo. Para isso
só o acesso aos dados permite este tipo de análise.

4.3 AGÊNCIA NACIONAL DE VIGILÂNCIA SANITÁRIA (ANVISA)

4.3.1 A Empresa
Figura 8 – Logotipo da ANVISA
Fonte: ANVISA (2003)

A Agência Nacional de Vigilância Sanitária foi criada pela Lei nº 9.782, de


26 de janeiro de 1999, segundo a ANVISA (2003). É uma autarquia sob regime
especial, ou seja, uma agência reguladora caracterizada pela independência
administrativa, estabilidade de seus dirigentes durante o período de mandato e
49

autonomia financeira. Na estrutura da Administração Pública Federal, a Agência está


vinculada ao Ministério da Saúde, sendo que este relacionamento é regulado por
Contrato de Gestão. De acordo com a ANVISA (2003), a finalidade institucional da
Agência é promover a proteção da saúde da população por intermédio do controle
sanitário da produção e da comercialização de produtos e serviços submetidos à
vigilância sanitária, inclusive dos ambientes, dos processos, dos insumos e das
tecnologias a eles relacionados. Além disso, a Agência exerce o controle de portos,
aeroportos e fronteiras e a interlocução junto ao Ministério das Relações Exteriores e
instituições estrangeiras para tratar de assuntos internacionais na área de vigilância
sanitária.

4.3.2 Problema

No Brasil, não são somente as empresas do setor privado que estão


obtendo bons resultados com esta tecnologia, o setor público também está
trabalhando com a mesma e chegando aos mesmos resultados que o setor privado.
Os governos, em todos os níveis, e os seus órgãos estão enfrentando um problema
semelhante ao enfrentado pelas empresas do setor privado, ou seja, melhorar a
qualidade de seus produtos e serviços, aumentar a arrecadação, diminuir o déficit
orçamentário, reduzir as práticas fraudulentas, melhorar a administração dos seus
recursos disponíveis, seguir seus programas de governo e alcançar a metas
planejadas. Neste contexto foi implantado o Data Warehouse na Agência Nacional
de Vigilância Sanitária (ANVISA) visando garantir agilidade e segurança na tomada
de decisão na área da Saúde.

4.3.3 Solução Tecnológica Adotada

Segundo Mussi (2004), a ANVISA tem desenvolvido o DW de forma


corporativa e incremental. O fato é que o DW se tornou a solução proposta para
apoiar o processo decisório na instituição. As principais fontes de dados do DW são
os sistemas transacionais ou On-Line Transaction Processing (OLTP) que atendem
aos usuários da ANVISA e do Ministério da Saúde. Esses sistemas possuem bases
de dados relacionadas com o assunto de interesse e que estão disponíveis para os
processos de extração, transformação e carga.
50

4.3.4 Resultados

Os estudos realizados até o presente momento mostram que é possível, a


partir do DW implantado, executar relatórios gerenciais sobre qualquer uma das
dimensões existentes, combinadas de qualquer modo, de acordo com a
especificidade de cada usuário, para que este possa tomar a melhor decisão. Além
disso, a implantação de um Data Warehouse em uma instituição de saúde
possibilitou a busca e interpretação de informações armazenadas, garantindo maior
acuricidade nas tomadas de decisão, afirma Mussi (2004).

4.4 SECRETARIA DA FAZENDA DO ESTADO DE SÃO PAULO (SEFAZ)

4.4.1 A Empresa
Figura 9 – Logotipo da Sefaz-SP
Fonte: BO (2005)

A Secretaria da Fazenda do Estado de São Paulo (Sefaz-SP) é


responsável por controlar a arrecadação de tributos estaduais e a despesa do
Estado de São Paulo. A Sefaz-SP possui 2.500 fiscais para fiscalizar 900 mil
empresas contribuintes do estado de São Paulo, estado de maior arrecadação do
Brasil.

4.4.2 Problema

Para administrar as informações geradas pelas 900 mil empresas


contribuintes de São Paulo, os fiscais da Sefaz-SP atuavam como verdadeiros
garimpeiros de informações. Sem acesso on-line a uma base de dados com o
histórico de contribuições dessas companhias, cada um dos fiscais tinha que ir
pessoalmente às empresas e conferir manualmente os dados referentes à
arrecadação. Era um processo lento e ineficaz, afirma BO (2005).
51

A Sefaz-SP tinha a necessidade de tornar o sistema de arrecadação fiscal


mais ágil, monitorar os contribuintes para combater a evasão fiscal, distribuir
informações para agilizar a tomada de decisões no governo e melhorar a qualidade
dos relatórios corporativos.

4.4.3 Solução Tecnológica Adotada

Neste contexto, a Secretaria decidiu investir em um sistema de Data


Warehouse capaz de analisar e cruzar informações estratégicas dos contribuintes,
agilizando o serviço dos fiscais e ampliando, assim, o controle sobre a arrecadação
e a fiscalização tributária.
Segundo BO (2005), o sistema foi iniciado com a definição de parâmetros
para consolidar um data warehouse gigantesco, repleto de dados gerados em
diferentes épocas e com parâmetros totalmente distintos. Vários sistemas de origens
diferentes, como mainframe e plataforma baixa, foram integrados em uma única
base de dados. A Secretaria decidiu que o projeto seria colocado em prática por
etapas, à medida que os fiscais começassem a utilizar o sistema, ainda na fase
piloto. A Sefaz-SP escolheu a solução WebIntelligence pela habilidade na
distribuição das informações com agilidade e segurança, além do atendimento da
equipe de pré-vendas.

4.4.4 Resultados

O retorno do investimento da Sefaz-SP foi alcançado já na fase piloto do


projeto. O sistema permitiu a disseminação de informações trazendo total
transparência e uniformidade nas informações distribuídas, mantendo os dados
sempre atualizados. Segundo BO (2005), a partir do sistema de Data Warehouse foi
possível monitorar a arrecadação, acompanhar o desvio dos contribuintes e realizar
o cruzamento de informações tributárias.
Outro benefício obtido foi o aumento da produtividade dos fiscais. O prazo
para respostas sobre consultas caiu de 30 dias para minutos ou até segundos. Hoje,
um agente pode analisar um universo de 3.000 empresas simultaneamente, de
acordo com diversos tipos de critérios, e selecionar somente companhias que
aparentam ter alguma irregularidade para visitar pessoalmente. O levantamento dos
52

dados do contribuinte, que antes demorava dias ou até meses, pode ser feito de
forma simples e rápida, padronizada em todo o estado, por meio da intranet. Além
dos resultados citados, BO (2005) enfatiza que o projeto está contribuindo para
ampliar a credibilidade da Secretaria. O autor aponta a disponibilidade das
informações como outro benefício do projeto. Segundo ele, os usuários não
precisam saber linguagens de programação para operar o sistema.

4.5 DISCUSSÃO DOS RESULTADOS

Segundo os autores, com base em pesquisas de satisfação que foram


realizadas junto aos usuários nessas empresas pôde-se constatar o sucesso da
implantação do DW. Hoje pode-se dizer que as expectativas dos usuários foram
superadas em muitos dos aspectos. Porém as empresas têm a consciência de
sempre buscar novos produtos/serviços para aumentar ainda mais essa satisfação.
Resumindo os casos discutidos acima, segundo Computerworld (1998
apud BISPO, 1998, p.43), um estudo realizado pela The Conference Board em
conjunto com a Price Waterhouse, com 50 corporações americanas com
faturamento anual superior a US$ 1 bilhão, apontou que 62% das corporações
respondeu que está parcialmente satisfeita com os resultados obtidos com a
implementação de um data warehouse, ou seja, em alguns setores, foi alcançado o
resultado almejado e em outros isso não foi possível. Para 7% das corporações, os
resultados superaram as expectativas, 19% se disse totalmente satisfeita com os
resultados alcançados e 12% afirmou que não alcançou os resultados esperados
(gráfico 1).
53

Não alcançaram Resultados


os resultados superaram as
esperados expectativas
12% 7% Totalmente
satisfeitas
19%

Parcialmente
satisfeitas
62%

Gráfico 1 - Gráfico demonstrando a satisfação de um grupo de usuários com a


implantação de um data warehouse
Fonte: Bispo (1998)

Em resumo, as empresas que se dizem satisfeitas e mais que satisfeitas


alcançam 26% do total. As empresas que obtiveram resultados parciais alcançam
62%. De acordo com Computerworld (1998 apud BISPO, 1998, p.43), isto se deve
ao fato de que a implementação nos diversos setores da empresa produz resultados
diferentes: alguns setores conseguem obter um bom retorno financeiro do
investimento realizado e outros não. Para minimizar isso, estudos de viabilidade de
implantação da ferramenta nos diversos setores de uma empresa devem ser
elaborados na fase inicial do projeto de implantação. Neste caso, 12% não obteve o
resultado esperado o que pode significar um projeto mal elaborado.
O Data warehouse é uma tecnologia frágil e cara, se as instalações não
são adequadas às exigências empresariais, o sistema entrará em desuso; se o
retorno de investimento não aparecer, o sistema pode ser considerado como um
luxo; se os executivos delegam seu uso, o lucro cultural estará perdido (HORROCKS
,1997, apud BISPO, 1998, p.43). Porém, segundo o autor, se a ferramenta foi bem
planejada, cuidadosamente implementada e é dirigida para a chamada “inteligência
dos negócios”, ela pode auxiliar os líderes empresariais nos seus desafios.
54

CAPÍTULO V

CONCLUSÕES

Como pôde ser visto o Data Warehouse permite ter uma base de dados
integrada e histórica, para análise dos dados, e isso pode e deve se tornar um
diferencial competitivo para as empresas. Tendo uma ferramenta desse porte na
mão, o executivo pode decidir com muito mais eficiência e eficácia. As decisões
serão embasadas em fatos, e não em intuições, poderão ser descobertos novos
mercados, novas oportunidades, novos produtos, pode-se criar uma relação mais
próxima com o cliente, pois a empresa terá todas as informações sobre ele, e com
simples cliques de mouse poderá identificar insatisfações com seus produtos e
serviços, direcionando decisões de melhoria.
Tendo como base os estudos de casos discutidos no capítulo anterior,
conclui-se que, entre os principais benefícios proporcionados pelo Data Warehouse
nas organizações estão:
Maior agilidade e acuricidade na tomada de decisão;
Conhecer melhor os clientes e suas necessidades, além de
acompanhá-los e monitorá-los no pós-venda;
Monitoramento do mercado;
Suporte à tomada de decisão de diversos setores;
Rapidez ao distribuir e compartilhar informações;
Disponibilizar informações corretas, de forma correta e no tempo
certo;
Maior produtividade;
Padronização das informações, e
Precisão e agilidade nos relatórios.
A vantagem da implantação de um data warehouse em uma organização
é propiciar aos administradores da empresa uma economia de tempo e esforço no
55

processo de tomada de decisão. Vale ressaltar, que a utilização do ambiente de data


warehouse não implica necessariamente em melhores decisões. Ele permite apenas
que os administradores baseiem suas decisões com melhores informações.
Quanto ao futuro, acredita-se que num mundo extremamente competitivo
em que se vive, ferramentas de BI como o data warehouse são essenciais para
quem quer entender e analisar o perfil de seus clientes. É um caminho natural para
as empresas que queiram manter e crescer a sua base de clientes. É um grande
diferencial para descobrir e alavancar negócios.
Para a construção desta monografia, buscou-se uma diversificada
literatura para poder analisar o tema, de forma a não se ater aos conceitos de
poucos autores ou literaturas. Pelo contrário, pode-se confrontar ou confirmar os
conceitos de autores distintos, possibilitando a seleção dos conceitos considerados
mais adequados para este trabalho. Tem-se a convicção de que a forma com que foi
abordado este tema foi suficiente para que fossem alcançados os objetivos
propostos. Quem desejar se aprofundar em pouco mais nos conhecimentos relativos
à ferramenta apresentada poderá consultar as literaturas apresentadas nas
referências bibliográficas. Para que se pudesse mostrar o que existe de mais atual a
respeito desta ferramenta deu-se prioridade às literaturas e casos práticos mais
recentes.
56

REFERÊNCIAS

ANVISA. Agência Nacional de Vigilância Sanitária. Apresentação, 2003, disponível


em: <http://www.anvisa.gov.br/institucional/anvisa/apresentacao.htm>. Acesso em:
11 jan. 2006.

BISPO, C. A. F. Uma Análise da Nova Geração de Sistemas de Apoio à


Decisão.1998. 160 p. Dissertação (Mestrado em Engenharia da Produção) – Escola
de Engenharia de São Carlos da Universidade de São Paulo, São Carlos, 1998.

BO. Business Objects. Sefaz-SP cruza dados do contribuinte e agiliza combate à


sonegação, 2005, disponível em:
<http://www.businessobjects.com.br/pdf/BusinessObjects_Case_Sefaz.pdf>. Acesso
em: 14 jan. 2006.

BO. Business Objects. Business intelligence ajuda a Brasil Telecom a gerenciar


o desempenho corporativo, 2005, disponível em:
<http://www.businessobjects.com.br/pdf/Case_Brasil_Telecom_22-07.pdf>. Acesso
em 09 dez. 2005.

CIELO, I. R. Estudo de caso da Brasil Telecom, 2005, disponível em:


<http://www.datawarehouse.inf.br/artigos/businessintelligence.asp>. Acesso em: 08
dez. 2005.

COEN, Luciana. Ferramentas de BI mostram a que vieram, 2005, disponível em:


<http://computerworld.uol.com.br/AdPortalv5/adCmsDocumentShow.aspx?GUID=E3
249E1D-A61E-471E-BD89-FD9CDA21E41E&ChannelID=22>. Acesso em: 01 nov.
2005.

COME, Gilberto de. Contribuição ao estudo da implementação de Data


Warehousing: um caso no setor de telecomunicações.2001. 133 p. Dissertação
(Mestrado em Administração) – Faculdade de Economia, Administração e
Contabilidade da Universidade de São Paulo, São Paulo, 2001.

COSTA, P. W. A. Como surgiram os data warehouses?. Computerworld, p. 16, nov.


1997.

HAMMOND, J. S.; KEENEY, R. L.; RAIFFA, H. The hidden traps in decision making.
Harvard Business Review, n. 98505, 9 p., Sept. 1998.
57

IG. Internet Generation, 2003, disponível em: < http://www.ig.com.br/>. Acesso em


11 jan. 2006.

INMON, William H. Data Mart ≠ Data Warehouse – DM Review, 1999, disponível


em: <www.dmreview.com>. Acesso em: 08 jan.2006.

INMON, William H. Como Construir o Data Warehouse. Rio de Janeiro: Campus,


1997.

KIMBALL, Ralph. Data Warehouse Toolkit: Técnicas para construção de Data


Warehouses Dimensionais. São Paulo: Makron Books, 1998.

MARCH, James G. A primer on decision making: how decisions happen. New


York: The Free Press, 1994.

MURAKAMI, Milton. Decisão Estratégica em TI: Estudo de Caso. 2003. 167 p.


Dissertação (Mestrado em Administração) – Faculdade de Economia, Administração
e Contabilidade da Universidade de São Paulo, São Paulo, 2003.

MUSSI, C.; et al. Data Warehouse: a experiência da ANVISA, Assessoria da


Presidência, Agência Nacional de Vigilância Sanitária, Brasília/DF, 2004.

NAVARRO, M. C. A. O que é Data Warehouse?, 1996, disponível em:


<http://www.serpro.gov.br/publicacao/tematec/1996/ttec27>. Acesso em: 05 abr.
2005.

NEXT GENERATION CENTER. BI módulo 1 - conceito e história do BI, 2005,


disponível em:
<http://www.celedo.com.br/portal/modules.php?name=News&file=article&sid=1>.
Acesso em: 03 out.2005.

PEROTTONI, R.; et al. Sistemas de informações: um estudo comparativo das


características tradicionais às atuais, PPGA/EA/UFRGS, v.7, n. 3, 2001. Porto
Alegre/RS: disponível em <http://read.adm.ufrgs.br>. Acesso em: 03 out. 2005.

RADDING, A. It's in the can: Analytical applications simplify back-end datamarts, in


"Datamation", jan.1999.

RUSSO, J.E.; SCHOEMAKER, P. J. H. Tomada de decisões: armadilhas, tradução


de Nivaldo Montingelli Jr. São Paulo: Saraiva, 1993.
58

SIMON, H. A. The new science of management decision. New York, USA:


Prentice Hall College Div, 1977.

SINGH, H. S. Data warehouse. São Paulo: Makron Books, 2001.

SOWEK, C. A. O que é Data Warehouse, 2003, disponível em: <


http://www.pr.gov.br/batebyte/edicoes/1997/bb62/warehouse.htm>. Acesso em: 20
jan. 2006.

SPRAGUE, R. H.; WATSON, H. J. Sistema de Apoio à Decisão: colocando a


teoria em prática. Rio de Janeiro: Campus, 1991.

Você também pode gostar