Escolar Documentos
Profissional Documentos
Cultura Documentos
FGV Management
A IMPORTÂNCIA DO DATA
WAREHOUSE NO PROCESSO DE
TOMADA DE DECISÃO
Brasília – DF
2005
2
A IMPORTÂNCIA DO DATA
WAREHOUSE NO PROCESSO DE
TOMADA DE DECISÃO
Brasília – DF
2005
3
Brasília,
APROVADA POR:
___________________________________
Prof. Alberto Luiz Gerardi, Mestre.
Orientador
FGV Management, Núcleo de Brasília-DF.
___________________________________
Prof.
FGV Management, Núcleo de Brasília-DF.
___________________________________
Prof.
FGV Management, Núcleo de Brasília-DF.
4
AGRADECIMENTOS
À minha família, meus pais e meus irmãos, pelo incentivo que me deram e
pelo auxílio que recebi nos momentos em que precisei durante o curso. E ao meu
filho Gabriel que em alguns momentos teve que ficar sob os cuidados do pai para
que eu pudesse dar continuidade ao curso.
LISTA DE FIGURAS
LISTA DE GRÁFICOS
LISTA DE QUADROS
LISTA DE SIGLAS
BI – Business Inteligence
DM – Data Mart
DW – Data Warehouse
ERP - Enterprise Resource Planning
OLAP – On-line Analytical Processing
OLTP – On-line Transactional Processing
SAD - Sistemas de Apoio à Decisão
SGBD – Sistema de Gerenciamento de Bancos de Dados
SIE - Sistema de Informações Executivas
SIG - Sistema de Informações Gerenciais
SPT - Sistema de Processamento de Transações
TI – Tecnologia da Informação
9
SUMÁRIO
RESUMO..................................................................................................10
ABSTRACT..............................................................................................11
CAPÍTULO I - INTRODUÇÃO..................................................................12
1.1 DEFINIÇÃO DO PROBLEMA......................................................13
1.2 OBJETIVOS ................................................................................13
1.2.1 Objetivo geral.........................................................................13
1.2.2 Objetivos específicos .............................................................13
1.3 JUSTIFICATIVAS........................................................................14
CAPÍTULO II – REFERENCIAL TEÓRICO .............................................16
2.1 PROCESSO DE TOMADA DE DECISÃO...................................16
2.1.1 O que é Tomada de Decisão .................................................16
2.1.2 Elementos do Processo de Tomada de Decisão ...................17
2.1.3 O Poder e a Importância das Decisões .................................18
2.2 A EVOLUÇÃO DOS SISTEMAS DE APOIO À DECISÃO...........19
2.3 DATA WAREHOUSE ..................................................................23
2.3.1 Histórico.................................................................................23
2.3.2 Conceitos Básicos .................................................................24
2.3.3 Data Mart ...............................................................................29
2.3.4 Metadados .............................................................................31
2.3.5 Extração, Transformação e Carga dos Dados (ETL).............32
2.3.6 Data Mining............................................................................33
2.3.7 Principais Ferramentas Utilizadas em um Data Warehouse..34
2.3.8 OLTP x OLAP ........................................................................35
2.3.9 Data Warehouse x SIG x SAD x SIE .....................................38
CAPÍTULO III - METODOLOGIA .............................................................43
3.1 TIPO DE PESQUISA...................................................................43
3.2 AMOSTRA DA PESQUISA .........................................................43
3.3 INSTRUMENTO ..........................................................................44
CAPÍTULO IV – RESULTADOS E DISCUSSÃO.....................................45
CAPÍTULO V - CONCLUSÕES ...............................................................53
REFERÊNCIAS........................................................................................56
10
RESUMO
O contexto em que se vive atualmente demanda das organizações uma capacidade de analisar,
planejar e reagir rapidamente para poder acompanhar ou superar as exigências dos clientes. A todo o
momento, uma grande quantidade de informações, sobre os mais variados aspectos dos negócios da
empresa, é gerada, armazenada, passando a fazer parte da base de conhecimento. Entretanto,
esses dados estão espalhados por vários sistemas de difícil integração, sem qualidade e
indisponíveis para os gerentes e altos executivos que são os tomadores de decisões estratégicas das
organizações. Para suprir essa deficiência surgiu o Data Warehouse (DW), que se constitui de um
conjunto de arquiteturas e/ou sistemas de informação orientados a assunto, manipulando grande
volume de dados, principalmente históricos, e dão origem a consultas invariavelmente não
previsíveis, que tem por objetivo dar suporte a esses processos. O presente estudo tem por objetivo
apresentar o estado da arte da tecnologia de Data Warehouse, introduzindo os principais conceitos
na área, procurando enfatizar a importância de sua utilização para garantir agilidade e segurança na
tomada de decisão nas organizações.
ABSTRACT
Nowadays, the existing context demands from organizations a capacity of rapidly analyzes, plan and
react, so they can follow or surpass client’s requirements. In every moment, a great amount of
information about the most different aspects of the company business is generated, stored and
becomes part of the knowledge basis. However, these data are spread in several systems of difficult
integration, without quality and unavailable for the managers and high level businessmen that take
strategic decisions on organizations. To supply this deficiency, it came out the Data Warehouse (DW),
that is constituted by a group of architectures and/or subject oriented information system that exists in
platforms segregated from the transactional environment, manipulating a great volume of data, mainly
historical, and invariably originate unexpected searches, that aims to give support to these process.
This course presents the current state of Data Warehouse technology, introducing the main issues in
that area and discussing, trying to emphasize the importance of its utilization to guarantee agility and
security in decisions on organizations.
CAPÍTULO I
INTRODUÇÃO
1.2 OBJETIVOS
1.3 JUSTIFICATIVAS
CAPÍTULO II
REFERENCIAL TEÓRICO
importante num processo decisório, contudo, não se deve esquecer que a tomada
de decisão é uma atividade desempenhada por pessoas, portanto, a subjetividade
está sempre presente, ainda que não seja apresentada clara ou explicitamente. Com
isso, qualquer metodologia de apoio à decisão deve suportar a subjetividade
inerente ao processo decisório.
Segundo March (1994), a tomada de decisão é uma atividade que
interpreta uma ação como uma escolha racional. Neste caso, o termo racional é,
normalmente, interpretado como equivalente a “inteligente” ou “bem sucedido”, o que
descreve que as ações foram bem sucedidas. O autor define a racionalidade como
um particular e muito familiar conjunto de procedimentos para fazer escolhas.
O autor considera que um procedimento racional é aquele que segue uma
lógica da conseqüência.
Definitivamente, é preciso aceitar que a subjetividade está onipresente
nos processos de tomada de decisão.
Em 1954, Simon (1977) já defendia a idéia de que o modo mais adequado
para se estudar a resolução de problemas era simular essa situação com programas
computacionais. A partir de então, Simon vem pesquisando a associação dos
recursos computacionais ao comportamento do homem e tornou-se o primeiro
cientista a abordar o conceito de Inteligência Artificial.
maior parte das decisões pelas quais é responsável não são suas mas sim de
subordinados.
Às vezes é melhor deixar de tomar a decisão do que tomar a decisão
errada. Decisões ruins podem prejudicar um negócio e uma carreira, às vezes de
forma irreparável. Tomar a decisão errada pode ser conseqüência do modo como
ela foi tomada, ou seja, as alternativas não estavam claramente definidas, a
informação certa não foi coletada, os custos e benefícios não foram pesados com a
devida precisão, afirmam Hammond, Keeney e Raiffa (1998).
Para Nutt (2002 apud MURAKAMI, 2003, p.36), o pior modo para se
alcançar uma decisão é impor suas idéias na organização. Baseado em estudos,
Nutt mostra que grande parte das decisões são impostas na organização. A maioria
tomou suas decisões por meio de persuasão ou por meio de determinação, que de
acordo com Nutt, cada uma dessas fórmulas é um atalho para o fracasso.
gerenciamento em níveis gerenciais. Isso fez com que a necessidade de análise dos
dados crescesse e ainda criou a necessidade de respostas mais rápidas, confiáveis
e que melhor se adaptassem às necessidades do gerenciamento da empresa e dos
negócios.
A globalização, que devido à velocidade que as informações chegam ao
outro lado do planeta e as exigências cada vez maiores dos clientes, fez com que a
concorrência aumentasse espantosamente a nível mundial. Com isso, tem-se um
cenário onde existe intensa e constante pressão sobre os gerentes, para conhecer
melhor seus negócios e clientes. Como conseqüência, houve um aumento das
necessidades gerenciais, novos tipos de consultas e de análises nos dados
passaram a ser necessárias, e, portanto, novos sistemas que dessem um melhor
suporte ao processo decisório precisavam ser elaborados.
Ainda nesta década, surgiram diversos sistemas para dar suporte à
tomada de decisão nas organizações. Entre estas novas ferramentas, segundo
Bispo (1998), está a ferramenta para gestão integrada da empresa, o Enterprise
Resource Planning (ERP) e a nova geração de Sistemas de Apoio à Decisão: o Data
Warehouse, o OLAP e o Data Mining. A ferramenta ERP é utilizada para o
gerenciamento no ambiente operacional da empresa, enquanto as três novas
ferramentas estão sendo utilizadas no ambiente gerencial. Estas ferramentas
revelam-se muito úteis no gerenciamento moderno dos negócios e estão auxiliando
os gerentes a enfrentar os desafios dos novos tempos.
2.3.1 Histórico
2.3.2.2 Integrado
2.3.4 Metadados
A etapa de ETL é uma das mais críticas de um projeto de DW, pois uma
informação carregada erroneamente trará conseqüências imprevisíveis nas fases
posteriores. O objetivo desta fase é fazer a integração de informações de fontes
múltiplas e complexas. Basicamente, divide-se esta etapa em três passos: extração,
transformação e carga dos dados. Embora existam hoje em dia ferramentas que
auxiliam na execução do trabalho, ainda assim é um processo trabalhoso, complexo
e também muito detalhado.
Carga. Num processo de ETL, primeiramente deve-se definir as origens
das fontes de dados e fazer a extração deles. As origens deles podem ser várias e
também em diferentes formatos, onde podem-se encontrar desde os sistemas
transacionais das empresas até planilhas, arquivos textos e também arquivos DBF
(dBase) ou do Microsoft Access.
Limpeza. Definidas as fontes, parte-se para o segundo passo que
consiste em transformar e limpar esses dados. A limpeza é necessária porque os
dados normalmente advém de uma fonte muitas vezes desconhecida, concebida há
muito tempo, contendo muito lixo e inconsistência. Por exemplo: se a empresa for de
cartão de crédito, o vendedor está mais preocupado em vender o produto (cartão) do
que com a qualidade de dados que está inserindo. Se o cliente não tiver o número
do RG na hora da venda, o vendedor cadastrará um número qualquer para agilizar a
venda. Se for feita uma consulta posterior, levando-se em conta o número do RG
dos clientes, no mínimo informações estranhas aparecerão (algo como RG número
33
99999999-99). Por isso, nessa fase do DW, faz-se a limpeza desses dados, para
haver compatibilidade entre eles.
Transformação. Uma vez que a origem dos dados pode ser de sistemas
diferentes, às vezes é necessário padronizar os diferentes formatos. Por exemplo:
em alguns sistemas a informação sobre o sexo do cliente pode estar armazenada no
seguinte formato: “M” para Masculino e “F” para Feminino. Porém, em algum outro
sistema pode estar armazenado como “H” para Masculino e “M” para Feminino e
assim sucessivamente. Quando esses dados são levados para o DW, deve-se ter
uma padronização deles, ou seja, quando o usuário for consultar o DW, ele não
pode ver informações iguais em formatos diferentes. Portanto, faz-se o processo de
ETL, esses dados são transformados e deixados num formato uniforme
normalmente sugerido pelo próprio usuário. No DW, terá somente M e F, fato esse
que facilitará a análise dos dados que serão recuperados pela ferramenta OLAP.
Apesar de existirem ferramentas de ETL como o Data Stage
(Ardent/Informix), o DTS (Microsoft) e o Sagent (da própria Sagent), às vezes é
necessário criar rotinas de carga para atender determinadas situações que poderão
ocorrer. Todos têm os seus diferenciais e cada um poderá ser utilizado dependendo
do caso de cada empresa. O mais importante é que uma ferramenta de ETL tem
grande valia, principalmente se os sistemas OLTP (transacionais) são muitos, pois
elas são uma poderosa fonte de geração de metadados, e que contribuirão muito
para a produtividade da equipe.
O autor afirma que tanto SPT como SIG são direcionados a fluxos de
informações estruturadas e acrescenta que servem de suporte para os processos
nos níveis baixo e médio da estrutura organizacional da empresa. Uma diferença
importante entre SAD e SPT/SIG é que no SAD a informação está disponível em
diversos formatos e em SPT/SIG as informações são bastante inflexíveis (COME,
2001).
Os Decision Support Systems, ou Sistemas de Apoio à Decisão (SAD),
surgiram a partir dos sistemas transacionais existentes nas empresas, segundo Next
Generation Center (2005). São soluções que auxiliam no processo decisório,
utilizando modelos para resolver problemas não estruturados.
Segundo Sprague e Watson (1991), os conceitos de SAD foram
desenvolvidos no início da década de 70 sob a denominação de “Sistemas de
Decisões Gerenciais”. Estes sistemas começaram a ser caracterizados como
39
CAPÍTULO III
METODOLOGIA
3.3 INSTRUMENTO
CAPÍTULO IV
RESULTADOS E DISCUSSÃO
4.1.1 A Empresa
4.1.2 Problema
4.1.4 Resultados
4.2.1 A Empresa
Figura 7 – Logotipo da iG
Fonte: IG (2003)
4.2.2 Problema
4.2.4 Resultados
4.3.1 A Empresa
Figura 8 – Logotipo da ANVISA
Fonte: ANVISA (2003)
4.3.2 Problema
4.3.4 Resultados
4.4.1 A Empresa
Figura 9 – Logotipo da Sefaz-SP
Fonte: BO (2005)
4.4.2 Problema
4.4.4 Resultados
dados do contribuinte, que antes demorava dias ou até meses, pode ser feito de
forma simples e rápida, padronizada em todo o estado, por meio da intranet. Além
dos resultados citados, BO (2005) enfatiza que o projeto está contribuindo para
ampliar a credibilidade da Secretaria. O autor aponta a disponibilidade das
informações como outro benefício do projeto. Segundo ele, os usuários não
precisam saber linguagens de programação para operar o sistema.
Parcialmente
satisfeitas
62%
CAPÍTULO V
CONCLUSÕES
Como pôde ser visto o Data Warehouse permite ter uma base de dados
integrada e histórica, para análise dos dados, e isso pode e deve se tornar um
diferencial competitivo para as empresas. Tendo uma ferramenta desse porte na
mão, o executivo pode decidir com muito mais eficiência e eficácia. As decisões
serão embasadas em fatos, e não em intuições, poderão ser descobertos novos
mercados, novas oportunidades, novos produtos, pode-se criar uma relação mais
próxima com o cliente, pois a empresa terá todas as informações sobre ele, e com
simples cliques de mouse poderá identificar insatisfações com seus produtos e
serviços, direcionando decisões de melhoria.
Tendo como base os estudos de casos discutidos no capítulo anterior,
conclui-se que, entre os principais benefícios proporcionados pelo Data Warehouse
nas organizações estão:
Maior agilidade e acuricidade na tomada de decisão;
Conhecer melhor os clientes e suas necessidades, além de
acompanhá-los e monitorá-los no pós-venda;
Monitoramento do mercado;
Suporte à tomada de decisão de diversos setores;
Rapidez ao distribuir e compartilhar informações;
Disponibilizar informações corretas, de forma correta e no tempo
certo;
Maior produtividade;
Padronização das informações, e
Precisão e agilidade nos relatórios.
A vantagem da implantação de um data warehouse em uma organização
é propiciar aos administradores da empresa uma economia de tempo e esforço no
55
REFERÊNCIAS
HAMMOND, J. S.; KEENEY, R. L.; RAIFFA, H. The hidden traps in decision making.
Harvard Business Review, n. 98505, 9 p., Sept. 1998.
57