Sistemas de suporte à decisão Conceitos Data Warehouse Data Mining OLAP
11/05/20 Gestão de Sistemas de Informação 2
Introdução
O mundo actual encontra‐se em constante mutação,
sendo a informação a chave para determinar vantagens competitivas, pois no meio dos dados encontram‐se as pistas para a estratégia ideal. Os sistemas tradicionais enfrentam um grande problema que é a dificuldade de fazerem análises interdepartamentais, no entanto essa análise é fundamental ao longo dos vários níveis hierárquicos.
11/05/20 Gestão de Sistemas de Informação 3
Com o aparecimento do Data Warehouse foi possível reunir a informação das mais diversas fontes, organizá‐la e pô‐la à disposição das pessoas certas na organização. O Data Warehouse está na base dos sistemas de apoio à decisão actual. Suporta processamento analítico porque se apresenta como uma plataforma de dados históricos integrados, a partir da qual se pode fazer análise.
11/05/20 Gestão de Sistemas de Informação 4
Conceitos
Segundo Inmon, que é tido como o pai do conceito, data
warehouse é uma colecção de dados orientados por assuntos, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo de tomada de decisão; Data Warehouse é uma colecção de dados: orientados por assunto; deve‐se determinar as áreas da empresa que são importantes para oprocesso de tomada de decisões.
11/05/20 Gestão de Sistemas de Informação 5
variáveis no tempo; A variabilidade no tempo consiste em análises de dados que são feitas consoante um determinado período de tempo e comparadas com outros períodos homólogos. Todos os dados do Data Warehouse são precisos em algum instante no tempo, como eles podem estar correctos somente num determinado momento, é dito que esses dados “variam com o tempo”.
11/05/20 Gestão de Sistemas de Informação 6
integrados; A integração é nem mais nem menos, do que a representação única para os dados provenientes dos diversos sistemas operacionais e fontes externas. De todas as características do Data Warehouse esta é a mais importante. Não voláteis; Por último a não volatilidade dos dados. Isto é, quando os dados entram no Data Warehouse não devem ser alterados, ao contrário do que acontece nos sistemas operacionais em que as bases de dados são alteradas de cada vez que é processada uma transacção.
11/05/20 Gestão de Sistemas de Informação 7
Objectivos
O Data Warehouse tem como objectivo reunir a
informação das mais diversas fontes, organizá‐la e disponibilizá‐la às pessoas certas na organização. Os dados de uma organização são como um puzzle, com cada peça residindo numa direcção diferente da organização. Todas estas peças encaixam no Data Warehouse.
11/05/20 Gestão de Sistemas de Informação 8
11/05/20 Gestão de Sistemas de Informação 9 Assim o Data Warehouse tem como principais objectivos: transformar os dados em informação; ajudar a identificar tendências; ajudar a antever acontecimentos, agindo antes deles; e ajudar a perceber acontecimentos passados, redefinindo processos com base nisso.
11/05/20 Gestão de Sistemas de Informação 10
O Data Warehouse deve satisfazer as necessidades de análises de informações dos utilizadores. Um dos grandes benefícios proporcionados por ele é a diminuição do tempo que os utilizadores (gerentes e analistas de negócios) levam para obter as informações necessárias aos seus processos de tomada de decisão.
11/05/20 Gestão de Sistemas de Informação 11
Arquitecturas de uma Data Warehouse Para ser útil,o Data Warehouse deve ser capaz de responder a consultas avançadas de maneira rápida e eficiente, sem deixar de mostrar detalhes relevantes na resposta. Para isso, deve possuir uma arquitectura que lhe permita: coleccionar, manipular e apresentar os dados de forma eficiente e rápida.
11/05/20 Gestão de Sistemas de Informação 12
Na construção de um Data Warehouse eficiente deve‐se considerar que os dados provenientes de vários sistemas podem conter redundâncias e diferenças, assim, é necessário aplicar filtros sobre eles, antes de passá‐ los para o Data Warehouse. Um Data Warehouse pode variar sua arquitectura conforme o tipo de assunto abordado pois, as necessidades também variam de empresa para empresa. No entanto, é possível definir uma arquitectura genérica, onde praticamente todas as camadas apresentadas são utilizadas:
11/05/20 Gestão de Sistemas de Informação 13
Camada de Base de Dados Operacionais e Fontes Externas: é composta pelos dados dos sistemas operacionais das organizações e informações provenientes de fontes externas que serão integradas para compor o Data Warehouse; Camada de Acesso aos Dados: esta camada faz a ligação entre as ferramentas de acesso à informação e as bases de dados operacionais. Comunica‐se com diferentes sistemas de bases de dados, sistemas de arquivos e fontes, sob diferentes protocolos de comunicação;
11/05/20 Gestão de Sistemas de Informação 14
Camada de Gestão de Processos: é a camada responsável pela gestão dos processos que contribuem para manter o Data Warehouse actualizado e consistente. Esta camada está envolvida com o controlo das várias tarefas que devem ser realizadas para construir e manter as informações do dicionário dedados e do Data Warehouse;
11/05/20 Gestão de Sistemas de Informação 15
Camada de Transporte: faz a gestão do transporte de informações pelo ambiente da rede. Inclui a colecção de mensagens e transações e encarrega‐se de entregá‐las em locais e tempos determinados; Camada do Data Warehouse: é o Data Warehouse propriamente dito. Corresponde aos dados utilizados para obter informações. Por vezes, o Data Warehouse pode ser simplesmente uma visão lógica ou virtual dos dados, podendo não envolver o armazenamento dos mesmos ou armazenar dados operacionais e externos para facilitar seu acesso e manuseio;
11/05/20 Gestão de Sistemas de Informação 16
Camada de Acesso à Informação: envolve o hardware e o software utilizado para obter relatórios, folhas de calculo, gráficos e consultas. É nesta camada que os utilizadores finais interagem com o Data Warehouse, utilizando ferramentas de manipulação, análise e apresentação dos dados, incluindo‐se as ferramentas de Data Mining e visualização;
11/05/20 Gestão de Sistemas de Informação 17
Camada de Metadados (Dicionário de Dados): metadados são as informações que descrevem os dados utilizados pela empresa, tais como, descrições de registos, comando de criação das tabelas, diagramas entidade‐relação (E‐R), dados de um dicionário de dados, etc. É necessário que exista uma grande variedade de metadados no ambiente de Data Warehouse para que ele mantenha sua funcionalidade e os utilizadores não precisem se preocupar onde residem os dados ou a forma com que estão armazenados
Gestão de Sistemas de Informação 18
Estruturas da Data Warehouse
Existem dois tipos de arquitecturas, quanto à estrutura
de um Data Warehouse: Data Warehouse à escala da organização Os antigos sistemas operacionais diferem muito do Data Warehouse, tendo em conta que os primeiros apresentam‐se como um repositório de transacções, o segundo funciona como uma ferramenta fundamental para a orientação do negócio.
11/05/20 Gestão de Sistemas de Informação 19
11/05/20 Gestão de Sistemas de Informação 20 Estruturas do Data Warehouse Data Marts – a abordagem “ divide and conquer” Após o surgimento dos “Mega” Warehouses de dados, surgiu a necessidade de se fazer Data Warehouses mais pequenos para uso ao nível departamental, é aqui que surgem os Data Marts. O conceito de Data Mart surge, devido ao crescimento da base de dados e do número de utilizadores tornar o acesso ao sistema lento e desmotivador, bem como, ao facto de um utilizador ter necessidades de informação limitadas.
11/05/20 Gestão de Sistemas de Informação 21
Assim, os dados necessários para a tomada de decisão num dado departamento (ou vários) são carregados do Data Warehouse central para o respectivo Data Mart, possibilitando um acesso mais rápido aos dados. A tendência actual vai para a construção de Data Marts para aplicação específica em alguns departamentos. Apenas a informação necessária para o departamento é que será extraída dos sistemas operacionais .
11/05/20 Gestão de Sistemas de Informação 22
Em resumo, os Data Marts, são mais direccionados para um problema específico, consomem menos recursos, atingem mais depressa os objectivos, são mais facilmente modificáveis num ambiente de mudança e são mais facilmente navegáveis por apresentarem um modelo de dados mais simples. Data Marts descendentes de um Data Warehouse central
11/05/20 Gestão de Sistemas de Informação 23
11/05/20 Gestão de Sistemas de Informação 24 Caracteristicas de um DW
Como um sistema complexo que é, e de grande dimensão,
o Data Warehouse apresenta diversas características, as quais têm de ser levadas em conta na sua concepção: 1. Modelo de Dados 2. Integração dos Dados 3. Metadata 4. On‐Line Analytical Processing (OLAP) 5. Dimensão