Você está na página 1de 6

CONCEITOS

Data Warehouse  armazenamento de dados correntes e históricos para posterior


análise e tomadas de decisão. O Data warehouse consolida e padroniza todos os
dados de diferentes bancos de dados para que as informações possam ser usadas de
forma gerencial para tomada de decisões.

Data mart  é sub-conjunto de dados de um Data warehouse. Geralmente são dados


referentes a um assunto em especial ou diferentes níveis de sumarização, que
focalizam uma ou mais áreas específicas. Seus dados são obtidos do DW,
desnormalizados e indexados para suportar intensa pesquisa.

Uma empresa pode criar um Data Warehouse para armazenar e centralizar todas as
informações ou pode criar vários Data Mart´s dividindo as informações dentro do Data
Warehouse.

Exemplo da Função: Podemos criar um Data Warehouse contendo informações


centrais de todas as áreas: e subdividindo data mart´s em clientes, software, recursos
humanos, comercial, financeiro, infraestrutura.

As ferramentas utilizadas para consolidar, acessar e analisar esse grande numero de


informações que foram consolidadas no Data warehouse, são as ferramentas de
inteligência empresaria (BI). Entre as principais ferramentas para inteligência
empresarial estão os software para consulta e emissão de relatórios de banco de
dados, as ferramentas para análise multidimensional de dados e o data mining.

O BI confere as empresas a capacidade de acumular informações , adquirir


conhecimentos sobre os clientes, concorrentes e operações internas e mudar o
comportamento de tomada de decisões para ter maiores lucros e metas corporativas.

Business Intelligence  proporcionar ao negócio das empresas estrutura e


embasamento para tomada de decisões através do uso e conjunto de técnicas e
ferramentas:

- acessa os dados, integra de diferentes fontes e armazena.

- analisa e transforma esses dados em informação

- apresenta os resultados

Big Data  grande volume de dados de fontes diferentes e autônomas

Text Mining  análise minuciosa de dados não estruturados. E-mails, memorandos,


arquivos de texto, etc.

Hoje existem ferramentas que fazem análise de dados não estruturados. Essas
ferramentas são capazes de extrair elementos chaves de grande conjunto de dados
não estruturados, descobrir padrões e relacionamentos, e resumir informações.

Data Mining  Prospecção de dados ou mineração de dados é o processo de


explorar grandes quantidades de dados à procura de padrões consistentes, como
regras de associação ou sequências temporais, para detectar relacionamentos
sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.

Tipo de informações obtidos com o data mining:

Associações: ocorrências ligadas a um único evento. Exemplo de uma promoção, qual


é mais rentável? A venda de salgadinhos ou de refrigerantes?
Sequencia: é uma sequencia de eventos analisadas durante um tempo. Compra-se
uma casa, depois de um tempo, compra-se uma geladeira e depois de um tempo, um
fogão.

Classificação: modelos que descrevem o grupo ao qual item pertence. Exemplo:


identificar qual o perfil de clientes que podem abandonar um serviço de telefonia.

Aglomeração (clustering): reunião dos grupos para posterior utilizar a classificação.

Prognóstico: definir padrões nos dados

Análise preditiva  usa técnicas de data mining, dados históricos e suposições sobre
condições futuras para predizer resultados de eventos.

OLAP  (Processamento Analítico On-Line) é uma ferramenta de Business


Inteligente utilizada para apoiar as empresas na análise de suas informações, visando
obter novos conhecimentos que são empregados na tomada de decisão.

O OLAP permite uma análise multidimensional dos mesmos dados olhando por
diferentes maneiras.

O OLAP permite que os usuários tenham respostas de dados on-line sobre questões
específicas.

Para utilizar o OPLAP e a análise de dados orientada por consulta, os usuários


precisam saber exatamente a informação que estão procurando.

O termo OLAP refere-se a um conjunto de ferramentas voltadas para acesso e


análise ad hoc de dados, com o objetivo final de transformar dados em informações
capazes de dar suporte as decisões gerenciais de forma amigável e flexível ao usuário
e em tempo hábil.

Para a implantação do sistema OLAP foram considerados os seguintes fatores:


planejamento; levantamento de requisitos e modelagem; projeto físico da base de
dados; desenvolvimento; mapeamento das fontes de dados; utilização de ferramentas
para conversão de dados; automação dos processos; criação de um conjunto inicial de
relatórios; treinamento e suporte aos usuários.
ETL  Extração, Transformação e Carga (em inglês Extract, Transform and Load) e
trata da sistematização do tratamento e limpeza dos dados oriundos dos diversos
sistemas organizacionais (OLTP) para a inserção, geralmente, em um DW ou Data
Mart.

Como podemos perceber, esse processo possui três etapas. A primeira é a extração
(extract), a segunda a transformação (transform) e por fim, a carga (load). Cada uma
delas possui grande importância para o sucesso da transição dos dados dos sistemas
de origem para o DW.

A etapa de extração pode ser entendida como a fase onde os dados são extraídos dos
OLTPs e conduzidos para a staging area (área de transição ou área temporária), onde
são convertidos para um único formato. A conversão se faz necessária devido a
heterogeneidade existente nas informações oriundas desses sistemas, sendo
essencial a conformação prévia para o tratamento adequado.

Após a extração, teremos subsídios para iniciar a etapa de transformação e limpeza


dos dados. Nessa fase são corrigidos, padronizados e tratados os desvios e
inconsistências, transformando os dados de acordo com as regras do negócio.

A etapa de carga ocorre em sequência com a de transformação. Assim que são


efetuados os tratamentos necessários nos dados, a carga no DW é iniciada. Essa fase
se resume na persistência dos dados na base consolidada.

O processo de ETL, por exemplo, é essencial para a criação das estruturas de


Dimensões e Fatos no ambiente do DW. É ele que faz a “ponte” de ligação entre o
operacional e o DW. Devemos escolher bem as ferramentas que darão suporte ao
processo, pois são essenciais para a correta execução das atividades do ETL.
O ETL é fundamental para qualquer iniciativa de DW. Porém deve ser planejado com
cuidado para não comprometer os sistemas transacionais (OLTP) das empresas. Um
bom ETL deve ter escalabilidade e ser manutenível.

Além disso, devemos analisar a janela de operação do ETL. Não é em qualquer


momento que ele poderá ser executado. Do mesmo modo, devemos analisar a
periodicidade de execução, como também definir qual será o alcance de dados que o
ETL irá abranger. Esses detalhes são críticos para o sucesso do processo.

Portanto, devemos tratar o ETL como sendo o “cordão umbilical” que une e possibilita
a condução dos dados ao DW. O processo deve ser bem planejado para evitar
transtornos futuros e até mesmo para que não ocasione, em casos extremos, a
interrupção dos sistemas operacionais da empresa. Dessa forma, o DW terá
informações tratadas, com qualidade e grande valor para apoiar as decisões
organizacionais.

Smart Business Application Development &Test  é um Sistema da IBM que para


desenvolvimento e teste de software de nuvem. + sobre computação em nuvem no
capitulo 11.
Sistemas de Apoio a Decisão

Sistemas de Informações Gerenciais (SIG)  análise de problemas estruturados

Sistema de Apoio a Decisão (SAD)  análise de problemas semi-estruturados e não


estruturados.

Você também pode gostar