Escolar Documentos
Profissional Documentos
Cultura Documentos
O QUE ?
Datawarehouse
Infelizmente, esta viso bastante limitada sobre o que Datawarehouse no inclui
todos os recursos e caractersticas que as pessoas costumam lhe associar.
Por exemplo, se voc fizer uma cpia dos dados de um sistema de mbito operacional e
associ-la a algum tipo de ferramenta de consulta, banco de dados multidimensional,
ou rede neural estar transformando esse banco de dados read-only em um
dawarehouse?
Datawarehouse
um sistema de administrao de banco de dados relacional (RDMS)
especificamente projetado para satisfazer as necessidades de sistemas de
processamento de transaes. Pode ser definido como repositrio de dados
centralizado que pode ser examinado para benefcio de negcio.
Datawarehousing
uma nova tcnica poderosa que torna possvel extrair dados operacionais
arquivados e inconsistncias superadas entre formatos de dados de legado
diferentes. Como tambm integram dados ao longo de um empreendimento,
indiferentemente da localizao, formato, ou exigncias de comunicao possvel
incorporar informao adicional ou especialista. , o vinculo lgico entre o que os
gerentes vem no apoio de suas deciso de aplicaes de EIS e as atividades
operacionais da companhia John McIntyre de Instituto de SAS Inc, em outras
palavras o Datawarehouse prove dados que j so transformados e resumidos e
por esta razo fazem isto em um ambiente apropriado para maior eficincia de
aplicaes de DSS e de EIS.
Datawarehouse
OBJETIVO
Datawarehouse
CARACTERSTICAS DE UM DATAWAREHOUSE
De acordo com Bill Inmon, autor de CONSTRUO DE UM DATAWAREHOUSE e o guru
que considerado ser o criador do conceito de data warehousing ,h geralmente quatro
caractersticas que descrevem um data warehouse:
variante de tempo: O data warehouse contm um lugar para armazenar dados que
possuem de cinco para dez anos de utilizao, ou mais, sendo usado para
comparaes, tendncias e prevenes. Estes dados no so atualizados.
Seguradoras
- Empresas de seguros, so pioneiras em diversos assuntos
relacionados a anlise da premiao dos seus segurados, como Gerenciamento de
Riscos e tambm a utilizao de datawarehouse. Aps analisarem os dados de seus
clientes, descobriram que as mulheres e as pessoas com idade acima de 40 anos e
que dirigem a mais de 5 anos, representam uma categoria de clientes que apresentam
uma baixa quantidade sinistros. Tendo posse deste fato, as seguradoras, conseguiram
montar planos que diferenciavam os clientes com estas caractersticas. Esta anlise,
fez com que tanto as seguradores como os segurados com tal caracterstica, fossem
beneficiados. O principal objetivo de desempenho atendido o da Qualidade, pois ir
satisfazer o cliente aquela seguradora que garantir maiores descontos e um lucro
maior. E ir satisfazer a seguradora, quando se identificar melhor o seu segurado.
Datawarehouse
Rede Hoteleira A rede hoteleira que ao longo do tempo, passou a conhecer melhor
seus clientes e a dar um atendimento personalizado aos mesmos. Em alguns hotis,
durante a primeira hospedagem, faz-se um levantamento de todos os dados que o
hspede gosta ou deixa de gostar, recolhe-se o maior nmero de informaes
possveis, tomando o cuidado sempre de no estar invadindo a privacidade do
mesmo. E na prxima vez que o cliente vier a se hospedar no hotel, o atendimento
ser totalmente personalizado de acordo com as informaes fornecidas e
armazenadas anteriormente. mais um caso onde tanto o hotel, quanto o hspede,
se beneficia com isso. Este um perfeito exemplo, que se enquadra mais no objetivo
de desempenho da Flexibilidade, pois os hotis para satisfazerem tantos clientes, com
gostos to distintos, precisam possuir uma estrutura muito flexvel. E ainda mais
flexvel, quando algum evento quebra a rotina do hotel.
Datawarehouse
Destinado a Gerentes
Suporte provido por vrios nveis de gerenciamento, variando da Alta Gerncia a
gerentes de nveis mais baixos.
Serventia a Grupos e a Indivduos
Suporte provido aos indivduos como tambm para grupos. Menores problemas de
estruturas requerem freqentemente o envolvimento de vrios indivduos de diferentes
departamentos e nveis organizacionais diferentes.
Interdependncia ou Deciso Seqencial
SAD provm suporte para os departamentos. Independentemente do grau decisrio e/ou
uma deciso seqencial do problema.
Suporte para todo Corpo Decisrio
D suporte a todas as fases do processo de tomada de deciso, Estratgia, Projeto,
Escolha da Soluo e Implementao.
Suporte Varivel aos Estilos
Suporte para a variedade de estilos no processo de deciso.
Adaptao e flexibilidade
Adaptao dos dados com o passar do tempo. A tomada de deciso deve ser capaz de
confrontar condies de mudanas rpidas e adaptar o Sistema para estas mudanas.
Deve haver uma flexibilidade para o usurio somar, excluir, combinar, trocar ou reformular
elementos bsicos no processo decisrio.
Facilidade Interativa de Uso
O usurio deve sentir-se a vontade com o Sistema. Um ambiente amigvel, o
relacionamento homem-mquina deve ser de fcil interao.
Efetividade, no Eficincia
O Sistema tenta melhorar a efetividade de deciso que faz preciso, oportunidade e
qualidade, em lugar de sua eficincia na tomada de decises.
Controle Humano da Mquina
O responsvel pela tomada de deciso tem controle completo sobre todos os passos do
processo decisrio, para resolver um problema. Um SAD especificamente deseja dar
suporte e no substituir o tomador de deciso.
Facilidade de Construo para Usurio Final
Usurios finais devem construir e modificar o sistema de forma simples por eles mesmos.
Datawarehouse
Modelagem e Anlise
Um SAD normalmente utiliza modelos para analisar situaes de tomadas de deciso. A
capacidade de modelagem, aumenta a experimentao para a rea estratgica decidir
sobre assuntos de diferentes configuraes.
Dados de Acesso
O SAD deveria prover acesso para uma variedade de fontes de dados, formatos, e tipos,
percorrendo geograficamente o sistema de informao.
PROCESSOS EM UM DATAWAREHOUSE
A primeira fase no data warehousing "separar" sua informao operacional atual, e para
preservar a segurana e a integridade de aplicaes OLTP de misso-crtica, enquanto d a
voc acesso mais larga possvel base de dados. O banco de dados resultante ou data
warehouse podem consumir centenas de gigabytes - ou at terabytes - de espao de disco, o
que requerido ento so tcnicas eficientes para armazenar e recuperar quantias
volumosas de informao. Crescentemente, grandes organizaes acham que somente
sistemas de processamento paralelo oferecem para largura de banda suficiente.
O datawarehouse assim recupera dados de uma variedade de bancos de dados operacionais
heterogneos. Os dados so transformados ento e so entregues ao warehouse/store de
dados baseado em um modelo selecionado (ou definio traada). A transformao dos
dados e a movimentao dos processos so executados sempre que uma atualizao para
os dados de warehouse requerida assim a deve existir alguma forma de automatizao
para
administrar
e
executar
estas
funes.
A informao que descreve o modelo e a definio dos elementos de fonte de dados so
chamados "elementos metadata". O metadata o meio pelo qual o usurio final encontra e
entende os dados no warehouse e uma importante parte do warehouse.
O METADATA deve ao menos conter:
a . A estrutura dos dados;
b . O algoritmo usado para summarization;
c . A cartografia do ambiente operacional para o data warehouse.
Datawarehouse
LIMPEZA DOS DADOS
um aspecto importante para a criao de um eficiente datawarehouse naquilo que
a remoo de certos aspectos de dados operacionais, como informao de transao
de
baixo
nvel
que
abaixam
os
tempos
de
query.
A fase de limpeza tem que ser to dinmica quanto possvel para acomodar todos os
tipos de querys at mesmo aquelas que podem requerer informao de baixo nvel.
Dados deveriam ser extrados de fontes de produo em intervalos regulares e
deveriam ser agrupados centralmente mas o processo de limpeza tem que remover
duplicao e reconciliar diferenas entre vrios estilos de coleo de dados.
Uma vez que os dados foram limpos, eles so ento transferidos ao data warehouse
que tipicamente ou um grande banco de dados de desempenho alto SMP(MultiProcessamento Simtrico) ou MPP( Processamento Maciamente Paralelo).
PODER DE MASTIGAO
O Poder de mastigao de nmeros outro aspecto importante de data warehousing
por causa da complexidade envolvida no processamento de querys ad hoc e por
causa das vastas quantidades de dados que a organizao querem usar no
warehouse.
Um datawarehouse pode ser usado de modos diferentes como por exemplo pode ser usado
como uma loja central contra a qual as querys so "rodadas" ou pode ser usado como um
mercado de dados. Mercados de dados que so pequenos warehouse
podem ser
estabelecidos para prover subconjuntos da loja principal e prover informao resumida
dependendo
das exigncias de um grupo / departamento especfico.
A aproximao da loja central geralmente usa estrutura de dados muito simples com muito
pequenas suposies sobre as relaes entre dados enquanto que mercados usam
freqentemente bancos de dados multidimensionais que podem acelerar processamento de
querys que como ela podem ter estrutura de dados que refletido em perguntas provveis.
Muitos vendedores tm produtos que provem de uma ou mais funes de data warehouse
descritas acima . Porm, pode levar uma quantia significante de trabalho e programao
especializada para prover a interoperabilidade necessria entre produtos de mltiplos
vendedores e os permitir a executar os processos de data warehouse exigidos. Uma
implementao tpica normalmente envolve uma mistura de produtos de uma variedade de
provedores.
Datawarehouse
UM MODELO DE DATAWAREHOUSE
Data Warehousing o processo de extrair e transformar dados operacionais em dados
informadores e carreglos em uma loja de dados central ou warehouse. Uma vez que os
dados esto carregados ele acessvel por querys de desktop e ferramentas de anlise
pelos fabricantes de deciso.
Os dados dentro do atual warehouse tem uma estrutura distinta com a nfase
em nveis diferentes de resumo.
Os dados correntes detalhados so importantes porque:
sempre (quase) so armazenados em unidades de disco que rpido ter acesso mas
caro e de administrao complexa.
Datawarehouse
Fontes de Pesquisa
DATAWAREHOUSE Conceitos, Tecnologias, Implementao e Gerenciamento
Autor : Harry S.Singh
Sytes da Internet.