Escolar Documentos
Profissional Documentos
Cultura Documentos
04 BDsDistr
04 BDsDistr
Conjunto de dados organizados, compartilhados e integrados, que seguem um conjunto de regras de formao e contedo. Normalmente este conjunto de dados se encontra centralizado, ou seja, os dados esto armazenados em apenas um local.
Independncia de localizao
Independncia de localizao Apesar de existir fisicamente a distribuio dos dados, esta deve estar em um nvel lgico para o usurio, permitindo o acesso aos dados de maneira transparente.
Esquema de um SBBD
Arquitetura de um SBBD
A imagem no pode ser exibida. Talv ez o computador no tenha memria suficiente para abrir a imagem ou talv ez ela esteja corrompida. Reinicie o computador e abra o arquiv o nov amente. Se ainda assim aparecer o x v ermelho, poder ser necessrio excluir a imagem e inseri-la nov amente.
Client 1
Client 2
...
Client M
A imagem no pode ser exibida. Talv ez o computador no tenha memria suficiente para abrir a imagem ou talv ez ela esteja corrompida. Reinicie o computador e abra o arquiv o nov amente. Se ainda assim aparecer o x v ermelho, poder ser necessrio excluir a imagem e inseri-la nov amente.
Unified Schema
Schema 1 Schema 2
...
Schema N
Distributed Database
DDBMS
Distributed Database
DDBMS
...
Distributed Database
DDBMS
Em 1987, C. J. Date, um dos primeiros projetistas de bancos de dados relacionais, junto com o Dr. E. F. Codd, autor da teoria relacional, props 12 regras que um SGBDD completo deveria seguir.
Gateway 1 DBMS 1
Gateway 2 DBMS 2
Gateway 3 DBMS 3
2.
5.
3.
6.
Recent Trends
(Ramakrishnan and Gehrke, 1999)
Vantagens de SGBDD
(em relao a SGBD centralizado) Compartilhamento de dados e controle distribudo: Existe um administrador global, responsvel pelo sistema como um todo, mas parte das responsabilidades so delegadas a administradores locais que gozam de certa autonomia. Maior confiabilidade: O sistema funciona conforme o projeto. Maior disponibilidade: O sistema est disponvel por maior percentual de tempo. Melhor desempenho no processamento de consultas: Sub-consultas podem ser executadas em paralelo. Maior escalabilidade: mais fcil acrescentar um n, desde que os mesmos sejam autnomos, do que substituir um sistema centralizado existente por um maior.
Users have to be aware of where data is located, i.e., Distributed Data Independence and Distributed Transaction Atomicity are not supported. These properties are hard to support efficiently. For globally distributed sites, these properties may not even be desirable due to administrative overheads of making the location of data transparent.
Desvantagens de SGBDD
(em relao a SGBD centralizado) Custo de desenvolvimento do software: A alta complexidade torna mais difcil implementar um SGBDD, tornando-o mais caro. Grande potencial para bugs: Ocorrncia de erros muito sutis na colaborao entre os ns do SGBDD. Aumento do overhead de processamento: Devido troca de mensagens e computao adicional para obter a coordenao entre os ns. Questes de projeto especficas: Por exemplo, replicao e fragmentao de dados. Dificuldades para obter conhecimento global: Por exemplo, controle de concorrncia entre transaes distribudas e deteco de deadlock.
Melhoria de desempenho
Fragmentao de dados
Replicao de dados
Rplicas dos dados em diferentes ns Aumento do paralelismo Aumento da disponibilidade de dados Elevao do overhead de atualizao Melhora desempenho das operaes de leitura, enquanto acarreta maior overhead nas atualizaes
Uma relao dividida em fragmentos, que so armazenados em diferentes ns. Fragmentao horizontal: os fragmentos so definidos por seleo de tuplas. Fragmentao vertical: os fragmentos so definidos por projeo de atributos.
Exemplo de Fragmentao
Replicao Assncrona: As cpias da relao modificada s so atualizadas periodicamente; rplicas podem ficar inconsistentes por algum tempo
Os usurios devem estar cientes da distribuio e replicao Produtos atuais seguem esta abordagem
Consultas Distribudas
SELECT AVG(sal) FROM TopModels M WHERE M.age > 20 AND M.age < 35
Fragmentao horizontal: Modelos com idade < 25 no Rio e idade >= 25 em SP Pode-se computar AVG(salary) em ambos o ns Como calcular a mdia geral dos salrios Pode-se trazer ambas os dados de ambas as relaes Fragmento vertical: vertical mid e age em SP, mid, name and sal no Rio Pode-se reconstruir a relao de modelo atravs de juno no atributo mid, e ento processar a consulta
2. Commit:
a) Se todos os participantes esto prontos, o coordenador envia um sinal de commit para cada participante, que o executa. b) Se algum dos participantes falhar na preparao para o commit, este notifica o coordenador, que envia um sinal de rollback para todos os participantes.
Mtodos otimistas
Livre execuo das operaes Monitoramento de conflitos (via grafos/rvores de execuo e/ou relgios lgicos) Em caso de conflito, a transao mais nova pode ser desfeita, para depois ser realizada novamente
Coordenador nico
Simples, mas com um ponto de falha e gargalo
Protocolo desviado
Bloqueio partilhado leitura (somente local) Bloqueio exclusivo escrita (todas as rplicas)
Protocolo de eleies
Gerenciamento local e trocas de requisies
Grafos de espera
T1
T2
T1
T2
Site A
Site B
T1
T2
Global