Você está na página 1de 2

Banco de dados Distribudos Aula 2 A arquitetura de memria compartilhada a mais prxima de um computador convencional e portar um SGBD para essa

sa arquitetura mais fcil. Embora essa arquitetura possa obter melhor desempenho em escala moderada de paralelismo, quando o nmero de CPUs aumenta muito, passa a existir uma competio entre as CPUs para acesso memria. O mesmo problema ocorre com o aumento de CPUs, em arquitetura de disco compartilhado. A partir de um certo ponto, a velocidade de cada CPU diminui a cada CPU adicionada devido competio pelo acesso memria e aos discos. Portar um SGBD para a arquitetura nada compartilhada mais difcil, porm essa arquitetura tem um aumento de desempelho linear medida que mais CPUs so adicionadas.

Avaliao de Consultas O plano de execuo de uma consulta relacional um grafo de operadores algbricos e esses operadores podem ser executados em paralelo. Se um operador consome a sada de outro operador, temos o paralelismo em pipeline (a sada do segundo operador utilizada pelo primeiro operador assim que gerada). O paralelismo em pipeline limitado pela presena de operadores que bloqueiam (operadores que no produzem nenhuma sada at consumir todas as entradas) como, por exemplo, ordenao e agregao. Outra forma de paralelizao das consultas a avaliao em paralelo de dados particionados, que permite a execuo de um operador em paralelo ao dividir o processamento desse operador em diferentes parties. Um dos motivos de sucesso dos bancos de dados paralelos em arquiteturas nada compartilhado que a avaliao das consultas relacionais muito receptiva a avaliao em paralelo de dados particionados.

Banco de Dados Distribudos Um banco de dados distribudo uma coleo de vrios bancos de dados logicamente inter-relacionados, distribudos por uma rede de computadores. Um sistema de gerenciamento de banco de dados distribudo um sistema que permite o gerenciamento de bancos de dados distribudos e que torna essa distribuio transparente para os usurios. As principais vantagens dos bancos de dados distribudos so: - Desempenho: A distribuio dos dados possibilita que esses dados estejam armazenados nos sites onde sero utilizados, evitando os atrasos no acesso remoto, alm disso, as consultas podem ser paralelizadas entre os diversos ns do banco de dados. - Disponibilidade: A existncia de diversos ns permite que o banco continue disponvel mesmo com a queda de um dos ns, com a replicao dos dados possvel que todo o banco seja capaz de continuar disponvel mesmo com a queda de um ou mais ns. - Expanso: Expandir um banco de dados distribudo composto de servidores de pequeno ou mdio porte acrescentando mais ns pode ser muito mais simples do que expandir um servidor de banco de dados de grande porte. Propriedades A viso clssica de um sistema de banco de dados distribudos que o sistema deve tornar o impacto da distribuio de dados transparente. Em particular as seguintes propriedades so consideradas desejveis: - Independncia dos Dados Distribudos: Os usurios devem ser capazes de fazer consultas sem especificar onde as relaes (ou cpias ou fragmentos das relaes) estejam localizadas, esse princpio uma extenso natural da independncia fsica e lgica. As consultas devem ser otimizadas considerando os custos de comunicao e de computao dos diversos ns. Esses princpios levam a transparncia de rede, de replicao e de fragmentao. - Transparncia de Rede: Os usurios devem ser protegidos contra os detalhes operacionais da rede. desejvel ocultar at mesmo a existncia da rede, se possvel. A transparncia de rede pode ser dividida em transparncia de localizao, que se refere ao fato de que o comando usado para executar uma tarefa independente tanto da localizao dos dados quanto dos sistemas em que a operao executada, e a transparncia de nomenclatura, que significa que o nome dos objetos do banco de dados devem ser nicos e sem dependncia da localizao do objeto. - Transparncia de Replicao: No deve ser necessrio que os usurios saibam da existncia de cpias dos dados e se esto acessando os dados originais ou cpias. O sistema deve tratar de gerenciamento de cpias e o usurio deve agir como se houvesse uma nica cpia dos dados - Transparncia de Fragmentao: Quando os objetos do banco de dados esto fragmentados, as consultas dos usurios que forem especificadas sobre relaes inteiras tm que ser executadas em subrelaes. As estratgias de execuo devem ser determinadas pelo sistema sem a participao ou conhecimento do usurio. - Atomicidade da Transao Distribuda: Os usurios devem ser capazes de escrever transaes que acessam e atualizam dados em diversos sites como se estivessem armazenados localmente. As transaes distribudas devem seguir o mesmo princpio de atomicidade das transaes locais. Embora essas propriedades sejam desejveis, em certas situaes essas propriedades no so eficientemente atingveis (como por exemplo, quando os ns so conectados por uma rede lenta). O custo para atingir essas propriedades pode tornar necessrio flexibilizar ou ignorar algumas dessas questes.

Você também pode gostar