Você está na página 1de 9

14/03/2017 Bancos de dados/Estrutura de armazenamento - Wikilivros

Bancos de dados/Estrutura de armazenamento


Origem: Wikilivros, livros abertos por um mundo aberto.
< Bancos de dados

Existem diversos tipos de armazenamento de dados. Estes meios so classificados de acordo com sua
velocidade de acesso e sua disponibilidade. Podemos definir uma hierarquia dos tipos de armazenamento de
dados onde geralmente aqueles de maior capacidade tem menor velocidade de acesso. Assim temos em ordem
de maior para menor velocidade (e de menor capacidade para o maior):

1. Cache
2. Memria Principal
3. Memria Flash
4. Disco Magntico
5. Disco tico
6. Fitas magnticas

Entre os dispositivos disponveis esto:

Cache:O cache do processador a forma de processamento a forma de armazenamento mais rpida,


mas mais cara. Ela pequena e geralmente o tema de gerenciamento do armazenamento em cache no
um tema de preocupao em banco de dados.
Memria principal: Embora a memria principal possa conter gigabytes de dados, de uma forma geral
pequena para armazenar um banco de dados inteiro. O contedo da memria principal pode ser perdido
se ocorrer uma falta de energia ou falha grave de sistema.
Memria Flash: Esta memria difere da memria principal pois os dados sobrevivem em caso de falta
de energia.
Armazenamento em Disco Magntico: O principal meio para armazenamento de dados por longos
perodos e acesso on-line. Normalmente os bancos de dados so armazenados desta forma. Os dados so
ento movidos do disco magntico para a memria principal para poderem ser acessados. So ento
executadas as operaes e os dados modificados so escritos no disco. O armazenamento em disco
chamado de memria de acesso direto, j que possvel ler os dados no disco em qualquer ordem. Os
discos podem falhar, mas estas falhas ocorrem com menos frequncia do que as falhas de sistema.
Armazenamento tico: Um exemplo deste tipo de armazenamento o CD-ROM, sendo os dados
armazenados oticamente no disco e lidos por laser.
Armazenamento em fita: Este tipo de armazenamento utilizado principalmente para backups. O
acesso aos dados mais lento devido ao fato de que o acesso aos dados deve ser feito de forma
sequencial (acesso sequencial).

ndice
1 Discos
2 Blocos
3 RAID (Redundante Arrays of Independent Disks)
3.1 Arquiteturas de RAID
3.1.1 Implementao Via software
3.1.2 Implementao Via hardware
3.1.2.1 Fake RAID
3.1.2.2 Comparao entre as arquiteturas
3.2 Nveis de RAID
3.2.1 RAID 0 Linear
3.2.2 RAID 0 Striping
3.2.3 RAID 1

https://pt.wikibooks.org/wiki/Bancos_de_dados/Estrutura_de_armazenamento 1/9
14/03/2017 Bancos de dados/Estrutura de armazenamento - Wikilivros

3.2.4 RAID 2
3.2.5 RAID 3
3.2.6 RAID 4
3.2.7 RAID 5
3.2.8 RAID 6
3.2.9 RAID 0 (zero) + 1
3.2.10 RAID 1+0
3.2.11 RAID 50
3.2.12 RAID 100
4 Organizao de Arquivos

Discos
Para ler e gravar informaes em um disco so utilizadas cabeas magnticas de Leitura/Gravao. As medidas
de desempenho de qualidade em um disco so a capacidade, o tempo de acesso, a taxa de transferncia de
dados e a confiabilidade. O tempo de acesso o tempo que o gasto desde que solicitado um pedido de
leitura/escrita at o incio de transferncia dos dados. Desta forma, o brao com a cabea de leitura/gravao
posiciona-se sobre a trilha onde esto os dados e espera que o setor aparea sob a cabea de leitura e escrita
enquanto o disco gira. O tempo de reposicionamento do brao o que conhecemos como tempo de procura
(seek time), aumentando de acordo com a distncia que o brao deve se mover. O tempo gasto aguardando que
o setor a ser acessado fique sob a cabea de leitura e escrita chamada de tempo de latncia rotacional. O
tempo de acesso aos dados a soma do tempo de procura e do tempo de latncia.

Uma vez que o primeiro setor de dados a ser acessado chegou sob a cabea de leitura e escrita a transferncia
de dados tem incio. A taxa na qual os dados so recuperados ou armazenados no disco chamada de taxa de
transferncia de dados. A ltima medida utilizada com frequncia o tempo mdio para ocorrncia de falha,
que trata da medida de confiabilidade de disco, onde o tempo mdio para a ocorrncia de falha de um
disco , na mdia, a quantidade de tempo que se pode esperar que o sistema trabalhe sem falhas.

Blocos
Para requisies de gravao e leitura em um banco de dados, o SGBD faz uma solicitao que especifica o
endereo no disco a ser referenciado, sendo que este endereo est no formato de nmero de bloco. Um bloco
uma sequncia contgua de bytes (setores) de uma nica trilha em um prato. Os dados so transferidos entre o
disco e a memria principal em unidades de bloco.

RAID (Redundante Arrays of Independent Disks)


Utilizar um grande nmero de discos pequenos e baratos para armazenar dados pode ser mais eficiente do que
utilizar nmeros menores de discos grandes e mais caros. Um grande nmero de discos em um sistema d a
oportunidade de melhorar a taxa na qual os dados so lidos/escritos, se os discos so operados em paralelo. Esta
configurao tambm permite melhorar a confiabilidade do armazenamento de dados, porque as informaes
podem ser armazenadas de forma redundante em diferentes discos, fazendo com que a falha em um disco no
leve perda dos dados.

Redundant Array of Independent Drives ou Conjunto Redundante de Discos Independentes um meio de


se criar um sub-sistema de armazenamento composta por vrios discos individuais, com a finalidade de ganhar
segurana e desempenho.

Popularmente, RAID seriam dois ou mais discos (por exemplo, HD ou disco rgido) trabalhando
simultaneamente para um mesmo fim. Apesar do RAID oferecer segurana e confiabilidade na adio de
redundncia e evitar falhas dos discos, o RAID no protege contra falhas de energia ou erros de operao.

https://pt.wikibooks.org/wiki/Bancos_de_dados/Estrutura_de_armazenamento 2/9
14/03/2017 Bancos de dados/Estrutura de armazenamento - Wikilivros

Falhas de energia, cdigo errado de kernel ou erros operacionais podem danificar os dados de forma
irrecuperveis.

O RAID foi proposto em 1988 por David A. Patterson, Garth A. Gibson e Randy H. Katz na publicao "Um
Caso para Conjuntos de Discos Redundantes Econmicos (RAID)". Publicado na Conferncia SIGMOD de
1988: pp. 10916.

Entre as vantagens obtidas podemos destacar:

1. Ganho de desempenho no acesso.


2. Redundncia em caso de falha em um dos discos.
3. Uso mltiplo de vrias unidades de discos.
4. Facilidade em recuperao de contedo "perdido".

Arquiteturas de RAID

Implementao Via software

Na implementao via software, o sistema operacional gerencia o RAID atravs da controladora de discos, sem
a necessidade de um controlador de RAIDs, tornando-a mais barata.

Nesse tipo de implementao, todo o processamento necessrio para o gerenciamento do RAID feito pela
CPU. Toda movimentao de dados(leitura e escrita) feita por uma camada de software que faz a abstrao
entre a operao lgica(RAID) e os discos fsicos, e controlada pelo sistema operacional.

A configurao do RAID via software feita pelo sistema operacional, que precisa ter implementado no
prprio kernel a utilizao de RAIDs via software.

Implementao Via hardware

Fake RAID

A implementao via software geralmente no possui uma fcil configurao. J na implementao via
hardware as controladoras tem um preo muito elevado. Ento foi criada uma "controladora barata" que em vez
de um chip controlador RAID voc utiliza uma combinao de funes especiais na BIOS da placa e drivers
instalados no sistema operacional .

Comparao entre as arquiteturas

Ao compararmos RAIDs por software e por hardware percebe-se que os implementados atravs de software so
mais flexveis que os via hardware. Por outro lado, os primeiros exigem da CPU mais tempo de processamento.
Comparando os dispositivos de blocos, os em software tambm so flexveis podendo ser usados em discos
inteiros, parties ou outro dispositivo de bloco.

Nveis de RAID

Nveis de RAID so as vrias maneiras de combinar discos para um fim.

O sistema RAID consiste em um conjunto de dois ou mais discos rgidos com dois objetivos bsicos: 1 - Tornar
o sistema de disco mais rpido (isto , acelerar o carregamento de dados do disco), atravs de uma tcnica
chamada diviso de dados (data striping ou RAID 0); 2 - Tornar o sistema de disco mais seguro, atravs de uma
tcnica chamada espelhamento (mirroring ou RAID 1).

Essas duas tcnicas podem ser usadas isoladamente ou em conjunto.

https://pt.wikibooks.org/wiki/Bancos_de_dados/Estrutura_de_armazenamento 3/9
14/03/2017 Bancos de dados/Estrutura de armazenamento - Wikilivros

RAID 0 Linear

uma simples concatenao de parties para criar uma grande


partio virtual.

RAID 0 Striping

No striping, ou distribuio, os dados so subdivididos em


segmentos consecutivos (stripes, ou faixas) que so escritos
seqencialmente atravs de cada um dos discos de um array,
ou conjunto. Cada segmento tem um tamanho definido em
blocos. A distribuio, ou striping, oferece melhor desempenho
comparado a discos individuais, se o tamanho de cada RAID-0
segmento for ajustado de acordo com a aplicao que utilizar
o conjunto, ou array.

H problemas de confiabilidade e desempenho. RAID 0 no ter


desempenho desejado com sistemas operacionais que no oferecem suporte
a busca combinada de setores. Uma desvantagem desta organizao que a
confiana se torna geometricamente pior. Um disco SLED com um tempo
mdio de vida de 20.000 horas ser 4 vezes mais seguro do que 4 discos
funcionando em paralelo com RAID 0 (admitindo-se que a capacidade de
armazenamento somada dos quatro discos for igual ao do disco SLED).
Como no existe redundncia, no h confiabilidade neste tipo de
organizao.

Vantagens:

- Acesso rpido as informaes (at 50% mais rpido).


- Custo baixo para expanso de memria.

Desvantagens:
RAID-0
- Caso algum dos setores de algum dos HD's venha a apresentar
perda de informaes, o mesmo arquivo que est dividido entre os
mesmos setores dos demais HD's no tero mais sentido existir, pois uma parte do arquivo foi
corrompida, ou seja, caso algum disco falhe, no tem como recuperar.
- No usado paridade.

RAID 1

RAID 1 implementa o espelhamento de disco, tambm conhecido como mirror. Para esta implementao so
necessrios no mnimo dois discos. O funcionamento deste nvel simples: todos os dados so gravados em
dois discos diferentes; se um disco falhar ou for removido, os dados preservados no outro disco permitem a no
descontinuidade da operao do sistema.

Com o RAID 1 consegue-se duplicar o desempenho na leitura de informao, pois as operaes de leitura
podem ser repartidas pelos dois discos.

Vantagens:

- Caso algum setor de um dos discos venha a falhar, basta recuperar o setor defeituoso copiando os
arquivos contidos do segundo disco.
- Segurana nos dados (com relao a possveis defeitos que possam ocorrer no HD).

Desvantagens:
https://pt.wikibooks.org/wiki/Bancos_de_dados/Estrutura_de_armazenamento 4/9
14/03/2017 Bancos de dados/Estrutura de armazenamento - Wikilivros

- Custo relativamente alto se comparado ao RAID 0.


- Ocorre aumento no tempo de escrita.
- No usado paridade.

RAID 2

RAID 2 similar ao RAID 4, mas armazena informao ECC


(Error Correcting Code), que a informao de controle de
erros, no lugar da paridade. Este facto possibilita uma pequena
proteo adicional, porm o RAID 2 ficou obsoleto pelas novas
tecnologias de disco j possurem este tipo de correo
internamente. O RAID 2 origina uma maior consistncia dos
dados se houver queda de energia durante a escrita. Baterias de
segurana e um encerramento correto podem oferecer os
mesmos benefcios RAID-1

Vantagem:

- Usa ECC;

Desvantagem:

- Hoje em dia h tecnologias melhores para o mesmo fim;

RAID 3

RAID 3 similar ao RAID 4, exceto pelo fato de que ele usa o menor
tamanho possvel para o stripe. Como resultado, qualquer pedido de leitura
invocar todos os discos, tornando as requisies de sobreposio de I/O
difceis ou impossveis.

A fim de evitar o atraso em razo da latncia rotacional, o RAID 3 exige


que todos os eixos das unidades de disco estejam sincronizados. A maioria
das unidades de disco mais recentes no possuem a opo de sincronizao
do eixo, ou se so capazes disto, faltam os conectores necessrios, cabos e RAID-1
documentao do fabricante.

Vantagens:

- Leitura rpida
- Escrita rpida
- Possui controle de erros

Desvantagem:

- Montagem difcil via software

RAID 4

Funciona com dois ou mais discos iguais. Um dos discos


guarda a paridade (uma forma de soma de segurana) da RAID-3
informao contida nos discos. Se algum dos discos avariar, a
paridade pode ser imediatamente utilizada para reconstituir o
seu contedo. Os discos restantes, usados para armazenar dados, so configurados para usarem segmentos
suficientemente grandes (tamanho medido em blocos) para acomodar um registro inteiro. Isto permite leituras
independentes da informao armazenada, fazendo do RAID 4 um array perfeitamente ajustado para ambientes
https://pt.wikibooks.org/wiki/Bancos_de_dados/Estrutura_de_armazenamento 5/9
14/03/2017 Bancos de dados/Estrutura de armazenamento - Wikilivros

transacionais que requerem muitas leituras pequenas e simultneas.

O RAID 4 assim como outros RAID's, cuja caracterstica utilizarem paridade, usam um processo de
recuperao de dados mais envolvente que arrays espelhados, como RAID 1. Este nvel tambm til para
criar discos virtuais de grande dimenso, pois consegue somar o espao total oferecido por todos os discos,
exceto o disco de paridade. O desempenho oferecido razovel nas operaes de leitura, pois podem ser
utilizados todos os discos em simultneo.

Sempre que os dados so escritos no array, as informaes so lidas do disco de paridade e um novo dado
sobre paridade deve ser escrito para o respectivo disco antes da prxima requisio de escrita ser realizada. Por
causa dessas duas operaes de I/O, o disco de paridade o fator limitante do desempenho total do array.
Devido ao facto do disco requerer somente um disco adicional para proteo de dados, este RAID mais
acessvel em termos monetrios que a implementao do RAID 1.

Vantagens:

- Taxa de leitura rpida;


- Possibilidade do aumento de rea de discos fsicos.

Desvantagens:

- Taxa de gravao lenta.


- Em comparao com o RAID 1, em caso de falha do disco, a reconstruo difcil, pois o RAID 1 j
tem o dado pronto no disco espelhado.
- Tecnologia no mais usada por haver melhores para o mesmo fim.

RAID 5

O RAID 5
frequentemente usado e
funciona similarmente ao
RAID 4, mas supera alguns
dos problemas mais
comuns sofridos por esse
tipo. As informaes sobre
paridade para os dados do
array so distribudas ao
longo de todos os discos do
RAID-5
array , ao invs de serem
armazenadas num disco
dedicado, oferecendo assim mais desempenho que o RAID 4, e,
simultaneamente, tolerncia a falhas.

Para aumentar o desempenho de leitura de um array RAID 5, o RAID-5


tamanho de cada segmento em que os dados so divididos pode
ser otimizado para o array que estiver a ser utilizado. O
desempenho geral de um array RAID 5 equivalente ao de um RAID 4, exceto no caso de leituras sequenciais,
que reduzem a eficincia dos algoritmos de leitura por causa da distribuio das informaes sobre paridade. A
informao sobre paridade distribuda por todos os discos; perdendo-se um, reduz-se a disponibilidade de
ambos os dados e a paridade, at recuperao do disco que falhou. Isto causa degradao do desempenho de
leitura e de escrita.

Vantagens:

- Maior rapidez com tratamento de ECC.


- Leitura rpida (porm escrita no to rpida).

https://pt.wikibooks.org/wiki/Bancos_de_dados/Estrutura_de_armazenamento 6/9
14/03/2017 Bancos de dados/Estrutura de armazenamento - Wikilivros

Desvantagem:

- Sistema complexo de controle dos HD's.

RAID 6

um padro relativamente novo, suportado por apenas algumas controladoras. semelhante ao RAID 5,
porm usa o dobro de bits de paridade, garantindo a integridade dos dados caso at 2 dos HDs falhem ao
mesmo tempo. Ao usar 8 HDs de 20 GB cada um em RAID 6, teremos 120 GB de dados e 40 GB de paridade.

Vantagem:

- Pode falhar 2 HD's ao mesmo tempo.

Desvantagens:

- Precisa de N+2 HD's para implementar por causa dos discos de paridade.
- Escrita lenta.
- Sistema complexo de controle dos HD's.

RAID 0 (zero) + 1

O RAID 0 + 1 uma combinao dos nveis 0 (Striping) e 1 (Mirroring),


onde os dados so divididos entre os discos para melhorar o rendimento,
mas tambm utilizam outros discos para duplicar as informaes. Assim,
possvel utilizar o bom rendimento do nvel 0 com a redundncia do nvel
1. No entanto, necessrio pelo menos 4 discos para montar um RAID
desse tipo. Tais caractersticas fazem do RAID 0 + 1 o mais rpido e
seguro, porm o mais caro de ser implantado. No RAID 0+1, se um dos
discos vier a falhar, o sistema vira um RAID 0.

Vantagens:

- Segurana contra perda de dados.


- Pode falhar metade dos HD's ao mesmo tempo, porm deixando de
RAID-0+1
ser RAID 0 + 1.

Desvantagens:

- Alto custo de expanso de hardware (custo mnimo = 2N HD's).


- Os drivers devem ficar em sincronismo de velocidade para obter a mxima performance.

RAID 1+0

O RAID 1+0, ou 10, exige ao menos 4 discos rgidos. Cada par ser espelhado, garantindo redundncia, e os
pares sero distribudos, melhorando desempenho. At metade dos discos pode falhar simultaneamente, sem
colocar o conjunto a perder, desde que no falhem os dois discos de um espelho qualquer razo pela qual
usam-se discos de lotes diferentes de cada lado do espelho. o nvel recomendado para bases de dados, por
ser o mais seguro e dos mais velozes, assim como qualquer outro uso onde a necessidade de economia no se
sobreponha segurana e desempenho.

Vantagens:

- Segurana contra perda de dados.


- Pode falhar um ou dois dos HD's ao mesmo tempo, dependendo de qual avaria.

Desvantagens:
https://pt.wikibooks.org/wiki/Bancos_de_dados/Estrutura_de_armazenamento 7/9
14/03/2017 Bancos de dados/Estrutura de armazenamento - Wikilivros

- Alto custo de expanso de hardware (custo mnimo = 2N HD's).


- Os drivers devem ficar em sincronismo de velocidade para obter a
mxima performance.

RAID 50

um arranjo hbrido que usa as tcnicas de RAID com paridade em


conjuno com a segmentao de dados. Um arranjo RAID-50
essencialmente um arranjo com as informaes segmentadas atravs de
dois ou mais arranjos. Veja o esquema representativo abaixo:
RAID-10

RAID 0
/-----------------------------------------------------\
| | |
RAID 5 RAID 5 RAID 5
/-----------------\ /-----------------\ /-----------------\
| | | | | | | | |
120 GB 120 GB 120 GB 120 GB 120 GB 120 GB 120 GB 120 GB 120 GB
A1 A2 Ap A3 A4 Ap A5 A6 Ap
B1 Bp B2 B3 Bp B4 B5 Bp B6
Cp C1 C2 Cp C3 C4 Cp C5 C6
D1 D2 Dp D3 D4 Dp D5 D6 Dp

Vantagens:

- Alta taxa de transferncia.


- timo para uso em servidores.

Desvantagens:

- Alto custo de implementao e expanso de memria.

RAID 100

O RAID 100 basicamente composto do RAID 10+0. Normalmente ele implementado utilizando uma
combinao e software e hardware, ou seja, implementa-se o RAID 0 via software sobre o RAID 10 via
Hardware.

Segue exemplo abaixo:

RAID 0
.-------------------------------------.
| |
RAID 0 RAID 0
.-----------------. .-----------------.
| | | |
RAID 1 RAID 1 RAID 1 RAID 1
.--------. .--------. .--------. .--------.
| | | | | | | |
120 GB 120 GB 120 GB 120 GB 120 GB 120 GB 120 GB 120 GB
A1 A1 A2 A2 A3 A3 A4 A4
A5 A5 A6 A6 A7 A7 A8 A8
B1 B1 B2 B2 B3 B3 B4 B4
B5 B5 B6 B6 B7 B7 B8 B8

Organizao de Arquivos
https://pt.wikibooks.org/wiki/Bancos_de_dados/Estrutura_de_armazenamento 8/9
14/03/2017 Bancos de dados/Estrutura de armazenamento - Wikilivros

Arquivo uma sequncia de registros lgicos controlado pelo sistema de arquivos. Os dados so organizados
logicamente quando se cria o modelo de dados, e estes dados so mapeados em arquivos para serem
armazenados e estes so divididos em blocos fsicos para finalmente serem armazenados no disco.

Obtido em "https://pt.wikibooks.org/w/index.php?
title=Bancos_de_dados/Estrutura_de_armazenamento&oldid=275992"

Categoria: Livro/Bancos de dados

Esta pgina foi modificada pela ltima vez (s) 10h59min de 12 de fevereiro de 2015.
Este texto disponibilizado nos termos da licena Creative Commons Atribuio-Compartilhamento pela
mesma Licena 3.0 Unported; pode estar sujeito a condies adicionais. Consulte as Condies de Uso
para mais detalhes.

https://pt.wikibooks.org/wiki/Bancos_de_dados/Estrutura_de_armazenamento 9/9

Você também pode gostar