Você está na página 1de 6

13/05/2022 14:50 As diferenças entre um pedaço, página, bloco, setor e bytes/bits em sistemas de armazenamento?

| Blog de Byte_Liu

As diferenças entre um pedaço, página, bloco, setor


e bytes/bits em sistemas de armazenamento?
2019-05-17
As diferenças entre um pedaço, página, bloco, setor e bytes/bits em
sistemas de armazenamento?

Todos eles constroem uns sobre os outros.

Pedaço

Bit é a menor unidade de dados, literalmente 0/1 (AKA ligado/desligado, AKA


sim/não, AKA verdadeiro/falso). Atualmente todos os dados digitais existem como
bits em um formato físico ou outro (ímãs, impulsos elétricos, luz, etc). Denotado
como “b” (pequeno b).

Byte

Byte é a combinação de bits mais usada. Um byte é 8 bits. Denotado como “B” (B


grande). Um byte pode representar28 28(256) valores diferentes. O exemplo mais
comum é o conjunto de caracteres ASCII, que atribui à maioria dos
números/letras/símbolos algum número de 0 a 127. Por exemplo, a letra
maiúscula A (“A”) é o código ASCII 65. Os números 128 e superiores diferem por
caractere definido e geralmente contém diferentes símbolos especiais, como letras
latinas.

Setor

Setor é um ponto físico em um disco formatado que contém informações. Quando


um disco é formatado, as trilhas são definidas (anéis concêntricos de dentro para
fora do prato do disco. Cada trilha é dividida em uma fatia, que é um setor. Em
discos rígidos e disquetes, cada setor pode conter 512 bytes de dados.

Um bloco, por outro lado, é um grupo de setores que o sistema operacional pode
endereçar (apontar). Um bloco pode ser um setor ou vários setores (2,4,8 ou até
16). quanto maior a unidade, mais setores um bloco conterá.

byteliu.com/2019/05/17/The-differences-between-a-chunk-page-block-sector-and-bytes-bits-within-storage-systems/ 1/6
13/05/2022 14:50 As diferenças entre um pedaço, página, bloco, setor e bytes/bits em sistemas de armazenamento? | Blog de Byte_Liu

Quadra

Bloco, por outro lado, é um grupo de setores que o sistema operacional pode
endereçar (apontar). Um bloco pode ser um setor ou vários setores (2,4,8 ou até
16). Quanto maior a unidade, mais setores um bloco conterá. O bloco é uma
abstração que representa a menor unidade de armazenamento em um sistema de
arquivos. Dentro do kernel, todas as operações do sistema de arquivos ocorrem
em termos de blocos. O bloco no contexto de armazenamento é o menor tamanho
em que você pode fazer interface com o hardware. Sempre que você lê de um
disco ou grava em um disco, você lê essa quantidade vezes quantos blocos
precisar ler. O tamanho do bloco NTFS padrão (Tamanho do cluster AKA, Unidade
de alocação AKA) é 4096 bytes (4 KB). Se você tiver um arquivo com exatamente
4096 bytes de comprimento, lerá um bloco do disco. Se for 4097 bytes, então
você lê dois blocos. Você não pode ler um bloco parcial, portanto, mesmo que um
arquivo não consuma um bloco inteiro, o sistema de arquivos de armazenamento
apaga o restante do bloco. Uma maneira simples de ver isso em ação é criar um
arquivo de texto em branco em seu disco rígido, observar as propriedades e a
diferença entre “Size” (0 bytes) e “Size on Disk” (4096 bytes).

Então, por que existem blocos. Por que o sistema operacional não aponta
diretamente para os setores? Porque há limites para o número de blocos, ou
endereços de unidade, que um sistema operacional pode endereçar. Ao definir um
bloco como vários setores, um SO pode trabalhar com discos rígidos maiores sem
aumentar o número de endereços de bloco. Por exemplo, o PC DOS (pelo menos
nas versões anteriores) poderia endereçar apenas 65.536 blocos (64K), e cada
bloco poderia ser apenas um único setor. Assim, o maior tamanho que um volume
de disco poderia ter era 32 MB (64 K 512 bytes). (Versões anteriores do Mac OS
tinham um limite de volume de 16 MB por motivos semelhantes). Se você
aumentar o tamanho de um bloco para, digamos, 4K, essa mesma versão do DOS

byteliu.com/2019/05/17/The-differences-between-a-chunk-page-block-sector-and-bytes-bits-within-storage-systems/ 2/6
13/05/2022 14:50 As diferenças entre um pedaço, página, bloco, setor e bytes/bits em sistemas de armazenamento? | Blog de Byte_Liu

agora pode trabalhar com volumes de até 256 MB (64K endereços de blocos de
4K).

Com as versões atuais dos sistemas operacionais, o software de formatação


analisará o tamanho da unidade e descobrirá o menor número de setores que
precisam estar em um bloco para poder usar a unidade inteira. Assim, ao formatar
um disquete, o tamanho do bloco será de um setor. Quando você formata uma
unidade de 230 MB, por exemplo, o tamanho do bloco é de 8 setores (4K). Por que
isso importa?

Verdadeiro ou Falso: Quando um arquivo é copiado de um disco rígido para um


disquete, geralmente ocupa menos espaço do que ocupa em um disco rígido?

VERDADE. Embora o tamanho do arquivo seja o mesmo, menos setores serão


usados ​para armazenar o arquivo. Por outro lado, quando um arquivo é copiado de
um disquete para um disco rígido, geralmente ocupa mais espaço em
disco. Quando os arquivos são armazenados em um disco, eles sempre usam um
número inteiro de blocos. Qualquer espaço desnecessário no final de um bloco
não é utilizado e desperdiçado. Por exemplo, digamos que seu disco rígido tenha
um tamanho de bloco de 4 K e você tenha um arquivo de 4,5 K. Isso requer 8K
para armazenar em seu disco rígido (2 blocos inteiros), mas apenas 4,5K em um
disquete (9 blocos do tamanho de um disquete).

Informações diversas…Se você costuma armazenar muitos arquivos pequenos em


seu disco rígido (como executar aplicativos do Windows e do Windows), os blocos
usados ​para armazenar todos esses pequenos arquivos podem ter um

muito espaço desperdiçado neles. Da mesma forma, compactar muitos arquivos


pequenos pode não economizar tanto espaço em um disco rígido grande com um
tamanho de bloco grande. Se o tamanho do bloco for 4K e você compactar um
arquivo de 3K, o arquivo será compactado, mas ainda usará 4K de espaço em
disco. Se você fizer um Get Info em um arquivo em um Mac, as informações de
tamanho dirão algo como '12K no disco, 8320 bytes usados'. O 12K é a
quantidade de espaço em disco usado, com base no tamanho do bloco. Assim, se
o tamanho do bloco de sua unidade for 4K, esse número sempre será em
incrementos de 4K. 8320 bytes é o tamanho real do arquivo. Observe que você
precisa ir para obter informações para ver o tamanho real do arquivo. Este número
não aparece em Ver por nome.

byteliu.com/2019/05/17/The-differences-between-a-chunk-page-block-sector-and-bytes-bits-within-storage-systems/ 3/6
13/05/2022 14:50 As diferenças entre um pedaço, página, bloco, setor e bytes/bits em sistemas de armazenamento? | Blog de Byte_Liu

Olhe isto deste modo. Cada bloco usado no sistema de arquivos do seu sistema
operacional para armazenar dados requer que uma certa quantidade de
metadados seja armazenada junto com os dados reais do arquivo que você está
gravando. por exemplo: timestamps (criados, modificados), nome do arquivo, bits
de propriedade/permissão. Para arquivos que abrangem vários blocos, você
também precisa armazenar os IDs de cada um desses blocos e a ordem em que
são encadeados etc.

Determinar o tamanho do bloco em um sistema operacional é um caso de


trocas. Cada arquivo deve ocupar pelo menos um bloco, mesmo que o arquivo
tenha 0 bytes, então há algo para anexar os metadados do arquivo. A menos que
você possa garantir que seus arquivos SEMPRE serão um múltiplo do tamanho do
bloco (por exemplo, em um sistema operacional de bloco de 4k, todos os arquivos
são de 4k), haverá uma certa quantidade de desperdício para os arquivos que não
se encaixam exatamente dentro aquele bloco.

Tamanhos de bloco pequenos são bons quando você precisa armazenar muitos
arquivos pequenos. Por outro lado, mais blocos = mais metadados, então você
acaba desperdiçando uma parte do seu sistema de armazenamento em
sobrecarga, rastreando a localização de todos os arquivos.

Por outro lado, blocos grandes significam menos metadados, mas também
significam maior desperdício ao armazenar arquivos pequenos. por exemplo, um
arquivo de 1 byte armazenado em um bloco de 4k desperdiça 3,99k desse bloco.

Cada um desses blocos deve receber um número de identificação pelo SO, para
que possa ser identificado de forma exclusiva. Um sistema operacional que usa
um campo de ID de 8 bits pode rastrear apenas 256 blocos e, portanto, por
extensão, apenas 256 arquivos. Mas se cada um desses blocos tiver realmente 1
megabyte de tamanho, você poderá armazenar até 256 megabytes de dados.

No entanto, conforme discutido anteriormente, blocos pequenos significam mais


metadados. Com tamanhos de unidade agora na faixa de mais de 3 terabytes, com
blocos de 512 bytes, você precisava ter armazenamento de metadados para 3
TB/512 bytes = 6,44 bilhões de blocos. Esse é um grande desperdício de
espaço. Então agora eles enviam unidades com 4k blocos, 8 vezes maiores, então

byteliu.com/2019/05/17/The-differences-between-a-chunk-page-block-sector-and-bytes-bits-within-storage-systems/ 4/6
13/05/2022 14:50 As diferenças entre um pedaço, página, bloco, setor e bytes/bits em sistemas de armazenamento? | Blog de Byte_Liu

você só precisa de armazenamento de metadados para 805 milhões de blocos. O


número total de arquivos possíveis foi reduzido por um fator de 8, mas a
quantidade reduzida de metadados significa que você pode armazenar uma
quantidade maior de dados utilizáveis.

Aliás, 6,4 bilhões de blocos é maior do que o que pode ser endereçado
diretamente por um sistema de 32 bits. 2^32 tem um limite superior de ~4,2
bilhões, portanto, máquinas de 32 bits mais antigas não podiam usar a totalidade
de uma unidade de 3 TB. Daí mudar para tamanhos de bloco maiores. Caixas de
32 bits podem lidar facilmente com 805 milhões de blocos.

Página

Page é semelhante a um bloco, mas é o equivalente em RAM. Os blocos


geralmente são a menor unidade de armazenamento “frio”, enquanto as páginas
geralmente são a menor unidade de armazenamento na memória. Posso estar
errado, mas acredito que o tamanho típico da página também seja de 4 KB de
memória.

O uso da página varia dependendo de como a SAN armazena as coisas no back-


end. Ao trabalhar com uma SAN que usa virtualização (Compellent), a paginação é
como a SAN move os dados entre os tipos de unidade. (15k RPM a 7K RPM)

Paginação é o método do SAN OS para otimizar e acompanhar os dados


armazenados. Portanto, quando você grava dados em sua matriz, a gravação
geralmente é dividida em segmentos gerenciáveis. Meu array atual pode rastrear
em páginas de 512K, 2MB e 4MB. Esses segmentos consomem espaço de
memória, quanto menor a página que você usa, mais memória você normalmente
consome.

Outros Observe que a maioria dos arrays apresenta setores 4K nativos para
servidores (em uma forma de LUN), independentemente dos discos por trás do
array. Isso como alguns aplicativos como o SQL Server, foram construídos e
otimizados para setores 4k nativos.

Pedaço

byteliu.com/2019/05/17/The-differences-between-a-chunk-page-block-sector-and-bytes-bits-within-storage-systems/ 5/6
13/05/2022 14:50 As diferenças entre um pedaço, página, bloco, setor e bytes/bits em sistemas de armazenamento? | Blog de Byte_Liu

Chunk realmente não tem uma definição estrita, geralmente é mais específico para
o uso. Por exemplo, um “pedaço” de dados pode ser a quantidade de dados que
um aplicativo processa do disco por vez. Por exemplo, um arquivo de log tem 100
MB e o aplicativo de análise lê o arquivo e o processa em partes de 5 MB. Read
5MB -> Process 5MB -> Read 5MB -> Process 5MB, etc. Em alguns sistemas de
armazenamento, isso pode ser uma camada de abstração acima de um bloco, por
exemplo, ao falar sobre cache de leitura/gravação, ele pode gravar dados no disco
em pedaços que não são do mesmo tamanho que um único bloco. Muito tempo
lendo e escrevendo em pedaços pode melhorar o desempenho.

byteliu.com/2019/05/17/The-differences-between-a-chunk-page-block-sector-and-bytes-bits-within-storage-systems/ 6/6

Você também pode gostar