Escolar Documentos
Profissional Documentos
Cultura Documentos
Alm de gavetas e suportes baratos para ligar HDs externos, a lista inclui dispositivos
mais caros. Nas fotos a seguir temos dois exemplos. O primeiro uma gaveta de HD
simples, ligada em uma porta USB e o segundo uma unidade eSATA da Micronet, que
utiliza 5 HDs, com RAID via hardware e outras funes. Apesar da diferena de
complexidade, temos em ambos os casos unidade externa ligada uma porta USB ou
eSATA, que no tem nada a ver com redes:
Um NAS (Network Attached Storage), por sua vez, roda um sistema operacional
completo e funciona como um servidor de arquivos, ligado diretamente na rede.
Existem muitas opes de NAS, que vo desde sistemas baratos, que custam pouco mais
que uma gaveta USB, at equipamentos caros, que utilizam um grande nmero de HDs.
Os modelos mais baratos comportam apenas um ou dois HDs e oferecem apenas
funes bsicas. Alguns modelos incluem tambm um transmissor wireless ou
disponibilizam uma porta USB, o que permite que sejam ligados ao PC diretamente e
seja usados como um DAS. Modelos intermedirios suportam em sua maioria 4 drives e
modelos high-end ou racks para uso em datacenters suportam muitas vezes 8 drives ou
mais.
Via de regra, um NAS no faz nada que um PC tradicional no possa ser configurado
para fazer. Um nmero surpreendente deles utilizam processadores x86, rodam Linux e
compartilham os arquivos com a rede utilizando o Samba. Ou seja, nada mais so do
que PCs compactos, otimizados para a tarefa.
A principal vantagem que eles so solues prontas, que podem ser instaladas
rapidamente, sem exigir muitos conhecimentos tcnicos, o que os torna ideais para uso
em escritrios e redes domsticas, por exemplo. Os modelos mais simples so bem mais
baratos que um PC, alm de serem menos compactos e consumirem menos energia,
enquanto os modelos mais caros oferecem mais espao de armazenamento, recursos de
redundncia e de gerenciamento que permitem o uso em redes que demandam um
maior nvel de confiabilidade.
Um exemplo o Linksys WRT600N, que apresenta uma porta USB escondida ao lado do
conector da interface WAN (onde voc ligaria o cable modem ou o modem ADSL, de
forma a compartilh-lo com a rede). Ao instalar um pendrive ou HD USB, voc pode criar
compartilhamentos atravs da opo "Storage" da interface de administrao. Os
recursos so incrivelmente limitados (no possvel sequer alterar o grupo de trabalho),
mas a funo bsica est presente:
Em muitas situaes, entretanto, usar um NAS no suficiente. Muitas empresas
precisam de volumes gigantescos de espao de armazenamento, que deve no apenas
oferecer um desempenho muito bom, mas tambm incluir backup dos dados e
redundncia.
De acordo com a escala necessria, usar um nico servidor, com HDs SATA regulares
seria a soluo mais barata, j que muitas placas-me possuem at 10 portas SATA (e
voc poderia adicionar mais portas instalando controladoras adicionais), de forma que,
voc poderia simplesmente instalar 10 HDs SATA de 1 TB e contar assim com um total
de 10 TB de armazenamento.
Usando o Samba voc no gastaria nada com o software, que forma que, alm da mo
de obra, o custo de resumiria ao preos dos HDs e dos demais componentes escolhidos e
usando um array RAID voc poderia sacrificar parte do espao de armazenamento para
melhorar o desempenho e a confiabilidade. De acordo com o nmero de HDs disponveis
e o recursos oferecidos pelo sistema operacional usado, os modos RAID disponveis so:
RAID 0 (Striping): No RAID 0 todos os HDs passam a ser acessados como se fossem
um nico drive. Ao serem gravados, os arquivos so fragmentados nos vrios discos,
permitindo que os fragmentos possam ser lidos e gravados simultaneamente, com cada
HD realizando parte do trabalho. Isso permite melhorar brutalmente a taxa de leitura e
de gravao e continuar usando 100% do espao disponvel nos HDs. O problema que
no RAID 0 no existe redundncia. Os HDs armazenam fragmentos de arquivos, e no
arquivos completos. Sem um dos HDs, a controladora no tem como reconstruir os
arquivos e tudo perdido. Isso faz com que o modo RAID 0 seja raramente usado em
servidores.
RAID 1 (Mirroring): No RAID 1 so usados dois HDs (ou qualquer outro nmero par).
O primeiro HD armazena dados e o segundo armazena um cpia exata do primeiro,
atualizada em tempo real. Se o primeiro HD falha, a controladora automaticamente
chaveia para o segundo HD, permitindo que o sistema continue funcionando. Em
servidores comum o uso de HDs com suporte a hot-swap, o que permite que o HD
defeituoso seja substitudo a quente, com o servidor ligado. A desvantagem em usar
RAID 0 que metade do espao de armazenamento sacrificado.
RAID 10 (Mirror/Strip): Este modo combina os modos 0 e 1 e pode ser usado com a
partir de 4 HDs (ou outro nmero par). Metade dos HDs so usados em modo striping
(RAID 0), enquanto a segunda metade armazena uma cpia dos dados dos primeiros,
oferecendo redundncia.
RAID 5: Este o modo mais utilizado em servidores com um grande nmero de HDs. O
RAID 5 usa um sistema de paridade para manter a integridade dos dados. Os arquivos
so divididos em fragmentos e, para cada grupo de fragmentos, gerado um fragmento
adicional, contendo cdigos de paridade. Os cdigos de correo so espalhados entre os
discos. Dessa forma, possvel gravar dados simultaneamente em todos os HDs,
melhorando o desempenho.
SAN
Armazenamento de rede: DAS, NAS e SAN
Carlos E. Morimoto
13/11/2007
Toda SAN tem como bloco de montagem HDs tradicionais, que so ligados a uma
unidade controladora (que se encarrega do acesso aos dados, RAID e outras funes) e
ligada a um servidor atravs de uma interface dedicada, que pode ser tanto uma
interface Fibre Channel quanto uma interface de rede Gigabit Ethernet ou 10 Gigabit
Ethernet (usando o iSCSI). O servidor se encarrega ento de distribuir os dados para os
clientes da rede ou fornec-los para aplicativos especficos, como no caso de um cluster
de servidores web, que utilizam a SAN para armazenar um grande banco de dados
usado para atender s requisies dos clientes.
Apesar disso, na grande maioria dos casos, o objetivo de usar uma SAN no
simplesmente obter um grande espao de armazenamento, mas sim obter ganhos de
desempenho e de confiabilidade para aplicaes crticas. Imagine o caso de um cluster
de servidores responsveis pelo site de um grande portal. As pginas so montadas a
partir de um enorme banco de dados, armazenado na SAN, que acessado de forma
conjunta por todos os servidores do cluster. As unidades de armazenamento combinam
um grande nmero de HDs em RAID, o que as torna capazes de atender a um grande
volume de requisies por segundo, o que permite atender aos muitos visitantes
simultneos. Alm do desempenho e do armazenamento centralizado, temos tambm a
questo da redundncia, que garante que o sistema funcione de forma contnua,
sobrevivendo a falhas em componentes diversos.
A principal vantagem do uso de uma SAN que o sistema pode ser expandido conforme
necessrio, incluindo mais storage racks e mais switchs. Os diferentes arrays podem
ento ser acessados por diferentes servidores e, dependendo da configurao, at
mesmo serem configurados para se comportarem como uma nica unidade, com as
capacidades somadas. Se dinheiro no for problema, possvel atingir facilmente a
marca de 100 terabytes de espao de armazenamento, com direito a um sistema de
redundncia completo.
Continuando, possvel tambm que um nico array seja dividido em vrias unidades
lgicas, cada uma com um identificador prprio (chamado de LUN, ou "Logical Unit
Number"), permitindo que cada unidade possa ser acessada por um servidor diferente.
Isso permite centralizar o armazenamento de dados da rede, armazenando todos os
dados importantes na SAN, ao invs de utilizar HDs separados em cada servidor. As
unidades podem ser inclusive redimensionadas durante o uso, realocando o espao entre
os servidores conforme necessrio.
Embora exista um padro de Fibre Channel que utiliza fios de cobre, os cabos de fibra
ptica so de longe os mais comuns. possvel utilizar cabos de fibra ptica de at 50
km, utilizando cabos monomodo, mas o mais comum que sejam usados cabos
multimodo (mais baratos e suficientes para a maioria das situaes), que oferecem um
alcance de at 300 metros. Tipicamente, os cabos so curtos, com de 2 a 10 metros, de
forma que a questo do alcance raramente um problema. As controladoras Fibre
Channel so chamadas de FC HBA (Fibre Channel Host Bus Adapter).
Fibre Channel HBA e conectores de um cabo Fibre Channel LC/LC
Outra tecnologia, mais recente o iSCSI (pronuncia-se "ai-isczi") que permite que o
cliente (chamado de initiator) envie comandos SCSI para um array de armazenamento
(chamado de target) via TCP/IP, utilizando uma rede Ethernet tradicional. Isso permite
que eles sejam sejam acessados como se fossem unidades de armazenamento local
atravs de cabos de rede. Voc pode pensar no iSCSI como um protocolo para
encapsular comandos de acesso a disco, juntamente com os dados resultantes,
transformando-os em pacotes TCP/IP.
A popularizao dos arrays iSCSI tornou as SANs muito mais acessveis. Montar uma
pequena SAN usando Fibre Channel custa, pelo menos, US$ 10.000 (em preos do
exterior, sem contar os impostos) apenas em equipamento bsico (o array de discos, o
switch, as controladoras e os cabos), sem sequer incluir os HDs. Um array de discos
iSCSI, por sua vez, pode ser ligado diretamente a uma placa gigabit Ethernet no
servidor, o que torna possvel montar uma pequena SAN utilizando apenas o array (os
mais simples custam a partir de US$ 1500) e os HDs.
Aqui temos o iX8-RAID, um exemplo de array iSCSI de baixo custo. Ele permite o uso de
at 8 HDs SATA, que podem ser usados em modo RAID 0, 10, 5, 50, 6 ou 60 e
conectado ao servidor atravs de um ou duas interfaces Gigabit Ethernet (a segunda
usada para redundncia). Ele inclui um processador de Intel IOP 331 e 512 MB de
memria, usada pra cache de disco e administrado atravs de uma interface web. Mas,
diferente de um NAS, ele no compartilha arquivos diretamente na rede. Depois de lig-
lo ao servidor, voc instala o iSCSI initiator, que faz com que ele seja visto pelo servidor
como uma unidade local. A partir da, voc pode formatar os discos e usar o espao
como quiser, inclusive criando compartilhamentos de rede:
Com 8 HDs, os modos RAID com melhor custo-benefcio so os modos 5 e 6. Optando
pelo RAID 5, voc sacrifica o espao equivalente a apenas um dos discos e tem
segurana contra falha de qualquer um dos HDs. Melhor ainda, o sistema pode continuar
funcionando normalmente, mesmo sem um dos HDs, j que a controladora capaz de
reconstruir os dados a partir dos cdigos de paridade em tempo real.
Quando falamos em HDs para servidores, a primeira sigla que vem mente o
SCSI, mas o antigo barramento SCSI paralelo est dando lugar a uma verso serial, o
SAS, da mesma forma que os antigos HDs IDE deram lugar aos HDs com interface
SATA.
O SAS (Serial Attached SCSI), um barramento serial, muito similar ao SATA utilizado
em HDs domsticos em diversos aspectos, mas que adiciona vrias possibilidades
interessantes voltadas para o uso em servidores. As verses iniciais do SAS suportavam
taxas de transferncia de 150 e 300 MB/s. Recentemente foi introduzido o padro de
600 MB/s e passou a ser desenvolvido o padro seguinte, de 1.2 GB/s. A evoluo
similar do padro SATA (note que as velocidades so as mesmas), porm o SAS tende
a ficar sempre um degrau acima.
Nesses casos, seria utilizado um sistema RAID, onde parte do espao e armazenamento
destinado a armazenar informaes de redundncia, que permitem restaurar o
contedo de um HD defeituoso assim que ele substitudo, sem interrupo ou perda de
dados. Ao contrrio das controladoras RAID de baixo custo, encontradas nas placas-me
para desktop, que executam suas funes via software, as controladoras SAS
tipicamente executam todas as funes via hardware, facilitando a configurao (j que
deixa de ser necessrio instalar drivers adicionais) e oferecendo um maior desempenho
e flexibilidade.
A maior parte dos HDs de alto desempenho, com rotao de 15.000 RPM, que antes s
existiam em verso SCSI, esto sendo lanados tambm em verso SAS. Nos prximos
anos de se esperar que o SAS substitua gradualmente o SCSI, assim como o SATA j
substituiu o IDE quase que completamente nos micros novos.
Em geral, HDs SAS e SCSI so certificados para operao contnua e so produzidos com
componentes de maior durabilidade. Via de regra, existem ganhos do ponto de vista da
confiabilidade e os fabricantes oferecem garantias de 5 anos. Isso faz com que eles
sejam preferidos em situaes onde exigido um maior nvel de confiabilidade, mesmo
que o desempenho no seja um fator importante.
Entretanto, vale lembrar que a confiabilidade pode ser obtida tambm atravs do uso de
RAID, de forma que muitos preferem utilizar HDs domsticos, reservando mais discos do
array RAID para redundncia. Se um HD SAS custa o dobro de um HD SATA equivalente,
por exemplo, faria mais sentido comprar dois HDs SATA e us-los em RAID 1, do que
usar um nico HD SAS.
Um bom exemplo de uso desta filosofia o Google, que utiliza servidores de baixo custo,
montados com HDs e placas comuns, o que permite que construam seus gigantescos
datacenters a preos relativamente baixos. Quase todas as funes de redundncia e
tolerncia a falhas so implementadas via software as transferncias executadas usando
interfaces de rede.