Escolar Documentos
Profissional Documentos
Cultura Documentos
Em linhas gerais, podemos definir SAN como uma infraestrutura que permite que
diversos servidores tenham acesso a discos externos de modo rápido e confiável. O
conceito de discos externos já é, há algum tempo, uma tendência mundial, e vem sendo
cada vez mais adotado. Os discos externos não são limitados em espaço como um disco
interno, são mais fáceis de manusear quando necessário e trazem facilidades para o
compartilhamento por vários servidores. A figura central de uma SAN, de fato, é o
servidor de discos ou, como é popularmente conhecido, o storage.
Abaixo, vemos uma SAN, representada por uma nuvem e diversos de seus
equipamentos, ao lado de outras redes. A figura nos dá uma idéia de como as
tecnologias não são isoladas, mas se integram.
Benefícios
Podemos citar como principais benefícios proporcionados por uma arquitetura de SAN:
Alta performance no acesso aos dados: as taxas de transferência nas SAN mais
modernas podem chegar a até 2 Gb/s. Além disso, dependendo do arranjo dos
discos (RAID), pode haver grande ganho de performance na leitura e/ou escrita,
como veremos adiante neste trabalho;
Alta disponibilidade e confiabilidade: uma SAN possui diversas formas de
aumentar a disponibilidade dos dados de modo que, mesmo em caso de falha de
alguns discos, a produção na seja interrompida. Opções como caminhos
redundantes para acesso aos dados e espelhamento de dados em tempo real pode
assegurar a disponibilidade dos dados e aplicações.
Escalabilidade: capacidade de adicionar mais capacidade de armazenamento e
outros recursos à infraestrutura já existente. Isto é feito facilmente dentro de uma
SAN, freqüentemente sem a necessidade de desligar o(s) servidore(s) ou seus
clientes de rede;
Centralizar a administração dos recursos: nos ambientes atuais, cada vez mais
complexos, isto pode ser a única solução para a administração dos recursos de
discos, trazendo grandes economias para as empresas.
Descongestionamento da LAN: em muitos casos a rede local é lenta devido ao
grande fluxo de informações que trafega por ela. Com uma SAN, este fluxo é
bastante reduzido, o que alivia a rede local, beneficiando os usuários. Isto
também é muito importante para o backup corporativo, que também pode ser
feito sem utilizar a rede local.
Além destes ganhos, há outros que variam um pouco dependendo da solução adotada e
dos fornecedores escolhidos, tal como balanceamento de carga e facilidades para
backup. Estas facilidades focam em alternativas para aplicações em que não há janela
para backup disponível, já que elas exigem disponibilidade integral. Veremos algumas
destas mais adiante.
Enfim, as características das SAN podem trazer grandes economias, alta disponibilidade
dos dados, fácil expansão do storage, poucas paradas da rede, e redução de seu tráfego.
História
A FCIA foi criada em agosto de 1999, da fusão da Fibre Channel Association e Fibre
Channel Community. É uma organização de benefício mútuo, sem fins lucrativos,
formada por fabricantes, integradores de sistemas, desenvolvedores, vendedores,
profissionais da indústria e usuários. O objetivo da FCIA é criar bases para a tecnologia
de infra-estrutura FC, a fim de que várias aplicações dentro dos complicados mercados
de Storage e TI possam ser suportadas.
A SNIA foi criada em Dezembro de 1997 e também é uma associação sem fins
lucrativos e dedica-se a garantir que as redes de armazenamento de dados tornem-se
soluções completas e confiáveis dentro da comunidade de TI.
Protocolos
Atualmente, Fibre Channel é o padrão utilizado na maioria das SANs. Fibre Channel é
uma interface serial que possui uma alta largura de banda e permite que um grande
número de dispositivos possam ser anexados a ela de uma vez. Os dispositivos Fibre
Channel são conectados, principalmente, a um cabo de fibra ótica, mas pode ser
utilizado também em cabos de cobre. As velocidades das SANs atuais vão até 2 Gb/s.
A Fibre Channel pode se comunicar com vários protocolos diferentes, incluindo SCSI, e
até mesmo IP. Os dispositivos do Fibre Channel são identificados por um número de ID
fisicamente gravado denominado World Wide Name, análogo a um endereço de
Ethernet MAC.
Hardware
Talvez a parte mais importante para a implantação de uma SAN seja referente
ao hardware. É importante selecionar com cuidado os dispositivos de hardware para
uma SAN pois há diferenças muito grandes entre os equipamentos fornecidos por
diferentes empresas do ramo. Além disso, devido às SANs serem bastante dependentes
de alguns softwares para funcionar corretamente, é muito importante garantir as
atualizações de softwares, firmwares e outras questões ligadas a compatibilidade. Os
fabricantes de equipamentos para SAN costumam divulgar matrizes de compatibilidade
para seus produtos em seus sites. Nelas há uma qunatidade muito grande de
informações, contendo diversas combinações de hardware e software,
como storage, switch, HBA, servidor e sistema operacional, que foram homologados
pelo fabricante. Entre as principais empresas do mercado especializadas em projeto de
SAN destacam-se: EMC, Sun Microsystems, IBM, HP, Network Appliance e Brocade.
Hubs:
Assim como hubs de uma rede local, os hubs FC permite que todos os
dispositivos conectados a ele se enxerguem e possam trocar informações entre
si. Possuem as vantagens de possuir baixo preço e baixa complexidade. Permite
ainda que dispositivos possam ser inseridos ou removidos sem interrupção
alguma, o que torna o ambiente bastante dinâmico. Entretanto, os hubs dividem
a largura de banda por todos os dispositivos conectados a ele, o que pode
representar uma perda muito grande de velocidade. Os hubs podem ser
cascateados, a fim de fornecer mais portas para aumentar ainda mais a
conectividade. Teoricamente, o hub suporta até 127 dispositivos conectados a
ele, mas na prática, deve-se restringir o total de dispositivos a 30, no máximo.
Para pequenos grupos de trabalho os hubs são mais atrativos, pois fornecem um
alto grau de interoperabilidade por um preço menor. Existem hubs fibre
channel de 4 a 16 portas e possuem uma largura de banda de, no máximo, 100
MB por segundo, compartilhado entre os servidores conectados às suas portas.
Switches: Switches fibre channel são bem mais complexos que os hubs, tanto em
seu projeto quanto em funcionalidade. Enquanto os hubs são apenas um
concentrador de cabos para um segmento compartilhado, um switch é um
dispositivo de rápido roteamento dos dados e possui uma taxa de transferência
de dados exclusiva para cada porta. As taxas de transferência variam bastante
dependendo do switch, que vêm evoluindo rapidamente. Atualmente, a
velocidade máxima está em 400 MB/s para cada porta. Enquanto os hubs não
participam de atividades no nível do protocolo Fibre Channel,
os switches participam ativamente, tanto para fornecer serviços quanto para
supervisionar o fluxo de frames entre a origem e o destino.
RAID
A maior parte das SANs atuais utiliza sistemas de RAID em seus principais
equipamentos de armazenamento de dados. Estes sistemas oferecem proteção dos
dados, tolerância a falhas, no caso de um componente ou um caminho de I/O falhar, alta
performance, capacidade de armazenamento e escalabilidade. Outras características para
garantir a confiabilidade dos sistemas de RAID mais modernos incluem redundância de
sistemas de refrigeração, fontes de alimentação, controladoras e até de circuitos de
monitoramento.
RAID 5: Este nível de RAID também utiliza o conceito de data striping, mais
acrescenta uma forma de obter redundância dos dados, através do gerador de
paridade. Para cada escrita, é gerada uma paridade calculada pela operação de ou
exclusivo dos bits gravados. A paridade fica espalhada pelos 3 discos, ou seja, a
cada gravação ela é gravada em um disco diferente. São necessários, no mínimo,
3 discos para sua implementação, sendo o espaço "desperdiçado" do conjunto
devido ao armazenamento da paridade é equivalente ao espaço de um disco.
Pode-se, com este esquema, perder até um disco que, a partir dos outros e da
paridade, reconstitui-se os dados do disco perdido. Caso mais de um disco falhe
ao mesmo tempo, os dados não poderão ser recuperados. É um método muito
empregado nos storages atuais, porque alia aumento de performance à segurança
oferecida pela redundância com um ótimo aproveitamento de recursos.
RAID 0 + 1 ou RAID 10: A combinação de níveis de RAID é uma prática
comum hoje em dia. A mais utilizada é a que combina os níveis 1 e 0, o que alia
a alta performance do RAID 0 com a segurança dos dados do RAID 1.
Software:
Normalmente, estes softwares possuem duas interfaces, uma gráfica, ou web, e outra
por linha de comando, o que é extremamente útil para a confecção de scripts para
automatizar alguns processos. Infelizmente, hoje em dia, os softwares envolvidos em
uma SAN estão amarrados aos fabricantes de hardware e não há uma padronização
destes produtos. As diferenças entre eles são muito grandes, e o modo de operá-los
também, e, assim, as empresas que implantam SAN sempre perdem um grande tempo (e
dinheiro) com treinamentos para seus funcionários. Ainda: caso a solução seja migrada,
o modo de operação do novo produto, com certeza, será bem diferente do anterior.
Assim, na hora de escolher qual fabricante de storage adotar, é importante procurar
saber bem como será o seu gerenciamento, quais serão as facilidades que os softwares
proverão, suas compatibilidades e quão fácil será a operação de todo o conjunto.
Topologias:
As SANs atuais são todas construídas em uma topologia física de estrela. Um hub ou
switch é conectado ao storage e neles conectamos todos os outros servidores da rede. A
excessão fica com a ligação ponto-a-ponto, como veremos a seguir.
- Loops ou anéis: são chamados de Fibre Channel Arbitrated Loop (FC-AL): Nesta
topologia utiliza-se hub, cuja largura de banda de no máximo de 100 MB/s é
compartilhada por todos os seus membros. Teoricamente suporta loops com até 126
dispositivos, mas na prática este número é bem menor. Esta topologia está sendo muito
pouco utilizada nas SANs modernas. Algumas pessoas comparam esta topologia como
uma rede Token Ring, em que a largura de banda é dividida por todos os dispositivos do
loop. Esta topologia está sendo muito pouco utilizada nas SANs modernas. Entretanto
há equipamentos antigos que não suportam o modo fabric e, assim, é utilizado o modo
em loop.
- Malha (Switched fabric ou apenas fabric): nesta topologia, utiliza-se switches Fibre
Channel, o que permite um grande número de dispositivos interconectados. Dedica
largura de banda integral a cada uma das portas e permite transferências de dados
simultaneamente para um único nó. É a topologia que permite mais escalabilidade e
crescimento. Teoricamente, pode conter mais de 7,7 milhões de nós.
Como este é um trabalho sobre redes de armazenamento de dados, vale à pena comentar
também uma outra tecnologia para compartilhamento de dados que ganhou
popularidade: a chamada NAS (Network Attached Storage). Trata-se, basicamente, de
um servidor de discos capaz de exportar áreas por protocolos como o NFS, CIFS ou até
mesmo o HTTP. Para isto, é utilizada a rede local, o que traz a vantagem de permitir
que qualquer host da rede tenha acesso a dados comuns, porém possui as desvantagens
de congestionar o tráfego da rede, bem como uma velocidade de acesso pequena, se
comparada à de uma SAN.
Uma outra grande vantagem da arquitetura NAS é que os dados podem ser
compartilhados entre diversos hosts, inclusive de sistemas operacionais diferentes,
enquanto em uma SAN os dados são dependentes do sistema operacional.
Bibliografia
Devido à dificuldade de se encontrar livros sobre este assunto no Brasil, a base para este
trabalho foi extraída toda da Internet. Segue abaixo, a lista dos principais links
utilizados por mim.
http://www.dothill.com/tutorial/index.htm
http://eval.veritas.com/webfiles/docs/san-whitepaper.pdf
http://www.qlogic.com/documents/datasheets/knowledge_data/whitepapers/whit
epapers.zoning.pdf
http://www.networkcomputing.com/1109/1109ws1.html
http://www.fibrechannel.org/
http://www.snia.org/
http://www.networkmagazine.com/shared/article/showArticle.jhtml?articleId=17
601008&pgno=2
http://access.globalknowledge.com/tutorials.asp?sort=cat&catID=12&perpage=2
0
http://us-
support.external.hp.com/iv/data/documents/DE_SW_UX_swrec_EN_01_E/Fibr
eChannel.pdf
http://forums1.itrc.hp.com/service/forums/questionanswer.do?admit=716493758
+1081305504552+28353475&threadId=19156
http://www.sun.com/storage/white-papers/fc_comp.html
http://www.javvin.com/protocolSAN.html
http://www.nas-san.com
http://www.chaparralnet.com/supp/support_documentation/JFS226UG.pdf
Além destes sites, foi retirada importantes informações sobre o padrão Fibre Channel do
seguinte livro:
Questões:
O snapshot é uma ferramenta de software que permite fazer e armazenar por um certo
tempo uma fotografia dos dados do servidor no storage. Possui a vantagem de quase não
consumir espaço em disco, uma vez que ele guarda um conjunto de ponteiros para os
dados, e não os dados propriamente. Esta imagem pode ser vista pelo servidor como
uma outra área, que pode ser montada como um drive (Windows) ou um filesystem
(Unix) para fins, principalmente, de backup. Em casos de atualização dos dados após o
snapshot, o software copia os dados anteriores à atualização para uma área temporária e
o ponteiro que apontava para os dados que foram atualizados passam a apontar para os
dados preservados nesta nova área, uma vez que a fotografia tirada deve ser mantida a
mesma. Isto limita o snapshot a momentos em que não aja muitas atualizações, ou em
casos em que não interessa guardar a imagem por um tempo muito grande.
4. Uma dada aplicação que utiliza um servidor UNIX de banco de dados deseja
utilizar uma SAN para, entre outras coisas, melhorar sua performance. O servidor
de banco de dados possui 3 áreas principais que podem ser distinguidas: tabelas,
índices e dados. Sabendo que as áreas não devem competir por recursos e que a
característica das áreas de tabelas e índice é mais de leitura, enquanto a área de
dados sofre um pouco mais de escrita, mas também muita leitura, diga como você
utilizaria os recursos de uma SAN para otimizar sua performance. Dica: estas
diferentes áreas correspondem a filesystems diferentes, que são montados no
servidor. Filesystem é como se fosse um pedaço de disco, ou seja, como um drive
para o Windows.
R: Neste caso, devemos fazer com que as diferentes áreas do servidor de banco de dados
acessem discos diferentes, que podem estar no mesmo storage, caso ele possua áreas
separadas (conhecidas como RAID groups), ou em storages diferentes. O importante é
perceber que o acesso aos dados deve ser feito por controladoras de disco diferentes,
uma vez que as 3 áreas não podem competir por recurso. Para melhorar ainda mais a
performance, podemos tentar adequar as características das áreas a um esquema de
RAID adequado, dentro do possível. No caso, uma boa solução seria, para as áreas de
tabelas e índices, seria um esquema de RAID 5 com 5 discos de dados e 1 de paridade,
enquanto para a área de dados, que sofre um pouco mais de escrita, poderíamos usar um
RAID 5 com 7 discos de dados e 1 (que é mais caro que o esquema 5 + 1) para
paridade, o que paralelizaria mais a escrita em disco, tornando mais rápido.
R: Neste caso, devemos utilizar discos BCV para o backup, pois atenderia tanto os
requisitos de backup quanto de restore. O sincronismo deve ser feito momentos antes de
iniciar o backup, para que os dados anteriores sejam preservados o maior tempo
possível, para o caso de precisar de uma recuperação. Logo após o término do
sincronismo, o quebramos e realizamos o backup do disco BCV, e não do servidor, que
continuará trabalhando e modificando sua base de dados. Para manter os dados por
ainda mais tempo no BCV, para o caso de precisar de uma restauração, pode-se usar
mais de um BCV em esquema de rodízio, conforme a disposição financeira.