Você está na página 1de 8

W H I T E PA P E R A Compresso em Tempo Real Promove a Otimizao do Armazenamento

Patrocinado pela: IBM Laura DuBois Maio de 2012

S u m rio E x ec u ti v o
No segredo que oramentos para armazenamento esto sob presso constante de foras opostas: por um lado, as foras econmicas esto pressionando os oramentos para que fiquem achatados ou, em muitos casos, encolham como uma porcentagem da receita da empresa. Por outro lado, a infraestrutura luta para manter o ritmo do crescimento das informaes, pressionada por muitas variveis, tanto sociais quanto econmicas. As empresas no tm outra escolha seno adaptar a sua infraestrutura de armazenamento aos nveis sem precedentes em que as informaes esto crescendo. Na maior parte dos casos, a ineficincia da infraestrutura de computao foi enfrentada atravs da virtualizao do servidor. Vrios bastidores de servidores ociosos foram sendo substitudos aos poucos pelos ambientes de computao virtualizados ultradensos que ocupam menos espao, sobrecarregando os fornecedores de armazenamento ao lidar com o desafio de tornar o armazenamento de dados eficiente e economicamente sustentvel. Os fornecedores de armazenamento reagiram prontamente ao desenvolver um conjunto de solues direcionadas para diminuir o ritmo do consumo de armazenamento. As tecnologias de otimizao de armazenamento, como so chamadas, procuram reduzir a rea ocupada pelos equipamentos de armazenamento ao remover redundncia e desperdcio e ao otimizar a alocao dos dados. Tradicionalmente, os conjuntos de otimizao de armazenamento consistiam em thin provisioning, deduplicao e pscompactao. Thin provisioning procura reduzir o espao desperdiado que era alocado, mas no utilizado por causa do excesso de provisionamento. Similarmente, a deduplicao tem como alvo dados redundantes ou duplos, criando instncias nicas de dados. Para dados que no podem ser afinados nem deduplicados, a compresso tem como alvo a reduo da rea de armazenamento geral ao comprimir os dados para diminu-los. A promessa que ao implantar uma ou mais ou todas essas tecnologias, as empresas podem reduzir seus gastos gerais com armazenamento, retardar compras futuras e obter um retorno melhor para seus investimentos. Na realidade, no entanto, toda otimizao coloca certa presso sobre o sistema em termos de desempenho ou de eficincia. Historicamente, o que mais prejudica nessa mistura a compresso, por causa de sua natureza inerente de ps-processamento intensivo de computao. Com frequncia isso conduziu as empresas a implantar thin provisioning pequeno e/ou deduplicao, mas deixando a compresso fora da mistura quando se trata de armazenamento primrio ativo.
www.idc.com Global Headquarters: 5 Speen Street Framingham, MA 01701 USA P.508.872.8200 F.508.935.4015

NESTE INFORME
Neste informe ns examinamos como a Compresso em Tempo Real da IBM est virando o jogo ao oferecer uma soluo de otimizao robusta, eficiente e econmica. Alm disso, a IBM est demonstrando que compresso tem lugar em otimizao de armazenamento e complementa de modo desejvel outras tcnicas de otimizao em uso atualmente. A IBM estima que ao implantar as solues com Compresso em Tempo

Real, como o IBM Storwize V7000, as empresas podem economizar 50% ou mais na quantidade de espao fsico necessrio e reduzir o crescimento geral do armazenamento em quase 30%. De acordo com a IBM, isto tipicamente resulta em uma reduo de 30 a 40% em custos por gigabyte (GB) para configuraes de armazenamento primrio, sem comprometer nenhuma capacidade ou desempenho. O IBM Real-time Compression um componente essencial do IBM Smarter Storage que, por sua vez, faz parte da estratgia Smarter Computing da IBM, uma abordagem desenvolvida em anos de liderana e inovao no segmento de armazenamento e uma tecnologia avanada que ajuda a direcionar o projeto e a implantao de sistemas de armazenamento. Smarter Storage permite que as organizaes assumam o controle de seus armazenamentos, de modo que possam se concentrar em compreender melhor seus dados, agregando mais valor para os negcios.

Situao do Mercado
Vivemos em um mundo ps-PC. Os dispositivos de computao mvel continuam a proliferar em toda parte, inclusive nas empresas. At 2015, o mercado de computao mvel consistir em mais de 243 milhes de tablets e mais de 1,5 bilhes de smartphones. De acordo com o IDC, cerca de 9.57 zettabytes (ZB) de informaes so consumidos anualmente, dos quais 1.2 ZB so dados de mdia desestruturada que esto crescendo a um ndice anual de crescimento composto de 62% (CAGR - taxa composta de crescimento anual). medida que a tendncia nas empresa, prosumer (produtor + consumidor) e do consumidor mudam para a criao de dados e acesso em trnsito dos mesmos, assim tambm muda a demanda por mais armazenamento. A pesquisa do IDC mostra que os sistemas mundiais de armazenamento em disco externo apresentaram um crescimento ano a ano de 7,7%, totalizando pouco menos de US$ 6,6 bilhes no quarto trimestre de 2011. A capacidade total dos sistemas de armazenamento em disco em 2011 alcanou 6.279 petabytes, crescendo 22,4% ano a ano. Com a demanda das empresas por capacidade de armazenamento no mundo todo projetada para crescer a um CAGR de mais de 43% de 2008 a 2013, a demanda por dados supera amplamente o fornecimento de armazenamento. Alm disso, a lentido persistente na economia significa que as empresas no podem mais garantir a acomodao desse crescimento de dados utilizando as abordagens tradicionais de armazenamento. J passou o tempo de tratar armazenamento somente com mecanismos adequados de proteo e de desempenho tais como os grupos RAID e gerenciadores de volume. Os custos por GB por disco podem estar caindo, mas os custos de infraestrutura esto subindo, forando as empresas a descartar as abordagens tradicionais para armazenamento de dados em favor de abordagens mais modernas e melhores. Os fornecedores de armazenamento seguiram amplamente o exemplo estabelecido pelos fornecedores de virtualizao de servidor ao criar um ecossistema de tecnologias que aprimora a utilizao da infraestrutura de armazenamento, tornando-a mais eficiente no processo. A prova da adoo crescente pelo mercado de tais tecnologias est no fato de que atualmente quase todas as solues de armazenamento so concebidas com uma ou mais tecnologias de otimizao de armazenamento que podem ser implantadas prontamente. Embora possa ser um desafio medir o tamanho do mercado de otimizao de armazenamento como uma frao do mercado geral de armazenamento, a taxa de adoo dessas tecnologias significa que, com o tempo, todos os armazenamentos instalados sero otimizados de um modo ou de outro.

#234933

2012 IDC

Por que a otimizao de armazenamento no mais opcional? Enquanto o motivador primrio para otimizao de armazenamento pode ser um grande crescimento de dados, a otimizao de armazenamento tambm influenciada em grande parte pelas ineficincias introduzidas por como os dados so criados, acessados e/ou armazenados. Algumas dessas ineficincias possuem um elemento humano, mas outras so subprodutos de sobrecarga de tecnologia. A quantidade de dados estticos (ou seja, dados que mal so acessados regularmente) continua a crescer a um ritmo muito mais rpido do que a quantidade de dados quentes ativos (ou seja, dados que so acessados o tempo todo). H uma desenfreada duplicao de dados, que so criados graas a tecnologias mais modernas. Por exemplo, a virtualizao de servidores pode criar imagens de sistemas operacionais que so quase idnticos uns aos outros. Outro exemplo est em usurios que criam cpias duplicadas de imagens, arquivos e outros dados. Alguns dos formatos utilizados para a criao de contedo esttico so nativamente ineficientes (isto , o formato cria uma grande quantidade de espao vazio). Isto resulta em espao redundante no disco. O armazenamento de dados estruturados, tais como bancos de dados, pode resultar em ineficincias no que diz respeito a armazenamento por causa dos elementos de metadados que suportam vrios atributos para esses dados. As empresas podem ter tipos distintos de armazenamento (e, s vezes, de vrios fornecedores) que criaram silos na infraestrutura. Devido a diferentes orientaes de interoperabilidade ou consideraes de desempenho, as empresas podem achar difcil implantar esses bens de forma homognea, resultando em que se tornem severamente subutilizados. A classificao por nveis parece uma forma ideal para dimensionar de maneira correta a infraestrutura de armazenamento, mas na prtica a falta de mecanismos automticos de hierarquizao apresenta um desafio para os administradores de armazenamento moverem dados de um nvel para outro. Isso resulta em uma utilizao ineficiente dos nveis de armazenamento e um menor benefcio de hierarquizao. As tecnologias de otimizao de armazenamento so destinadas diretamente ao aprimoramento da utilizao dos ativos ao alterar a colocao e a organizao dos dados. Como uma camada adicional da tecnologia, a otimizao de armazenamento , em ltima anlise, projetada para superar as ineficincias introduzidas por seres humanos ou pela prpria tecnologia: Hierarquizao automatizada a capacidade de mover apenas pores ativas de dados para nveis mais elevados (e mais caros) enquanto que a maioria menos ativa dos dados permanece em nveis mais baixos de armazenamento. O princpio bsico que enquanto os dados podem crescer, uma porcentagem cada vez maior de dados de dados estticos ou fixos que no precisam residir em camadas de alto desempenho em todos os momentos. A virtualizao de armazenamento a capacidade de reunir recursos de armazenamento diferentes e muitas vezes de vrios fornecedores sob uma gesto e uma forma de visualizao nica. Thin provisioning a capacidade de definir uma unidade de armazenamento (sistema completo, conjunto de armazenamento ou volume) com um tamanho de capacidade lgico que maior do que a capacidade fsica atribuda unidade de armazenamento. O host ou dispositivo que acessam a unidade de armazenamento veem a capacidade lgica e no a capacidade fsica.
2012 IDC #234933 3

Deduplicao a capacidade de analisar um bloco de dados nico ou arquivo ou uma srie de blocos de dados ou arquivos procurando por padres comuns e substitulos ou direcion-los para uma nica instncia daquele padro, reduzindo assim a duplicao de tais padres na base de armazenamento. Devido natureza de bloquear o acesso, a deduplicao oferecida principalmente em armazenamento baseado em arquivo. A compresso a capacidade de comprimir os dados para que os blocos se tornem menores. A utilizao de compresso permite que esses dados consumam muito menos armazenamento em comparao com outras tecnologias de otimizao, como a deduplicao ou o thin provisioning. Como os motivadores e tcnicas de otimizao de armazenamento demonstram, a otimizao de armazenamento no uma abordagem que serve para tudo, ao contrrio de algumas outras tecnologias de armazenamento, tais como replicao, clones de matriz e assim por diante. A natureza diversa dos dados em si torna algumas tcnicas de otimizao de armazenamento mais adequadas para determinados tipos de dados do que outras. No entanto, ao utilizar tecnologias de otimizao de armazenamento como um pacote em uma infraestrutura de armazenamento compartilhado, as empresas podem obter importantes benefcios tangveis, sem comprometer a qualidade do servio.

Compresso em Tempo Real


Antes de destacar os benefcios da Compresso em Tempo Real, vamos primeiro examinar porque a compresso muitas vezes excluda da lista quando se trata de otimizao de armazenamento. Muitos fornecedores so rpidos em apontar que, ao contrrio do thin provisioning ou da deduplicao, a compresso pode ter resultados mistos e, por vezes, adversos. Isso ocorre em parte porque a abordagem tradicional fora os fornecedores para conseguir um equilbrio delicado entre a compressibilidade e a penalidade de desempenho, resultando em desempenho abaixo do esperado. por isso que geralmente implementada somente para dados que so utilizados com pouca frequncia. Desafios da Utilizao da Compresso A abordagem tradicional e comumente adotada a de comprimir os dados fora da produo. Este tipo de compresso, que tambm conhecido como compresso psprocesso, entra em ao depois que os dados j foram gravados no disco. Isto muito semelhante a vrios utilitrios com base em servidores que compactam arquivos e pastas, assim que so criados. Este mtodo inerentemente ineficiente, pois seus algoritmos consomem ciclos relevantes de computao, so intensivos para disco e requerem um delta adicional de espao para armazenar os dados no comprimidos. Em um servidor, na maioria das vezes, pode-se ir mais longe com esse impacto em funo do poder do processamento adicional, mas em uma srie de armazenamento dedicado, uma sobrecarga adicional desse tipo pode facilmente produzir uma degradao perceptvel na qualidade do servio, o que automaticamente observado no servidor e nos aplicativos. Como resultado, os fornecedores so rpidos em no valorizar a compresso na maioria das situaes, a menos que o conjunto de dados seja insignificante ou o sistema de armazenamento como um todo esteja subutilizado. Na compresso tradicional, quando os aplicativos fazem vrias atualizaes de dados, tais mudanas so gravadas no disco de forma descompactada. Posteriormente, outra operao tem de ser agendada e comprimir os dados com base em sua localizao fsica em um volume, seja qual for a sua relao com outros blocos de dados que o aplicativo possa estar acessando.
4 #234933 2012 IDC

Os resultados produzidos por mecanismos de compresso tradicionais tambm variam muito. Tais mecanismos de compresso leem um pedao fixo de dados pr-determinados e produzem uma sada varivel, dependendo da compressibilidade desses dados. Alm disso, as taxas de compresso dependem dos tamanhos dos blocos: quanto maior o bloco, maior a taxa de compresso e maior a sobrecarga do desempenho. Blocos de tamanhos menores resultam em taxas menores de compresso. O meio-termo entre os tamanhos do bloco e a sobrecarga de desempenho no to bom no final. Um efeito colateral da compresso que resulta em fragmentao. Devido ao psprocesso e natureza varivel dos mecanismos de compresso tradicionais, a compresso degenera a continuidade dos dados ao longo do tempo. Os dados comprimidos so espalhados em pedaos em todo o volume e necessitam de coleta de lixo frequente. O impacto deste efeito o impacto no desempenho ao longo do tempo. Compresso em tempo real revigora o papel da compresso na otimizao do armazenamento Atualmente, a maioria dos fornecedores oferece compresso como um recurso opcional licencivel , mas recomenda-se firmemente que os administradores a habilitem apenas em conjuntos de dados selecionados. Na maioria das situaes, a adoo de compresso para dados primrios ativos na infraestrutura de armazenamento em geral continua a ser limitada. Uma vez que cada penalidade no desempenho do sistema de armazenamento pode ter um efeito cascata sobre o resto dos aplicativos, a maioria das empresas opta por deixar a compresso desativada. Uma nova abordagem, conhecida como Compresso em Tempo Real, pode estar colocando em evidncia novamente o papel da compresso na otimizao do armazenamento. A Compresso em Tempo Real torna vivel a utilizao da compresso sem penalidades operacionais. Ela promete taxas de compresso de at cinco vezes para dados em produo. Alm disso, pela reduo de dados primrios, ela tambm comprime todas as cpias derivadas desses dados, como backups, arquivos, instantneos e rplicas. A IBM implementou a tecnologia no sistema de armazenamento Storwize V7000, eliminando a necessidade de aplicativos externos. O IDC espera que outros fornecedores sigam a liderana da IBM e se afastem da compresso tradicional em repouso e desenvolvam tecnologias semelhantes mas competitivas de compresso. Isso ir validar e reforar o papel de compresso como um componente essencial da eficincia. De fato, medida que os processadores de armazenamento se tornam mais rpidos e mais poderosos, os fornecedores de armazenamento podem direcionar ciclos de compresso para ncleos ou processadores dedicados no controlador de armazenamento, alm de ciclos de deduplicao. O que a Compresso em Tempo Real e quais so os seus Benefcios? Ao contrrio das tecnologias tradicionais de compresso que comprimem os dados como uma operao ps-processo, a Compresso em Tempo Real opera em dados primrios ativos medida que esto sendo acessados. Isso expande a esfera de compresso a um conjunto muito maior de cargas de trabalho com resultados previsveis e mensurveis. Alm disso, essa compresso est sempre ligada, o que significa que pode ser habilitada em cargas de trabalho ativas e no necessita de perodos previstos para ps-processamento, ao contrrio de seus antecessores.

2012 IDC

#234933

O principal diferenciador que na Compresso em Tempo Real o mecanismo de compresso processa um fluxo de dados variveis com base nos padres de dados que so realmente gravados. A Compresso em Tempo Real aproveita a localidade temporal e no a localizao fsica: Os dados que so acessados em conjunto so comprimidos juntos, seja qual for a sua localizao fsica. Portanto, quando as aplicaes fizerem atualizaes relacionadas a diferentes partes do volume, essas atualizaes sero tratadas em conjunto e de forma contgua. Isto semelhante operao do sistema real porque tira proveito da estrutura dos dados, do tamanho dos dados e da relao dos dados com outros dados. Essa conscincia da carga de trabalho minimiza a quantidade de operaes de compresso e/ou descompresso, resultando em menos IOPS (operaes de entrada e sada por segundo) de disco e menos sobrecarga no controlador de armazenamento. Isso aumenta os ndices de compresso e a eficincia, sem comprometer o desempenho.

Implementao do IBM Storwize V7000


A IBM adquiriu a tecnologia de Compresso em Tempo Real atravs da aquisio da empresa Storwize em 2010. Inicialmente, a IBM ofereceu essa tecnologia atravs de dispositivos desenvolvidos especificamente para comprimir de modo transparente em ambientes NAS. A IBM ainda vende esses dispositivos atualmente, mas tambm deu um passo frente ao implementar a tecnologia dentro da sua plataforma Storwize V7000. A plataforma Storwize V7000 utilizar a mesma tecnologia do Mecanismo de Compresso de Acesso Aleatrio (RACE) que os dispositivos dedicados utilizam. A IBM planeja introduzir a compresso no Storwize V7000 como um componente licencivel opcional atravs da atualizao de um firmware. Assim, os usurios existentes de Storwize V7000 conseguiro selecionar compresso como um atributo ao criar novos volumes. Os administradores tambm tm a opo de converter volumes existentes utilizando espelhamento de volume para comprimir volumes mal provisionados e eliminar o espao no utilizado no processo. A IBM inicialmente planeja aceitar at 200 volumes comprimidos, mas pode aumentar esse limite com os lanamentos posteriores. A interface grfica com o usurio do Storwize V7000 apresentar informaes sobre desempenho relacionado com compresso e permitir que os administradores gerenciem e monitorem compresso a partir de um nico console. A Compresso em Tempo Real aprimora a funcionalidade do Storwize V7000 sem criar sobrecarga administrativa adicional. Como a Compresso no Storwize V7000 se compara com a Abordagem Tradicional? Conforme observado anteriormente, as abordagens tradicionais para compresso vm tendo uma m reputao por seu desempenho imprevisvel, sobrecarga e a natureza pesada de ps-processamento. A Compresso em Tempo Real, por outro lado, altera a equao ao criar uma camada de otimizao em linha e eficiente. O impacto imediato da implementao da Compresso em Tempo Real que o sistema de armazenamento produz resultados com menos IOPS durante a rotina de compresso. Cargas de trabalho ativas, tais como bancos de dados e sistemas de e-mail muitas vezes executam pequenas atualizaes nos dados existentes. A anlise da IBM sugere a melhoria relevante quando comparada com as abordagens tradicionais para essas cargas de trabalho (consulte a Tabela 1).

#234933

2012 IDC

T abe l a 1
Comparao da Compresso Tradicional com a Compresso em Tempo Real da IBM Compresso Tradicional pedao de 1 MB Leitura de 1 MB Descompresso de 1 MB Atualizao de 100 Bytes Compresso de 1 MB Gravao de 1 MB E/S total por operao de compresso: 2 MB
Fonte: IBM, 2012

Compresso em Tempo Real da IBM Atualizao de 100 Bytes Leitura de 0 MB Descompresso de 0 MB Atualizao de 0 Byte Compresso de 100 Bytes Gravao de < 100 Bytes E/S total por operao de compresso: < 100 Bytes

A Compresso em Tempo Real Storwize V7000 alcana ndices de compresso semelhantes aos dos dispositivos de Compresso em Tempo Real da IBM (consulte a Tabela 2). Uma vez que a Compresso em Tempo Real pode ser implementada com uma variedade de tipos de dados maior do que a compresso tradicional, os benefcios potenciais podem ser maiores. Taxas de compresso previsveis tornam mais fcil para as empresas planejar os oramentos dedicados ao sistema de armazenamento.

T abe l a 2
ndices de Compresso Observados pela IBM em Ambientes dos Clientes Aplicativos Bancos de dados Servidores Virtuais (VMware) Escritrio Sistema Operacional Linux virtual Sistema Operacional Windows virtual 2003 2007 ou posteriores CAD/CAM
Fonte: IBM, 2012

Compresso Observada At 80% At 70% At 50% At 75% At 20% At 70%

Ao possibilitar a compresso em volumes novos ou existentes no Storwize V7000, as empresas podem extrair maior capacidade utilizvel de seus investimentos existentes. Isso permite que muitas empresas achatem ou reduzam seus gastos em armazenamento para a maioria das configuraes comuns. Um benefcio adicional da utilizao da Compresso em Tempo Real com o Storwize V7000 que mesmo volumes extrados de armazenamento virtualizado externo podem ser comprimidos. Em muitos casos, isso representa quase o dobro da quantidade de capacidade utilizvel para investimentos modestos em CAPEX e menores custos de OPEX.

2012 IDC

#234933

Desafios e Oportunidades para o Storwize V7000


Nos tempos atuais, quando os oramentos de armazenamento so limitados ou reduzidos, as organizaes de TI continuam a procurar maneiras de armazenar de modo eficiente e rpido o crescimento de dados a custos mais baixos. A Compresso em Tempo Real, embora atraente, ainda est na fase inicial de adoo. Muitas organizaes continuam a considerar a compresso como uma tecnologia intensiva de ps-processamento de computao. Um dos principais desafios que as organizaes enfrentam atualmente ao utilizar a Compresso em Tempo Real o do risco versus a recompensa. As organizaes certamente exigem respostas para perguntas como a seguinte: Quanto devo pagar para comprimir os meus dados e que economias vou ver como resultado? Quis so os meus riscos ao comprimir os meus dados? Quais so as penalidades do desempenho? Conseguirei manter os ndices de compresso ou eles se degeneram ao longo do tempo? Ser capaz de quantificar a economia ser um grande fator para decidir se vale a pena adquirir ou no o software. As organizaes podem recorrer ferramenta Compresstimator da IBM para obter uma estimativa dos benefcios esperados da compresso para ambientes especficos. Utilizando os resultados e as taxas de crescimento esperados, as organizaes podem obter economias potenciais atravs da implantao do Storwize V7000 com a compresso ou a habilitao da compresso em volumes existentes. A IBM pode proativamente utilizar esta ferramenta para fornecer aos clientes existentes e futuros clientes uma visualizao do potencial de economia. A tarefa que se apresenta para a IBM ajudar as organizaes a remover a sua viso de compresso como uma tarefa inerente de ps-processo. A IBM pode continuar a obter reconhecimento entre seus clientes ao orient-los sobre as prticas recomendadas e utilizar casos para a implantao da Compresso em Tempo Real, criando documentos que descrevam a utilizao da compresso juntamente com outras tecnologias de otimizao de armazenamento, tais como thin provisioning, hierarquizao de armazenamento e deduplicao.

C O N C LU S O E O R I E N T A O E S S E N C I A L
As tecnologias de otimizao de armazenamento chegaram para ficar. Graas Compresso em Tempo Real, a compresso tem o seu lugar no portflio de otimizao de armazenamento. A IBM deu um passo na direo certa ao oferecer essa tecnologia em um de seus principais produtos de armazenamento. A natureza previsvel, confivel e linearmente escalvel da Compresso em Tempo Real ir impulsionar a sua adoo em ambientes com cargas de trabalho diversas. Isto, por sua vez, conduzir as empresas a sarem de suas zonas de conforto, tornando a Compresso em Tempo Real em uma das tecnologias obrigatrias em seus ambientes. Ser capaz de quantificar, prever e medir as economias apresentadas pelas tecnologias de otimizao de armazenamento como a Compresso em Tempo Real ir equipar melhor as empresas para enfrentar o crescimento explosivo dos dados.

Direito de Copyright
Publicao Externa de Informao e Dados da IDC Qualquer informao da IDC a ser utilizado em propaganda, comunicados da imprensa ou materiais promocionais requer aprovao prvia por escrito do Vice-Presidente ou Diretor Regional adequado da IDC. Um rascunho do documento proposto deve acompanhar qualquer pedido relacionado. A IDC se reserva ao direito de negar a aprovao do uso externo no importando o motivo. Copyright 2012 IDC. A reproduo sem a permisso por escrito completamente proibida.
8 #234933 2012 IDC