Você está na página 1de 6

COMPUTAO EM NUVEM: CONCEITOS E

TECNOLOGIAS DE GERENCIAMENTO DE DADOS


Ticiana Linhares Coelho da Silva1, Jean Gleison de Santana Silva2, Lincoln
Alexandre Paz Silva2, Clayton Maciel Costa2
1
Departamento de Computao
Universidade Federal do Cear (UFC) Fortaleza, CE Brasil
2
Instituto Federal do Rio Grande do Norte (IFRN) Ipanguau, RN Brasil
ticianalc@lia.uf.br, jeangleison2@gmail.com, lincoln-
alexandre@hotmail.com, clayton.maciel@ifrn.edu.br

Abstract. The advent of new information technologies has resulted in an


increased amount of data to be stored. The need to provide services that
manipulate data, such as management services, storage and query on these
data still grows. In this context, it is necessary to provide computing as a
service, such paradigm is known as Cloud Computing, where the term cloud is
a metaphor for the Internet. This new trend of technology, which is one of the
biggest promises of the century, allows the use of services of Information
Technology (IT) to demand payment based on usage. Furthermore, Cloud
Computing is an alternative sustainable and brings many benefits; because it
covers a wide area in the IT market. This work discusses the concept, some
characteristics of Cloud Computing technologies and data management
technologies in Cloud Computing.

Resumo. O advento das novas tecnologias de informao tm resultado no


aumento da quantidade de dados a serem armazenados. Cresce ainda, a
necessidade de disponibilizar servios que manipulem esses dados, tais como
servios de gerenciamento, de armazenamento e de consulta sobre esses
dados. Nesse contexto, necessrio fornecer computao como um servio, tal
paradigma conhecido como Computao em Nuvem ou Cloud Computing
em ingls, onde o termo nuvem uma metfora para Internet. Essa nova
tendncia de tecnologia, a qual uma das maiores promessas do sculo,
permite a utilizao de servios de Tecnologia da Informao (TI) sob
demanda com pagamento baseado no uso. Alm disso, a Computao em
Nuvem se mostra uma alternativa sustentvel e trs muitos benefcios, pois
abrange uma ampla rea no mercado de TI. Dessa forma, o objetivo desse
artigo consiste em discutir o conceito, as caractersticas, e ainda algumas
tecnologias de gerenciamento de dados em Computao em Nuvem.

1. Introduo
O advento das novas tecnologias de informao tm resultado no aumento da
quantidade de dados a serem armazenados. Cresce ainda, a necessidade de
disponibilizar servios que manipulem esses dados, tais como servios de
gerenciamento, de armazenamento e de consulta sobre esses dados. Nesse contexto,
necessrio fornecer computao como um servio, tal paradigma conhecido como
Computao em Nuvem ou Cloud Computing em ingls, onde o termo nuvem uma
metfora para a Internet. Essa nova tendncia de tecnologia diz respeito a proporcionar
servios de Tecnologia da Informao (TI) sob demanda com pagamento baseado no
uso. A Computao em Nuvem pretende atingir desde os usurios finais que hospedam
seus documentos na Internet at empresas que terceirizam recursos de TI para outras
empresas.
A Computao em Nuvem facilita o acesso aos servios ou recursos
computacionais, de maneira independente de plataforma e de arquitetura. Alm disso,
prov aos usurios a ideia de recursos computacionais e armazenamento de dados
infinitos. Contudo, toda sua estrutura arquitetural sob demanda e com pagamento
baseado no uso, ou seja, s se paga pelo que utilizado (pay only when it matters).
Esse artigo tem como objetivo discutir o conceito, as caractersticas e algumas
tecnologias de Computao em Nuvem. Alm disso, so apresentadas algumas
tecnologias de gerenciamento de dados em nuvem existentes. O artigo est organizado
da seguinte forma: a Seo 2 apresenta uma viso geral do que a Computao em
Nuvem e suas principais caractersticas; a Seo 3 descreve o gerenciamento de dados
em nuvem. Finalmente, a Seo 4 discute as consideraes finais.

2. Computao em Nuvem: uma nova tendncia


O computador tem sido utilizado cada vez mais em nosso dia-a-dia, pois nele que
armazenamos arquivos e que executamos aplicativos para uso pessoal. Contudo, em um
ambiente corporativo, o mesmo no acontece, pois normalmente tem-se uma estrutura
de rede e os arquivos ficam armazenados nos servidores, de forma que os usurios finais
podem acess-los de qualquer computador que esteja no grupo da rede. Essa ideia de
armazenamento e processamento local, que temos hoje, est sendo substituda por
outros modelos distribudos e transparentes ao usurio.
Computao em Nuvem tem se tornado uma palavra chave da indstria de TI.
Ela uma evoluo dos servios e produtos de tecnologia da informao sob demanda.
Usurios de servios que so baseados nesse modelo, no precisam se preocupar com
escalabilidade nem com disponibilidade dos recursos, e ainda, eles pagam apenas pelo
recurso utilizado. Assim, computao em Nuvem um modelo inovador que prov
recursos computacionais com base em self-service sob demanda, ou seja, os recursos
utilizados pelo usurio que esto dentro da nuvem sejam eles software ou hardware,
podem ser alocados automaticamente de acordo com a necessidade do usurio de
maneira transparente e sem que o mesmo necessite de interao humana com os
provedores do servio.
A Computao em Nuvem prov ainda um pooling de recursos. O provedor
organiza seus recursos computacionais em um pool, tanto de recursos fsicos quanto
virtuais, a fim de atender a demanda de vrios usurios. A localizao desses recursos
transparente ao usurio. A elasticidadade rpida outra caracterstica do modelo de
Computao em Nuvem, ela se comporta de acordo com a demanda. Recursos
dedicados ao processamento e capacidade de armazenamento dos dados, por exemplo,
so automaticamente adquiridos pelo usurio de maneira rpida e elstica, basta que o
mesmo pague o preo adequado pelo uso do recurso. Quando a demanda dimunui, os
recursos so automaticamente liberados.
A Computao em Nuvem permite aos usurios acessarem seus aplicativos e
programas como se estivessem instalados em sua mquina e independentemente do
sistema operacional. O processamento da mquina, as configuraes de hardware e de
softwares aplicativos, e at mesmo o sistema operacional so carregadas no momento
em que se comea a utilizar o servio. Isso vantajoso, no s para as empresas como
para os usurios domsticos, visto que dessa forma s h o pagamento se houver o uso,
no havendo a necessidade de comprar licenas integrais de um software. Assim, a
medida que a necessidade dos usurios aumenta, basta eles adquirirem facilmente
recursos que esto nas nuvens.

Figure 1. Uma viso geral de uma nuvem computacional.

Outra vantagem para empresas e usurios domsticos que eles no precisaro


mais se preocupar com o backup, cuja responsabilidade passa a ser do provedor de
servio de Cloud Computing, responsvel por guardar e proteger seus arquivos, e
restaurar se necessrio. Contudo, muitas empresas ficam receosas pelos seus dados
estarem sob o domnio de outra empresa, ou hospedar todos os seus dados na Internet,
no oferecendo total segurana a suas informaes, como por exemplo, nmero da conta
corrente dos funcionrios, relatrios de produo, relatrios de projetos, entre outros.
Dessa forma, foram criados os modelos de implantao, so eles: pblico, privado,
hbrido e comunidade [NIST 2009], a fim de atender ao requisito de segurana da
aplicao.
O modelo de implantao privado dedicado exclusivamente para uma
organizao, podendo a nuvem ser administrada pela prpria empresa ou por terceiros.
Neste modelo, so empregadas polticas de segurana quanto ao acesso. Essas polticas
podem ser a nvel de gerenciamento de rede, configuraes dos provedores de servios e
utilizao de tecnologia de autenticao e autorizao [Sousa 2010]. Esse tipo de
modelo vivel de se utilizar em um cenrio de uma universidade e seus departamentos,
de tal forma que a universidade s deseja disponibilizar seus dados aos departamentos.
O modelo de implantao pblico dedicado a qualquer usurio, basta que o
mesmo conhea onde se encontra o servio. Nesse modelo, no faz sentido aplicar
tcnicas de segurana quanto ao acesso, como por exemplo, aplicao de tecnologia de
autenticao e autorizao. No modelo de implantao comunidade, diversas empresas
compartilham uma mesma nuvem. Nesse modelo, podem ser aplicadas tcnicas de
segurana quanto ao acesso, tais polticas de segurana devem estar de acordo com os
requisitos de cada empresa que participa da comunidade. Uma empresa da comunidade
ou terceiros podem administrar a nuvem. O modelo hbrido envolve unio de duas ou
mais nuvens, que podem ser privada, pblica e comunidade.

3. Gerenciamento de Dados em Computao em Nuvem


A expanso dos processos automatizados em diversas reas e as novas tecnologias de
informao levaram os sistemas computacionais a manipularem grande quantidade de
dados e ainda, de forma flexvel. Aplicaes como sistemas de monitoramento, desejam
armazenar e consultar dados capturados por uma rede de sensores, por exemplo, a fim
de tomar decises futuras. Assim, um sistema de monitoramento que opera em um
ambiente local, pode utilizar um Sistemas de Gerenciamento de Banco de Dados
(SGBD) relacional, o qual atenderia ao requisito de os usurios consultarem de forma
flexvel. Contudo, quando esses sistemas passam a ser operados e sincronizados de
maneira distribuda, uma opo seria utilizar SGBDs que estivesse em ambiente de
nuvem, j que esses ambientes garantem caractersticas tais como alta escalabilidade,
alta disponibilidade, autogerenciamento.
Apesar da alta disponibilidade que os bancos de dados para ambientes de nuvem
garantem, atravs da replicao em mltiplos data centers, do escalonamento
automtico e do particionamento dos dados para o armazenamento em vrios hosts
atendendo a demanda dos usurios, muitos dos bancos de dados de ambientes de nuvem
perdem caractersticas peculiares que existem em bancos de dados relacionais, tais como
consultas utilizando operador de juno, suporte a transaes e garantia de consistncia
forte [Sousa 2010].
Na literatura, existem SBGDs relacionais para ambientes de nuvem, tais como
Relational Cloud [Curino 2010], SQL Azure [Microsoft Azure 2009] e Amazon RDS
[Amazon 2010], que garantem suporte a transao e suporte ao SQL como linguagem de
consulta. Mas, apresentam desvantagens, pois no garantem forte escalabilidade nem
alta disponibilidade. J os SGBDs orientados a coluna, tais como Google DataStore e
Cassandra [Lakshman, A., Malik, Prashant 2009], garantem forte escalabilidade e alta
disponibilidade. Porm, no oferecem ou oferecem suporte simplificado a transaes e
possuem API simples para realizar consultas, no oferecendo suporte a junes. Os
SGBDs orientados a coluna, geralmente, so otimizados para leituras, sendo
aconselhvel a sua utilizao em aplicaes que requerem a realizao de consultas ad-
hoc em grande quantidade de dados, j os SGBDs relacionais, geralmente, so
otimizados para escrita, sendo mais viveis para aplicaes que realizam consultas com
pouca frequncia e que desejam alto desempenho na escrita dos dados.
Na literatura, existem outros Sistemas de Gerenciamento de Banco de Dados que
apresentam suporte nuvem e que possuem modelos de dados diferentes do relacional e
do modelo orientado a coluna, como por exemplo, os modelos Chave-Valor, como
Amazon Dynamo [DeCandia 2007] e orientado a Documento, como CouchDB [Apache
CouchDB 2010]. O Dynamo utiliza o modelo par chave-valor armazenados em uma
Distributed Hash Table e no possui suporte a associaes ou esquemas. Para garantir
um nvel de escalabilidade e disponibilidade, uma das tcnicas utilizada por ele relaxar
a consistncia em alguns cenrios de falhas [Sousa 2010]. O CouchDB um sistema de
banco de dados orientado a documentos, ditribudo, livre de esquema e de cdigo livre.

Figure 2. Classificao dos Sistemas de Gerenciamento de Dados.

4. Consideraes finais
Ultimamente, a ateno dada preservao do meio ambiente tem aumentado. Os
problemas ambientais causados pelos lixos tecnolgicos tm obrigados as empresas a
repensar seu modo de trabalhar e adotarem medidas que sejam tanto benficas aos seus
negcios, quanto ao meio ambiente.
Toneladas de lixo tecnolgico so jogadas no meio ambiente todos os dias,
devido falta de postos de coleta, principalmente em pases de economia emergente
como o Brasil. O uso cada vez mais crescente do computador e a necessidade de
upgrade das mquinas, devido ao uso de softwares que exigem melhores configuraes
de hardware, gera uma problemtica preocupante, pincipalmente nos dias de hoje.
Alternativas como Cloud Computing prometem diminuir esse problema, pois os
provedores oferecem servidores de alto desempenho, de tal sorte que os usurios no
precisam se preocupar com o upgrade de suas mquinas e em descartar as que esto
obsoletas. Dessa forma, os usurios geram menos lixo tecnolgico, no prejudicando o
meio ambiente.
Este artigo apresentou um estudo sobre Computao em Nuvem, destacando o
gerenciamento de dados nesse ambiente. A Computao em Nuvem um novo
paradigma, onde os recursos de TI so oferecidos como servios aos usurios que pagam
pelo seu uso. No gerenciamento de dados, podemos perceber que existem vrios
sistemas de gerenciamento de banco de dados que oferecem suporte nuvem. Esses
SGBDs esto evoluindo e se adequando necessidade das aplicaes.

5. Referncias
Sousa, F. R. C. (2010). Gerenciamento de Dados em Nuvem, Monografia de
Qualificao de Doutorado em Cincia da Computao na Universidade Federal do
Cear, Brasil.
NIST. Draft Definition of Cloud Computing. National Institute of Standarts and
Technology, 2009. http://csrc.nist.gov/groups/SNS/cloud-computing.
Curino, C., Jones, E., Zhang, Y., Wu, E., Madden, S. (2010). Relational cloud: The
case for a database service. Technical report, MIT-CSAIL-TR-2010-014. Computer
Science and Artificial Intelligence Laboratory, MIT, Estados Unidos.
Microsoft Azure (2009). http:/www.microsoft.com/azure/.
Amazon Relational Database Service (2010). http://aws.amazon.com/rds/.
Lakshman, A., Malik, Prashant (2009). Cassandra a decentralized structured storage
system. Ladis 09: Proceedings of the 3nd Workshop on Large-Scale Distributed
Systems and Middleware.
DeCandia, G., Hastorun, D., Jampani, M., Kakulapati, G., Lakshman, A., Pilchin, A.,
Sivasubramanian, S., Vosshall, P., Vogels, W. (2007). Dynamo: amazons highly
available key-value store. SIGOPS Oper. Syst. Rev., 41(6):205220.
Apache CouchDB(2010). http://couchdb.apache.org/.
Vecchiola C., Chu, X. and Buyya R. Aneka: A software platform for .net-based cloud
computing. CoRR, abs/0907.4622, 2009.
Daniel J Abadi. Data management in the cloud: Limitations and opportunities. IEEE
Data Eng. Bull., 32:3-12, 2009.
Vaquero L. M., Rodero-Merino L., Caceres J and Lindner M. A breaking the clouds:
towards a cloud definition. SIGCOMM Comput. Commun. Rev., 39(1):50-55, 2009.
Aboulnaga A., Salem K., Soror A. A, Minhas U. F., Kokosielis P. and Kamath S.
Deploying database appliances in the cloud. IEEE Data Eng. Bull., 32(1):13-20,
2009.
Ciurana E. Developing with Google App Engine. Apress, Berkely, CA, USA, 2009.
Liu S, Liang Y. and Brooks M. Eucalyptus: a web service-enabled-infrastructure. In
CASCON '07: Proceedings of the 2007 conference of the center or advanced studies
on Collaborative research, pages 1-11, New York, NY, USA, 2007. ACM.