Você está na página 1de 10

Grids Computing

Introduo
Nos dias de hoje a capacidade de processamento limitada, seja em
nossos computadores pessoais ou mesmo em grandes servidores. Por isso
surgiu a ideia de uma infraestrutura que disponibiliza mais taxa de
processamento assim que a demanda de processamento do servidor estiver
no pico, isto sem a necessidade de se conhecer todo o aparato
computacional que existe atravs deste processamento. Este conceito de
processamento chamado de Computao em grade (Grid Computing).
A computao em grade tem o objetivo de combinar poder de
processamento de milhares ou at milhes de pequenos computadores
ligados em redes locais ou redes de longa distancia, normalmente VPNs
(Virtual Private Network), para que seja possvel processar um grande
nmero de tarefas em um determinado servidor, funcionando como um
supercomputador virtual.
A ideia da computao em grade replicar para o processamento
computacional a filosofia e os princpios de funcionamento da World Wide
Web. Assim como ela passou a disponibilizar uma gigantesca quantidade de
informaes em escala mundial, as Grids iro disponibilizar elevadas
capacidades computacionais, custa de distribuir tarefas de processamento
por vrios computadores de forma coordenada e eficiente.
Essa forma de computao permite revolucionar a maneira de
trabalhar em vrias reas da cincia e da tecnologia. Numa era em que o
trabalho cientfico de qualquer domnio do conhecimento produz cada vez
mais informaes, como por exemplo a descodificao do genoma humano,
a cura de doenas infectocontagiosas, imunolgicas ou cancergenas, ou o
estudo do comportamento da matria e da energia em experincias com
aceleradores de partculas cujos dados so analisados e partilhados por
investigadores dispersos por todo o mundo, a computao em grelha vem
oferecer respostas s enormes exigncias ao nvel da capacidade
computacional e de armazenamento que o processamento de grandes
quantidades de dados colocam.
Tambm na simulao computacional de sistemas de grande
dimenso, como por exemplo em meteorologia, oceanografia e genmica, a
computao em grade permite a conjugao de recursos computacionais
distribudos para a resoluo de problemas que requerem elevado
desempenho computacional.

Definio
Basicamente, uma grade computacional, ou grid, uma infraestrutura para
o compartilhamento de poder de processamento e capacidade de
armazenamento pela internet, a fim de se otimizar as tarefas realizadas. A
ideia do grid ir bem alm do que ser apenas um meio de comunicao

entre computadores, mas buscar transformar a rede


computadores em um nico e vasto recurso computacional.

global

de

Segundo Ian Foster, as Grids podem ser definidas de dois modos:

Um mtodo de se compartilhar recursos e se resolver problemas em


organizaes virtuais multi-institucionais dinmicas.

Sistemas que do suporte a criao de aplicaes paralelas que


agregam
e
fornecem
recursos
heterogneos
distribudos
geograficamente de forma consistente e barata.

No sistema de computao em grade ideal, todo recurso compartilhado,


transformando a rede de computadores em um poderoso supercomputador.
Com a interface de usurio certa, acessar o sistema de computao em
grade no seria diferente de acessar os recursos de uma mquina local.
Qualquer computador autorizado teria acesso a um enorme poder de
processamento e capacidade de armazenamento.
Ainda segundo Ian Foster, um Grid um sistema que:

Coordena recursos que no esto sujeitos a um controle centralizado;


Usa protocolos e interfaces normalizadas, abertas e de uso genrico
para garantir a interoperabilidade entre sistemas diferentes;
Fornece servios com uma qualidade no trivial de modo a satisfazer
as necessidades dos utilizadores mesmo que estas sejam complexas.

A utilizao da computao em grid costuma obedecer aos seguintes


conceitos:

Computao oportunista: Faz uso da capacidade de processamento


no utilizada pelos computadores, executando processos em
prioridades mais baixas de modo a no prejudicar a realizao de
outros processos ou a utilizao do computador pelo usurio.
Computao voluntria ou Computao filantrpica: O usurio
interessado em ajudar certo projeto se cadastra nele e instala o
aplicativo cliente em seu computador, fornecendo recursos a esse
projeto.

Podem ser destacados alguns tipos de grades:

Grid computacional: Tem o enfoque voltado para o processamento de


dados. Portanto importante que se tenha mquinas de alto
desempenho.

Grid varredor: Nesse tipo de grid feita uma varredura no pc dos


recursos e ciclos de CPU ociosos, para que possam ser utilizados pela
grid. Contudo, os donos dos computadores sempre tm o controle
sobre os recursos que esto participando do Grid.

Grid de dados: Nesse tipo de grid, diversas organizaes armazenam


e acessam os dados compartilhados. Neste caso, os usurios no

sabem aonde se localizam os dados, apesar de terem acesso s


informaes.
Os tipos supracitados no so mutuamente excludentes. Ou seja, uma
mesma grid pode ser um grid computacional, varredor e de dados ao
mesmo tempo, se apresentar as caractersticas necessrias.
Com uma interface de usurio certa, acessar o sistema computacional em
grade no seria diferente de acessar os recursos de uma mquina local.
Qualquer computador que tenha autorizao teria acesso a todo o conjunto
de processamento e capacidade de armazenamento.
Muitas empresas e organizaes esto trabalhando juntas para criar um
conjunto padro de protocolos para tornar mais fcil configurar ambientes
da computao em rede. possvel criar um sistema de computao em
rede agora, e vrios j existem. Mas o que est faltando um mtodo
consensual. Isso significa que dois diferentes sistemas de computao em
grade podem no ser compatveis porque cada um est trabalhando com
um conjunto de ferramentas e protocolos individuais. Uma vez que as
pessoas entrem em acordo sobre um conjunto de padres e protocolos
confiveis, ser mais fcil e mais eficiente para empresas adotarem algum
modelo para computao em grade.
Essas so algumas das empresas e organizaes que esto trabalhando
para estabelecer padres e protocolos da computao em grade:

Open Grid Frum (OGF), que criou um importante conjunto de


padres chamado Open Grid Services Architecture (OGSA);
Organization for the Advancement of Structured Information
Standards (Oasis);
Globus Alliance, colaborao internacional de cientistas da
computao.
IBM;
Microsoft;

Diferena entre Grids e Clusters


Apesar de alguns autores considerarem clusters e grids dois conceitos
distintos, outros tratam os grids como uma evoluo do conceito de
clusters. Assim como os clusters, os grids esto se tornando algo popular. A
ideia por trs tanto dos clusters quanto dos grids basicamente a mesma:
combinar o poder de processamento de vrios computadores ligados em
rede para conseguir executar tarefas que no seria possvel (ou pelo menos
no com um desempenho satisfatrio) executar utilizando um nico
computador e ao mesmo tempo faz-lo a um custo mais baixo de um
supercomputador de potncia semelhante.
Para alguns autores, a principal diferena entre um cluster e um grid
que um cluster possui um controlador central, um nico ponto de onde
possvel utilizar todo o poder de processamento do cluster. Os demais ns
so
apenas
escravos
que
servem
a
este
n
central.

Os grids por sua vez utilizam uma arquitetura mais flexvel onde embora
possa existir algum tipo de controle central, tem-se um ambiente
cooperativo, onde os usurios compartilham os ciclos ociosos de
processamento em seus sistemas em troca de poder utilizar parte do tempo
de processamento do grid. uma ideia mais inteligente, mas tambm
mais
complexa.
Veja algumas diferenas entre eles:

Diferenas entre Cluster e Grid

Histria
A ideia de computao em grade nasceu no incio dos anos 90,
visando auxiliar atividades de pesquisa e desenvolvimento cientfico. O
termo surgiu em analogia s redes eltricas (power grids) por propor se
apresentar ao usurio como um nico computador virtual, mascarando toda
a infraestrutura distribuda, assim como a rede eltrica para uma pessoa
que utiliza uma tomada sem saber como a energia chega ela. Trata-se de
uma metfora de tornar o acesso ao poder de computao to fcil quanto
o acesso a uma rede eltrica. Seu objetivo era casar tecnologias heterogneas (e
muitas vezes geograficamente dispersas) formando um sistema robusto, dinmico e
escalvel
onde
se
pudesse
compartilhar
processamento,
espao
de
armazenamento, dados, aplicaes, dispositivos, entre outros.

Em 1998 Ian Foster e Carl Kesselman, publicaram um trabalho


intitulado "The Grid: Blueprints for a new computing infrastructure" (A
grelha: modelos para uma nova estrutura de computao), que hoje
conhecido como a bblia da computao em grade. Esses autores reuniram
as ideias de uma grid, incluindo aquelas de computao distribuda,
programao orientada a objetos, computao em cluster, servios web e
outros, se tornando amplamente conhecidos como os pais da computao
em grid.
Eles tambm tiveram criaram o Globus Toolkit, que um conjunto de
servios que facilitam a computao em grade. Esses servios podem ser
usados para a submisso e controle de aplicaes, movimentao de dados,
segurana no ambiente do grid e descoberta de recursos. Atualmente, a
soluo de maior impacto na comunidade da computao de alto

desempenho. Globus e os protocolos definidos em sua arquitetura tornaramse um padro como infraestrutura para computao em grade.
Varrimento de CPU e computao voluntria foram popularizados
somente no inicio de 1997 por distributed.net, que foi o primeiro projeto de
computao distribuda com propsito geral. Posteriormente, em 1999 sua
popularidade foi aumentada pelo SETI@home, que buscava, e ainda busca
inteligncia extraterrestre, analisando dados vindos de um radiotelescpio,
que ao contrrio de um telescpio comum, que produz imagens atravs da
luz visvel, trabalha com a recepo de ondas de rdio recebidas por um a
ou um conjunto de antenas parablicas.
Durante a dcada de 90, surgiram tecnologias que, sem dvida, auxiliaram
na evoluo e difuso do uso das grid. Entre elas, podem ser apontadas:

World wide web, que possui um papel essencial, simplificando a


comunicao nas grades.

Sistema operacional Linux, que o sistema operacional preferido de


vrios Gridtestbeds, que so grids montadas apenas com a finalidade
de se realizar testes.

Linguagem de programao Java, que apesar de no ser a nica


linguagem usada nas grades computacionais, extremamente
popular e bem adaptada a filosofia das grids.

A tecnologia em grade vem sendo aperfeioada, em grande parte


pelo esforo do Global Grid Frum (GGF), uma comunidade formada por
entidades do meio cientfico e corporativo que criam e padronizam
tecnologias para ambientes em grade. Um dos trabalhos mais importantes
do GGF atualmente vem sendo o desenvolvimento do OGSA (Open Grid
Service Architecture), um padro cujo objetivo permitir interoperabilidade,
portabilidade e reutilizao de servios em grade atravs da padronizao
de interfaces, comportamentos e servios bsicos obrigatrios, APIs, etc.,
assim viabilizando a utilizao conjunta de servios desenvolvidos em
diferentes ambientes, por diferentes desenvolvedores.
Pesquisadores da rea acreditam que a tecnologia de grades
computacionais seja a evoluo dos sistemas computacionais atuais, no
sendo apenas um fenmeno tecnolgico mas tambm social pois num
futuro prximo reuniria recursos e pessoas de vrias localidades, com vrias
atividades diferentes, numa mesma infraestrutura possibilitando sua
interao de uma forma antes impossvel.
A computao em grade vem ganhando destaque nos ltimos tempos
com algumas empresas apostando alto nessa tecnologia. Um bom exemplo
a IBM que tem feito grande investimento em pesquisa e desenvolvimento
de ferramentas em grade para ambiente corporativo, e tambm uma das
principais colaboradoras no desenvolvimento do Globus Toolkit.
No meio cientfico j se pode encontrar vrias grades em
funcionamento espalhados por vrios pases, muitos sendo projetos multiinstitucionais. Como exemplos tm-se: Datagrid, do CERN (Organizao
Europeia de Pesquisa Nuclear), um projeto financiado pela Comunidade

Europeia com o objetivo de atuar em reas de pesquisa como astronomia,


fsica e biologia; BIRN, projeto multi-institucional que conta com quinze
universidades norte-americanas, voltado para a pesquisa neurolgica e
Mammogrid, uma iniciativa da comunidade europeia para formar uma base
de mamografias que abrange toda a Europa com intuito de fornecer
material de estudo e campo para o desenvolvimento de tecnologias em
grade. No Brasil um bom exemplo o Sprace, projeto de uma grade do
Instituto de Fsica da USP que participa no processamento dos dados
provenientes do projeto D0 (projeto que rene pesquisadores do mundo
todo para analisar os dados gerados pelo acelerador de alta energia
Tevatron Collider, localizado em Illinois, Estados Unidos).

Arquitetura
Normalmente a arquitetura Grid dividida em camadas, cada qual
com uma funo especfica, de forma que as camadas mais altas so
centradas no usurio e as mais baixas no hardware. Ela pode ser dividida
em quatro camadas:

A primeira camada, mais baixa, a da rede, que tem o papel de


conectar os recursos da grid.

Na segunda camada, acima da camada da rede, se encontram os


recursos, tais como computadores, servios de armazenamento,
catlogos eletrnicos e sensores que esto conectados a rede. Essa
camada dos servios coletivos, que tambm so baseados em
protocolos. Estes so os protocolos de informao, que obtm
informao sobre a estrutura e o estado dos recursos numa grade
computacional a os protocolos de gerncia, que negociam o acesso a
recursos de um modo uniforme. Servios coletivos abrangem
atividades como realizar update de diretrios dos recursos
disponveis, monitorar e diagnosticar problemas, replicar dados,
fornecer servios de policiamento para rastrear que pode fazer o que
e quando.

A terceira camada a do middleware (mediador, faz a mediao


entre os softwares e demais aplicaes), que fornece ferramentas que
permitem
que
elementos
distintos
(servers,
redes
de
armazenamento, etc.) participem na grade. Pode se dizer,
analogamente, que o middleware o crebro da grid, pois a
'inteligncia' que une e controla os outros elementos. A camada
do middleware dividida em outras duas camadas:
o

A primeira a de recursos e protocolos de conectividade, que


cuidam da comunicao
em rede
entre
diferentes
computadores e recursos de grid. Nesta camada, protocolos de
comunicao so usados para que computadores que
contribuam numa grid reconheam mensagens relevantes no
contexto da grid e ignorem qualquer outra mensagem vinda
pela internet, isto , permite que os recursos se comuniquem
entre si, possibilitando troca de dados.

A segunda trata dos protocolos de autenticao, que fornecem


mecanismos seguros de verificar a identidade tanto dos
usurios, como dos recursos.

A quarta e ltima camada, a mais alta da estrutura, a que se refere


aplicao propriamente dita, que inclui aplicaes em diversas
reas como engenharia e financias, alm de portais e
desenvolvimento de ferramentas que auxiliam as aplicaes. Nas
arquiteturas em grade mais comuns, a camada de aplicao fornece
o chamado serviceware, que se consiste de funes gerais de
gerncia como medir quem fornece recursos e quem os usa, uma
atividade importante quando se compartilha recursos de uma
diversidade de instituies entre um grande nmero de usurios.

Camadas da arquitetura Grid


Fonte: http://www.gta.ufrj.br/grad/08_1/grades/img/arq1.gif

Vantagens
Dentre os benefcios que a utilizao da computao em grade pode trazer,
podemos citar:

Reduo de custos: Diminui-se a quantidade de mquinas que uma


empresa tem que adquirir para realizar armazenamento e/ou
processamento de dados. Estes so armazenados e/ou processados
distributivamente na rede.

Aumento da produtividade: Aumenta-se a quantidade


computadores que trabalham em determinada tarefa.

de

Compartilhamento de recursos e informaes: Torna possvel


que organizaes agreguem recursos, como de armazenamento e
processamento de dados, alm de informaes.

Poderosa plataforma de suporte a organizaes virtuais:


organizaes podem melhorar radicalmente sua qualidade e
velocidade de produtos e servios disponibilizados.

Melhor utilizao de largura de banda: pode-se criar a mais


robusta e resistente infraestrutura de informaes.

Acesso distribudo a diversos tipos de recursos: Permite que


bases de dados sejam compartilhadas e acessadas remotamente por
outras empresas. Esta caracterstica de fundamental importncia
para a comunidade de pesquisa, que, diariamente, acessa e gera
grande quantidade de informaes. Alm disso, permite que haja
colaborao entre centros de pesquisa.

Aproveitamento de recursos ociosos: Utiliza os recursos ociosos


dos computadores na grid, sem prejudicar a utilizao pelo usurio.

Desafios
Dada complexidade, nmero e heterogeneidade de mecanismos e
regras para controle dos recursos, a necessidade de utilizao de polticas
de alto nvel surge naturalmente. Essas polticas devem facilitar a tarefa dos
administradores de polticas, tanto a nvel de cada organizao individual,
quanto ao nvel central da organizao virtual.
No entanto, as plataformas de grid existentes atualmente
disponibilizam apenas de mecanismos simples de controle de acesso.
Diversos motores de polticas foram integrados com as plataformas
utilizadas, mas tambm esses no suportam polticas de segurana
avanadas.
H ainda desafios operacionais e de pesquisa a serem vencidos, como por
exemplo:

Federar um nmero de fontes de dados;


Replicar dados em favor da velocidade e robusteza;
Acessar dados heterogneos;
Permitir rpida transferncia de arquivos grandes;
Localizao dos recursos;
Reserva de recursos;
Capacidade para adaptar- se a mudanas no ambiente;
Criao e escalonamento das tarefas;
Autonomia de cada grupo participante para definir suas prprias
polticas de segurana;
Recursos requisitados podem estar em diferentes localidades;
Qualidade de servio exigida por cada aplicao.
Gerenciamento de licenas;

Para se utilizar um sistema em Grid so necessrios diversos


protocolos, padres e ferramentas de software. Para desenvolver padres
comuns de processamento a Universidade do Sul da Califrnia, o
Laboratrio Nacional de Argonne e a Universidade de Chicago atravs do
Projeto Globus esto desenvolvendo um conjunto de especificaes tcnicas
e ferramentas de software para Grid Computing, comandados pelo
pesquisador Ian Forster. A padronizao da tecnologia de Grid j vem
ocorrendo a bastante tempo, sendo que, devido ao uso de diversas
empresas, os esforos passaram a ter uma prioridade muito maior nesses
ltimos anos.

Exemplos de grids
A seguir sero citadas algumas das grid funcionando atualmente:

Folding@home
Folding@Home, ou FAH, uma Grid lanada em outubro de 2000 e
construda para realizar simulaes de enrolamentos de protenas, design
computacional de drogas e outros tipos de dinmica celular, analisando
tambm as doenas relacionadas, como BSE, Alzheimer, Huntington, etc.
Atualmente gerenciado pelo grupo Panda, que uma organizao sem fins
lucrativos, dedicada pesquisa cientfica e educao, que se compromete
a no vender nenhum dado ou ter qualquer lucro sobre ele. localizado
dentro do departamento de qumica da Universidade de Stanford. Quando
foi lanado, tornou-se o segundo maior projeto depois do SETI@Home.
Em 2007, o Guinness reconheceu o Folding@home como a mais
poderosa rede de computao distribuda do mundo. Em 30 de setembro de
2014 o projeto contabilizou 107.708 ncleos de CPU ativos e 63.977 GPU
ativos, com uma capacidade total de 19,282 petaFLOPS.

SETI@home
O projeto Search for Extraterrestrial Intelligence (SETI) foi um dos
primeiros sistemas em grade a ganhar a ateno. A misso do SETI
analisar dados reunidos por radiotelescpios na busca de evidncias de
comunicao aliengena inteligente. O projeto SETI criou um programa
chamado SETI@home, que interliga computadores conectados em rede para
formar um supercomputador virtual.
Com mais de 5,2 milhes de participantes em todo o mundo, o
projeto o projeto de computao distribuda com o maior nmero de
participantes at o momento. A inteno original do SETI @ home foi utilizar
50,000-100,000 computadores domsticos. Desde o seu lanamento em 17
de maio de 1999, o projeto j registrou mais de dois milhes de anos de
tempo de computao agregado. Em 26 de setembro de 2001 SETI @ home
tinha realizado um total de 10 21 ponto flutuante operaes. Com mais de
145 mil computadores ativos no sistema em 233 pases, a partir de 23 de
junho de 2013 , SETI @ home tinha a capacidade para computar mais de
668 teraflops .

WLCG
O projecto Worldwide LHC Computing Grid (WLCG) uma colaborao
global de mais de 170 centros de computao em 40 pases, ligando-se as
infraestruturas nacionais e internacionais de grade. A misso do projeto
lanado em 2002 fornecer recursos de computao globais para
armazenar, distribuir e analisar os 25 Petabytes de dados gerados
anualmente pelo Large Hadron Collider (LHC) do CERN. No final de 2010, a
rede consistia em cerca de 200.000 ncleos de processamento e 150
petabytes de espao em disco. O fluxo de dados a partir dos detectores
fornece aproximadamente 300 GBytes / s de dados, o qual aps a filtragem
de "eventos" interessantes, resulta em um "dados em bruto" corrente de
cerca de 300 MByte / s.

Referncias
http://www.clubedohardware.com.br/artigos/Computacao-em-Grade-Uma-VisaoIntrodutoria/124/1
http://www.umic.pt/index.php?option=com_content&task=view&id=26&Itemid=509
http://www.gta.ufrj.br/grad/08_1/grades/definicao.html
https://pt.scribd.com/doc/59662950/Grid-Computing
http://tecnologia.hsw.uol.com.br/computacao-em-grade.htm
http://gliner.blogspot.com.br/2010/05/grid-computing-x-cluster.html
http://datacenter10.blogspot.com.br/2009/03/clusters-vs-grid-ou-clusters-e-grid.html
http://www.portalwebmarketing.com/Tecnologia/Oque%C3%A9aComputa
%C3%A7%C3%A3oemGrelha(GridComputing)/tabid/946/Default.aspx
http://projetofirb.blogspot.com.br/2007/11/historia.html
http://en.wikipedia.org/wiki/High-throughput_computing
http://pt.wikipedia.org/wiki/Computa%C3%A7%C3%A3o_de_alto_desempenho