Você está na página 1de 9

Computao em GRID Uma Introduo

Fbio Bombonato

Resumo
Este artigo ir tratar da explicitao do conceito de Grid Computing, tentando apresentar diante das vrias concepes existentes no meio acadmico e cientifico, a qual, sua popularizao que gera um certo desentendimento, mas que ser clareado com a apresentao de uma checklist para identificar-se um Grid. Sendo feito algumas diferenciaes entre o ambiente de Cluster e a emergente infraestrutura em Grid, que no acontece por acaso, conforme ser mostrado nas trs fases de sua concepo que se encontra neste artigo.

Palavras-chave
Computao em Grid, idle, colaborao, Grid Global, infraestrutura, Grid Checklist, organizaes virtuais, QoS, Enterprise Grids, Partner Grids, Service Grids.

GRID Computing A Introduction


Summary
This article will go to deal with the explication of the concept of Grid Computing, being tried to ahead present of the some existing conceptions in the academic and cientific area, wich its popularization that generates a misunderstanding, but that will be clarified with the presentation of one checklist to identify a Grid. Being made some differentiations between the environment of Cluster and the emergent Grid infrastructure, that does not happen by chance, as it will be shown in the three phases of its conception that if finds in this article.

Keywords
Grid Computing, idle, collaboration, Global Grid, infrastructure, Grid Checklist, virtual organization, QoS, Enterprise Grids, Partner Grids, Service Grids.

http://www.geleira.org

1. Introduo
No mundo, existem milhares de computadores em um estado ocioso (idle) ou desligados por no estarem sendo utilizados. Quem sabe um dos subsdios necessrios para utilizar este tempo ocioso sero as idias propostas pelos sistemas de Grid Computing, que sero capazes de utilizar estes recursos, que no momento estariam sendo subtilizados, para diferentes objetivos. Isso ser possvel com a consolidao de um sistema distribudo que tem como foco a colaborao. Vrios benefcios sero possveis, como uma empresa em um pas como o Brasil que poder utilizar o processamento de computadores na madrugada de Tkio, onde estes computadores poderiam estar em idle ou at mesmo desligados, bem como o oposto, o Brasil provendo processamento para Tkio ou outros pases. Essa possibilidade se faz cada vez mais necessria neste duro ambiente econmico, onde as organizaes sofrem, constantemente, presses para reduzirem seus custos em desenvolvimento e pesquisa. Vivemos no chamado tempo de mercado (time-to-market), do aumento de rendimentos e gesto de qualidade em produtos e servios. Normalmente, a melhor utilizao dos recursos de uma organizao e o aumento do poder de processamento pode alavancar tais mudanas. Neste contexto, o advento de Grid Computing est gerando especulaes no somente na rea cientifica, mas tambm na empresarial, pois ir permitir esta reduo de custos, tempo, aumento de produtividade, compartilhamento de recursos e informaes, dentre outras possibilidades. Veremos que esse patamar ser alcanado gradualmente, sendo proposto sua construo em trs fases, conforme apresentado neste artigo. Inicialmente a montagem dos Grids ser feita entre partes com interesses similares, como pesquisas da sade, biologia, astronomia, fsica, dentre outros que estaro interligando laboratrios, empresas e universidades e, que tenham interesses semelhantes. Com sua expanso, pode-se chegar, no final, em algo como a formao de um Grid Global, uma rede distribuda global de colaboraes entre seus participantes, capaz de prover recursos talvez inatingveis por um cluster isolado. Certamente, a popularizao do sistema em Grid ir atingir o usurio final, que tambm far parte desta comunidade de colaborao, beneficiando-se dos recursos desta grande rede, utilizando o poderio de processamento, compartilhamento de bases de dados e/ou arquivos e informaes, sendo que, o usurio tambm far sua parte, compartilhando os recursos de seu computador para benefcio da rede, ser algo como uma troca de favores.

2. O que Grid Computing


O termo Grid foi concebido por volta da dcada de 90 para denotar uma proposta de uma infraestrutura de computao distribuda para cientistas e engenheiros em um mbito mais avanado. Hoje, a computao em grid vista como a nova gerao de infraestrutura dos ITs (information technology) e espera que transforme a forma de computao, comunicao e colaborao. As multides de grids iro existir, cada um com seu prprio contexto, compartilhado por comunicaes na mesma industria ou com os mesmos

interesses. Os grids sero servios dirigidos, com organizaes acessando recursos computacionais pela Internet ou servios pblicos, quando preciso. [BAIRD, 2002] Ian Baird nos ajuda a iniciar o entendimento do significado da computao em grid, mas necessitamos ir mais a fundo para entender o que Grid Computing, para tal, temos mais algumas definies, como: "Grid uma infraestrutura emergente, que faz o processamento e o acesso a dados serem possveis de qualquer lugar e a qualquer horrio, sem que algum seja obrigatoriamente notificado". [GriPhyN, 2002] Vale ressaltar que no somente o processamento e o acesso a dados, mas sim a recursos, como apresentado em outra definio: Computao em Grid uma coleo de recursos heterogneos e distribudos possibilitando que sejam utilizados em grupo para executar aplicaes de larga escala. [LASZEWSKI, 2002] Isso ajuda a identificar que existe um compartilhamento de recursos, feitos em uma nova infraestrutura, como visto por Baird, e que o acesso pode ser feito de qualquer lugar qualquer horrio [GriPhyN, 2002]. Mas, para ajudar, Ian Foster do Laboratrio Nacional de Argonne em conjunto com a Universidade de Chicago criou uma lista (checklist) em 3 tpicos para ajudar esta conceituao.

2.1 - Grid Checklist


Com intudo de clarear a definio de Grid, j que este conceito est deixando o obscuro mundo acadmico e se tornando altamente popular, pois j possvel ler a respeito de Compute Grids, Data Grids, Science Grids, Access Grids, Knowledge Grids, Bio Grids, Sensor Grids, Cluster Grids, Campus Grids, Tera Grids, e comunmente Grids, mas estas, constantemente se confundem com o real significado do que Grid. Para tal, Ian sugeriu um checklist englobando a essncia de outras definies [FOSTER, 2002]: 1. Recursos coordenados que no se sujeitam a um controle centralizado - (Sistemas em Grid integra e coordena recursos e usurios que vivem no interior de diferentes domnios de controle, por exemplo: o desktop do usurio VS um computador central, existem diferentes unidades administrativas na mesma empresa ou em diferentes empresas, dirigido a poltica de segurana, salrio, ttulos e por ai vai de acordo com este ambiente. De qualquer forma, nos estamos lidando com um sistema de gerenciamento local) 2. Utilizar padres, abertos e com interfaces e protocolos de propsito geral (Sistemas em Grid so construdos de protocolos e interfaces de propsito geral que se dirige um fluxo fundamental como a autenticao, autorizao, descobrimento de recursos e aceso a recursos. importante que estes protocolos ou interfaces

sejam padronizados e abertos. De outra forma, nos estaremos lidando com um sistema de aplicao especfica. 3. Prover o mnimo em qualidade de servios - (Sistemas em Grid permitem que os recursos do cliente sejam utilizados em uso coordenado para entregar vrias qualidades de servio, relatando, por exemplo, o tempo de resposta, throughput, disponibilidade, segurana e/ou a recolocao de mltiplos tipos de recursos para se adequar s complexas exigncias do usurio, logo, a utilidade de um sistema combinado significativamente maior que a soma das partes.) Foster faz uma das melhores definies at o momento sobre Grid, mas que, para Wolfgang, algumas observaes ainda devem ser ressaltadas nesta checklist, conforme ele coloca: [Gentzsch, 2002] Para 1: Esta definio exclui qualquer grid que tenha um controle central. Ns se referimos freqentemente a power grids em analogia e, claro que possu um forte mecanismo de controle central. Na computao em grid, enquanto existe uma carncia de controle central em algumas grids, outras, notavelmente possuem vrias enterprise grids (explicado posteriormente), empregando um mecanismo de controle central para permitir o QoS. Olhando adiante, esperado que em uma infraestrutura verdadeira de global grid algum controle central pode ser consideravelmente til, mais que uma certa quantia de controle central empregado nos mercados de estocagem. Para 2: Eu certamente concordo que seja sem direitos autorais, padronizaes e protocolos de cunho aberto sejam necessrias para alavancar verdadeiras infraestrutura globais de computao em grid (real global grid computing). No demais restringir a aplicao de padres abertos como teste, bem como a imposio de mtricas para o desenvolvimento em mercado em uma soluo tecnolgica? Aproximao de padres abertos podem ganhar por fora sob uma aproximao proprietria em um espao de soluo, mas obscurece as definies dos termos tcnicos com o mercado de desenvolvimento atribuindo falta de clareza ou contribuindo para qualquer aspecto tcnico da definio. Para 3: quais so as qualidades de servios triviais e quais no so triviais? Como no trivial Foster menciona o tempo de resposta, troughput, disponibilidade e segurana: servios que ns j vemos hoje sendo executado no ambiente local por alguns sistemas de gerenciamento de recursos distribudos. Nos certamente iremos ver o aumento de tempo nos servios, como por exemplo, com a chegada dos Web Services e da computao em Grid. Sendo assim, Wolfgang Gentzsch prefere uma definio simples que diga o que um Grid, e o que ele faz, mais voltado para termos simples, como: "Um Grid uma infraestrutura de hardware e software que oferece dependncia, consistncia e facilidade de acesso a recursos que possibilitem o compartilhamento de tais recursos computacionais, computao utilitria, computao automtica, colaborao em

um grupo de organizaes virtuais (VOs) e processamento de dados distribudo, dentre outros".[GENTZSCH, 2002]

2.2 - Alguns Esclarecimentos


As definies apresentadas at o momento j possibilitam uma conceituao adequada no entendimento do que Grid, contudo, ainda existem pessoas que chamam um cluster de grid e, neste aspecto que Rajkumar Buyya tenta esclarecer colocando: "Se acontece o compartilhamento de recursos gerenciado por um nico, sistema global sincronizado e centralizado, ento um cluster. Em um cluster, todos os ns trabalham cooperativamente em um objetivo comum e o objetivo a alocao de recursos executada por um gerente centralizado e global. Em Grid, cada n, possu seu prprio gerente de recursos e poltica de alocao". [BUYYA, 2002] Mas algo certo, os Grid Computing ultrapassam o ambiente local e restrito para algo mais global e compartilhado. Sendo assim, quando falamos de computao em Grid, temos que lembrar de alguns termos, como: Heterogeneidade; Colaborao; Coordenao; Compartilhamento de Recursos; QoS; Regras/Poltica de Compartilhamento; Organiaes Virtuais VO.

Em uma outra escala, Ian Foster tambm mostra que a Web no - pelo menos ainda - um Grid, pois apesar de ser aberto, utilizar protocolos de propsito gerais que suportam o acesso a recursos distribudos, mas estes, no so feitos de forma coordenada com interesse na qualidade de servios. Vale ressaltar que o problema real e especfico que est por traz do conceito de Grid "coordenar o compartilhamento de recursos e resolver problemas em uma organizao virtual dinmica e multi-institucional". O compartilhamento exposto no unicamente troca de arquivos, mas acesso direto a computadores, software, dados e recursos. E, a srie de indivduos e/ou instituies definidas pelas regras de compartilhamento formam o que ns chamamos de organizao virtual (virtual organization - VO). [GANATOMY,2002]

2.2.1 - Organizao Virtual


Para se entender melhor o que constitui uma VO, temos como exemplos: ASP (aplication service providers), SSP (storage service providers), cycle providers, etc.

Saindo do mbito computacional, tambm podemos considerar alguns VO's como: membros de um consrcio para aquisio de um veculo, membros de uma cooperativa para aquisio de uma casa ou apartamento, etc. Ou quem sabe, misturando ambos, como: um time de gerentes de risco que utilizam sistemas de simulao e base de dados para planejar uma resposta a uma situao de risco. Nestes cinco anos, diversos esforos em pesquisas e desenvolvimento com a comunidade Grid tem produzido protocolos, servios e ferramentas que levam, precisamente, as mudanas necessrias quando procuramos pela criao de VOs escalonveis. [FOSTER & KESSELMAN & TUECKE, 2001]

3. Benefcios
Entendido o que Grid torna-se interessante mostrar alguns benefcios que est infraestrutura oferece, conforme Ian Baird apresenta: [BAIRD, 2002] A computao em Grid permite que as organizaes possam agregar recursos com toda a infraestrutura dos ITs, no importando localizao global. Isso elimina situaes onde um site esteja sendo executado com sua capacidade mxima, enquanto outros tenham ciclos disponveis. Organizaes podem melhorar dramaticamente sua qualidade e velocidade de produtos e servios disponibilizados, enquanto os custos de IT so reduzidos por habilitar a colaborao transparente dos recursos compartilhados. Permite que empresas acessem e compartilhem bases de dados de forma remota. Isto essencialmente benfico para as cincias da sade ou comunidades de pesquisa, onde volumes grandiosos de dados so gerados e analisados durante todo dia. Possibilita a larga disperso das organizaes para que facilmente possam colaborar em projetos pela criao da habilidade do compartilhamento de tudo, desde aplicaes a dados, at projetos de engenharia, etc. Pode criar a mais robusta e resistente infraestrutura de IT, com melhor capacidade de responder a desastres. Pode aproveitar os ciclos de processamento idle disponveis dos PCs de mesa que encontram-se em vrias localizaes em mltiplas faixas de tempo (time zones). Por exemplo, os computadores que se encontram tipicamente em idle durante a noite de uma empresa em Tkio pode ser utilizado durante o dia para operaes na Amrica do Sul.

4. As Trs Fases

A criao de uma infraestrutura de Grid Computing no acontece por acaso, Ian Baird estima que a adoo ou expanso da computao em grid ser feita, aproximadamente, em 3 fases. [BAIRD, 2002]

4.1 - 1a Fase
Esta primeira fase comea com o desenvolvimento dos chamados Enterprise Grids, que envolvem as implementaes comerciais de grids de produo por corporaes que possuem presena global ou que precisam acessar recursos fora de uma simples corporao local. A adoo dos Enterprise Grid simplificada e possvel hoje por causa da colaborao virtual e a disponibilizao de recursos compartilhados que ocorrem por traz de sistemas de firewall nas empresas.

4.2 - 2a Fase
A segunda fase, Partner Grids, ir surgir das operaes das organizaes com industrias similares ou reas de interesse colaborativo em projetos e o compartilhamento de recursos entre cada um destina-se a pesquisa de um objetivo em comum. Por exemplo, organizaes cientficas na rea da sade, como a prpria biologia, trabalhando em conjunto, iro acelerar o tempo de pesquisa pela utilizao do potencial computacional disponvel no sistema ou por compartilhar uma grande quantia de dados com as organizaes parceiras.

4.3 - 3a Fase
Chamada de Service Grids, ir acontecer quando os usurios adotarem o sistema de grid como um modelo utilitrio. Na mesma direo, o consumidor est confiante da utilizao da Internet e o reconhecimento da expanso dos benefcios da computao em grid ir guiar a um novo nvel de aceitao.

4.4 Fases Equivalentes


De forma equivalente, ser fcil verifica essa expanso acontecer gradualmente: Regional: onde empresas, universidades ou organizaes se juntam em uma mesma regio/cidade em um intuito de colaborao para aumentar seu poder de processamento, troca de dados e informaes, de modo geral, o compartilhamento de recursos. Estadual: a medida que os Grids regionais comearem a crescer ser mais fcil a interligao dos Grids entre estados, novamente com um objetivo de colaborao.

Global: por final, cria-se um interesse de interligar estas "fazendas de Grids" entre os vrios paises, possibilitando um poder de colaborao muito grande, neste momento, j existiram empresas de grande porte que desejam tal interligao, facilitando tal manobra. Isso no quer dizer que as fazes sejam executadas em ordem, j existem esforos e interligaes sendo montadas entre Grids de diferentes pases, como EUA, Europa e Austrlia, alm de outros. Mas, acredito que ser visto um crescimento natural, conforme foi dividido acima, principalmente, pela maior facilidade fsica e operacional na montagem. Est fase final, onde os recursos computacionais sero alugados por usurio ou utilizados quando necessrio, somente ir acontecer uma vez que o modelo de computao em grid prove ser confivel, seguro e com uma larga aceitao de padres e protocolos.

5. Concluso
Realmente o sistema em Grid Computing est crescendo e, cada vez mais sendo visado por empresas que sabem as vantagens que podem ser conseguidas com tal infraestrutura. Com o caminhar desta popularizao faz-se necessrio definio de padres o mais rpido possvel, seno solues diversificadas e incompatveis entre si surgiro, sejam elas pelas necessidades da utilizao deste sistema ou pela tentativa de imposio de um padro, neste mbito, profundamente necessria a criao de padres e, mais ainda, estes sendo abertos. O prprio Ian Foster expressa sua preocupao na definio de padres em protocolos para a "InterGrid" (conforme ele mesmo chama). Nesta preocupao, encontramos a OGSA e o Globus Toolkit, a qual, ambos iro permitir a interoperabilidade em sistemas heterogneos de forma efetiva, permitindo, a possvel criao da "Global Grid" em um futuro prximo.

Assuntos relacionados
- Apresentao deste trabalho - Slides em PDF
- Apresentao deste trabalho no Workshop de TI 2002 na Universidade Catlica de

Braslia (UCB) - Slides em PDF

Referncias
[BAIRD, 2002] Baird, I - "Understanding Grid Computing", In: http://www.platform.com/pdfs/whitepapers/understanding_grid.pdf [BUYYA, 2002] Buyya, R - "Grid Computing Info Centre (GRID Infoware)", In: http://www.gridcomputing.com/ [FOSTER, 2002] Foster, I - "What is the Grid? A Three Point Checklist", In: http://wwwfp.mcs.anl.gov/~foster/Articles/WhatIsTheGrid.pdf 8

[FOSTER & KESSELMAN & TUECKE, 2001] Foster,I & Kesselman,C & Tuecke,S "The Anatomy of the Grid", In: http://www.globus.org/research/papers/anatomy.pdf [GENTZSCH, 2002] Gentzsch,W - "Response To Ian Foster's "What Is The Grid?", In: http://www.gridtoday.com/02/0805/100191.html [GRIDCOMP, 2002] "Grid Computing Info Centre (GRID Infoware)", In: http://www.gridcomputing.com/ [GRIPHYN, 2002] GriPhyN - Education & Outreach Center, In: http://www.phys.utb.edu/griphyn/ [LASZEWSKI, 2002] Laszewski, G. V. Gregor von Laszewski Grid Course, In: http://www-fp.mcs.anl.gov/~gregor/gridiit/talks/Introduction%20to%20Grid%20Computing.htm

Alteraes
25 de outubro de 2002 - Termino do documento 08 de novembro de 2002 - Converso para HTML 06 de dezembro de 2002 - Adicionando Slides das Apresentaes em PDF

Você também pode gostar