Escolar Documentos
Profissional Documentos
Cultura Documentos
Módulo 1 - Introdução
Trata-se de um modelo capaz de lidar com uma alta taxa de processamento, dividida
em diversas máquinas que formam uma única máquina virtual, podendo ser em rede
local ou rede de longa distância. Tais processos são executados quando as máquinas
não estão em uso, evitando dessa forma o desperdício de processamento.
Essa nova infra-estrutura de computação distribuída foi proposta nos anos 90, com o
objetivo de auxiliar atividades de pesquisa e desenvolvimento científico. Vários
modelos dessa infra-estrutura foram especificados. A tecnologia em grade faz
analogia às redes elétricas (“power grids”) e apresenta-se ao usuário como um
computador virtual, mascarando toda a infra-estrutura distribuída, assim como a
rede elétrica para uma pessoa que utiliza uma tomada, sem saber exatamente como
a energia chega a ela. Seu objetivo inicial era casar tecnologias heterogêneas (e
muitas vezes geograficamente dispersas), formando um sistema robusto, dinâmico e
escalável, para compartilhar processamento, espaço de armazenamento, dados,
aplicações e dispositivos.
-1–
Como exemplo, há o Datagrid, do CERN (Organização Européia de Pesquisa Nuclear),
projeto financiado pela Comunidade Européia, com o objetivo de atuar em áreas de
pesquisa como Astronomia, Física e Biologia.
Permanentes ou temporários
Os grids podem ser permanentes ou temporários. Podem ser formados para executar
uma tarefa específica e, em seguida, serem desfeitos. Presumindo que todos os
computadores estejam previamente ligados em rede, a criação e dissolução é apenas
questão de ativar e depois desativar o software responsável em cada computador.
-2–
Os grids, por sua vez, contam com uma arquitetura mais “democrática”, em que,
embora possa existir algum tipo de controle central, existe um ambiente
fundamentalmente cooperativo, onde empresas, universidades ou mesmo grupos de
usuários compartilham os ciclos ociosos de processamento em seus sistemas em
troca de poder utilizar parte do tempo de processamento do grid.
Por exemplo, duas empresas sediadas em países com fusos horários diferentes
poderiam formar um grid, combinando seus servidores web, de modo que uma
utilizasse os ciclos ociosos de processamento da outra, em seus horários de pico, já
que, com horários diferentes, os picos de acessos aos servidores de cada empresa
ocorreriam em momentos distintos.
Programa Above
O programa teve início em outubro de 2005 e até o final daquele ano, pelo menos 20
soluções passaram pelos laboratórios da Intel, em São Paulo e no México. A Oracle e
a Intel apóiam as software-houses aprovadas, dando a elas um certificado de
participação no programa para as soluções testadas.
-3–
O programa prevê ainda a realização de eventos para clientes, assim como a
permissão do uso do logo Above nas comunicações para o mercado e marketing
cooperado.
As soluções que já passaram pelo programa são das seguintes empresas: Arango,
Bohm Soluções Corporativas, CM Soluções, DB1 Informática, Delta, DTC, Expert,
Gemco, Gobtec, Grande, Innersoft, Integry, Jatafi, Matera Sênior Sistemas, Mega
Sistemas, Microsiga, MSM, MSV Soluções, Opencard, Opensystems, Sistemas
Compartidos, Socase, Softcomex, Solur e Trust.
-4–
Módulo 2 - Organização Virtual
Esse módulo irá explicar o que constitui uma organização virtual e porque esse
conceito é importante para grid computing. Alguns exemplos são ASP (aplication
service providers), SSP (storage service providers) e cycle providers. Saindo do
âmbito da tecnologia, também podem ser consideradas organizações virtuais os
membros de um consórcio para aquisição de um veículo, membros de uma
cooperativa para aquisição de uma casa ou apartamento, entre outros.
Operação: Essa fase inclui o controle e a monitoração das atividades realizadas pelas
organizações individuais, incluindo resolução de conflitos, e possível necessidade de
reconfiguração da OV devido a falhas parciais.
-5–
Dissolução: Distribuição de lucros obtidos, e armazenamento de informação
relevante. Esse projeto incide na fase de seleção de parceiros da OV, e encontra-se
presentemente em desenvolvimento.
Dificuldades
-6–
O Grupo de Sistemas Distribuídos do INESC-ID tem participado ativamente na
definição e implementação do grid@INESC, na qual pretende testar modelos
inovadores de políticas de controle de acesso e utilização de recursos. Para isso
encontra-se em desenvolvimento a plataforma Heimdall, que suporta a definição,
implementação e auditoria de políticas avançadas.
Engenharia da linguagem
Para combater essas dificuldades, estão sendo dados os primeiros passos, no sentido
de utilizar os grids no processamento de língua natural. Assim, está em curso um
projeto destinado a estudar o impacto de utilização de grids no que respeita a
arquiteturas de aplicações, descoberta automatizada de recursos e formas flexíveis
de incorporar e coordenar os diferentes componentes de uma aplicação
geograficamente dispersa, tanto na sua execução, quanto no armazenamento dos
resultados produzidos. O objetivo é permitir que investigadores possam usar as grids
computacionais sem terem de dominar todos os conceitos envolvidos na infra-
estrutura.
Mais do que tirar partido da tecnologia das grids computacionais, esperamos que o
projeto contribua para que surjam novas formas de interação entre os vários grupos
e potencialize a reutilização de recursos pela comunidade de NLE: com a abordagem
proposta, os dados, ferramentas e componentes reutilizáveis podem ser facilmente
partilhados e comparados. Esses aspectos são muito importantes, dada a
dependência da área relativamente à língua: aplicações multilíngües podem ser
construídas, utilizando componentes de várias procedências, tanto dependentes,
quanto independentes da língua.
-7–
Os principais obstáculos à execução distribuída das ferramentas de simulação são: a
correta divisão dos problemas pelas várias máquinas disponíveis no grid e o balanço
entre a computação local e a comunicação entre máquinas.
A Comissão Européia tem financiado vários projetos que se baseiam nos avanços
recentes na área dos grids computacionais. O objetivo é o desenvolvimento de uma
infra-estrutura na Europa que esteja disponível 24 horas por dia. Esse esforço
explora as ligações multigigabit da rede pan-européia GEANT, que está sendo
ampliada também na América do Sul, Norte de África e Ásia.
-8–
Módulo 3 - Benefícios
A tecnologia grid computing foi uma das respostas a um problema muito comum no
meio acadêmico: a escassez de verba para pesquisa. Nos anos 90, após perder seu
financiamento governamental, um projeto norte-americano que buscava por sinais
de vida inteligente em outros planetas – o SETI (Search for Extra-Terrestrial
Intelligence) – teria apostado na abordagem da computação distribuída para não
abandonar suas pesquisas. No lugar de supercomputadores protegidos pelos muros
dos institutos de pesquisa, os cientistas passariam a contar com milhares de
computadores comuns de voluntários, espalhados pelos locais mais variados do
mundo, para processar pequenos pacotes de dados vindos do espaço, nos períodos
de ociosidade do sistema, e devolver os resultados aos pesquisadores.
-9–
Imagine o que significa, para uma empresa de telecomunicações, a possibilidade de
reduzir de uma semana para um dia o processo de fechamento das faturas dos seus
clientes. Quando se adota o grid, um dos benefícios é uma economia de tempo dessa
escala. O grid é mais uma das respostas tecnológicas à demanda crescente no
mercado pela distribuição de cargas de trabalho de forma mais eficiente pelo
hardware, simplificando o gerenciamento e diminuindo os custos.
Embora ofereça tais benefícios, o grid só agora começa a ser percebido como uma
solução para aplicações comerciais mais tradicionais – e não apenas uma aplicação
do mundo acadêmico -, segundo um estudo da Insight Research. Os benefícios ficam
mais claros para empresas cujo negócio principal é a própria tecnologia. A tecnologia
será tão mais útil quanto maior for o volume de dados e a necessidade de agilidade
da empresa que a adotar. Cabe fazer as contas para saber se o benefício compensa
os custos.
Flexibilidade na infra-estrutura
Após registrar um faturamento de 975 milhões de reais em 2005, valor 14% superior
ao do ano anterior, a GRSA, empresa do grupo Accor e do Compass Group,
especializada em serviços de alimentação, viu-se diante de um desafio: como
preparar a TI para o crescimento? Formada por sete marcas que servem escolas,
aeroportos, terminais rodoviários e hospitais, a GRSA atende 700 mil refeições por
dia em todo o País. Depois de analisar quais seriam os investimentos necessários
para melhorar a capacidade dos sistemas cruciais para o negócio, a GRSA decidiu
adotar a arquitetura de grid computing. Um dos objetivos era obter o balanceamento
automático da infra-estrutura, em função da ociosidade e da capacidade de recursos
existentes, evitando assim a subutilização de servidores e equipamentos de storage.
- 10 –
Rápido de instalar
Antes, a GRSA tinha apenas um servidor para banco de dados, com ociosidade média
de 2%. A nova infra-estrutura de hardware inclui dois servidores IBM, um storage,
quatro switches Giga e o banco de dados Oracle, migrado da versão 9i para a 10g,
com serviços de segurança e gerenciamento de identidade. Agora, a GRSA segue
para a segunda fase do projeto de grid computing, na qual pretende colocar o back-
office e os demais ambientes de desenvolvimento e homologação em grade.
Outra empresa que aposta no grid computing é a Lehman Brothers, que adota
soluções de grid desde 1990. Nos últimos anos, a empresa de serviços financeiros
aborda de forma ainda mais estratégica essa opção. A empresa acredita que um dos
benefícios óbvios de uma solução em grid é a possibilidade de distribuir várias
tarefas para serem processadas em milhares de CPUs. Como resultado direto disso,
o que se vê no mercado é que as soluções corporativas de grid computing e de
arquitetura orientada a serviços (SOA) estão ganhando maturidade juntas. Essa é a
estratégia da Lehman Brothers, que migrará seus grids isolados, que funcionam em
tecnologia desenvolvida internamente pela empresa, para uma arquitetura
estruturada. Hoje, a Lehman conta com três grids – com cerca de 1.500 servidores
blade – rodando software e aplicações de análise de derivativos, hipotecas e crédito
corporativo. A idéia é criar uma plataforma para suportar SOA e oferecer um uso
mais flexível dos recursos de TI a todos os usuários da empresa baseados em Nova
York, Londres ou Tóquio.
- 11 –
Módulo 4 - Formação de um grid e pré-requisitos
- 12 –
Grid nacionals
Além disso, a estrutura proposta na etapa inicial da GRADE é capaz de permitir sua
ampliação, seja com a incorporação de novos clusters, seja com a incorporação do
legado já existente nos centros participantes. O uso de clusters de PCs foi baseado
na sua difusão devido ao baixo custo, escalabilidade e alternativas de comunicação
baratas intra-clusters, além de cada cluster só contar com o seu sistema operacional
próprio para interligação com o software de Grade.
O uso de clusters de baixo custo representa uma inovação tecnológica atraente para
o setor empresarial, que demonstra interesse em participar.
- 13 –
Além da infra-estrutura de clusters mencionada, é necessário que haja pesquisa e
desenvolvimento de serviços básicos a serem incorporados na rede de interconexão
(RNP), baseados na proposta da Internet2, que apresenta um middleware básico
com os seguintes serviços:
Em 2004, Dell, EMC, Intel e Oracle lançaram o projeto Megagrid, para desenvolver
empreendimento grid computing. Empresas-líderes da indústria combinam recursos
técnicos e experiência para recorrer às necessidades do mercado em acesso testado
e validado para empreendimentos de grid computing. A idéia é criar um padrão de
desenvolvimento e implantação de um empreendimento de infra-estrutura grid
computing . As quatro empresas estão combinando algumas das principais
tecnologias e recursos técnicos para diminuir a responsabilidade de integração de
seus clientes, e desenvolver um completo empreendimento de soluções grid
computing que executam ofertas SMP tradicionais a um custo menor.
- 14 –
Essas práticas também incluem a condução de uma série de testes para
possibilidades de ajustes, desempenho e gerenciamento de uma base de dados
compreensível, configurações de armazenamento do servidor e das redes.
- 15 –
Alto Nível de Serviço
O projeto MegaGrid foi demonstrado pela primeira vez na Oracle OpenWorld São
Francisco, no Centro de Convenções Moscone, em São Francisco. Demonstrações
técnicas foram destacadas em cada um dos stands do Projeto MegaGrid existentes
no espaço de exibição:
- 16 –
Módulo 5 - Diferença entre Cluster e Grid Computing
Uma das definições mais aceitas está no artigo “O que é o Grid?”, do especialista Ian
Foster define Grid Computing. Para ele, a tecnologia pode ser resumida em três
grandes tópicos: Os recursos computacionais não são administrados de maneira
central, são utilizados padrões abertos e a qualidade de serviço chamada “non-
trivial” é garantida. Mesmo despertando debates, essa definição é bem aceita no
mercado. Além desse, outros especialistas se debruçaram sobre o problema em
busca de criar alguma conceituação que abarque de maneira satisfatória o escopo
total do significado do conceito de Grid Computing. Para Plaszczak e Wellner, a
tecnologia Grid pode ser definida como o modelo que fornece virtualização de
recursos, provisionamento sob demanda e compartilhamento de serviços entre as
organizações.
Grid Histórico
- 17 –
No primeiro, apenas uma área ou um grupo conecta via rede seus desktops, clusters
e equipamentos para desempenhar uma função que demanda mais capacidade
operacional; o segundo é uma evolução para toda a empresa, que pode utilizar os
recursos computacionais em Grid para armazenamento e cycle-stealing; já o Grid
global é uma conexão entre os outros Grids que podem ser usados de maneira
colaborativa ou para resultados comerciais.
Origem do Cluster
A evolução foi tamanha que o cluster mudou a idéia sobre supercomputadores. Se,
antes, um supercomputador era uma máquina com processamento extraordinário
atingido à custas de muito poder de processamento e, por conseqüência,
investimento equivalente, o conceito de cluster muda drasticamente essa realidade.
Esse conceito já foi somado à construção dos novos supercomputadores, o que
reduziu o custo de produção, além de aumentar o aproveitamento do poder de
processamento das máquinas que estão em uso.
Tipos de Cluster
Na prática, os clusters podem ser divididos em três grandes tipos. O primeiro, High-
availability clusters (HA – clusters de alta disponibilidade), são implementados para
aumentar a disponibilidade dos serviços através da criação de nós redundantes, que
são utilizados para manter o serviço mesmo em caso de falha de componentes do
sistema. Normalmente, os HA possuem o mínimo para prover a redundância: dois
nós.
Funções Diferentes
Nesse sentido, o Grid Computing é muito mais flexível ao permitir conexão entre
computadores que não confiam plenamente entre si, ou melhor, que não
compartilham a mesma rede interna. Assim, o Grid pode ser indicado para cargas de
trabalho que tenham diversas tarefas independentes acontecendo simultaneamente;
é recomendável que elas, contudo, não demandem compartilhamento de dados entre
os trabalhos durante o processo de computação.
- 19 –
Isso garante que cada computador em Grid realize seu trabalho independente do
resto da cadeia.
Apesar das diferenças, não é possível negar, contudo, que as duas tecnologias têm
origens muito próximas. A aplicabilidade de cada uma das tecnologias depende
substancialmente das necessidades do usuário e, para a decisão, elas precisam ser
levadas em conta.
- 20 –
Módulo 6 - As pequenas e médias empresas no contexto do GRID
Neste ponto, a Dell, EMC, Intel e Oracle anunciaram um projeto conjunto para criar
um padrão de desenvolvimento de infra-estrutura de Grid Computing. O Projeto,
denominado de MegaGrid teve início em 2004 tinha o objetivo de fazer uma
combinação de tecnologias e recursos das quatro gigantes de TI para facilitar a
implementação e a utilização de sistemas Grid, principalmente pelas pequenas e
médias empresas. Mais tarde, a Cisco, comporia a equipe do Megagrid junto às já
citadas companhias.
Primeira fase
O projeto teve uma primeira fase em que o foco foi concentrar forças no
desenvolvimento, com testes e documentação de melhores práticas. Com isso, seria
possível, segundo as companhias, construir uma consolidada infra-estrutura que
fosse efetiva e trouxesse valor agregado ao Grid. Entre as ações de performance,
foram feitos testes de desempenho, aumento de capacidade de processamento dos
sistemas e gerenciamento das redes corporativas.
Neste contexto, vale destacar que a união das quatro empresas para o mesmo fim, é
um sinal de que de alguma forma elas estão alinhadas nesse conceito de Grid e se
preocupam com a adoção em larga escala e com a consolidação da tendência de
forma igualitária.
- 21 –
Em Ação
Vale destacar o discurso dos envolvidos de que a intenção não é usar o projeto para
promover lançamentos de produtos conjuntos das quatro companhias envolvidas, e
sim fazer a divulgação de guias de conduta para que as empresas saibam como
gerenciar melhor a tecnologia.
Grid em pauta
- 22 –
Segundo o Departamento de Ciência e tecnologia, a necessidade de se fazer valer da
tecnologia começou a fazer sentido, principalmente após os atentados de 11 de
setembro, afinal a computação colaborativa tornou-se essencial para controlar crises,
garantir a continuidade dos negócios e assegurar as informações críticas.
- 23 –
Módulo 7 - Perspectivas
A definição de padrões está entre os desafios para o futuro que a Grid Computing
terá de enfrentar. Conceitos como a OGSA e o Globus Toolkit permitirão a
interoperabilidade em sistemas heterogêneos de forma efetiva e a possível criação
da “Global Grid” em um futuro próximo.
A partir dos anos 90, portanto, uma nova infra-estrutura foi proposta para auxiliar
atividades de pesquisa e desenvolvimento científico. Vários modelos dessa infra-
estrutura foram especificados, dentre eles, a Tecnologia em Grade.
O objetivo era reunir tecnologias heterogêneas (e muitas vezes geograficamente
dispersas) formando um sistema robusto, dinâmico e escalável para
compartilhamento de processamento, espaço de armazenamento, dados, aplicações,
dispositivos, entre outros.
A opinião de grande parte dos pesquisadores é que esse tipo de tecnologia seja a
evolução dos sistemas computacionais atualmente em execução, o que significa não
apenas um fenômeno tecnológico, mas também social, pois reúne recursos e pessoas
de várias localidades, com várias atividades diferentes.
Nos últimos anos, algumas empresas estão investindo nessa tecnologia e tendência
computacional. A IBM, por exemplo desenvolve um trabalho de pesquisa e
desenvolvimento de ferramentas em Grid focado em ambientes corporativos. Além
disso, a empresa trabalha em cima do conceito de Globus Toolkit, extremamente
importante para a evolução do Grid Computing.
- 24 –
O uso dos serviços do Globus requer a instalação e a configuração de uma infra-
estrutura de suporte. Nesse cenário, cada recurso é gerenciado por uma instância do
Globus Resource Allocation Manager, que é responsável por direcionar, monitorar e
reportar o estado das tarefas alocadas para o recurso.
- 25 –
A OGSA tem por objetivo padronizar os diferentes serviços que são freqüentemente
encontrados em uma aplicação de Grid por meio de uma especificação de um
conjunto de interfaces. Em OGSA, esses serviços são chamados de serviços de Grade
e correspondem a uma extensão da tecnologia de serviços Web. O conceito define o
que pode ser chamado em uma grade de serviços.
Com essa necessidade de padrões, já se pode ver pelo mundo diversas grades em
funcionamento, projetos que se tornam, inclusive, multi-institucionais. O Datagrid é
um deles. A estratégia é da CERN (Organização Européia de Pesquisa Nuclear) e é
financiado pela Comunidade Européia. O objetivo é utilizar o grid de forma eficiente
como apoio em áreas de pesquisa como astronomia, física e biologia.
Além dessa iniciativa, há também o BIRN, projeto multiinstitucional que conta com o
apoio de quinze universidades norte-americanas e que é voltado para pesquisa
neurológica e Mammogrid, uma iniciativa da comunidade européia para formar uma
base de mamografias que abrange toda a Europa com intuito de fornecer material de
estudo e campo para o desenvolvimento de tecnologias em grade.
- 26 –
Módulo 8 - Tendências
Grid Computing, conceito surgido há mais de três décadas, em 1969, volta à tona e
desponta como futuro da Tecnologia da Informação nas corporações bem planejadas.
Passou a chamar a atenção de CEOs e Chairmans de empresas de TI e grandes
corporações. Uma série de artigos publicados pelo pesquisador e professor de
ciências da Computação da Universidade de Chicago Ian Foster ao longo dos últimos
dez anos deram ao tema uma nova dimensão – mais palpável e aplicável no
ambiente da informática corporativa.
Nos anos 90, após perder seu financiamento governamental, um projeto norte-
americano que buscava por sinais de vida inteligente em outros planetas – o SETI
(Search for Extra-Terrestrial Intelligence) – teria apostado na abordagem da
computação distribuída para não abandonar suas pesquisas.
A idéia é que em vez de uma pessoa fazendo dez contas, você tenha dez pessoas,
cada uma fazendo uma conta. Quem resolve mais rápido? Na prática, são várias
estações em rede rodando porções diferentes de uma mesma aplicação. A
capacidade de combinar o poder de processamento distribuído em diversas máquinas
para realizar tarefas que exigem mais do hardware é comumente confundida com o
conceito de cluster de servidores, que também envolve equipamentos interligados –
de novo, a idéia da “união que faz a força”.
- 27 –
Porém, enquanto no cluster todos os recursos do hardware passam a ser enxergados
como um único supercomputador, somando-se recursos de memória,
armazenamento e processamento, no grid a capacidade permanece segmentada, o
que se fragmentam são os pacotes de dados a serem processados durante os
períodos de ociosidade do sistema. Por isso, o processo de adoção está mais maduro
nas organizações que têm aplicações que podem operar paralelamente. Empresas
que fazem análises sísmicas, simulações meteorológicas e financeiras, por exemplo.
Ganhando espaço
Embora ofereça tais benefícios, o Grid só agora começa a ser percebido como uma
solução para aplicações comerciais mais tradicionais, e não apenas uma aplicação do
mundo acadêmico, segundo estudo da Insight Research. A consultoria aponta alguns
marcos atingidos no último ano que atestam essa tendência.
Entre eles estão a escolha por grandes empresas de telecom, incluindo a British
Telecom e a Telefônica, de parceiros de software de middleware para grid para a
criação de serviços baseados na tecnologia; um número de empresas iniciantes de
grid que receberam investimentos de grupos de capital de risco; e a implementação
de projetos de grid parciais ou experimentais em uma série de grandes companhias.
Por outro lado, a consultoria lista também alguns empecilhos para a adoção do grid
nas empresas. Segundo a pesquisa, ainda faltam modelo estáveis de aplicações não-
acadêmicas de grid para serem usadas como referências. Além disso, na ciência, os
grids já cruzam as fronteiras das organizações, enquanto no mundo corporativo o
grid fica amarrado atrás dos firewalls de um endereço físico da empresa. Há apenas
alguns exemplos de grids espalhados por mais de um ponto de presença física da
mesma empresa.
Ainda assim, o relatório aponta para uma forte curva de crescimento do mercado de
Grid nos próximos cinco anos. A estimativa é que o setor, que em 2006 deve
movimentar 1,8 bilhão de dólares, cresça, em 2011, para cerca de 24,5 bilhões de
dólares.
- 28 –
De acordo com o Insight, alguns mercados devem fazer a transição da fase
experimental para os projetos de fato com maior antecedência – entre eles, o de
engenharia técnica, o de farmacêutica e, em menor escala, o financeiro.
Contudo, alguns analistas afirmam que o Grid não é para todos. A tecnologia será
tão mais útil quanto maior for o volume de dados e a necessidade de agilidade da
empresa que a adotar. Cabe fazer as contas para saber se o benefício compensa os
custos.
Segunda do ranking
1. Virtualização,
2. Grid Computing,
3. Arquitetura orientada a serviços (SOA),
4. Enterprise Information Management (EIM),
5. Código aberto,
6. Acesso à informação,
7. Ajax,
8. Mashup Composite Model,
9. Computação Distribuída no Ambiente (do inglês, Pervasive Computing),
10. Coleta inteligente de dados.
- 29 –