Você está na página 1de 18

GRID

José Arturo García Monroy


E.T.S.I.Telecomunicación- Departmento Ingenieria Sistemas Telemáticos
Ciudad Universitaria s/n 28040 Madrid
Teléfono 652 313 603
jmonroy@dit.upm.es

Resumen. Una evolución del computo distribuido, el cómputo en GRID, representa


oportunidades enormes para que las organizaciones utilicen al máximo y exploten las
capacidades y ventajas que este mundo de interconexiones nos ofrece. Existen diversos tipos de
Grids, de Información, Recursos y Servicios, con diferentes características y usos específicos.
Actualmente hay numerosos esfuerzos y asociaciones alrededor del mundo para perfeccionar
esta tecnología tales como el Globus Project o el Datagrid Project. Son muchos los que
apuestan por el Grid, y expertos concuerdan en que tiene el potencial de revolucionar las
Tecnologías de la Información, de la misma forma que lo hizo el Internet en su tiempo.

1 Introducción trabajo a través de recursos de cómputo


heterogéneos, a una solución ubicua que ha sido
Debido a la situación económica actual, hay una abrazada por diversas de las principales
organizaciones en el mundo en múltiples sectores
presión constante en las organizaciones por
industriales.
reducir sus costes de investigación y desarrollo,
el tiempo en el que sacan sus productos al
mercado, y a la vez aumentar su capacidad de El cómputo distribuido se asegura de que todos
procesamiento. Típicamente, lo que se haría para los servicios son confiables y disponibles a pesar
eliminar los cuellos de botella, sería incrementar de poder encontrarse en mantenimiento, el que
la potencia de procesamiento de la organización. haya interrupciones de la energía, o fallas
Sin embargo, enormes cantidades de capacidad de inesperadas. También ayuda a eliminar el
computo existentes dentro de las infraestructuras problema del tiempo que pierden los usuarios al
informáticas de las organizaciones no están intentar localizar recursos disponibles para
siendo aprovechadas, y las reducciones procesar cargas de trabajo, mientras que muchos
dramáticas en los presupuestos cierran la puerta a otros sistemas dentro de la organización se
cualquier gasto injustificado de la tecnología. Así encuentran inutilizados.
nace el Grid.
Aunque el computo distribuido logra utilizar el
En este artículo se exponen los orígenes y la potencial máximo de los recursos existentes, al
evolución de esta tecnología, pasando por las nivelar con eficacia los ciclos de proceso con la
herramientas utilizadas para su desarrollo, como demanda creada por las aplicaciones, se dice que
lo es el Globus Toolkit; la arquitectura utilizada su importancia radica en que ha abierto el camino
basada en el OGSA y el middleware OGSI; a la Computación en Grid, un enfoque global y
concluyendo con lo que se espera en el futuro del mucho más eficaz para compartir información y
GRID y las oportunidades que presenta para las recursos.
empresas.

2 Antecedentes 3 Grid
El origen del Grid se encuentra en el cómputo Una evolución del computo distribuido, el
distribuido, el cual trata los desafíos de la carga cómputo en Grid, representa oportunidades
de trabajo agregando y asignando los recursos enormes para que las organizaciones utilicen
disponibles de una organización para ciclos de proceso de redes de ordenadores
proporcionar potencia de procesamiento ilimitada. atravesando incluso múltiples límites geográficos.
En los últimos diez años, ha cambiado el concepto
que se tenía en donde simplemente permitiría a Aunque la idea de Grid puede sonar complicada,
las organizaciones el distribuir las cargas de se le puede comparar con el peer-to-peer (P2P),
modelo que se hizo popular por la comunidad de 4 Grid : La nueva era en
compartición de archivos Napster. De la misma
manera en que Napster permitía a los usuarios Cómputo Distribuido
acceder y compartir música entre ordenadores de
escritorio, el cómputo distribuido utiliza un Definido como la forma coordinada, transparente
modelo similar para reunir los recursos y segura de compartir recursos de información a
disponibles en clusters separados de PCs, través de sitios distribuidos geográficamente, el
servidores o superordenadores. Grid lleva a estos cómputo en Grid se desarrolla y se basa en
clusters al siguiente nivel al conectarlos con otros protocolos estándar y plataformas de referencia de
múltiples clusters a través de áreas geográficas código libre para tener la máxima
dispersas, logrando compartir los recursos y una interoperabilidad.
colaboración mejorada.
Esencialmente, provee la habilidad de
. decrementar el coste de computo al entregar, bajo
demanda, accesos confiables y económicos a
3.1 Beneficios de la computación en recursos informáticos.
Grid
Utilizado inicialmente por investigadores y
Permite a las organizaciones agregar recursos a la academia, la computación en Grid emerge
infraestructura tecnológica sin importar en donde rápidamente como el medio utilizado por
estén localizados. Elimina las situaciones en empresas corporativas para colaborar, compartir
donde un solo sitio/servidor se encuentre datos y software, almacenar más información que
trabajando en su máxima capacidad mientras en las redes existentes, y acceder grandes
otros tienen ciclos de procesamiento inutilizados. cantidades de poder de procesamiento sin invertir
sumas significativas en costosos
Las organizaciones pueden mejorar superordenadores.
dramáticamente la calidad y el tiempo de entrega
de los productos y servicios que ofrecen, a la vez Uno de los ejemplos pioneros de Grid es el
que reducen costos de IT al permitir la proyecto SETI@home, establecido por el Instituto
colaboración transparente y la compartición de de Búsqueda de Inteligencia Extraterrestre
recursos. (SETI). En la búsqueda por encontrar indicios que
señalaran la existencia de inteligencia
Permite a las compañías acceder y compartir extraterrestre, utilizaron el Internet para establecer
bases de datos remotas. Esto es especialmente un superordenador virtual. Al reunir la potencia
benéfico para las comunidades de investigación, de procesamiento de mas de 500,000 ordenadores
en donde enormes cantidades de información son personales alrededor del mundo, SETI@home se
generadas y analizadas casi a diario. aseguró de tener la capacidad necesaria para
analizar Terabytes de datos previamente
Permite a organizaciones con diferentes sedes la recopilados por un radiotelescopio, sin contar con
fácil colaboración en proyectos en conjunto al el gasto de un superordenador.
permitir el compartir desde aplicaciones de
software hasta planos o modelos de ingeniería. Más allá de el mundo de la academia y la
investigación, empresas corporativas como IBM,
Puede crear una infraestructura mas robusta y Sun Microsystems, Intel, HP reconocen y
resistente y más capaz de responder a desastres. apuestan al gran potencial que ofrece Grid y lo
adoptan con un ritmo asombroso. Cualquier
Puede aprovechar los ciclos de procesamiento organización que realice investigación o requiera
inutilizados de ordenadores de escritorio que se intensivas cargas de trabajo a través de
encuentren en diversas zonas geográficas. Por procesamiento se puede beneficiar del cómputo
ejemp lo, ordenadores que normalmente se en Grid.
encuentran inutilizados por la noche en una
compañía en Europa, podrían ser utilizados en el Aunque las implementaciones iniciales de Grid,
día por una sede de operaciones en América. que se enfocaban en proveer a las organizaciones
acceso global a los recursos computacionales
disponibles parezca algo simplista, su verdadero
potencial es enorme.
A pesar de que muchos piensan que esta diversas comunidades científicas
tecnología se encuentra en su infancia, emerge dispersas geográficamente.
rápidamente hacia otros horizontes con el
desarrollo de Grids de utilidad pública, las cuales
venderán o alquilarán recursos de cómputo,
incluyendo ancho de banda, aplicaciones y 6 Los Tipos de Grid
almacenamiento, cobrando de acuerdo a su uso o
en base a un servicio solicitado, de la misma Grid ha establecido un nuevo paradigma para
forma en que las compañías de luz cargan la entregar información, recursos y servicios a los
electricidad, todo esto hecho claro, a través del usuarios. Las implementaciones actuales abarcan
Internet. diversas aplicaciones en la industria y centros de
investigación. En este creciente mundo de
interconexiones se pueden distinguir tres
categorías del Grid.
5 Impulsar el concepto del
Cómputo en Grid
Debido a que se necesita una enorme Grid de Información
colaboración, esfuerzos de estandarización son de
singular importancia para desplegar Grid: Grid de Recursos

• El "Globus Project" (www.globus.org) Grid de Servicios


formado por múltiples instituciones de
investigación y desarrollo, se concentra La figura 1 muestra la relación y la dependencia
en las tecnologías centrales para Grids de estos tres Grids en cuanto al acceso uso y
computacionales. Su producto primordial publicación de meta información.
es el Globus Toolkit, de arquitectura
abierta, un sistema de protocolos de
código libre, servicios y herramientas Grid de Grid de
que permiten una computación en Grid Información Servicios
segura y distribuida.
OGSA
Web HTML
• Global Grid Forum SOAP, WDSL, UDDI
archivos compartidos
(www.golbalGridforum.com) es una
comunidad en foro de investigadores XML
individuales y usuarios que se enfocan
SEARCH
en la promoción y el desarrollo de las
ENGINES
tecnologías Grid y las aplicaciones
mediante el desarrollo y la
documentación de los avances, los
mejores resultados, guías de Grid de Recursos
implementación y estándares con énfasis .

en el consenso. Otros grupos como el Ancho de Banda Almacenamiento


New Productivity Initiative y el Peer-to- Poder de Procesamiento .......
Peer Working Group han unido fuerzas
con este forum para crear el mayor grupo
global de estándares de cómputo en Grid
. acceso, uso publicación de meta información

Fig 1. Los tres tipos de Grid y sus relaciones conjuntas


• Data Grid Project: fundado por la Unión
Europea, este proyecto se concentra en
proveer la tecnología Grid necesaria en
la investigación científica de próxima 6.1 Information Grid
generación que requiere enormes
cantidades de poder de procesamiento, Con la invención de la WWW en 1990, Tim
análisis de datos y el tratamiento de Berners-Lee y Robert Calliau tomaron el primer y
millones de Gigabytes, a lo largo de el más importante paso hacia la estructura global
Grid. En solo unos años, el crecimiento La idea principal de este tipo de Grid es el
exponencial de la Web creó una infraestructura de proveer accesos sencillos, transparentes y
red pública y accesible, un Grid de Información eficientes a cualquier recurso independientemente
omnipresente que entrega información de de su localización. Estos recursos pueden ser
cualquier tipo a cualquier lugar en el mundo. Esta desde poder de procesamiento, almacenamiento
información se puede obtener al conectar de información, ancho de banda, etc.
cualquier ordenador a una red telefónica pública
vía modem , que es tan sencillo como enchufarse 6.21 Situación Actual
a la red eléctrica.
Son un poco más difíciles de implementar y
Servicios de compartición de archivos como desplegar, ya que los recursos son costosos y no
Napster, Gnutella Network, E-Donkey forman pueden ser entregados al público en general sin
parte del Grid de Información actual. A diferencia costo alguno.
de la Web, los datos compartidos no se
encuentran respaldados por una organización o En esta categoría se encuentran los Grids
dueño de algún sitio Web, sino que el servicio Computacionales, que permiten el acceso a
para compartir archivos es dispuesto por personas superordenadores distribuidos para realizar tareas
que desean intercambiar archivos de música, que consumen mucho tiempo. La mayoría se
películas, videos o software. El servicio de basan en la herramienta que se ha convertido en el
intercambio se mantiene gracias a los estándar en esta área, el Globus Toolkit.
participantes, no hay un repartidor central
involucrado. Es un ambiente distribuido, Hoy en día hay diversos prototipos de Grids
dinámico y altamente flexible. específicos en investigación farmacéutica,
química, astrofísica, tratamiento y representación
6.11 Situación Actual de video, post producción, simulación del clima,
geología, etc. Algunos de éstos utilizan portales
Desde su invención, se ha convertido en uno de Web, otros ocultan el acceso Grid dentro de la
los mayores éxitos en la tecnología y la aplicación.
comunicación, es usada por un gran numero de la
población mundial para acceder a información También están los Grids de Datos, los cuales
actual. proveen mecanismos para el almacenamiento
seguro y redundante en sitios esparcidos
Una de las razones de su éxito es el concepto de geográficamente. Debido a los desafíos
hipervínculo, una referencia hacia otras webs que ocasionados al almacenar y procesar cantidades
es muy fácil de usar. El seguir los hipervínculos de Petabytes de datos en diferentes localizaciones,
es comúnmente la manera más rápida para se convierte en un tema extendidamente
encontrar información sin tener que teclear la demandante. Temas como la replicación,
información. Debido a esto, la Web dominó obtención, catalogación y la coordinación de estos
rápidamente a ftp y a redes que existían con datos deben ser aun refinados.
anterioridad.
Otro ejemplo son las Aplicaciones paralelas como
Otra causa para el éxito de esta red ha sido la el ya mencionado proyecto SETI@home,
facilidad con la que se puede actualizar la fightcancer@home o distributed.net, los cuales
información, de esta forma ésta se mantiene al han probado ser fácilmente ejecutables en
día. ordenadores distribuidos. No necesitan
Middleware ya que está integrado en la
6.2 Grid de Recursos aplicación, la cual se encarga también de la
ejecución de los trabajos remotos y la recolección
Provee mecanismos para el uso coordinado de de los resultados. Un aspecto importante de estas
recursos como ordenadores, archivos de datos, aplicaciones es la confianza implícita en ambas
servicios e instrumentos de laboratorio. partes. El dueño del PC confía en la integridad
del software sin verificar personalmente la
A diferencia del Grid de Información, usuarios autenticación y la autorización, y el que distribuye
anónimos no pueden acceder a este sin las el software Grid confía que los resultados no han
credenciales necesarias a las facilidades y sido falsificados por el dueño del PC.
ventajas otorgadas por del Grid de Recursos. Solo
usuarios autorizados y previamente registrados Los Grids de acceso también recaen dentro de
pueden utilizarlo. esta categoría. Construyen la base técnica para la
colaboración remota al proveer video ofrecen la infraestructura básica necesaria para la
conferencias interactivas y facilidades creación y ejecución de aplicaciones distribuidas,
Blackboard. así como para la construcción de Grids.
Actualmente, Globus se ha convertido en el
6.3 Grid de Servicio estándar de facto para la computación en Grid.

Entrega servicios y aplicaciones sin importar la Globus consta de tres componentes


ubicación geográfica, implementación o fundamentales:
plataforma de hardware. Los servicios son
montados en los recursos concretos disponibles en
el Grid de Recursos. Una de las mayores • Gestión o manejo de recursos
diferencias entre estos dos tipos de Grid se (GRAM)
encuentra en que el Grid de Servicios provee
servicios abstractos sin importar su localización,
• Servicios de información
mientras que el Grid de Recursos facilita accesos
(MDS)
a recursos concretos ofrecidos en un sitio en
particular.
• Gestión o manejo de datos
6.31 Situación Actual (GridFTP)

Abarca los servicios disponibles como las


maquinas de búsqueda, portales, paginas de
servidor activas y diverso contenido dinámico. Una parte importante de Globus, utilizado en cada
Normalmente son gratuitos debido a patrocinios o uno de los componentes, es el protocolo de
publicidad. Servicios de email y autorización seguridad GSI para la comunicación y
como Passport, GMX y Hotmail recaen en esta autentificación.
categoría.
• Así que la Seguridad se considera como
Con los web services y el Open Grid Service un componente.
Architecture OGSA están diseñados para proveer
interoperabilidad entre los servicios sin importar Los componentes anteriores, ya sea de forma
la implementación, localización geográfica o independiente o conjunta, facilitan el acceso
plataforma de ejecución. transparente y seguro a recursos distribuidos
geográficamente en diferentes dominios de
administración, además de servir como
herramientas básicas para implementar las fases
7. GLOBUS Alliance de la planificación de trabajos en Grids tales
como: descubrimiento, selección y preparación de
GLOBUS Alliance , o también conocido como recursos; y envío, monitorización, migración y
Proyecto GLOBUS, es un programa de finalización de trabajos.
investigación sobre tecnologías de GRID
sustentado por varios centros de investigación, La versión actual del Globus Toolkit , GT3.2 (al
universidades y compañías del sector (IBM y HP 31 de marzo de 2004), y cuenta ya con la
entre otras) . implementación a gran escala de Open Grid
Services Architecture (OGSA), que es la
El núcleo de miembros del programa son el arquitectura Grid definida por la organización
Argonne National Laboratory , la Universidad de Global Grid Forum (consorcio de mas peso en la
California Sur, La Universidad de Chicago, la definición de estándares en Grid Computing) y
universidad de Edimburgo y el Center for Parallel en la que Globus Alliance también participa.
Computing de Suecia.

El programa genera software de código abierto


que se utiliza en producción de actividades 8. El Globus Toolkit (GT)
científicas, de ingeniería y comerciales.
Globus Toolkit versión 1 (GT1) ,versión 2 (GT2)
La herramienta principal generada por Globus y versión 3 (GT3) son los predecesores de la
Alliance es el Globus Toolkit El Globus Toolkit versión actual de Globus Toolkit , que es GT3.2.
es una colección de componentes software que
GT3.2 ha evolucionado para soportar un conjunto Todos los componentes utilizan el protocolo de
más amplio de servicios y servidores. seguridad denominado GSI (Grid Security
Infrastructure) en la capa de conexión.
El toolkit se basa en tecnologías estándar como
XML, SOAP, WSDL, Servicios Web y está Globus utiliza el mencionado OGSI (software
implementado íntegramente en Java. Su que también es open source) para construir los
arquitectura se estructura en varias capas. La capa servicios base de GT3 y algunos servicios de
inferior es el núcleo donde se encuentran las gestión.
factorías de recursos, el servicio de notificaciones,
el servicio de persistencia y el servicio de ciclo de Al menos un servicio de cada pilar se utiliza en
vida. La segunda capa comprende los servicios de cualquier implementación de un servicio Grid.
seguridad (GSI Grid Security Infraestructure). En
la tercera capa se encuentran los servicios básicos 8.1 Gestión de Recursos (Globus
como la gestión de trabajos, los servicios de Resource Allocation Manager,GRAM)
directorio y monitorización y los de transferencia
de ficheros. En el nivel más alto se encuentran los La arquitectura de gestión de recursos de Globus
servicios de gestión de grandes cantidades de permite el acceso transparente, unificado y seguro
datos y aquellos servicios que no son parte del a los distintos gestores de recursos locales de cada
toolkit pero que se basan en esta arquitectura. centro o institución. Los principales componentes
de esta arquitectura son: el lenguaje de
Los servicios Grid, en la implementación GT3.2, especificación de recursos (RSL), el gestor de
son básicamente Web Services, pero construidos asignación de recursos (GRAM), y DUROC
siguiendo un conjunto de especificaciones (Dynamically-Updated Request Online
definidas por OGSI. Dentro de GT3.2 se Coallocator ) para la asignación múltiple de
contempla el soporte de versiones anteriores del recursos.
toolkit (compatibilidad hacia atrás) mientras se
produce la migración de sus usuarios a GT3.2. En sí lo que hace el GRAM es procesar las
peticiones de recursos para ejecución de
Los pilares básicos del Globus Toolkit, desde la aplicaciones remotas, maneja los trabajos activos
versión GT2 son los ya mencionados e ilustrados y regresa información actualizada de las
en la figura 2: capacidades y de la disponibilidad de los recursos
de cómputo.
• GRAM ( Grid Resource Allocation
2.2 Servicios de Información (Meta-
Management)
computing Directory Service,MDS)
• MDS (Monitoring and Discovering
Services) El sistema de información de Globus es el
Metacomputing Directory Service (MDS), que
• GridFTP ( Grid File Transfer Protocol) usa el protocolo LDAP para la consulta uniforme

Gestión Servicios Gestión


de De de
Recursos Informaci ón Datos

Seguridad

Fig. 2 Componentes Fundamentales


de la información referente a los sistemas en el 9. Open Grid Services
Grid.
En particular, el Grid Resource Information Architecture (OGSA)
Service (GRIS), provee de manera uniforme la
búsqueda de recursos obteniendo como resultado OGSA define el esqueleto de lo que debe ser una
la configuración actual, capacidades, el estado y arquitectura grid, así como el modelo de
las prestaciones de cada recurso del Grid. programación de los servicios grid. Suministra
instrucciones de cómo construir un servicio grid,
La información suministrada por cada GRIS se con que componentes y la forma de ensamblarlos.
agrupa en el Grid Index Information Service
(GIIS), que ofrece una imagen conjunta y La GGF define OGSA de esta manera:
coherente de los recursos del Grid, es decir acepta
mensajes de registro de los GRIS y conjunta esas “Es un marco (framework) de amplio espectro de
fuentes de información en un espacio unificado de aplicación para la integración de Sistemas
información. Distribuidos. Este framework define un núcleo
de interfaces, comportamientos, modelos de
8.3 Gestión de Datos (GridFTP) recursos, enlaces, etc que constituyen la
Plataforma OGSA. El grupo de trabajo OGSA
El GridFTP es un protocolo de transferencia de del GGF define la Plataforma OGSA mediante
ficheros seguro y de alto rendimiento basado en el los siguientes pasos:
popular protocolo FTP, optimizado para redes de
área amplia con grandes anchos de banda. Este a) Definir el alcance de los servicios que
protocolo es de gran importancia en Grids de se requiere para dar un soporte adecuado
datos. para las aplicaciones de Grid (e-science,
e-business, etc)
El servicio GridFTP se asigna por defecto al
puerto 2811. b) Identificar un subconjunto básico de
tales servicios que sean esenciales para
Entre sus características se encuentran : los sistemas Grid y las aplicaciones que
se ejecuten sobre ellos, es decir, definir
• Múltiples canales de datos para un conjunto base (core) de servicios.
transferencias paralelas.
c) Especificar las funcionalidades de alto-
• Transferencias parciales de archivos. nivel (alto nivel de abstracción) de estos
servicios base (core) y sus
• Transferencias server-to-server interrelaciones.

Mas en detalle, OGSA define cosas como las


siguientes:
8.4 Seguridad (Grid Security
Infrastructure, GSI) • Establecimiento de identidad y
negociación de autenticaciones
El Globus Toolkit usa el GSI para habilitar una
autentificación y para tener una comunicación • Definición de normativas
segura a través de una red abierta.
• Descubrimiento, monitorización y
Las motivaciones principales del GSI son: gestión de servicios

• Comunicación segura entre elementos • Negociación y monitorización de


del grid. Niveles de Servicio

• Soporte de ¨single sign on¨, incluyendo • Comunicación y Gestión de la


delegación de credenciales para realizar Virtualización de miembros de la
cómputo que involucre múltiples red Grid.
recursos y sitios.
• Uso jerárquico de servicios Grid
• Integración de recursos de datos en Un Servicio Grid es una instanciación de estas
los procesos de computación interfaces cuyas características se acaban de
definir . El punto importante es que el único
• Gestión de recursos a través de contacto entre un servicio Grid y sus usuarios (las
plataformas heterogéneas aplicaciones que se están ejecutando en el Grid)
es el interfaz de servicio. Estas interfases se
• Generación de Calidad de Servicio definen mediante ficheros WSDL (Web Services
(QoS) adecuada Description Language). OGSI ha añadido
algunas extensiones al WSDL v1.1 estándar para
• Definición de una base común para cubrir ciertos requerimientos . Estas extensiones
gestión autónoma (capacidad de los se cubrirán en la v 1.2 de WSDL que aún no es
sistemas de auto verificarse y firme.
autogestionarse) 9.2 Open Grid Services Infrastructure
(OGSI)
• Interfaces públicos y abiertos.
OGSI es la implementación de la infraestructura
• Utilizar tecnología estándar: SOAP; que define OGSA. Es lo que se llama el
XML, … “middleware” o la plataforma para ejecutar
servicios Grid. OGSI no determina que
• Integración de los recursos de TI middleware concreto debe usarse y existen
existentes. implementaciones OGSI en java, .Net, etc. Se
puede utilizar tecnología Java 2 para crear y
La arquitectura OGSA se puede implementar gestionar de servicios Grid e intercambiar
mediante múltiples productos o software open información entre ellos de acuerdo a OGSI.
source , entre los cuales está GT3.2.
La definición que da el GGF de OGSI es esta:
9.1 Modelo de Programación de OGSA “OGSI define mecanismos para crear, gestionar
e intercambiar información entres entidades
Al programar un servicio Grid es esencial para la llamadas Servicios Grid utilizando tecnología
interoperabilidad y la reutilización, hacerlo de Grid y de Web Services.
conforme a un conjunto común de interfaces y
comportamientos. Es lo que se llama un modelo Sucintamente, un Servicio Grid es un Web
de programación y es una de las cosas que define Service que se ajusta a una serie de convenciones
OGSA. (interfaces y comportamientos) que definen
como los clientes interaccionan con el Servicio
Algunas de las definiciones del modelo de Grid. Estas convenciones y otros mecanismos
programación son obligatorias y otras optativas. OGSI asociados con la creación y localización
(discovery) de servicios Grid permiten una
Éstas definiciones son: gestión adecuada (control, fiabilidad , seguridad)
de la información de estado distribuido y de larga
• Factory (factoria de clases) duración que se requiere en la ejecución de
aplicaciones distribuidas”.
• Registry (registro)
9.3 Web Services
• Discovery (localización de recursos)
La base fundamental de los Servicios Grid en la
• Life cycle (Ciclo de Vida) implementación de Globus es el estándar Web
Services.
• Query service data (petición de servicio)
Web Services es una tecnología de computación
de sistemas distribuidos que permite la creación
• Notificación
de aplicaciones basándose en el modelo
cliente/servidor mediante una plataforma
• Invocación fiable independiente del lenguaje y utilizando
protocolos abiertos como HTTP .
Los Web Services usan el protocolo SOAP Una URI es equivalente y
(Simple Objects Access Protocol) y gramática formalmente igual a una URL dentro de
XML para comunicarse, aunque el protocolo una página web. Los Web Services
básico de transporte es HTTP para realizar las suelen usar URIs porque suelen estar
peticiones y las repuestas, aunque puede usar dentro de un contenedor Web. Un
otros como JMS, etc. Mientras que las URI tendría una estructura tal como:
tecnologías distribuidas tales como CORBA, http://sitio.com/aplicacion/servicio-web-
EJB, COM/DCOM , etc están orientadas a xxxx .
clientes y servidores muy dependientes, los Web
Services están orientados usar clientes que no 3. El cliente sabe donde está el servicio
tienen un conocimiento previo del servicio hasta Web mediante el URI, pero no sabe
que se le invoca, es decir, existe un fuerte como invocarlo, para lo cual pregunta
desacoplamiento entre cliente y servidor del al servidor Web como hacerlo.
servicio.
4. El servidor Web le contesta con un
Los Servicios Web no manejan servicios con fichero WSDL (Web Services Definition
información de estado (stateful), es decir, no Language) que da los detalles para hacer
“recuerdan” valores de una llamada a otra . Sin la invocación. Mas rigurosamente,
embargo, en los entornos distribuidos describe el interfaz del servicio Web.
contemplan en numerosas ocasiones escenarios
en que si se requiere información de estado. Los 5. Una vez conocido el donde y el como,
Servicios Grid añaden esa capacidad a los Web se hace la invocación. Se puede hacer de
Services. varias formas, pero la más común es
usar SOAP (Simple Object Access
Para invocar un Web Service se dan los pasos Protocol), un protocolo que permite
siguientes (figura 3): llamadas remotas de servicios
(programas) mediante mensajes
1. El cliente localiza el servicio Web codificados y encapsulados en XML.
mediante el uso de un registro UDDI o
cualquier otro sistema que permita 6. El servicio Web contesta con la
revisar las descripciones WSDL de los respuesta SOAP en un mensaje escrito
servicios Web. en gramática XML.

2. El registro UDDI responde devolviendo


una dirección URI (Universal Resource
Identifier) que apunta a uno de los
servidores que contiene servicio Web.

WSDL,
7 El Potencial de Grid
API UDDI
Como hemos visto, la más simple y la primera
forma de cómputo en Grid empezó con el
WSDL,
concepto del cómputo distribuido. Pero hoy, se ve
SOAP
al sobre
Grid como la nueva generación en
HTTP
infraestructuras de Tecnologías de la Información,
y se espera que transforme la computación, la
comunicación y colaboración. Existirán diversas
Grids, cada una dentro de su propio contexto,
compartidas por comunidades que compartan El
Fig. 3 Invocación de un Web Service
desarrollo de servicios Web habitualmente no • Servicio de Nombres (Naming) , que
necesita considerar los detalles SOAP y WSDL asegura la existencia de un nombre único
ya que las herramientas generan automáticamente para cada instancia de Servicio Grid y
unos “stub” o proxys que interpretan las permite la localización de servicios Grid
peticiones y las enrutan al destino (discovering) mediante nombres.
adecuado(figura4).
• Servicio de Datos, que gestiona los
10. Servicios GRID conjuntos de datos asociados a la ejecución
de un servicio Grid
Un Grid Service es una ampliación de los Web
Services, su arquitectura está especificada por el • Notificación, es decir el conjunto de
Global Grid Forum (OGSA). La idea era buscar interfaces para registrar y suministrar
una tecnología de objetos distribuidos que se notificaciones y subscripciones. Estos son
adaptase a las necesidades de una aplicación grid, los mecanismos usados para la
y se pensó en los Web Services, aunque estos comunicación entre los componentes de
presentaban algunas limitaciones que se una aplicación Grid.
superaron:
• Ciclo de Vida, mecanismos para la
• Los Web Services no mantienen el creación y destrucción de instancias de
estado de una invocación a otra, los grid
Servicios Grid
services si.
10.1 Servicio de Nombres (GSH y
• Los Web services no son transientes, es GSR)
decir no se pueden crear varias instancias
de un mismo servicio según se necesita y
Los Servicios Grid , al igual que los Web Services
destruirlas cuando ya no son necesarias, en
sobre los que se basan, utilizan URIs para
los grid services, se puede.
localizarse. Sin embargo, dentro de la
terminología OGSI, un URI de un Servicio Grid
• Los Web Services no incluyen servicios
se denomina Grid Service Handler (GSH), pero
de apoyo que han sido incluidos en los grid
conceptualmente es lo mismo que un URI.
services como son las notificaciones, el
servicio de persistencia, la gestión del ciclo
de vida, etc. Adicionalmente, este GSH, al igual que un URI,
debe resolverse para encontrar el servidor
específico que contiene la instancia del Servicio
Los grid services utilizan un enfoque de Factorías
de Objetos de manera que en lugar de tener un Grid, es decir una referencia llamada Grid Service
único servicio compartido por todos los usuarios Reference (GSR).
(como el Web Service) se tiene un servicio-
factoría que crea instancias individuales del Un GSH debe ser único y apuntar a una instancia
servicio. Cuando se invoca a una operación del de Servicio Grid, pero no contiene información
servicio se accede a la instancia y no a la factoría. suficiente para invocar la instancia. Esta
Además se puede crear una instancia por cliente, información esta contenida en el GSR.
o varias por cliente o una para varios clientes. Por
último la destrucción de la instancia puede correr Un GSR no es un puntero permanente a una
a cargo del cliente o de la factoría. Los Servicios instancia de Servicio Grid ya que los GSR
Grid están construidos utilizando Web Services pueden invalidarse por razones tales como , por
pero se les incorporan una serie de mecanismos ejemplo, que dicha instancia se pase de un
de la plataforma OGSI. Estos mecanismos servidor a otro diferente. Esto significa que debe
adicionales se pueden agrupar en cuatro áreas: haber mecanismos de actualización de los GSR.

Fig. 4 SOAP y stubs


Cliente Servidor en los Web Services
Desde la versión GT3 de Globus se proporciona Ya que WSDL define operaciones y mensajes
un mecanismo denominado HandleResolver para los portTypes, el estado declarado de un
para resolver GSHs y encontrar su GSR servicio debe ser sólo externamente accedido a
correspondiente. Un GSR puede tener diferentes través de operaciones del servicio definidas en el
implementaciones según la plataforma Grid que interfaz de dicho servicio. Para evitar la
se use, pero GT3 utiliza un fichero WSDL necesidad de definir operaciones específicas de
para describir el GSR . Como ya se ha serviceData para cada SDE , el portType de los
comentado, los ficheros WSDL son los que se servicios suministra operaciones base para
usan para definir un interfaz de un Web Service, manipular los SDE por nombre. Esta declaración
es decir, que métodos tiene, etc). permite expresar los elementos de la información
de estado públicamente disponibles. La parte
OGSI, y por tanto GT3, utilizan una extensión interna privada del estado no es parte del interfaz
del estándar WSDL 1.1 para los interfaces de los y por tanto no esta representada por una
servicios Grid. WSDL 1.1 tiene dos limitaciones declaración de datos del servicio.
importantes en relación a la implementación de
servicios Grid: primero, no tienen herencia de El concepto de serviceData es muy semejante al
interfaz (portType), y segundo no puede describir concepto de “variable pública de instancia o de
elementos de información adicionales en el (falta campo” en lenguajes orientados a objeto tales
de contenido abierto). Estas limitaciones están en como Java, SmallTalk o c#. Así, por ejemplo, en
la especificación WSDL 1.2, pero ésta Java un javabean define convenciones para las
especificación no es firme y entre tanto OGSI ha firmas de método para acceder a las propiedades
añadido algunas extensiones que lo cubran. y clases helper para documentar las
propiedades. El modelo OGSI usa serviceData
Un portType es un elemento de un fichero WSDL elements (SDE) y tipos de esquema XML
que identifica un conjunto de operaciones y los (WSDL) para hacer eso mismo respectivamente,
mensajes involucrados con cada una de las pero con la ventaja de ser un procedimiento
operaciones . extensible y que permite querys complejas y
semánticas de suscripción.
10.2 Servicio de Datos (ServiceData)
Una característica muy importante de los
Este es uno de los conceptos más importantes de serviceData es su extensibilidad. Los
Grid Computing. Un servicio de datos es una serviceData definen un nuevo elemento de
colección estructurada de información que va portType denominado serviceData que permite
asociada a una instancia concreta de un Servicio definir serviceData Elements (SDE), asociados
Grid, es decir, es un mecanismo para exponer con este portType. Los valores de estos SDE
los datos de estado de la instancia a los pueden declararse estáticamente en el portType o
peticionarios del servicio (un cliente u otros dinámicamente a lo largo de la vida del Web
servidores). Service o Grid Service.

Dichos peticionarios pueden hacer una “query” Además de los SDE estándar definidos por OGSI,
(petición), o modificar esta información en existe una API para permitir la creación dinámica
función del privilegio de acceso. de serviceData que corresponde a los datos del
WSDL de la instancia concreta del servicio Grid.
Estos elementos de información se denominan Las instancias del Servicio Grid mantienen el
Service Data Elements (SDE) y contienen valor del serviceData , que pueden ser solicitadas
información de contexto y de estado de la en cualquier momento o ser asociadas a una
instancia del Servicio Grid. Cada instancia de un notificación de aviso cuando su valor cambie.
Servicio tiene varios SDEs , de diferentes tipos. OGSI define para esto una interfaz para hacer
querys a los SDEs o subscribirse a notificaciones
Para suministrar la información adecuada para de aviso (que avisen de cambios en los SDE, lo
describir el interfaz de un Stateful Web Service cual puede ser bastante útil).
(por ejemplo un Servicio Grid), es necesario una
descripción de los datos de éste estado que son 10.3 Notificaciones
externamente observables, es decir, los que son
usado por un cliente que use la interfaz declarada Las notificaciones son mecanismos de
del servicio. Es equivalente a la declaración de comunicación entre los componentes de la
atributos en un interfaz OO (orientado a objeto) infraestructura. Permite el envío de mensajes
de un IDL (Interface Definition Language). desde una Fuente de Notificación a un Sumidero
de Notificación, según la terminología de OGSI 5. Mensaje de la notificación: puede ser un
(Notation Source y Notation Sink ). mensaje estático (no necesita suscripción)
o bien sujeto a modificaciones futuras
Se trata de un mecanismo de mensajería dinámicas de un SDE (serviceData
asíncrona. La mensajería asíncrona tiene dos Element) concreto para lo cual necesita un
variantes: los gestores de colas, y el mecanismo procedimiento de suscripción
de publicación-suscripción a un topic (que
básicamente es una cola). 6. Sumidero de Notificación: es la instancia
de Servicio Grid que recibe los mensajes
La implementación de GT3 gestiona el ciclo de
notificaciones mediante un mecanismo de Estos elementos se pueden ver representados en
suscripción. la siguiente figura:

El ciclo de notificaciones tiene los siguientes La implementación de este mecanismo de


componentes (figura 5): publicación-suscripción entre los distintos
componentes se hace en el Globus Toolkit
1. Petición de Suscripción: la Fuente recibe mediante el servicio JMS (Java Messaging
un mensaje con la localización del Services) definido dentro del estándar J2EE. La
Sumidero a donde se deben mandar los interacción con el cliente sigue haciéndose vía
mensajes , así como un tiempo de vida SOAP/http.
para el origen de la suscripción. Una
petición de suscripción genera una 10.4 Ciclo de Vida
instancia de Servicio Grid denominada
Suscripción. Se utiliza la definición El ciclo de vida de un Servicio Grid está marcado
NotificationSource portType . por la creación y la destrucción de la instancia de
este servicio. Es una propiedad básica de Servicio
2. Expresión de la Suscripción: es un Grid y esta controlada por el llamado “hosting
documento XML que describe las reglas y environment” (el sistema que aloja a la
el formato del mensaje de la Notificación plataforma Grid, el Globus Toolkit en este caso),
(destino de la notificación, cuando debe pero que, sumariamente, puede ser el propio
enviarse, etc.) sistema operativo, un contenedor (servidor) Web,
un contenedor J2EE, etc.
3. Instancia del Servicio Grid de
suscripción: es una instancia de servicio Un Servicio Grid soporta también notificaciones
Grid que se crea durante la operación de relativas a eventos del ciclo de vida, lo que
suscripción y que se encarga de gestionar permite a los Servicios Grid ser conscientes de la
las propiedades de la suscripción. situación de otros servicios y tenerlo en cuenta
para la dinámica de la propia aplicación Grid.
4. Fuente de la Notificación: es una
instancia de servicio Grid que envía Para crear una instancia de un Servicio Grid se
notificaciones hace una petición a un objeto Factory para que

2-Expresión de la
Suscripción
1 - Petición de 3-Instancia
Suscriptor del Suscriptor
Suscripción del Service
Cliente

Instancia de Servicio que


recibe la
Notificacion Instancia de Servicio que
manda la
6- Sumidero Notificación

5-Mensaje de la 4- Fuente
Notificación

Fig. 5 Ciclo de Notificaciones en el GT


creé una instancia para el cliente, mientras que su 11. Estructura de Globus Toolkit
destrucción se hace por dos vías: la invocación de
un método específico dentro de la instancia, o
Los componentes de la versión actual del Globus
mediante un procedimiento llamado de “soft-
Toolkit se pueden agrupar en dos áreas:
state” en el que una instancia que durante un
periodo de tiempo no ha sido usada o refrescada,
termina. • El núcleo, constituido por:

-La base: la implementación de OGSI


El mecanismo de creación de instancias de
Servicios Grid es, la invocación de un objeto
Factory. Está definida en la especificación OGSI -La infraestructura de Seguridad GSI
y se implementa mediante un interfaz Factory.
-Los servicios a nivel de sistema (System-level
La operación de crear un Servicio Grid devuelve Services)
el GSH (un URI) del servicio solicitado. El GSH
es resuelto en un GSR (es decir, la descripción -El contenedor de Grid Services
completa en formato WSDL) que tiene un tiempo
de validez determinado (mientras que el GSH es • Componentes auxiliares, que son:
permanente).
-Servicios base
Los pasos a partir de aquí son(figura 6):
-Servicios definidos por el usuario
1. El cliente localiza una Factory en el
registro o servicio de nombres relativo al Todo el toolkit se ejecuta sobre lo que se llama
servicio Grid a ejecutar un Entorno de Alojamiento (Hosting
Environment), que es el entorno operativo del
2. El cliente llama a una operación dentro servidor donde se ejecuta(figura 7). En la
del Factory para crear una instancia del actualidad existen cuatro posibles tipos de
servicio Grid Hosting Environment :

3. El factory crea la instancia • Un contenedor embebido en un sistema


operativo (linux, unix…)
4. El factory devuelve el GSH (el URI)
del nuevo servicio Grid al cliente. • Un contenedor autónomo sobre una JVM
(Java Virtual Machine)
5. El cliente y el servidor interactúan a
través del servicio como resultado de la • Un Contenedor Web J2EE (como
llamada inicial. Tomcat, etc)

REGISTRY SERVICIO
FACTORY

Nueva
Instancia
del
Servicio
• Un Contenedorde EJB de J2EE (como
Grid
JBoss, WebSphere, WebLogic, etc).
Cliente

Fig. 6 Creación de Instancias de Servicios Grid


Dependiendo de que entorno sea , el Globus 11.1 Entorno embebido
Toolkit operará utilizando una serie de
utilidades u otras y tendrá diferentes Se utiliza principalmente con clientes o
prestaciones. servidores ligeros que soliciten la ejecución de
Servicios Grid. Por ejemplo, una operación de
suscripción puede crear un pequeño Entorno de
Hosting para ejecutar dentro del cliente la
instancia del servicio de suscripción que permita
GT3 recibir notificaciones de otros servicios grid.

Es un pequeño entorno Grid para operaciones


grid poco pesadas.

OGSI GSI 11.2 Entorno autónomo

Este entorno tiene un entorno hosting embebido


pero le añade un interfaz de línea de comandos
Hosting Enviroment para arrancar y parar el entorno GT mediante
comandos como: globus-start-container y
Fig. 7 Hosting Enviroment globus-stop-container , así como otras
operaciones simples de administración (logging,
Dentro del Hosting Environment existen varios trace SOAP…)
niveles de servicios que son importantes(fig 8):
Permite un manejo simple y rápido.
• Una capa de Interfaz , sujeta a la 11.3 Entorno de Contendor de Web
especificación OGSI para usar los
J2EE
servicios del entorno.
El entorno embebido se ejecuta en una JVM
• Un servidor Web que soporte SOAP,
(Java Virtual Machine) de un contenedor Web
como el Apache AXIS, el cual está
como Tomcat , webSphere o similar. Este Web
encargado de gestionar la comunicación
Container utiliza los servicios Web del motor
SOAP sobre transporte HTTP . Actúa
java en vez de los suministrados por GT (los
como un listener (escuchador) de mensajes
servicios Web son la base de la implementación
SOAP y que se encarga de la
de servicios Grid en el toolkit).
serialización/deserialización de las
peticiones y respuestas SOAP. AXIS está
En este entorno se pueden añadir características
siendo superado por otros motores SOAP
de escalabilidad y alta disponibilidad que
en la actualidad.
suministran este tipo de servidores.
• Un contenedor del toolkit con sus 11.4 Entorno de contenedor EJB
herramientas y servicios.
En este entorno , el entorno embebido se ejecuta
Hosting Enviroment en un contenedor EJB y los servicios Grid son
invocados desde beans java denominados EJB
(Enterprise Java Beans) que tienen una amplia
versatilidad (transaccionalidad, mensajería, 2
phase commit, seguridad, etc).

Contenedor En este entorno se pueden añadir características


de escalabilidad y alta disponibilidad que
Capa de transporte/ Binding (SOAP/Http) suministran este tipo de servidores.

Capa de interfaz OGSI

Fig. 8 Niveles de Servicios en el HE


12. Componentes de Globus hemos visto ya, son los elementos que
permiten guardar la información de estado
Toolkit de los Servicios Grid (la principal
diferencia respecto a los Web Services). El
Sobre el Entorno de Hosting que se ha descrito Servicio de Indexación suministra un
en la sección anterior se ejecuta el Globus comando (cliente) llamado ogsi-find-
Toolkit , el cual tiene varios componentes : service-data que permite hacer una query
de cualquier SDE de cualquier Servicio
Grid. El servicio de indexación utiliza un
12.1 Servicios de Nivel de Sistema servidor LDAP por debajo.
(System Level)
• RFT (Reliable File Transfer) , también
conocido como multiRFT: es parte de la
Son servicios que facilitan el uso de los
implementación de Gestión de Datos
Servicios Grid en entornos de producción. La
distribución core de GT3 suministra los definida por OGSI junto con otros
servicios como Grid FTP (procede de GT2)
siguientes servicios de sistema:
y RLS (Replica Relocation Services).
Suministra un interfaz para transferencias
• Servicios de administración: arranque,
fiables de ficheros en el entorno Grid.
“ping” y shutdown del entorno de Hosting

• Servicio de Logs: permite usar filtros en


run-time y monitorizar los buffers de log . 12.3 Relación con la versión GT2

• Servicio de Gestión: permite Los servicios base que se han comentado respecto
monitorizar la carga del servidor , así de GT3 son la evolución de los mismos
como destruir, activar y desactivar componentes en la versión previa GT2. Se
servicios Grid. mantiene el concepto aunque la implementación
en GT3 está orientada a servicio en un
arquitectura SOA (Service Oriented
Architecture).
12.2 Servicios GT3 Base
La relación entre componentes GT2 y servicios
No son servicios del core GT y se instalan a GT3 se ve en la Tabla 1.
parte, pero son de gran importancia en la
implementación real de servicios Grid. .

Son tres servicios básicos asociados a los tres ya GT2, componentes GT3, servicios
mencionados pilares del GT(fig.1)
GRAM (gatekeeper) MMJFS
Estos tres servicios básicos son: la gestión de
trabajos (jobs), la indexación , y la gestión de (Grid Resource Allocation
datos y ficheros. Manager)

• JMS (Job Management Services): MDS GIIS (Monitoring & Index services
Gestión de trabajos (jobs), es decir, envío y Discovery Services)
monitorización de trabajos remotamente al
Grid. Esta herramienta sigue las interfaces MDS GRIS SDE in MMJFS
definidas por OGSI utilizando WSDL.
Suministra un comando llamado manager- GridFTP server GridFTP server
job-globusrun que invoca el MMJFS
(Master Managed Job Factory Service) GRAM Reporter SDE in Managed Job
para enviar (submit) trabajos. Service

globus-url-copy Reliable File Transfer


• Servicio de Indexación: Se utiliza para
Service
operaciones de localización (discovering) y
permite peticiones y generación de
serviceData Element (SDE), que como Tabla 1 Comparación GT2 con GT3 y la
migración hacia servicios
GT3 mantiene una compatibilidad en algunos de y que permita la Autenticación Mutua entre
lo servicios respecto a GT3 (nombres de componentes del Grid. Cada uno de los
comandos, etc). Así mismo, algunos servicios componentes del Grid debe “confiar” en la
de GT3 se han mantenido. Por ejemplo en misma CA de manera que esa CA sea la que
MMJFS (Master Manager Job Factory) algunos firme los certificados digitales de todos los
servicios son los mismos que en GRAM. componentes de una red Grid particular.

12.4 Seguridad GT3 utiliza SSL (TLS) para la autenticación


mutua.
La seguridad en Globus se implementa a
mediante el servicio GSI (Grid Security GT3 incorpora una CA dentro de los recursos del
Infrastructure). Toolkit aunque es algo compleja de manejar ya
que está enfocada a instalaciones de producción.
Es, tal vez, la infraestructura que más dificultad Se puede usar cualquier otra CA que use
ofrece por el carácter distribuido y heterogéneo certificados x509, desde las más sofisticadas a
de los componentes (servidores) que forman las más simples como openSSL . Suelen llevar
parte de la red Grid. todas ellas un soporte de LDAP para registrar los
DN (Distinguished Names) .
La infraestructura de seguridad de Globus Toolkit
se basa en la criptografía de clave pública. Los La confidencialidad de los datos se realiza
conceptos de clave pública y privada y el de mediante encriptación de clave asimétrica usando
firma digital, son básicos dentro de GSI, y de las claves públicas y privadas de los componentes
hecho, la implementación de GT3 necesita la del Grid que mandan y reciben datos, comandos,
presencia de una CA (Certification Authority) y, etc. GT3 también usa estas claves para la
eventualmente de una RA (Registration integridad de las comunicaciones (asegurar que
Authority), dependiendo de los requerimientos los datos no son modificados) mediante
legales de la instalación concreta. algoritmos de hashing . Tanto la integridad
como la confidencialidad son optativos dentro de
Las necesidades de seguridad en Globus (y en GT3 ya que suponen una sobrecarga en el
Grid Computing en general) son las siguientes: rendimiento.

1. Comunicaciones seguras (autenticación, Las claves privadas se almacenan, en principio,


confidencialidad e integridad de datos) entre en el sistema de ficheros de cada uno de los
los componentes del Grid. A nivel de nodos del grid (es un fichero xxxx.pem en
mensaje XML se implementan los formato base64 o similar). Para evitar que sean
estándares WS-Security y XML-Signature. accedidos , estos ficheros se cifran mediante una
frase clave (pass phrase). No obstante, en
2. La necesidad de soportar un modelo de entornos con requerimientos altos de seguridad
seguridad por encima de los limites estas claves privadas deben almacenarse en
organizacionales (no se usa un modelo smartcards (tarjetas inteligentes) o en adaptadores
centralizado de la gestión de la seguridad). criptográficos de hardware, que disponen de
Para independizarse del mecanismo de sistemas antiviolación (tampering).
autenticación GT3 utiliza una
especificación de J2EE denominada JAAS El Logon Unico dentro del grid que implementa
(Java Authentication & Authorization GSI se basa en el mecanismo de delegación de
Services) credenciales . Las credenciales son en este caso
certificados x509. El mecanismo de delegación
3. La necesidad de un Logon Unico (Single es una extensión del protocolo SSL que permite
Sign On) con delegación de credenciales y reducir el número de veces que debe introducirse
un sistema adecuado de control de acceso a la passphrase cuando se utilizan varios recursos
los recursos sin la necesidad de múltiples grid que requieren autenticación mutua o se
autenticaciones. necesita un agente para solicitar servicios para un
usuario.
La herramienta básica en el GSI es el Certificado
Digital de acuerdo al estándar x.509 de la IETF. La delegación de credenciales se consigue
mediante un proxy, que no es otra cosa que otro
En un Grid Globus se configura una CA que certificado con una clave publica y otra privada
firme los certificados que se usen en todo el grid nuevas, el cual contiene la información del
propietario como el certificado inicial pero y los Compute Grids para el año 2008. Estos son
ligeramente modificado para indicar que es un algunos de los factores que dictan esta tendencia:
proxy. A diferencia del certificado inicial, este
certificado lo firma el usuario y no la CA del grid. • Las compañías están migrando de
También lleva un timestamp para indicar cuando equipos costosos con gran capacidad de
deja de tener validez ya que , por seguridad, los procesamiento a clusters basados en
proxies duran poco tiempo (si se captura su clave procesadores menos potentes y mas
privada no servirá en un tiempo razonablemente económicos.
corto).
• Aunque el utilizar clusters provee
Una vez creado y almacenado el proxy , se puede opciones de escalabilidad menos
usar junto con la clave privada para hacer costosas, el manejo y la administración
Autenticación Mutua sin necesidad de usar la de estos clusters no son tan robustos y
passphrase. confiables como las soluciones de
manejo de arquitecturas con servidores
El Globus Toolkit y algún otro software dedicados.
relacionado con OGSA son los únicos que
aplican estas extensiones de delegación al • Los Service Grids proveen mejores
protocolo SSL o TLS. Globus está trabajando métodos para administrar y utilizar
para incluir dichas extensiones en el estándar. virtualmente estos clusters.
Es lo que se llama dentro de GT3 el HTTPG
(GSI-enabled HTTP). • Compañías que se encuentran utilizando
aplicaciones de Web Services basadas en
componentes necesitan de algún
método mejorado para manejar y
13. El futuro en Grid desplegar virtualmente estos servicios a
través de una red.
El máximo crecimiento en aplicaciones Grid no
lo darán las soluciones de calculo intensivo, sino Durante los próximos cinco años se puede
mas bien los grids de datos y de servicio, ya que asegurar que las tecnologías grid serán parte de la
sus aplicaciones son mucho mas amplias que los mayoría de las infraestructuras de las principales
tradicionales grids de cómputo. Los Data Grids compañías mundiales. Aunque todavía no se
proveen una capa de virtualización llamada anticipa una red ubicua, ni la total virtualización
también data fabric. Las Grids de Servicio de servicios, datos y cómputo, se anticipa que la
proveen la infraestructura para desarrollar y expansión de la heterogeneidad de la tecnología,
desplegar arquitecturas robustas enfocadas en los la inclinación hacia los servicios, tecnología, los
componentes. procesos de negocio en outsourcing, los Web
services y las continuadas presiones de recortar
Los Service Grids proveen la capa heterogénea costos forzará a las compañías a realizar cambios
de administración de hardware, y la radicales en los que manejan la tecnología.
infraestructura de despliegue para los Web
Services. Una de las razones por las cuales hemos El mercado para los grids de datos y de servicios
oído mucho acerca de los Web Services, pero es todavía relativamente pequeño y abierto a
hemos visto tan pocos despliegues es por la falta nuevos competidores.
de una infraestructura robusta de despliegue de
los mismos. Actualmente, aunque los Web
Los fabricantes/desarrolladores en este espacio,
Services han sido desarrollados e implementados aparte de los principales proveedores de
a través de redes heterogéneas , no hay manera de
servicios/hardware, (IBM, HP, Oracle, Sun
crear e implementar adecuadamente Web Services
Microsystems), son pequeños y tienden a ser
complejos con niveles de servicio garantizados. pioneros con una limitada penetración en los
Los service grids proveen esta infraestructura al
mercados. Aunque a estos desarrolladores se les
regir tecnologías heterogéneas en donde los
puede categorizar como novedosos, cuando
servicios se despliegan al mismo tiempo que se estándares como en WS BPEL (Web Services
maneja la vitalidad de la infraestructura de
Business Process Execution Languaje) y la
despliegue.
coreografía de los Web Services sea completada,
veremos a los mercados y a los
Según expertos, el crecimiento en el sector de los
Service Grids superará el crecimiento de los Data
fabricantes/desarrolladores expandirse
rápidamente.

Referencias
[1] I. Foster, C. Kesselman, S. Tuecke. “The
Anatomy of the Grid: Enabling Scalable
Virtual Organizations”. International J.
Supercomputer Applications, 15(3), 2001.

[2] Alexander Reinefeld, Florian Schintke.


“Concepts and Technologies for a
Worldwide Grid Infrastructure”. Euro-Par
2002 Parallel Processing, volume 2400 of
Lecture Notes in Computer Science, pages
62-71, Springer 2002. (c) Springer-Verlag.

[3] I. Foster, C. Kesselman, J. Nick, S. Tuecke.


“The Physiology of the Grid: An Open Grid
Services Architecture for Distributed
Systems Integration.” Open Grid Service
Infrastructure WG, Global Grid Forum, June
22, 2002.
[4] Ian Baird. “Understanding Grid Computing”
Daily News and Information for the Global
Grid Community / July 1, 2002: vol. 1 no. 3

[5] Globus Project http://www.globus.org

[6] EU Datagrid Project


http://web.datagrid.cnr.it
[7] I. Foster, C. Kesselman,. “Globus: A
Metacomputing Infrastructure Toolkit”.
International Journal of Supercomputer
Applications, vol .11 no.2, 1997
[8] Globus Project Open Grid Services
Architecture Working Group
https://forge.gridforum.org/projects/ogsa-wg

[9] Ángel Hernández Bravo. “El proyecto


Globus”. Enero, 2004

[10] Grid Service Development Tools Guide


http://www-
unix.globus.org/toolkit/3.0/ogsa/docs/tools_guide.html

[11] Open Grid Services Infrastructure Working


Group
https://forge.gridforum.org/projects/ogsi-wg

[12] GridFTP Working Group


https://forge.gridforum.org/projects/gridftp-
wg

Você também pode gostar