Você está na página 1de 18

INSTITUTO TECNOLOGICO SUPERIOR DE CINTALAPA

SISTEMAS OPERATIVOS 2

REYNOL ROQUE FARRERA

INVESTIGACION DE LA QUINTA UNIDAD: Usos y


tendencias de los Sistemas Operativos Distribuidos

INTEGRANTES:
JOSE ANGEL ORTIZ SANCHEZ
JOSE FRANCISCO CORTES SOLIS
JOSE ANGEL MORALES RAMOS
REY DANIEL CRUZ CAMACHO
OSCAR ROMEO PEREZ AQUINO

QUINTO SEMESTRE GRUPO H

CINTALAPA CHIAPAS A 29 DE NOVIEMBRE DE 2015

UNIDAD 5 USOS Y TENDENCIAS DE LOS SISTEMAS


DISTRIBUIDOS
5.1ADMINISTRACIN SISTEMAS DISTRIBUIDOS
La administracin de sistemas distribuidos incluye las actividades como: manejo de
la versin y distribucin del software, monitoreo de la utilizacin de los recursos y el
mantenimiento del sistema de seguridad, entre otros.
Los administradores de sistemas distribuidos se ocupan de monitorear
continuamente al sistema y se deben de asegurar de su disponibilidad. Para una
buena administracin, se debe de poder identificar las reas que estn teniendo
problemas as como de la rpida recuperacin de fallas que se puedan presentar.
La informacin que se obtiene mediante el monitoreo sirve a los administradores
para anticipar situaciones crticas. La prevencin de estas situaciones ayuda a que
los problemas no crezcan para que no afecten a los usuarios del sistema.

5.2 INSTALACIN DE SISTEMAS OPERATIVOS DISTRIBUIDOS


En este caso se instalara el sistema operativo distribuido Linux. Preparacin Primero
vamos a probar el sistema antes de instalarlo. Para ello, debemos tener un CD de
Ubuntu. Podemos hacerlo de varias maneras:
1.

Descargarlo

desde

la

pgina

web

oficial.

2. Pedirlo a travs de shipit (tarda de 4 a 6 semanas en llegar)

3. Obtener una copia a travs de un conocido. Independientemente del mtodo que


us, el disco que obtendr ser el mismo. Una vez que tengas el CD, debe
configurar la BIOS para que nos lea el CD antes de arrancar el disco duro.

Puedes comprobar si lo tienes correctamente configurado introduciendo el CD de


Ubuntu y reiniciando el sistema. Si carga el CD lo tienes bien, si no lo carga, debes
hacer lo siguiente. Nada ms encender el ordenador, aparece una pantalla negra
con letras. Debe ser algo parecido a esto: Veis que dice Press DEL to enter
SETUP? Eso significa que pulsando la tecla Suprimir entraremos a la configuracin.
Advierto que la tecla vara de unas BIOS a otras. Aqu es Suprimir pero podra ser
F2 o F12.

Todo es fijarse y pulsarla. Una vez hecho esto, aparecer una pantalla tpicamente
azul. Dentro de ella, debemos buscar algo as como Boot Order, y poner al lector de
CD el primero y al disco duro en segundo lugar. Si lo hemos hecho bien, deber
quedarse como en la imagen de abajo. Una vez ajustado este parmetro, buscamos
la tecla para salir de la BIOS guardando los cambios (Save and Exit setup suele
ser la frase asociada a tal tecla). Una vez guardemos los cambios el sistema se
reiniciar y debera cargar el CD del lector.

Si sigues teniendo problemas contacta con nosotros o pide ayuda en un foro


especializado. Una vez consiga cargar el CD, veremos el siguiente men: Debemos
seleccionar la opcin Probar Ubuntu sin alterar el equipo, puesto que es lo que
queremos. Tardar unos 5 minutos en arrancar. Una vez arranque, tendremos listo
el sistema para un primer uso. El primer contacto Al iniciar, tendremos una pantalla
parecida a esta.

Vemos 3 mens (Aplicaciones, Lugares y Sistema). Desde Aplicaciones podremos


acceder a los programas instalados en el sistema. En Lugares podremos encontrar
accesos a los directorios relevantes del sistema. Por ltimo, en el men sistema
podremos configurar aspectos de nuestro sistema (salvapantallas, temas, pantalla
de entrada, bluetooth,...)
Dado que estamos iniciando desde el CD, podemos tocar todo lo que queramos sin
que esto repercuta en nuestro sistema. As que lo mejor es comprobar que todo el
hardware o casi todo funiona. Por lo dems, simplemente podemos ver las
aplicaciones que vienen con el sistema y familiarizarnos un poco con l. Si
queremos instalar hacemos doble clic en el icono que hay en el escritorio.

Si no queremos instalarlo, pulsamos en el botn que hay en la parte superior


derecha, donde dice Live Session User, desde ah podremos apagar el sistema.
Instalando el sistema Para instalar el sistema, hacemos doble clic en el icono del
escritorio que dice instalar. Nos aparecer un asistente que nos guiar en toda la
instalacin. Aqu nos saltamos los primeros pasos porque son muy sencillos
(Idioma, distribucin del teclado y zona horaria). As pues, llegamos al paso del
particionado.

Lo ms fcil es usar una de las opciones prefijadas que nos da el instalador, ya que
nos evita este pas. De todas formas, si lo que queremos es algo personalizado,
debemos especificar las particiones manualmente. Debemos recordar que para

funcionar correctamente, Ubuntu necesita dos particiones: una ext3 (o ext4) y una
particin SWAP. Si elegimos un particionado personalizado crearlas es muy
sencillo. Debemos seleccionar un espacio en blanco y crear una particin con
formato ext3/ext4 y el tamao que nosotros elijamos. Adems, el punto de montaje
de esta particin debe ser / puesto que ser nuestra particin raz. Debe quedar
algo parecido a esto: Para la particin SWAP, debemos darle un tamao
aproximado de 1 GB.

Las particiones swap no tienen punto de montaje as que es mucho ms sencillo


crearlas. Una vez creada debe ser parecido a esto: Recordad que los tamaos de
las particiones (tanto la raz como SWAP se escriben MB. Para pasar a GB debis
dividir por 1024). Una vez tengamos el particionado completo pasamos a rellenar
los datos de usuario.
Si tenemos una particin con una versin de Windows, el instalador nos ofrecer la
opcin de utilizar los datos de esa cuenta para Ubuntu. Si es lo que quieres, marcas
las
casillas
correspondientes
y
listas.
Detallamos un poco como rellenar estos apartados. En el primero debemos poner
nuestro nombre. En el segundo, el nombre para iniciar sesin. Este nombre slo
puede contener minsculas. La contrasea es a vuestra eleccin. El nombre del
equipo es el nombre con el que otros usuarios vern al equipo en la red. Por ltimo,
podremos seleccionar si queremos que este usuario se identifique en el sistema
automticamente o por el contrario pida la contrasea. Esto ltimo es a nuestra
eleccin.

Una vez hayamos terminado de configurar todos los apartados, se nos mostrar un
resumen de todos los cambios que el instalador har en el sistema. Conviene
comprobarlos para ver si est todo correcto. Si lo est, pulsamos en Instalar y
comenzar la instalacin del sistema. Suele durar unos 15-20 minutos. Cuando
termine, nos mostrar una pantalla para, o bien continuar usando el sistema del CD,
o bien reiniciar y empezar a usar el nuevo sistema.

Si seguEs utilizando el CD, recordad que para salir debEs pulsar en el botn que
hay en la parte superior derecha. Al reiniciar, usaremos el sistema nuevo, con las
mismas caractersticas que el del CD, pero trabajando mucho ms rpido. Ahora
pasaremos a la correcta configuracin del sistema, que es otro aspecto importante
a tener en cuenta.

CONFIGURACION DE SOD
En este caso se configurara el sistema operativo LINUX. Primero debemos
identificarnos en el sistema (si elegimos en la instalacin que entrara
automticamente no ser necesario). Para configurar el sistema necesitaremos una
conexin a internet, as que lo primero que debes hacer es establecerla. Bien,
entraremos en el men Sistema, despus vamos a Administracin, y luego Soporte
de idiomas. Ahora pulsaremos en el botn "Instalar/eliminar idiomas...". Se nos
abrir una ventana, donde debemos marcar nuestro idioma nativo (Castellano,
espaol, ingls, etc.) y desmarcar los dems. Cuando terminemos pulsamos en
aplicar y llevar a cabo ciertas acciones. Nos pedir la contrasea de usuario. Se la
damos y listo.

Administracin y luego Orgenes del Software. Si nos pide la contrasea se la


introducimos. Aqu configuraremos dos pestaas: Software de Ubuntu, y
actualizaciones. Si disponemos de una conexin a internet permanente
desmarcaremos los CD-ROM de Ubuntu (abajo) y marcaremos las 4 primeras
casillas. En el servidor de descarga debe elegir, o bien el de nuestro pas (Espaa
en mi caso) o bien el servidor principal, que tambin suele ir rpido. En la parte de
actualizaciones marcaremos las dos primeras casillas (security y updates). La
tercera queda a vuestra eleccin, aunque mi experiencia personal es que no es muy
inestable.

Tambin marcaremos la casilla de comprobar actualizaciones diariamente. Con


esto ya tendremos configurados los repositorios. Ahora pasaremos a instalar el
driver de la tarjeta grfica. Si nuestra tarjeta grfica es nVidia o ATI, el propio sistema
nos mostrar un icono en la bandeja del sistema (parte superior derecha)
informndonos de que existen controladores para instalar. Si queremos instalarlos,
debemos ir al men Sistema, Administracin y luego Controladores de Hardware.
All marcaremos el driver para instalarlo. Ahora pasaremos a instalar el driver de la
tarjeta grfica. Si nuestra tarjeta grfica es nVidia o ATI, el propio sistema nos
mostrar un icono en la bandeja del sistema (parte superior derecha) informndonos
de que existen controladores para instalar. Si queremos instalarlos, debemos ir al
men Sistema, Administracin y luego Controladores de Hardware. All marcaremos
el driver para instalarlo.

CONTROL SOD
El Control de Sistemas e Informtica, consiste en examinar los recursos, las
operaciones, los beneficios y los gastos de las producciones (servicios y/o productos
de los Sistemas Informticos), de los Organismos sujetos a control, con la finalidad
de evaluar la eficacia y eficiencia Administrativa Tcnica y/u Operacional de los
Organismos, en concordancia con los principios, normas, tcnicas y procedimientos
normalmente aceptados. Asimismo de los Sistemas (Planes, Programas y
Presupuestos, Diseo, Software, Hardware, Seguridad, Respaldos y otros)
adoptados por la Organizacin para su dinmica de Gestin en salvaguarda de los
Recursos del Estado.

Existe otra definicin sobre el "control tcnico" en materia de Sistemas e Informtica,


y esta se orienta a la revisin del Diseo de los Planes, Diseos de los Sistemas, la
demostracin de su eficacia, la Supervisin compulsa de rendimientos,
Productividad de la Gestin - Demanda llamada "Pruebas intermedias", el anlisis
de resultados, niveles y medios de seguridad, respaldo, y el almacenamiento. As
mismo medicin de la vida til del Sistema Informtico adoptado por la Organizacin
bajo control.

5.3
ESTNDARES
DISTRIBUIDOS

ADMINISTRACIN

EN

SISTEMAS

El establecimiento de estndares

Aquellas normas usuales, los propsitos, los objetivos, a alcanzar, los datos de
carcter histrico las directrices que guan las actividades, las predicciones sobre el
volumen de estas, las metas a alcanzar y aquellos ndices que integran los planes ,
y todo dato o cifra que pueda emplearse como medida para cumplirlas, son
considerados como estndares.

Estas medidas son indispensables para el control, ya que indican la manera en que
deseas que se ejecute una actividad. En la prctica, son los objetivos declarados y
definidos de la organizacin y por esa razn los estndares deben abarcar las
funciones bsicas y reas clave de los resultados logrados.

Para construir los estacares, debe partirse del anlisis de procesos, como las
normas de trabajo o de costos y la recopilacin de experiencias anteriores.

Estndares estadsticos o histricos: parten del anlisis de datos de experiencias


logradas, que muchas veces son complementadas con el criterio personal.

Los estndares elaborados tcnicamente se fundamentan en el estudio objetivo y


cuantitativo de una situacin de trabajo especfica.

Los estndares puedes ser fsicos, intangibles, de costos, de inversin, de recursos


o medios de produccin, de ingresos o de resultados, y expresarse
cuantitativamente, en unidades numricas, de uno u otro tipo (moneda, volumen,
capacidad), o cualitativos, cuando se establecen subjetivamente y lo que se mide y
evala se refiere a cierta calidad (impacto en el mercado, nombre de la empresa,
precio en la competencia).

Los estndares pueden representar calidad, mediante ndices o calificaciones


convencionales o por medio de coeficientes.
Tendencias de Investigacin Sistemas Distribuidos

Hoy en da, y gracias a la tecnologa, "el termino centralizado" est desapareciendo,


con la llegada de la redes de ordenadores podemos compartir recursos sin
preocuparnos de la ubicacin geogrfica de la otra persona, podemos manejar
ordenadores como si estuvisemos trabajando fsicamente en ellos, adems de
transmitir informacin o escribir cartas que llegan al receptor en lapsos de tiempo
mnimos.

Por ellos existen dos arquitecturas que resuelven dichos problemas Arquitectura
SMP (Uma) Arquitectura DSM (Numa.) Arquitectura SMP (Uma) Los
multiprocesadores simtricos (Symmetric Multiprocessor): son ordenadores con
arquitectura de memoria compartida que presentan en la memoria principal un
acceso simtrico desde cualquier procesador, es decir, el retardo en el acceso a
cualquier posicin de memoria es el mismo con independencia del procesador
desde el que se realice la operacin o tarea, dicha arquitectura es denominada
como "Acceso Uniforma a Memoria" (UMA) y se lleva a cabo con una memoria
compartida pero centralizada. Estos multiprocesadores dominan el volumen como
el capital invertido.

Arquitectura DSM (Numa).

Esta arquitectura de memoria que se genera en retardo de acceso dependiente


tanto la posicin de memoria como el procesador se denomina Acceso No Uniforme
a Memoria (NUMA), hace su aparicin cuando la memoria compartida est
distribuida entre los nodos. De esta manera, se mejora el retardo medio de acceso
a memoria, ya que en cada ordenador los accesos a posiciones de su memoria local
presentan un retardo sensiblemente inferior al caso en que es accedido a posiciones
de memoria en otros ordenadores. Esta clase de ordenadores con arquitectura
NUMA presentas escalabilidad. Propone un espacio de direcciones de memoria
virtual que integre la memoria de todas las computadoras del sistema, y su uso
mediante paginacin.

Las pginas quedan restringidas a estar necesariamente en un nico ordenador.


Cuando un programa intenta acceder a una posicin virtual de memoria, se
comprueba si esa pgina se encuentra de forma local. Si no se encuentra, se
provoca un fallo de pgina, y el sistema operativo solicita la pgina al resto de
computadoras. El sistema funciona de forma anloga al sistema de memoria virtual
tradicional, pero en este caso los fallos de pgina se propagan al resto de
ordenadores, hasta que la peticin llega al ordenador que tiene la pgina virtual
solicitada en su memoria local. A primera vista este sistema parece ms eficiente
que el acceso a la memoria virtual en disco, pero en la realidad ha mostrado ser un
sistema demasiado lento en ciertas aplicaciones, ya que provoca un trfico de
pginas excesivo.

Sistema realmente distribuido.- El objetivo es crear la ilusin en la mente de los


usuarios de que toda la red es un solo sistema de tiempo compartido.
Caractersticas: Debe existir un Mecanismo de comunicacin global entre los
procesos (cualquiera puede hablar con cualquiera). No tiene que haber distintos
mecanismos en distintas mquinas o distintos mecanismos para la comunicacin
local o la comunicacin remota. Debe existir un esquema global de proteccin. La
administracin de procesos debe ser la misma en todas partes (crear, destruir,
iniciar, detener). Debe existir un sistema global de archivos y debe tener la misma
apariencia en todas partes.

El rasgo clave es que existe una sola cola para una lista en el sistema, de los
procesos que no se encuentran bloqueados y que estn listos para su ejecucin.
Dicha cola de ejecucin de procesos se encuentra almacenada en la memoria
compartida. Cuando los procesos que se encuentran en la cola listos para su
ejecucin son asignados a los procesadores de la siguiente manera: 1.- Encuentra
que el cache del procesador esta ocupad, por palabras de memoria compartida que
contiene al programa del proceso anterior. 2.- Despus de un pequeo intervalo de
tiempo, se remplazara por el cdigo y los datos del programa del proceso que le ha
sido asignado a dicho procesado

5.4 Y 5.5 SISTEMAS DISTRIBUIDOS DE ALTO RENDIMIENTO A


BAJO COSTO (CLUSTERING) EN SISTEMAS OPERATIVOS DE
LIBRE DISTRIBUCIN
El cmputo con Clster surge como resultado de la convergencia de varias
tendencias actuales que incluyen la disponibilidad de microprocesadores
econmicos de alto rendimiento y redes de alta velocidad, el desarrollo de
herramientas de software para cmputo distribuido de alto rendimiento, as como la
creciente necesidad de potencia computacional para aplicaciones que la requieran.

El Clster es un grupo de computadoras unidas mediante una red de alta velocidad,


de tal forma que trabajan como una nica computadora, ms potente.

En la actualidad, es factible disponer de alta capacidad computacional, incluso


equivalente a la encontrada en las poderosas y costosas supercomputadoras
clsicas, mediante clusters de computadoras PC independientes, de bajo costo,
interconectadas con tecnologas de red de alta velocidad, y empleando software de
libre distribucin. El clster puede trabajar de forma coordinada para dar la ilusin
de un nico sistema. Ms adelante revisaremos las ideas bsicas sobre diseo,
construccin y operacin de clusters, presentando aspectos relacionados al
software y al hardware.

MOSIX
Es un paquete de software que mejora el kernel de Linux con capacidades de
computacin de clusters. El kernel mejorado permite a cualquier cluster de
estaciones de trabajo y servidores X86/Pentium/AMD trabajar coordinadamente
como parte de un slo sistema.
MOSIX es una extensin del kernel de Linux que permite ejecutar aplicaciones
normales (no paralelizadas) en un Clster. Una de las posibilidades de MOSIX es
la migracin de procesos, que permite migrar procesos de nodo en nodo. Si por
ejemplo, cierto proceso est dominando la carga de un nodo, este ser movido a
otro que tiene ms recursos. Una de las caractersticas de MOSIX es que, a
diferencia de otros clusters, no es necesario modificar las aplicaciones ni tampoco
utilizar libreras especiales. De hecho, tampoco es necesario asignar a mano los
procesos a los diferentes nodos que componen el cluster. La idea es que despus
de la creacin de un nuevo proceso (fork), MOSIX intenta asignarlo al mejor nodo
disponible en ese entonces. MOSIX monitorea constantemente los procesos, y si
fuera necesario, migrar un proceso entre los nodos para maximizar el rendimiento
promedio. MOSIX realiza todo esto automticamente, bajo el concepto de fork and

forget al igual que en un sistema SMP (Multiprocesamiento Simtrico). Esto


significa que slo algunas aplicaciones se beneficiarn de un cluster MOSIX,
bsicamente:

Procesos que requieren de mucho CPU, aplicaciones cientficas, de ingeniera,


etc.

Procesos paralelos, especialmente los que tienen tiempos de ejecucin


impredecibles.

Clusters con nodos de diferentes velocidades y/o distintas cantidades de memoria.

Entornos multiusuario y de tiempo compartido.

Servidores WEB escalables.

MOSIX funciona silenciosamente. Sus operaciones son transparentes para las


aplicaciones. Los usuarios no necesitan saber dnde se estn ejecutando los
procesos, tampoco necesitan preocuparse de lo que estn haciendo otros usuarios.
Como MOSIX est implementado en el kernel de Linux, sus operaciones son
totalmente transparentes para las aplicaciones. Esto permite definir distintos tipos
de clusters, incluso un cluster con diferentes CPUs o velocidades LAN.

KNOPPIX
Es una distribucin de GNU/Linux. Est desarrollada por el consultor de GNU/Linux
Klaus Knopper.
Existen varias distribuciones derivadas de Knoppix, el producto bsico es un Live
CD comprimido que se infla en un kernel de 1.6 GB, y un Live DVD de 4.7 GB;
tambin se puede cargar via USB o flash card. Basado en DEBIAN, KNOPPIX
puede ser usado como tutorial de Linux, pero tambin puede correr software
propietario con ciertas condiciones.

Entre otras caractersticas, puede usarse como plataforma de rescate de datos de


discos y particiones inaccesibles o daadas.

Otros paquetes que incluye son: LXDE, un entorno de escritorio ligero tipo X11, o
bien el KDE 3, una versin mejorada del escritorio. reproductor MP, software de
acceso a Internet con KPPP y el ISDN, navegador Iceweasel Firefox, cliente e-mail
Icedove Firefox Thunderbird, procesador de imgenes GIMP, Libre Office, y
herramientas para recuperacin de datos y reparacin de sistema, monitorea y
anlisis de la red y una suite extensa de terminal de servidor.

Cluster Knoppix es una distribucin basada en Knoppix y que utiliza Linux Terminal
Server Project y OpenMosix. Es una va conveniente para probar configuraciones
en cluster.

Knoppix se puede usar para demostrar de manera sencilla el sistema GNU/Linux,


especialmente como sistema operativo; para verificar la compatibilidad de hardware
con Linux (especialmente para tarjeta de vdeo), o para restaurar un sistema
corrupto o datos perdidos.

Gracias a su rapidez, portabilidad, las herramientas que incluye y el amplio soporte


para la mayora de dispositivos que ofrece; puede usarse en muchos mbitos.
Knoppix funciona a la perfeccin como sistema de rescate y reparacin de errores,
como CD educacional, sistema comercial o sistema de uso personal, y debido a sus
capacidades de descompresin sobre la marcha puede albergar hasta 2 GB de
software instalado en el CD, u 8 GB en el DVD.

Tradicionalmente la computacin por clusters slo se poda implementar


estableciendo llaves RSH (Remote Shell), creando NFS compartidos, (Sistemas de
Archivos en Red), editando archivos de configuracin de hosts, estableciendo
direcciones IP estticas, y aplicando manualmente los parches al Kernel.
ClusterKnoppix nos salva de hacer todo este trabajo. La distribucin contiene un
sistema de autoconfiguracin donde las nuevas mquinas que ingresan al cluster
acceden automticamente por medio de la red.

HPCC (High-Performance Computing Cluster), tambin se le conoce como DAS


(Data Analytics Supercomputer), es una plataforma de procesamiento de datos a
gran escala, de libre distribucin desarrollada por LexisNexis Risk Solutions. La
plataforma HPCC incorpora una arquitectura de software implementada en
commodity computing que es una forma de hacer clusters con mquinas baratas,
para obtener procesamiento paralelo de alto rendimiento para aplicaciones que
usan grandes volmenes de datos. La plataforma HPCC incluye configuraciones del
sistema para soportar procesamiento por lotes y procesamiento paralelo, y
aplicaciones de consulta de alto desempeo que usan archivos de datos indexados.
La plataforma HPCC tambin incluye un lenguaje de programacin declarativo
orientado a los datos para procesamiento paralelo llamado ECL.

BEOWULF El nombre se refiere a una computadora especfica llamada as y


construida en 1994 por Thomas Stirling y Donald Becker en la NASA. El nombre
Beowulf proviene del poema pico clsico de la literatura Inglesa Beowulf. Es un
cluster de computadoras de bajo costo, normalmente idnticas que estn
conectadas en una pequea LAN, con libreras y programas instalados que permiten
que el procesamiento se reparta entre ellos. El resultado es una computadora de
procesamiento paralelo con hardware barato.

El autor compara el trabajo del cluster con la frase del poema "thirty men's heft of
grasp in the gripe of his hand".

Beowulf es cluster normalmente basado en UNIX, como BSD, Linux o Solaris; se


construye con software gratuito y de libre distribucin. Comnmente utilizan libreras
de Procesamiento Paralelo como MPI (Message Passing Interface) y PVMI (Parallel
Virtual Machine). Ambas permiten al programador dividir una tarea entre un grupo
de computadoras en red, y colectar los resultados del procesamiento. Ejemplos de
software MPI son OpenMPI y MPICH, as como versiones adicionales del MPI.

Los sistemas Beowulf se usan en todo el mundo en todo el mundo sobre todo en el
rea de la Computacin Cientfica.

APACHE HADOOP
Es un producto de libre distribucin de Apache Software Foundation, para
procesado y almacenamiento de conjuntos de datos a gran escala en Clusters de
hardware de bajo costo. Se supon que es uno delos proyectos lderes de Apache y
es usado por una comunidad importante de desarrolladores y usuarios.
Con licencia de Apache 2.0 Hadoop consta de los siguientes mdulos:
Hadoop Common: Contiene libreras y utileras para los mdulos eternos.
Hadoop Distributed File System (HDFS):- Un sistema de archivos distribuido que
almacena datos en las mquinas PC, porporcionando un muy alto ancho de banda
para almacenamiento en el clster.
Hadoop YARN: Una plataforma de administracin de recursos informticos en
clusters, que tmbien hace las funciones de planificador de aplicaciones de usuario.
Hadoop MapReduce: Un modelo de programacin para procesamiento de datos a
gran escala.
Todos los modulos de Hadoop estn diseados bajo la filosofa de de que las fallas
enel hardware (de maquinas individuales o racks de ellas) son comunes y por ende
deben ser tratados de forma automtica en el software por el entorno operativo. El
MapReduce de Hadoops y sus componentes del (HDFS) Hadoops File System,
derivan originalmente de Google's MapReduce y se basan en artculos sobre
Google File System (GFS). Mas all de HDFS, YARN y MapReduce, la plataforma
Hadoop en total es considerada como un conjunto de pryectos relacionados, como
Apache Pig, Apache Hive, Apache HBase y otros.

Para el usuario final, el cdigo Java es una eleccin natural a travs de MapReduce,
pero cualquier lenguaje de programacin puede ser usado con Hadoop Streaming
para implementar el "mapa" y "reducir" piezas del programa del usuario. El entorno
Hadoop es por s mismo cdigo Java con un poco de Lenguaje C nativo, utileras
dela lnea de comandos y scripts del shell.

La especificaciones y la potencia de los Sistemas Oerativos distribuidos vistos


difieren en su implementacin, pero son en esencia soluciones a gran escala para
resolver los problemas comunes que atiende el Sistema Operativo; el clster es en

este sentido una especificacin muy clara y podramos estudiar ms productos para
encontrar piezas grandes complejas pero con fines similares, ya que una cualidad
especial de estas plataformas es la bsqueda de la sencillez, la ejecucin ligera y
el ahorro de recursos informticos para los usuarios, no para el gestor del cluster.
Las tareas de administracin son esencialmente las mismas, memoria, procesos,
tiempo de procesador, entrada-salida, seguridad y Sistema de Archivos; ahora con
la responsabilidad en un ambiente compartido.

Ms all del conocimiento tradicional sobre clusters,la carrera tecnolgica sigue


avanzando. Descifrar el genoma humano y en general otros genomas es el ejemplo
clasico de tareas computacionales titnicas para las cuales se tienen potentes
sistemas trabajando 24 horas al da. Podemos por ejemplo conectarnos a alguno
de los clusters para usarlos. Esto nos da una idea de la nueva forma de trabajar en
entornos de alta disponibilidad de recursos informticos y su aplicacin.

5.6 TENDENCIAS DE INVESTIGACIN

Tendencias de investigacin
Una tendencia importante y primordial para los sistemas distribuidos es como su
nombre lo indica; distribuir la labor o procesos de cmputo entre varios
procesadores.
A diferencia de los sistemas fuertemente acoplados, los procesos no comparten la
memoria o el reloj. Los procesadores se comunican entre si a travs de diversas
lneas de comunicacin como buses de alta velocidad o lneas telefnicas
Los procesadores de estos sistemas pueden tener diferentes tamaos y funciones
que pueden incluir microprocesadores pequeos, estaciones de trabajo,
minicomputadoras y sistemas de computador de propsito general o distribuido.

Las principales razones para construir sistemas distribuidos son:

Computacin ms rpida: un clculo dado o un proceso de mayor tamao se puede


subdividir en los distintos nodos de un sistema distribuido ejecutndolo de forma
concurrente y agilizando dicho proceso.
Confiabilidad: si un nodo que forma parte de un sistema distribuido falla, los nodos
restantes pueden seguir funcionando.

Comunicacin: hay muchos casos en los que los programas necesitan intercambiar
datos con otros programas del mismo sistema lo cual resulta ms rpido si los nodos
estn conectados a travs de una red de comunicaciones, as los procesos de
diferentes sitios tienen la oportunidad de intercambiar informacin

Tendencias para la explotacin y administracin de sistemas de informacin que se


estn implantando actualmente y las que se esperan en los prximos aos.

Nuevos requerimientos a los sistemas informticos


Extensin completa a las intranets y extranet
Criticidad de servicios considerados de baja prioridad
Incremento de los servicios sensibles a la seguridad
Crecimiento de los servicios mviles y ubicuos
Sistemas de procesamiento y almacenamiento en red
Crecimiento de las herramientas y soluciones de gestin de aplicaciones
Utilizacin de la gestin basada en web
Gestin y administracin de los flujos de trabajo (workflow).

As mismo medida que se desarrollan las maneras de gestionar una organizacin,


aparecen nuevos requerimientos de los sistemas de informacin que la soportan.
Especialmente con la explosin de Internet, los modelos ya adelantados de
empresas perfectamente integradas en el funcionamiento interno, su backoffice,
muchas de stas con plataformas corporativas consolidadas, dan paso a una
potenciacin del frontal de negocio, el frontoffice. Este paso les permitir entrar en
el nuevo rol del comercio electrnico y las transacciones comerciales ubicuas, en
cualquier lugar y en cualquier momento.

5.7 SISTEMAS DISTRIBUIDOS COMO INFRAESTRUCTURA PARA


EL SOPORTE DE LAS EMPRESAS EN LAS TI
Este rea tecnolgica persigue el anlisis, modelado, desarrollo, validacin,
verificacin y evaluacin del rendimiento de sistemas formados por agentes
software distribuidos lgica o fsicamente sobre una red de computadores.

En los ltimos aos, la importancia de las aplicaciones distribuidas y los servicios


en red ha adquirido una importancia creciente hasta el punto que hoy en da no se
entiende una aplicacin como un ente aislado del resto del mundo. La concurrencia
inherente a este tipo de sistemas complica su desarrollo y correccin.

La necesidad de abordar dos retos contrapuestos (a) mejora de la calidad en el


software, en trminos de disponibilidad y rendimiento y (b) reduccin de costes
durante todo el ciclo de vida del desarrollo (hacer ms barato el software fiable y
ms fiable el software barato) y, en particular, la reduccin del time-to-market de los
nuevos servicios en red, motiva el esfuerzo en I+D para conseguir mtodos, tcnicas
y herramientas que posibiliten superar estos retos.

Uno de los objetivos de la industria de las telecomunicaciones es el despliegue de


redes orientadas a servicios que alcancen un nivel de disponibilidad de 5 nueves
(99,999%), pero el desarrollo y posterior validacin de estos complejos sistemas
concurrentes y distribuidos es extremadamente difcil y costosa.

Entre las lneas diferenciadoras dentro del rea tecnolgica se incluye:

(1) empleo del paradigma funcional distribuido para la construccin de modelos


ejecutables y para la implementacin ltima de servicios con alta disponibilidad.

(2) identificacin de patrones de diseo y componente reutilizables para uniformizar


soluciones a problemas recurrentes en las distintas fases del desarrollo.

(3) utilizacin de mtodos formales de forma pragmtica dentro del ciclo de vida del
software, por ejemplo para validar de forma automtica o certificar el

comportamiento del sistema basado en propiedades especificadas formalmente


sobre el mismo.

El rea tecnolgica se interesa tanto en los modelos fsicos y arquitecturas que


soportan estos sistemas concurrentes y distribuidos (red de ordenadores, cluster de
ordenadores, sistemas multincleo, etc.) as como distintos modelos lgicos para
definir arquitecturas orientadas a servicios (cliente/servidor, P2P, cloud computing,
etc.).

Você também pode gostar