Você está na página 1de 20

Big Data

Curso Electivo Diurno


Agenda

● Programa del curso ( Actualización)


● Normas del curso
● Lista de alumnos
● Unidad 1: Big Data, un nuevo paradigma.
● Ejercicio: Escalabilidad.
Programa del curso

Unidades:

1. Big Data, un nuevo paradigma


2. Arquitectura Lambda : Introducción
3. Arquitectura Lambda : Batch Layer
4. Arquitectura Lambda : Serving Layer
5. Arquitectura Lambda : Speed Layer
6. Procesamiento en tiempo real
7. Análisis en tiempo real
Metodología
Evaluaciones semana a semana:

1. Controles programados sobre lectura, de forma individual y/o en


pareja.
2. Ejercicios en clase
3. Presentaciones complementarias al programa.

Asistencia: 80 %

* Número de alumnos total definirá si las presentacione son en pareja o


individuales.
Big Data, un nuevo paradigma

Definición:

● “extremely large data sets that may be


analysed computationally to reveal patterns,
trends, and associations, especially relating to
human behaviour and interactions.”
● “Cuando el tamaño de los datos es parte del
problema”
● “Cuando una de las 3 `V`está presente:
Variedad, Velocidad y Volumen”
Motivación: Poder de Cómputo y
limitantes.

Ley de Moore: “El poder de cómputo


se duplicará cada 2 años”

- Fundado de intel
- Limitante: Pero no se puede
duplicar eternamente un
componente mientras al mismo
tiempo se reduce el tamaño de
su contenedor.
Motivación: Volúmenes Datos para los
próximos años
Motivación: Evolución computacional
Virtualización, un uso eficiente de los
recursos

En grandes servidores se produce una sub-utilización de los recursos, en el cual en el mejor


de los casos la CPU se utilizaba al 60%.

Como mejora a esto nace la virtualización.


Cloud Computing: Introducción

Definición Comercial:

- Servicios computacionales de almacenamiento, red y procesamiento disponible para su


uso bajo demanda y que puede escalar elásticamente en respuesta a las necesidades
de una solución..

Principales Características:

● Creación automatizada de ambientes.


● Escalabilidad elástica.
● Utilización de virtualización
● Facturar por utilización
Cloud Computing: Escalabilidad

Tipos de Escalabilidad:

Vertical: Crecer en hardware en alguno de los nodos.

Ventajas:

● Sin cambio para las aplicaciones


● Fácil de implementar.

Desventajas:

● Limitado por hardware


● Unico punto de falla
● Sin alta disponibilidad
Cloud Computing: Escalabilidad
Tipos de Escalabilidad:

Horizontal: Varios nodos trabajando como un todo, un cluster.

Ventajas:

● Crecimiento no limitado ( En teoría)


● Tolerancia a fallas
● Balanceo de Cargas
● Alta disponibilidad

Desventajas:

● Alto costo en mantención


● Alto costo en infraestructura
● Rediseño de aplicaciones
Cloud Computing: Tipos de cloud.
Cloud Computing: Patrones de
escalabilidad

Ejercicio:

● En qué aplicaciones se podría utilizar.


● Ventajas.
● Puntos de falla.
Patron 1: Load Balancer
Patron 2: Scatter and Gather
Patron 3: Result Cache
Patron 4: Pipe and Filter
Patron 5: Map-Reduce
Patron 6: Execution Orchestrator

Você também pode gostar