Você está na página 1de 32

Lourdes Hernández

Vozmediano

Big Data #1
M1 Datawarehousing y Big Data
Nombre del Máster

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
www.madridschoolofmarketing.es 1  
Agenda  

1.  Introducción  
2.  Qué  es  Big  Data  
3.  Usos  e  implicaciones  
4.  Caso  prácDco  1:  
Paco  Barranco    
BBVA  |  Innovación  y  Tecnología  
IT  Risk,  Fraud  &  Security  |  SNS  (Social  Networks  Security)    
“Presencia  y  escucha  acDva  en  las  redes  sociales  y  el  entorno  digital”  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 2  
1.  Introducción  

•  Think  Big  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 3  
1.  Introducción  

•  ExpectaDvas  del  módulo  


–  ObjeDvos  
–  Organización  de  las  sesiones  
–  Evaluación  de  la  consecución  de  los  objeDvos  
•  Contenido  propuesto  
•  Criterios  de  evaluación  del  módulo  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 4  
1.  Introducción  

•  ExpectaDvas  del  módulo  


•  ObjeDvos  
•  Organización  de  las  sesiones  
•  Evaluación  de  la  consecución  de  los  objeDvos  

Interrupciones, comentarios, aportaciones,


consultas… durante las clases, serán
bienvenidas!

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 5  
1.  Introducción.  Contenido  propuesto  

•  Contenido  propuesto  
–   Qué  es  Big  Data  
–  Usos  e  implicaciones  en  las  compañías  
–  Arquitectura  Big  Data:    Hadoop  
–  Principales  soluciones  tecnológicas  
–  Tendencias  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 6  
1.  Introducción.  Criterios  de  evaluación  

1.  Test  sencillo  de  conocimientos  básicos  (10%  nota).  


Mandatorio  obtener  una  puntuación  +6.    
2.  Desarrollo  del  caso  de  Big  Data  (50%).  En  grupo,  
debe  contener:  
Sesión 1
–  Idea  de  negocio  con  Big  Data,  qué  mejoras  se  obDenen  y  
qué  cambios  conlleva  el  proyecto  
Sesión 2
–  IdenDficación  de  datos  y  transformación  de  los  mismos  en  
conocimiento  
Sesión 3
–  definición  de  la  arquitectura  que  soporte  el  proyecto  
–  organización  del  equipo  de  trabajo  
M1 Datawarehousing y Big Data
Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 7  
1.  Introducción.  Criterios  de  evaluación  

3.  Elevator  pitch  individual  (40%)  del  caso  del  grupo:  


“Elevator  pitch:  condensar  un  mensaje  que  llame  la  atención  
de  alguien  en  pocos  segundos  o  minutos”  
                 Debe  contener:  
-­‐  Lo  más  emocionante  de  la  idea  
-­‐  Valor  del  proyecto  para  el  cliente  
-­‐  Mostrar  problema  -­‐>  acción  -­‐>  resultado  
-­‐  Qué  es  diferente  
4.  (Opcional)  Desarrollo  de  algún  caso,  idea,  proyecto  
relacionado  con  Big  Data.    

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 8  
Agenda  

1.  Introducción  
2.  Qué  es  Big  Data  
3.  Usos  e  implicaciones  
4.  Caso  prácDco  1  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 9  
2.  Qué  es  big  data  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 10  
2.  Qué  es  big  data.  El  camino  hasta  Big  Data  

§  +20  años  de  historia  y  evolución  del  Data  Warehouse:  


§  Hemos  pasado  de  (1.992)  …  :  
–  Las  grandes  preguntas  sobre:    
•  Modelización:  estrellas,  snowflake,  …  
•  Arquitectura:  S.A.,  ODS,  DDS,  OLAP,  …  
–  El  debate  de  si  Data  Marts  o  Data  Warehouse  
–  Refrescos/granularidad  de  datos  mensuales  
–  Histórico  de  3  años  …  
–  ETL´s  en  C  y  Shell  Unix  
–  Herramientas    Cliente/Servidor  –  DOS  
–  Explotación  del  DW  con  reporDng/papel  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
2.  Qué  es  big  data.  El  camino  hasta  Big  Data  

§  …  a  la  situación  actual  en  DW  (datos  estructurados)  :  


–  Explosión  de  datos  estructurados  
•  Máxima  granularidad      
•  Más  latencia  (near  real-­‐Dme)  
–  Más  análisis  (potencia  ,  flexibilidad,  rapidez.…)    
–  Más  Usuarios  /  perfiles  de  Usuario  
–  Mayor  Concurrencia  y  Disponibilidad  
–  DisposiDvos  móviles  
–  …  
–  Modelo  Servicio  (Cloud)  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
2.  Qué  es  big  data.  El  camino  hasta  Big  Data  
§  Hoy  existen  soluciones  para  todos  los  retos  que  nos  
plantean  los  datos  estructurados:  
–  Procesamiento  de  datos  extremo  
–  Análisis  a  la  velocidad  del  pensamiento  
–  Decisiones  en  Tiempo  Real    
–  Disponibilidad,  seguridad  de  los  datos  
–  Trazabilidad  del  dato  
–  …  
§  Pero  además,  algunas  de  las  técnicas  Big  Data  de  hoy,  nos  
abren  nuevas  oportunidades:  música,  vídeos,  texto  libre,  
acciones  aleatorias…  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
2.  Qué  es  big  data.  El  camino  hasta  Big  Data  
§  Todos  los  datos  estructurados  que  
conocíamos  y  analizábamos  (hasta  
hace  XXX  años)  representan          

<  10%  
de  los  datos  disponibles  
 
§  Datos  estructurados  (sistemas    
legacy,  ERPs,  CRMs,  DW,  XLS,  CSV,  
M1 Datawarehousing y Big Data
…)  
Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
 
2.  Qué  es  big  data.  El  camino  hasta  Big  Data  

§  Datos estructurados (sistemas


legacy, ERPs, CRMs, DW, XLS, CSV, …)

§  Datos NO estructurados:

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
2.  Qué  es  big  data.  CaracterísDcas  

“Entre  el  nacimiento  del  mundo  y  el  año  2003,  


hubo  cinco  exabytes  de  información  creada.    
Actualmente  creamos  cinco  exabytes  cada  dos  
días“.  
 Eric  Schmidt  (ex  CEO  de  Google)      
   
 
 
 

Social  
 
Social      

BLOG  
BLOG   $
Smart
Metering

VOLUMEN VELOCIDAD VARIEDAD VALOR


M1 Datawarehousing y Big Data
Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
2.  Qué  es  big  data.  Volumen  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
2.  Qué  es  big  data.  Valor  

“Data Driven companies”

•  Conocimiento  
Bussines
Intelligence
•  Información    

Bussines
•  Dato   Operation

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 18  
2.  Qué  es  big  data.  Velocidad.  PrácDca  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 19  
2.  Qué  es  big  data  Open  Data,  Big  Data,  Data  
Mining…  
“Open  data”:  todos  aquellos  datos  suscepDbles  de  ser  uDlizados  
libremente,  reuDlizados  y  redistribuidos  por  cualquier  persona  
–  Disponibilidad  y  acceso  
–  ReuDlización  y  redistribución  en  condiciones    
–  ParDcipación  universal  
“Big  data”:  grandes  conjuntos  de  datos  que  tengan  algún  valor  
para  las  empresas.  Los  más  conocidos  están  relacionados  con  el  
análisis  de  datos  de  Facebook,  Twiver  y  Google.  
“Data  Mining”:  proceso  que  intenta  descubrir  patrones  en  
grandes  volúmenes  de  conjuntos  de  datos.  UDliza  los  métodos  de  
la  inteligencia  arDficial,  aprendizaje  automáDco,  estadísitca  y  
sistema  de  bases  de  datos.  
M1 Datawarehousing y Big Data
Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 20  
2.  Data  ScienDst  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 21  
Agenda  

1.  Introducción  
2.  Qué  es  Big  Data  
3.  Usos  e  implicaciones  
4.  Caso  prácDco  1  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 22  
3.  Usos  e  implicaciones.  ObjeDvos  

•  Reducción  de  costes  tecnológicos  


•  Reducción  de  Dempo  
•  Desarrollo  de  nuevas  offerings  basadas  en  Big  Data  
•  Apoyo  a  la  toma  de  decisiones  internas  
•  …  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
3.  Usos  e  implicaciones.  Algunas  uDlidades  

•  Creación  de  transparencia  


•  Fomentar  la  experimentación  para  descubrir  
necesidades  exposición  a  la  variabilidad  y  mejora  del  
rendimiento  
•  Segmentación  de  clientes  objeDvo  para  personalizar  
las  acciones  
•  Apoyo  a  la  toma  de  decisiones  con  algoritmos  
automaDzados  
•  Modelos  innovadores  de  negocio,  productos  y  
servicios  
M1 Datawarehousing y Big Data
Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
3.  Usos  e  implicaciones.  Algunas  uDlidades  

•  Análisis  del  senDmiento  y  la  experiencia  del  cliente  a  


través  de  todos  los  canales  
•  Detección  de  condiciones  que  amenazan  la  vida  en  los  
hospitales  a  Dempo  de  intervenir  
•  Predicción  de  patrones  climatológicos  para  
planificación  ópDma  de  la  producción  y  consumo  
energéDco  
•  IdenDficación  de  criminales  y  amenazas  desde  audio,  
video  y  datos  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
3.  Usos  e  implicaciones.  Amanecer  

•  Predecir  el  éxito  (o  el  fracaso)  de  Amanecer  2  

–  Película  de  referencia  en  Navidad,  compiDendo  con  Sky  Fall,  The  Man  
with  the  Iron  Fists,  Flight  y  Rompe  Ralph  
–  Analizaron  de  5  Mio  de  Tweets  con  IBM  Social  Sen8ment  Index,  los  días  
previos  al  estreno  
–  Amanecer  generó  mayor  volumen  de  Tweets  respecto  a  su  compeDdora  
principal  Sky  Fall  
–  El  día  del  prelanzamiento  pasó  del  90%    al  75%.  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 26  
3.  Usos  e  implicaciones.  Obama  

•  Campaña  electora  Obama  


Tres  días  antes  de  las  votaciones,  cuando  todos  los  sondeos  auguraban  
un  empate  absoluto  entre  los  dos  candidatos,  Obama  padecía  el  índice  
de  popularidad  más  bajo  en  campaña  de  cualquier  presidente  desde  
1980    
En  la  noche  del  escruDnio,  todos  los  “estados  bisagra”  cayeron  en  el  
campo  de  Obama.  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 27  
3.  Usos  e  implicaciones.  Obama  

•  Qué  hicieron  
1.  Unificación  de  todas  las  bases  de  datos  (lista  de  donantes,  encuestas,  
voluntarios  de  los  estados,  ficheros  del  parDdo  demócrata).  
2.   Recopilación  de  información  de  las  redes  sociales  y…  electorales  
indecisos  en  cada  estado  basculante  
3.  Cruza,  compara,  verifica  y  corrige  hasta  el  úlDmo  detalle  personal  de  
cada  potencial  votante  
4.  Acciones  personalizadas  
5.  Aprendizaje  y  corrección  de  acciones  
 
 

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 28  
3.  Usos  e  implicaciones.  Obama  

•  Cómo  lo  hicieron  


–  hacer  palanca  sobre  la  nueva  realidad  demográfica  de  EEUU  
–  18  meses  recopilación  y  unificación  de  todas  las  bases  de  datos:    
•  Factores  básicos:  edad,  sexo,  raza,  zona  de  residencia,  nivel  de  ingreso,  inclinaciones  
políDcas,  historial  de  parDcipación  electoral  
•  Factores  decisorios:  perfiles  de  consumo,  aficiones,  preferencias,  círculo  de  amigos  
–  elaboración  de  herramientas:  Quick  Donate,  app  con  mensajes  de  
Obama,  
–  66.000  simulaciones  digitales  completas  de  la  jornada  electoral  /  noche  
–  Mensajes  masivos  (Facebok,  Reddit)  +  mensajes  personalizados  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano
3.  Usos  e  implicaciones.  Obama  

•  Cómo  lo  hicieron  


 
  OHIO  
• 29.000  indecisos  
• Evento  que  cambia  la  intención  de   COSTA  ESTE:  
• Mujeres  
voto:  debate  (perdido  por  Obama).  
• Gustos:  Serie  
• Resultado  final:  50,1%  
Sexo  en  NY  
• Acción:  
reunión  en  el  
apartamento  
de  Sarah  
Jessica  Parker  

COSTA  OESTE  
•  Mujeres  40  <  <49   FLORIDA  
•  Gustos:  deseaban  cenar  con  George  Cluny   • Mujeres  <  35  condado  de  
•  Acción:  velada  en  Hollywood  con  el  actor  y   Dade  
sortero  de  una  cena  con  él.  
• Gustos:  series  de  TV.    
• Acción:  publicidad  en  las  
series  diseñada  con  
mensajes    específicos  para  
ellas  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 30  
Trabajo  en  grupo  

Definición  de  los  grupos  


Elección  de  los  casos.  Lectura  en  grupo  y  breve  
resumen  para  exponer,  que  incluya:  
1.  ObjeDvo  
2.  Valor  de  los  datos  
3.  Resultado  obtenido  
4.  ¿Qué  es  diferente?  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 31  
Agenda  

1.  Introducción  
2.  Qué  es  Big  Data  
3.  Usos  e  implicaciones  
4.  Caso  prácDco  1  

M1 Datawarehousing y Big Data


Módulo  XX.  Prof.    
Lourdes Hernández Vozmediano 32  

Você também pode gostar