Você está na página 1de 37

Jose Gabriel Plantarosa Lopez

Luis Fernando Lima Gomez


introducción
 El Big Data es el análisis masivo de
datos. Una cuantía de datos, tan
sumamente grande, que las
aplicaciones de software de
procesamiento de datos que
tradicionalmente se venían usando no
son capaces de capturar, tratar y poner
en valor en un tiempo razonable.
 Volumen, hace referencia al tamaño de los
datos que pueden provenir de múltiples fuentes.
 Velocidad, define la rapidez con que llegan los
datos usando unidades como tera, peta o exa
bytes
 Variedad, hablamos de datos:
• Estructurados
• Semi-estructurados
• No estructurados
Las V
Es usado ¿para que propósito?
 El BIG DATA es usado generalmente
para tener información certera sobre
intereses y gustos o las opiniones
acerca de algo, y ser usados para un
fin. Aclarando un gobierno puede usar
los datos sobre un lugar en específico
relacionado con su apego, aceptación
hacia un partido y utilizarlos a su favor
para saber que ofrecer y a quien
ofrecer.
Trata de obtener información de un usuario
o usuarios hacer un análisis de los datos y
tomar una decisión con ellos.
Por que es importante el big data
1) reducciones de costos.
2) reducciones de tiempo.
3) desarrollo de nuevos productos y soluciones optimizadas.
4) toma de decisiones inteligente. Cuando se combina el big
data con analítica poderosa, se pueden realizar tareas
relacionadas con negocios, tales como:
 Determinar las causas de origen de fallos, problemas y
defectos casi en tiempo real.
 Generar cupones en el punto de venta basados en los
hábitos de compra del cliente.
 Recalcular portafolios de riesgo completos en minutos.
 Detectar conducta fraudulenta antes de que afecte a su
organización.
¿De dónde provienen los datos?

 Producidos por personas


 Entre máquinas
 Biométricas
 Marketing web
 Transacciones de datos
Arquitectura o topología
 Teradata Corporation en 1984,
comercializó el sistema de
procesamiento paralelo DBC 1012.
 Fueron los primeros en almacenar y
analizar 1 terabyte de datos en 1992
 Los discos duros eran de 2,5 GB en
1991, por lo que la definición de big data
evoluciona continuamente.
Arquitectura o topología
 Datos estructurados: datos que tienen bien
definidos su longitud y su formato, como las fechas,
los números o las cadenas de caracteres. Se
almacenan en tablas. Un ejemplo son las Base de
datos relacionales y los almacenes de datos.
 Datos no estructurados: datos en el formato tal y
como fueron recolectados, carecen de un formato
específico. No se pueden almacenar dentro de una
tabla ya que no se puede desgranar su información
a tipos básicos de datos. Algunos ejemplos son
los pdf, documentos multimedia, correos o
documentos de texto.
Arquitectura o topología
 Datos semiestructurados: datos que no
se limitan a campos determinados, pero
que contiene marcadores para separar los
diferentes elementos. Es una información
poco regular como para ser gestionada de
una forma estándar. Estos datos poseen
sus propios metadatos semiestructurados
que describen los objetos y las relaciones
entre ellos, y pueden acabar siendo
aceptados por convención. Como ejemplos
tenemos los archivos tipo hojas de
calculo, HTML, XML o JSON.
Hadoop
 En 2004, Google publicó un documento
sobre un proceso llamado MapReduce
que utiliza una arquitectura similar.
 Marco diferencia el mas exitoso y
eficiente.
 Replicado por otros medios.
 Código abierto
 Hadoop Apache Spark se desarrolló en
2012.
Caracteristicas
 Escalable, permite crear estructuras en
cluster, a las que se les puede añadir nuevos
nodos fácilmente.
 Flexible, se adapta a múltiples formatos de
datos, puede utilizar o no esquemas para
tratar información y permite que los usuarios
lo usen en diferentes niveles.
 Fiable, ha sido diseñado, teniendo en cuenta
que el hardware y software pueden fallar.
 Rápido y lento, es muy rápido para tratar
grandes cantidades de datos, pero puede ser
lento al trabajar con poca información.
Aplicaciones
 El big data permite como tal el
almacenamiento de datos variados en
tiempo actual, para poder usarlos
teóricamente sin fines de lucro. El uso
de big data ha sido utilizado por la
industria de los medios, las empresas y
los gobiernos para dirigirse con mayor
precisión a su público y aumentar la
eficiencia de sus mensajes.
Gobierno
 Los datos masivos se usan
habitualmente para influenciar el
proceso democrático. Los
representantes del pueblo pueden ver
todo lo que hacen los ciudadanos, y los
ciudadanos pueden dictar la vida
pública de los representantes mediante
tuits y otros métodos de extender ideas
en la sociedad.
Cambridge analytica
Cambridge analytica
Desarrollo internacional
 Los avances en el análisis de big data
ofrecen oportunidades rentables para
mejorar la toma de decisiones en áreas de
desarrollo críticas como la atención
médica, el empleo, la productividad
económica, la delincuencia, la seguridad y
el manejo de recursos y desastres
naturales. Además, los datos generados
por el usuario ofrecen nuevas
oportunidades para ofrecer una voz
inaudita.
Medios
Los entornos de publicación adaptan cada vez
más los mensajes (anuncios publicitarios) y el
contenido (artículos) para atraer a los
consumidores que han sido recolectados
exclusivamente a través de diversas actividades
de extracción de datos.
 Orientación de los consumidores (para
publicidad de los vendedores)
 Mineria de datos
 Periodismo de datos: los editores y los
periodistas usan herramientas de Big Data
para proporcionar información
e infografias únicas e innovadoras.
Marketing y ventas

El big data cada vez se utiliza más para


segmentación avanzada de los
consumidores, automatizar la
personalización de los productos, adaptar
las comunicaciones al momento del ciclo
de venta, captar nuevas oportunidades de
venta, apoyo en la toma de decisiones a
tiempo real, gestión de crisis.
 Para gente en contra de las armas.
 Gente a favor de las armas
Aumentar la seguridad

 Los datos nos informan de muchas cosas,


pero en parte son responsables
de alertarnos sobre posibles problemas de
seguridad que estemos sufriendo en la
empresa. Gracias al big data podemos ser
capaces no solo de ver dónde están esos
agujeros de seguridad que ya sufrimos,
sino que también podremos prevenir
futuros riesgos al comprobar la
inestabilidad que se esconde detrás de los
datos externos e internos.
DESVENTAJAS
 El exceso de datos: La utilidad del Big Data surge de su capacidad para extraer
información de los datos. Si estos datos se almacenan y analizan indiscriminadamente
solo se convierten en ruido que ralentizará y obstaculizará las tareas. Los profesionales
con Máster Big Data obtienen la capacidad de discernir y seleccionar las datos y patrones
que serán de utilidad.
 Ciberseguridad: La seguridad es el mayor reto para la tecnología Big Data. La
vulnerabilidad de esta enorme cantidad de datos almacenados es el objetivo de los
nuevos ciberataques. Reconocer la responsabilidad de trabajar con datos y dotar los
sistemas de normas y herramientas, son aspectos clave de la formación en un Máster en
Big data.
 Las políticas de protección de datos: En relación con lo anterior, y como ocurre con
muchos de los grandes avances tecnológicos, son necesarios consensos y protocolos que
establezcan hasta qué punto esta tecnología podría considerarse intrusiva y cómo
protegerla.
 Tecnofobia: Más como consecuencia de los mitos sobre el Big Data que por sus
desventajas, existen reacciones desfavorables por parte de los usuarios, que consideran
que vulnera su privacidad. Lo que estos usuarios probablemente no sepan, es que la
tecnología de datos lleva años entre sus acciones cotidianas permitiendo avances
destinados a facilitar su día a día.
SITUACION ACTUAL
 El boom del "big data" es una muestra que pone en
relieve la importancia de los datos en el Siglo XXI,
algo que es solo comparable, según expertos, con la
relevancia de la electricidad en el siglo XIX.
 De acuerdo con la encuesta IT Priority 2018 de
TechTarget, que consultó a más de 1.000
profesionales de tecnologías de información, señala
que la tecnología big data en análisis de negocios,
es la segunda prioridad que se debe aplicar en las
empresas.
 En caso de América Latina, el concepto de big data
ha logrado pasos significativos, pero no logra
enraizarse aún en las instituciones.
SITUACIÓN ACTUAL
 Bancos
 Análisis de riesgos.
 La evaluación de la experiencia del cliente
 La optimización de operaciones.
 Telecomunicaciones
 Mejorar la gestión de sus infraestructuras y procesos.
 Comprender y satisfacer más a sus clientes.
 Utilizar el poder de su conectividad para ofrecer servicios
a terceros.
 Aseguradoras
 Calcular mejor las primas de los seguros.
 Identificar automáticamente, y mediante la inteligencia
artificial, conductas fraudulentas.
SITUACIÓN ACTUAL
 Empresas de energía
 Anticipar fallos en la red y mejorar el mantenimiento.
 Interpretar mejor las variables del subsuelo que se intenta
explotar.
 Rendimiento de las infraestructuras.
 Gran comercio & socios logísticos
 La primera tiene que ver directamente con sus clientes.
 La segunda está relacionada con la manera en la que
transportan y almacenan sus productos.
 Agencias de publicidad y marketing digital
 capturar, almacenar y analizar los datos que emiten los
sensores de miles de millones de objetos.
 ofrecer nuevos o mejores productos y servicios.
SITUACIÓN ACTUAL EN BOLIVIA
 2018: Se prevé que en país el negocio y aprovechamiento de
los datos recién comience a ser explotado en unos dos o tres
años.
 Existe un interés por esta nueva tecnología en las empresas
del país para mejorar su relación con sus clientes y establecer
negocios a través de tecnología del big data.
 Los primeros acercamientos de compañías en nuestro medio
tienen que ver con monitoreo más cercano sobre las cifras de
sus cuentas de redes sociales y la información que les brinda
Google Analytics respecto a las características de usuarios que
visitan su página web.
 En la actualidad, el big data no solo se está viendo a través de
las grandes empresas que manejan muchos datos.
 Los restaurantes cuentan con jefes de datos usando el big
data, al igual que las farmacias.
PROVEEDORES
 IBM fue el proveedor más grande de Big
Data en el 2012.
 Las ofertas incluyen:
 Hardware de servidor y de almacenamiento.
 software de base de datos.
 Aplicaciones analíticas y servicios asociados.
 Los productos más conocidos son las
plataformas de base de datos DB2,
Informix e InfoSphere, y las aplicaciones
analíticas Cognos y SPSS.
PROVEEDORES
 HP fue el segundo proveedor más grande de Big
Data en el 2012.
 Esta empresa también ofrece una mezcla de hardware,
software y servicios, y es conocida por la plataforma de
análisis Vertica.
 Teradata fue el tercer proveedor más grande de Big
Data del 2012.
 Esta es conocida por sus plataformas de hardware, de
software analítico y de base de datos. También ofrece
herramientas analíticas específicas para industrias de
distribución y transporte.
 Oracle fue el quinto gran proveedor en el 2012
 Su Oracle Big Data Appliance combina un servidor Intel,
distribución Hadoop de Cloudera y la base de datos
NoSQL de Oracle.
PROVEEDORES
 SAP ofrece una variedad de herramientas analíticas, pero
es más conocido por su base de datos en memoria,
HANA.
 EMC ayuda a las compañías a almacenar y analizar Big
Data y es también la sede del Marketing Science Lab.
 Amazon es conocido por su plataforma en la nube, pero
también ofrece un número de productos de Big Data,
incluyendo el Elastic MapReduce basado en Hadoop, la
base de datos Big Data DynamoDB, el almacén de datos
paralelamente masivo RedShift, y todos funcionan bien
con Amazon Web Services.
 Microsoft incluye una asociación con Hortonworks, una
empresa nueva de Big Data, y la herramienta HDInsights
basada en la plataforma de datos de Hortonworks.
Microsoft también es conocida por su servidor de base de
datos SQL
PROVEEDORES
 Google.
 VMware.
 Cloudera.
 Hortonworks.
 Splunk.
 10Gen.
 MapR.
EQUIPOS
 No existen equipos específicos para big
data.
 Los SOFTWARE son diseñados y
elaborados por los proveedores.

Você também pode gostar