introducción El Big Data es el análisis masivo de datos. Una cuantía de datos, tan sumamente grande, que las aplicaciones de software de procesamiento de datos que tradicionalmente se venían usando no son capaces de capturar, tratar y poner en valor en un tiempo razonable. Volumen, hace referencia al tamaño de los datos que pueden provenir de múltiples fuentes. Velocidad, define la rapidez con que llegan los datos usando unidades como tera, peta o exa bytes Variedad, hablamos de datos: • Estructurados • Semi-estructurados • No estructurados Las V Es usado ¿para que propósito? El BIG DATA es usado generalmente para tener información certera sobre intereses y gustos o las opiniones acerca de algo, y ser usados para un fin. Aclarando un gobierno puede usar los datos sobre un lugar en específico relacionado con su apego, aceptación hacia un partido y utilizarlos a su favor para saber que ofrecer y a quien ofrecer. Trata de obtener información de un usuario o usuarios hacer un análisis de los datos y tomar una decisión con ellos. Por que es importante el big data 1) reducciones de costos. 2) reducciones de tiempo. 3) desarrollo de nuevos productos y soluciones optimizadas. 4) toma de decisiones inteligente. Cuando se combina el big data con analítica poderosa, se pueden realizar tareas relacionadas con negocios, tales como: Determinar las causas de origen de fallos, problemas y defectos casi en tiempo real. Generar cupones en el punto de venta basados en los hábitos de compra del cliente. Recalcular portafolios de riesgo completos en minutos. Detectar conducta fraudulenta antes de que afecte a su organización. ¿De dónde provienen los datos?
Producidos por personas
Entre máquinas Biométricas Marketing web Transacciones de datos Arquitectura o topología Teradata Corporation en 1984, comercializó el sistema de procesamiento paralelo DBC 1012. Fueron los primeros en almacenar y analizar 1 terabyte de datos en 1992 Los discos duros eran de 2,5 GB en 1991, por lo que la definición de big data evoluciona continuamente. Arquitectura o topología Datos estructurados: datos que tienen bien definidos su longitud y su formato, como las fechas, los números o las cadenas de caracteres. Se almacenan en tablas. Un ejemplo son las Base de datos relacionales y los almacenes de datos. Datos no estructurados: datos en el formato tal y como fueron recolectados, carecen de un formato específico. No se pueden almacenar dentro de una tabla ya que no se puede desgranar su información a tipos básicos de datos. Algunos ejemplos son los pdf, documentos multimedia, correos o documentos de texto. Arquitectura o topología Datos semiestructurados: datos que no se limitan a campos determinados, pero que contiene marcadores para separar los diferentes elementos. Es una información poco regular como para ser gestionada de una forma estándar. Estos datos poseen sus propios metadatos semiestructurados que describen los objetos y las relaciones entre ellos, y pueden acabar siendo aceptados por convención. Como ejemplos tenemos los archivos tipo hojas de calculo, HTML, XML o JSON. Hadoop En 2004, Google publicó un documento sobre un proceso llamado MapReduce que utiliza una arquitectura similar. Marco diferencia el mas exitoso y eficiente. Replicado por otros medios. Código abierto Hadoop Apache Spark se desarrolló en 2012. Caracteristicas Escalable, permite crear estructuras en cluster, a las que se les puede añadir nuevos nodos fácilmente. Flexible, se adapta a múltiples formatos de datos, puede utilizar o no esquemas para tratar información y permite que los usuarios lo usen en diferentes niveles. Fiable, ha sido diseñado, teniendo en cuenta que el hardware y software pueden fallar. Rápido y lento, es muy rápido para tratar grandes cantidades de datos, pero puede ser lento al trabajar con poca información. Aplicaciones El big data permite como tal el almacenamiento de datos variados en tiempo actual, para poder usarlos teóricamente sin fines de lucro. El uso de big data ha sido utilizado por la industria de los medios, las empresas y los gobiernos para dirigirse con mayor precisión a su público y aumentar la eficiencia de sus mensajes. Gobierno Los datos masivos se usan habitualmente para influenciar el proceso democrático. Los representantes del pueblo pueden ver todo lo que hacen los ciudadanos, y los ciudadanos pueden dictar la vida pública de los representantes mediante tuits y otros métodos de extender ideas en la sociedad. Cambridge analytica Cambridge analytica Desarrollo internacional Los avances en el análisis de big data ofrecen oportunidades rentables para mejorar la toma de decisiones en áreas de desarrollo críticas como la atención médica, el empleo, la productividad económica, la delincuencia, la seguridad y el manejo de recursos y desastres naturales. Además, los datos generados por el usuario ofrecen nuevas oportunidades para ofrecer una voz inaudita. Medios Los entornos de publicación adaptan cada vez más los mensajes (anuncios publicitarios) y el contenido (artículos) para atraer a los consumidores que han sido recolectados exclusivamente a través de diversas actividades de extracción de datos. Orientación de los consumidores (para publicidad de los vendedores) Mineria de datos Periodismo de datos: los editores y los periodistas usan herramientas de Big Data para proporcionar información e infografias únicas e innovadoras. Marketing y ventas
El big data cada vez se utiliza más para
segmentación avanzada de los consumidores, automatizar la personalización de los productos, adaptar las comunicaciones al momento del ciclo de venta, captar nuevas oportunidades de venta, apoyo en la toma de decisiones a tiempo real, gestión de crisis. Para gente en contra de las armas. Gente a favor de las armas Aumentar la seguridad
Los datos nos informan de muchas cosas,
pero en parte son responsables de alertarnos sobre posibles problemas de seguridad que estemos sufriendo en la empresa. Gracias al big data podemos ser capaces no solo de ver dónde están esos agujeros de seguridad que ya sufrimos, sino que también podremos prevenir futuros riesgos al comprobar la inestabilidad que se esconde detrás de los datos externos e internos. DESVENTAJAS El exceso de datos: La utilidad del Big Data surge de su capacidad para extraer información de los datos. Si estos datos se almacenan y analizan indiscriminadamente solo se convierten en ruido que ralentizará y obstaculizará las tareas. Los profesionales con Máster Big Data obtienen la capacidad de discernir y seleccionar las datos y patrones que serán de utilidad. Ciberseguridad: La seguridad es el mayor reto para la tecnología Big Data. La vulnerabilidad de esta enorme cantidad de datos almacenados es el objetivo de los nuevos ciberataques. Reconocer la responsabilidad de trabajar con datos y dotar los sistemas de normas y herramientas, son aspectos clave de la formación en un Máster en Big data. Las políticas de protección de datos: En relación con lo anterior, y como ocurre con muchos de los grandes avances tecnológicos, son necesarios consensos y protocolos que establezcan hasta qué punto esta tecnología podría considerarse intrusiva y cómo protegerla. Tecnofobia: Más como consecuencia de los mitos sobre el Big Data que por sus desventajas, existen reacciones desfavorables por parte de los usuarios, que consideran que vulnera su privacidad. Lo que estos usuarios probablemente no sepan, es que la tecnología de datos lleva años entre sus acciones cotidianas permitiendo avances destinados a facilitar su día a día. SITUACION ACTUAL El boom del "big data" es una muestra que pone en relieve la importancia de los datos en el Siglo XXI, algo que es solo comparable, según expertos, con la relevancia de la electricidad en el siglo XIX. De acuerdo con la encuesta IT Priority 2018 de TechTarget, que consultó a más de 1.000 profesionales de tecnologías de información, señala que la tecnología big data en análisis de negocios, es la segunda prioridad que se debe aplicar en las empresas. En caso de América Latina, el concepto de big data ha logrado pasos significativos, pero no logra enraizarse aún en las instituciones. SITUACIÓN ACTUAL Bancos Análisis de riesgos. La evaluación de la experiencia del cliente La optimización de operaciones. Telecomunicaciones Mejorar la gestión de sus infraestructuras y procesos. Comprender y satisfacer más a sus clientes. Utilizar el poder de su conectividad para ofrecer servicios a terceros. Aseguradoras Calcular mejor las primas de los seguros. Identificar automáticamente, y mediante la inteligencia artificial, conductas fraudulentas. SITUACIÓN ACTUAL Empresas de energía Anticipar fallos en la red y mejorar el mantenimiento. Interpretar mejor las variables del subsuelo que se intenta explotar. Rendimiento de las infraestructuras. Gran comercio & socios logísticos La primera tiene que ver directamente con sus clientes. La segunda está relacionada con la manera en la que transportan y almacenan sus productos. Agencias de publicidad y marketing digital capturar, almacenar y analizar los datos que emiten los sensores de miles de millones de objetos. ofrecer nuevos o mejores productos y servicios. SITUACIÓN ACTUAL EN BOLIVIA 2018: Se prevé que en país el negocio y aprovechamiento de los datos recién comience a ser explotado en unos dos o tres años. Existe un interés por esta nueva tecnología en las empresas del país para mejorar su relación con sus clientes y establecer negocios a través de tecnología del big data. Los primeros acercamientos de compañías en nuestro medio tienen que ver con monitoreo más cercano sobre las cifras de sus cuentas de redes sociales y la información que les brinda Google Analytics respecto a las características de usuarios que visitan su página web. En la actualidad, el big data no solo se está viendo a través de las grandes empresas que manejan muchos datos. Los restaurantes cuentan con jefes de datos usando el big data, al igual que las farmacias. PROVEEDORES IBM fue el proveedor más grande de Big Data en el 2012. Las ofertas incluyen: Hardware de servidor y de almacenamiento. software de base de datos. Aplicaciones analíticas y servicios asociados. Los productos más conocidos son las plataformas de base de datos DB2, Informix e InfoSphere, y las aplicaciones analíticas Cognos y SPSS. PROVEEDORES HP fue el segundo proveedor más grande de Big Data en el 2012. Esta empresa también ofrece una mezcla de hardware, software y servicios, y es conocida por la plataforma de análisis Vertica. Teradata fue el tercer proveedor más grande de Big Data del 2012. Esta es conocida por sus plataformas de hardware, de software analítico y de base de datos. También ofrece herramientas analíticas específicas para industrias de distribución y transporte. Oracle fue el quinto gran proveedor en el 2012 Su Oracle Big Data Appliance combina un servidor Intel, distribución Hadoop de Cloudera y la base de datos NoSQL de Oracle. PROVEEDORES SAP ofrece una variedad de herramientas analíticas, pero es más conocido por su base de datos en memoria, HANA. EMC ayuda a las compañías a almacenar y analizar Big Data y es también la sede del Marketing Science Lab. Amazon es conocido por su plataforma en la nube, pero también ofrece un número de productos de Big Data, incluyendo el Elastic MapReduce basado en Hadoop, la base de datos Big Data DynamoDB, el almacén de datos paralelamente masivo RedShift, y todos funcionan bien con Amazon Web Services. Microsoft incluye una asociación con Hortonworks, una empresa nueva de Big Data, y la herramienta HDInsights basada en la plataforma de datos de Hortonworks. Microsoft también es conocida por su servidor de base de datos SQL PROVEEDORES Google. VMware. Cloudera. Hortonworks. Splunk. 10Gen. MapR. EQUIPOS No existen equipos específicos para big data. Los SOFTWARE son diseñados y elaborados por los proveedores.