Escolar Documentos
Profissional Documentos
Cultura Documentos
01000111
01101110
01100001
01101110
01100101
01000010
01101001
01100011
01101100
01110100
01100100
01101001
01110000
01100100
01110011
01101001
01110100
01100001
01100111
01110011
01101101
01101111
00100000
01100111
01101001
01100101
00100000
01110100
00100000
01100011
01100001
01101111
01110101
01101111
01101111
01101001
01100010
01100001
01100001
01100101
01100100
01100101
01110011
01100101
00100000
01100101
00100000
01101100
01101001
11110011
01110011
01100100
01101111
01100101
01110100
01101110
00100000
01100010
01110011
01100100
01110011
01101100
01110010
01110000
00100000
01100001
00100000
00100000
01101110
01100100
01110010
01111001
01100001
01110011
01101110
01110100
01100101
01110011
01101100
01101111
01100011
01000100
01110010
00100000
01101111
01110000
01100101
01100001
01110100
01110010
01101101
01100001
01100101
01100011
01100101
01100011
00100000
00100000
01101100
00101110
01101001
00100000
00100000
00100000
01110010
01100001
01100101
01100101
01101101
01110011
01101111
01110011
00100000
01100001
11100001
01100101
00100000
01111000
01101001
01101100
01100001
01100100
01101100
01100001
00001101
11110
01000
01100
01010
00100
01110
01110
00100
11101
00100
01101
00100
01100
01110
01110
01101
01101
01101
01100
00100
01100
01100
01100
01100
00001
Tabla de contenido
0. Introduccin
1. Big Data drivers
2. Tipos de implementacin de Big Data
3. Big Data Governance
4. Tres ventajas de implementar Analytics
5. Privacidad y Big Data
6. Modelos de deployment
7. Cloud y Big Data
8. El internet de las cosas
9. Data Science, el nuevo superman?
10. Las cuatro reglas de Big Analytics
0. Introduccin
Qu tienen en comn Facebook, Amazon y la CIA? Es cierto que el tamao s que importa?
Pueden encontrarse cientficos con un marcado perfil artstico? Existe la privacidad en la era 3.0?
Todas las respuestas convergen en un nico concepto, Big Data, capaz de resolver los problemas
ms complejos aportando valor mientras que, al mismo tiempo, desde el ahorro, crea rentabilidad.
En esta gua trataremos de desgranar los tpicos, los datos ms curiosos y las ancdotas ms
interesantes alrededor del mundo de Big Data. Sin embargo, nuestro objetivo tiene ms que ver con
el lado prctico y, por eso, nos esforzaremos en que se conozca mejor, entre otras cosas:
- En qu consiste el Data Governance.
- Cmo Big Analytics puede mejorar un negocio y su rentabilidad desde el primer minuto.
- Quines son los profesionales ms buscados en el mercado de trabajo actual.
- Cmo puede implementarse Big Data en una organizacin.
- Cules son las reglas de oro del procesamiento de la informacin de ltima generacin.
Y, de todo esto, del arte, o el arte de magia, del Data Science al internet de las cosas; del cloud al
Big Analytics...todo lo que rodea a Big Data quedar expuesto en forma de datos que reflejan
solamente la punta del iceberg de la revolucin que supone el tener acceso a tal volumen de
informacin y, al mismo tiempo, con capacidad y medios para descifrarla, interpretarla y encontrar
todas las correlaciones que desvelan el contenido que encierra en su capa ms profunda.
la repercusin de un simple comentario negativo. Deben recoger estos datos, ser conscientes de
cunto puede afectarles, ya no slo en cuanto a las ventas de un producto, sino como marca; y
tienen que conseguir volver las tornas y transformarlo en una ventaja, explotando esta posibilidad
que les brinda Big Data.
En esta informacin se encierra un gran valor que, adems se puede recoger sin lmites gracias a
Big Data, porque hay que recordar que en la mayora de los casos se trata de texto libre, que
requiere anlisis de sentimiento y, para ello, el uso de una tecnologa muy precisa.
* Automatizacin. Aqu es donde entra en juego otro de los factores que conducen a Big Data, la
automatizacin, que es la capacidad de algunos procesos de cuantificar algo que no es tan sencillo
de ponderar y donde, el mayor cambio, es la disposicin para modificar la experiencia del cliente
mediante polticas de software, procedimientos y personalizacin de sistemas self-service mucho
ms amigables.
- Escalabilidad. Se cuenta con capacidad para almacenar un increble volumen de
datos, y se necesita porque ya no se puede hacer manualmente. Algo que recuerda,
por ejemplo a lo sucedido en los inicios de Google y Yahoo, donde mientras que el
primero recoga las peticiones de bsqueda y las gestionaba de forma automtica, el
segundo lo haca de forma manual. Fue Google quien obtuvo el algoritmo,
automatizando, y por eso sus resultados fueron tan buenos y su penetracin tan
rpida.
- Granularidad. Se puede procesar toda la informacin recibida. Por ejemplo,
almacenar todos los tweets y analizar cada uno de manera automtica usando un
diccionario para saber qu percepcin se tiene de la empresa en la red y obtener as
un porcentaje.
- Valor. Automatizando se puede obtener valor, porque si no se puede procesar la
informacin de que se dispone, su recoleccin y almacenamiento carecen de sentido,
les falta el anlisis.
* Monetization. Big Data habilita un gran mercado donde los datos se renen, intercambian y se
venden a otros clientes. La informacin se ha vuelto una alternativa que permite obtener
rentabilidad. Es decir, que adems del beneficio que supone para la organizacin el poder acceder a
tanta informacin se puede ganar dinero con ello, si se sabe cmo y se tienen buenas ideas (data
science), ya que estos datos pueden venderse a otras compaas. Ejemplo de ello seran las
empresas de telecomunicaciones, como Telefnica que, gracias a los datos de cada usuario que
almacenan al perfeccionar cada contrato, relacionados con su posicin geogrfica, que consiguen
saber por la conexin a las distintas antenas; pueden elaborar un mapa humano estructurado por
edades y sexos, muy til a la hora de establecer un negocio en una zona u otra de la misma ciudad.
2. Tipos de implementacin de
Big Data
Cmo se puede hacer una implementacin de Big Data? No existe una nica respuesta a esta
cuestin porque ello depender de:
- La madurez del business intelligence de la empresa.
- La infraestructura de que la organizacin disponga para la implementacin.
- Su nivel de conocimiento del nuevo entorno, su expertise (data science).
- Su planteamiento, ms innovador o ms tradicional, que condicionar inequvocamente su eleccin.
En cualquier caso, s que puede hablarse de que, generalmente, las empresas, atendiendo a su
configuracin y dependiendo de los factores precitados se agrupan atendiendo a tres modelos
diferentes de implementacin de Big Data:
- Revolucionario
- Evolutivo
- Hbrido
entorno. Y, junto con ellos, los informes, el modelado y la integracin con los procesos de negocio.
El pasado queda atrs y desde el primer momento todo comenzar de cero en esta nueva
plataforma.
Hay 3 tres tecnologas que permiten llevarlo a cabo: hadoop, las bases de datos paralelas y las
bases de datos in memory, para anlisis en tiempo real. Mediante su tctica de "divide y vencers"
permiten trabajar con volmenes inmensos de informacin en poco tiempo y a bajo coste y que se
complementan con la posibilidad de moverlo todo al cloud.
* Ventajas de este tipo de implementacin:
- Agilidad del procesamiento de la informacin: ya que cada porcin se procesa de
forma mucho ms rpida y lo que antes se procesaba en 6 horas, ahora se hace en
minutos.
- Optimizacin de los recursos que implica una notable reduccin de costes en
comparacin a otros mtodos.
- Flexibilidad de uso gracias al sistema de nodos: que permite adems poder calcular
lo que se va a gastar y pagar slo por lo que se usa.
* Inconvenientes:
- Altos costos en lo referente a habilidades a lo que se sumara la dificultad de
encontrar en el mercado candidatos con este perfil, que conozcan y sepan manejar
adecuadamente esta tecnologa, sacndole todo el partido.
- Quizs tambin puede suponer un mayor tiempo de adaptacin hasta que se pone en
marcha que otros sistemas, ya que se trata de un mtodo totalmente nuevo.
estructura actual, simplemente se suman los datos que no tenan cabida en el sistema para
pre-procesarlos desde la plataforma de Big Data. De esta forma, el sistema actual los puede ver y
as se logran anlisis, que siguen siendo del mismo tipo o parecidos, pero que ahora incorporan
ms datos.
La ventaja que tiene esta opcin es que su umbral de entrada tiene un costo menor, ya que las
empresas todava pueden seguir empleando su herramienta, aunque de la extraccin de datos y su
estructuracin se encargue Big Data. En concreto, Big Data se convierte en una entrada a la
plataforma de BI existente. Los datos se acumulan y analizan, y los resultados se envan al data
warehouse.
* Ventajas de este sistema:
- Rendimiento. Los modelos ahora se nutren con muchos ms datos y ms
diversificados.
- Volumen. Se multiplica el volumen de informacin que se obtiene, gracias a Big Data.
- Ahorro. Tanto en tiempo de implantacin, como en costes, ya que se mantiene el BI
existente.
* Inconvenientes:
- La velocidad de extremo a extremo siempre estar limitada por el entorno actual de
BI (que es mucho ms lento).
- El nivel de percepcin no es tan amplio, ya que fallara la granularidad por el BI
existente.
- Esta solucin no es definitiva, porque llegar un momento en que el BI no tenga
capacidad para hacer frente a los requerimientos informativos de la organizacin y se
tenga que optar por hacer el traslado completo de los datos al exterior de la empresa.
consiguiendo que los datos del data warehouse se almacenen en el motor de anlisis, lo que sera
visto por el ste como un DataMart.
En esta opcin Big Data no slo es un anexo al BI tradicional que permite ahora ver datos que antes
no poda, sino que adems es una plataforma que sirve para hacer anlisis avanzado mezclando
datos del tradicional que siguen all, con los nuevos como por ejemplo Redes Sociales o los datos
NO-Estructurados que los BI de antes no contemplaban a la hora de trabajar.
* Ventajas:
- Precisin: los sistemas ahora se nutren con una informacin estructurada, cuando
antes slo podan acceder a datos no estructurados.
- Big Analytics. O lo que es lo mismo, posibilidad de hacer un anlisis predictivo,
creando un modelo estadstico con todos los datos e identificando las relaciones
causales y las correlaciones; apoyndonos tambin en herramientas avanzadas de
visualizacin.
- El internet de las cosas: que permite conocer en tiempo real todo lo que est
sucediendo en cualquier parte y en relacin a cualquier asunto.
- Rentabilidad. En definitiva, esta opcin permite ofrecer mejores servicios que, claro
est, tambin pueden cobrarse.
* Inconvenientes:
- Resistencia: de las empresas menos evolucionadas, tecnolgicamente hablando, a la
implantacin de un modelo de este tipo.
- Dificultad: de quienes estn acostumbrados a limitarse a un tipo de anlisis
simplemente descriptivo, a la hora de lanzarse a las nuevas posibilidades.
10
11
polticas especficas que indiquen cunto tiempo se prolongar su validez. Esta gestin
hace falta tanto cuando se trabaja en entornos de real-time con tiempos de respuesta
muy cortos; como cuando se habla de elevados volmenes de datos histricos y hay
que decidir la frecuencia de archivo de la informacin usando infraestructuras ms
econmicas TIER-1, 2 o 3. Por eso es necesario que Data Governance se encargue de:
- Administrar los datos.
- Establecer el ciclo de vida de cada dato.
- Descifrar el tiempo de inters de la informacin y enunciar polticas de datos acordes
a l.
- Observar el cumplimiento de la legalidad vigente.
12
4.
Tres
ventajas
implementar Analytics
de
Una de las ventajas de Big Data Analytics es que puede coexistir con el BI tradicional, como ya
explicamos en los modelos de implementacin. Su poder reside en la facultad que otorga a quien lo
disfruta de tener la posibilidad de trabajar con grandes volmenes de informacin y mayor
precisin, algo que redunda en una toma de decisiones impecable, por lo actualizado y profundo de
su enfoque.
Implementar Big Data Analytics es el futuro, s, pero por qu esperar? todo tiende hacia un
perfeccionado control de la informacin que slo puede conseguirse mediante inmediatez, gran
capacidad y una tecnologa que lo haga posible. El tamao de la empresa y su sector de actividad
son independientes de una decisin de este tipo, que abre las puertas el negocio a una realidad
donde la informacin juega un papel fundamental, donde los datos se cuidan con celo y donde la
gestin proactiva de los mismos es ventaja competitiva.
13
14
15
deseable?
Para responder a esta pregunta habra que comenzar plantendose si todo lo tecnolgicamente
posible es social y humanamente deseable. No podemos ser espectadores ingenuos y ciegamente
maravillados por lo que nos dicen sobre el Big Data y eso implica ser crtico con los servicios que se
nos ofrecen.
Los avances en cualquier campo han de ser evaluados, igual que ocurre en el mbito de la medicina,
donde hay que apoyar el progreso, pero tambin hay que saber frenar a tiempo para evitar
impulsar situaciones que atenten contra nuestros derechos o realidades deshumanizadas.
Hay que cuestionar todo lo cuestionable para evitar casos como el tristemente famoso de la CIA que
ha saltado a los medios recientemente o el de IBM, que Edwin Black explica en su libro "IBM y el
holocausto".
16
6. Modelos de deployment
Administrar datos nunca fue tan sencillo, ni tan barato. Hoy da se puede escoger el modelo de
deployment que mejor encaja con las necesidades de cualquier empresa y empezar a disfrutar de un
procesamiento de la informacin novedoso. Sin embargo, es fcil adivinar que la tendencia en alza
es el cloud ya que es la opcin ms eficiente y gil, siendo adems la nica que hace posible tener un
control total del gasto y el consumo.
17
18
19
20
- Que dominen Big Data y que no existan secretos para ellos en este rea.
- Que sean capaces de hacer anlisis de la informacin que combine un background tcnico con una
gran habilidad predictiva.
- Que logren encontrar todas las posibilidades que existen en una empresa, conozcan la tecnologa
necesaria para lograrlo y la sepan aplicar.
21
22