Você está na página 1de 27

Big Data: Avances Recientes a Nivel Internacional y

Perspectivas para el Desarrollo Local

Autores: Facundo Malvicinoa y Gabriel Yoguelb

Coordinacin: Gabriel Yoguel

Centro Interdisciplinario de Estudios en Ciencia Tecnologa e Innovacin


Ministerio de Ciencia, Tecnologa e Innovacin Productiva
Ciudad Autnoma de Buenos Aires, Agosto de 2015

Centro Interdisciplinario de Estudios en Ciencia, Tecnologa e Innovacin (CIECTI). Mail:


fmalvicino@ciecti.gob.ar; fmalvicino@yahoo.com.ar
b
CIECTI Universidad Nacional General Sarmiento. Mail: gyoguel@gmail.com

Resumen
Big Data abre la posibilidad de hacer grandes avances en muchas disciplinas cientficas,
aportes a la innovacin y mejoras de productividad y competitividad. Sin embargo, hay que
tener en cuenta que los desafos que se presentan con Big Data, no slo estn referidos al
volumen de datos, sino tambin a su heterogeneidad, al carcter poco estructurado de los
mismos, a los aspectos de privacidad, a los problemas de procesamiento y la visualizacin,
entre otros. En trminos esquemticos, la problemtica Big Data puede dividirse entre los
desafos tecnolgicos de infraestructura y servicios (software y hardware) por un lado, y la
dimensin del anlisis de Grandes Datos por el otro. Asimismo, junto a los problemas de
infraestructura y de servicios (tanto de hardware y software), el aprovechamiento de Big Data
para el desarrollo social y econmico requiere un enfoque multidisciplinario y el diseo de
polticas estratgicas.
Palabras Claves: Big Data, TIC, desarrollo, sectores productivos

Introduccin
Big Data surge como una nueva fase del paradigma intensivo en informacin y comunicacin
que abarca no slo su dimensin tecnolgica, sino tambin una dimensin social, econmica,
poltica y cultural. Por lo tanto, una comprensin holstica sobre el tema requiere un abordaje
multidisciplinario. Al igual que con el surgimiento de las Tecnologas de la Informacin y
Comunicacin (TIC), existe una discusin acerca de si nos encontramos frente a un cambio de
paradigma tecnolgico, una nueva revolucin industrial-tecnolgica o si Big Data no ha hecho
ms que intensificar la competencia en mercados ya existentes, sin mostrar un impacto en las
mejoras de la productividad general. Los autores que tienen una visin optimista, sostienen
que Big Data estara provocando cambios en la organizacin del trabajo con mejoras en la
toma de decisiones y el acceso a los mercados. Estos cambios daran lugar a una reduccin en
las brechas de productividad a partir de una mayor competitividad de las unidades productivas
con un impacto positivo sobre la calidad de vida de las personas (McKinsey, 2011; Brynjolfsson,
Hitt, y Kim, 2011; UNGPulse, 2012; Chen y Chun-Yang, 2014). La viabilidad de este proceso est
sujeta a los cambios comunicacionales e informacionales que promueve la digitalizacin, la
convergencia tecnolgica e Internet a distintos niveles: a nivel operativo se trata del acceso
remoto y en tiempo real a la informacin para la toma de decisiones, permitiendo un
desanclaje territorial; los cambios estructurales tienen que ver con la mayor y mejor
accesibilidad comunicacional (conectividad); mientras que nuevos niveles de propagacin
permiten variaciones en la escala comunicacional (Forte et al., 2012). En la Figura N 1
presentamos un esquema del mecanismo de transmisin entre el cambio comunicacional y el
aumento de la productividad. Existe por lo tanto una oportunidad para crear un sendero de
desarrollo virtuoso que permita reducir las brechas de productividad con los pases
desarrollados, a partir el diseo de polticas efectivas orientadas a sectores de alto contenido
tecnolgico e informacional, conjuntamente con el fortalecimiento de organismos pblicos de
2

ciencia y tecnologa. Sin embargo, como veremos a lo largo del trabajo, Big Data no es de por s
una panacea, ya que requiere importantes desafos para pases en desarrollo.
En las ltimas dcadas Argentina ha desarrollado el sector de Servicios de Informtica e
Informacin posicionndolo entre los ms dinmicos de la regin. Por lo tanto, existen
capacidades tcnicas reales y potenciales que permitiran aprovechar este avance
informacional-tecnolgico a los fines del crecimiento y desarrollo socioeconmico del pas.
Entre 2003 y 2010 el sector de Servicios de Informtica e Informacin ha mostrado
incrementos significativos en el empleo, las ventas y las exportaciones, aunque en el marco de
una gran heterogeneidad (Barletta et al., 2013). Segn la CESSI (2014) entre 2003 y 2012 la
facturacin del mercado TIC en Argentina creci al 19,8% anual en promedio (un 19% anual
promedio entre 2010 y 2012, luego de la cada de 2009). Dadas estas caractersticas, Argentina
cuenta con la oportunidad de crear una plataforma para una industria de Big Data,
promoviendo polticas convergentes hacia un uso intensivo de datos digitales y TIC.

Figura 1. Mecanismo de transmisin: Cambio comunicacional y productividad

Estructura

Propagacin

Organ. del
Trabajo

Toma
Decisiones

Digitalizacin,
Convergencia,
Internet

Aumento
Productividad

Operatividad

Acceso
Mercados

Fuente: Elaboracin propia

Sin embargo, de acuerdo a los resultados de la Encuesta Big Data 2014, el mercado de este
sector en Argentina muestra una demanda escasa y de baja complejidad, explicado en parte
por la falta de conocimiento sobre el tema, problemas institucionales y limitaciones en la
infraestructura. Simultneamente, las instituciones cientficas muestran una desconexin
entre la produccin acadmica y los desarrollos de las empresas locales. En ese marco, el
objetivo del presente documento es discutir el rol del Sector Pblico en el desarrollo de nuevos
sectores de alta tecnologa en pases en desarrollo, tomando la situacin actual de Big Data en
Argentina. Frente a este desafo surgen las siguientes preguntas: se encuentra el pas en
condiciones de aprovechar los beneficios que promete esta nueva fase de sociedades basadas
en el conocimiento?; si el anlisis de grandes datos requiere de una base tecnolgicocomunicacional: est el pas en condiciones de dar respuesta a esta exigencia?; cmo
impacta el escaso desarrollo local de infraestructura de alta complejidad para el desarrollo de
Big Data?
En ese marco, el objetivo del presente documento es establecer un marco terico-conceptual
para desarrollar la discusin sobre los potenciales beneficios de Big Data en Argentina. En
consecuencia, interesa alcanzar una definicin tcnica de lo que se suele denominar como Big
Data para delimitar su alcance. Adicionalmente, se avanzar sobre la conceptualizacin del
anlisis de Big Data como forma ineludible de obtener un valor de los mismos y se har un
relevamiento de algunas de las aplicaciones sociales y econmicas que se vienen
desarrollando. En la primera seccin se discute la dimensin epistemolgica del fenmeno Big
Data (Big Data: Nuevo Paradigma o Nueva Fase del Paradigma Intensivo en Informacin y
Comunicacin?). En la segunda seccin proponemos una definicin de Big Data partiendo de
los puntos comunes que existen en la literatura (Definicin de Big Data y aspectos tcnicos) y
presentamos el esquema conceptual de lo que se entiende por Anlisis de Datos. Luego,
presentamos algunas de las aplicaciones en la seccin Big Data: aplicaciones sociales y
econmicas. Oportunidades para el desarrollo. Finalmente discutimos las principales
conclusiones.

1. Big Data: Nuevo Paradigma o Nueva Fase del Paradigma


Intensivo en Informacin y Comunicacin?
1.1.Impacto econmico: cambios en la productividad y competitividad
Big Data constituye un fenmeno global que puede llegar a tener un impacto econmico real y
potencial, beneficiando tanto al sector pblico y privado, en el aumento de la productividad, la
competitividad sectorial y la calidad de vida de los ciudadanos. Sin embargo, existe una
importante discusin acerca de si nos encontramos frente a un cambio de paradigma
tecnolgico, una nueva revolucin industrial-tecnolgica o si Big Data no slo no es un cambio
de paradigma, sino que no ha hecho ms que intensificar la competencia en mercados ya
existentes, sin mostrar un impacto en las mejoras de la productividad general. Se pueden
identificar tres grupos dentro de la literatura: i) optimistas: identificado como aquellos que ven
en Big Data un cambio positivo en la sociedad, a partir de mejoras en la productividad,
respuestas a problemas sociales en reas tales como la salud y nuevas oportunidades de
negocios (McKinsey, 2011; Brynjolfsson, Hitt, y Kim, 2011; UNGPulse, 2012; Chen y Chun-Yang,
2014); ii) escpticos/pesimistas: aquellos que consideran que Big Data es una moda pasajera,
que no reviste las virtudes adjudicadas o que incluso una forma de avasallamiento a las
libertados individuales y la privacidad (Gordon, 2014; NY Times, 2013; La Nacin, 2013)1; y iii)
crticos: quienes ven oportunidades aunque no dejan de realizar un anlisis crtico de este
proceso, ms all de los indicadores socio-econmicos tradicionales (Manovich, 2011; boyd y
Crawford, 2012; Peres y Hilbert, 2010).
De acuerdo a McKinsey (2011: 2), consultora de management estratgico y reconocimiento
mundial, nos encontramos frente a un punto de inflexin, en la cspide de una tremenda ola
de innovacin, productividad y crecimiento, como tambin nuevas formas de competencia y
apropiacin de valor. Si bien los datos siempre han sido parte del impacto de las TIC, los
cambios que Big Data provoca estn mostrando un cambio en el panorama econmico:
nuevas oportunidades de negocios y mejoras en las tomas de decisiones a partir de la
disponibilidad de datos en tiempo real que permiten cambios en la productividad.
Brynjolfsson, Hitt, y Kim (2011) entrevistaron 179 grandes firmas en EEUU en 2008,
concluyendo que aquellas que incorporaron el uso de Big Data para la toma de decisiones y la
creacin de nuevos productos y servicios, alcanzaban una productividad entre 5 y 6% superior
a la esperada considerando sus otras inversiones y usos tecnolgicos. En cuanto a capacidad
de almacenamiento y generacin de datos, McKinsey (2011) estim que en 2010 el 60% de la
poblacin mundial utilizaba celulares (el 12% de esta poblacin eran Smartphones) y que esta
penetracin creca al 20% anual, mientras que se calcularon ms de 30 millones de sensores
conectados en red en el sector transporte, en automviles, industrias, servicios pblicos y
comercios minoristas con una tasa de crecimiento del 30% anual. Asimismo, concluye que a
nivel global en 2010, las empresas habran tenido capacidad de almacenar ms de 7 exabytes2
1

Joel Waldfogel, de la Universidad de Minnesota, considera que las oportunidades de negocio que Big
Data ha generado no son ms que el canibalismo de los negocios que ya existan offline. (NY Times,
2013; La Nacin, 2013)
2
3
6
9
12
15
18
1 Exabyte = 10 Petabytes = 10 Terabytes = 10 Gigabytes = 10 Megabytes = 10 Kilobytes = 10
bytes

de nuevos datos, mientras que personas particulares almacenaron ms de 6 exabytes de


nuevos datos en PCs y notebooks. Para tener una nocin de las dimensiones, 1 exabyte
equivale a 4.000 veces la informacin almacenada en la Biblioteca del Congreso de EEUU Es
fsicamente imposible almacenar todos los datos que generamos.
Estos importantes avances tienen como antecedente los cambios significativos en la capacidad
de almacenamiento, procesamiento de los datos y ancho de banda que se manifiestan en las
leyes de Moore, Gilder y Metcalfe3. De acuerdo a OECD (2013), el incremento exponencial de
generacin, recoleccin y transporte de datos es producto del desarrollo tecnolgico
comunicacional (banda ancha, smartphones, smart grid, etc.) y su mayor disponibilidad: el
costo de acceso a Internet ha venido decreciendo considerablemente en los pases
desarrollados4. Asimismo, el uso -almacenamiento y procesamiento- de datos se vio favorecido
por el descenso en el costo del almacenamiento, procesamiento y anlisis: el costo de
almacenamiento en Unidades de Discos Duros (Hard Disk Drives HHD) cay a un 39%
promedio anual entre 1998 y 20125; el costo de Dispositivos de Estado Slido (Solid State
Drives SSD) cay un 51% anual entre 2007-2012; mientras que el costo del anlisis genmico
se desplom un 60% promedio anual entre 2001-2012, acelerndose la cada a partir de
mediados de 20086. A esto debemos agregar que el aumento del acervo de informacin no ha
sido acompaado por un avance equivalente en la capacidad de procesamiento y
almacenamiento (Barrantes et al., 2013), lo que redunda en un mayor desafo para crear valor
a partir de los datos generados.
McKinsey (2011) identifica cuatro olas de adopcin de tecnologas de la informacin en EEUU
con diferentes niveles de impacto en la productividad. Tambin ha detectado que dicho
impacto se da con cierto rezago que se explica por el tiempo que demanda incorporar las
nuevas tecnologas en la organizacin del trabajo. Por lo tanto, es probable que las ganancias
en productividad que se registran en un determinado perodo sean producto de la realizacin
de las inversiones de perodos anteriores. De esta manera, puede que la totalidad de las
bondades de Big Data no se hayan dejado ver todava, aunque para los pases en desarrollo
implica el desafo adicional de cerrar la brecha tecnolgica informacional y la capacitacin de
los recursos humanos. En el Cuadro N 1 se sintetizan los datos presentados por McKinsey
(2011: 24-25), donde se observa que los ltimos dos perodos muestran las tasas de
productividad por tecnologas de la informacin (IT, siglas en ingls) ms elevadas, aun siendo
los ms cortos en duracin (no superan los 5 aos), reflejando un progresivo aumento de la
participacin de IT en el crecimiento anual de la productividad desde los aos 70 hasta el
2000, cuando muestra una desaceleracin.

La Ley de Moore establece que el nmero de transistores por procesador se duplica cada 18 meses
(hecho que se ha registrado en los ltimos 35 aos aproximadamente); la Ley de Gilder plantea que el
ancho de banda se triplica cada ao; y, finalmente, la Ley de Metcalfe dice que el valor de una red es
igual al cuadrado de los usuarios. Para una discusin sobre la ley de Metcalfe, ver Krugman (2014).
4
En Francia el costo de acceso a Internet cay de USD 75 por conexiones dial-up por mes en 1995 a USD
33 por conexiones de banda ancha (1.000 veces ms veloz), por mes.
5
Tasa de crecimiento anual compuesta.
6
Entre septiembre de 2001 y octubre de 2007, el costo por genoma cay a un promedio anual del 21%;
mientras que entre junio 2008 y julio de 2014 lo hizo al 44% promedio anual.
(Fuente: www.genome.gov/sequencingcosts/).

Cuadro N 1. Perodos de adopcin de tecnologas IT en EEUU

Perodos

Primera
Segunda
Tercera
Cuarta

Mainframe Era (Computadora Central)


Minicomputers & PCs
Internet&Web 1.0
Dispositivos Mviles & Web 2.0

Perodo

1959-1973
1973-1995
1995-2000
2000-2006

Crecimiento
Contribucin Part. De IT
Anual de
IT
en Product.
Product. USA
2,82%
1,49%
2,70%
2,50%

0,30%
0,65%
1,59%
0,96%

11%
44%
59%
38%

Fuente: Elaboracin propia en base a McKinsey (2011: 24-25)

Vale destacar que las ganancias en productividad que puedan lograrse con Big Data dependen
de las inversiones en tecnologas de la informacin (capacidad de almacenamiento y
procesamiento) y de la innovacin en la organizacin del trabajo que incorpore las nuevas
herramientas. Segn Barrantes et al. (2013), Big Data es una de las tres trayectorias7 en las que
se desarrolla la explosin en la generacin de datos que protagonizamos por el aumento del
uso de la tecnologa en la vida cotidiana, cuyo aprovechamiento descansa y depende de la
instalacin de infraestructura de redes de alta velocidad.
En la direccin de McKinsey (2011), UN Global Pulse, una divisin de Naciones Unidas para
impulsar innovaciones en la velocidad de recoleccin y anlisis de datos vigente desde 2009,
sugiere que nos encontramos frente a una Revolucin Industrial de los Datos precedida
desde el comienzo del nuevo siglo por las innovaciones tecnolgicas y los dispositivos digitales.
Este perodo estara caracterizado por un incremento exponencial en la cantidad y diversidad
de datos digitales disponibles en tiempo real, producto de un mayor uso de equipos
tecnolgicos de mayor capacidad en la vida diaria, permitiendo alcanzar un mayor
conocimiento del comportamiento humano (UN Global Pulse 2012). Segn las estimaciones
que utilizan, la cantidad de datos digitales disponibles a nivel mundial pasaron de 150 exabytes
en 2005 a 1.200 en 2010, esto es un crecimiento de 8 veces, proyectndose un crecimiento del
40% por ao, es decir 40 veces el crecimiento de la poblacin mundial. Por lo tanto, no slo se
estara duplicando la cantidad de informacin digital acumulada cada 20 meses,
reproduciendo una dinmica similar a la de la Ley de Moore, sino que tambin dichos datos se
estaran haciendo cada vez ms jvenes en trminos relativos, al haber una mayor
disponibilidad en tiempo real. Asimismo, desde una perspectiva acrtica sobre la naturaleza de
las crisis internacionales, el documento sugiere que Big Data es una oportunidad,
particularmente para los pases en desarrollo, para evitar o moderar el impacto de los shocks
financieros o climticos y reducir el impacto de la volatilidad de los mercados a partir de la
disponibilidad de datos en tiempo real que habiliten a dar respuestas con mayor anticipacin.
Sin embargo, analizando el crecimiento econmico y la productividad de EEUU entre 18912013 (ver Grfico N 1), Gordon (2014) observa que, luego de alcanzar un mximo en el
perodo 1996-2000, la cada en el crecimiento del producto, la productividad y el empleo para
el perodo 2004-2013, contradice la prediccin de los tecno-optimistas de una aceleracin
7

Las otras dos son la difusin de la banda ancha y la computacin en la nube. Dado el alcance del
presente documento, nos ocuparemos slo de Big Data, sin por ello considerar a estas dos de menor
importancia.

del crecimiento econmico. Durante los ltimos 10 aos, la cada de la productividad de la


economa americana no muestra ningn impulso provocado por la explosin de Big Data o la
invencin de smart-phones o tablets. Para el autor, no hay sorpresas en estos resultados ya
que si los costos marginales se igualan a los beneficios marginales, en la medida que el costo
de los datos digitales tiende a cero, tambin lo harn los beneficios: ha dejado de existir la
relacin entre la Ley de Moore (o el crecimiento de los datos digitales), por un lado, y el
crecimiento del producto per cpita y la productividad, por el otro. Big Data es para el autor un
juego de suma cero, ya que mayormente son utilizados por grandes corporaciones para
mercadotecnia y conductas predatorias por la participacin en el mercado.
Grfico N 1. PIB pc, Productividad y Empleo. EEUU 1891-2013

PIB per cpita, Productividad y Empleo.


EEUU 1891-2013
3
2,5

2,54

2,36

2,18

2,13

1,95

1,38

1,5
%

1,33

0,76

0,57
0,5
0
-0,5

-0,24

-0,36
-0,56

-1
1891-1972

1972-1996
Y/N

1996-2004
Y/H

2004-2013

H/N

Fuente: Gordon (2014). Y/N expresa el PIB per capita; Y/H es la relacin entre PIB y Horas
Trabajadas o productividad por hora-hombre; H/N es la relacin entre Horas Trabajadas y
Poblacin, capturando el empleo

En cuanto al mercado de Big Data, Kelly (2014) sostiene que en 2012 las ventas de hardware,
software y servicios profesionales vinculados a Big Data crecieron un 59% respecto a 2011,
ascendiendo a 11,59 mil millones de dlares de acuerdo a un relevamiento realizado sobre
ms de 60 grandes empresas. Para 2013 se espera un crecimiento del negocio en un 61%
anual, alcanzando los 18,1 mil millones de dlares. En el Grfico N 2 vemos que servicios
profesionales es la categora que mayores ingresos concentr. En este estudio, se observa que
IBM registr ingresos por 1,25 mil millones de dlares, de los cules el 50% se generaron por
servicios profesionales; mientras que HP, la segunda firma en importancia, gener 0,66 mil
millones de dlares, siendo el 38% servicios profesionales8.

Listado completo de firmas en Kelly (2014).

Grfico N 2. Segmentacin Mercado Big Data 2012

Software
19%
Servicios
44%
Hardware
37%

Fuente: Kelly (2014)

Si bien el mercado est dominado por grandes firmas como IBM, HP, Teradata y Dell9, es
probable que las innovaciones sean impulsadas por pequeas empresas dedicadas
exclusivamente a Big Data, las cuales se vuelven objetivos de adquisicin de las grandes
compaas. Segn la European Commision (2013) esto obligar a estas PyMEs a elegir entre los
siguientes modelos de negocio: i) concesin de licencias del software que desarrollen; ii) oferta
de servicios profesionales; iii) venta de sus productos; iv) su adquisicin por parte de una
empresa ms grande.

1.2. Consideraciones metodolgicas y epistemolgicas a partir de Big


Data
Una discusin que se plantea desde la teora sociolgica y que abarca tanto a las TIC en general
y a Big Data en particular, tiene que ver con el rol que desarrollan dentro del orden social, ms
all de la reflexin particular que se pueda hacer sobre ellas. Esto es, considerar a las TIC no
como sub-producto de las relaciones sociales o como factores tecnolgicos, sino considerar
tambin su carcter sociolgico y sus funciones comunicativas. Para ello, Forte et al. (2012)
identifican tres obstculos epistemolgicos para el anlisis de las TIC, que consideramos es
extensivo para la particularidad de Big Data: i) tecnologicismo: reduccin a sus caractersticas
tecnolgicas; ii) sociologicismo: TIC como variable dependiente de la estructura social; iii)
sobrecarga diacrnica: se imputan pretensiones diacrnicas a las TIC y se espera que
devuelvan criterios para la distincin de etapas dentro de la evolucin societal reciente, sin
ponderarlas dentro de una teora de la sociedad. Como veremos ms adelante en cuanto a la
definicin ms aceptada de Big Data, estos obstculos epistemolgicos estn presentes para
un abordaje sociolgico de Big Data. Para estos autores, se trata de observar una estructura
comunicativa histricamente novedosa ligada a tres procesos: digitalizacin (o informatizacin
de contenidos), convergencia tecnolgica e Internet. De esta manera, la digitalizacin supone
9

De acuerdo a Kelly (2014) las firmas IBM, HP, Teradata y Dell concentran el 24% de los ingresos
generados por actividades vinculadas a Big Data.

la convergencia de distintos soportes tcnicos que a su vez implican el robustecimiento y


mundializacin de la conectividad de Internet, ofreciendo infraestructura y propagacin dentro
de la red. La digitalizacin se constituye en un medio de comunicacin y en un umbral histrico
a partir de su masificacin, al transformarse en unidades trasladables y transmisibles de
informacin mediante tcnicas de binarizacin. La convergencia tecnolgica se da dentro de
esta digitalizacin y se reducen los grados de libertad del desarrollo de tcnicas, tendiendo a
un acoplamiento tecnolgico que forma una simplificacin funcional o bien, en otros
trminos, una dependencia en la trayectoria de este desarrollo. Incluso esta convergencia
puede ser vista como un fenmeno comunicativo porque se desarrolla en un medio de
comunicacin digital, pero al mismo tiempo condiciona la comunicacin por la simplificacin
funcional, generando una dependencia mutua y el aumentando del riesgo de disrupcin
digital/comunicacional, generalmente mencionado como brecha digital. Finalmente, Internet
ofrece la infraestructura telecomunicativa y su propagacin a nivel mundial. Es por ello que la
emergencia de un medio de comunicacin digital transforma la comunicacin y las estructuras
de propagacin de la comunicacin.
Otra discusin vigente y de orden epistemolgico, tiene que ver con cambios en el paradigma
metodolgico cientfico sobre los lmites y la relacin entre teora y contraste emprico. En este
sentido Manovich (2011) se plantea cmo los Grandes Datos pueden cambiar el mtodo de
investigacin en las ciencias sociales y las humanidades, ya que en la medida que el mundo se
vuelve ms y ms digital, nuevas tcnicas sern necesarias para investigar, analizar y entender
esta cantidad de datos. Una primera manifestacin de estos cambios para el autor sera la
divisin entre los mtodos cuantitativos, comnmente vinculados a las ciencias sociales, y los
mtodos hermenuticos generalmente asociados a las humanidades: ya no sera necesario
elegir entre el tamao de la muestra versus datos en profundidad. Asimismo, el autor advierte
que para poder darle un uso provechoso a los datos masivos, primero hay que tener claro
cules son nuestras limitaciones y por lo tanto, cules deben ser las cualidades que los
analistas de Big Data deben tener. Reivindica de esta manera el rol del analista
(particularmente de los humanistas) frente a una completa automatizacin por mtodos
computacionales a la hora de la limpieza e interpretacin de los datos y la deteccin de
patrones. Si bien mantiene un enfoque optimista sobre el potencial de esta herramienta,
considera que todava se encuentra en una etapa embrionaria, donde las empresas que
recolectan grandes datos la utilizan para detectar patrones de comportamiento y ofrecer
productos, personalizar publicidad, etc. Estas empresas no comparten estos datos, cuanto
mucho ofrecen informacin sintetizada.
boyd y Crawford (2012) consideran a Big Data como un fenmeno cultural, tecnolgico y
acadmico, que descansa en la interaccin de: i) la tecnologa, maximizando la capacidad
computacional y la precisin de los algoritmos; ii) el anlisis para identificar patrones y facilitar
la toma de decisiones; y iii) la mitologa o creencia que grandes cantidades de datos ofrecen
una forma de conocimiento ms elevada y una mejor aproximacin a la verdad. Como todo
nuevo fenmeno socio-tecnolgico, Big Data despierta posiciones utpicas y catastrficas
sobre la nueva etapa: la visin optimista sugerira que Big Data permitir resolver graves
problemas sociales en el rea de salud, terrorismo o inseguridad, cambio climtico, etc.;
mientras que la visin pesimista alerta sobre el advenimiento de una era Big Brother, con
violacin a la privacidad de las personas, menos libertades civiles y mayor control corporativo.
10

Sin embargo, las autoras destacan que posiciones extremas obscurecen la discusin sobre los
cambios vertiginosos que este nuevo fenmeno est protagonizando en un contexto de
incertidumbre: las decisiones que se tomen en el surgimiento de esta etapa, condicionarn su
desarrollo futuro. Considerando la creciente capacidad de recoleccin de datos y de algoritmos
capaces de determinar patrones de comportamiento humano, es necesario discutir qu
sistemas estn motorizando estas prcticas y cules los regulan. En este trabajo, el fenmeno
Big Data adopta una jerarqua semejante al Fordismo: este nuevo fenmeno emerge como un
sistema de conocimiento que est cambiando incluso los mismos objetos de conocimiento10, la
epistemologa y la tica, planteando una transformacin de la teora y el aprendizaje a partir
de nuevas herramientas. En la misma lnea de Manovich (2011), las autoras plantean que la
disponibilidad de grandes cantidades de datos, renueva la discusin sobre objetividad y
subjetividad del mtodo cientfico, particularmente en las ciencias sociales y las humanidades.
La cantidad de datos por s mismos no otorgan objetividad absoluta, ya que los mismos estn
sujetos a interpretacin, de la misma manera que el objeto observado y las decisiones de
investigacin se basan en la subjetividad del investigador: Big Data no se explica por s solo y
los mtodos de interpretacin estn sujetos a debates filosficos11. Esto es as, aun sin
considerar los errores que puedan tener los datos masivos, la dificultad de interpretacin
que se genera por fuentes desconocidas, la (poca) representatividad del conjunto de datos
elegido o la descontextualizacin de los mismos, por mencionar algunos temas. Una mayor
cantidad no necesariamente significan mayor calidad, es decir, no quedan exentos de la
necesidad de mecanismos de validacin de los resultados. El aspecto tico abordado en el
documento tiene que ver con la disponibilidad y el uso de los datos de las personas. Que la
informacin est disponible o parezca pblica, no significa que no deban resguardarse los
derechos de las personas: estar en pblico (ej: estar en un parque), no es lo mismo que la
exposicin pblica (ej: reclamar activamente atencin). Finalmente, las autoras tambin
destacan el problema de la desigualdad en cuanto al limitado acceso a Big Data y la brecha
digital, abordando asimismo la discusin sobre la apropiacin de los datos por parte de las
empresas y la problemtica de las dimensiones pblica y privada.
Bollier (2010) aborda la discusin metodolgica sobre cmo deberan ser elaboradas las
teoras en la Era Big Data y la importancia de la interpretacin de las correlaciones y
predicciones que se realizan a partir del procesamiento de los datos masivos. Hace cinco aos
Google Flu Trends sorprendi con la aparente posibilidad de predecir epidemias en forma
rpida, precisa, econmica y sin teora. De hecho, el estudio ni siquiera planteaba una
hiptesis (Wired 2008). Sin embargo, cuatro aos ms tarde las predicciones del modelo libre
de teora de Google Trends, mostr grandes fallas de prediccin: el problema fue que Google
no analiz cules eran los factores que vinculaban los trminos de bsquedas con la
10

Chen y Chun-Yang (2014) plantean que el fenmeno Big Data, que da lugar a la Ciencia de Datos, se
presenta como un cuarto paradigma cientfico debido a los cambios que las crecientes aplicaciones
intensivas en datos estn provocando en la ciencia. Los otros tres paradigmas habran sido la Ciencia
Emprica (explicacin de la naturaleza basada en experiencia emprica), Ciencia Terica (Leyes de
Newton y Kepler) y la Ciencia Computacional (simulacin cientfica).
11
En trminos ms generales, la realidad no se explica por s sola y por lo tanto un empirismo radical
no es sostenible ya que forma parte de un sistema. De esta manera, un dato ya es una construccin
sobre aquello que es observable, es decir no existe un dato crudo absolutamente puro y objetivo (Forte,
1999).

11

propagacin de la gripe; se ocuparon de correlaciones sin preocuparse por la causalidad.


Grandes cantidades de datos no solucionan por s mismos los problemas estadsticos que
llevan aos de investigacin (FT Magazine, 2014; Lazer et al., 2014). A esto debemos agregar la
representatividad de los datos, como lo demuestra el hecho que en frica apenas ms del 16%
de la poblacin tiene acceso a Internet o el fracaso que result aplicar Google Flu Trends en
Bolivia, donde la poblacin, a diferencia de EEUU, confa ms en la consulta al mdico para el
diagnstico de la gripe antes que la bsqueda en Internet (SciDev.Net, 2014). En este sentido,
Hilbert (2013b) advierte las limitaciones que puede tener Big Data para el desarrollo socioeconmico y rechaza las posturas apologticas que plantean el fin de la teora. El anlisis de
Grandes Datos aporta informacin sobre la estructura y dinmica de hechos pasados, por lo
que su capacidad de prediccin queda sujeta a que no haya cambios significativos. Sin
embargo, el objetivo de las polticas de desarrollo, consiste en crear un nuevo escenario,
diferente al pasado, cambiando la lgica de funcionamiento del sistema socio-econmico y
cultural. Dada la complejidad que esto reviste, por un lado, vale cuestionar cunto puede decir
el pasado sobre el futuro y, por el otro, implementar modelos basados en la teora, cuyos
grados de libertad permitan realizar los ajustes necesarios para la prediccin de
comportamientos, etc. Hilbert propone el uso de Big Data (en tiempo real) en modelos de
simulacin computacional (como modelos basados en agentes), cuya capacidad de adaptacin
permitan ir de la teora general a los casos concretos.
Desde la perspectiva del desarrollo econmico-social, Hilbert (2013a) adopta un esquema
analtico tridimensional entre tecnologa, cambio social y polticas estratgicas que procede de
la literatura del ICT4D (Tecnologas de Informacin y Comunicacin para el Desarrollo) y que
est basado en la nocin schumpeteriana de evolucin social a travs de la innovacin
tecnolgica. Este autor considera que los Grandes Datos aplicados a la toma de decisiones van
a tener un efecto positivo sobre la eficiencia y la productividad similar al que mostraron las TIC
en las dcadas recientes (Peres y Hilbert, 2010), abrindose los mismos problemas para los
pases en desarrollo12. Por lo tanto, aun cuando esto pueda redundar en una mejora en la
toma de decisiones de reas claves como ser la salud, el empleo, la productividad, la seguridad
y el manejo de los recursos naturales; el autor advierte que cuestiones tales como la
privacidad y los aspectos tcnicos/tecnolgicos, se encuentran agravados en los pases en
desarrollo por otros factores como el atraso tecnolgico, la falta de infraestructura y la
carencia de personas capacitadas: este nuevo paradigma se desarrollara a travs de un
proceso de difusin lento y desigual, comprometido por la falta de infraestructura, de capital
humano y la falta de disponibilidad de recursos econmicos e institucionales en los pases en
desarrollo. Esto abre una nueva brecha digital basada en el anlisis de datos para la toma de
decisiones inteligentes. Por lo tanto, la mejora en el desarrollo econmico y social no se da
automticamente, sino que requiere elaborar estrategias y polticas pblicas especficas. En
esta misma direccin, UN Global Pulse (2012: 6) considera que Big Data aplicado al desarrollo
significa convertir datos imperfectos, complejos y desestructurados en informacin
procesable, aunque esto no se da automticamente.

12

En los pases en desarrollo el problema con las TIC es que la demanda es poco sofisticada y por lo
tanto se limita la emergencia de una oferta de mayor complejidad. Buena parte de las soluciones suelen
ser de tipo incorporado que se generan en pases desarrollados.

12

De acuerdo a estos enfoques, ms all de la escala de los Grandes Datos, la clave del nuevo
paradigma es el anlisis sistemtico de datos masivos, previo a y para una mejor toma de
decisiones. Este proceso podra ser entendido como un paso natural en la evolucin de la Era
de la Informacin o Sociedades de la Informacin (en trminos de Bell, Castells, etc.) hacia
las Sociedades del Conocimiento: basadas en la infraestructura digital que permite un vasto
incremento de la informacin, el desafo actual consistira en convertir la informacin digital
en conocimiento para la toma de decisiones inteligente. (Hilbert 2013)13.
Por lo tanto, aceptando la posicin que plantea estar en presencia de un cambio
paradigmtico en la forma de generar la informacin y transformarla en conocimiento, no
debemos dejar de mencionar algunos aspectos estructurales de la creacin y apropiacin de
valor a partir de la informacin. Por un lado, es necesario destacar que la informacin mientras
ms se sociabiliza, ms se valoriza, esto es, mientras haya ms personas trabajando con un
determinado conjunto de datos, mejores y ms resultados se pueden obtener. Sin embargo,
esta proposicin entra en contradiccin con la lgica de acumulacin vigente, caracterizada
por una frgil inclinacin a la libre difusin de la informacin y el conocimiento. Los datos, la
informacin, el conocimiento son activos sociales que no se agotan con el uso y, salvo por el
soporte fsico que necesiten para estar disponibles, tampoco son exclusivos por lo que lo nico
que puede imponer una limitacin en la difusin de estos son los medios sobre los que se
diseminan (i.e. soporte tecnolgico). Quien accede a controlar los medios, puede controlar los
contenidos. En el caso particular de Big Data es importante sealar que quien genera el dato
no necesariamente es quien lo almacena: el 70% del total de los datos mundiales est
almacenado en Norteamrica y Europa, lo que se expresa como brecha digital o
informacional14. Manovich (2011) sugiere que este nuevo fenmeno crea una nueva divisin
de clases o data-clases en la sociedad: i) aquellos quienes generan los datos: la mayora de la
poblacin; ii) aquellos que tienen los medios para recolectarla: muy pocos; iii) aquellos que
tienen la capacidad para analizarla: un sector an menor de la sociedad. Existen por lo tanto
jerarquas y relaciones de poder, debido a que quienes poseen los medios para captar los
datos, tienen el poder para apropiarse de la renta generada. boyd y Crawford (2012), aceptan
esta divisin en data-clases y agregan la distincin Big Data ricos - Big Data pobres al interior
de los sectores que acceden de una u otra forma a los datos masivos (ej: Universidades).
En principio, una alternativa es hacer pblicos los datos pero esto abre al menos otros dos
planteos: i) Cmo hacer pblicos los datos que se relevan de forma privada?; ii) Quin
recopila los datos? La recopilacin y limpieza de los datos es parte del proceso de anlisis
donde la objetividad del dato en bruto ya se pierde y queda condicionada por la forma en
que se recopila y selecciona y, por lo tanto, a los intereses de quien realiza esta tarea, lo cual
no necesariamente est ajustado a la poltica de desarrollo adoptada por el pas o la regin. Al
respecto UN Global Pulse (2012) plantea entre los desafos para el desarrollo, dimensiones
tales como: i) la privacidad: implicancias conceptuales, legales y tecnolgicas; ii) el acceso y
disponibilidad: la reticencia de las empresas privadas y otras instituciones para compartir datos
13

Los autores que menciona Hiberlt (2013a) forman parte de un debate acerca de la caracterizacin y
denominacin de las distintas Eras o Sociedades, que no ser abordado en el presente trabajo. Sin
embargo, vale destacar que, si bien se menciona el paso hacia un nuevo tipo de sociedad, no
consideramos que dicho trnsito sea automtico, sino que un proceso path dependence es necesario.
14
Para una discusin vigente en Amrica Latina ver AmbitoOnLine (2014)

13

sobre clientes, usuarios, operaciones, etc.; iii) anlisis: a la pregunta qu est sugiriendo el
dato?, debemos agregar el desafo de obtener el dato correcto, darle sentido y detectar las
anomalas. Los desafos aqu planteados estn sujetos a todo tipo de subjetividad. Un caso
importante y estratgico para los pases en desarrollo es el de los recursos naturales, donde la
tecnologa para la explotacin suele estar en manos privadas (nacional o extranjera) y por lo
tanto el uso monoplico de la informacin puede dar lugar a la apropiacin privada de rentas
informacionales.

2. Definicin de Big Data y aspectos tcnicos


Una primera aproximacin al tema Big Data nos lleva a responder la pregunta qu es Big
Data, de qu se trata? Dada la novedad, el tema todava no se halla suficientemente
delimitado, aunque podemos encontrar varios puntos en comn entre las definiciones
planteadas por la comunidad acadmica, los tcnicos y los profesionales que se encuentran
indagando sobre el mismo.
Una definicin (tcnica) que se desprende del nombre del tema, refiere a la escala o volumen
del conjunto de datos. McKinsey (2011: 1) ofrece una definicin intencionalmente subjetiva
y dinmica, a partir de las limitaciones tecnolgicas de un determinado perodo: Big Data
refiere a un conjunto de datos cuyo tamao est ms all de la capacidad que tienen los
software de base de datos para capturar, almacenar, administrar y analizar. De esta manera,
a medida que la frontera tecnolgica se va modificando, el tamao del conjunto de datos que
califica como Big Data tambin ir cambiando. De esta manera, hablamos de Big Data cuando
el tamao se vuelve parte del problema. Si bien el volumen es un punto en comn, otras
definiciones incorporan ms dimensiones al anlisis. Algunas compaas que investigan sobre
el tema15 suelen caracterizar el tema a partir de los desafos que Big Data genera no slo a
partir del volumen, sino tambin de la variedad y la velocidad (3Vs), incluso dndole mayor
importancia a estas ltimas. Con variedad se suele hacer referencia a la heterogeneidad de la
representacin e interpretacin semntica de los datos, es decir, que no estn directamente
listos para ser integrados a una aplicacin16; mientras que con velocidad (o timeliness segn el
trmino en ingls) se hace referencia tanto a la frecuencia de disponibilidad de los datos, como
con el tiempo en el que hay que dar respuesta; la importancia reside en la velocidad del
feedback, utilizando los datos para la toma de decisiones. En algunas ocasiones tambin se
incluye una cuarta V que remite a valor, variabilidad o virtual (Dumbill 2012, Armah, 2013;
OECD, 2013; Chen y Chun-Yang 2014). A pesar de la importancia de estas caractersticas, segn
la publicacin White Paper (2012) restara incluir privacidad de las personas17 y facilidad de uso
(usability).
15

Gartner (2011), UN Global Pulse (2012), por nombrar algunos.


Algunas estimaciones consideran que los datos no-estructurados alcanzan entre el 80%y el 85% de los
datos totales estn mayormente sub-aprovechados (OECD 2013).
17
Segn Cumbley y Church (2013), el anlisis de Big Data consta de cuatro etapas: i) recoleccin; ii)
combinacin; iii) anlisis; y iv) uso. Para analizar el riesgo de violacin de la privacidad de las personas
debemos comenzar por la etapa de recoleccin de datos que abarca: i.a) las comunicaciones
electrnicas (ej: correos electrnicos); i.b) Internet tracking (ej: cookies); i.c) tecnologa para
identificacin de radiofrecuencia o Radio Frequency Identification - RFID (ej: Octupus Card en Hong
16

14

Es decir, Big Data son datos que exceden la capacidad de procesamiento de los sistemas de
base de datos convencionales, caracterizados por un gran volumen, por la gran velocidad a que
se transmiten y por no ajustarse a las restricciones de las bases de datos convencionales. La
definicin de Big Data aceptada al momento se basa en las caractersticas y limitaciones que
este nuevo paradigma tecnolgico informacional impone sobre las capacidades tcnicas y
cognitivas actuales. Crear valor a partir de los Grandes Datos exige cambios en la forma de
procesar los datos, de pensar y de plantear los problemas.

2.1 Anlisis de Big Data. Un esquema conceptual


Siguiendo a Hilbert (2013a), lo crucial de Big Data no es el gran aumento de los datos en s
mismo, sino su anlisis para la toma de decisiones inteligente, por lo que prefiere la expresin
Big Data Analysis a la de Big Data. En este sentido, boyd y Crawford (2012) consideran que
la novedad de Big Data, ms que el volumen, se encuentra en las capacidades de bsqueda y
agregacin de grandes cantidades datos relacionados (cross-reference data sets). Por otro
lado, sin diferir en lo sustancial con lo anterior y ofreciendo un esquema analtico ms claro a
los fines conceptuales18, el White Paper (2012) sugiere que el anlisis de Big Data involucra
mltiples fases que plantean un desafo en s mismo y proponen un esquema lineal para
caracterizar todo el sistema, al que agregamos un proceso de retroalimentacin.
Figura N 1. Secuencia de Anlisis de Grandes Datos.

PLANTEO DEL PROBLEMA:


"FORMULACIN DE LA PREGUNTA
CORRECTA"

Recopilacin /
Captura de Datos

Variedad
(Heterogeneidad)

Limpieza de
Datos

Volumen (Escala)

Integracin /
Agregacin

Velocidad
(Timeliness)

Anlisis /
Modelizacin

Privacidad

Interpretacin

Interpretacin /
Disponibilidad

3V

Sistema Global

Arriba: las principales etapas en el anlisis de Big Data.


Abajo: las caractersticas de Big Data que hacen de esta tarea un desafo.
Fuente: Elaboracin propia en base a White Paper (2012)

Kong, Oyster en Londres, SUBE en Argentina, etc.); i.d) geolocalizacin a travs de smartphones y
tracking vehicular (ej: GPS); i.e) video vigilancia (ej: cmaras en espacios pblicos y privados); i.f)
informacin financiera (ej: consumo tarjeta de crdito, pago electrnico, etc.); i.g) conservacin de
registros electrnicos (ej: nube digital para almacenar informacin).
18
Otras consideraciones sobre el esquema de Big Data incorpora el uso de las herramientas vigentes
Map Reduce, SQL, NoSQL, etc. Ver Tekiner y Keane (2013)

15

Si bien la etapa de Anlisis/Modelizacin (Analysis/Modelling) suele ser la que mayor atencin


atrae segn los autores, no se obtienen demasiados resultados si se descuidan el resto de las
etapas y contexto en el cual se realiza el anlisis de Big Data. La fase de filtrado y limpieza de
los datos puede demandar hasta el 80% del trabajo de anlisis19. Si aceptamos esta estimacin
y tenemos en cuenta que una vez que el dato es manipulado se pierde su objetividad
intrnseca, prcticamente no hay objetividad posible. Por lo tanto, quien tiene la propiedad de
los datos (o los medios para apropiarse de ellos) y quien realiza el anlisis es determinante en
la construccin de sentido.
Esto agrega otro desafo en el anlisis de Big Data: no slo plantea un problema tcnico de
hardware y software, sino tambin requiere tcnicos y profesionales capacitados para llevar a
cabo esta tarea. De acuerdo a Peter Sondergaard, vice presidente de Gartner, empresa
dedicada a la investigacin de IT, en 2013 pronosticaba una demanda de 2 millones de
cientistas de datos20 en los prximos tres aos slo para EEUU (y de 4 millones para todo el
mundo), de los cuales slo un tercio seran cubiertos. Incluso, sugera que cada puesto
relacionado con Big Data en EEUU generar tres empleos por fuera de IT, ofreciendo 6
millones de nuevos puestos de trabajo en tres aos (CNN Money, 2013).
Existen una gran variedad de tcnicas y tecnologas para agregar, manipular, analizar y
visualizar los Grandes Datos desarrolladas a partir de diferentes campos como la estadstica,
las ciencias de la computacin, la matemtica aplicada y la economa, a partir de un enfoque
flexible y multidisciplinario21. La European Comission (2013) elabor la siguiente lista de
tcnicas, tecnologas y herramientas:
Figura N2. Diferentes tipos de Tcnicas, Tecnologas y Herramientas de Visualizacin de Big Data

Tcnicas

Tecnologas

Visualizacin

A/B Testing
Association rule learning
Data Mining
Algoritmos genticos
Redes neuronales

Cassandra
Cloud computing
Extraer, transformar y cargar
Hadoop
SQL
NoSQL

Tag clouds
Conversation clouds
Grficos de clusters
Flujos histricos
Flujos de informacin espacial

Fuente: European Commision (2013)

19

http://strata.oreilly.com/2012/01/what-is-big-data.html
La Ciencia de Datos aparece como una nueva profesin vinculada a las ciencias matemticas,
estadsticas y computacionales, con perfil analtico y capacidad de un abordaje multidisciplinario de los
problemas: http://tecno.americaeconomia.com/noticias/el-cientifico-de-datos-una-nueva-y-necesariaprofesion
21
Para un detalle de las tcnicas, tecnologas y herramientas de visualizacin de Big Data vigentes,
consultar McKinsey (2011, Captulo 2, p. 27-36). Ver Apndice.
20

16

3 Big Data: aplicaciones sociales y econmicas. Oportunidades

para el desarrollo.
En este apartado se relevan en forma an preliminar los sectores que, de acuerdo a la
literatura, muestran experiencias en el uso de Big Data.

3.1 Salud
McKinsey (2011 y 2013) han estudiado el potencial impacto de Big Data en el incremento de la
productividad del sector salud en EEUU. Este sector fue elegido por: i) participacin en el PIB
de EEUU (17% - 2010); ii) la necesidad del sector de aumentar la productividad: en la ltima
dcada, el gasto en salud creca al 5% anual y en 2007 el gasto per cpita ajustado por poder
adquisitivo era un 30% superior al promedio de los pases de la OECD, sin mostrar mejores
resultados en los cuidados de la salud; iii) las partes involucradas: industria farmacutica y de
productos mdicos, proveedores y pacientes.
Considerando las inversiones necesarias en tecnologa, personal capacitado, cuidado de la
privacidad y con los incentivos adecuados, el estudio estimaba que las ganancias potenciales
con Big Data en diez aos ascenderan a 300 mil millones de dlares anuales, explicndose dos
tercios de dicho valor por reducciones en los gastos de atencin de la salud. Esto es un 8% del
nivel de gasto estimado en salud para 2010. Las estimaciones conservadoras de productividad
sugieren una mejora del 0,7% anual a partir de la reduccin de costos por tratamientos
(drogas) poco efectivos, reduccin de efectos adversos provocados por tratamientos,
reduccin de errores mdicos y criterios sesgados hacia intervenciones poco efectivas,
deteccin de patrones en las patologas, monitoreo remoto de los pacientes y sistemas
personalizados. Los principales desafos son: i) la digitalizacin de gran parte de la
documentacin (i.e. historias clnicas) y la manipulacin de imgenes; ii) la privacidad; iii) la
compartimentacin de la informacin entre las empresas y organismos pblicos; iv) personal
capacitado.
Por otro lado, el trabajo menciona algunas aplicaciones de Big Data en la salud en EEUU, UK e
Italia que mostraron buenos resultados, principalmente vinculados al efecto adverso y
efectividad de medicamentos y tratamientos.
El uso de Big Data puede mejorar el monitoreo de la salud pblica y la capacidad de respuesta,
a partir de una base de datos de pacientes y tratamientos que permita una coordinada y
temprana deteccin de enfermedades infecciosas, como as tambin reducir los tiempos de
investigacin. Wired (2010) muestra los resultados de una investigacin sobre el mal de
Parkinson alcanzados por el Modelo Tradicional de investigacin del National Institute of
Health y el modelo empleado por la organizacin Parkinsons Genetic Iniative. El primer
modelo sigue el esquema tradicional: i) planteo de hiptesis; ii) estudios; iii) recoleccin de
resultados; iv) anlisis; v) elaboracin del documento; vi) presentacin del documento en The
New England Journal of Medicine; vii) aceptacin del documento; viii) publicacin. El otro
modelo: i) preparacin de la herramienta: i.e. encuesta; ii) reclutamiento de pacientes; iii)
recoleccin de resultados; iv) anlisis; v) presentacin de resultados en el encuentro de la
Royal Society of Medicine en Londres, esperando publicar un documento ms tarde. Lo
17

interesante es que ambos estudios llegaron prcticamente a los mismos resultados, aunque al
tradicional le llev seis aos y al segundo slo 8 meses.
Hilbert (2013a) cita un estudio de caso en EEUU sobre atencin mdica de lesiones de cadera y
de antebrazo cuyas conclusiones permiten identificar cuatro tipos de variaciones en el
tratamiento y afeccin de determinadas patologas: i) patrn geogrfico-ambiental; ii) errores
mdicos; iii) criterios sesgados: i.e. necesidad de ciruga; iv) sobre utilizacin y sobre oferta de
intervenciones y gastos en algunas regiones por abundancia.
Harding y Lovenheim (2014) estudian el rol de los precios en el patrn de consumo y nutricin
en EEUU entre 2000-2007, combinando tcnicas de demanda estructural con el enfoque de Big
Data22. Esto les permite caracterizar las decisiones de consumo e investigar el efecto de
diferentes impuestos a los alimentos para mejorar el impacto nutricional del consumo
alimenticio y prevenir problemas de obesidad. La conclusin es que el impacto de una poltica
impositiva sobre los componentes nutricionales es ms efectivo sobre el consumo alimenticio
saludable, que la aplicacin de impuestos sobre los productos.

3.2 Administracin Pblica


McKinsey (2011), estudia cmo incrementar la productividad del sector pblico en la Unin
Europa que representa un 50% del PIB y cuyo principal factor a tener en cuenta es el
envejecimiento de la sociedad que imprime presin sobre el dficit fiscal. Si bien el sector
pblico genera menos datos (medidos en bytes) respecto al sector de la salud, la ventaja es
que el 90% de esta informacin est digitalizada. El estudio se centraliz en las agencias de
recaudacin de impuestos y de trabajo. De acuerdo a los clculos, el sector pblico en 23 de
los Estados ms grandes de Europa puede crear potencialmente entre 150 y 300 mil millones
de euros en los prximos diez aos, lo que representara un aumento de la productividad del
0,5% anual, de mantenerse la tendencia. Las tres dimensiones identificadas para este aumento
son: i) eficiencia operativa; ii) reduccin de errores y fraudes en la administracin de
beneficios; iii) reduccin de la brecha fiscal (recaudacin potencial menos recaudacin real) a
partir de un incremento de la recaudacin de impuestos. Un factor que puede ayudar es
incrementar la transparencia, mientras que uno de los principales desafos metodolgicos es
medir la productividad en este sector.
Por otro lado, Einav y Levin (2013) destacan que el sector pblico es una gran fuente de datos
en sectores tales como seguridad social, sistema impositivo, programas sociales y educacin.
Estas fuentes estn subutilizadas, aunque hay algunos casos positivos en pases europeos
donde se releva informacin demogrfica individual, situacin de empleo y salud de la
totalidad de la poblacin. Cita tambin un trabajo de inequidad en la distribucin del ingreso
de Piketty y Saez (2003) y la situacin del percentil ms rico de EEUU entre 1913 y 1998, a
partir de los datos de lRS (Internal Revenue Service), como potencial aplicacin de esta
herramienta.

22

Segn los autores, el enfoque Big Data que utilizan se basa en la vinculacin conjunta de varias bases
de datos grandes para proporcionar una visin global de consumo, precios, caractersticas nutricionales
de los alimentos comprados y el entorno que se realiz la compra.

18

Hilbert (2013a) menciona aplicaciones con referencias geogrficas (GPS) para la administracin
del trnsito til para el transporte pblico, polica, bomberos, planificacin urbana, etc. En
Estocolmo, taxis y camiones provistos con GPS envan informacin cada 30 y 60 segundos,
ofreciendo un panorama del trnsito en tiempo real que, sumado a los datos histricos y
climticos, permite elaborar proyecciones sobre las condiciones del trnsito (ver Biem et al.
2010). Tambin este tipo de relevamiento sirve para hacer un mapeo del delito como ya fue
aplicado en Chicago. En este documento se halla tambin una discusin sobre el potencial
aprovechamiento de los datos por el sector pblico y sobre el resguardo de la privacidad.

3.3 Recursos Naturales, Medio Ambiente y Energa


Hilbert (2013a) aborda la discusin de la difusin de la informacin y la competitividad a partir
de los casos registrados en recursos naturales. La evidencia sugiere que una mayor
disponibilidad de los datos que es posible recolectar con la tecnologa disponible en petrleo,
gas y la industria minera, aumenta la transparencia y no afecta la competitividad de la
actividad.
En este trabajo, el autor tambin menciona aplicaciones a medio ambiente, prevencin de
desastres climticos y alerta temprana (ver UNU 2012), cuellos de botella en recursos
naturales y aplicaciones concretas de seguimiento del clima y el comportamiento social para
comercio minorista.
Otro sector para tener en cuenta respecto de los recursos naturales es el agro y la agricultura
de precisin. Este caso ya est mostrando desarrollos en Argentina de la mano del proyecto de
la Fundacin Sadosky con la Asociacin Argentina de Consorcios Regionales de
Experimentacin Agrcola (AACREA). La agricultura de precisin permite realizar un mapeo
del suelo obteniendo datos sobre componentes qumicos, humedad, etc. Tambin ya existen
aplicaciones de sensores y Big Data para la produccin de alimentos y biotecnologa (Carvalho
et al. 2014; La Nacin 2014a)
Dada la dependencia de combustibles fsiles importados en Taiwn, Chou y Telaga (2014)
realizan un estudio experimental de 17 semanas, donde desarrollan una metodologa para
predecir y detectar anomalas del consumo elctrico en edificios de oficina en tiempo real. Los
datos pueden ser recogidos por medidores inteligentes (smart meters) en tiempo real. La
metodologa consta de dos etapas, una de prediccin que permite la planificacin del consumo
energtico y otro de deteccin de anomalas que permite identificar patrones de
comportamiento. Ambos contribuyen a la eficiencia en el consumo energtico.

3.4 Industria Manufacturera


McKinsey (2011) considera que si bien la industria manufacturera ha registrado altos niveles
de productividad y eficiencia durante los 90s, todava pueda alcanzar mejoras a travs de Big
Data en: i) eficiencia en diseo y produccin; ii) mejoras en calidad del producto; iii) mejoras
en la comercializacin, promocin y distribucin. Segn el estudio, la consultora identific
siete niveles potenciales que el sector puede obtener mejoras gracias a Big Data a travs de
toda la cadena de valor y que pueden agruparse en cuatro grupos: i) I+D; ii) Reduccin de la
incertidumbre a travs de proyecciones de demanda y planeamiento de la cadena de
19

suministro; iii) Eficiencia en la produccin a partir de tcnicas de simulacin, sensores, etc.; iv)
Estrategias de comercializacin y servicios post-venta.

3.5 Transporte
Li, Hongfei, et al. (2014) utilizan grandes volmenes de datos histricos, que pueden ser
recolectados en tiempo real por sensores, para aumentar la velocidad de la red ferroviaria y
dar respuesta al aumento de la demanda del servicio. Combinando datos histricos con datos
de fallas, de mantenimiento y climticos, buscan elaborar modelos para predecir fallas (ej:
descarrilamiento) en el servicio como forma de aumentar la velocidad de la red. Para ello
utilizan tcnicas de aprendizaje automtico (machine learning) que les permite disear un
sistema de alarma para responder ante la probabilidad de fallas, ganando en seguridad y
mejorando los tiempos del servicio.
Otras de las aplicaciones ms difundidas y con mayor potencial de Big Data es en la
optimizacin del transporte en sentido amplio, esto es, desde transporte pblico urbano hasta
aerocomercial. De acuerdo a un relevamiento realizado por European Commission (2013), en
Francia ya se ha implementado el uso de Big Data proporcionando herramientas de anlisis en
tiempo real para minimizar los costos operativos asociados con el mantenimiento no
programados de las aeronaves.

3.6 Otras Alternativas que ofrece Big Data


En el White Paper (2012) se mencionan otras aplicaciones de Big Data que enumeramos a
continuacin: i) astronoma (ver SDSS-III, 2008): Big Data de imgenes; ii) sector financiero:
anlisis de riesgo financiero sistmico a partir de compartir datos que las entidades recogen
digitalmente; iii) medio ambiente: a travs de la difusin de sensores permite realizar avances
en cuestiones medio ambientales tales como cursos de ros, emisiones de humo en incendio
de reservas; iv) bioinformtica: a partir de las nuevas tecnologas de secuencias (Next
Generation Sequencing) se podr alcanzar ms cantidad y calidad de datos genticos; v) salud:
mejora de calidad y reduccin de costos; vi) planeamiento urbano; vii) transporte
inteligente; viii) seguridad: i.e. crimen organizado
Armah (2013) hace un relevamiento, para el Banco de Canad, del uso potencial de grandes
volmenes de datos para estimar variables econmicas tales como el PBI, la inflacin y el
desempleo, con una mayor frecuencia que la permitiran los ndices oficiales y tradicionales.
Considerando que la poblacin tiende a utilizar cada vez ms medios de pagos electrnicos y
de la disponibilidad de datos digitales tempranos para el anlisis, podran estimar nivel de
actividad econmica con mayor frecuencia. Entre los desafos que hay que afrontar, destacan
aspectos metodolgicos, de acceso a los datos y de privacidad de las personas.
Choi y Varian (2011) hacen una revisin sobre aplicaciones de Google Trends para nowcasting,
esto es a diferencia de forecasting que intenta predecir el futuro, predecir el presente. Entre
las destacadas y ms conocidas se encuentran la prediccin de la tasa de desempleo a partir de
las bsquedas en la web, demanda de automviles, epidemias, destinos tursticos e inflacin.
Tambin realiza un estudio propio para destinos viajes, desempleo, confianza del consumidor y
demanda de automviles.
20

UN Global Pulse (2012) menciona aplicaciones una metodologa desarrollada por la


International Food Policy Research Institute (IFPRI) para detectar volatilidades de precios en
los alimentos que pongan en riesgo la seguridad alimentaria de determinados pases. Tambin
destaca un sistema aplicado a la deteccin de la amplitud de sismos y terremotos o epidemias
basados en mensajes de Twitter. Este organismo se encuentra llevando adelante un proyecto
con una firma privada de anlisis de social media, para estudiar el comportamiento de la
poblacin de EEUU e Indonesia sobre determinados tpicos como vivienda, alimentos,
petrleo, etc. Entre las virtudes que destaca del estudio del comportamiento humano, esta
organizacin sugiere que se pueden avanzar en tres reas: i) sistemas de alerta temprana; ii)
alertas en tiempo real; iii) retroalimentacin en tiempo real: i.e. impacto de polticas pblicas.

Conclusin
Big Data surge como una nueva fase del paradigma intensivo en comunicacin e informacin
surgido a partir de la revolucin tecnolgica iniciada en la dcada del 70. En este sentido, si
bien ofrece oportunidades para alcanzar tanto mejoras en competitividad y productividad
como en opciones para la mejora en la calidad de vida con potenciales beneficios para los
pases en desarrollo, se requieren importantes desarrollos en el rea de TIC. Si bien Big Data
abre oportunidades, el anlisis de datos masivos para la toma de decisiones inteligentes pone
de manifiesto la necesidad de generar capacidades para superar la brecha digital.
Por lo tanto, la materializacin de los potenciales beneficios para pases en desarrollo, requiere
la elaboracin de polticas activas y especficas que tengan en cuenta la generacin y
apropiacin de rentas informacionales, el manejo de la privacidad en cuanto a datos
personales, el desarrollo de capacidades para la creacin de valor y la difusin de la
informacin y el conocimiento para contribuir a la reduccin de desigualdades
socioeconmicas.
Si bien necesitaremos profundizar en los sectores de aplicacin de Big Data en Argentina, a
continuacin suministramos una lista preliminar con potenciales reas de aplicacin:
1. Agropecuario: los avances tecnolgicos y cientficos del sector lo convierten en una
potencial rea de aplicacin. De hecho, la Fundacin Sadosky y AACREA estn
desarrollando actividades conjuntamente. Sin embargo, no hay que descartar las brechas
de productividad que existen con el resto de los sectores, quines se apropian de la renta
informacional y la sustentabilidad del modelo de negocio que se aplica al sector;
2. Biotecnologa: El potencial de Big Data en el rea de la salud es alentador. Argentina tiene
desarrollos e investigacin en secuenciacin genmica, medicina personalizada,
bioinformtica, etc. El INQUIMAE de la Facultad de Ciencias Exactas y Naturales de la UBA,
ha realizado estudios y aplicaciones al respecto: los sectores de implementacin pueden
ser agropecuario (medicina veterinaria, genoma de especies), salud (medicina
personalizada), seguridad (perfil gentico), biotecnologa de combustibles;
3. Clima: dada las herramientas satelitales del pas y las capacidades desarrolladas por
ARSAT, se podran obtener datos para combinarlos con el sistema de transporte y logstica,
prevencin de desastres naturales, planificacin urbana, agricultura, etc.;
21

4. Deporte: existe actualmente el anlisis de datos masivos aplicados al deporte tales como
en ftbol, tenis, atletas en general, etc. Con el impulso que ha recibido el deporte
argentino en los ltimos aos, esta podra ser una oportunidad para vincular a los equipos
de alto rendimiento nacionales con proyectos Big Data (La Nacin 2014.b).
5. Energa: particularmente en lo que refiere a energa elctrica, existe un relevamiento de
CAMESA en tiempo real sobre consumo que podra servir para determinar patrones de
comportamiento y predecir problemas en el sistema;
6. Entretenimiento: Redes sociales, juegos, aplicaciones mviles;
7. Nanotecnologa: Dado el desarrollo del rea en el pas, se podra aplicar para la
administracin y almacenamiento de datos, dando solucin a las limitaciones del ancho de
banda. Desde el Ministerio de Ciencia, Tecnologa e Innovacin se estn otorgando
subsidios para proyectos de nanotecnologa que incluyan nanomateriales,
nanointermediarios y nanosensores.
8. Salud: el avance en la digitalizacin de historias clnicas e imgenes ofrece una
oportunidad para lograr reducciones de costos, deteccin de irregularidades y eficiencia
en los tratamientos mdicos. Hay que tener en cuenta que con sector salud nos
referimos a un amplio espectro que involucra no slo a los prestadores mdicos, sino
tambin la industria farmacutica y de insumos de salud, sindicatos, obras sociales, etc;
9. Software y servicios informticos: se desarrollan motores de bsqueda; se realizan
desarrollo de herramientas para la bsqueda de informacin basada en contextos
temticos; tambin se investiga en software de datamining genmico y farmacutico.
10. Subsidios: estrechamente vinculado al transporte, se cuenta con informacin de la tarjeta
SUBE que junto a otras bases de datos permitira una mejor asignacin de los subsidios;
11. Transporte: a partir de herramientas geo-referenciales se pueden realizar modelos de
administracin del trnsito, transporte pblico y planificacin urbana. Tambin se pueden
realizar aplicaciones dinmicas continuas de informacin del transporte pblico tales como
la deteccin de problemas, frecuencia y patrones de uso del servicio por parte de los
pasajeros (Tarjeta SUBE);
Es importante tener en cuenta que las aplicaciones de Big Data no se darn de forma
automtica. Su implementacin no slo est sujeta a la disponibilidad de trabajadores
calificados o la previa inversin en TIC, sino tambin a las barreras que puedan imponer el
contexto institucional, poltico y cultural particular de los sectores, como as tambin los
intereses econmicos de los actores involucrados. Asimismo, un tema central en la aplicacin
de polticas exitosas ser el tratamiento de la privacidad de los datos de las personas para que
no haya un dao en la integridad de las mismas y un descrdito de la herramienta que
obstaculice un mejor aprovechamiento de sus beneficios. En este marco, Argentina ha
desarrollado capacidades tcnicas y potencialidades que permitiran aprovechar este avance
informacional-tecnolgico en la contribucin para generar un sendero de desarrollo
econmico y social virtuoso.

22

Apndice: Tcnicas y tecnologas vigentes para el tratamiento de


Big Data23
Actualmente las tcnicas y tecnologas para la captura, procesamiento, anlisis y visualizacin
de Big Data se clasifican en tres categoras de herramientas de procesamiento: i) por lotes; ii)
por flujos (streaming); y iii) de anlisis interactivo (Chen, et al., 2014). Las primeras se basan en
la infraestructura de Apache Hadoop, tales como Mahout y Dryad. Para herramientas de
procesamiento streaming suelen utilizarse plataformas Storm o S4, mientras que para el
anlisis interactivo las plataformas suelen ser Dremel de Google y Apache Drill.
Tcnicas
Las tcnicas que se enuncian aqu son algunas de las usadas, por lo que esta lista no pretende
ser exhaustiva, teniendo en cuenta que los desarrollos en esta materia estn en permanente
crecimiento.

A/B testing: un grupo de control es comparado con una variedad de grupos de testeos
para determinar cul es el mejor procedimiento para alcanzar un objetivo particular. Big
Data permite realizar varios testeos asegurando grupos suficientemente grandes.
Association rule learning: conjunto de tcnicas para descubrir relaciones entre variables
en grandes bases de datos
Data mining: tcnicas para extraer patrones de grandes bases de datos, combinando
mtodos estadsticos y machine learning. Estas tcnicas incluyen association rule learning,
cluster analysis, classification y regresin.
Genetic algorithms: tcnica de optimizacin inspirada en procesos de evolucin natural
(supervivencia del ms apto). Usualmente son caracterizados como algoritmos
evolutivos.
Machine Learning: vinculado al diseo y desarrollo de algoritmos que permiten a las
computadoras desarrollar comportamientos basados en datos empricos. NLP (Natural
language processing), es un ejemplo de machine learning.
Redes Neuronales: modelos computacionales inspirados en la estructura de redes
neuronales biolgicas (ej: clulas y conexiones dentro del cerebro), para buscar patrones
en el set de datos y optimizacin.

Tecnologas

Cassandra: administrador de base de datos open source (cdigo abierto) para el


tratamiento de grandes cantidades de datos en un sistema distribuido. Es un proyecto
Apache Software.
Cloud computing: (o nube de cmputo) paradigma computacional en el que los recursos
de computacin altamente escalables, a menudo configurados como un sistema
distribuido, se ofrecen como un servicio a travs de una red.

23

La mayor cantidad de definiciones fueron obtenidas de McKinsey (2011). Tambin puede consultarse
Chen, et al. (2014).

23

Extract, transform, and load (ETL): herramientas de software utilizadas para extraer datos
de fuentes externas, transformarlas para satisfacer las necesidades operativas, y cargarlos
en una base de datos.
Hadoop: Estructura de software de cdigo abierto para el procesamiento de grandes bases
de datos en sistemas distribuidos. Su desarrollo fue inspirado por Googles MapReduce y
Google File System, desarrollado originalmente por en Yahoo! Y actualmente administrado
como proyecto de Apache Software Foundation.
HBase: Base de datos abierta, distribuida y no relacionada, modelada en Googles Big
Table. Orginalmente desarrollada por Powerset, actualmente es administrada por Apache
Software foundation como parte de Hadoop.
MapReduce: modelo de programacin inspirado por Google para procesamiento de
grandes bases de datos en sistemas distribuidos. Fue implementado tambin por Hadoop.
SQL: (structured query language o lenguaje de consulta estructurado), lenguaje de
computacin designado para administrar base de datos relacionales, permitiendo
especificar distintos tipos de operaciones.

Visualizacin
Las herramientas de visualizacin permiten comunicar, entender y mejorar el anlisis de los
resultados obtenidos a partir de Big Data, en forma eficiente.

Tag Cloud: o nube de texto ponderada, donde las palabras utilizadas ms frecuentemente
aparecen en forma ms grande que las menos frecuentes.
Clustergram: tcnica de visualizacin utilizada para mostrar cmo miembros de una base
de datos se asignan a un cluster a medida que el nmero de clusters se incrementa.
History Flow: tcnica de visualizacin que grafica la evolucin de un documento a medida
que este es editado por mltiples autores contribuyentes.
Spatial information flow: muestra cmo fluyen los datos en forma espacial, es decir, de
una regin, pas, ciudad, etc. a otra.

Referencias Bibliogrficas

AmbitoOnLine (2014). GLASER: Necesitamos una internet menos dependiente de EEUU Diario mbito
Financiero, versin on line, Buenos Aires. Abril 2014.
Disponible: http://www.ambito.com/diario/noticia.asp?id=735458

Armah, N. A. (2013). Big Data Analysis: The Next Frontier. Bank of Canada Review, 2013 (Summer), p. 32-39.
Disponible: http://www.bankofcanada.ca/wp-content/uploads/2013/08/boc-review-summer13-armah.pdf

Barletta, Pereira, Robert y Yoguel (2013), Argentina: Dinmica reciente del sector de software y servicios
informticos, Revista CEPAL N 110. Agosto 2013.
Disponible: http://www.cepal.cl/publicaciones/xml/2/49262/BandaAnchaenAL.pdf.pdf

Barrantes, Roxana, Valeria Jordn, and Fernando Rojas. "La evolucin del paradigma digital en Amrica
Latina." Banda ancha en Amrica Latina: ms all de la conectividad (2013).

Biem, et. al. (2010) Real-Time Traffic Information Management using Stream Computing IBM TJ Watson
Research Center, NY, USA. 2010

24

Bollier, D. (2010). The promise and peril of Big data. Washington D.C.: The Aspin Institute.
Disponible:
http://www.aspeninstitute.org/sites/default/files/content/docs/pubs/The_Promise_and_Peril_of_Big_Data.pd
f

Brynjolfsson, Erik and Hitt, Lorin M. and Kim, Heekyung Hellen (2011). Strength in Numbers: How Does DataDriven Decision making Affect Firm Performance? Abril 2011.
Disponible: http://ssrn.com/abstract=1819486 or http://dx.doi.org/10.2139/ssrn.1819486

Carvalho, et al.. (2014). A Smart Platform for Precision Agriculture. Cisco White Paper, 2014.

CESSI (2014). Reporte semestral sobre el Sector de Software y Servicios Informticos de la Repblica
Argentina. Observatorio Permanente de la Industria del Software y Servicios Informticos de la Repblica,
Cmara de Empresas de Software y Servicios Informticos. Agosto 2014.
Disponible: http://www.cessi.org.ar/opssi

Chen, C. L., y Chun-Yang Zhang (2014). "Data-Intensive Applications, Challenges, Techniques and Technologies:
A Survey on Big Data." Information Sciences. 2014.

Choi, Dae Won. Banda ancha y poltica industrial: la experiencia coreana. En: Banda ancha en Amrica Latina:
ms all de la conectividad. Santiago: CEPAL, 2013.
Disponible: http://www.cepal.cl/publicaciones/xml/2/49262/BandaAnchaenAL.pdf.pdf

Chou, J. S., & Telaga, A. S. (2014). Real-time detection of anomalous power consumption. Renewable and
Sustainable Energy Reviews, 33, 400-411. 2014

CNN Money (2013). Big Data could generate millions of new Jobs. Mayo 2013.
Disponible: http://management.fortune.cnn.com/2013/05/21/big-data-jobs-2/?

Cumbley, Richard y Peter Church (2013). "Is Big Data creepy?". Computer Law & Security Review 29.5: 601609. Londres 2013

danah boyd & Kate Crawford (2012). Critical questions for Big Data. Information, Communication & Society,
15:5, 662-679, DOI:10.1080/1369118X.2012.678878
Disponible: http://dx.doi.org/10.1080/1369118X.2012.678878

European Commission (2013). Big Data. Analytics & Decision Making. Business Innovation Observatory.
Septiembre 2013.

Forte, Miguel ngel (1999). Modernidad: Tiempo, forma y sentido. Buenos Aires 1999.
Disponible: http://www.modernidadforte.8m.com/

Forte, M. ., Pignuoli Ocampo, S., Calise, S., Palacios, M., & Zitello, M. (2012). Las TIC como problemtica de la
teora sociolgica. Una problematizacin terica de la comunicacin digitalizada desde la teora general de
sistemas sociales autorreferenciales y autopoiticos. Revista de la Carrera de Sociologa. Entramados y
Perspectivas, (2), 205-226.
Disponible:
http://publicaciones.sociales.uba.ar/index.php/entramadosyperspectivas/article/download/137/121

FT Magazine (2014). Big data: are we making a big mistake? Financial Times Magazine. Marzo 2014.
Disponible: http://www.ft.com/cms/s/2/21a6e7d8-b479-11e3-a09a-00144feabdc0.html#axzz2zdXz8WBN

Gartner (2011). Gartner Says Solving 'Big Data' Challenge Involves More Than Just Managing Volumes of
Data. Junio 2011
Disponible: http://www.gartner.com/newsroom/id/1731916

25

Gordon, R. J. (2014). The Demise of US Economic Growth: Restatement, Rebuttal, and Reflections. (No.
w19895). National Bureau of Economic Research. Febrero 2014.
Disponible: http://www.nber.org/papers/w19895.pdf

Harding y Lovenheim (2014), The Effect of Prices on Nutrition: Comparing the Impact of Product- and
Nutrient-Specific Taxes. Diciembre 2014.
Disponible: http://www.stanford.edu/~mch/resources/Harding_Nutritiondemand.pdf

Hilbert (2013a) Big Data for Development: From Information- to Knowledge Societies United Nations ECLAC.
Enero 2013.
Disponible: http://ssrn.com/abstract=2205145

Hilbert (2013b) CEPAL Charlas Sobre Sistemas Complejos Sociales (CCSSCS) [Vdeo].
Disponible: http://www.martinhilbert.net/CCSSCS.html

Kelly, Jeffrey (2014). Big Data Vendor Revenue and Market Forecast Wikibon Article. Febrero 2014
Disponible: http://wikibon.org/wiki/v/Big_Data_Vendor_Revenue_and_Market_Forecast_2012-2017

Krugman, Paul (2014). Networks and Economic History. The New York Times. Noviembre 2014
Disponible: http://nyti.ms/112wYnT

LaNacin (2013). Big Data: una oportunidad o un festival de humo de colores?. Diario La Nacin, Buenos
Aires. Octubre 2013.
Disponible: http://www.lanacion.com.ar/1628427-big-data-una-oportunidad-o-un-festival-de-humo-decolores

LaNacin (2014a). Un aliado tecnolgico para evitar que la comida termine en la basura. Diario La Nacin,
Buenos Aires, Argentina. Marzo 2014.
Disponible: http://www.lanacion.com.ar/1673266-un-aliado-tecnologico-para-evitar-que-la-comida-termineen-la-basura

LaNacin (2014b). Big Data, el as bajo la manga de los equipos de ftbol del futuro. Diario La Nacin, Buenos
Aires, Argentina. Abril 2014
Disponible: http://www.lanacion.com.ar/1682716-big-data-el-as-bajo-la-manga-de-los-equipos-de-futbol-delfuturo

Lazer, D. M., Kennedy, R., King, G., & Vespignani, A. (2014). The parable of Google Flu: Traps in big data
analysis.
Disponible: http://gking.harvard.edu/files/gking/files/0314policyforumff.pdf

Li, H., Parikh, D., He, Q., Qian, B., Li, Z., Fang, D., & Hampapur, A. (2014). Improving rail network velocity: A
machine learning approach to predictive maintenance. Transportation Research Part C: Emerging
Technologies. 2014

Liran Einav y Jonathan Levin (2013), The Data Revolution and Economic Analysis. NBER Innovation Policy and
the Economy Conference. Abril 2013

Manovich, L. (2011). Trending: The Promises and the Challenges of Big Social Data. In M. Gold (Ed.), Debates
in the Digital Humanities (pp. 460476). Minneapolis: The University of Minnesota Press.
Disponible: http://www.manovich.net/DOCS/Manovich_trending_paper.pdf

McKinsey (2011). Big data: The next frontier for innovation, competition, and productivity. McKinsey Global
Institute. Junio 2011.
Disponible:
http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation

26

McKinsey (2013). The big-data revolution in US health care: Accelerating value and innovation. Center for US
Health System Reform Business Technology Office. Enero 2013
Disponible: http://www.mckinsey.com/insights/health_systems_and_services/the_bigdata_revolution_in_us_health_care

NY Times (2013) Is Big Data an Economic Big Dud?. New York Times. Agosto 2013
Disponible: http://www.nytimes.com/2013/08/18/sunday-review/is-big-data-an-economic-bigdud.html?pagewanted=all&_r=0

OECD (2013), Exploring Data-Driven Innovation as a New Source of Growth: Mapping the Policy Issues Raised
by "Big Data", OECD Digital Economy Papers, No. 222, OECD Publishing.
Disponible: http://dx.doi.org/10.1787/5k47zw3fcp43-en

Dumbill, E. (2012). What is big data? An introduction to the big data landscape. OReilly Radar.
Disponible: http://strata.oreilly.com/2012/01/what-is-big-data.html

Peres, W., y Hilbert, M. (2010). Information Societies in Latin America and the Caribbean Development of
Technologies and Technologies for Development. Santiago de Chile: United Nations ECLAC. Diciembre 2010
Disponible: http://www.cepal.org/publicaciones/xml/3/43803/Libro_Cepal_98.pdf

Piketty y Saez (2003). Income Inequality in the United States, 19131998 The Quarterly Journal of Economics.
Febrero 2003

SciDev.Net (2014). Big Data for Development. Big obstacles ahead for big data for development. SciDev.Net,
abril 2014.
Disponible: http://www.scidev.net/global/data/feature/obstacles-big-data-development.html

SDSS-III (2008). Massive Spectroscopic Surveys of the Distant Universe, the Milky Way Galaxy, and Extra-Solar
Planetary Systems Enero 2008.
Disponible: http://www.sdss3.org/collaboration/description.pdf

Tekiner y Keane (2013). Big Data Framework School of Computer Science, The University of Manchester,
Manchester, UK. 2013

UN Global Pulse 2012. Big Data for Development: Challenges & Opportunities United Nations. Mayo 2012.
Disponible: http://unglobalpulse.org/

UNU (United Nations University). (2012). Rainfall Variability, Food Security and Human Mobility: an approach
for generating empirical evidence Bonn: United Nations University Institute for Environment and Human
Security (UNU-EHS). Junio 2012
Disponible en http://www.ehs.unu.edu/file/get/9921.pdf

White Paper (2012): Challenges and Opportunities with Big Data. A community white paper developed by
leading researchers across the United States. Documento creado a partir de conversaciones mantenidas entre
miembros de universidades de EEUU (MIT, UC Berkeley, Standford Univ., etc.) y empresas tecnolgicas lderes
(Yahoo!, Google, Microsoft, IBM, HP). Nov. 2011-Feb. 2012.
Disponible: http://www.cra.org/ccc/files/docs/init/bigdatawhitepaper.pdf

Wired (2008). The End of Theory: The Data Deluge Makes the Scientific Method Obsolete. Wired Magazine.
Junio 2008.
Disponible: http://archive.wired.com/science/discoveries/magazine/16-07/pb_theory

Wired (2010). Sergey Brins Search for a Parkinsons Cure. Wired Magazine. Junio 2010.
Disponible: http://www.wired.com/2010/06/ff_sergeys_search/all/

27

Você também pode gostar