Escolar Documentos
Profissional Documentos
Cultura Documentos
Big Data & IoT
Big Data & IoT
Gilberto L. Fernandes
Mamede Lima-Marques
Gilberto L. Fernandes
Mestre em Arquitetura da Informao pela Faculdade da Cincia da Informao da
Universidade de Braslia UnB (2014) e pesquisador do Centro de Pesquisas em
Arquitetura da Informao CPAI da UnB. Graduado em Engenharia Eletrnica pela
Universidade Federal do Rio de Janeiro UFRJ (1980) e especialista em Engenharia de
Sistemas, com nfase em inteligncia artificial e redes neurais, pelo Instituto Alberto Luiz
Coimbra de Ps-Graduao e Pesquisa de Engenharia Coppe/UFRJ (1990). Atua h
cerca de 38 anos no mercado de tecnologia da informao, nas reas de engenharia de
software, implantao de processos de desenvolvimento e gesto do ciclo de vida de
aplicaes de software.
Mamede Lima-Marques
Mestre e doutor em Cincia da Computao pela Universit Paul Sabatier Toulouse III
Frana, com especializao em Cincia da Computao e ps-doutorado em Lgica
Aplicada, ambos pela Universidade Estadual de Campinas Unicamp (1989, 1992).
Graduado em Eletrnica pelo Centro Federal de Educao Tecnolgica de Minas Gerais
CEFET-MG e em Filosofia pela Pontifcia Universidade Catlica de Campinas PUCCampinas. professor titular do Departamento de Cincia da Informao e Documentao
da Universidade de Braslia UnB. consultor nacional e internacional, destacando-se
trabalhos em rgos do setor pblico, entre os quais Ministrio da Educao, Setor
Educacional do Mercosul SEM, Instituto Nacional de Pesquisas Educacionais Inep,
Ministrio da Sade, Secretaria de Segurana Pblica de So Paulo e Ministrio da
Justia.
Este trabalho foi financiado com subveno do Centro de Pesquisas em Arquitetura da Informao (CPAI),
Faculdade de Cincia da Informao, Universidade de Braslia (UnB).
2
O presente texto composto pelo segundo captulo do livro Anlise da informao para tomada de deciso:
desfios e solues (TARAPANOFF, 2015), acrescido de material apresentado no Seminrio IoT & Big Data,
ocorrido no Centro de Pesquisas em Arquitetura da Informao (CPAI), Faculdade de Cincia da Informao,
Universidade de Braslia (UnB), em 18/09/2015.
Resumo
Este trabalho tem por objetivo reconhecer os fenmenos tecnolgicos e sociais presentes
na Internet das Coisas e no Big Data, estud-los e avaliar o seu potencial impacto, riscos e
oportunidades, sob as perspectivas da sociedade civil, do mercado empresarial e da
indstria de tecnologia em especial. Procura ainda apontar e explicar que tipos de
aplicaes vinculadas Internet das Coisas e ao Big Data podero proporcionar os
melhores diferenciais competitivos.
Palavras-chaves: Internet das Coisas. Big Data. Arquitetura da informao. Tecnologia da
informao. Cincia da informao. Inteligncia artificial. Realidade aumentada.
Abstract
This study has the purpose to recognize the technological and social phenomena present in
the Internet of Things and Big Data, to study them and their potential impact, risks and
opportunities from the perspectives of the civil society, the corporate market and the
technology industry in particular. This work also attempts to point out and explain what kind
of applications, related to Internet of Things and Big Data, may provide the best competitive
advantages.
Keywords: Internet of Things. Big Data. Information architecture. Information technology.
Information science. Artificial intelligence. Augmented reality.
1 Introduo
O domnio da tecnologia, desde tempos imemoriais, tem sido sinnimo de poder,
permitindo espcie humana controlar a natureza sua volta e seus prprios
semelhantes. Para o homem das cavernas, o controle do fogo ou a habilidade para
construir a ponta de sua lana com uma pedra afiada poderiam significar a diferena entre
viver ou morrer para todo o seu grupo. A histria tem mostrado, ao longo do tempo, que
ligeiras vantagens tecnolgicas podem representar a distncia entre o domnio ou a
submisso e o desparecimento de povos inteiros. Por outro lado, para ter um real impacto
e importncia para o ser humano, a tecnologia precisa sempre servir a uma finalidade
social. Desse modo, quando a tecnologia se aplica em quebrar ou reduzir barreiras de
tempo e espao, como o caso dos meios de transporte e de comunicao, esse impacto
significativamente maior, pois enseja revolues, algumas vezes pequenas, outras vezes
de grandes propores, atingindo todas as reas da atividade humana e gerando enormes
oportunidades de mudana e desenvolvimento. Como marcos importantes da civilizao,
destacam-se os eventos de introduo da roda, do estribo, das velas navais, das
locomotivas, das estradas de ferro, do automvel, do avio e das viagens espaciais, assim
como o foram a linguagem, a escrita, a imprensa, o telgrafo, o telefone, o rdio, a
televiso, o computador e a internet, com todos os seus desdobramentos, incluindo a
Internet das Coisas e o Big Data, temas deste trabalho.
A Sloan Foundation uma organizao norte-americana sem fins lucrativos, com sede em Nova York,
centrada no apoio e financiamento da educao e de pesquisas nas reas de cincia, tecnologia, engenharia,
matemtica e economia.
4
Segundo o NIST (National Institute of Standards and Technology), computao em nuvem, ou cloud
computing, um modelo que possibilita o acesso, de modo conveniente e sob demanda, a um conjunto de
recursos computacionais configurveis (como redes, servidores, infraestrutura de armazenamento, aplicaes
e servios).
3 Conceitos de referncia
Para que seja alcanado um entendimento o mais prximo possvel daquele
pretendido, a seguir so apresentadas algumas definies de termos e conceitos que
sero utilizados ao longo do texto.
dados no estruturados;
SQL (Structured Query Language, ou Linguagem de Consulta Estruturada) a linguagem declarativa padro
para consultas em bancos de dados relacionais. Desenvolvido no incio da dcada de 1970, o SQL tem sua
concepo original baseada na lgebra relacional.
6
1 zettabyte = 1 mil exabytes = 1 milho de petabytes = 1 bilho de terabytes = 1 trilho de gigabytes.
7
Ver Hilbert; Lpez, 2011; Statistic Brain, 2013, 2015a, 2015b, 2015c.
padres
previamente
detectados
constitui
uma
importante
ferramenta
de
expectativa causada pelo anncio de dispositivos como o Google Glass, lanado no incio
de 2014, e de similares lanados posteriormente.
3.2 Prossumidor
A ideia do prossumidor10, neologismo formado pelas palavras produtor e
consumidor, foi apresentada por McLuhan, provavelmente pela primeira vez, em uma
conferncia pblica realizada em Nova York, em 7 de maio de 1966 (McLuhan; Staines,
2005, p. 113-135). Transcrevemos, a seguir, um pequeno trecho dessa conferncia:
A estranha dinmica ou padro da informao eletrnica consiste em envolver o
pblico cada vez mais como parte da fora de trabalho, em vez de apenas lhe atirar
coisas como objetos de consumo ou entretenimento. A tendncia envolver o pblico
como fora de trabalho [...]. Voc faz o trabalho. E estamos chegando a isso. Tempo
vir em que ser possvel informar o pblico da televiso ou de formas similares sobre
os grandes problemas da fsica, da cincia, seja o que for, e convid-los a dar sua
resposta a esses problemas [...].
10
Em ingls, prosumer.
entendimento da arquitetura cerebral pode ser medida pela dimenso do projeto europeu
Human Brain Project11 e dos projetos norte-americanos Human Connectome Project12 e
Brain Project13, todos com o objetivo de mapear a arquitetura e a conectividade do crebro
humano. Considera-se o conjunto desses projetos como o de maior envergadura da
humanidade, de todos os tempos, milhares de vezes maior que o projeto de mapeamento
do genoma humano. Trata-se de projetos que envolvem centenas de centros de pesquisa
espalhados pelo mundo e que contam com o aporte financeiro da ordem de centenas de
bilhes de dlares.
Contudo, apesar de todo o esforo e investimento que est sendo realizado em
pesquisas sobre o crebro humano e a despeito dos resultados j alcanados em diversas
reas, com prognsticos animadores para a cura de doenas como Alzheimer, Parkinson e
alguns tipos de autismo, provvel que o entendimento do funcionamento dessa incrvel
mquina produzida pela natureza, em profundidade suficiente para a criao de modelos
que permitam o desenvolvimento de dispositivos que possam suportar a execuo de
processos mentais tal como ocorrem no crebro humano, ainda demore algumas dcadas,
talvez mais. Desse modo, uma alternativa mais vivel para suportar as necessidades
computacionais para a obteno plena dos benefcios oferecidos por aplicaes de Big
Data talvez seja uma aproximao da simbiose homem-computador, conforme proposto
pelo fsico, matemtico e psiclogo norte-americano Joseph Carl Robnett Licklider (19151990), ainda na dcada de 1960 (Licklider, 1960, 1965, 1968)14.
A ideia de Licklider sobre a simbiose homem-computador vai muito alm da simples
extenso dos sentidos ou das capacidades mentais do ser humano, assumindo o conceito
biolgico de uma associao ntima com fins de cooperao e benefcios mtuos. Os
principais pontos dessa associao, de acordo com a concepo de Licklider, esto
listados a seguir (Licklider, 1960, p. 4-7; 1968, p. 21-28):
11
Isso pode levar, digamos, cinco anos para o desenvolvimento da simbiose homem-computador e 15 anos
para a sua utilizao. Estes 15 anos podem tornar-se 10 ou 500, mas esses anos devero ser intelectualmente
os mais criativos e excitantes na histria da humanidade [traduo nossa].
16
Lei de Moore - Em abril de 1965, o ento presidente da Intel, Gordon Earle Moore, profetizou que a
quantidade de transistores que poderiam ser colocados em uma mesma rea dobraria a cada 18 meses
mantendo-se o mesmo custo de fabricao. Depois dessa data, a soluo para manter o processamento dos
processadores fazer uso intenso de paralelismo, como hoje implementado em placas de vdeo, otimizao
dos sistemas operacionais e softwares, processadores dedicados ou mesmo alterar a tecnologia utilizada,
mudando do silcio para outras tcnicas e materiais que j se mostram passveis de se implementar na prtica,
como grafeno e computao quntica. Disponvel em: <http://canaltech.com.br/o-que-e/intel/O-que-e-a-Lei-deMoore/>. Acesso em 7 de abril de 2015
humana
da
realidade,
ao
adicionar
em
tempo
real
informaes
17
Recentemente, a empresa japonesa Panasonic anunciou que pretende disponibilizar para a Copa do Mundo
de Futebol de 2022 projees hologrficas em 3D dos jogos, em tempo real, de modo que possam ser
assistidos em outros estdios ou mesmo na superfcie de uma mesa ou no cho da sala dos telespectadores.
translcidos do filme Minority Report que permitiam a seus usurios um tipo de interao
impensvel pouco tempo atrs.
Naturalmente, dispositivos e aplicaes de RA podero ser utilizados como a
camada de apresentao e interao de aplicaes relacionadas ao Big Data,
principalmente para a anlise e reconhecimento de padres.
Estima-se ainda que nos prximos cinco anos sero lanados ao espao mais de
mil nano-satlites para viabilizar a comunicao desses bilhes de novos
dispositivos.
Talvez seja ainda difcil imaginarmos todo o impacto dessa nova infraestrutura de
comunicao. Mas o que podemos afirmar com certeza que todos esses
dispositivos iro gerar muitos dados, oceanos de dados, e tambm muitos
metadados.
As coisas a nossa volta, que fazem parte do nosso dia a dia corriqueiro, sero os
olhos e ouvidos da Internet. A discusso sobre as implicaes de toda essa
infraestrutura de comunicao sobre a privacidade algo que deve merecer
especial ateno.
arquitetura da informao pode ser associada a uma viso de mundo, entendida como um
conjunto de aes aplicadas a um espao de informao determinado, de modo a
transform-lo em sistema de informao. Na atualidade, o domnio de modelos de
informao vital para a sobrevivncia das organizaes; toda estrutura econmica est
suportada por padres de informao. Dominar o ciclo de vida da informao desde sua
origem, seus padres de organizao, suas representaes em modelos adequados, que
possibilitem a compreenso de fenmenos e a tomada de decises, tem sido o esforo
constante das organizaes desde o final do sculo XX. Contudo, a quantidade de
informao tem se mostrado demasiada para a capacidade humana de consumi-la. A
profuso de informao e a relevncia dela sobre temas especficos suscitaram o
desenvolvimento da tecnologia e cincia da informao e, mais especificamente, da
arquitetura da informao, como instrumento para reduzir a disperso da informao e
torn-la mais adequada ao entendimento humano.
O cenrio do Big Data, por um lado, composto pela convergncia de diversas
tecnologias, que aliam facilidades de mobilidade, de cloud computing, de interfaces para a
interao homem-computador em tempo real e da conectividade de uma infinidade de
sensores e dispositivos. Por outro lado, desenha-se um cenrio de desafios, alguns de
ordem tcnica, como o excesso de dados gerados e a consequente dificuldade para filtrar
e processar o que de fato seja relevante, e outros causados pelo processo de mudanas
sociais e econmicas, em pleno andamento, propiciadas por um novo ambiente
informacional que altera os papis e a forma de relacionamento entre os entes envolvidos.
Em conjunto, esses fatores fazem da disciplina de arquitetura da informao uma
ferramenta das mais necessrias para o aproveitamento do potencial de competitividade
empresarial representado pelo Big Data.
Analisaremos nesta seo alguns dos potenciais riscos e benefcios do Big Data
para o cidado.
4.1.1 Riscos
Em 1949, George Orwell19 publicou o livro 1984, no qual inseriu o personagem O
Grande Irmo, representado por um grande olho que tudo observa (Orwell, 2014). Nessa
histria, Orwell retrata um governo totalitrio e repressivo que tenta controlar a vida de
todos os cidados, monitorando-os permanentemente com o uso de cmeras de vdeo. A
previso de Orwell de monitorao de cidados demorou cerca de duas dcadas, alm da
poca em que se passa o romance, para tornar-se realidade. Porm, provvel que nem o
prprio Orwell pudesse imaginar o grau de monitorao que viria a existir. Atualmente
18
O termo Internet das Coisas" (ou Internet of Things, IoT, em ingls) foi proposto em 1999 por Kevin Ashton,
do MIT (Massachusetts Intitute of Tecnologia), Seu objetivo conectar dispositivos, sensores e itens de uso
cotidiano internet, por meio de conexes wi-fi e RFID (Radio-Frequency IDentification), formando um
sistema global de captao contnua de dados.
19
George Orwell, como ficou conhecido, na verdade o pseudnimo do escritor ingls Eric Arthur Blair.
somos monitorados no somente pelos governos, mas tambm por empresas, no apenas
por meio de cmeras de vdeo, mas por meio de uma infinidade de dispositivos, como
GPS, telefones celulares, cartes de crdito e provedores de internet. Aonde vamos, com
quem falamos, o que acessamos na internet, hbitos de consumo, todos esses dados so
registrados minuto a minuto.
A legislao de cada pas determina que empresas de telefonia celular e
provedoras de internet sejam obrigadas a guardar as informaes de uso de seus usurios
por um prazo que varia de seis meses a dois anos. O Projeto de Lei do Marco Civil da
Internet, uma espcie de constituio da internet, que se encontra na pauta de votao da
Cmara dos Deputados, em Braslia, prev um aumento no prazo de guarda dos dados de
usurios de seis meses para um ano. A Polcia Federal defende que esse projeto de lei
seja
estendido
tambm
provedores
de
contedo,
aumentando-se,
assim,
4.1.2 Benefcios
A seguir, listamos alguns dos potenciais benefcios do Big Data populao em
geral (Canton, 2015; Goodman, 2015; Schneier, 2015):
combate a epidemias;
diversas;
Nessa
lista
de
potenciais
benefcios,
maioria
dos
itens
apoia-se
no
organizadas, e estticas, ocorre que o fluxo contnuo de dados, ou streaming data, passa
por uma srie de operaes previamente determinadas. Tambm nesse caso, a indstria
de TI j oferece ferramentas voltadas para o tratamento analtico de dados, compatveis
com as caractersticas do Big Data, como Haddop e MapReduce20.
Outro desafio tcnico imposto pelo Big Data a criao, gesto e aplicao de
cpias de segurana, em um cenrio de fluxo constante de dados, em volumes e
velocidades elevadas, em que deixa de existir a figura da janela de tempo para a
realizao de backup off-line.
Entretanto, independentemente das iniciativas e progressos j alcanados pela
indstria de TI, preciso considerar a possibilidade de estarmos vivendo um momento
histrico, como o descrito no incio deste trabalho, no qual a introduo de uma nova
tecnologia tem o potencial de alterar o equilbrio social e econmico em diversos setores
da atividade humana, tornando mais ntidos os efeitos de um processo econmico
darwinista. Considerando essa perspectiva, apresentamos a seguir alguns pontos que, ao
mesmo tempo, podem significar desafios, riscos e oportunidades para os atores
envolvidos:
lanamento de novos produtos, as quais com o tempo devero ser incorporadas por
outras maiores, restando, ao final desse perodo de maior instabilidade, apenas as
20
Hadoop consiste basicamente em uma infraestrutura que permite o processamento massivamente paralelo,
utilizando um grande nmero de computadores (ns), que podem estar em uma mesma rede local, formando
um cluster, ou geograficamente distribudos, constituindo um grid. MapReduce uma plataforma para o
desenvolvimento de aplicaes voltadas para o processamento distribudo de grandes volumes de dados,
estruturados ou no. Hadoop e MapReduce so projetos originalmente concebidos pela Fundao Apache. Ver
Apache Software Foundation (2015a, 2015b).
necessidade
de
reagir
rapidamente,
atuando
no
mercado,
4.3.2 Oportunidades
Como mencionado anteriormente, acreditamos que as melhores oportunidades
para a obteno de vantagens competitivas com o Big Data estaro centradas na
capacidade de reconhecimento de padres, principalmente na identificao de padres
inditos ou adaptativos. No entanto, como ilustram os exemplos citados ao longo do texto,
novas aplicaes surgem a todo momento e em todas as reas de atividades econmicas.
Consideraes finais
O Big Data, enquanto restrito a bases de dados de grande volume, ainda que se
considerem as exigncias de infraestrutura e ferramentas para seleo, coleta e
armazenamento especialmente projetadas, no constitui fator efetivo de competitividade,
configurando apenas um potencial a ser aproveitado por sistemas e aplicaes.
Algoritmos para o reconhecimento de padres certamente oferecero vantagens
competitivas em diversas reas da atividade humana, porm os maiores benefcios
podero ser obtidos pela deteco de padres inditos ou adaptativos, que podero
posteriormente ser tratados por algoritmos especficos, por meio de uma simbiose homemmquina.
As aplicaes que fizerem uso do Big Data em conjunto com modelos de realidade
aumentada podero oferecer as melhores condies de efetividade na anlise de cenrios
de elevada complexidade, e, portanto, de competitividade, quando envolverem o ser
humano em um processo colaborativo. Desse modo, as solues devem ser desenhadas
considerando-se a participao central do ser humano, com especial ateno s interfaces
interativas que possam privilegiar sua capacidade criativa e associativa.
Neste cenrio de introduo de novas tecnologias, a Histria nos ensina que os
detalhes podem significar importante vantagem competitiva, a diferena entre o sucesso e
o fracasso, entre o crescimento e o desaparecimento de empresas. Desse modo, torna-se
necessrio aperfeioar o projeto de cada componente do processo, desde a produo de
dados por diversos atores e dispositivos, os mecanismos de coleta desses dados de
diferentes formatos, os mecanismos de seleo e armazenamento, as ferramentas para a
anlise e a construo de algoritmos para o reconhecimento de padres e as interfaces
para a apresentao desses dados e a interao com as aplicaes, de forma a permitir a
tomada de deciso mais inteligente. A matria-prima de todo esse processo, os dados, e o
fator de maior relevncia, o envolvimento do ser humano, devem ser tratados como os
elementos mais importantes, e, nessa perspectiva, a arquitetura da informao constitui a
mola mestra, subjacente a todos os aspectos relacionados ao Big Data.
Para finalizar, ressaltamos que, para aproveitarem a janela de oportunidades do Big
Data e se beneficiarem de seu potencial competitivo, as empresas devem ser proativas,
sendo necessrio reconhecer os fenmenos por trs do Big Data, estud-los em
profundidade e avaliar seriamente seus impactos. Reagir ser contraproducente.
Referncias
APACHE
SOFTWARE
FOUNDATION.
Hadoop.
Disponvel
em:
MapReduce
tutorial.
Disponvel
em:
Boston
Consulting
Group,
2012.
Disponvel
em:
mecanismo
de
apreenso
humana.
Disponvel
em:
<http://www.academia.edu/4070969/Em_busca_de_um_modelo_fenomenol%C3%B3g
ico_do_mecanismo_de_apreens%C3%A3o>. Acesso em: 11 fev. 2015.
FOLDIT. The Science Behind Foldit. Washington: Foldit, 2013. Disponvel em:
<http://fold.it/portal/info/about>. Acesso em: 11 fev. 2015.
FORTUNE. Global 500. USA: CNN Money, 2013.
GANTZ, J.; REINSEL, D. The Digital Universe in 2020: Big Data, Bigger Digital
Shadows, and Biggest Growth in the Far East. [S.l.]: IDC, Dec. 2012. Disponvel em:
<http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf>.
Acesso em: 8 dez. 2013.
GOODMAN, M. Future crimes: everything is connected, everything is vulnerable
and and what we can do about it. New York: Doubleday, 2015. Livro Eletrnico.
HILBERT, M.; LPEZ, P. The Worlds Technological Capacity to Store, Communicate,
and Compute Information. Science, v. 332, n. 6025, p. 60-65, Apr. 2011. Disponvel
em: <http://www.uvm.edu/~pdodds/files/papers/others/2011/hilbert2011a.pdf>. Acesso
em: 11 fev. 2015.
HUMAN BRAIN PROJECT. Disponvel em: <https://www.humanbrainproject.eu/pt>.
Acesso em: 11 fev. 2015.
HFE-1,
p.
4-11,
Mar.
1960.
Disponvel
em:
<http://worrydream.com/refs/Licklider%20-%20Man-Computer%20Symbiosis.pdf>.
Acesso em: 11 fev. 2015.
LICKLIDER, J. C. R.; TAYLOR, R. W. The Computer as a Communication Device.
Science
and
Technology,
Apr.
1968.
Disponvel
em
Publication
800-145.
Disponvel
em:
11 fev. 2015.
RANGANATHAN, S. R. Documentation and Its Facets: Being a Symposium of
Seventy Papers by Thirty-two Authors. [S.l.]: Asia Publishing House, 1963.
RIORDAN, M.; HODDESON, L. Crystal Fire: the Birth of the Information Age. New
York: Norton, 1997.
SANKAR, S. The Rise of Human-computer Cooperation. Edinburgh, Scotland: TED,
June
2012.
Palestra.
Disponvel
em:
<http://www.ted.com/talks/shyam_sankar_
de
Braslia,
Braslia,
DF,
2008.
Disponvel
em:
<http://repositorio.unb.br/bitstream/10482/3185/1/Dissert_AndreHenriqueSilveira.pdf>.
Acesso em: 11 fev. 2015.
SCHNEIER, B. Data and Goliath: the hidden battles to collect your data and
control your world. New York: W. W. Norton & Company, 2015. Livro eletrnico.
SPITZ, M. The Dark Side of Data. Edinburgh, Scotland: TED, June 2012. Palestra.
Disponvel
em:
<http://www.ted.com/playlists/130/the_dark_side_of_data.html>.
BRAIN.
Statistics.
Jan.
27,
2015a.
Disponvel
em:
Netflix
Statistics.
May
3,
2013.
Disponvel
em:
n.
236,
p.
433-460,
Oct.
1950.
Disponvel
em: