Você está na página 1de 30

Big Data & IoT: uma perspectiva a partir da disciplina de Arquitetura da Informao1,2

Gilberto L. Fernandes
Mamede Lima-Marques
Gilberto L. Fernandes
Mestre em Arquitetura da Informao pela Faculdade da Cincia da Informao da
Universidade de Braslia UnB (2014) e pesquisador do Centro de Pesquisas em
Arquitetura da Informao CPAI da UnB. Graduado em Engenharia Eletrnica pela
Universidade Federal do Rio de Janeiro UFRJ (1980) e especialista em Engenharia de
Sistemas, com nfase em inteligncia artificial e redes neurais, pelo Instituto Alberto Luiz
Coimbra de Ps-Graduao e Pesquisa de Engenharia Coppe/UFRJ (1990). Atua h
cerca de 38 anos no mercado de tecnologia da informao, nas reas de engenharia de
software, implantao de processos de desenvolvimento e gesto do ciclo de vida de
aplicaes de software.

Mamede Lima-Marques
Mestre e doutor em Cincia da Computao pela Universit Paul Sabatier Toulouse III
Frana, com especializao em Cincia da Computao e ps-doutorado em Lgica
Aplicada, ambos pela Universidade Estadual de Campinas Unicamp (1989, 1992).
Graduado em Eletrnica pelo Centro Federal de Educao Tecnolgica de Minas Gerais
CEFET-MG e em Filosofia pela Pontifcia Universidade Catlica de Campinas PUCCampinas. professor titular do Departamento de Cincia da Informao e Documentao
da Universidade de Braslia UnB. consultor nacional e internacional, destacando-se
trabalhos em rgos do setor pblico, entre os quais Ministrio da Educao, Setor
Educacional do Mercosul SEM, Instituto Nacional de Pesquisas Educacionais Inep,
Ministrio da Sade, Secretaria de Segurana Pblica de So Paulo e Ministrio da
Justia.

Este trabalho foi financiado com subveno do Centro de Pesquisas em Arquitetura da Informao (CPAI),
Faculdade de Cincia da Informao, Universidade de Braslia (UnB).
2
O presente texto composto pelo segundo captulo do livro Anlise da informao para tomada de deciso:
desfios e solues (TARAPANOFF, 2015), acrescido de material apresentado no Seminrio IoT & Big Data,
ocorrido no Centro de Pesquisas em Arquitetura da Informao (CPAI), Faculdade de Cincia da Informao,
Universidade de Braslia (UnB), em 18/09/2015.

Resumo
Este trabalho tem por objetivo reconhecer os fenmenos tecnolgicos e sociais presentes
na Internet das Coisas e no Big Data, estud-los e avaliar o seu potencial impacto, riscos e
oportunidades, sob as perspectivas da sociedade civil, do mercado empresarial e da
indstria de tecnologia em especial. Procura ainda apontar e explicar que tipos de
aplicaes vinculadas Internet das Coisas e ao Big Data podero proporcionar os
melhores diferenciais competitivos.
Palavras-chaves: Internet das Coisas. Big Data. Arquitetura da informao. Tecnologia da
informao. Cincia da informao. Inteligncia artificial. Realidade aumentada.

Abstract
This study has the purpose to recognize the technological and social phenomena present in
the Internet of Things and Big Data, to study them and their potential impact, risks and
opportunities from the perspectives of the civil society, the corporate market and the
technology industry in particular. This work also attempts to point out and explain what kind
of applications, related to Internet of Things and Big Data, may provide the best competitive
advantages.
Keywords: Internet of Things. Big Data. Information architecture. Information technology.
Information science. Artificial intelligence. Augmented reality.

1 Introduo
O domnio da tecnologia, desde tempos imemoriais, tem sido sinnimo de poder,
permitindo espcie humana controlar a natureza sua volta e seus prprios
semelhantes. Para o homem das cavernas, o controle do fogo ou a habilidade para
construir a ponta de sua lana com uma pedra afiada poderiam significar a diferena entre
viver ou morrer para todo o seu grupo. A histria tem mostrado, ao longo do tempo, que
ligeiras vantagens tecnolgicas podem representar a distncia entre o domnio ou a
submisso e o desparecimento de povos inteiros. Por outro lado, para ter um real impacto
e importncia para o ser humano, a tecnologia precisa sempre servir a uma finalidade
social. Desse modo, quando a tecnologia se aplica em quebrar ou reduzir barreiras de
tempo e espao, como o caso dos meios de transporte e de comunicao, esse impacto
significativamente maior, pois enseja revolues, algumas vezes pequenas, outras vezes
de grandes propores, atingindo todas as reas da atividade humana e gerando enormes
oportunidades de mudana e desenvolvimento. Como marcos importantes da civilizao,
destacam-se os eventos de introduo da roda, do estribo, das velas navais, das
locomotivas, das estradas de ferro, do automvel, do avio e das viagens espaciais, assim
como o foram a linguagem, a escrita, a imprensa, o telgrafo, o telefone, o rdio, a
televiso, o computador e a internet, com todos os seus desdobramentos, incluindo a
Internet das Coisas e o Big Data, temas deste trabalho.

2 Um novo ambiente de competio


No por acaso que as maiores corporaes do planeta tm suas atividades
ligadas s reas de comunicaes e transportes. O surgimento do telgrafo deu origem
Western Union, que rapidamente se tornou a maior empresa do planeta. O telefone
superou tecnologicamente o telgrafo, e a Bell Telephone Company, antecessora da
AT&T, constituda em 1877 para explorar comercialmente essa nova inveno, logo
superaria a Western Union na posio de maior corporao global. Em um processo com
caractersticas que nos permitem pensar numa espcie de darwinismo econmico,
intensificado aps o incio da globalizao, empresas como Shell, Exxon, Toyota,
Volkswagen, GM, Samsung, Apple, NTT, AT&T, Telefnica, HP, IBM, Microsoft, Amazon e
Google mantm-se e revezam-se, durante as ltimas dcadas, nas primeiras posies
desse ranking mundial (Fortune, 2013).

A viso da Sloan Foundation3 sobre a utilizao da tecnologia, parcialmente


transcrita a seguir, corrobora o posicionamento adotado nesta introduo:
[...] tecnologia a aplicao da cincia, engenharia e organizaes industriais para
criar um mundo mais apropriado ao ser humano. Isto tornou possvel, nas naes
desenvolvidas, um padro de vida inconcebvel h um sculo. O processo, entretanto,
no isento de tenses; por sua natureza, a tecnologia provoca mudanas na
sociedade e agride convenes. Afeta praticamente todos os aspectos das atividades
humanas: instituies pblicas e privadas, sistemas econmicos, redes de
comunicao, estruturas polticas, associaes internacionais, a organizao das
sociedades, e as condies da vida humana. Este efeito no ocorre apenas em um
sentido; assim como a tecnologia muda a sociedade, tambm as estruturas sociais,
atitudes e demais caractersticas da vida humana afetam a tecnologia. Mas, talvez
porque a tecnologia seja to rapidamente e completamente assimilada, a profunda
interao desta com a sociedade, na histria moderna, no venha sendo
suficientemente reconhecida. (Riordan; Hoddeson, 1997, p. ix, traduo nossa)

O advento do Big Data, por suas caractersticas e possibilidades de aplicao nas


mais diversas reas da atividade humana, impe desafios de ordem tcnica, social, poltica
e legal.
Fundamentalmente, tecnologias no so boas ou ms, sendo essas caractersticas
associadas ao uso que delas se faz. As inovaes que se apresentam neste incio de
sculo, com a disseminao quase onipresente de computadores, redes de comunicao,
dispositivos mveis e da computao em nuvem4 e, agora, com o Big Data, podem
oferecer um potencial quase ilimitado de aplicaes, assim como riscos de acidentes ou de
utilizao com fins no pacficos, com efeitos igualmente perigosos.
Os riscos e benefcios que podero resultar do uso de aplicaes com acesso s
bases de dados classificadas como Big Data justificam plenamente o estudo, a anlise e
um amplo debate sobre os eventuais impactos desses avanos tecnolgicos, que sero
tratados ao longo do texto. Estes possveis impactos igualmente justificam que a presente
discusso seja estendida no somente aos profissionais de tecnologia e aos executivos de
empresas interessados nos benefcios econmicos que podem advir de vantagens
competitivas oferecidas pelo Big Data, mas tambm a agncias governamentais,
economistas, polticos e juristas.
Portanto, o objetivo deste trabalho reconhecer os fenmenos presentes no Big
Data, estud-los e avaliar o seu potencial impacto, riscos e oportunidades, sob os pontos
de vista da sociedade civil, da indstria de tecnologia e do mercado empresarial.

3

A Sloan Foundation uma organizao norte-americana sem fins lucrativos, com sede em Nova York,
centrada no apoio e financiamento da educao e de pesquisas nas reas de cincia, tecnologia, engenharia,
matemtica e economia.
4
Segundo o NIST (National Institute of Standards and Technology), computao em nuvem, ou cloud
computing, um modelo que possibilita o acesso, de modo conveniente e sob demanda, a um conjunto de
recursos computacionais configurveis (como redes, servidores, infraestrutura de armazenamento, aplicaes
e servios).

3 Conceitos de referncia
Para que seja alcanado um entendimento o mais prximo possvel daquele
pretendido, a seguir so apresentadas algumas definies de termos e conceitos que
sero utilizados ao longo do texto.

3.1 Big Data


O termo Big Data tem sido empregado com distintos significados, dependendo do
contexto: ora se refere prtica de salvar e armazenar indefinidamente dados dos mais
variados tipos, ou s prprias bases de dados com caractersticas especficas de volume e
diferentes formatos, que excedem a capacidade de processamento de ferramentas
tradicionais, como bancos de dados baseados no padro SQL5, ora diz respeito ao prprio
fenmeno de exploso da gerao de dados; pode fazer referncia tambm a aspectos
tecnolgicos e de infraestrutura e, ainda, a determinados tipos de aplicao que se
beneficiam de um ambiente em que convergem diferentes tecnologias.
Apesar de ainda no haver um conceito consolidado sobre o Big Data, algumas de
suas caractersticas aparecem mencionadas em grande parte da bibliografia referente ao
assunto. Entretanto, a caracterstica mais presente na literatura, e certamente um
componente importante e que ser analisado em profundidade, a do volume de dados,
no necessariamente determinante para o enquadramento de aplicaes sob essa
denominao, havendo exemplos reais de bases de dados que podem ser classificadas
como Big Data, mas que no apresentam volume na casa dos petabytes ou exabytes6. A
seguir, listamos algumas das principais caractersticas do Big Data, que podem ser
facilmente comprovadas por meio de dados estatsticos, disponveis na internet7:

variedade de fontes e formatos de dados, com massiva predominncia de

dados no estruturados;

gerao de dados por empresas, por organizaes e pelo cidado;

velocidade de gerao de dados considerada alta em relao aos sistemas

transacionais tradicionais, em vrios casos de forma contnua, determinando, assim,


a necessidade de processamento em tempo real;

SQL (Structured Query Language, ou Linguagem de Consulta Estruturada) a linguagem declarativa padro
para consultas em bancos de dados relacionais. Desenvolvido no incio da dcada de 1970, o SQL tem sua
concepo original baseada na lgebra relacional.
6
1 zettabyte = 1 mil exabytes = 1 milho de petabytes = 1 bilho de terabytes = 1 trilho de gigabytes.
7
Ver Hilbert; Lpez, 2011; Statistic Brain, 2013, 2015a, 2015b, 2015c.

volume de dados resultante principalmente da presena de dados no

estruturados e de suas taxas de gerao por usurios;

complexidade tcnica, motivada pela combinao dos fatores aqui listados,

como volume e variedade de fontes de dados, necessidade de processamento em


tempo real, reconhecimento e anlise de padres.
Como mencionado na introduo deste artigo, a Histria nos ensina que certas
mudanas tecnolgicas podem vir acompanhadas por mudanas sociais, culturais,
polticas e econmicas. O Big Data, mais que a convergncia de um conjunto de
tecnologias, oferece tanto s empresas como aos cidados, ou consumidores finais, um
ambiente frtil inovao, que certamente impulsionar mudanas nos mbitos social,
cultural, poltico, jurdico e econmico. Conforme afirmava Marshall McLuhan (1911-1980),
filsofo da teoria da comunicao canadense, " o ambiente que muda as pessoas, e no
a tecnologia" (McLuhan; Staines, 2005, p. 267).
Como evidncia de alteraes recentes em nosso ambiente cotidiano, podemos
citar a enorme quantidade de registros que so efetuados, a cada minuto, em decorrncia
das interaes sociais e econmicas de bilhes de pessoas em todo o mundo, por meio de
uma srie crescente de mecanismos, como telefones celulares, dispositivos diversos de
acesso internet (computadores, tablets etc.), redes sociais, cartes de crdito e dbito,
equipamentos mdicos, etiquetas de RFID8, cmeras de vdeo e radares de vias pblicas,
GPS e at Smart TVs. O registro dessas interaes resulta em volumes de dados inditos,
e com crescimento acelerado, que precisam ser coletados, armazenados, analisados e
processados, conforme demonstram algumas estatsticas apresentadas na seo
especfica para essa finalidade.
No entanto, muitas das abordagens que tratam do Big Data tm sua nfase
justamente nas questes relacionadas coleta, armazenagem, anlise e processamento
de dados, as quais so pertinentes, necessrias, mas no suficientes para o entendimento
do alcance e o aproveitamento do potencial desse novo ambiente que se denomina de Big
Data.
Nesse cenrio, algumas questes imperativas se apresentam. Primeiramente,
apesar da relativa complexidade tecnolgica, a dificuldade maior no reside na coleta,
armazenagem, anlise e processamento dos dados. Em funo do volume de dados, em
muitos casos, absurdamente elevado e da diversidade de fontes, fcil nos perdermos
nesse oceano de dados, sem a obteno de resultados relevantes. Essa possibilidade

8

RFID (Radio-Frequency Identification, ou identificao por radiofrequncia) um sistema de identificao


automtica que tem como principal componente uma etiqueta dotada com um dispositivo de sensoriamento
remoto por meio de sinais de rdiofrequncia. Essa etiqueta pode ser utilizada em embalagens, produtos
diversos, vestimentas, animais e at mesmo em pessoas.

decorre justamente do fato de que as melhores oportunidades de benefcios e os


diferenciais competitivos esto intimamente associados ao tipo de dificuldade mencionada
acima. Para que padres escondidos possam ser revelados, e talvez seja este o maior
potencial de aplicaes na era do Big Data, torna-se prioritrio saber o que e onde
procurar. E, quando se est perdido, mapas so de inegvel importncia. No caso em
questo, os mapas so as formas de visualizao desses dados, conferindo uma posio
de destaque s interfaces que permitiro o acesso aos sistemas que se utilizam dessas
bases de dados, assim como arquitetura da informao que ser empregada em todas
as etapas e componentes desses sistemas. A engenharia de extrao de conhecimento til
dessas bases de dados denominado de data mining.
Em segundo lugar, embora inmeros filmes e livros de fico cientfica ou de
suspense apresentem algoritmos capazes de detectar padres, e por mais atraente que
isso possa parecer, ainda no temos como minerar dados algoritmicamente para obteno
de padres originais, em situaes de grande complexidade, por maior que seja a fora
bruta de processamento. Algoritmos trabalham com padres previamente determinados e
catalogados, sendo, na melhor das hipteses, levemente adaptativos. Os resultados que
podem ser obtidos com algoritmos rgidos sero to menos significativos quanto maior for
a necessidade de integrar dados de fontes e formatos diferentes.
Em uma poca em que mais da metade da movimentao das bolsas de valores
norte-americanas e londrina comandada por algoritmos de negociao (trading
algorithms)9 e em que mais de 60% dos aluguis de filmes da Netflix so realizados por
meio de sugestes oferecidas por algoritmos a seus usurios, alm de diversos outros
exemplos semelhantes, certamente a capacidade de desenvolver algoritmos para a anlise
de

padres

previamente

detectados

constitui

uma

importante

ferramenta

de

competitividade entre as empresas que compartilham mercados especficos. Entretanto, o


principal fator de competitividade no cenrio do Big Data reside, como veremos ao longo
deste texto, na inovao e descoberta de novos padres.
A dimenso dos fatores envolvidos para a obteno de valor em aplicaes de Big
Data, principalmente para a percepo de padres inditos ou adaptativos, torna
fundamental a interao dessas aplicaes com o ser humano e sua capacidade intuitiva
de associar dados, testar hipteses, identificar relaes e perceber tais padres. Desse
modo, o design de interfaces de baixo atrito, que privilegiam a interatividade homemmquina e favorecem a cooperao entre o poder de processamento das mquinas e a
intuio humana, assume um papel de relevncia, sendo este o motivo de to grande

Ver Vermeulen, 2013; Dayal et al., 2012.

expectativa causada pelo anncio de dispositivos como o Google Glass, lanado no incio
de 2014, e de similares lanados posteriormente.

3.2 Prossumidor
A ideia do prossumidor10, neologismo formado pelas palavras produtor e
consumidor, foi apresentada por McLuhan, provavelmente pela primeira vez, em uma
conferncia pblica realizada em Nova York, em 7 de maio de 1966 (McLuhan; Staines,
2005, p. 113-135). Transcrevemos, a seguir, um pequeno trecho dessa conferncia:
A estranha dinmica ou padro da informao eletrnica consiste em envolver o
pblico cada vez mais como parte da fora de trabalho, em vez de apenas lhe atirar
coisas como objetos de consumo ou entretenimento. A tendncia envolver o pblico
como fora de trabalho [...]. Voc faz o trabalho. E estamos chegando a isso. Tempo
vir em que ser possvel informar o pblico da televiso ou de formas similares sobre
os grandes problemas da fsica, da cincia, seja o que for, e convid-los a dar sua
resposta a esses problemas [...].

McLuhan, como poucos, foi de preciso cirrgica em suas previses. Como


exemplo, podemos citar o caso de jogos de computador criados para resolver problemas
para os quais somente a fora bruta de supercomputadores insuficiente. Em maio de
2008, foi lanado por pesquisadores da Universidade de Washington, como parte de um
projeto de pesquisa experimental, o Foldit, um quebra-cabea on-line colaborativo para
testar possveis configuraes da estrutura de protenas previamente selecionadas. Nesse
jogo, o ser humano participa com sua capacidade criativa, enquanto os computadores da
universidade verificam a possibilidade de existncia no mundo real de cada configurao
estrutural sugerida. Resultados experimentais mostram que esse mtodo de trabalho,
baseado em uma simbiose homem-mquina, derrota os supercomputadores em 50% das
vezes e empata em outros 30% (Sankar, 2012). Em 2011, trs jogadores decifraram em
dez dias a estrutura de uma protena retroviral presente em smios da espcie Rhesus,
diretamente relacionada Aids. A resoluo desse problema havia ocupado anteriormente
a comunidade cientfica por uma dcada inteira, sem a obteno de uma soluo (Foldit,
2013; Sankar, 2012).
Apesar de a ideia original do prossumidor estar associada a McLuhan, credita-se
a criao do termo a Alvin Tofler (1980), em seu livro A terceira onda, no qual j chamava
a ateno para a dissoluo progressiva da fronteira que separava o produtor do
consumidor, com uma crescente participao do prossumidor. Segundo o autor, este
pode ser um importante marco econmico: Algumas vezes, mudanas histricas


10

Em ingls, prosumer.

gigantescas so simbolizadas por mudanas minsculas no comportamento cotidiano


(Tofler, 1980, p. 266).
Tradicionalmente, o fluxo de dados tinha um sentido nico, com as empresas e as
organizaes de mdia disponibilizando seus dados para o consumo de seus usurios.
Atualmente, os dados produzidos por usurios e consumidores finais representam cerca de
dois teros de todos os dados globais produzidos, o dobro da quantidade produzida por
estas mesmas empresas e organizaes (Gantz; Reinsel, 2013). O simples fato de algum
acessar a internet faz com que tambm esteja gerando dados. No cenrio do Big Data, o
consumidor/produtor de dados passa a ter um papel central em todo o processo. Um
exemplo representativo do papel e atuao de prossumidores a enciclopdia virtual
Wikipdia.

3.3 Interao homem-computador e realidade aumentada


Em seu livro 2001: uma odisseia no espao (Clarke, 2013) e, posteriormente, no
filme homnimo, Sir Arthur C. Clarke (1917-2008), um dos expoentes mximos da fico
cientfica, tem em HAL 9000 um de seus principais personagens. HAL um
supercomputador autnomo responsvel por toda a operao e funcionamento da nave
espacial Discovery e representava as expectativas da poca sobre a evoluo da cincia
da computao e da inteligncia artificial.
Uma definio atual e apropriada para inteligncia artificial seria a capacidade no
de simular os processos mentais humanos em computadores com a atual arquitetura,
desenvolvida por John von Neumann (1903-1957) e Alan Turing (1912-1954), mas de
realizar esses processos mentais, tal como de fato eles ocorrem, em dispositivos no
cerebrais que os suportem. Esse modelo denominado de inteligncia artificial forte,
enquanto os sistemas especialistas, como aplicaes para jogar xadrez, que, apesar de
terem a capacidade de aprendizado, no emulam processos mentais humanos, so
denominados de inteligncia artificial fraca.
O projeto e a construo dos computadores digitais atualmente em uso foram
precedidos por teorias computacionais e modelos algortmicos que descreviam o processo
lgico a ser implementado. A mquina de Turing, apresentada no artigo intitulado
Computing Machinery and Intelligence (Turing, 1950), o modelo lgico abstrato, o DNA
por assim dizer, que d forma estrutura dos computadores digitais e fundamenta a
cincia da computao (Fernandes; Lima-Marques, 2012, p. 53). Nesse artigo, com uma
abordagem tanto filosfica quanto tcnica, Turing tentou responder questo As
mquinas podem pensar? e tambm deu incio formal ao estudo da inteligncia artificial.

Do mesmo modo como ocorreu com os computadores digitais, o desenvolvimento


de dispositivos que possam implementar de forma plena a inteligncia artificial, nos moldes
descritos anteriormente, dever ser precedido por um entendimento profundo dos
processos mentais humanos e pela construo de teorias e modelos que os representem
(Fernandes; Lima-Marques, 2012). A disciplina de Arquitetura da Informao, tema da
seo posterior a esta, tem contribudo efetivamente, por meio de uma abordagem
transdisciplinar, para o desenho dessas teorias e modelos.
A

ateno da comunidade cientfica para as questes relacionadas ao

entendimento da arquitetura cerebral pode ser medida pela dimenso do projeto europeu
Human Brain Project11 e dos projetos norte-americanos Human Connectome Project12 e
Brain Project13, todos com o objetivo de mapear a arquitetura e a conectividade do crebro
humano. Considera-se o conjunto desses projetos como o de maior envergadura da
humanidade, de todos os tempos, milhares de vezes maior que o projeto de mapeamento
do genoma humano. Trata-se de projetos que envolvem centenas de centros de pesquisa
espalhados pelo mundo e que contam com o aporte financeiro da ordem de centenas de
bilhes de dlares.
Contudo, apesar de todo o esforo e investimento que est sendo realizado em
pesquisas sobre o crebro humano e a despeito dos resultados j alcanados em diversas
reas, com prognsticos animadores para a cura de doenas como Alzheimer, Parkinson e
alguns tipos de autismo, provvel que o entendimento do funcionamento dessa incrvel
mquina produzida pela natureza, em profundidade suficiente para a criao de modelos
que permitam o desenvolvimento de dispositivos que possam suportar a execuo de
processos mentais tal como ocorrem no crebro humano, ainda demore algumas dcadas,
talvez mais. Desse modo, uma alternativa mais vivel para suportar as necessidades
computacionais para a obteno plena dos benefcios oferecidos por aplicaes de Big
Data talvez seja uma aproximao da simbiose homem-computador, conforme proposto
pelo fsico, matemtico e psiclogo norte-americano Joseph Carl Robnett Licklider (19151990), ainda na dcada de 1960 (Licklider, 1960, 1965, 1968)14.
A ideia de Licklider sobre a simbiose homem-computador vai muito alm da simples
extenso dos sentidos ou das capacidades mentais do ser humano, assumindo o conceito
biolgico de uma associao ntima com fins de cooperao e benefcios mtuos. Os
principais pontos dessa associao, de acordo com a concepo de Licklider, esto
listados a seguir (Licklider, 1960, p. 4-7; 1968, p. 21-28):

11

Ver Human Brain Project, 2015.


Ver NIH Blueprint for Neuroscience Research, 2015.
13
Ver NIH, 2015.
14
Joseph C. R. Licklider considerado um dos principais idealizadores da rede ARPANet, precursora da
internet.
12

facilitar ao ser humano o pensamento criativo, a percepo de insights, a

formulao de perguntas e hipteses;

permitir a cooperao entre homens e computadores, para a anlise, o

entendimento, a tomada de deciso e o controle de situaes de alta complexidade,


sem a dependncia de programas e algoritmos rgidos, previamente desenvolvidos;

permitir a interao e troca de informaes em tempo real, de forma to ou

mais eficaz do que entre seres humanos.


Segundo Licklider (1960), os problemas que podem ser descritos e modelados de
modo a permitir a construo de algoritmos e programas para posterior processamento
no justificariam o investimento necessrio ao desenvolvimento de um modelo
computacional com as caractersticas descritas anteriormente. Para Licklider, o
reconhecimento de padres adaptativos ou inovadores era um dos principais tipos de
problemas que deveriam ser tratados sob o paradigma da simbiose homem-computador.
Em seu tempo, a tecnologia necessria ainda no estava disponvel, e os custos
envolvidos com dispositivos de memria e de armazenamento, para no citar outros,
tornavam invivel a implementao de projeto to ambicioso. No entanto, para Licklider, a
proposta de uma parceria estreita homem-computador mostrava-se mais factvel do que o
sonho ainda mais distante dos entusiastas da inteligncia artificial. Licklider no tinha
meios confiveis para estimar quando sua viso poderia comear a ser implementada ou
tornar-se realidade, mas, para ele, estes seriam anos de intensa atividade intelectual,
conforme o trecho de seu artigo transcrito a seguir: That would leave, say, five years, to
develop man-computer symbiosis and 15 years to use it. The 15 may be 10 or 500, but
those year should be intellectually the most creative and exciting in the history of mankind.
(Licklider, 1960, p. 5)15.
Nos dias atuais, grande parte dos obstculos tcnicos ou tecnolgicos apontados
por Licklider j foi superada, e os custos decaram desde ento, segundo a Lei de Moore16.
possvel que estejamos vivendo a poca histrica prevista por Licklider, em seu texto,
citado no pargrafo anterior. Entretanto, para concretizar efetivamente a simbiose homem
15

Isso pode levar, digamos, cinco anos para o desenvolvimento da simbiose homem-computador e 15 anos
para a sua utilizao. Estes 15 anos podem tornar-se 10 ou 500, mas esses anos devero ser intelectualmente
os mais criativos e excitantes na histria da humanidade [traduo nossa].
16
Lei de Moore - Em abril de 1965, o ento presidente da Intel, Gordon Earle Moore, profetizou que a
quantidade de transistores que poderiam ser colocados em uma mesma rea dobraria a cada 18 meses
mantendo-se o mesmo custo de fabricao. Depois dessa data, a soluo para manter o processamento dos
processadores fazer uso intenso de paralelismo, como hoje implementado em placas de vdeo, otimizao
dos sistemas operacionais e softwares, processadores dedicados ou mesmo alterar a tecnologia utilizada,
mudando do silcio para outras tcnicas e materiais que j se mostram passveis de se implementar na prtica,
como grafeno e computao quntica. Disponvel em: <http://canaltech.com.br/o-que-e/intel/O-que-e-a-Lei-deMoore/>. Acesso em 7 de abril de 2015

computador, conforme a concepo de Licklider, ainda resta solucionar alguns desafios de


grande complexidade tcnica. Um deles, certamente, conseguir permitir que algoritmos
para o reconhecimento de novos padres possam ser construdos, reprogramados ou
adaptados, pela simples interao com o usurio de uma aplicao, a partir de seus
insights, enquanto examina determinada situao. Outra questo, quase que consequncia
da anterior, a construo de interfaces homem-computador com capacidade de
comunicao similar ou superior existente entre seres humanos, tem recebido muita
ateno e investimentos. Embora ainda estejamos distantes de algo como o que foi
implementado (em fico) em HAL 9000, estamos percorrendo de forma acelerada o
caminho que nos separa daquela realidade.
No momento atual, talvez uma das melhores opes de interface interativa, que se
aproxima das caractersticas de uma parceria homem-computador, como descrito
anteriormente, seja a realidade aumentada (RA). Com a RA, a ideia enriquecer a
percepo

humana

da

realidade,

ao

adicionar

em

tempo

real

informaes

computadorizadas complementares quelas que podem ser obtidas diretamente pelos


sentidos sensoriais humanos, criando um ambiente hbrido, pela combinao de elementos
virtuais com elementos do mundo real.
O tipo de aplicaes de RA que nos interessa, neste estudo, ultrapassa largamente
a leitura de QR codes, a insero de medidas de distncia em jogos de futebol
televisionados ou mesmo video games que utilizam culos ou capacetes, em ambientes
fechados e controlados. As pesquisas de ponta nessa rea concentram-se em aplicaes
de RA que permitam a seus usurios interagir em ambientes abertos com a aplicao de
RA, com o prprio ambiente e com outros seres humanos presentes no ambiente.
Inmeros so os tipos de aplicaes que podero se beneficiar com o uso dessa
tecnologia. Basta imaginarmos as possibilidades que se abrem com a visualizao de
informaes em culos translcidos, como o Google Glass e dispositivos semelhantes, ou
por meio de projees hologrficas em trs dimenses17, ou simplesmente com projees
no para-brisa de automveis, de modo a torn-los verdadeiras telas de navegao,
trazendo novas informaes ao motorista, em tempo real, de acordo com suas reaes,
sua localizao e com dados coletados nos diversos sensores do veculo e da via ou
estrada. Esse tipo de aplicao poder antecipar ao motorista a aproximao de outro
veculo ou de uma curva, por exemplo, antes que possam ser percebidos pelo condutor.
Se quisermos nos aventurar um pouco mais, podemos nos lembrar dos painis


17

Recentemente, a empresa japonesa Panasonic anunciou que pretende disponibilizar para a Copa do Mundo
de Futebol de 2022 projees hologrficas em 3D dos jogos, em tempo real, de modo que possam ser
assistidos em outros estdios ou mesmo na superfcie de uma mesa ou no cho da sala dos telespectadores.

translcidos do filme Minority Report que permitiam a seus usurios um tipo de interao
impensvel pouco tempo atrs.
Naturalmente, dispositivos e aplicaes de RA podero ser utilizados como a
camada de apresentao e interao de aplicaes relacionadas ao Big Data,
principalmente para a anlise e reconhecimento de padres.

3.4 Internet das Coisas - IoT


3.4.1 Caractersticas
A Internet das Coisas (IoT) consiste de uma grande variedade de objetos com
minsculas fontes de alimentao, sensores dos mais diversos tipos embutidos e
integrados, endereos de internet e comunicao via RFID, wi-fi ou bluetooth,
armazenamento e comunicao em nuvem, integrao de diversos tipos de software e
hardware, apps para dispositivos mveis, conversores de sinais eltricos em sinais digitais,
e processamento analtico dos dados coletados e armazenados.
Refrigeradores, torradeiras, mquinas de lavar roupa, mquinas de lavar loua,
escovas de dente, relgios de pulso, sensores de sinais vitais, fechaduras, portes de
garagem, termostatos, luzes, esto entre alguns dos objetos que passaro a ter identidade
e comunicao pela internet. No somente os phones sero smart, mas todos os objetos
do dia a dia. Alguns desses dispositivos tero simplesmente a funo de coletar dados de
seus usurios, enquanto outros podero ter aes real time pr-definidas. Esses
dispositivos permitiro que se saiba se voc dormiu bem, se escova direito seus dentes, se
est devidamente hidratado, se tem feito exerccios fsicos adequadamente, se seus sinais
vitais esto normais ou se h alguma emergncia e deve ser efetuada uma chamada
automticas para auxlio mdico.
O fato dessa tecnologia ser chamada de Internet das Coisas e no de Coisas
Conectadas Internet, nos indica o tipo de objetivo que pretende ser alcanado nessa
nova onda de aplicaes baseadas na Internet a interconectividade de praticamente
todas as coisas nossa volta, que se tornaro na prtica, os olhos e ouvidos da internet.
3.4.2 Alguns Dados

Estimativas indicam um nmero atual de 10 bilhes de dispositivos conectados


Internet. Um nmero que j maior que o nmeros de pessoas no planeta.

Estas mesmas estimativas apontam um crescimento vertiginoso, devendo alcanar


um nmero entre 26 e 50 bilhes desses dispositivos em 2020, portanto daqui a
somente 5 anos.

Desses 26 bilhes a 50 bilhes de dispositivos, somente 1 bilho sero de


computadores pessoais, tablets e smartphones.

Na prtica, existe a inteno de dar um endereo de internet a qualquer objeto


produzido. Desse modo, a comunicao entre objetos ser bem mais intensa do
que entre pessoas, e a internet precisar dispor de banda mais larga, tornando-se
pervasiva e ubqua.

Estima-se ainda que nos prximos cinco anos sero lanados ao espao mais de
mil nano-satlites para viabilizar a comunicao desses bilhes de novos
dispositivos.

Talvez seja ainda difcil imaginarmos todo o impacto dessa nova infraestrutura de
comunicao. Mas o que podemos afirmar com certeza que todos esses
dispositivos iro gerar muitos dados, oceanos de dados, e tambm muitos
metadados.

As coisas a nossa volta, que fazem parte do nosso dia a dia corriqueiro, sero os
olhos e ouvidos da Internet. A discusso sobre as implicaes de toda essa
infraestrutura de comunicao sobre a privacidade algo que deve merecer
especial ateno.

Em 2014, o Google comprou uma empresa de automao domstica por cerca de


US$3,8 bilhes. Isso permitir ao Google saber quando voc est em casa, em que
cmodo voc est, se est dormindo ou acordado, quando voc sai de casa,
quando abre a geladeira, acende a luz, liga o micro-ondas ou a TV. A Amazon tem
esse mesmo tipo de interesse.

3.4.3 IoT Segurana e Privacidade


Um ponto que tambm merece reflexo que dados so contedo, enquanto
metadados so contexto. Metadados podem ser muito mais reveladores que dados,
especialmente quando coletados de forma agregada. Computadores so mais eficientes
lidando com metadados do que manipulando conversaes. Quando h apenas uma
pessoa sob vigilncia, o contedo de conversas, mensagens de texto e e-mails podem ser
mais importantes que seus metadados. Porm, quando uma populao inteira est sob
vigilncia, os metadados tm um significado bem mais importante e til. A IoT poder se
tornar a mais eficiente infraestrutura de vigilncia de massas jamais concebida e
construda. Segundo o ex-Conselheiro Geral da NSA Stewart Baker, Metadados dizem
absolutamente tudo sobre a vida de algum. Se voc tiver suficientes metadados voc no
precisa de contedo.

3.4.4 IoT Tecnologia desruptiva?


A IoT constituda pela utilizao conjunta de vrias tecnologias comuns, como
RFID, wi-fi, bluetooth e os mais diversos tipos de sensores, tambm sem grandes
inovaes. Desse modo, a IoT no possui caractersticas tcnicas intrnsecas que possam
ser classificadas como desruptivas. Entretanto, muito tem sido dito sobre a disrupo que
ser causada pela expanso da IoT, e que esta ser a norma nos anos vindouros. Esta
aparente contradio nos indica que no se trata de uma tecnologia desruptiva, mas sim
dos modelos de negcio que sero viabilizados e que utilizaro a IoT. Tal disrupo
provavelmente ocorrer em um perodo de transio para um novo estilo de vida, seja na
vida pessoal, profissional, social, poltica ou econmica.

Exemplos de negcios desruptivos:

UBER: a maior empresa de taxis, que no presente momento no possui um


nico automvel;

Booking: a maior empresa de hotelaria, sem possuir um nico quarto de


hotel:

AirBNB: a maior administradora de imveis, , sem possuir um nico imvel;

Bancos digitais, sem agncias

3.4.4 IoT & Big Data


A IoT, atravs de sua vasta rede de sensores, ir gerar streamings contnuos de
dados, com quantidades absurdamente grandes de dados estruturados e no estruturados,
que devero ser coletados e armazenados em nuvem e, em muitos casos analisados em
real-time. A prtica de salvar e armazenar indefinidamente dados de todos os tipos
chamada de Big Data, e a engenharia de extrao de informao til desses dados
armazenados denominado de data mining.
As evidncias da formao desses oceanos de dados, a partir do registro de
operaes financeiras, utilizao de dispositivos de comunicao, como celulares e tablets,
alm de uma infinidade de sensores, como cmaras de vdeo, radares e outros, j foram
mencionadas anteriormente.
Desse modo, a IoT implica na utilizao e expanso em ritmo idntico de Big Data.

3.5 Arquitetura da informao


A arquitetura da informao (AI) pode ser definida como

uma metodologia de desenho que se aplica a qualquer ambiente informacional, sendo


este compreendido como um espao localizado em um contexto; constitudo por
contedos em fluxo; que serve a uma comunidade de usurios. A finalidade da
Arquitetura da Informao , portanto, viabilizar o fluxo efetivo de informaes por meio
do desenho de ambientes informacionais. (Lacerda, 2005, p. 132)

Caracteriza-se, ainda, como [...] o ato de escutar, o ato de construir, o ato de


habitar e o ato de pensar a informao como atividade de fundamento e de ligao
hermenutica de espaos, desenhados ontologicamente para desenhar (Lima-Marques,
2011, p 311- 319, traduo nossa).
A arquitetura da informao pode ser considerada como disciplina quando o termo
refere-se a um esforo sistemtico de identificao de padres e criao de
metodologias para a definio de espaos informacionais, cujo propsito a
representao e manipulao de informaes; bem como a criao de relacionamentos
entre entidades lingusticas para a definio desses espaos da informao.
(Albuquerque; Siqueira; Lima-Marques, citados por Siqueira, 2008, p. 33)

Trata-se de uma rea interdisciplinar e que tem diversos profissionais envolvidos


em sua implementao. Aplica mtodos e conceitos advindos da cincia da informao e
de outras reas, tais como vocabulrios controlados, esquemas de classificao, modelos
mentais e interao homem-mquina. , em primeiro lugar, um processo, em segundo,
uma prtica (profisso) e, por fim, uma disciplina. A prtica fortalece a disciplina e promove
seu desenvolvimento.
So objetivos da arquitetura da informao: desenvolver ambientes de informao
semanticamente relevantes; modelar informao em ambientes que possibilitem sua
criao, gesto e compartilhamento pelos usurios; e promover a melhoria da
comunicao, da colaborao e do intercmbio de experincias. A informao s existe em
contextos especficos, para comunidades de significado, caso contrrio, seria somente
um aglomerado de dados.
A arquitetura da informao baseada na viso humanista, segundo a qual as
pessoas esto em primeiro lugar e a tecnologia vem em seguida; desse modo, deve estar
de acordo com as necessidades de informao dos usurios, que necessitam de
informao certa no tempo certo (Ranganathan, 1963).
Como disciplina, tem por objeto a informao, sua estrutura e configurao nos
diferentes fenmenos que a manifestam. Do ponto de vista tecnolgico, pode ser vista
como um conjunto de mtodos e tcnicas para o desenho de ambientes de informao. Os
modelos desenvolvidos para projetar uma arquitetura da informao partem de conceitos
tericos e transformam-se em um sistema de informao, uma coleo de componentes
inter-relacionados (equipamentos, programas, procedimentos, bases de dados) que
trabalham juntos para coletar, processar, armazenar e distribuir informao. Dessa forma,

a tecnologia da informao (TI) o mecanismo produtor da atividade de coleta e


tratamento de dados que gera sadas de informao e as dissemina para os usurios. Para
construir tais sistemas, necessrio:

determinar os problemas de informao;

aplicar as teorias para nortear o desenvolvimento das solues; e

integrar as solues e valid-las dentro de uma arquitetura de informao


especfica.
Sob a perspectiva das organizaes sociais ou da sociedade da informao, a

arquitetura da informao pode ser associada a uma viso de mundo, entendida como um
conjunto de aes aplicadas a um espao de informao determinado, de modo a
transform-lo em sistema de informao. Na atualidade, o domnio de modelos de
informao vital para a sobrevivncia das organizaes; toda estrutura econmica est
suportada por padres de informao. Dominar o ciclo de vida da informao desde sua
origem, seus padres de organizao, suas representaes em modelos adequados, que
possibilitem a compreenso de fenmenos e a tomada de decises, tem sido o esforo
constante das organizaes desde o final do sculo XX. Contudo, a quantidade de
informao tem se mostrado demasiada para a capacidade humana de consumi-la. A
profuso de informao e a relevncia dela sobre temas especficos suscitaram o
desenvolvimento da tecnologia e cincia da informao e, mais especificamente, da
arquitetura da informao, como instrumento para reduzir a disperso da informao e
torn-la mais adequada ao entendimento humano.
O cenrio do Big Data, por um lado, composto pela convergncia de diversas
tecnologias, que aliam facilidades de mobilidade, de cloud computing, de interfaces para a
interao homem-computador em tempo real e da conectividade de uma infinidade de
sensores e dispositivos. Por outro lado, desenha-se um cenrio de desafios, alguns de
ordem tcnica, como o excesso de dados gerados e a consequente dificuldade para filtrar
e processar o que de fato seja relevante, e outros causados pelo processo de mudanas
sociais e econmicas, em pleno andamento, propiciadas por um novo ambiente
informacional que altera os papis e a forma de relacionamento entre os entes envolvidos.
Em conjunto, esses fatores fazem da disciplina de arquitetura da informao uma
ferramenta das mais necessrias para o aproveitamento do potencial de competitividade
empresarial representado pelo Big Data.

3.6 Uma correlao entre os conceitos


O fato de gerar dados no prprio ato de consult-los transforma o papel passivo do
usurio, ou cidado, no papel ativo do prossumidor. Essa mudana, associada
necessidade de processamento em tempo real, caracterstica bsica do Big Data, fora o
uso de uma via de mo dupla para o trfego de dados, bem como o uso de interfaces cada
vez mais interativas e amigveis, tornando o computador um instrumento tanto de
processamento como de comunicao. Aplicaes de RA, como as citadas anteriormente,
exemplificam bem essa afirmao.
A comunicao, com o sentido utilizado no pargrafo anterior, diferentemente da
simples troca de informaes entre um transmissor e um receptor, pressupe uma
interao criativa, atuando como um catalisador para o surgimento de novas ideias
(Licklider, 1968, p. 21), tal como ocorre entre seres humanos. Processos criativos para o
desenvolvimento de novas aplicaes, nas mais diversas reas da atividade humana,
como os que podem ser propiciados por uma estreita cooperao homem-computador,
constituem um fator dos mais relevantes dentre aqueles que oferecem vantagens
competitivas s empresas que operam neste incio do sculo XXI, em cenrios que, muito
em breve, se aproximaro aos dos filmes de fico cientfica mencionados ao longo deste
texto.
O desenho de aplicaes de software, para maximizar suas chances de sucesso,
deve estar centrado nas necessidades e caractersticas de seus usurios e deve ser
modelado de acordo com o ambiente informacional no qual interagem os seus entes. Entre
as atribuies da disciplina de arquitetura da informao est o estabelecimento das
corretas relaes entre os entes que compem um cenrio, ou espao de informao, e da
distino entre seus papis. Em tempos de Big Data e do uso de aplicaes de RA, em
que usurios assumem novos papis e interagem em um contexto em pleno processo de
transformao, tratar de modo eficiente todos esses pontos torna-se ainda mais vital do
que j tem sido.

4 Impactos do Big Data


Tomando por base os conceitos tratados na seo anterior, passaremos, na
sequncia, a examinar os possveis impactos do Big Data, organizados como riscos,
desafios e oportunidades, sob a tica do cidado, da indstria de TI e do mercado
empresarial em geral.

4.1 Na sociedade civil


O ser humano, por natureza, costuma oferecer alguma resistncia mudana. O
processo de introduo de novas tecnologias, conforme mencionado no incio deste
trabalho, no escapa desse padro, podendo provocar tenses sociais enquanto durar sua
acomodao.
Ao associarmos o Big Data Internet das Coisas (IoT)18, os efeitos, tanto benficos
como seus riscos, so potencializados. Estimativas calculam em cerca de dez bilhes o
nmero atual de dispositivos conectados a internet. Este nmero j supera o nmero total
de habitantes do planeta e algumas previses estimam que alcance a marca de trinta
bilhes em 2020 (Schneier, 2015,). Conforme esclarece Schneier (2015), o que sabemos
que eles todos (os dispositivos) iro produzir dados, muitos dados. As coisas em nossa
volta se tornaro os olhos e ouvidos da Internet.
Ainda segundo Goodman (2015),
Nossas redes eltricas, redes de controle de trfico areo, sistemas de controle de
incndio, e at mesmo elevadores esto todos criticamente dependentes de computadores. A cada
dia, ns conectamos mais e mais de nossas vidas dirias rede mundial de informaes sem
pararmos para pensar em seu significado.
Quanto mais conectamos nossos dispositivos e nossas vidas rede global de informaes
seja por meio de telefones celulares, redes sociais, elevadores, ou automveis autmanos mais
vulnerveis nos tornarmos (traduo dos autores).

Analisaremos nesta seo alguns dos potenciais riscos e benefcios do Big Data
para o cidado.

4.1.1 Riscos
Em 1949, George Orwell19 publicou o livro 1984, no qual inseriu o personagem O
Grande Irmo, representado por um grande olho que tudo observa (Orwell, 2014). Nessa
histria, Orwell retrata um governo totalitrio e repressivo que tenta controlar a vida de
todos os cidados, monitorando-os permanentemente com o uso de cmeras de vdeo. A
previso de Orwell de monitorao de cidados demorou cerca de duas dcadas, alm da
poca em que se passa o romance, para tornar-se realidade. Porm, provvel que nem o
prprio Orwell pudesse imaginar o grau de monitorao que viria a existir. Atualmente

18
O termo Internet das Coisas" (ou Internet of Things, IoT, em ingls) foi proposto em 1999 por Kevin Ashton,
do MIT (Massachusetts Intitute of Tecnologia), Seu objetivo conectar dispositivos, sensores e itens de uso
cotidiano internet, por meio de conexes wi-fi e RFID (Radio-Frequency IDentification), formando um
sistema global de captao contnua de dados.
19

George Orwell, como ficou conhecido, na verdade o pseudnimo do escritor ingls Eric Arthur Blair.

somos monitorados no somente pelos governos, mas tambm por empresas, no apenas
por meio de cmeras de vdeo, mas por meio de uma infinidade de dispositivos, como
GPS, telefones celulares, cartes de crdito e provedores de internet. Aonde vamos, com
quem falamos, o que acessamos na internet, hbitos de consumo, todos esses dados so
registrados minuto a minuto.
A legislao de cada pas determina que empresas de telefonia celular e
provedoras de internet sejam obrigadas a guardar as informaes de uso de seus usurios
por um prazo que varia de seis meses a dois anos. O Projeto de Lei do Marco Civil da
Internet, uma espcie de constituio da internet, que se encontra na pauta de votao da
Cmara dos Deputados, em Braslia, prev um aumento no prazo de guarda dos dados de
usurios de seis meses para um ano. A Polcia Federal defende que esse projeto de lei
seja

estendido

tambm

provedores

de

contedo,

aumentando-se,

assim,

monitoramento de atividades de todos os cidados.


Recentemente, a NSA (National Security Agency), a agncia norte-americana de
segurana da informao, com creditada capacidade para interceptar a comunicao de
quem quer que seja, admitiu, aps acusaes que lhe foram feitas, que monitora as
atividades, incluindo a localizao, de cerca de cinco bilhes de celulares por dia. A LG
tambm foi obrigada a admitir que, por meio de seus televisores de ltima gerao, est
coletando e enviando empresa dados que vo alm dos hbitos televisivos de seus
usurios, incluindo arquivos de pastas compartilhadas em computadores pessoais ao seu
alcance.
A quantidade e a diversidade de informaes sobre a populao sob domnio de
governos e empresas expem a sociedade civil a uma reduo acentuada de sua
privacidade e a riscos elevados na manuteno de suas garantias fundamentais e de
liberdade, principalmente na eventualidade de governos totalitrios e antidemocrticos.
Nesse sentido, temos uma questo interessante para refletir, apresentada por Malte Spitz
(2012), pesquisador alemo que estuda o impacto do Big Data na sociedade: nos dias
atuais, praticamente cada cidado carrega consigo um telefone celular; caso fosse essa a
realidade em 1989, teria sido possvel a derrubada do muro de Berlim ou a Stasi, a temida
polcia poltica da antiga Alemanha Oriental, teria tido os meios de impedir o evento e
prender os principais lderes do movimento? A Figura 2.1, construda com base em uma
lista de registros de ligaes telefnicas, mostra a visualizao do relacionamento entre os
respectivos usurios do servio de telefonia mvel (Spitz, 2012). Alm de expressar a
facilidade existente na atualidade para monitorar praticamente toda a populao mundial, a
figura 2.1 tambm ilustra o poder da visualizao para melhorar o entendimento,
principalmente de situaes de alta complexidade, quando comparada com a anlise de
uma lista de registros.

Figura 2.1 Redes de conexes de usurios de telefonia celular

Fonte: Spitz, 2012.

4.1.2 Benefcios
A seguir, listamos alguns dos potenciais benefcios do Big Data populao em
geral (Canton, 2015; Goodman, 2015; Schneier, 2015):

luta contra o crime organizado e grupos terroristas;

combate a fraudes financeiras;

combate a epidemias;

controle preventivo de grupos de riscos de determinadas doenas;

localizao e atendimento imediato em casos de mal sbito ou emergncias

diversas;

planejamento de investimentos em infraestrutura;

planejamento de aes em caso de acidentes ou catstrofes naturais.

Nessa

lista

de

potenciais

benefcios,

maioria

dos

itens

apoia-se

no

reconhecimento de padres. E, mais uma vez, deparamo-nos com a necessidade da


participao do ser humano para a identificao de padres inditos. Em grandes volumes
de dados, com crescimento acelerado e originados de fontes diversas, componentes
constituintes de novos padres ficam cada vez mais escondidos, aumentando a dificuldade
em perceb-los. No caso de adversrios adaptativos, como grupos organizados que
planejam e executam fraudes financeiras e atos terroristas, evitando ou raramente
apresentando um padro repetitivo que algoritmos computacionais possam identificar,

tornam-se fundamentais, para o sucesso das aes de combate a essas prticas, a


participao do ser humano e a eficincia de interfaces colaborativas para a interao
homem-mquina.

4.2 Na indstria de tecnologia


A indstria de TI tem procurado responder adequadamente aos desafios do
fenmeno do Big Data, nada modestos, lanando tecnologias especficas para atender s
necessidades de infraestrutura e de tcnicas para o armazenamento e a anlise dados, em
dimenses inditas em sua breve histria. Algumas dessas situaes desafiadoras
apresentam tanto componentes de risco como oportunidades de crescimento e ganhos.

4.2.1 Desafios e oportunidades


Em termos de armazenamento, o modelo relacional, proposto em 1969 e
implementado nos principais bancos de dados disponveis no mercado, foi desenhado para
tratar apenas dados estruturados, com objetivos definidos de suportar de modo eficiente a
categorizao e a normalizao desse tipo de bases de dados. Apesar de extremamente
bem sucedido, tanto tecnicamente como comercialmente, o modelo relacional no foi
projetado para tratar dados no estruturados ou suportar uma escalabilidade at a ordem
de petabytes, ou mais, tendo seu desempenho fortemente afetado nessas condies. As
estruturas tradicionais de indexao e os correspondentes mecanismos de busca e
recuperao so inadequados nessas circunstncias. A resposta da indstria de TI a esses
desafios traduz-se no lanamento de diversos modelos de bancos de dados apropriados
ao armazenamento de dados no estruturados, denominados NoSQL (Not only SQL),
projetados para uma escalabilidade compatvel com as necessidades do Big Data, j
comercialmente disponveis.
Em termos da anlise de dados, tornou-se necessrio repensar as tcnicas que
vm sendo empregadas em bases relacionais, em razo das novas exigncias de
velocidade para suportar o tratamento de dados em tempo real. O modelo tradicional de
minerao de dados foi desenvolvido com a perspectiva de filtrar os dados gerados pelos
diversos sistemas transacionais, copiar os dados resultantes numa base analtica,
atualizada periodicamente, ou data warehouse, e depois aplicar queries a essa base. O
problema desse tipo de soluo que na prtica os relatrios analticos so produzidos
com base em dados estticos, refletindo a realidade de horas ou dias anteriores. Para
resolver essa questo, surgiu o conceito de stream processing, um novo paradigma de
processamento paralelo, no qual, em vez da aplicao de queries a bases previamente

organizadas, e estticas, ocorre que o fluxo contnuo de dados, ou streaming data, passa
por uma srie de operaes previamente determinadas. Tambm nesse caso, a indstria
de TI j oferece ferramentas voltadas para o tratamento analtico de dados, compatveis
com as caractersticas do Big Data, como Haddop e MapReduce20.
Outro desafio tcnico imposto pelo Big Data a criao, gesto e aplicao de
cpias de segurana, em um cenrio de fluxo constante de dados, em volumes e
velocidades elevadas, em que deixa de existir a figura da janela de tempo para a
realizao de backup off-line.
Entretanto, independentemente das iniciativas e progressos j alcanados pela
indstria de TI, preciso considerar a possibilidade de estarmos vivendo um momento
histrico, como o descrito no incio deste trabalho, no qual a introduo de uma nova
tecnologia tem o potencial de alterar o equilbrio social e econmico em diversos setores
da atividade humana, tornando mais ntidos os efeitos de um processo econmico
darwinista. Considerando essa perspectiva, apresentamos a seguir alguns pontos que, ao
mesmo tempo, podem significar desafios, riscos e oportunidades para os atores
envolvidos:

desafios de ordem tcnica ainda a serem solucionados de forma eficiente:


o

interfaces interativas de baixo atrito;

tcnicas e ferramentas de backup;

pessoal qualificado insuficiente;

crescimento acelerado de aplicaes e do surgimento de novas empresas,

agravando a competio tanto por mercados especficos como por mo de obra


qualificada;

momento histrico de volatilidade tecnolgica, com risco de surgimento e

rpido desaparecimento de inmeros produtos e, eventualmente, de suas


respectivas empresas;

momento de disputa intensa entre as empresas bem-sucedidas com o

lanamento de novos produtos, as quais com o tempo devero ser incorporadas por
outras maiores, restando, ao final desse perodo de maior instabilidade, apenas as


20

Hadoop consiste basicamente em uma infraestrutura que permite o processamento massivamente paralelo,
utilizando um grande nmero de computadores (ns), que podem estar em uma mesma rede local, formando
um cluster, ou geograficamente distribudos, constituindo um grid. MapReduce uma plataforma para o
desenvolvimento de aplicaes voltadas para o processamento distribudo de grandes volumes de dados,
estruturados ou no. Hadoop e MapReduce so projetos originalmente concebidos pela Fundao Apache. Ver
Apache Software Foundation (2015a, 2015b).

empresas que melhor conseguirem se adaptar ao novo cenrio tecnolgico e


econmico.

4.3 No mercado empresarial em geral


Com o objetivo de conhecer melhor os seus antigos e potenciais novos clientes
para maximizar as vendas de produtos e servios, as empresas tero como observar e
coletar uma grande variedade de dados sobre hbitos de consumo, quer seja on-line, que
seja presencialmente. Podero reconhecer clientes facialmente e gravar as imagens e
comentrios destes enquanto estiverem dentro ou na frente de uma loja, banco ou
supermercado, obtendo suas impresses sobre produtos, atendimento e instalaes.
Podero, ainda, avaliar o atendimento de cada vendedor e a reao de cada consumidor,
sugerir em tempo real a compra de algum item ou mesmo oferecer promoes
instantneas e exclusivas. Os profissionais de marketing no podero reclamar da falta de
informaes sobre o mercado ou do perfil de seus clientes. A fico apresentada no filme
Minority Report est prxima de tornar-se realidade. Entretanto, o aproveitamento eficiente
de todo esse potencial de marketing depende de uma srie de fatores tecnolgicos e
humanos, listados a seguir.
2.4.3.1 Riscos
A maior parte dos riscos apontados para a indstria de TI est igualmente presente
para a totalidade do mercado. A seguir, destacamos alguns desses riscos:

pessoal despreparado para explorar as novas tecnologias;

pessoal despreparado para a anlise eficiente da grande quantidade de

dados coletados e a inferncia de padres de consumo;

necessidade

de

reagir

rapidamente,

atuando

no

mercado,

preferencialmente, de forma proativa.

4.3.2 Oportunidades
Como mencionado anteriormente, acreditamos que as melhores oportunidades
para a obteno de vantagens competitivas com o Big Data estaro centradas na
capacidade de reconhecimento de padres, principalmente na identificao de padres
inditos ou adaptativos. No entanto, como ilustram os exemplos citados ao longo do texto,
novas aplicaes surgem a todo momento e em todas as reas de atividades econmicas.

Consideraes finais
O Big Data, enquanto restrito a bases de dados de grande volume, ainda que se
considerem as exigncias de infraestrutura e ferramentas para seleo, coleta e
armazenamento especialmente projetadas, no constitui fator efetivo de competitividade,
configurando apenas um potencial a ser aproveitado por sistemas e aplicaes.
Algoritmos para o reconhecimento de padres certamente oferecero vantagens
competitivas em diversas reas da atividade humana, porm os maiores benefcios
podero ser obtidos pela deteco de padres inditos ou adaptativos, que podero
posteriormente ser tratados por algoritmos especficos, por meio de uma simbiose homemmquina.
As aplicaes que fizerem uso do Big Data em conjunto com modelos de realidade
aumentada podero oferecer as melhores condies de efetividade na anlise de cenrios
de elevada complexidade, e, portanto, de competitividade, quando envolverem o ser
humano em um processo colaborativo. Desse modo, as solues devem ser desenhadas
considerando-se a participao central do ser humano, com especial ateno s interfaces
interativas que possam privilegiar sua capacidade criativa e associativa.
Neste cenrio de introduo de novas tecnologias, a Histria nos ensina que os
detalhes podem significar importante vantagem competitiva, a diferena entre o sucesso e
o fracasso, entre o crescimento e o desaparecimento de empresas. Desse modo, torna-se
necessrio aperfeioar o projeto de cada componente do processo, desde a produo de
dados por diversos atores e dispositivos, os mecanismos de coleta desses dados de
diferentes formatos, os mecanismos de seleo e armazenamento, as ferramentas para a
anlise e a construo de algoritmos para o reconhecimento de padres e as interfaces
para a apresentao desses dados e a interao com as aplicaes, de forma a permitir a
tomada de deciso mais inteligente. A matria-prima de todo esse processo, os dados, e o
fator de maior relevncia, o envolvimento do ser humano, devem ser tratados como os
elementos mais importantes, e, nessa perspectiva, a arquitetura da informao constitui a
mola mestra, subjacente a todos os aspectos relacionados ao Big Data.
Para finalizar, ressaltamos que, para aproveitarem a janela de oportunidades do Big
Data e se beneficiarem de seu potencial competitivo, as empresas devem ser proativas,
sendo necessrio reconhecer os fenmenos por trs do Big Data, estud-los em
profundidade e avaliar seriamente seus impactos. Reagir ser contraproducente.

Questes para estudos futuros

Avaliar os impactos polticos e jurdicos do Big Data;

Avaliar fragilidades tecnolgicas e seu impacto em uma sociedade cada vez

mais tecnologicamente dependente (Qual seria, por exemplo, o impacto em toda a


sociedade humana de um colapso da internet e dos meios de comunicao
eletrnica, por um perodo prolongado?);

Avaliar as tcnicas e ferramentas disponveis para a criao e gesto de

cpias de segurana (backup);

Avaliar a vida til e analisar os aspectos tecnolgicos e econmicos da

obsolescncia acelerada dos dispositivos de armazenamento de dados, na


perspectiva do Big Data;

Analisar, sob o domnio da arquivologia, as tcnicas e mecanismos de

coleta, armazenamento e recuperao de dados, na perspectiva do Big Data;

Modelar uma arquitetura da informao para o Big Data.

Referncias
APACHE

SOFTWARE

FOUNDATION.

Hadoop.

Disponvel

em:

<http://hadoop.apache.org/>. Acesso em: 11 fev. 2015a.


_____.

MapReduce

tutorial.

Disponvel

em:

<https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html>. Acesso em: 11 fev.


2015b.
CANTON, J. Future Smart: Managing the Game-Changing Trends that Will
Transform Your World. Boston: Da Capo Press, 2015. Livro eletrnico.
CLARKE, S. A. C. 2001: uma odisseia no espao. 1. ed. So Paulo: Aleph, 2013.
DAYAL, R. et al. Risk Report 2012-2013: An Inflection Point in Global Banking. BCG
The

Boston

Consulting

Group,

2012.

Disponvel

em:

<http://www.bcg.de/documents/file123001.pdf>. Acesso em: 11 fev. 2015.


FERNANDES, G. L.; LIMA-MARQUES, M. Em busca de um modelo fenomenolgico
do

mecanismo

de

apreenso

humana.

Disponvel

em:

<http://www.academia.edu/4070969/Em_busca_de_um_modelo_fenomenol%C3%B3g
ico_do_mecanismo_de_apreens%C3%A3o>. Acesso em: 11 fev. 2015.
FOLDIT. The Science Behind Foldit. Washington: Foldit, 2013. Disponvel em:
<http://fold.it/portal/info/about>. Acesso em: 11 fev. 2015.
FORTUNE. Global 500. USA: CNN Money, 2013.
GANTZ, J.; REINSEL, D. The Digital Universe in 2020: Big Data, Bigger Digital
Shadows, and Biggest Growth in the Far East. [S.l.]: IDC, Dec. 2012. Disponvel em:
<http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf>.
Acesso em: 8 dez. 2013.
GOODMAN, M. Future crimes: everything is connected, everything is vulnerable
and and what we can do about it. New York: Doubleday, 2015. Livro Eletrnico.
HILBERT, M.; LPEZ, P. The Worlds Technological Capacity to Store, Communicate,
and Compute Information. Science, v. 332, n. 6025, p. 60-65, Apr. 2011. Disponvel
em: <http://www.uvm.edu/~pdodds/files/papers/others/2011/hilbert2011a.pdf>. Acesso
em: 11 fev. 2015.
HUMAN BRAIN PROJECT. Disponvel em: <https://www.humanbrainproject.eu/pt>.
Acesso em: 11 fev. 2015.

LICKLIDER, J. C. R. Man-Computer Partnership. International Science and


Technology, May 1965. Disponvel em <http://worrydream.com/refs/Licklider%20%20Man-Computer%20Symbiosis.pdf>. Acesso em 30/03/2015.
_____. Man-Computer Symbiosis. Transactions on Human Factors in Electronics,
v.

HFE-1,

p.

4-11,

Mar.

1960.

Disponvel

em:

<http://worrydream.com/refs/Licklider%20-%20Man-Computer%20Symbiosis.pdf>.
Acesso em: 11 fev. 2015.
LICKLIDER, J. C. R.; TAYLOR, R. W. The Computer as a Communication Device.
Science

and

Technology,

Apr.

1968.

Disponvel

em

<http://sloan.stanford.edu/mousesite/Secondary/Licklider.pdf>. Acesso em: 11 fev.


2015.
LIMA-MARQUES, M. Outline of a Theoretical Framework of Architecture of
Information: a School of Brasilia Proposal. In: BZIAU, J.; CONIGLIO, M. E. (Ed.).
Logic Without Frontiers: Festschrift for Walter Alexandre Carnielli on the Occasion of
his 60th Birthday. London: College Publications, 2011. (Tribute Series, v. 17).
LACERDA, F. O.. Arquitetura da informao: aspectos epistemolgicos, cientficos e
prticos. 2005. 190 f. Dissertao (Mestrado em Cincia da Informao)
Universidade de Braslia, Braslia, DF, 2005.
MCLUHAN, S.; STAINES, D. McLuhan por McLuhan: conferncias e entrevistas
inditas do profeta da globalizao. Rio de Janeiro: Ediouro, 2005.
MELL, P.; GRANCE, T. The NIT Definition of Cloud Computing: Recommendations
of the National Institute of Standards and Technology. Gaithersburgh, MD: US
Department of Commerce; National Institute of Standards and Technology, Sept. 2011.
Special

Publication

800-145.

Disponvel

em:

<http://csrc.nist.gov/publications/nistpubs/800-145/SP800-145.pdf>. Acesso em: 11


fev. 2015.
NIH BLUEPRINT FOR NEUROSCIENCE RESEARCH. The Human Connectome
Project. Disponvel em: <http://www.humanconnectome.org/>. Acesso em: 11 fev.
2015.
NIH National Institutes Of Health. The Brain Initiative. Disponvel em:
<http://www.nih.gov/science/brain/index.htm>. Acesso em: 11 fev. 2015.
ORWELL, G. Nineteen Eighty-four (1984). Adelaide: University of Adelaide, 2014.
Disponvel em: <https://ebooks.adelaide.edu.au/o/orwell/george/o79n/>. Acesso em:

11 fev. 2015.
RANGANATHAN, S. R. Documentation and Its Facets: Being a Symposium of
Seventy Papers by Thirty-two Authors. [S.l.]: Asia Publishing House, 1963.
RIORDAN, M.; HODDESON, L. Crystal Fire: the Birth of the Information Age. New
York: Norton, 1997.
SANKAR, S. The Rise of Human-computer Cooperation. Edinburgh, Scotland: TED,
June

2012.

Palestra.

Disponvel

em:

<http://www.ted.com/talks/shyam_sankar_

the_rise_of_human_computer_cooperation.html>. Acesso em: 11 fev. 2015.


SIQUEIRA, A. H. A lgica e a linguagem como fundamentos da Arquitetura da
Informao. 141 f. Dissertao (Mestrado em Cincia da Informao) Faculdade de
Economia, Administrao, Contabilidade e Cincia da Informao e Documentao,
Universidade

de

Braslia,

Braslia,

DF,

2008.

Disponvel

em:

<http://repositorio.unb.br/bitstream/10482/3185/1/Dissert_AndreHenriqueSilveira.pdf>.
Acesso em: 11 fev. 2015.
SCHNEIER, B. Data and Goliath: the hidden battles to collect your data and
control your world. New York: W. W. Norton & Company, 2015. Livro eletrnico.
SPITZ, M. The Dark Side of Data. Edinburgh, Scotland: TED, June 2012. Palestra.
Disponvel

em:

<http://www.ted.com/playlists/130/the_dark_side_of_data.html>.

Acesso em: 11 fev. 2015.


STATISTIC

BRAIN.

Facebook

Statistics.

Jan.

27,

2015a.

Disponvel

em:

<http://www.statisticbrain.com/facebook-statistics/>. Acesso em: 11 fev. 2015.


_____. Google Annual Search Statistics. Jan. 9, 2015b. Disponvel em:
<http://www.statisticbrain.com/google-searches/>. Acesso em: 11 fev. 2015.
_____.

Netflix

Statistics.

May

3,

2013.

Disponvel

em:

<http://www.statisticbrain.com/netflix-statistics/>. Acesso em: 11 fev. 2015.


_____. Total Number of Pages Indexed by Google. Jan. 9, 2015c. Disponvel em:
<http://www.statisticbrain.com/total-number-of-pages-indexed-by-google/>. Acesso em:
11 fev. 2015.
TARAPANOFF, K. Anlise da informao para tomada de deciso: desfios e
solues. Curitiba: Ed. Intersaberes 2015.
TOFLER, A. A terceira onda. Rio de Janeiro: Record, 1980.
TURING, A. M. Computing Machinery and Intelligence. Mind, JSTOR New Series, v.
59,

n.

236,

p.

433-460,

Oct.

1950.

Disponvel

em:

<http://phil415.pbworks.com/f/TuringComputing.pdf>. Acesso em: 11 fev. 2015.


VERMEULEN, C. Algorithmic Trading: The New Way of Investing for Peak
Performance. Nov. 2013. Disponvel em: <http://www.algotrades.net/algorithmictrading-new-way-investing-peak-performance/>. Acesso em: 11 fev. 2015.

Você também pode gostar