Você está na página 1de 10

Big Data: os novos desafios para o profissional da informação

Big Data: os novos desafios para o profissional da informação

Claudio José Silva Ribeiro


Universidade Federal do Estado do Rio de Janeiro (UNIRIO), Brasil. E-mail:
claudio.ribeiro@unirio.br

Resumo
O tema Big Data tem despertado interesse nos profissionais que trabalham com a Gestão da
Informação. Este artigo apresenta o tema e explora os fundamentos que auxiliam no entendimento da
abordagem de Big Data. Discute a explosão informacional e a avalanche de dados, chegando aos
elementos que compõem o tema. Aborda os 4 Vs do Big Data e as fases de Discovery, Data
Preparation, Model Planning e Analytics. Ao final, apresenta alguns aspectos ligados ao perfil do
profissional que está participando destes projetos.
Palavras-chave: Big Data. Gestão da Informação. Análise de Dados. Profissional de Informação.
multidirecionados e levam condições
1 Introdução virtuais em seu desatamento, quando o
tempo se aproxima de zero, a
O tema Big Data desperta, na velocidade se acerca do infinito e os
atualidade, o interesse, e até mesmo o espaços são de vivência pela não
presença (BARRETO, 2014, online).
fascínio, para todas as pessoas que tem
algum envolvimento com atividades para Outra contribuição para este debate
Gestão da Informação (HUWE, 2012). foi levantada pelo Profo. Dr. Marcos
A recente reportagem publicada no Cavalcanti, pesquisador do CRIE/COPPE,
Rio de Janeiro pelo Jornal O Globo, sob que afirmou em recente publicação que
título “Big Data: enxurrada de dados “Ao contrário do que muita gente pensa,
emerge como novo termômetro da Big Data não é uma ‘nova tecnologia’”
economia” suscitou um debate interessante (CAVALCANTI, 2014, online).
sobre novas formas para interação entre a Fazendo uma análise preliminar
sociedade, governos e serviços em geral, destes movimentos, é licito supor que o
pois estas formas promovem uma nova profissional de informação deve refletir um
dinâmica para fluxos informacionais pouco sobre como poderá se envolver nas
(SETTI, 2014). A publicação desta discussões sobre o tema Big Data, pois
reportagem por um veículo de grande afinal, o uso de dados e informação sempre
circulação, demonstra que este assunto já é foi objeto de estudo para a Ciência da
de interesse para a sociedade, indo além Informação.
das fronteiras acadêmicas e da realização Vale lembrar que não está se
de negócios. propondo algo totalmente novo com o
Verifica-se também um movimento tema Big Data, pois o uso de informação
na área de Ciência da Informação neste para a obtenção de resultados não é uma
tema, quando o Profo. Dr. Aldo Barreto, coisa nova. Ao fazer um breve retrospecto
pesquisador na nossa área, faz em seu blog nas pesquisas desenvolvidas na área, é
algumas reflexões sobre os três tempos da possível observar que o desenvolvimento
ciência da informação. Ele traz uma de ações investigativas em Sistemas de
consideração sobre os estoques disponíveis Apoio à Decisão (EIS), uso de Armazéns
de forma online, onde afirma que: de Dados (Data Warehouses e Data Marts),
Hoje, com a condição online os aplicações para melhorar o Desempenho
estoques e os fluxos de informação, dos Negócios (Business Intelligence),
renomeados para “Big Data”, são soluções para Mineração de Dados (Data
96
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014
Big Data: os novos desafios para o profissional da informação  

Mining) (CIUPAK, BOSCARIOLI, Dentro deste contexto, este relato


CATARINO, 2013; HOFFMANN, 2011; introduz a discussão dentro do projeto de
REIS, ANGELONI, SERRA, 2010; pesquisa do autor, que tem por objetivo
VELHO, GOMES, 2009), além de investigar métodos e abordagens para gerir
informação para planejamento estratégico, recursos de informação residentes em
gestão de recursos informacionais e ativos ambientes digitais.
de informação na Web (BETTENCOURT,
CIANCONI, 2013; GUEDES, 2012; 2 Da Explosão Informacional à
BARBOSA, NACIF, 2012; RIBEIRO, Avalanche de Dados
2008; dentre outros), foram abordagens O tratamento e uso da informação
exploradas nos últimos anos pela Ciência pela sociedade têm se modificado nas
da Informação. últimas décadas como consequência do
Mas afinal, o que é Big Data? É uma surgimento de novos modelos sociais,
tecnologia? Uma ferramenta? Uma econômicos ou tecnológicos. Estes
metodologia nova? Como o profissional da modelos promoveram uma mudança de
informação pode se inserir na discussão paradigma tão importante quanto à
deste tema? invenção da imprensa, ou ainda, quanto à
Para esclarecer estas questões é própria revolução industrial. A crescente
preciso, antes de tudo, observar algumas utilização de meios de comunicação com
considerações sobre os aspectos alto grau de mobilidade e o uso cada vez
norteadores para o tema Big Data. maior da Internet, definem outros espaços
A primeira consideração diz respeito e demarcam novas fronteiras para a
ao tratamento de Big Data como uma sociedade contemporânea (RIBEIRO,
tecnologia, pois o tema de alto volume de 2008).
dados e informação há muito se faz A quantidade de informação
presente nas pesquisas sobre processos de disponível cresce vertiginosamente e
Gestão da Informação. O impulso dado surgem novos comportamentos e
pela tecnologia, principalmente pelo sentimentos decorrentes deste crescimento.
incremento do uso dos dispositivos Termos como Ansiedade da Informação,
móveis, trouxe um forte aumento no cunhado por Wurman (2005), e Explosão
volume de dados. Mas, o debate sobre Informacional cunhado por Gopinath e Das
temas como o crescimento exponencial da (1997) corroboram este estado de
informação e explosão informacional, insatisfação dos usuários. Além disto,
originados pelas pesquisas pós segunda apesar do frequente lançamento de novas
Guerra Mundial, já se fazia presente nas tecnologias e ferramentas para resolver os
discussões e pesquisas na área de Ciência problemas dos usuários, a cada dia que
da Informação (SARACEVIC, 1996). passa, eles (os usuários) têm mais
Uma segunda consideração diz dificuldades em solucioná-los. Para
respeito à variedade de dados disponíveis. Wurman:
A profusão de informações na internet,
Cada nova tecnologia não acaba com o
originadas pelas diferentes fontes de dados, resto, mas termina somando-se às
ocasionam uma sobrecarga de dados e outras. Disseram que o computador
informação disponíveis para a sociedade. tornaria o papel obsoleto; aconteceu
Cabe registrar que apenas 1% destes dados justamente o contrário: graças às
é efetivamente analisado (BREITMAN, impressoras e copiadoras. Acreditava-
se que o vídeo fosse dar fim ao cinema,
2014) e, consequentemente, pode-se mas hoje há mais filmes do que nunca.
deduzir que existe um grande campo de [..] Estamos cercados por versões
atuação para os profissionais que atuam na alternativas, imitações e originais, tudo
disciplina de gestão da informação. em números incontáveis de
exemplares. (WURMAN, 2005, p.4-5)

97
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014
Big Data: os novos desafios para o profissional da informação  

Heath e Bizer (2011) reforçam que Complementarmente, é possível


na atualidade estamos cercados por uma perceber também uma mudança no
grande quantidade de dados e informação. funcionamento das aplicações de comércio
São registros sobre o cotidiano – eletrônico. A ampliação do uso de sistemas
desempenho da educação, produção de de recomendação 1 na Web, permite que
bens e serviços, investimentos e impostos sejam indicados dezenas de opções de
governamentais, estatísticas sobre a compras aos clientes usuários destes
economia e dados sobre o consumo - que serviços.
nos ajudam a tomar decisões e gerar Por outro lado, a previsão da
conhecimento. expansão das fontes de dados é de
Verifica-se também que existe uma aproximadamente 50 vezes nos próximos
retomada de debates para organizar a 10 anos. Segundo previsões apresentadas
informação, que estão sendo discutidos sob pela empresa EMC, instituição
a disciplina de ERM (Electronic Resource especializada em armazenamento de
Management), pois este tema tem surgido dados, o crescimento de dados e
com frequência nos projetos sobre o informações digitais no mercado brasileiro
gerenciamento de ativos e/ou recursos de crescerá de 212 Exabytes 2 em 2014,
informação digitais (SPREHE, 2005). alcançando a marca de 1.6 Zettabytes
Ribeiro (2008) convalida esta (1.600 Exabytes) em 2020 (EMC, 2014).
percepção e observa que: Fruto deste cenário, rico em volume
[..] o processo de estruturação de dados e variedade de fontes, tem surgido uma
e informações carece de maior nova disciplina que, apesar de não ser
instrumentação, pois a ótica utilizada apenas um tema essencialmente
na atualidade está mais concentrada em tecnológico, vem sendo impulsionado
aspectos tecnológicos do que nas
pelos projetos de tecnologia: a vertente de
questões de organização das
informações, deixando em segundo Big Data.
plano as indagações ligadas à gestão da
informação (RIBEIRO, 2008, p. 18). 3 A visão do Big Data
Mas afinal, o que está impulsionando Fox e Hendler (2011) também
esta avalanche? Conforme mencionado na anteciparam que estamos vivendo com
introdução deste relato, uma diferença uma nova abordagem chamada de “Big
observada é que com a evolução da Data”. Esta abordagem está surgindo em
tecnologia o cotidiano ficou repleto de decorrência da geração, e,
dados e informação, só que agora ao consequentemente, da necessidade da
alcance dos nossos dedos. O avanço do uso coleta de grande volume de dados com
de dispositivos móveis, o uso de sensores formatos variados. Ademais, estes dados
industriais e biomédicos, fotos, vídeos, e- ainda precisam ser geridos e, neste sentido,
mails, redes sociais, além do comércio Hendler e Fox continuam e observam que
eletrônico, interações via call centers, a gestão destes recursos possibilitará a
dispositivos móveis, dados públicos resolução de problemas que nem sabíamos
imagens médicas e outros dados que existiam. No entanto, vale ressaltar
científicos, câmeras para monitoramento,
                                                                                                               
medidores inteligentes, GPS, aplicativos 1
Em um sistema de recomendação, parte-se de perfis de
para troca de mensagens, aplicações que usuários específicos, que podem ser agrupados e
nos ajudam a pegar táxis, outras que nos relacionados a outros perfis que, quando incrementados
com seus respectivos históricos de compras e com os
ajudam na locomoção urbana evitando dados originados pelas redes sociais, possibilitam a
engarrafamentos, ou ainda no descoberta de produtos a serem ofertados (FLORISSI,
monitoramento de ônibus e até de aviões, 2
2014).
são exemplos concretos desta avalanche. A unidade Exabyte é equivalente, em números
aproximados, a 1.000 Petabytes, ou a 1.000.000 de
Terabytes, ou ainda a 1.000.000.000 de Gigabytes.
98
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014
Big Data: os novos desafios para o profissional da informação  

que não podemos prescindir de A abordagem de Big Data está


ferramentas, pois a capacidade do ser apoiada em quatro outros fatores de
humano de analisar dados e informações sustentação, conhecidos como os 4 Vs do
com múltiplas facetas é limitada. Logo, são Big Data: Volume, Variedade, Velocidade
necessários alguns instrumentos que nos e Veracidade (DUMBILL, 2012). A seguir
auxiliem a executar estas tarefas. será apresentado um breve esclarecimento
A necessidade de vencer o desafio, do papel de cada um desses componentes:
reunindo e analisando fontes de diversas O primeiro V é de Volume e está
naturezas, deu origem a pesquisas que nos ligado ao grande quantitativo de dados e
levaram ao tema “Big Data”. Estas informações que nos cercam no cotidiano.
pesquisas foram desenhadas a partir de três Já o segundo V está ligado à variedade
aspectos iniciais (DAVENPORT, 2014): destes recursos.
1. A múltipla natureza dos dados – Devido a forte relação entre Volume
aspecto relacionado com as e Variedade, estes fatores serão
diferentes fontes disponíveis. comentados em conjunto. A multiplicidade
2. O uso de processamento em de dispositivos e a capacidade destes
nuvem – aspecto relacionado ao dispositivos interagirem em rede está
uso ilimitado de recursos promovendo a verdadeira inundação de
computacionais e com dados. Cada um de nós carrega junto de si
processamento em larga escala, um celular, que agindo como um sensor,
com a possibilidade de redução de pode enviar informação de localização das
custos (economia de escala – é o pessoas e permitir a realização de negócios
aspecto econômico-financeiro). direcionados 8 . Ao levarmos em
3. Uso de tecnologias específicas,
consideração que o mundo tem cerca de 7
tais como processamento de bilhões de habitantes (WIKIPEDIA, 2014)
rotinas em paralelo e ferramentas e que aproximadamente 6 bilhões possuem
para otimização como Hadoop3 e celulares (ONUBR, 2013), pensem no
MapReduce 4 , HDFS 5 , além de volume e na variedade de dados que pode
abordagens de MachineLearning6 ser gerado, captado, processado,
e Analytics7. (re)utilizado e entregue.
As cidades estão repletas de câmeras
de monitoramento nos prédios, lojas, ruas e
                                                                                                                avenidas. Qualquer cidadão pode gravar e
3
Hadoop é tecnologia open source desenvolvida pela postar um vídeo em mídias sociais ou no
Google e Yahoo para processar muitos dados em Youtube. Estima-se que a quantidade de
servidores, usando a noção de processamento em
paralelo e uso de clusters (conjuntos) de computadores
vídeos produzidos diariamente ultrapassa a
no processamento. Pode ser chamado de Apache produção dos primeiros 50 anos de
Hadoop e também foi desenvolvido e customizado por televisão (DAVENPORT, 2014).
outros fabricantes (EMC, Intel, Microsoft, dentre
outros).
Saindo do cotidiano e observando o
4
MapReduce é o framework arquitetural que deu origem ambiente de ciência e tecnologia, temos
à tecnologia de Hadoop. Usa a estratégia de dividir muitos outros exemplos. Os projetos de
para conquistar, ou seja, distribui e aloca um problema
muito grande em clusters de armazenamento, usando
pesquisa de perfuração de petróleo em
registros serializáveis do tipo <chave, valor>. águas profundas, incluindo o pré-sal
5
HDFS é a sigla de Hadoop File System. É uma estrutura (CIARINI, 2013; SANTOS, 2014), além
de armazenamento de arquivos que utiliza blocos de
128 Mbytes, que são muito menores do que os blocos
de projetos de pesquisa em astronomia,
de particionamento tradicionais, utilizados em                                                                                                                
8
dispositivos de armazenamento. Um exemplo para a prática de negócios direcionados é o
6
Machine Learning trata o uso de algorítimos que e e-couponing. Esta prática possibilita o envio de
identificam o melhor modelo para ser aplicado ao cupons de desconto em tempo real para os usuários,
conjunto de dados. quando os mesmos estão nas proximidades das lojas,
7
Analytics é a essência de Big Data. Trata a análise dos utilizando-se as coordenadas GPS dos celulares dos
dados e será apresentada mais à frente neste relato. usuários (FLORISSI, 2014).
99
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014
Big Data: os novos desafios para o profissional da informação  

estão impulsionando o uso da abordagem entendidos pela noção de Big Data


de Big Data (PORTO, 2013). Analytics.
Adiciona-se a esse cenário, uma
vasta coleção de outras fontes e formas 4 O esforço para análise: o
para geração de unidades documentárias. O trabalho com Big Data Analytics
crescimento do uso de documentos digitais
e páginas Web nas organizações, recursos O objetivo da tarefa de Analytics é
estes estruturados por meio de ferramentas executar a análise preditiva dos dados por
para Gestão de Conteúdo (RIBEIRO, meio da execução de mining
2012), bem como o desenvolvimento de (minerações)9. Segundo os autores Oliveira
propostas de uso da Web of Data e Linked (2013) e Tavares (2014), inicialmente,
Data (RIBEIRO, ALMEIDA, 2011; serão tratados os dados com o uso de
RIBEIRO, PEREIRA, 2014) também têm técnicas estatísticas, para separação e
contribuído para um aumento em Volume reunião de conjuntos (denominado de fase
e Variedade de dados e informação. de discovery).
Voltando aos 4 Vs do Big Data, Adicionalmente, para executar a
chega-se agora ao terceiro V, de tarefa também pode-se fazer uso de
velocidade. A melhoria dos canais de técnicas para categorização, limpeza e
transmissão, com redes em fibra ótica e transformação dos dados, utilizando,
emissores de sinais de alta capacidade, o inclusive, a visão da proveniência (fontes
uso de satélites, o uso de outras bandas de origem) dos dados para auxiliar no
para a telefonia celular, as comunicações processo de categorização. Ao final desta
em tempo real para controle de processos fase é possível chegar à definição e
na internet, os workflows científicos com preparação de modelos (fase de data
processamento paralelo e cluster de preparation e model planning) que serão
processamentos vem possibilitando atingir úteis na construção do grande conjunto de
uma maior velocidade para troca de dados dados, chamado de lago de dados (data
e informação (MATTOSO, 2013). lake).
Ademais, é possível afirmar que a A carga de dados (denominada fase
velocidade continuará crescendo, pois o de ingest) ocorrerá em seguida e será
desenvolvimento da tecnologia de realizada para povoar o lago de dados. No
processadores, dos canais e do hardware lago estarão reunidos todos os dados que
para armazenamento (discos rígidos e serão alvo de análise. Por fim, os
memória rápida – flash memory), duplica o resultados que serão obtidos a partir do
seu poder a cada período de 2 anos tratamento e análise do conteúdo do lago
(FLORISSI, 2012). serão apresentados com uso de ferramentas
O quarto V é de Veracidade. A de visualização e deverão estar associados
qualidade dos dados e informação é ao contexto de negócios (OLIVEIRA,
característica essencial para que os 2013; TAVARES, 2014).
usuários interessados (executivos, gestores A análise de dados que atendem aos
públicos e a sociedade em geral) usem e requisitos descritos anteriormente
(re)usem os dados de maneira apropriada e (lembrem-se dos 4 Vs), precisará ser
real, gerando informações críveis para eles desenvolvida segundo uma nova
mesmos. arquitetura de análise, onde dados serão
Para concluir a noção de Big Data obtidos de múltiplas fontes e em
ainda vale explorar um componente que tecnologias diversas. O ponto central desta
faz parte do terceiro aspecto relacionado análise está ligado à capacidade de
anteriormente por Davenport. A discussão                                                                                                                
sobre o trabalho de análise dos dados, 9
A noção de mining de dados passa pela extração e
análise de grandes volumes de informação em busca de
padrões e comportamentos.
100
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014
Big Data: os novos desafios para o profissional da informação  

correlacionar dados, pois, como já Para Oliveira (2013), o cientista de


observado, o ser humano possui limitações dados deve ser um técnico cético, curioso,
para fazer análises associadas a múltiplas criativo, comunicativo e deve saber
dimensões. Em essência, quando temos trabalhar em colaboração. Ademais, o
uma pequena quantidade de dados (little cientista de dados deve sempre (re)avaliar
data) não temos muita dificuldade de questões durante as primeiras fases do
correlacioná-los, pois existem poucas desenvolvimento do trabalho.
inter-relações. Mas, com uma grande Oliveira continua e apresenta
quantidade (big data), temos muitos dados questões que podem auxiliar na revisão
sendo gerados em paralelo, logo, surge a destas fases (OLIVEIRA, 2013):
dificuldade para correlacioná-los Na fase de Discovery:
(SEYMOUR, 2014).
• Eu possuo o conhecimento
Então, decorrente deste cenário,
suficiente do ambiente de dados e
chegamos não apenas a um novo conjunto
informação?
de passos para análise, mas também a um
outro perfil profissional atuando neste • Eu tenho informação suficiente
mercado. Na visão de Sathi (2013), a ara esboçar um plano analítico e
compartilhar com meus pares?
vertente de Analytics começa a se integrar
aos processos de negócio das empresas, • Eu consigo desenvolver trabalhos
tendo em vista a mudança do para organização para tipos de
comportamento nos executivos e na nova problemas? Categorizações e
ótica de produção de bens e serviços que classificações de dados? Projeto
está influenciando estas organizações. de conjuntos (clusters) de dados?
• Eu consigo esboçar e realizar
5 O profissional do Analytics entrevistas para conhecer o
contexto e domínio que será
Fruto do trabalho com Analytics trabalhado?
cunhou-se um novo perfil profissional. • Eu posso identificar as diferentes
Este perfil passou a ser denominado de fontes de dados?
Cientista de Dados (Data Scientist). A
característica principal deste profissional é Na fase de Data Preparation e
ter a capacidade de aplicar ferramentas Model Planning:
analíticas e algoritmos para gerar previsões • Eu tenho um conjunto de dados
sobre produtos e serviços (DAVENPORT; que seja suficiente e de boa
PATIL, 2012). Oliveira (2013) qualidade para iniciar a
complementa e detalha que este perfil deve construção de um modelo?
ter forte conhecimento em disciplinas • Eu tenho uma boa ideia sobre o
como a matemática e a estatística, com tipo de modelo que vou testar?
treinamento avançado em estratégias para • Eu posso refinar o modelo
tratamento de grandes conjuntos de dados, analítico?
fazendo uso de modelos matemáticos,
formulação de hipóteses e técnicas de Em suma, os projetos de Big Data
regressão. Já Brietman (2013) observa que são desenvolvidos com os objetivos de
o Cientista de Dados deve ter capacidade criar novos produtos, compreender novas
de levantar requisitos dos usuários, necessidades dos clientes e seus
buscando não apenas nas necessidades comportamentos, bem como perceber
destes usuários, mas também nos outros novos mercados. Para isto, é necessário
envolvidos no ambiente sob análise desenvolver teorias para tratar com clientes
(clientes, parceiros de negócio, e usuários, construindo hipóteses e
informações de mercado, feeds de notícias, identificando dados e informações
redes sociais, blogs, dentre outros). relevantes. Este processo deve ser repetido
101
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014
Big Data: os novos desafios para o profissional da informação  

e refinado, de acordo com os experimentos tem um importante papel nos estudos que
realizados e as respostas obtidas envolvem o tema Big Data. Versig (apud
(MARCHAND; PEPPARD, 2013). Pinheiro e Loureiro, 1995, p.4) observa
que, em função da interdisciplinaridade da
5.1 Uma proposta de atuação para o nossa área, o cientista da informação é
profissional da informação obrigado a lidar “com dados fragmentados
A Ciência da Informação é o campo de natureza empírica e teórica.” Além
de estudos apropriado para desenvolver disto, Versig continua e complementa com
novos estudos acerca de dados e a ideia de reformulação constante da
informação. Segundo Saracevic (1996, Ciência, quando observa que:
p.43) O papel da CI é “prover os meios [..] se a ciência da informação existe,
para o fornecimento de informações qualquer que seja a denominação dada
relevantes para indivíduos, grupos e a esse campo, ela não possuirá uma
teoria, mas uma estrutura proveniente
organizações envolvidas com a ciência e de um amplo conceito científico ou
tecnologia.” modelos e conceitos reformulados.
Tálamo e Smit (2007, p. 39, grifo Esses serão intertecidos a partir de seu
nosso, p.48-49) convalidam este desenvolvimento e do problema do uso
argumento quando observam que “a área do conhecimento nas condições pós-
modernas de informatização. Havendo
se relaciona tanto à organização de práticas uma interconexão entre tudo, ciência
científicas e profissionais, quanto ao da informação deve desenvolver um
acompanhamento das mudanças nas sistema de navegação conceitual
práticas culturais e nas modalidades de (VERSIG apud PINHEIRO e
difusão e aquisições de conhecimentos.” LOUREIRO, 1995, p.4).
Este acompanhamento se desenvolve
apoiado em práticas informacionais que 6 Considerações Finais
buscam: ter forte relação com as ações da O que vivemos é um momento
sociedade, por meio de serviços para singular, pois a contínua redução do custo
atender as atividades (sejam elas públicas dos equipamentos, levando este insumo ao
e/ou privadas); articulações entre campos patamar de comodities, os novos processos
de estudo e a disponibilidade de de gestão de dados e informação, além de
correlacionar problemáticas oriundas de novos softwares e ferramentas para apoiar
correntes distintas (TALAMO, SMIT; o processo de análise de dados (analytics),
2007). tem contribuído para um momento especial
Saracevic também observa que são no tratamento da informação (MINELLI,
várias as teorias e disciplinas que auxiliam CHAMBERS, DHIRAJ, 2013).
na formalização da investigação em As reflexões apresentadas aqui ainda
Ciência da Informação, dentre elas: teoria estão em fase de gestação, pois o próprio
da informação, teoria das decisões, ciência desenvolvimento do tema Big Data ainda é
cognitiva, lógica, análises em bibliometria, bastante recente. Muitas dúvidas ainda
além da quantificação das estruturas do cercam os projetos, especialmente nas
conhecimento e de seus efeitos. Assim, é fases iniciais, pois conhecer o ambiente de
possível propor que o professional da dados e informação, efetuar a organização
informação acompanhe as pesquisas em de conjunto de dados (categorizá-los?),
Big Data, especialmente nos temas iniciais realizar entrevistas e desenvolver os
desenvolvidos na fase de Discovery, Data modelos (tanto estruturais quanto
Preparation e Modeling Planning. matemáticos), ainda carecem de melhor
A Ciência da Informação nasceu e experimentação nos diferentes domínios de
foi gestada com o objetivo maior de conhecimento.
apresentar solução para problemas ligados Espera-se que este movimento de
ao uso de dados e informação e como tal, pesquisa sobre o tema Big Data na área da
102
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014
Big Data: os novos desafios para o profissional da informação  

Ciência da Informação, ilumine o caminho engajar nesta discussão, levando este tema
a ser trilhado e possibilite que outros para além da tecnologia.
pesquisadores interessados possam se

Big Data: new challenges for the information professional


Abstract
The theme Big Data has been raising interest on professionals who work with Information
Management. This article not only presents this theme and explores the fundamentals that help in
understanding Big Data’s approach, but also discusses the information explosion and data deluge,
reaching elements that make up the theme. Moreover, it covers the 4 Vs of Big Data and the phases of
Discovery, Data Preparation, Model Planning and Analytics. At it’s end, this paper points out some
aspects related to the professional who takes part in these projects.
Key-words: Big Data. Information Management. Data Analysis. Information Professional.
Referências CAVALCANTI, M. Big Data não é
tecnologia. 23 de março de 2014. O
BARBOSA, R. R.; NASSIF, M. E. Globo. Disponível em:
PRÁTICAS DE GESTÃO E DE <http://oglobo.globo.com/blogs/inteligenci
TECNOLOGIA DA INFORMAÇÃO E aempresarial/posts/2014/03/23/big-data-
SEU RELACIONAMENTO COM O nao-tecnologia-528599.asp>. Acesso em:
DESEMPENHO ORGANIZACIONAL. 30 Abril 2014.
Perspectivas em Gestão & CIARINI, A. E. M. Research on Big Data
Conhecimento, João Pessoa, v. 2, n. esp., and Opportunities. Palestra apresentada no
2012. 1o. EMC Summer School on Big Data.
BARRETO, A. Os três tempos da Ciência EMC/NCE/UFRJ. Rio de Janeiro. 2013.
da Informação. 16 maio 2014. Disponível CIUPAK, L. F.; BOSCARIOLI, C.;
em: <http://aldobarreto.wordpress.com>. CATARINO, M. E. AN ANALYSIS OF
Acesso em: 12 maio 2014. THE USE OF BUSINESS
BETTENCOURT, M. P. da L.; INTELLIGENCE TECHNOLOGIES AS
CIANCONI, R. de B. GESTÃO DO FACILITATORS OF UNIVERSITY
CONHECIMENTO: um olhar sob a MANAGEMENT. Brazilian Journal of
perspectiva da ciência da informação. Information Science, Marilia, v. 7, n.
Tendências da Pesquisa Brasileira em esp., 2013.
Ciência da Informação, João Pessoa, v. 5, DAVENPORT, T. H. Big Data at Work:
n. 1, 2013. Dispelling the Myths, Uncovering the
BRIETMAN, K. Big Data Overview. Opportunities. Harvard Business Review
Palestra apresentada no 1o. EMC Summer Press Books. 2014.
School on Big Data. EMC/NCE/UFRJ. DAVENPORT, T. H.; PATIL, D.J. "Data
Rio de Janeiro. 2013. Scientist: The Sexiest Job of the 21st
______________. Big Data Seen from the Century." Harvard Business Review 90,
Clouds. Palestra apresentada no 2o. EMC no. 10, October, p.70–76, 2012.
Summer School on Big Data. DUMBILL, E. What is Big Data? In:
EMC/NCE/UFRJ. Rio de Janeiro. 2014. O’Reilly Media Inc. Big Data Now:
Disponível em: current perspectives. O’Reilly
<http://2014.emcbigdataschool.nce.ufrj.br/i Media:California. 2012. Disponível em:
mages/presentations/_Big_Data_Summer_ <http://www.oreilly.com/data/free/files/big
School_Karin.pdf >.Acesso em: 30 Maio -data-now-2012.pdf>. Acesso em: 03 maio
2014. 2014.
103
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014
Big Data: os novos desafios para o profissional da informação  

EMC. Brazil country brief. The Digital HUWE, T. K. Big Data, Big Future.
Universe of opportunities. 2014. Computers in libraries, v. 32, n. 5, p.20-
Disponível em: 22, 2012.
<http://www.emc.com/collateral/analyst- MARCHAND, D. A.; PEPPARD, J. Why
reports/idc-digital-universe-2014- IT Fumbles Analytics. Harvard Business
brazil.pdf>. Acesso em: 12 maio 2014. Review, jan-fev. 2013.
FLORISSI, P. Big Data: Challenges and MARSHALL, Cathy. Big Data, the crowd
Opportunities. Palestra apresentada no 2o. and me. Information Services & Use, IOS
EMC Summer School on Big Data. Press, 2012, p. 213-224.
EMC/NCE/UFRJ. Rio de Janeiro. 2014.
MATTOSO, M. Scientific Workflows and
FLORISSI, P. EMC On Big Data. 2012. Big Data. Palestra apresentada no 1o. EMC
Disponível em: Summer School on Big Data.
<https://www.carecorenational.com/health EMC/NCE/UFRJ. Rio de Janeiro. 2013.
caresummit/powerpoints/PatriciaFlorissiPh
D.pdf>. Acesso em: 15 maio 2014. MINELLI, M.; CHAMBERS, M.;
DHIRAJ, A. Big Data, Big Analytics:
FOX, P.; HENDLER, J. Changing the Emerging Business Intelligence and
Equation on Scientific Data Visualization. Analytic Trends for Today's Businesses.
Science 331, 705 (2011). Disponível em: Wiley CIO Series. 2013.
<http://data2discovery.org/dev/wp- OLIVEIRA, A. Data Science and Data
content/uploads/2013/05/Fox-and- Analytics. 2013. Palestra apresentada no
Hendler_Visualization_Science-2011-Fox- 1o. EMC Summer School on Big Data.
705-8.pdf>. Acesso em: 15 maio 2014. EMC/NCE/UFRJ. Rio de Janeiro. 2013.
GOPINATH, M. A.; DAS, P. ONUBR. ONU: Dos 7 bilhões de
Classification and representation of habitantes do mundo ….. 22 de março de
Knowledge. Library Science with a Slant 2013. Disponível em
to Documentation and Information http://www.onu.org.br/onu-dos-7-bilhoes-
Studies, v. 34, n. 2, p. 85-90, 1997. de-habitantes-do-mundo-6-bi-tem-
celulares-mas-25-bi-nao-tem-banheiros/
GUEDES, V. L. da S. A BIBLIOMETRIA Acesso em 10 maio 2014.
E A GESTÃO DA INFORMAÇÃO E DO
CONHECIMENTO CIENTÍFICO E PINHEIRO, L.V.R., LOUREIRO, J.M.M.
TECNOLÓGICO: uma revisão da 1995. Traçados e limites da Ciência da
literatura. Ponto de Acesso, Salvador, v. 6, Informação. Ciência da Informação,
n. 2, 2012. Brasília, v.24, n.1, p.42-53, 1995

HEATH T.; BIZER C. Linked Data: PORTO, Fabio. Big Data in Astronomy:
Evolving the Web into a Global Data The LIneA-DEXL case
Space (1st edition). Synthesis Lectures on 2013. Palestra apresentada no 1o. EMC
the Semantic Web: Theory and Summer School on Big Data.
Technology. Morgan & Claypool EMC/NCE/UFRJ. Rio de Janeiro. 2013.
Publishers, 2011. REIS, E. S.; ANGELONI, M. T.; SERRA,
F. R. Business Intelligence como
HOFFMANN, W. A. M. Monitoramento Tecnologia de Suporte a Definição de
da informação e inteligência competitiva: Estratégias para a Melhoria da Qualidade
realidade organizacional. InCID: Revista de Ensino. Informação & Sociedade:
de Ciência da Informação e Estudos, João Pessoa, v. 20, n. 3, p. 157-
Documentação, Ribeirão Preto, v. 2, n. 2, 167, set./dez. 2010.
p. 125-144, 2011.
104
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014
Big Data: os novos desafios para o profissional da informação  

RIBEIRO, C. J. S. Diretrizes para o projeto SATHI, A. Big Data Analytics:


de portais de informação: uma proposta Disruptive Technologies for Changing
interdisciplinar baseada na Análise de the Game. Mc Press. 2013.
Domínio e Arquitetura da Informação.
SETTI, R. Enxurrada de dados emerge
2008. 298 f. Tese (Doutorado em Ciência
como novo termômetro da economia. 22
da Informação) – Convênio UFF/IBICT,
de março de 2014. O Globo. Disponível
Rio de Janeiro. em:
_______________. Projeto de serviços <http://oglobo.globo.com/sociedade/tecnol
para Gestão Documental com uso de ogia/big-data-enxurrada-de-dados-emerge-
abordagem tecnológica SOA (Arquitetura como-novo-termometro-da-economia-
Orientada a Serviços). Informação & 11959190>. Acesso em: 10 maio 2014.
Sociedade: Estudos, João Pessoa, v. 22, n. SEYMOUR, C. The State of Big Data.
2, 2012. EContentMag.com, jan-feb, p. 26-27.
RIBEIRO, C. J. S.; ALMEIDA, R. F. 2014
Dados Abertos Governamentais (Open TÁLAMO, M. de F. G. M.; SMIT, J. W.
Government Data): Instrumento para CIÊNCIA DA INFORMAÇÃO:
Exercício de Cidadania pela Sociedade. In: PENSAMENTO INFORMACIONAL E
Elmira Simeão, Jorge Henrique Cabral INTEGRAÇÃO DISCIPLINAR. Brazilian
Fernandes, Isa Maria Freire. (Org.). XII Journal of Information Science, v.1, n.1,
Enancib - Políticas de Informação para jan./jun. 2007. Disponível em:
a Sociedade - Anais. Brasília: Thesaurus, <http://www2.marilia.unesp.br/revistas/ind
2011. ex.php/bjis/article/view/30/54>. Acesso
RIBEIRO, C. J. S.; PEREIRA, D. V. El em: 15 junho 2014.
proceso de publicación e los datos TAVARES, E. BIG DATA in Business. 12
gubernamentales abiertos acerca de la clase de maio de 2014. Palestra apresentada no
de la Seguridad Social Brasileña de 2o. EMC Summer School on Big Data.
Vocabulario Controlado del Gobierno EMC/NCE/UFRJ. Rio de Janeiro. 2014.
Electrónico (VCGE). In: Simposio Disponível em:
Latinoamericano Acceso a la <http://2014.emcbigdataschool.nce.ufrj.br/i
Informacion Gubernamental, 2014, mages/presentations/Apresentacao_Elaine_
Cidade do México. Anais do Simposio Tavares.pdf>. Acesso em: 30 maio 2014.
Latinoamericano Acceso a la Informacion
Gubernamental, 2014. VELHO, A. C. M.; GOMES, S. L. R. A
tomada de decisão na Previdência social:
SANTOS, I. H. R. BigData Research and transpondo o uso das tecnologias de
Developement at Petrobras. 13 de maio de Informação na DATAPREV. Informação
2014. Palestra apresentada no 2o. EMC & sociedade (UFPB. Online), v. 19, p.
Summer School on Big Data. 55-68, 2009.
EMC/NCE/UFRJ. Rio de Janeiro, 2014.
Disponível em: WIKIPEDIA. A Enciclopédia Livre.
<http://2014.emcbigdataschool.nce.ufrj.br/i Disponível em:
mages/presentations/Ismael_BigDataTOO <http://pt.wikipedia.org/wiki/População_m
L_SummerSchool_v2.pdf>. Acesso em: 20 undial>. Acesso em: 10 maio 2014.
maio 2014. WURMAN, R. S. Ansiedade de
SARACEVIC, T. Ciência da informação: Informação 2. São Paulo: Editora de
origem, evolução e relações. Perspectivas Cultura, 2005.
em Ciência da Informação, Belo
Horizonte, v. 1, n. 1, p. 41-62, jan./jun.
1996.
105
Informação & Tecnologia (ITEC): João Pessoa/Marília, 1(1): 96-105, jan./jun., 2014

Você também pode gostar