Escolar Documentos
Profissional Documentos
Cultura Documentos
Faculdade de Minas
Sumário
REFERENCIAS ............................................................................................ 30
2
Faculdade de Minas
FACUMINAS
3
Faculdade de Minas
Todos esses aparatos rastreiam cada passo do que é feito na Web e cada
um desses passos é um potencial gerador de dados. Como passa-se cada vez mais
tempo online, gera-se progressivamente mais dados, de forma mais rápida.
Qualquer tarefa realizada quando se está conectado, desde enviar um e-mail,
escrever uma mensagem em uma rede social ou até mesmo deixar o GPS do
celular ligado enquanto se movimenta, deixa rastros imperceptíveis que
transformam-se em dados.
4
Faculdade de Minas
Neste mundo globalizado e constantemente conectado, surge então uma nova fonte
de poder que não pode mais ser ignorada. Os especialistas a chamam de Big Data
5
Faculdade de Minas
BIG DATA
Dado é definido por Setzer (2001, não paginado) como “[...] uma seqüência
de símbolos quantificados ou quantificáveis [...] Com essa definição, um dado é
necessariamente uma entidade matemática e, desta forma, é puramente sintático”.
Já Angeloni (2003, p.18) afirma que “Os dados são elementos brutos, sem
significado, desvinculados da realidade.” Davenport (1998, p.18) define dado como
uma “Simples observação sobre o estado do mundo”. Sendo ele facilmente
estruturado e obtido por máquinas, além de ser quantificado com frequência. O
dado é facilmente transferível. Conclui-se à partir das elucidações de Russo (2010,
p.15), que “[...] dados são sinais que não foram processados, correlacionados,
integrados, avaliados ou interpretados de qualquer forma, e, por sua vez,
representam a matéria prima a ser utilizada na produção de informações”.
6
Faculdade de Minas
Analisando as definições acima, percebe-se que o dado, por si só, não possui
significado claro e precisa portanto, ser capturado e analisado, para que se
transforme em informação. Uma característica importante a ser analisada sobre os
dados é que antes do Big Data, os dados coletados pelas empresas provinham de
fontes internas e eram, majoritariamente, dados estruturados, ou seja, “[...] dados
7
Faculdade de Minas
Big Data pode ser definida, de maneira mais simplista, como um conjunto de
técnicas capazes de se analisar grandes quantidades de dados para a geração de
resultados importantes que, em volumes menores, dificilmente seria possível. Em
tese, podemos definir o conceito de Big Data como um conjunto de dados
extremamente amplos que, por isto, necessitam de ferramentas especiais para
comportar o grande volume de dados que são encontrados, extraídos, organizados,
transformados em informações que possibilitam uma análise ampla e em tempo
hábil.
Para os autores, big data não é apenas uma tecnologia, é também sobre
como as tecnologias podem impulsionar uma organização cada vez mais as
organizações estão gerando enormes quantidades de dados que são provenientes
de fontes distintas e armazenados de diferentes maneiras, o que demanda um
8
Faculdade de Minas
Dados estruturados
As soluções de Big Data são feitas para lidar com um grande volume de
dados não-estruturados. Isso significa que eles não têm relação entre si e nem uma
estrutura definida. São, por exemplo, posts no Facebook, vídeos, fotos, tweets,
geolocalização, comportamento.
9
Faculdade de Minas
10
Faculdade de Minas
As empresas usam o Big Data para realizar os desejos dos clientes antes que
eles peçam. Um exemplo disso são as sugestões de sites de compras, como a
Amazon, e as recomendações de serviços como Netflix e Spotify.
Big Data também pode ser usado para satisfazer os clientes de outras
maneiras como, por exemplo, dando mais conforto a ele em situações incômodas,
mas que não são desagradáveis o suficiente para chegar a um canal de
reclamações da empresa. A companhia aérea Delta identificou que uma das
maiores preocupações de seus clientes durante as viagens era com a bagagem.
Com base nessa informação, criaram um recurso no aplicativo da companhia que
ajuda os viajantes a rastrear suas malas, o Track My Bag.
A análise de Big Data também pode ser usada para dar suporte a ações do
governo. Durante a epidemia de gripe suína, uma equipe da Telefônica usou dados
da rede de celulares para entender como as pessoas estavam se locomovendo
durante o surto da doença. Suas descobertas ajudaram a validar ações do governo
para combater a crise.
11
Faculdade de Minas
12
Faculdade de Minas
Velocity – Velocidade:
Hoje para alguns negócios, 1 minuto pode ser muito tempo, detecção de
fraudes, liberações de pagamentos, análises de dados médicos ou qualquer outra
informação sensível a tempo. A maior parte dos projetos de DW/BI (Data
Warehouse e Business Intelligence) ainda tem latência em D-1, ou seja, carregamos
o dia anterior. Ainda acreditamos que essa solução se aplique a muitos negócios,
porém, para algumas análises, quanto mais próximo do tempo real, maior pode ser
o incremento de negócio.
Variety – Variedade:
Big Data também poderia ser considerado como Any Data (qualquer dado),
hoje temos capacidade de capturar e analisar dados estruturados e não
estruturados, texto, sensores, navegação Web, áudio, vídeo, arquivos de logs,
catracas, centrais de ar condicionado, entre outros. Uma nova série de ferramentas
está se tornando parte dos projetos, são as ferramentas de machine data, dados de
máquina, quase qualquer aparelho eletrônico hoje em dia tem uma estrutura de
dados ou programação, o ponto é que nem todos podem ser acessados (ainda..).
Ela também diz respeito a diversidade dos dados e informações. Kaisleret al.
(2013), afirma que a partir de uma perspectiva analítica, fazer a gestão da variedade
de dados é provavelmente o maior obstáculo para utilização efetiva de grandes
volumes de dados. Formatos de dados incompatíveis, estruturas de dados não
13
Faculdade de Minas
Valor:
Variabilidade
Refere-se aos dados que estão em constante variação, como por exemplo,
dados meteorológicos. Gandomi e Haider (2015), afirmam que a variabilidade
possui relação com a variação nos fluxos de dados.
14
Faculdade de Minas
A Figura 3, a seguir, apresenta uma visão geral das tecnologias do Big Data,
segundo Davenport (2014, p.112).
15
Faculdade de Minas
16
Faculdade de Minas
Para obter sucesso tirando proveito do Big Data, faz-se essencial para as
empresas começarem a investir em tecnologias que o comportem, tendo sempre em
vista que um dos atributos essenciais quando se fala deste novo conceito é a
resiliência. O volume de dados, sua natureza, a velocidade com que são criados
novos dados, está em constante mudança e somente as organizações que
17
Faculdade de Minas
Por isso, mais que ter acesso a uma grande quantidade de dados, é
necessário tratá-los de maneira correta. O ideal é fazer uma análise aprofundada
para encontrar respostas certas, que visem a quatro principais objetivos:
Redução de custos;
Economia de tempo;
Desenvolvimento de produtos e otimização de ofertas;
Otimização das tomadas de decisão.
Com essa explicação, fica claro que o propósito do Big Data é fazer a análise
de dados — e é aí que está a inteligência do processo. Sem uma avaliação
meticulosa e precisa, é impossível saber qual é o melhor caminho. Mas o que
efetivamente significa a análise de dados? A ideia é encontrar padrões
comportamentais para monitorá-los e, sempre que houver alguma alteração, tomar
a decisão certa. É o caso de sua empresa vender o produto X, mas identificar que o
18
Faculdade de Minas
Vários são os exemplos que demonstram o uso dos dados no seu negócio.
Primeiramente, você precisa entender que há três tipos:
19
Faculdade de Minas
Veja, a seguir, outros exemplos de uso do Big Data em diferentes setores, com
cases de sucesso.
Marketing
Em uma confecção, você pode usar o Big Data para descobrir se há uma
preferência nacional ou regional por suéteres de lã ou blusas de algodão. Da
mesma forma, a visualização desses dados podem indicar oportunidades.
Controle de qualidade
As variáveis abrangidas nesse critério são muitas, como defeitos por unidade,
rendimentos de primeira passagem, taxas de preenchimento e outras. Elas podem
até incluir os fornecedores, a capacitação dos colaboradores e as condições
ambientais no momento da produção.
Todos esses itens podem ser analisados com o Big Data. Os dados de
produção, inclusive, são passíveis de integração a outros, o que facilita a
identificação e a eliminação de gargalos e fatores de lentidão.
Financeiro
20
Faculdade de Minas
GESTÃO DA INFORMAÇÃO
21
Faculdade de Minas
22
Faculdade de Minas
GESTÃO DO CONHECIMENTO
23
Faculdade de Minas
24
Faculdade de Minas
Pelo ponto de vista, Wilson (2003), está correto na sua afirmação, pois o
conhecimento é intangível. Mas quando aplicamos gestão do conhecimento
estaremos direcionando-a de acordo com um objetivo. E quando direcionamos as
informações para o ponto certo (equipe ou as pessoas certas), pode resultar em
conhecimento.
GESTÃO DE DADOS
25
Faculdade de Minas
26
Faculdade de Minas
Sem uma gestão efetiva dos dados, a evolução desta cadeia não é atingida,
portanto, para atingir os objetivos é fundamental a disciplina atuar nos estágios
iniciais da cadeia. Por esta razão o nome da disciplina é Gestão de Dados e não
Gestão das Informações ou Gestão do Conhecimento. Porém, valem ressaltar que,
dependendo do nível da maturidade da empresa, as ações de gestão para a
evolução da cadeia podem se estabelecer em outros níveis.
GERENCIAMENTO DE DADOS
A análise de dados tem sido cada vez mais importante para o sucesso, sendo
você um pequeno empresário ou uma grande indústria. Para que a sua empresa se
destaque e deixe a concorrência para trás, é necessário reunir e analisar
informações sobre clientes e o mercado como um todo. Sendo assim, em diversos
27
Faculdade de Minas
Quando todas as informações das quais você precisa estão bem organizadas
e devidamente armazenadas, de forma integrada e ordenada, arquivos como
projetos, balanços financeiros, prospecções de vendas e outros documentos
importantes são encontrados com maior facilidade no sistema toda vez que você
precisar analisá-los.
28
Faculdade de Minas
O uso da cloud computing tem se tornado uma tendência cada vez mais
presente no mercado. A praticidade e o dinamismo que essa tecnologia oferece vem
29
Faculdade de Minas
REFERENCIAS
30
Faculdade de Minas
CAI, Li; ZHU, Yangyong. The Challenges of Data Quality and Data Quality
Assessment in the Big Data Era. Data Science Journal, v. 14, n. 0, 2015, p. 2. Dis
CIANCARINI, Paolo; POGGI, Francesco; RUSSO, Daniel. Big Data Quality: a
Roadmap for Open Data. 2ND IEEE INTERNATIONAL CONFERENCE ON BIG
DATA COMPUTING SERVICE AND APPLICATIONS, 2., 2016, Oxford. Anais
eletrônicos… Praga: 2016.
ENDLER, Gregor; BAUMGAERTEL, Philipp; LENZ, Richard. Pay-as-you-go data
quality improvement for medical centers. In: CONFERENCE ON EHEALTH -
HEALTH INFORMATICS MEETS EHEALTH, 2013, Vienna. Anais eletrônicos…
Vienna: 2013.
RDBCI: Revista Digital Biblioteconomia e Ciência da Informação RDBCI : Digital
Journal of Library and Information Science DOI 10.20396/rdbci.v16i1.8650412 ©
RDBCI: Rev. Digit. Bibliotecon. Cienc. Inf. Campinas, SP v.16 n.1 p. 194-210
jan./abr. 2018 [207] p.13-18. Disponível em: . Acessoem: 7 jul. 2017.
ERL, Thomas; KHATTAK, Wajid; BUHLER, Paul. Big Data Fundamentals:
Concepts, Drivers & Techniques. Boston: Prentice Hall, 2016.
FREITAS, Patrícia Alves de et al. Information Governance, Big Data and Data
Quality. In: IEEE 16TH INTERNATIONAL CONFERENCE ON COMPUTATIONAL
SCIENCE AND ENGINEERING (CSE), 16., 2013, Sydney. Anais eletrônicos…
Sydney: 2013. p.1142- 1143.
FURLAN, Patricia Kuzmenko; LAURINDO, Fernando José Barbin. Agrupamentos
epistemológicos de artigos publicados sobre big data analytics.
Transinformação, v. 29, n. 1, 2017, p. 91-100.
GANAPATHI, Archana; CHEN, Yanpei. Data Quality: Experiences and Lessons
from Operationalizing Big Data. 4TH IEEE INTERNATIONAL CONFERENCE ON
BIG DATA (BIG DATA), 4., 2016, Washington. Anais eletrônicos… Washington:
2016.
GANDOMI, Amir; HAIDER, Murtaza. Beyond the hype: Big data concepts,
methods, and analytics. International Journal of Information Management, v. 35, n.
2, 2015, p. 137– 144.
HARYADI, AdiskaFardaniet al. Antecedents of Big Data Quality An Empirical
Examination in Financial Service Organizations. 4TH IEEE INTERNATIONAL
CONFERENCE ON BIG DATA (BIG DATA), 4., 2016, Washington. Anais
eletrônicos… Washington: 2016.
HAZEN, Benjamin T. et al. Data quality for data science, predictive analytics,
and big data in supply chain management: An introduction to the problem and
suggestions for research and applications. International Journal of Production
Economics, v. 154, 2014, p. 72–80.
JUDDOO, Suraj. Overview of data quality challenges in the context of Big Data.
In: INTERNATIONAL CONFERENCE ON COMPUTING, COMMUNICATION AND
SECURITY (ICCCS), 2015, Pamplemousses. Anais eletrônicos… Pamplemousses :
2015..
31
Faculdade de Minas
KAISLER, Stephen et al. Big Data: Issues and Challenges Moving Forward. In:
XLVI HAWAII INTERNATIONAL CONFERENCE ON SYSTEM SCIENCES, 46.,
Maui, 2013.
KELLING, Steve et al. Taking a `Big Data’ approach to data quality in a citizen
science project. AMBIO, v. 44, n. 4, 2015, p. S601–S611.
KWON, Ohbyung; LEE, Namyeon; SHIN, Bongsik. Data quality management, data
usage experience and acquisition intention of big data analytics. International
Journal of Information Management, v. 34, n. 3, 2014, p. 387–394.
LANEY, Doug. Application Delivery Strategies. META Group, 2001. Disponível
em: . Acessoem: 7 jul. 2017.
MCAFEE, Andrew; BRYNJOLFSSON, Erik. Big Data. The management revolution.
Harvard BuinessReview, v. 90, n. 10, 2012 p. 61–68.
MERINO, Jorge et al.A Data Quality in Use model for Big Data. Future Generation
Computer Systems, v. 63, 2016, p.123-130.
PAIM, Isis; NEHMY, Rosa Maria Quadros, GUIMARÃES, César Geraldo.
Problematização do conceito "Qualidade" da Informação. Perspectivas em
Ciência da Informação, v. 1, n. 1, 1996, p. 111–119.
PORTAL DE PERIÓDICOS DA CAPES/MEC. 07 jun. 2017.
RAO, Dhana; GUDIVADA, Venkat N.; RAGHAVAN, Vijay V. Data Quality Issues in
Big Data. In: IEEE INTERNATIONAL CONFERENCE ON BIG DATA, 2015, Santa
Clara. Anais eletrônicos... Santa Clara: 2015.
RIBEIRO, Claudio José Silva. Big Data: os novos desafios para o profissional da
informação. Informação & Tecnologia, v. 1, n. 1, 2014, p. 96–105.
RDBCI: Revista Digital Biblioteconomia e Ciência da Informação RDBCI : Digital
Journal of Library and Information Science DOI 10.20396/rdbci.v16i1.8650412 ©
RDBCI: Rev. Digit. Bibliotecon. Cienc. Inf. Campinas, SP v.16 n.1 p. 194-210
jan./abr. 2018 [209]
SADIQ, Shazia; PAPOTTI, Paolo. Big Data Quality - Whose problem is it? 32ND
IEEE INTERNATIONAL CONFERENCE ON DATA ENGINEERING (ICDE), 32.,
2016, Helsinki. Anais eletrônicos… Helsinki: 2016.
SAHA, Barna; SRIVASTAVA, Divesh. Data Quality: The other Face of Big Data. In:
IEEE 30TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING (ICDE),
30., 2014, Chicago. Anais eletrônicos…Chicago: 2014.
SOMASUNDARAM, G.; SHRIVASTAVA, Alok. Armazenamento e Gerenciamento
de Informações: Como armazenar, gerenciar e proteger informações digitais. Porto
Alegre: Bookman. 2011. 472p.
TALEB, Ikbalet al. Big Data Quality: A Quality Dimensions Evaluation. 13TH
IEEE INT CONF ON UBIQUITOUS INTELLIGENCE AND COMP, 13., 2016,
Toulouse. Anais eletrônicos… Toulouse: 2016. Disponível em: . Acesso em: 7 jul.
2017.
32
Faculdade de Minas
33