Escolar Documentos
Profissional Documentos
Cultura Documentos
3
Fundamentos e Projetos de Big Data.................................................... 3
Como surgiu e o que é Big Data .................................................................... 3
Processo de Tomada de Decisão ................................................................... 6
Os cinco V’s do Big Data (5 V’s) .................................................................... 7
Gestão do Conhecimento em Big Data ......................................................... 10
Gestão do Conhecimento em ambiente Big Data .......................................... 12
Projetos de Big Data ................................................................................... 13
Armazenamento de Dados em projetos de Big Data ..................................... 20
Vamos falar um pouco de MapReduce e Hadoop .......................................... 22
Variedade e Veracidade .............................................................................. 23
Variedade .................................................................................................. 23
Veracidade ................................................................................................. 24
Atomicidade, Consistência, Isolamento e Durabilidade .................................. 24
Conectividade e Internet das Coisas ............................................................ 27
E o que é IoT (Internet das coisas) ............................................................. 28
Conclusão .................................................................................................. 31
Bibliografia ................................................................................................. 33
Texto da disciplina
Fundamentos e Projetos de Big Data
Nesse sentido, o conceito de Big Data surge como um novo horizonte para
entender o mundo da informação e auxiliar, de forma incisiva, a tomada de
decisões.
Big Data tem, no entanto, seus riscos tanto éticos quanto políticos.
Recentemente, descobriu-se que o Brasil tinha grande fluxos informacionais
monitorados pelos Estados Unidos.
Os dados oriundos de Big Data são, ainda assim, modelos matemáticos que
visam simplificar uma situação complexa e dar organização ao que
aparentemente está disperso.
Eles são úteis para a compreensão contextual e aprofundada, mas têm seus
limites. Os modelos matemáticos são baseados em estudo e cruzamento de
dados referentes a gostos, opções políticas, etc.
Ademais, a utilização do Big Data também deve ser realizada pensando nas
questões éticas envolvidas, pois o fato de um determinado dado estar
disponível para uso não faz com que seu uso seja ético.
As empresas deverão, então, criar estratégias para definir como lidar com
grande volume de dados e analisar as informações úteis, visto que o
desempenho das organizações no mercado será definido a partir da forma com
que as mesmas irão trabalhar com esse volume e essa variedade de
informações e com a velocidade que elas surgem e se disseminam.
Estes dados possuem um grande Valor que normalmente são pouco ou nada
explorados.
Grande parte das empresas que conheço ainda toma decisões baseadas na
extração dos dados operacionais.
Dados estes que são transferidos para relatórios e planilhas e que levam horas
e até dias para serem gerados, tornando a informação pouco confiável e,
muitas vezes, chegando tarde para a tomada de decisão, não gerando nenhum
painel de informações com os principais indicadores da empresa.
- Definir o problema;
- Identificar os critérios;
- Ponderar os critérios;
- Gerar alternativas;
- Classificar cada alternativa segundo cada critério;
- Identificar a solução ideal.
Nas organizações o conhecimento é algo que pode ser aplicado em algum tipo
de sistema produtivo.
Portanto ele só existe quando gera prescrições que possam transformar uma
situação existente em uma situação desejada.
Essas prescrições visam dar apoio a outro processo muito relevante nas
organizações: a tomada e decisão.
Como a maioria dos projetos de Big Data falha por falta de clareza e devido à
incapacidade de demonstrar a funcionalidade da iniciativa, você mesmo deve se
responsabilizar por isso para trazer foco e comprovação ao seu projeto.
Seguem três dicas úteis para garantir que o seu projeto já comece dando certo
e continue em operação.
Valor demonstrável
Patrocínio
As soluções de Big Data também têm como objetivo tratar dados brutos,
heterogêneos com e sem estrutura e sem padrão de formatação.
Pode-se dizer que o projeto teve início em meados de 2003, quando o Google
criou um modelo de programação que distribui o processamento a ser realizado
entre vários computadores para ajudar o seu mecanismo de busca a ficar mais
rápido e livre da necessidade de servidores poderosos (e caros).
O Hadoop é tido como uma solução adequada para Big Data por vários
motivos:
Variedade e Veracidade
Estes dois V’s que já citamos anteriormente são importantíssimos para o
projeto de Big Data, pois temos um volume enorme de dados, de variadas
fontes, porém temos que ter certeza se quais dados realmente necessitamos e
se estes são verídicos, pois trabalhar com dados incorretos para tomadas de
decisões, deixa a organização totalmente vulnerável e sem credibilidade.
Variedade
Será preciso integrar várias fontes se quiser incluir novos tipos e estruturas de
dados (sociais, sensores, vídeo) às fontes com as quais você já está
acostumado (relacionais, mainframes legados).
Quanto mais dados você analisar, mais importante será manter um alto nível de
qualidade dos dados.
Para que os dados sejam adequados à finalidade, você precisa conhecer essa
finalidade.
Bancos deste tipo são mais flexíveis, sendo inclusive compatíveis com um grupo
de premissas que “compete” com as propriedades ACID: aBASE (Basically
Available, Soft state, Eventually consistency – Basicamente disponível, Estado
Leve, Eventualmente consistente).
A escolha do banco NoSQL adequado para uma determinada aplicação não é
trivial, alguns fatores importantes devem ser levados em consideração nesta
escolha:
1. Escalabilidade;
2. Desempenho;
3. Disponibilidade;
4. Facilidade de uso.
Afinal, a ampla conectividade não apenas mudará a forma como vivemos, mas
gerará uma quantidade imensa de informações que se analisadas de forma
precisa e inteligente poderão gerar grandes potenciais competitivos.
Por outro lado, esse conjunto de fatores irá demandar, cada vez mais, dos
provedores de serviços em nuvem.
No caso da IoT, a IDC estima que mais de 90% destes dados serão alojados
em plataformas deste tipo nos próximos cinco anos. Isso porque a nuvem reduz
a complexidade associada à fusão de dados provenientes de fontes diversas e
dispersas.
O volume de dados gerados pela IoT será tamanho que obrigará, em curto
prazo, as empresas a repensar até suas estratégias de conectividade.
Relógios, óculos, roupas tecnológicas estão cada vez mais nos trazendo
informações para nossa rede de conhecimento.
Big Data: Com a maior absorção das informações que coletamos durante
nosso dia a dia, através de nosso comportamento digital, vamos gerar um
volume cada vez maior de informações a nosso respeito.
Cloud Computing: Este processo parece sem volta. A cada dia que passa,
estamos observando o crescimento desta área que já suporta o nascimento e
os primeiros passos do Big Data.
A verdadeira Globalização: Que o mundo está a cada dia mais integrado, isso é
fato. Mas a tendência é que tenhamos apenas uma única língua, e que as
fronteiras entre os países, sejam meramente físicas, mas inexistentes
comercialmente.
Com todos estes conceitos acima mencionados, poderemos “estar” em qualquer
lugar em qualquer “tempo”. Claro que vamos precisar que a holografia tenha
um bom salto tecnológico em um futuro próximo.
Conclusão
Com base no estudo realizado, torna-se evidente que não há como fugir do
fenômeno Big Data, pois já é uma realidade muito mais próxima de nós do que
possamos imaginar.
Atualmente a maioria das pessoas possui algum contato com algo que pode
contribuir para gerar essa grande quantidade de dados, de forma direta ou
indireta.
Podemos concluir que o Big Data se revela um divisor de águas e seu impacto
na sociedade poderá ser comparado com o advento da internet, que hoje se
tornou algo indispensável em nossas vidas.
Como já foi dito, o surgimento do Big Data é o que temos hoje para trabalhar
com essa quantidade enorme de dados que vem surgindo no cenário atual.
Acreditamos que lidar com esses dados é uma missão que todo ser humano
deverá abraçar com cuidado porque eles são o código que nos mostrará como
dar equilíbrio ao nosso planeta.
Como diz Thomas Davenport, “Big Data pode ser descrito como um rio de
informações em correnteza que nunca para”.
BIBLIOGRAFIA
HURWITZ, Judith; NUGENT, Alan; HALPER, Fern; KAUFMAN, Marcia. Big Data
para Leigos. Rio de Janeiro: Ed. Starlin, 2016.
INMOMENT – 2014.
LIMA, Gustavo. Cezar Taurion ensina o que é Big Data. 9 jan. 2013.
Disponível em: <blog.corujadeti.com.br/cezar-taurion-ensina-o-que-e-big-
data>.
O’REILLY. Big Data Now. 1. ed. Sebastopol, CA: O’Reilly Media Inc. 2012.
PETRY, A. Vida digital: o berço do Big Data. Revista Veja, São Paulo, maio
2013, p. 71-81.
SCHÖNBERGER, Viktor M.; CUKIER, Kenneth. Big Data: a revolution that will
transform how we live, work and think. Kindle Edition. New York: Houghton
Mifflin Harcourt Publishing Company, 2013.
Taurion – 2014 -
www.revistas.usp.br/signosdoconsumo/article/download/.../100022