Escolar Documentos
Profissional Documentos
Cultura Documentos
Sumário
1 Introdução 3
2 O que é Big Data? 4
2.1 Big Data no cotidiano do mercado 7
3 Tecnologias parceiras do Big Data 8
3.1 Cloud computing 8
3.1.1 Cloud computing no cotidiano do mercado9
3.2 Inteligência artificial 10
3.2.2 Inteligência artificial
no cotidiano do mercado 10
3.3 Machine learning 11
3.4 Internet das coisas (IOT) 11
3.4.1 Internet das coisas
no cotidiano do mercado 12
4 Big Data: um histórico 12
4.1 Bug do milênio 14
5 Momento atual dos dados 15
5.1 Dados estruturados 15
5.2 Dados não estruturados 17
5.3 Análise de dados e análise preditiva 17
5.4 Data science e Data analitycs 18
5.5 Coletando dados 19
6 Quarta revolução industrial,
Big Data e o impacto no mercado 20
6.1 Big Data no varejo 21
6.2 Big data na indústria de transformação22
Resumo do curso 23
Referências 24
Módulo 1
Big Data
1 Introdução
Na era da informação, as decisões orientadas pela geração de dados com sua inevitável co-
leta e posterior análise não constituem mais uma escolha para o mundo corporativo e os go-
vernos, mais que isso, é um paradigma de sobrevivência. O efeito globalizante que acirra a
competitividade ao redor do planeta dispõe de um nascedouro gigantesco de dados que o
tempo todo surgem no panorama das mídias digitais e das diversas transações digitalizadas
presentes nos corredores da internet. A capacidade de extração da informação e produção
de conhecimento a partir desses dados criará melhores oportunidades de produção, venda e
otimização de gastos, atingirá um público cada vez maior e conhecerá a natureza de consu-
mo deste mesmo público, resultando em parcerias mais eficientes e na conformidade exigida
pelas agências de regulação. O futuro que se descortina ainda carrega muitas questões, mas
nos traz uma certeza: a de que a produção e análise de dados ocuparão (na realidade, já ocu-
pam) papel central. E mais do que nunca, esses dados que são produzidos em quantidades
estonteantes compõem hoje o chamado Big Data.
Em nosso estudo, trataremos também das tecnologias que dão auxílio ao Big Data, por isso
também trataremos da análise de dados, internet das coisas, computação em nuvem, inte-
ligência artificial, machine learning entre outras, bem como abordaremos fatores gerenciais
como a business inteligence e a forte influência do Big Data nos processos estratégicos e nas
tomadas de decisões gerenciais
2 O que é Big Data?
Antes de desenvolvermos melhor o amplo conceito de Big Data, vamos a uma abordagem mais
direta: Big Data está ligado a técnicas de armazenamento de dados, muitos dados, vindos de
todos os lugares e, em sua maioria, de forma não estruturada (AMARAL, 2016).
Importante
O que hoje é chamado de Big Data está, em grande parte, conectado ao mer-
cado, principalmente a atividades de gestão corporativa e gestão da infor-
mação (GOLDMAN, 2012). Além da propriedade em si de reunir dados estru-
turados, não estruturados e semiestruturados, também está intimamente
ligado a diversas e modernas técnicas e tecnologias de tratamento, compila-
ção e organização de dados (DAVENPORT, 2014).
O uso da enorme quantidade de informação presente hoje nos corredores virtuais não chega
a ser uma novidade nos meios da ciência da informação e administração, sistemas informa-
tizados já estão coletando dados desde a década de 50 (CHEN; CHIANG; STOREY, 2012). No
entanto, na contemporaneidade, o crescente número de fontes de informação se dá em alta
velocidade, redes sociais, sensores em produtos diversos, registros de tráfego na internet,
câmeras de vigilância, uso de aplicativos, entre outros.
A quantidade de dados nesse cenário cresce, assim como as alternativas para sua utilização.
Tal realidade constitui um grande desafio no uso desses dados, bem como na compreensão
de como os mesmos podem melhorar o ambiente de negócios. Mais que desenvolver tecnolo-
gia, é preciso uma nova mentalidade para o trânsito na estrada da dadosfera (AMARAL, 2016).
5
FIGURA 1 – BIG DATA
Os dados gerados atualmente são tão numerosos, que tecnologias mais tradicionais já não
dão conta de lidar com eles, por isso, uma abordagem referente ao Big Data não pode se dar
isoladamente, ela necessariamente trará em seu bojo outros implementos técnicos e tecno-
lógicos. Dentre os mais populares, trabalhando junto ao Big Data também se apresentam a
IA (Inteligência Artificial), o aprendizado de máquina do machine learning e a IOT – Internet of
Things (Internet das Coisas) (GOLDMAN et al., 2012). Tal força e quantidade de dados no cená-
rio moderno dá origem a grandes registros informacionais que, mais do que nunca, capaci-
tam processos de análises preditivas, ou seja, abre grandes possibilidades de planejamento
e ações preventivas a partir do suporte fornecido pelos dados. De certa forma, em termos
corporativos, seria com prever o futuro.
Atenção!
6
Vamos observar o quadro abaixo:
O Big Data não trata unicamente de grandes volumes de dados, mas também da heterogenei-
dade desses dados e toda essa diversidade é aplicada em processos de legitimação. Para tal
tarefa, foram desenvolvidas categorias classificadas nos cinco Vs do Big Data: volume, varie-
dade, velocidade, veracidade e valor. Vejamos o quadro abaixo:
Os cinco Vs
Veracidade O grande volume de dados coletados necessita de validação, por isso existe
um cuidado especial com as fontes geradoras desses dados, e uma vez verifi-
cada a relevância, são possíveis ações direcionadas para públicos específicos.
Valor A utilidade dos dados após a validação deve ser criteriosa. Os insights criados
devem ser significativos no panorama organizacional.
7
Taurion (2013) aponta acertadamente que um grande volume de dados por si só não possui a
significância e relevância necessárias para a geração de processos e negócios. Para que tal
seja suficiente, existem quatro pilares que devem ser percebidos, a saber:
Agora que compreendemos um pouco melhor sobre o que trata o Big Data, pensemos na quan-
tidade avassaladora de informações geradas e compartilhadas ao longo de um dia em nosso
planeta. O bom uso de tais informações rapidamente disponibilizadas nessas plataformas é
vital em estratégias corporativas, determinante para a elaboração de projetos voltados ao pú-
blico, para a proposição de novos produtos e serviços.
8
3 Tecnologias parceiras do
Big Data
Não é possível falar de Big Data sem abordar as diversas técnicas e tecnologias que lhe dão
suporte.
Atenção!
Por isso, é interessante e necessário que tomemos conhecimento de outras premissas tecno-
lógicas que trabalham junto ao Big Data (AMARAL, 2016).
9
Nuvem A infraestrutura é dividida entre empresas que têm objetivos
comunitária e interesses em comum, dividindo dados. A gestão pode ser
interna ou terceirizada.
Nuvem híbrida São nuvens de naturezas distintas, via níveis de acesso, cer-
tas informações não são compartilhadas, porém outras per-
manecem disponíveis a todos.
10
3.2 Inteligência artificial
A inteligência artificial trata de uma junção de várias tecnologias, redes neurais, algoritmos,
aprendizado de máquina (machine learning), entre outros. O caminho é a simulação das capa-
cidades humanas ligadas à inteligência, como o ato de raciocinar, a percepção do ambiente ao
redor e habilidades de análise de dados.
Sendo assim, o conceito de inteligência artificial é a capacidade da tecnologia de realizar ati-
vidades de uma forma que seja considerada inteligente e até intuitiva. As inteligências artifi-
ciais (IAs) aprendem por si, sistemas analisam dados (daí sua capacidade de atuar como su-
porte ao Big Data) possibilitando a ampliação de conhecimentos.
11
3.3 Machine learning
Pode-se considerar o machine learning como um segmento da IA (Inteligência Artificial), e
que dá suporte a ela. Faz uso de tecnologias que aprendem a partir de interações e opera-
ções calcadas na tentativa e erro (como em certa medida, humanos aprendem), a partir de
premissas básicas.
Atenção!
12
FIGURA 4 – INTERNET DAS COISAS
13
Quadro 4 – Períodos de sistemas de dados e características
14
4.1 Bug do milênio
Um fato marcante e curioso na história do armazenamento e registro de dados foi o chamado
de Bug do milênio, que se deu pela forma como foram estipuladas as configurações de datas
em sistemas operacionais. Na tentativa de se poupar espaço de memória, o formato utilizado
foi o dia/mês/ano e nele foram utilizados dois dígitos para cada sessão. Assim, se a data in-
dicada era 12/05/96 o sistema automaticamente compreenderia que a referência era ao ano
de 1996. Os computadores até então estavam programados para interpretar o ‘00’ no final de
uma data como 1900. Sendo assim, os sistemas, ao contrário de continuarem linearmente em
uma linha temporal progressiva, acabariam por recuar no tempo cem anos, criando um efeito
cascata que poderia levar a falhas sucessivas nos equipamentos em rede (GAMEHALL, 2017).
Nos anos 1960, o uso de computadores passou a ser muito mais difundido dentro da esfera
governamental e das corporações. Naquele momento era um equipamento caro e de aces-
so limitado, desenvolvedores buscavam maneiras de diminuir o consumo de memória desses
equipamentos. Uma forma encontrada foi a de salvar apenas dois dígitos fazendo com que o
número “19” estivesse presente automaticamente nos registros de data. O que resultou no se-
guinte: 1º de junho de 1967 seria automaticamente reduzido para 010667 ao invés de 01041964,
essa medida mínima representou na época uma expressiva economia.
Por décadas tal estratégia se mostrou eficiente, no entanto, com a virada do século que se
aproximava, especialistas apontaram a possibilidade dos dígitos 1 e 9 não serem substituídos
pelos dígitos 2 e 0, ou seja, os sistemas retornariam ao ano de 1900 automaticamente. Haveria
enorme confusão na arquitetura dos sistemas. Alguns afirmavam que as consequências po-
deriam ser gigantescas e haver colapsos no sistema bancário, usinas nucleares, sistemas de
aviação e na automatização de empresas. Mas o único evento relevante referente ao bug do
milênio aconteceu em uma usina nuclear japonesa, houve uma falha no sistema de segurança,
porém um acidente maior foi evitado pelos sistemas secundários.
Atenção!
15
5 Momento atual dos dados
Para começar, abordaremos a diferença entre dados, informação e conhecimento. Existe
uma ordem ou hierarquia entre esses três elementos:
Em um primeiro momento, podemos afirmar que dados e informações estão em toda parte:
textos escritos, registros digitais, eletrônicos, na linguagem falada etc. (LAUDON; LAUDON,
2010). Tomemos aqui um exemplo: vamos utilizar os números 28 29 e 30. Isoladamente, esta-
mos falando de dados que por si só têm muito pouco a nos dizer, no entanto, se associarmos
esses dados a outros, como por exemplo, todos os dias 28, 29 e 30 de cada mês, e buscarmos
a presença de chuva, temos então informação, e ainda mais, se aumentarmos esse leque e
colocarmos essas mesmas datas todos os meses durante 10 anos. Certamente, poderemos
daí estabelecer um padrão de comportamento da chuva, teremos então conhecimento. As-
sim, será possível descobrir em quais períodos do ano existe maior possibilidade de presença
da chuva nesses dias, orientando ações preventivas para essas ocasiões.
16
Quadro 5 – tipos de dados estruturados
Dados de entrada: qualquer tipo de dado que Dados de sensores: etiquetas de radiofre-
uma pessoa possa colocar em um computa- quência, medidores, dispositivos médicos,
dor, nome, idade, renda, respostas a pesqui- dados de GPS.
sas, etc.
Dados de fluxo de clique: registrados toda Dados de web log: servidores, aplicativos,
vez que o usuário clica em um link em um interações em rede e outros dispositivos que
website. capturam dados e atividades de usuários.
Dados relacionados a jogos: cada movimento Dados de ponto de venda: através de có-
realizado em um jogo virtual pode ser regis- digo de barras, nesse caso todos os da-
trado. Isso é bastante útil para que se enten- dos associados ao produto são gerados e
da como usuários se movem através de uma armazenados.
tela em uma situação de jogo.
17
5.2 Dados não estruturados
Os dados não estruturados não seguem um formato específico. Como já citamos em nosso
estudo, são cerca de 80% dos dados na internet. Esse tipo de dado está por toda parte e, as-
sim como os dados estruturados, também são gerados por máquinas ou por humanos. Veja-
mos no quadro a seguir alguns exemplos:
Textos institucionais: textos contidos em do- Imagens via satélite: são informações de
cumentos, registros, resultados de pesquisa tempo ou vigilância através de satélites. O
ou e-mails enviados. Todo tipo de informação Google Earth é um exemplo.
de caráter empresarial e textual.
Dados de mídias sociais: são diversos e ge- Dados científicos: registros sobre variações
rados a partir de plataformas sociais como energéticas, dados atmosféricos ou monito-
YouTube, Facebook, Linkedin, Tik Tok etc. ramento de rotinas sísmicas.
Dados móveis: contém todo tipo de elemento Fotos e vídeos: dados que podem vir de
como informações de localização, mensa- vídeos de segurança, vigilância e tráfego,
gens de texto e arquivos diversos trocados acompanhamentos por drones, câmeras do
entre dispositivos móveis. sistema bancário etc.
Há, ainda, os dados semiestruturados, tipo de dado contido justamente entre dados estrutu-
rados e dados desestruturados. Na maior parte do tempo contêm características de ambos,
podendo contar com uma estrutura padrão que os torna estruturados, mas como uma organi-
zação interna mais caótica que lhe confere uma desestrutura.
18
Atenção!
19
Quadro 7 – data science e data analitycs
Campo que une estatística, matemá- Analisa dados brutos em busca de pa-
tica, programação e atua na extração, drões e usa algoritmos para isso. Pro-
triagem e preparação de dados. Busca cura correlações significativas entre
padrões em dados estruturados e não dados de uma base.
estruturados.
20
çamos também a coleta de dados através de máquinas, mas nesse momento enfatizaremos
dados de interação daquele que utiliza a internet voluntariamente.
Esses dados primários dos usuários são registrados, e com eles uma ‘espionagem’ maior aca-
ba sendo efetivada, pois são coletados mais dados, como o dispositivo utilizado (smartphone,
PC, tablet, notebook etc), o sistema operacional que está rodando nesses dispositivos, horá-
rio, localização geográfica, endereço de IP, endereços de e-mail e até mesmo seu histórico
de buscas, logins e senhas, mapas de calor, entre outros. Lembrando que na estrutura de um
e-commerce (como de qualquer site devidamente programado para isso) ainda temos o histó-
rico de navegação e compras. Todos esses dados coletados passam por um processo de mi-
neração, que nada mais é que a procura por padrões dos usuários dentro de uma estrutura di-
gital qualquer. É nesse momento que tecnologias que já citamos, como a inteligência artificial
e a ciência de dados, dentre outras, entram em ação. Nessa fase, dados gerados dão origem a
mapas comportamentais de extratos definidos de usuários e consumidores.
Através de um complexo sistema de protocolos presentes na internet, é possível que cada
passo de um usuário seja rastreado, esses protocolos registram toda vez que um usuário
acessa a internet, quantos cliques ele deu em uma foto ou link, quais áreas da rede mais aces-
sa e quanto tempo ficou on-line nesses locais. O ambiente digital está permeado de mecanis-
mos de rastreamento e são esses mecanismos que fornecem continuamente os dados que
são diariamente aproveitados pelo Big Data (AMARAL, 2016).
6 Quarta revolução
industrial, Big Data e o
impacto no mercado
A essa altura de nosso estudo, já pudemos perceber o enorme impacto que o Big Data e as
tecnologias de lhe dão suporte causaram no dia a dia do mercado, mas é chegado o momento
de nos debruçarmos mais assertivamente sobre esse tópico. Sabe-se que 59% dos habitantes
do globo é de usuários ativos da rede (E-COMMERCE BRASIL, 2020), a internet como canal de
negócios é uma incontestável realidade e faz parte de linha histórica que trouxe mudanças
fundamentais nas formas de organização social e modelos econômicos, interferindo nos as-
pectos da vida comum (AMARAL, 2016).
Historicamente, a primeira revolução lançou mão de água e vapor, trouxe a mecanização da
produção; na segunda revolução, a energia elétrica incrementou e ampliou muito a produção
em massa; na terceira revolução, a eletrônica e a tecnologia da informação aumentaram as
possibilidades ao promoverem a automatização da produção.
21
Atenção!
22
6.2 Big data na indústria de transformação
O Big Data possui aplicação em praticamente todos os setores e a indústria de transforma-
ção certamente não ficaria de fora desse paradigma. Nesse segmento, os dados coletados
têm contribuído significativamente na redução de falhas e diminuição de taxas de retrabalho,
aumentado a qualidade da produção e eficiência, otimização de tempo e dinheiro. Alguns tó-
picos relevantes que têm sido destacados em pesquisas são o aumento da qualidade do pro-
duto e a rápida determinação das causas que geram defeitos de fabricação, proporcionam
um planejamento preciso da cadeia de suprimentos, maior monitoramento em processos de
fabricação, controle de prazos e relacionamento com fornecedores, previsões de entrada e
saída de mercadorias e matéria-prima, eficiência energética, prototipação mais rápida de no-
vos produtos e personalização massificada.
Outro fator se debruça nas análises preditivas do data science, a indústria de transformação
busca indicações nos dados de oportunidades e tendências futuras, seja no desenvolvimento
de novos materiais, processos, paradigmas, otimização e afins. A personalização é um grande
exemplo disso, as movimentações de usuários em rede revelaram ao mercado fortes segmen-
tos que antes passavam despercebidos, como por exemplo, o mercado vegano, a sustentabi-
lidade ou as representações étnicas e culturais. A indústria percebeu que em grande medida
produtos, embalagens e afins não poderiam mais ser homogêneos, existe a necessidade de
buscar identificação com segmentos distintos e seus interesses. Esses segmentos deixam
claras suas preferências nos dados do Big Data.
O impacto do Big Data pode ser medido em todas as esferas de convivência, tanto pessoal
quanto mercadológica. A humanidade, sem dúvida, vive na contemporaneidade sua mais
massiva quantidade de dados criados e registrados em nível pessoal e profissional, o aces-
so cada vez mais facilitado às mídias digitais abarrotam as nuvens virtuais. A comunicação e
interação entre dispositivos aumenta exponencialmente (JENKINS; FORD; GREENE, 2014), as
informações necessárias para a criação de verdadeiros mapas comportamentais de consu-
midores, bem como diversos outros processos mercadológicos estão na pauta do dia. Exis-
tem plataformas com capacidade de processamento e administração de dados que suportam
massas gigantescas de arquivos.
A automatização da indústria utiliza máquinas inteligentes que decidem ações de forma autô-
noma e descentralizada em sistemas que interagem e colaboram mutuamente. O advento da
fibra ótica, o desenvolvimento dos computadores e a abrangência dos smartphones impulsio-
nam a revolução digital, a erupção dos dados na quarta Revolução Industrial (AMARAL, 2016).
Assim, quando alcançarmos a consolidação desses processos, teremos um grau de eficiência
nunca antes visto. Obviamente a tecnologia apenas não é suficiente, é necessária a maturida-
de digital nas organizações e corporações, com mão de obra especializada e visão estratégica
para tirar o maior proveito da enorme quantidade de dados presente no Big Data.
23
Resumo do curso
Neste curso, você aprendeu que o Big Data, com as premissas da exploração de dados, é vi-
tal para o presente e futuro dos negócios. Buscar novas formas de lidar com a informação é
a palavra de ordem, ter estratégia e novas perspectivas de gestão nos impulsionam em uma
maior competitividade e resultados mais promissores.
A esfera do Big Data também se presta na determinação de modelos preditivos de proteção a
fraudes, possibilitando processos de alerta que possam garantir respostas oportunas quan-
do dados de natureza incomum são reconhecidos. Com a emergência dos dados, cria-se um
olhar abrangente e analítico para todo tipo de operação a ser executada dentro do ambiente
corporativo. À medida que as empresas compreendem isso, mais promissores serão seus re-
sultados no caminho da competitividade e diferenciação no mercado.
24
Referências
AGRAWAL, D. Analytics based decision making. Journal of Indian Business Research, v. 6, n. 4, p. 332-
340, 2014.
AMARAL, F. Big Data: uma visão gerencial. São Paulo: Polo Books, 2016.
25
SOUSA, F. R.C.; MOREIRA, L. O.; MACHADO, J. C. Computação em nuvem: conceitos, tecnolo-
gias, aplicações e desafios. II Escola Regional de Computação Ceará, Maranhão e Piauí (ERCE-
MAPI), p. 150-175, 2009.
SILVEIRA, M.; MARCOLIN, C.; FREITAS, H. O Big Data e seu uso corporativo: uma revisão de li-
teratura, 2015. Disponível em: https://singep.org.br/4singep/resultado/245.pdf. Acesso em: 30
ago. 2021.
TAURION, C. Cloudcomputing-computação em nuvem. Brasport, 2009.
_____. Big Data. Brasport, 2013.
VEJA. Demasiado humano: há 20 anos, Kasparov era esmagado por Deep Blue. Disponível em:
https://veja.abril.com.br/blog/reveja/demasiado-humano-ha-20-anos-kasparov-era-esma-
gado-por-deep-blue/. Acesso em: 30 ago. 2021.
ZARDO, P. As tecnologias digitais e o processo de projeto contemporâneo. Dissertação Mes-
trado em Arquitetura e Urbanismo. Faculdade IMED, 2018. Disponível em: https://www.pas-
seidireto.com/arquivo/89606659/mes-zardo-2018-as-tecnologias-digitais-e-o-processo-de-
-projeto-contemporaneo. Acesso em: 30 ago. 2021.
26