Você está na página 1de 29

Big data analytics nos negócios

Apresentação
A mineração de dados é um princípio importante da data science, em que acontece o envolvimento
de tecnologia da informação para, de forma automatizada, realizar o tratamento de dados por meio
de avaliações de padrões. Assim, é importante conhecer todo o processo para estruturar projetos
de mineração de dados, assim como as suas tarefas, para que o processo de encontrar padrões, a
partir de dados definidos em um conjunto de subtarefas, seja mais concreto.

Os resultados melhorados de um negócio não dependem apenas do volume dos dados que uma
empresa apresenta, mas também sobre a forma como essas informações serão utilizadas. No
campo dos negócios, o processo de análise de dados vem beneficiando os aspectos de identificação
de fenômenos reais, que são analisados por meio desse grande conjunto de dados para melhorar
suas estratégias e seus processos.

Nesta Unidade de Aprendizagem, você vai aprender a aplicação do big data analytics nos negócios,
a partir da análise de tarefas de mineração de dados utilizados em casos reais e realizados a partir
da tomada de decisão para a escolha dos melhores processos e sua aplicação nas organizações.

Bons estudos.

Ao final desta Unidade de Aprendizagem, você deve apresentar os seguintes aprendizados:

• Relacionar casos reais e técnicas de mineração de dados.


• Aplicar a tomada de decisão baseada em dados.
• Identificar processos de implantação de analytics dentro do cenário empresarial.
Desafio
Toda empresa precisa reunir fatores que contribuam para alinhar as necessidades dos clientes às
suas previsões de vendas como, por exemplo, organizar a loja de forma que os consumidores não
se frustrem por não encontrarem o que desejam; buscar manter os estoques organizados para as
vendas futuras; organizar os vendedores para melhorarem as formas de vendas; entre outras
situações.

Quando são organizados os produtos em uma loja, é preciso levar em consideração alguns
parâmetros, como: a capacidade de produção; a distribuição da indústria que o produz; se aquele
produto tem material de divulgação e marketing próprio; o melhor mês para expor o item; entre
outros.

Nesse sentido, acompanhe a seguinte situação:


Diante desse panorama, você, como analista da informação responsável pela implementação desse
novo sistema, precisa responder as questões a seguir.

a) Além das informações sobre as vendas dos últimos 5 anos, quais outras podem ser utilizadas e,
assim, melhorar a análise dos dados que dará origem ao sistema de previsão?

b) Quais são os tipos de técnicas de mineração podem ser usados para realizar o sistema de
previsão de venda?
Infográfico
Para analisar os dados de uma organização, é necessário realizar a mineração de dados que, por
meio de um conjunto de técnicas automáticas, vai explorar grandes quantidades de dados para,
assim, descobrir novos padrões e novas relações que possam existir entre esses dados e que não
são possíveis de descobrir manualmente. Muitas técnicas podem ser utilizadas para realizar esse
processo de mineração.

Neste Infográfico, acompanhe as fases de mineração de dados por meio do modelo CRISP-DM,
compreendendo como cada uma das seis etapas é estruturada para gerar bons resultados de
análise para as organizações.
Aponte a câmera para o
código e acesse o link do
conteúdo ou clique no
código para acessar.
Conteúdo do livro
Dados são gerados a cada momento, especialmente no tempo tecnológico, em que o aumento de
vendas on-line cresceu — consequentemente, a quantidade de dados enviados para as redes
também. Tudo isso gera uma grande quantidade de dados, que precisam ser tratados dentro das
empresas para que tomadas de decisões assertivas sejam realizadas.

No capítulo Big data analytics nos negócios, base teórica desta Unidade de Aprendizagem, veja
como utilizar as técnicas de mineração de dados para a tomada de decisão, identificando os
modelos e métodos que vão ser implementados para gerar os melhores resultados e lucros para as
empresas. Por fim, acompanhe como aplicar corretamente essas análises realizadas por meio da
mineração de dados.
ANALYTICS PARA
BIG DATA
Big data analytics
nos negócios
Myllena Silva de Freitas Morais

OBJETIVOS DE APRENDIZAGEM

> Relacionar casos reais e técnicas de mineração de dados.


> Aplicar a tomada de decisão baseada em dados.
> Identificar processos de implantação de analytics dentro do cenário
empresarial.

Introdução
A transformação digital e os avanços da tecnologia têm feito o big data analytics
se tornar uma das grandes tecnologias para o mundo dos negócios, pois usa
o tratamento dos dados para gerar vários benefícios às organizações, melho-
rando as estratégias e os processos, que irão, consequentemente, aumentar
as vendas e os lucros.
O big data analytics é utilizado para gerenciar um grande volume de dados,
que, sendo capturados de diferentes formas, servirão para auxiliar no processo
de tomada de decisão das organizações. Por meio dessas análises serão des-
cobertos padrões para obter insights para os negócios.
Neste capítulo, você vai estudar a análise de dados a partir das técnicas
de mineração aplicadas a práticas da realidade das organizações. Veremos,
também, como identificar os processos de implantação de analytics para
melhorar os processos de negócios.
2 Big data analytics nos negócios

Técnicas de mineração e tomada de decisão


baseada nos negócios
A mineração de dados é um processo importante dentro do estudo da data
science, no qual existem estágios em que poderão ser aplicadas tecnologias
da informação, avaliação de padrões por meio de dados e descoberta automa-
tizada. Algumas vezes, esse processo envolve a criatividade, o conhecimento
de negócios e um bom papel do analista.
Para Provost e Fawcett (2016), a mineração de dados é uma arte, ou seja,
permite um processo que poderá contribuir com o aumento da probabilidade
de que um recurso seja bem-sucedido. O conceito da mineração de dados é
fundamental para pensar sobre data science.
A mineração de dados consiste em um processo analítico que tem como
função principal explorar grandes quantidade de dados, com o objetivo de bus-
car padrões consistentes e/ou relacionamentos sistemáticos entre variáveis,
para assim validá-los e aplicar aos padrões detectados novos subconjuntos
de dados (DEVMEDIA, 2015).
Para tanto, se faz importante conhecer todo o processo de estruturação
da mineração de dados, para que se aproxime da análise sistemática e não
haja perda de esforços. Uma vez que a mineração de dados busca encontrar
padrões de dados a partir de conjuntos de subtarefas, é importante também
saber estruturar os conceitos de data science (PROVOST; FAWCETT, 2016).
De acordo com Provost e Fawcett (2016, documento on-line):

Nos negócios, cada problema de tomada de decisão orientada em dados é ex-


clusivo, composto por sua própria combinação de metas, desejos, limitações e
até mesmo personalidades. Contudo, como acontece com boa parte da engenha-
ria, há conjuntos de tarefas comuns que permeiam os problemas de negócios.
Em colaboração com os investidores da empresa, os cientistas de dados decompõem
um problema de negócios em subtarefas. As soluções para as subtarefas podem,
então, ser compostas para resolver o problema geral. Algumas dessas subtarefas
são exclusivas do problema de negócios em particular, mas outras são tarefas
comuns de mineração de dados.

Os projetos de análises de negócios poderão, por meio de uma variável


específica, descrever de forma clara um indivíduo ou várias variáveis, como,
por exemplo: ao saber quais clientes deixaram a empresa após contratos
vencidos, a análise poderá relacionar outras variáveis que poderão surgir e
implicar a saída do cliente no futuro (PROVOST; FAWCETT, 2016).
Big data analytics nos negócios 3

Vejamos, a seguir, como se utilizam os conceitos fundamentais da mi-


neração de dados e suas tarefas que irão propor tomadas de decisão nos
negócios, segundo Provost e Fawcett (2016).

1. Na tarefa de classificar e estimar a probabilidade de classe, existe


a tentativa de prever, para cada indivíduo de uma população, a que
conjunto de classes ele pertence. De forma geral, as classes são mu-
tuamente exclusivas. Vejamos um exemplo que se aplica essa tarefa.

Uma empresa de telemarketing precisa saber quais, dentre o seu


público de clientes, são sensíveis a responder a uma oferta. Nesse
tipo de exemplo, poderiam ser nomeadas duas classes: “vai responder” e “não vai
responder”. Na mineração de dados, a tarefa de classificação serve para produzir
um modelo que analisa o novo indivíduo e determina a sua classe de pertença.

Na tarefa de classificação é possível, por meio da tarefa de estimar a


probabilidade da classe, prever, a partir de uma análise de cada cliente, qual
resposta seria dada pelo cliente à oferta. Nesse caso, quando se aplica o mo-
delo de pontuação ao indivíduo, uma pontuação representará a probabilidade
de o indivíduo pertencer a cada classe.

2. A tarefa de regressão tenta, para cada indivíduo, estimar ou prever o


valor numérico de alguma variável. Pegando o exemplo anterior, veja
como essa tarefa se aplica.

Agora a empresa precisa coletar os dados sobre quando um de-


terminado cliente usará um serviço. Nesse caso, precisa-se prever
quando acontecerá o uso do serviço. Pode-se, nesse caso, gerar um modelo
que vai analisar o comportamento de outros indivíduos semelhantes no que se
refere à sua população e ao histórico de uso. Um procedimento de regressão
produz um modelo que, a partir do indivíduo, vai calcular o valor da variável
para aquele cliente.
4 Big data analytics nos negócios

Existe relação entre a tarefa de regressão e a classificação, porém a


classificação prevê se algo irá acontecer, e, no caso da regressão, se prevê
quando algo vai acontecer, sendo assim, as duas são diferentes.

3. A combinação por similaridade tenta identificar semelhança entre os


indivíduos tendo como base os dados que já se tem sobre eles. Esse
tipo de tarefa pode ser usado para encontrar entidades semelhantes.
Esse método é um dos mais populares para as empresas recomenda-
rem seus produtos. Com ele, é possível encontrar semelhança entre
as pessoas e assim gerar dados sobre seus gostos e suas compras.
Na mineração de dados, em atividades como classificação e regressão,
a combinação por similaridade é uma das bases de soluções.

A IBM, uma das maiores empresas de tecnologia, está interessada


em encontrar empresas semelhantes aos seus melhores clientes
comerciais, para, dessa forma, concentrar sua força de vendas nas melhores
oportunidades. Para isso, eles usam a combinação por similaridade com base
nos dados “firmográficos”, que servem para descrever as características das
empresas.

4. Com o agrupamento, se busca reunir indivíduos de uma população


por meio de sua similaridade, mas sem nenhum propósito específico.

Suponha que a empresa de telemarketing precisa saber a quais


grupos, entre naturais e segmentos, seus clientes pertencem.
Em casos assim, aplicar a tarefa do agrupamento poderá ser útil para explorar
de forma preliminar o domínio e identificar os grupos naturais existentes, pois,
a partir deles, poderão surgir outras abordagens e tarefas de mineração de
dados. Outro exemplo seria analisar os produtos que a empresa deve oferecer ou
desenvolver para os seus clientes com base no processo de tomada de decisão.
Big data analytics nos negócios 5

5. O agrupamento de co-ocorrência (poderão ser encontradas literaturas


com mineração de conjunto de itens frequentes, descoberta da regra
de associação e análise de portfólio de ações) tenta encontrar asso-
ciações entre entidades com base em transações que as envolvem.
O agrupamento analisa as semelhanças que existem entre os objetos
tendo como base os seus atributos; já no agrupamento de co-ocorrência
se considera a similaridade dos objetos, tendo como base as suas
aparições conjuntas nas transações. O resultado do agrupamento por
co-ocorrência descreve itens que ocorrem juntos.

Em uma rede de supermercados, busca-se identificar quais produtos


são sempre comprados juntos. Na análise das compras dos clientes,
percebeu-se que a carne moída é sempre comprada junto do ketchup de forma
mais frequente do que o comum. Esse tipo de análise poderá criar novas campa-
nhas de promoção ou modificar a forma como os produtos são organizados nas
prateleiras. Esse tipo de co-ocorrência de produtos em compras é um exemplo
de agrupamento conhecido também como análise de portfólio de ações.

6. O perfilamento busca caracterizar o comportamento padrão de um in-


divíduo, grupo ou população. Esse comportamento poderá ser descrito
de forma geral, para uma população inteira, ou ao nível de pequenos
grupos ou mesmo indivíduos.

Um exemplo claro poderia ser a seguinte pergunta: “Qual é o tipo de


celular que um determinado grupo de cliente usa?”. Em casos assim,
descrever o comportamento não é simples, podendo ser traçado o perfil de uso
do celular, com uma descrição completa sobre todas as suas descrições: uso
dia e noite, uso nacional e internacional, conteúdos, uso de rede, dentre outros.
Esse tipo de atividade é bastante usado para estabelecer o comportamento
em relação a fraudes de sistemas de computadores ou em cartões de cré-
dito. Quando se tem um perfil de compras de uma pessoa por meio de cartão,
é possível determinar se houve ou não uma compra fora do perfil. Em casos
assim, poderá ser usado o grau de pontuação para acionar se houver disparidade.
6 Big data analytics nos negócios

7. A previsão de vínculo busca prever quais ligações existem entre itens


de dados, podendo sugerir que um vínculo deveria existir, e, se possível,
estimar sua força.

Duas pessoas têm, em suas redes sociais, 10 amigos em comum. Será


que essas 10 pessoas teriam interesse de serem amigos? Utilizar a
tarefa de previsão de vínculo poderia estimar qual a força de essas pessoas
terem um vínculo de fato. Outro exemplo seria a recomendação de séries e
filmes para clientes, que poderia ser feita a partir de uma análise entre filmes
já assistidos ou classificados por eles. Podem ser previstos vínculos que não
existiram entre os clientes e os filmes, mas que serviriam para prever vínculos
que poderiam existir e se tornar fortes.

8. A tarefa de redução de dados busca substituir um conjunto de dados


grandes por um conjunto menor, focando nas informações mais impor-
tantes do conjunto maior. Dessa forma, será mais fácil tratar o conjunto
menor de dados, e este poderá demonstrar melhor as informações.

Um grande conjunto de dados sobre preferências de filmes dos


consumidores poderá ser reduzido a um conjunto de dados ca-
paz de revelar os gostos do cliente mais evidentes na visualização de dados,
o que poderia ser feito por preferências de gênero. Geralmente, a redução de
dados envolverá a perda de informação, gerando o equilíbrio para uma melhor
compreensão.

9. A modelagem causal busca ajudar na compreensão dos acontecimentos


ou ações que causam influências em outras pessoas. As técnicas de
modelagem causal incluirão aquelas que envolvem um investimento
substancial em dados, como, por exemplo, os experimentos rando-
mizados controlados, assim como métodos sofisticados para obter
conclusões causais a partir de dados observacionais.
Big data analytics nos negócios 7

Um exemplo seria usar uma modelagem preditiva que denunciaria os


anúncios para consumidores e observaria o que os consumidores-
-alvo comprariam em uma taxa ainda maior após terem se tornado um alvo.
Podemos considerar que isso aconteceu porque houve influência dos anúncios
aos consumidores para comprar ou porque os modelos preditivos simplesmente
fizeram um trabalho bom ao identificar quais seriam os consumidores que teriam
comprado de qualquer forma.

Poderíamos detalhar bem mais cada uma dessas tarefas, embora não seja
possível aqui, mas, juntas, elas formam a base de todos os tipos de tarefas.
É preciso saber identificar quais tipos de tarefa se encaixarão para resolver
seu problema de análise dos dados.

Modelos de análise de negócios


Para realizar a análise de negócios, é preciso envolver várias tecnologias que
permitirão as análises de dados; sendo assim, é importante saber definir as
técnicas de mineração de dados e realizar sua escolha a partir dos objetivos
dessa técnica, seus benefícios e do papel desempenhado.
Vejamos, agora, métodos (ou técnicas) que, de uma forma geral, são di-
vididos em preditivo (supervisionado) ou descritivo (não supervisionado).
Durante o processo de mineração, existem diversas técnicas, que, após serem
testadas e combinadas, podem ser escolhidas para melhor refinamento dos
dados (HAN; KAMBER, 2006).

„ Associações: a regra de associação consiste em identificar quais itens


mais frequentemente são consumidos por um determinado conjunto
de dados e, assim, serão obtidos os resultados, como, por exemplo:
SE compra leite e pão, TAMBÉM compra manteiga.
■ Mineração de itens frequentes: existem duas etapas que formam esse
método; a primeira etapa cria um conjunto de itens frequentes, que
respeita um valor mínimo de frequência para os itens. Na segunda
etapa, as regras de associação serão geradas pela mineração desse
conjunto. Para cada regra produzida, deve-se gerar resultados váli-
dos que darão confiança para medir o percentual de registros que
atenderão à regra; o conceito de suporte vai indicar o percentual
8 Big data analytics nos negócios

de registros que se encaixam nessa regra. Consideramos uma regra


forte quando ela atende minimante ao suporte e à confiança.
„ Classificações: quanto aos métodos de aprendizado, as técnicas de
classificação poderão ser supervisionadas e não supervisionadas.
Esse tipo de método deve ser utilizado para prever os valores de va-
riáveis para cada tipo de categoria. Um exemplo para esse método
seria classificar os clientes de um banco, definindo-os como especiais
ou de risco. O modelo criado poderá identificar A categoria a qual um
registro pertence.
■ Árvores de decisão: é um método de classificação que faz uso de
fluxograma no formato de árvore, demonstrado por cada nó (não
folha), para indicar um teste feito em cima de um valor. Cada ligação
entre os nós representará os valores possíveis para o teste do nó
superior, e as folhas indicarão a classe (categoria) a qual cada re-
gistro pertence. Logo após a árvore de decisão ser criada, é preciso
classificar um novo registro, seguindo o fluxo na árvore, começando
pelo nó da raiz até chegar à folha, como demonstrado na Figura 1.

Figura 1. Exemplo de uma árvore de decisão.


Fonte: Árvore... ([2020], documento on-line).
Big data analytics nos negócios 9

■ Redes neurais (neural networks): simula o comportamento dos


neurônios. Uma rede neural pode ser considerada um conjunto de
unidades de entrada e saída conectadas por camadas intermediárias
em que cada ligação tem um peso associado. Durante o processo de
aprendizado, a rede ajusta esses pesos para conseguir classificar
corretamente um objeto.
„ Predições numéricas: os métodos de predição têm como objetivo
descobrir um possível valor futuro que uma variável poderá ter. As
predições numéricas preveem valores para variáveis contínuas. No
caso de predição de variáveis discretas, poderão ser aplicadas as
técnicas de classificação. Sir Frances Galton (1822 à 1911) desenvolveu
os métodos mais conhecidos para predição numérica, as regressões:
■ regressão linear — acontece quando a relação entre as variáveis
preditoras e a resposta segue um comportamento linear, sendo pos-
sível criar um modelo em que o valor de y é uma função linear de x;
■ regressão não linear — a relação entre as variáveis preditoras e a
resposta não segue um comportamento linear.
„ Agrupamento: as técnicas de agrupamento são não supervisionadas.
A partir de um conjunto de registros são gerados os agrupamentos,
que vão conter registros semelhantes. Essas similaridades serão usa-
das para medidas de distâncias tradicionais. Podemos classificar os
algoritmos de agrupamento nas categorias a seguir.
■ Métodos de particionamento (partitioning methods): dado um con-
junto D de dados com n registros, sendo k o número de agrupamentos
desejados, os algoritmos de particionamento organizam os objetos
em k agrupamentos, tal que k <= n. Os algoritmos mais comuns de
agrupamento são:
– k-means;
– k-medoids.
■ Métodos hierárquicos (hierarchical methods): cria o agrupamento
por meio da aglomeração ou da divisão dos elementos do conjunto.
A forma gerada por esses métodos é um gráfico em formato de
árvore. Dois tipos básicos de métodos hierárquicos podem ser
encontrados:
– aglomerativos;
– divisivos.
10 Big data analytics nos negócios

■ Os métodos de particionamento e hierárquicos geram agrupamentos


de formatos esféricos, nos quais a distribuição dos valores dos dados
é mais esparsa. São exemplos de algoritmos:
– DBSCAN;
– OPTICS;
– DENCLUE.
■ Métodos baseados em grade (grid-based methods): utilizam-se da
estrutura de grades e dividem os registros nas células dessa grade.
Apresentam um tempo de processamento bem rápido. Os principais
algoritmos são:
– STING;
– WaveCluster.
■ Métodos baseados em modelos (model-based methods): criam
um modelo para cada agrupamento e tentam identificar o melhor
modelo para cada objeto. Esse método parte da ideia de que os
dados são gerados por uma série de probabilidade de distribuições.
Os algoritmos que implementam esse modelo são:
– EM;
– COBWEB;
– CLASSIT.

Processos de implantação de analytics


no mercado
Após realizar a mineração de dados, o próximo passo a ser dado é implementar
a analytics para ser utilizada de forma real e, dessa forma, os resultados da
mineração gerarem lucros para a empresa. De acordo com Provost e Fawcett
(2016, documento on-line) “os casos mais claros de implantação envolvem
a implementação de um modelo preditivo em algum sistema de informação
ou processo de negócios”.
Atualmente é possível que as próprias técnicas de mineração de dados
passem pelo processo de implantação. Vejamos alguns exemplos reais.

Quando uma nova campanha publicitária é apresentada, poderá


ter sido realizado um direcionamento de anúncios on-line, no qual
os sistemas são implantados para construir e testar de forma automática os
modelos em produção.
Big data analytics nos negócios 11

Podemos citar duas razões principais para que a implantação aconteça


já na mineração de dados, sem necessariamente serem criados modelos
produzidos por um sistema de mineração de dados:

„ a mudança rápida do mundo, fazendo com que as equipes de data


science precisem se adaptar, para não deixar os dados desatualizados
ou vulneráveis a fraude ou invasão;
„ negócios com grande quantidade de tarefas de modelagem que ne-
cessitem de uma depuração por parte da equipe de data science a ser
realizada de forma manual para modelo. Em casos assim, é fundamental
comunicar à equipe de data science qualquer problema que venha a
aparecer e prejudique a entrega de uma operação segura.

Existem casos em que a implantação poderá assumir caráter menos técnico,


como naquele em que o uso do processo de mineração de dados conseguiu
descobrir um conjunto de regras que ajudou no diagnóstico e na correção de
erros que eram encontrados na impressão industrial. Esse problema pode
ser corrigido por meio de uma tarefa que, basicamente, seria a colocação
de uma folha de papel, que apresentava as regras, ao lado da impressora
(EVANS; FISHER, 2002).
Outros exemplos de implantação são alteração de dados nos procedi-
mentos de aquisição de dados, mudanças de estratégias, processos com
resultados obtidos da mineração de dados, etc.
Provost e Fawcett (2016, documento on-line) afirmam que:

A implantação de um modelo no sistema de produção normalmente requer que


o modelo seja recodificado para o ambiente de produção, geralmente para maior
velocidade ou compatibilidade com um sistema existente. Isso pode resultar em
despesas e investimentos substanciais. Em muitos casos, a equipe de data science
é responsável pela produção de um protótipo de trabalho, junto com sua avaliação,
que é passado para uma equipe de desenvolvimento.

É possível que haja riscos quando acontece a transferências de dados


inconsistentes ou errados de data science para o desenvolvimento. Dessa
forma, é importante que os membros da equipe de desenvolvimento sejam
envolvidos no início do projeto de data science. Eles podem começar como
consultores, oferecendo uma visão crítica para a equipe de data science.
12 Big data analytics nos negócios

O processo de implantação geralmente é realizado pelos engenheiros


de data Science, que, por terem conhecimentos específicos do projeto, irão
assumir responsabilidades a cada etapa. Existem casos nos quais os desenvol-
vedores irão assumir a propriedade e a liderança do produto. Na implantação
final do projeto, é possível que haja envolvimento dos cientistas de dados,
que poderão assumir o papel de consultores, pois existirão casos em que o
processo precisa retornar para a fase de compreensão do negócio.

O processo de mineração de dados produz uma grande quantidade de conhecimen-


to sobre o problema de negócios e as dificuldades de sua solução. Uma segunda
iteração pode produzir uma solução melhorada. Apenas a experiência de pensar
sobre o negócio, os dados e as metas de desempenho, muitas vezes, leva a novas
ideias para melhorar o desempenho e até mesmo criar linhas novas de negócios
ou novos empreendimentos (PROVOST; FAWCETT, 2016, documento on-line).

O ciclo de implementação acontece independentemente de falhas que


venham a existir, pois, na fase de avaliação, poderão ser reveladas infor-
mações sobre os dados, como se são bons ou suficientes para implantação,
e se serão necessários ajustes ou a obtenção de novos dados.

Referências
ÁRVORE de tomada de decisão. In: WIKIPÉDIA, [2020]. Disponível em: https://commons.
wikimedia.org/wiki/File:%C3%81rvore_de_tomada_de_decis%C3%A3o.png. Acesso
em: 15 out. 2021.
DEVMEDIA. Mineração de dados na prática: parte 1. 2015. Disponível em: https://www.
devmedia.com.br/mineracao-de-dados-na-pratica-parte-1/33299. Acesso em: 15 out.
2021.
EVANS, R.; FISHER, D. Using decision tree induction to minimize process delays in the
printing industry. In: KLOSGEN, W.; ZYTKOW, J. (ed.). Handbook of data mining and
knowledge discovery. Oxford: Oxford University Press, 2002. p. 874-881.
HAN, J; KAMBER, M. Data mining: concepts and techniques. Amsterdam: Elsevier, 2006.
PROVOST, F.; FAWCETT, T. Data science para negócios: o que você precisa saber sobre
mineração de dados e pensamento analítico de dados. Rio de Janeiro: Alta books,
2016. (E-pub).
Big data analytics nos negócios 13

Leituras recomendadas
DOMINGUES, M. L. Mineração de dados utilizando aprendizado não-supervisionado:
um estudo de caso para bancos de dados da saúde. 2003. 127 f. Dissertação (Mestre
em Ciências da Computação) — Instituto de informática, Universidade Federal do Rio
Grande do Sul, Porto Alegre, 2003.
NASCIMENTO, C. A. X. et al. Inovação nos negócios por meio da análise de big data
international. Journal of Professional Business Review, v. 3, n. 1, p. 1-16, 2018.
REZENDE, S. O. Mineração de dados. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COM-
PUTAÇÃO, 25., 2005, São Leopoldo. Anais [...]. São Leopoldo: Unisinos, 2005. p. 397-433.

Os links para sites da web fornecidos neste capítulo foram todos


testados, e seu funcionamento foi comprovado no momento da
publicação do material. No entanto, a rede é extremamente dinâmica; suas
páginas estão constantemente mudando de local e conteúdo. Assim, os edito-
res declaram não ter qualquer responsabilidade sobre qualidade, precisão ou
integralidade das informações referidas em tais links.
Dica do professor
A mineração de dados se constitui no processo de conhecimento de grandes quantidades de dados,
podendo utilizar vários métodos e diversas técnicas para analisá-los. Dentro das tarefas de
mineração de dados, existem os métodos conhecidos como "aprendizagem supervisionada" e
"aprendizado não supervisionado", que vão contribuir com a melhor exploração dos dados.

Nesta Dica do Professor, compreenda como cada um desses métodos se apresenta, suas
características e quais são os métodos utilizados em cada tarefa de mineração especificamente.

Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.
Exercícios

1) Uma rede de farmácias percebeu que com a aproximação do verão precisava organizar as
suas prateleiras para as vendas de produtos utilizados nessa época. Porém, para aumentar a
quantidade de vendas não apenas nesses produtos específicos, a empresa decidiu realizar
uma análise em seus dados para saber como organizar melhor os seus itens para que possam
ser adquiridos juntos.

Com base nesse contexto, assinale qual é a melhor tarefa de mineração de dados que pode
ser aplicada para realizar a análise dos dados da rede de farmácias.

A) Classificação e estimativa de probabilidade.

B) Regressão.

C) Combinação por similaridade.

D) Agrupamento.

E) Agrupamento de coocorrência.

2) Dentro da mineração de dados, deseja-se analisar os dados de uma organização a partir das
características comportamentais de um determinado indivíduo ou comportamento de
aplicações. Sendo assim, a melhor opção será aplicar a tarefa de _____________.

Marque a alternativa que completa corretamente a lacuna.

A) Modelagem casual.

B) Regressão.

C) Redução de dados.

D) Perfilamento.

E) Agrupamento de coocorrência.

3) No processo de mineração de dados, grande parte das teorias, dos algoritmos e dos métodos
que são utilizados para fazer o tratamento de volumes de dados é proveniente do
reconhecimento de padrões e aprendizado de máquina, como os métodos supervisionado e
não supervisionado.

Sobre esses métodos, analise as afirmativas a seguir.

I. O aprendizado supervisionado requer algum tipo de supervisão do processo que passe


informações sobre típicos de classe, em que dentro do processo de treinamento poderá
identificar a classe de novos objetos.

II. No aprendizado não supervisionado, é preciso identificar como os objetos poderão ser
agrupados em classes, baseando-se em atributos deles.

III. O aprendizado não supervisionado apresenta exemplos, e o número típico de classes é


conhecido.

São corretas as afirmativas:

A) I e II.

B) II e III.

C) I e III.

D) III, apenas.

E) I, apenas.

4) Após realizar a mineração dos dados, é preciso implementá-los na empresa para que o
investimento aplicado na mineração possa gerar lucros para o negócio. Existe a possibilidade
de a implantação acontecer já durante a análise da mineração de dados sem
necessariamente criar um modelo específico.

Sendo assim, assinale (V) para verdadeiro e (F) para falso nas afirmativas a seguir.

( ) O cientista de dados precisa ficar atento para que os dados analisados não sejam
desatualizados.

( ) Essa decisão poderá ser tomada para análises que precisem de decisões imediatas.

( ) Quando a modelagem apresenta grandes quantidades de tarefas, o cientista de dados


precisa acompanhar o modelo por meio de correções para entregar uma operação segura.

Assinale a alternativa com a ordem correta.

A) V, V, F.
B) F, V, F.

C) F, F, V.

D) V, V, V.

E) V, F, V.

5) Uma empresa de fabricação de sapatos está organizando o lançamento de seu novo produto,
porém precisa encontrar o melhor momento para realizá-lo e garantir que as vendas sejam
bem-sucedidas. Pensando nisso, o setor de marketing decidiu contratar uma equipe de data
science para realizar uma análise nos dados e determinar qual será a melhor data para lançar
o seu produto.

Sendo assim, assinale qual é a tarefa de mineração de dados que pode ser aplicada pela
equipe de data science.

A) Modelagem casual.

B) Regressão.

C) Agrupamento.

D) Perfilamento.

E) Redução dos dados.


Na prática
Conhecer seus clientes deve sempre ser um dos grandes objetivos de uma organização. Cabe à
empresa realizar esse conhecimento por vários níveis, que vão do tipo de produto que o cliente
deseja até quais ofertas poderão causar interesse, mesmo que esse não seja o padrão de compras
do cliente. Outros fatores que uma empresa precisa conhecer diz respeito ao perfil médio do
consumidor: renda, sexo, idade, tipo de família, entre outros.

A partir disso, o negócio poderá se organizar para oferecer aos seus clientes ofertas com certo grau
de certeza de sucesso. Dessa forma, o trabalho do mercado dirigido vai criar uma relação próxima
com cada cliente e poder investir em classificações sucessivas de sua clientela.

Confira, Na Prática a seguir, como uma empresa de distribuição de materiais de construção aplicou
o processo de mineração de dados para melhorar as suas vendas para clientes revendedores de
seus produtos.
Aponte a câmera para o
código e acesse o link do
conteúdo ou clique no
código para acessar.
Saiba +
Para ampliar o seu conhecimento a respeito desse assunto, veja abaixo as sugestões do professor:

Dados podem ser determinantes para o crescimento de uma


empresa. Você sabe usar?
A reportagem a seguir mostra a importância de as empresas desenvolverem análises dos dados dos
seus clientes. Veja também como o big data analytics vem crescendo cada vez mais, tendo papel
fundamental no crescimento das empresas, assim como na busca por novas soluções de mercado e
investimentos.

Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.

Inovação nos negócios por meio da análise de big data


No seguinte artigo, leia uma discussão, por meio de bibliografias, sobre os temas que estão
relacionados com o big data, a plataforma de inovação e o big data analytics, assim como com a
intenção de demonstrar o uso e a aplicação do big data nas empresas.

Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.

O uso coorporativo do big data: uma revisão de literatura


O big data vem ganhando notoriedade por conta de oportunidades e desafios em torno de sua
utilidade no apoio aos negócios. No artigo a seguir, veja um estudo que procura, com uma revisão
sistemática da literatura, identificar como estão ligados o big data e o mundo corporativo.
Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.

Você também pode gostar