Você está na página 1de 49

Escolas Integradas – Educação Continuada

Business Analytics
Aplicado a Redes Sociais

Prof. Edmilson Martins


https://www.linkedin.com/in/edmilson-martins-3947a721a/
AS VANTAGENS
DO SEU CURSO!

Flexibilidade de tempo Estude em qualquer lugar Autonomia da aprendizagem

Suporte de tutores Aprendizagem colaborativa


Apresentação do Professor
Experiência Acadêmica:
 Mestrado em Engenharia de Software - IPT
 MBA em Gestão de Tecnologia da Informação – FIAP
 Tecnologia em Processamento de Dados – Mackenzie

Experiência Profissional:
 Consultor de TI
 Especialista de Sistemas
 Coordenador de Sistemas
Atuação profissional há mais de 26 anos, nos seguintes
ramos:
 Bancos
 Seguros
 Treinamentos
Agenda da Aula

 Apresentação do Case
 Literatura
 Casos Práticos
 Instruções para entrega do
Case
Apresentação do Case
DISCUSSÃO DO
CASO

PONTOS PRINCIPAIS

Case: Banco Acme


(Nubank)
Case: Banco Acme
O Banco Acme é uma fintech que surgiu em 2015.

Inicialmente ela atuava como operadora de cartões de


crédito, depois ampliou o seu portfolio para constas pessoais
e empréstimos.

Possuía 5 milhões de clientes no cartão de crédito e 2,5


milhões na conta digital em 2018.

Nas redes sociais, também em 2018, possuía


aproximadamente 1,4 milhão de likes no Facebook, 93.000
seguidores no Twitter e 249.000 no Instagram.
Case: Banco Acme
O público principal (millenials) está acostumado com as
mídias sociais, e eventualmente reclama dos problemas por
esses canais.

Millenials, também chamada da Geração Y, são as pessoas


que nasceram entre 1981 e 1996, ou seja, que atualmente
tem entre 26 e 41 anos.

Isso gera uma preocupação de imagem e acaba trazendo


novas ideias para a equipe responsável pela comunicação
pública da empresa.

A empresa deseja identificar as emoções que estão atreladas


aos comentários dos usuários nas redes sociais para manter
os sentimentos mais positivos em relação à sua marca.
Case: Banco Acme
O departamento de tecnologia da empresa Acme foi
acionado para extrair os comentários de uma rede social,
analisar o seu conteúdo e gerar um relatório sobre como os
sentimentos variavam em um determinado período de tempo.

Para isso será necessário projetar uma solução baseada em


Business Analytics aplicado a redes sociais.

Esse projeto envolve extração de dados, pré-processamento


e análise.
Case: Banco Acme
A primeira etapa, a de extração de dados, compreende as
tarefas de escolher uma mídia social e obter os seus dados.

A segunda está relacionada com deixar esses dados em um


formato adequado para análise.

Por fim, a análise envolve executar um algoritmo para obter a


evolução de sentimentos ao longo do tempo.

Com base no exposto, reflita e descreva: como podemos


criar uma análise dos comentários na mídia social conhecida
como Twitter?
Dicas para Resolução do Case
Dica 01: Sentimentos e Interesses
Contidos em Textos
Proceder à análise de textos para identificar sentimentos e interesses não é tão
novo.

Apesar disso, a utilização, por grande parte das pessoas, desse tipo de técnica é
recente.

Um dos maiores exemplos é a ferramenta conhecida como Google Trends.

Esse recurso permite analisar o interesse do mundo todo em um determinado tema.

Digamos que queremos entender como o assunto machine learning evoluiu ao longo
do tempo.

Para isso, basta colocar o termo de busca na ferramenta, para obter o resultado.
Dicas para Resolução do Case
Dica 02: Machine Learning Aplicada na Análise
de Sentimentos
A aplicação do aprendizado de máquina (machine learning) é muito útil
nos mais variados domínios de conhecimento.

A ideia de utilizar essa técnica para identificar sentimentos em textos vem


sendo empregada por empresas, tais como Google e Facebook.

Isso pode ser feito com uma linguagem conhecida como R e a ferramenta
RStudio.

Sendo assim, é importante conhecer os fundamentos da análise de


sentimento com machine learning.

Leia o texto proposto e reflita: como os conceitos apresentados poderiam


auxiliar na resolução do problema apresentado no videocase?
Dicas para Resolução do Case
Dica 3: Mineração de Texto com a Linguagem R
A análise de sentimentos é uma das subáreas da mineração de texto.

Esta, por sua vez, é uma subárea da mineração de dados.

É importante entender os aspectos da mineração de texto e como pode ser criada, com
base na utilização da linguagem R, para entender como isso afeta a análise de sentimento.

Um excelente livro sobre o assunto é o Text Mining with R.

Existe uma versão on-line da obra, que permite ler e utilizar os códigos, para testar e
aprender como esse tipo de tarefa funciona.

O conteúdo específico encontra-se no capítulo 2.

Leia o texto.
Literatura
O que a literatura nos diz?
O que a literatura nos diz?
O volume de dados gerados está cada vez maior
O que a literatura nos diz?
Big Data
BIG DATA é um conjunto de metodologias utilizadas para capturar,
armazenar e processar um volume imenso de informações de várias
fontes (dados estruturados e não estruturados) com o objetivo de acelerar a
tomada de decisão e trazer vantagem competitiva.

 Dados estruturados x não estruturados

 90% dos dados gerados pela humanidade foram criados nos últimos 2
anos
O que a literatura nos diz?
Business Intelligence
Business Intelligence é a utilização dos dados do Big Data para uma ação
específica, pois tem relação com a análise de dados brutos e sua
transformação em informações comerciais valiosas.

É o processo de coletar, armazenar e analisar os dados das operações de


negócios da empresa para prover métricas abrangentes e quase em tempo
real para auxiliar na tomada de decisões da empresa.

Com ele é possível, por exemplo, criar indicadores de desempenho, detectar


tendências de mercado, entre outras aplicações.

Ela é focada na análise descritiva, ou seja, no fornecimento de um resumo


dos dados históricos e atuais para mostrar o que aconteceu e o que está
acontecendo atualmente (relaciona-se às perguntas: “o quê” e “como”)

Fonte: FIVEACTS (2018) e TABLEAU (2020)


O que a literatura nos diz?
Business Analytics
O Business Analytics é uma abordagem centrada em dados que combina a
ciência de análise preditiva com capacidades avançadas de inteligência de
negócios.

Business Analytics refere-se à prática de usar os dados de sua empresa para


antecipar tendências e resultados e ajudar a tomar decisões melhores.

Ela é focada na análise preditiva, ou seja, na mineração dos dados, na


modelagem e no aprendizado de máquina para determinar a probabilidade
de resultados futuros (relaciona-se à pergunta: “por quê”)

Em outras palavras, podemos dizer que BA é a interseção entre o seu


negócio e a ciência de dados.

Fonte: TABLEAU (2020) ; PROOF (2020)


O que a literatura nos diz?
Business Analytics – Integração em campos

Fonte: NEO (2022)


O que a literatura nos diz?
Análise de Sentimentos
Análise de Sentimentos, ou mineração de opinião, é a análise de textos para
saber, por exemplo, se o texto é a favor ou contra alguma coisa.

Ela utiliza-se do processamento de linguagem natural para extrair, classificar


e analisar opiniões sobre diversos temas em grandes volumes de dados
textuais.
O que a literatura nos diz?
Análise de Sentimentos - Abordagens
Aprendizagem supervisionada: exige a classificação manual de amostras
da base de dados (ou conjunto de treino) para se criarem padrões baseados
no texto que servirão de parâmetro à classificação automática de toda a base
de dados com o auxílio de algoritmos de aprendizagem de máquina

Aprendizagem não supervisionada: feito exclusivamente pela máquina


O que a literatura nos diz?
Mineração de Textos
A Mineração de Textos, também chamada de Descoberta de Conhecimento
em Textos (Knowledge Discovered in Texts – KDT), é o processo de extração
de informação útil (conhecimento) em documentos de textos não-
estruturados.

Estima-se que mais de 80% das informações atuais estão armazenadas em


formato de texto não-estruturado, seja em livros, sites ou redes sociais. Por
essa razão a mineração de textos possui grande valor comercial.
O que a literatura nos diz?
Etapas para Mineração de Textos
Seleção dos Dados: selecionar e coletar o conjunto de dados ou variáveis
necessárias

Processamento: também chamada de pré-processamento, visa eliminar os


dados que não se adequam às informações, seja por estarem incompletos,
repetidos, ou por alguma outra razão.

Transformação/Indexação: nesta etapa os dados são armazenados


adequadamente para facilitar a utilização das técnicas de mineração de
dados
O que a literatura nos diz?
Etapas para Mineração de Textos
Mineração de dados: a atividade de descoberta do conhecimento é onde
são processados os algoritmos de aprendizado de máquina e de
reconhecimento de padrões.

Interpretação/Avaliação: os resultados do processo de descoberta do


conhecimento podem ser mostrados de diversas formas para que o usuário
possa entender e interpretá-los.
O que a literatura nos diz?
Etapas para Mineração de Textos
O que a literatura nos diz?
Processo de Indexação:
 Análise Léxica: converte uma sequência de caracteres em uma sequência
de palavras, que serão as palavras candidatas a serem termos do índice;

 Remoção de Stopwords: remove palavras que aparecem com muita


frequência no texto;

 Stemming: remove as variações de palavras, deixando apenas o termo


“raiz”;
O que a literatura nos diz?
Processo de Indexação:
 Seleção dos Termos-índice: determina quais palavras ou radicais serão
usados como elementos de indexação;

 Determinação de pesos: utiliza medidas de frequência relativa para


identificar termos que ocorrem com frequência

 Criação de Tesauros: tesauro é um vocabulário controlado que representa


hierarquias, relações de equivalência, pertinência e associações entre os
termos, com o objetivo de auxiliar o usuário a encontrar informação com a
menor margem de erro (COLEPÍCOLO, 2004)
O que a literatura nos diz?
Linguagem R
O R é uma linguagem e um framework para computação de gráficos e
cálculos estatísticos.

É uma linguagem de código aberto e pode ser usada sem a necessidade de


licenças.

Fornece uma ampla variedade de técnicas estatísticas (modelagem linear e


não linear, testes estatísticos clássicos, análise de séries temporais,
classificação e agrupamento, entre outras) e técnicas gráficas que são
altamente extensíveis.

Possui facilidade para produzir gráficos de qualidade, incluindo símbolos e


fórmulas matemáticas quando necessários.

Para baixar: https://www.r-project.org/


O que a literatura nos diz?
Linguagem R – Alguns comandos
library(nome_da_biblioteca): para importar uma biblioteca

cidade <- “São Paulo”: para atribuir um conteúdo para uma


variável

nome_da_funcao(arg1, arg2, argn): para executar uma


função passando argumentos

data.frame: são os objetos que guardam os dados, como se


fosse uma planilha do Excel
Exemplo:
df1 <- data.frame(
nome = c("João", "Pedro", "Amanda", "Fábio",
"Fernanda", "Gustavo"),
altura = c(1.80, 1.77, 1.71, 1.65, 1.66, 1.63),
idade = c(22, 21, 18, 20, 23, 19))
O que a literatura nos diz?
RStudio
RStudio é um ambiente de desenvolvimento integrado (IDE) para a
linguagem R.

O RStudio IDE é desenvolvido pela Rstudio e não possui conexão formal


com a Fundação R.

Possui versões desktop e web based.

Para baixar: https://rstudio.com/products/rstudio/download/


O que a literatura nos diz?
Tag Cloud
 Mostra palavras (tags) com tamanhos baseados na sua importância ou
quantidade de vezes em que aparece
Casos Práticos
O que a prática nos mostra?
Para coletar dados do Twitter:
 Criar uma conta no Twitter

 Solicitar acesso aos dados: https://apps.twitter.com/ (para obter key,


secret, token e token_secret)
O que a prática nos mostra?
Exemplo de código para autenticar:
library(twitteR)

twitter_token <- create_token(


app = "data_science_ppgia",
consumer_key="[coloque_sua_chave_aqui]",
consumer_secret="[coloque_sua_chave_aqui]",
access_token="[coloque_sua_chave_aqui]",
access_secret="[coloque_sua_chave_aqui]",
set_renv = TRUE)

# para obter os últimos tweets de um termo


tweet_c <- search_tweets("#[coloque_sua_chave_de_pesquisa_aqui", n =
[coloque_a_quantidade_de_tweets_aqui], lang = "pt",
include_rts = FALSE)
O que a prática nos mostra?
Exemplo de código completo:
Para elaborar o caso, copiar o código do site abaixo, alterando de “STF” para
a empresa do case:
https://rpubs.com/thiago123789/thfg_3va
Resultado gerado (utilizando STF, com 1.000 tweets):
Instruções para entrega do Case
Agora é com você!

Com tudo isso mente, o que você propõe para


resolver o case da “Empresa Acme”?
Agora é com você!
Você deve:
 Obter os dados do twitter da empresa apresentadas no estudo de
caso;

 Utilizar a ferramenta R para mineração dos textos;

 Implementar um código para análise do texto;

 Analisar os resultados obtidos;

 Elaborar um relatório com uma proposta de solução para os


problemas reportados no estudo de caso

 Justificar as suas escolhas utilizando as referências estudadas na


disciplina, ou alguma outra referência que achar mais pertinente.

 Ao utilizar texto de outro autor, seja de um livro ou site da internet,


sempre faça referência à fonte
Agora é com você!
Como apresentar meus resultados?
 Trata-se de uma questão dissertativa, que deve ter no mínimo 20
linhas e no máximo 30 linhas (ou no mínimo 1000 caracteres com
espaço e no máximo 1400 caracteres com espaço).
Agora é com você!
Como apresentar meus resultados?
 A dissertação deve estar totalmente relacionada ao case
apresentado.

 Precisa ser autoral e inédito. Comprove-a com a opinião de outros


autores, mas não se esqueça de colocar o que e de onde foi
retirado cada trecho, colocando-o entre aspas e referenciando
todas as fontes.

 Utilize as normas da ABNT para referenciar no meio do texto


(AUTOR, ANO) e traga a referência completa no final do seu
trabalho (SOBRENOME, Nome. Título da Obra. Editora. Ano).
Agora é com você!
Como apresentar meus resultados?
 Trata-se de texto único, sem separações de subtítulos; não será
aceito conteúdo em modelo de pergunta e resposta e nem em
tópicos separados.

 Não há necessidade de uma capa de apresentação.

 Imprescindível, porém, que você coloque um título em seu


trabalho.
Agora é com você!
Erros mais comuns cometidos pelos alunos
Erros de português:
 Separar o sujeito do verbo com vírgula:
Exemplo:
A maioria das empresas, passa por um processo ... (errado)
A maioria das empresas passa por um processo ... (certo)

 Concordância verbal:
Exemplo:
As empresas precisa implantar ... (errado)
As empresas precisam implantar ... (certo)

 Utilização incorreta de pronome:


Exemplo: a expressão “a mesma” não deve ser utilizada como
pronome
A empresa precisa garantir a sobrevivência da mesma ... (errado)
A empresa precisa garantir a sua sobrevivência ... (certo)
Agora é com você!
Erros mais comuns cometidos pelos alunos
Problemas com referências:

 Copiar texto de um livro ou site sem citar a fonte

 Não colocar nenhuma referência

 Fazer referência de forma errada:


Exemplo:
Segundo o site g1.com.br/nomeDaPagina, as empresas ... (errado)
Segundo (G1, 2020), as empresas ... (certo)
E na parte de referências colocar:
G1. [Título da página]. Disponível em g1.com.br/nomeDaPagina.
Acessado em xx/xx/2020
Agora é com você!
Erros mais comuns cometidos pelos alunos
Problemas estruturais:

 Apresentar menos de 20 linhas, ou mais de 30 linhas

 Desenvolvimento do texto sem uma estrutura (começo, meio, fim)

 Não apresentar uma proposta para solução para o Case


Para saber mais ...
Para saber mais ...
Referências:
FIVEACT. Afinal, qual a diferença entre Business Intelligence e
Big Data? Disponível em:
https://www.fiveacts.com.br/afinal-qual-diferenca-entre-business-intelli
gence-e-big-data/
. Publicado em: 04/01/2018. Acessado em 15/11/2022

PROOF. O que é Business Analytics? Disponível em:


https://www.proof.com.br/blog/o-que-e-business-analytics/ . Acessado
em: 15/11/2022

TABLEAU. Business Intelligence or Business Analytics: What’s


the difference and which do you need? Disponível em:
https://www.tableau.com/learn/articles/business-intelligence/bi-busine
ss-analytics
. Acessado em: 15/11/2022
Para saber mais ...
Referências:
NEO. Business Analytics. Disponível em:
https://www.neoinfinito.com.br/site/o-que-e-business-analytics/.
Acessado em 15/11/2022
Escolas Integradas – Educação Continuada

Business Analytics Aplicado a Redes Sociais

Prof. Edmilson Martins


https://www.linkedin.com/in/edmilson-martins-3947a721a/

OBRIGADO.

Você também pode gostar