Você está na página 1de 59

<7X UNIVERSIDADE

DE 49 GREENWICH
COMP1682: Projeto de Conclusão de Curso

Uma investigação sobre se uma empresa mais ativa nas redes sociais é mais
"bem-sucedida" do que uma com menos presença online

Nome do Aluno

000111111

Supervisor: Nome do Supervisor

Contagem de palavras: 12.104

Bacharel em Computação Empresarial

Uma dissertação apresentada em execução parcial da Universidade de Greenwich

Abstrair

O Projeto tem como objetivo descobrir se as Empresas que usam as Redes Sociais como ferramenta de
marketing para se conectar com os Clientes têm uma melhor reputação e/ou são mais lucrativas do que uma
Empresa sem uma, ou com uma presença online muito pequena.

O relatório se concentrará em pesquisar o desenvolvimento do Marketing de Relacionamento com o Cliente ao


longo dos últimos quarenta anos, o que resultou em Análise de Sentimento por meio de Raspagem de Dados e
Mineração de Texto, e reconhece os vários programas que um Desenvolvedor poderia usar para visualizar os
Dados coletados por meio desses métodos no século 21. Além disso, o relatório examinará as metodologias
usadas nas etapas de planejamento e desenvolvimento do ciclo de vida do produto.

1
Agradecimentos
O projeto criado não teria sido possível sem muitas pessoas ótimas que me incentivaram ao longo dos últimos
quatro anos, obrigado.

Agradecimentos especiais às minhas supervisoras por me incentivarem e ajudarem durante todo o


desenvolvimento deste projeto, vocês duas são modelos femininas muito poderosas, e sou grata por ter estado
em sua classe neste último ano.

Também um enorme obrigado à minha família por ter comigo como a primeira pessoa a ir para a
Universidade: minha mãe por sempre garantir que eu estivesse bem e oferecer lanches quando necessário, meu
pai por sempre acreditar em mim desde o momento em que eu disse a ele que queria entrar em Ciência da
Computação, dizendo que eu poderia fazer qualquer coisa desde o momento em que comecei a estudar.

Minhas irmãs também precisam de reconhecimento extra por fornecer viagens para Byron Burger e
McDonalds, e verificações gramaticais/ortográficas sempre que eu precisar delas.

2
Índice
<7X UNIVERSIDADE DE 49 GREENWICH.....................................................................................1
Índice..........................................................................................................................................3
1 Secção 1: Introdução...........................................................................................................5
2 Seção 2: Revisão da Literatura...........................................................................................6
Quão bom é "bom"? Agora com ainda mais palavras!................................................12
YouGov................................................................................................................................13
3 Seção 3: Pesquisa de Produtos..........................................................................................15
3.4 Modelo de Pontuação Ponderada..............................................................................18
4 Seção 4: Questões e Considerações Legais, Sociais, Éticas e Profissionais.....................19
5 Seção 5: Requisitos e Metodologia...................................................................................20
5.5 Metodologia...............................................................................................................21
5.6 Justificação da adequação de uma Metodologia ou de um Quadro seguido.............23
6 Projetar.................................................................................................................................23
6.1 Diagrama de caso de uso UML.................................................................................23
7 Processo de Desenvolvimento..............................................................................................25
7.1 Estágio 1: Busca inicial de código Python................................................................25
7.2 Etapa 2: Implementação da Análise Semântica.........................................................29
7.2.1 Iteraçã o 1.............................................................................................................29
7.2.2 Iteraçã o 2.............................................................................................................29
7.2.3 Iteraçã o 3.............................................................................................................29
7.3 Estágio 3: Agrupando os dados no Excel..................................................................30
7.4 Etapa 4: Criando visualizações de dados........................................................................31
7.5 Caixa de Tempo.........................................................................................................34
7.6 Potenciais abordagens alternativas............................................................................34
8 Teste..................................................................................................................................35
9 Avaliação..........................................................................................................................36
9.1 Avaliação do Produto................................................................................................36
9.2 Auto-Avaliação..........................................................................................................37
10 Conclusão............................................................................................................................39
10.1 Conclusões sobre Reputação.....................................................................................39
10.2 Conclusões relativas à Rentabilidade...........................................................................42
11 Bibliografia.........................................................................................................................43
12 Apêndices............................................................................................................................45
12.1 Apêndice A: Figuras.....................................................................................................45
12.2 Apêndice B: Relatório contextual................................................................................46
12.3 Apêndice C: Código do Notebook Python Jupyter......................................................47
12.4 Apêndice D: Código de Análise Semântica.................................................................48

3
12.5 Apêndice E: Fórmulas de planilha do Excel.............................................................51
12.6 Apêndice F: Visualizações de dados do Tableau......................................................53
:o......................................................................................................................................................54
12.7 Apêndice G: Ensaios.................................................................................................57
1.1

Tableau Public de painéis:


https://public.tableau.com/profile/georgia6424#!/vizhome/DataVisualisations/GatheringStats

4
1 Secção 1: Introdução
1.1 Fundo

Sempre foi importante para as empresas comercializar seus produtos e, na última década, o público começou
a perceber como as mídias sociais se tornaram cada vez mais importantes na publicidade das empresas. As
pessoas usam as Redes Sociais para expressar qualquer opinião, emoção, preocupação ou reclamação que
tenham em relação aos produtos e serviços que utilizam. Na maioria das vezes, os consumidores estão
postando porque querem uma resposta de algum tipo do público em geral ou da própria empresa.

Este projeto tentará identificar se há uma ligação entre uma empresa com uma boa estratégia on-line e se isso
tem um efeito sobre sua reputação geral – e a quantidade de lucros obtidos – em comparação com os lucros de
empresas que usam as mídias sociais com menos frequência, ou talvez nem isso.

Na era digital moderna, com muitos compradores on-line pertencentes às gerações Millennial ou Gen-Z, as
empresas estão tentando aumentar suas posições nas mídias sociais, pois acreditam que uma boa presença nas
mídias sociais leva a um aumento no relacionamento, reputação e, portanto, um aumento nos lucros. O
projeto criará um conjunto de dados a partir de postagens nas redes sociais, analisará a positividade ou
negatividade da frase e transformará esses dados em visualizações para exibir as emoções dos públicos de
várias empresas.

1.2 Informações ao Cliente

O cliente deste projeto e relatório é um varejista de roupas de rua em ascensão. Eles estão determinando se
devem investir em uma presença on-line em uma tentativa de aumentar sua lucratividade, pois isso envolveria
a contratação de pessoal de atendimento ao cliente para monitorar as mídias sociais, fotógrafos para fazer
upload de postagens de alta qualidade, o que, portanto, exigiria muito tempo e dinheiro.

1.3 Aproximação

Este relatório começa discutindo uma revisão da literatura na Seção 2 e prossegue investigando produtos
similares que existem no mercado na Seção 3. Seguem-se as possíveis considerações jurídicas, sociais, éticas
e políticas na Seção 4, e uma discussão dos requisitos e da metodologia usada para o desenvolvimento na
Seção 5. A secção 6 concentra-se nos planos de concepção do projecto, a secção 7 demonstrará as etapas
tomadas durante cada fase do processo de desenvolvimento. A Seção 8 analisa o teste e a verificação das
capacidades do projeto, a Seção 9 é centrada na avaliação do projeto, bem como do Desenvolvedor. A secção
10 conclui com as conclusões do projecto global.

5
2 Seção 2: Revisão da Literatura
2.1 Abordagem da pesquisa bibliográfica

A pesquisa realizada para o projeto foi uma combinação de várias fontes online e físicas, para identificar
quaisquer tendências em Social Media Marketing/Social Customer Relationship Management, ou suposições
que já existem dentro do setor de mercado. Como a área de marketing de mídia social é um tópico
relativamente novo dentro da tecnologia, não há uma abundância de textos físicos amplos apoiando ou
negando qualquer argumento em relação a isso. De fato, muitos livros/textos físicos sobre o tema estão
focados nas fórmulas utilizadas para analisar os dados encontrados, em vez de opinar a favor ou contra o uso.
As fontes on-line, como revistas, artigos e outros sites, permitem obter material muito mais moderno, em
relação a uma maior variedade de opiniões e estudos nos últimos anos; Assim, a maioria das fontes e
materiais ao longo da revisão da literatura é on-line.

2.2 Identificando o problema

Dentro da sociedade moderna, tornou-se uma provação mensal testemunhar uma marca fazer um negócio
falso. A seguir:
1) A maioria dos meios de comunicação discutiria isso em detalhes.
2) O público, clientes ou não, então compartilha suas opiniões e indignações em suas mídias sociais
pessoais, ou nas mídias sociais da empresa.
3) A empresa provavelmente emitiria um pedido de desculpas e excluiria todas as evidências de tais
falsidades.
4) O mundo seguiria em frente.

Somente em 2018, o Snap Chat perdeu quase US$ 2 bilhões de celebridades que compartilharam seu novo
distain para a empresa em relação a algumas mudanças na interface do usuário, bem como alguns anúncios
antiéticos sendo aprovados (Bullock, 2018). O IHOP nos EUA perdeu milhões de dólares mudando sua marca
de IHOB para IHOP depois que a nova mudança de nome para "International House of Burgers" foi recebida
horrivelmente em todo o mundo, resultando em clientes e inúmeras empresas zombando deles por tentarem a
mudança (Tobin, 2018) (Roberts, 2018). Houve indignação em janeiro com as escolhas de modelos da H&M
em relação a moletons com temática animal em sua coleção infantil, resultando em perda de lucro, e
protestos/tumultos em algumas de suas lojas em toda a África do Sul (Fortin, 2018).

Desde o rápido desenvolvimento da tecnologia, a informação é significativamente mais fácil de descobrir nos
dias modernos do que era há apenas uma década, o que permitiu que o fenômeno global da mentalidade da
máfia se espalhasse. Isso significa que um erro de marketing que pode ter sido encoberto no passado, é
colocado sob o microscópio e analisado nos dias atuais. Essa mentalidade de máfia ou indignação tende a ter
um efeito contínuo na reputação de uma empresa e, portanto, todas as empresas devem ser especialmente
cautelosas com seu marketing e mídias sociais.

Classific Geração H (%) Milenar


ação da Marca Marca
Geração Classificar (%)
Z
1 Oreo 75.0 1 Nike 65.2
2 Nike 69.3 2 Hershey's 63.5
3 Hershey's 67.1 3 Amazona 62.6
4 Kraft Mac & Queijo 63.8 4 Oreo 60.3

5 Pequena Debbie 62.5 S Alvo 60.0

6
6 M&'s 61.3 6 M&'s 59.1
7 Amazona 59.3 7 Google 56.3

8 Sob Armadura 57.0 8 Heinz Ketchup 56.2


9 Levi's 56.0 9º PayPal 55.6

10 Maçã 55.2 9º A Face Norte 55.6

Gráfico 1. (YPulse, 2018)

Notavelmente, de acordo com uma Pesquisa sobre Confiança de Marca da YPulse, as marcas que têm os
maiores índices de fidelidade entre os Millennials/Gen-Z são aquelas que tendem a anunciar nas mídias
sociais e têm uma grande presença online, como Nike (Joseph, 2017), Oreo (O'flynn, 2017) e M&M's
(Marketing Week, 2018), bem como as marcas domésticas típicas, como Amazon e Apple.

2.3 Discussão Inicial

De acordo com (Edosomwan, Kalangot Prakasan, Kouame, Watson, & Seymour, 2011), "a mídia social pode
ser chamada de estratégia e um veículo para a transmissão, enquanto as redes sociais são uma ferramenta e
uma utilidade para se conectar com os outros", e se alinha com a visão comum de negócios de que "Se o
objetivo de uma empresa é alcançar os clientes onde eles estão, uma presença nas redes sociais parece
necessária." (Adams-Mott, 2018).

Esse consenso geral é o que tem levado as empresas a segmentar seus clientes on-line, usando aplicativos de
mídia social em vez de métodos tradicionais de publicidade, como em um jornal, no rádio ou na televisão. Por
exemplo, uma pesquisa mostrou que jovens de 17 a 35 anos pegam seus telefones de 50 a 75 vezes por dia
(Eadicicco, 2015), enquanto em um estudo divulgado pela Music Business Association, apenas 12% dos
jovensmillennials ouviam rádio e 51% ouviam serviços de streaming como Spotify ou Apple Music
(McIntyre, 2016).

Além disso, 67% dos Millennials pagam por 1-3 serviços de streaming como alternativa a pagar por televisão
a cabo ou assistir a canais de TV que exigem uma licença de TV, devido à liberdade que eles têm sobre o que
querem assistir, a falta de publicidade quebra por toda parte, tudo por um preço muito mais baixo do que a
família típica pagaria pela televisão a cabo (Arnold, 2017).

2.4 Gestão de Relacionamento com o Cliente

O Customer Relationship Management (CRM) tem existido como uma abordagem para gerenciar as trocas de
uma empresa com clientes atuais – e potenciais – usando análise de dados. Embora a ideia de sistemas de
marketing baseados no clientetenha sido discutida ao longo da década de 1980, amplamente trazida pelo
sistema de marketing de banco de dados de Robert e Kate Kestnbaum (CRM Switch, 2013), o primeiro
sistema criado com foco especializado em CRM não foi até a Siebel Systems em 1993.

Esse novo sistema e seus ideais foram bem recebidos pelos revolucionários, como (Gates, 1999) disse certa
vez "como você coleta, gerencia e usa informações determinará se você ganha ou perde". Essa ideia de coletar
e analisar informações, como tendências baseadas no cliente, abriu caminho para a Gestão de Relacionamento
com o Cliente que vemos hoje, ou seja, "Os clientes que se envolvem em uma conversa na página de marca de
mídia social de uma empresa esperam atenção e resolução para suas preocupações da empresa, assim como
fariam em um canal de CRM tradicional, como telefone ou e-mail". (Ajmera, Ahn, Nagarajan, Verma, &
Contratante, 2013). Devido a isso, pode-se argumentar que as interações de mídia social que você vê os
clientes tendo todos os dias com as empresas on-line é um dos usos mais eficazes do CRM nos dias atuais.

7
2.4.1 Benefícios do CRM com Social Media Marketing

Existem vários aspectos benéficos da Gestão de Relacionamento com o Cliente:


1) Ele permite que as empresas tratem cada cliente individualmente, em vez de como um grupo, devido à
coleta de dados pessoais exclusivos para cada pessoa.
2) Ele ajuda a gerenciar e centralizar os dados do cliente em um só lugar.
3) Ele ajuda a determinar quais aspectos do negócio estão funcionando bem e quais aspectos têm espaço
para melhorias a serem feitas.
4) Isso aumenta a produtividade dos funcionários, pois o sistema reúne as informações sobre os próprios
clientes e, portanto, tudo o que o funcionário precisa fazer é utilizar essas informações durante a
interação.

2.5 Social CRM

O Social Customer Relationship Management envolve o uso de serviços de mídia social e tecnologia para
permitir que as empresas se comuniquem melhor com sua base de clientes, como descobrir a quantidade de
tráfego na web, o número de "seguidores" em mídias sociais específicas, bem como a quantidade de menções
que uma empresa pode receber nesses sites (Castronovo & Huang, 2012). Enquanto o CRM tradicional foi
desenvolvido na década de 80, o Social CRM só começou a se tornar um tópico de conversa na última década
devido ao aumento de usuários nas mídias sociais ao longo desse período de tempo.

É importante notar, no entanto, que, enquanto o CRM tradicional se baseia em "coletar e gerenciar dados
atuais do cliente", o CRM Social é "mais uma estratégia para o engajamento do cliente", pois permite que as
empresas rastreiem as comunicações de vendas, bem como as interações nas mídias sociais. O Social CRM
ajudou a criar um caminho para clientes em potencial, conversando com eles em sua própria plataforma de
mídia social preferida, e os ajuda a compartilhar suas próprias experiências com milhares de outras pessoas
on-line (Rouse, 2017).

8
Juros de horas extras © •<>«

1 de janeiro de 2004 jun 1,2012

Gráfico 2. Google Tendências

2.6 Líderes atuais dentro do marketing de mídia social

A partir de outubro de 2018, as marcas 'High Street' que foram classificadas como "as mais bem-sucedidas
nas mídias sociais do Reino Unido", de acordo com a Red Hot Penny, são varejistas mais caras, como Nike,
Adidas, Tommy Hilfiger, Doc Martens e Marks Spencer. Essas marcas "demonstram que conhecem seu
público em todos os canais e podem envolvê-lo ativamente de forma natural". (Red Hot Penny, 2018). Isso
pode, no entanto, decorrer do "efeito bandwagon" (Coleman, 2003), já que as marcas são todas nomes
conhecidos de longo prazo, portanto, pode haver um leve viés. Isso deixa uma lacuna no mercado, ou seja, por
alternativas mais baratas, com as quais as empresas digitais podem se engajar.

Se você fosse investigar essas cinco empresas e excluir as duas com os preços mais altos (Tommy Hilfiger e
Doc Martens), as marcas têm cada uma mais de 30.000 tweets em seus respectivos Twitters de empresas. A
Nike (@nike), por exemplo, tem mais de 35.500 tweets, apesar de seus últimos quatro tweets postados (em
2019) terem sido dois meses antes, novembro de 2018. Isso ocorre porque sua conta no Twitter passa horas
respondendo aos tweets do Cliente, negativos ou positivos, para mostrar à sua base de clientes que eles estão
cuidando deles como uma forma de fidelizá-los.

Em uma escala muito maior, Marks & Spencer (@marksandspencer), tem mais de 416.000 tweets, e ao longo
de seu dia de trabalho (8h às 22h) responde a centenas de clientes, direcionando reclamações para sua caixa
de entrada de mensagens diretas ou endereços de e-mail para que as preocupações do cliente não passem
despercebidas, respondendo a comentários de elogios e informando os clientes sobre consultas gerais, como
horários de abertura da loja e quando os produtos provavelmente estarão de volta ao estoque.

9
Essas interações são o que tem possibilitado um bom nível de confiança em uma empresa para seus clientes e
são o que os inspira a incluir as mídias sociais do negócio em seu dia a dia, apesar de nunca ter conhecido a
pessoa do outro lado da tela, colocado simplesmente pelo Economic Times, "seu público se importa com você
se você for de alguma ajuda para eles" (Thiagarajan, 2018).

4) A REIA @SANDYJM12-47M V Philly @philippadixon -1h


11 6 ©MARKSANDSPENCER OMG! CHLOE ME MANDOU ESTILOS DE TRY IT TUESDAY E I N% HEART ©marksandspencer obrigado por fazer todos os seus doces de geleia (Percy e Colin)
THEM! EXCELENTE TRABALHO! veggie agora só fui em busca dos veggie e Io e eis que todos eles são EU APRECIO
TANTO XXX
Q1TOS
M&SQ ©MARCASAND SPENCER -45M V
M&S PRAZER EM SABER QUE ESSES FORAM UM SUCESSO SANDY! :D ATENCIOSAMENTE, JAKE
M&S Q ©marksandspencer -1h
EU Q 1 T O 1 0 M& Seja muito bem-vindo! :D Espero que você possa continuar desfrutando desses Philly!
Quais são os seus faves? - Jake
G), ARENOSO @SANDYJM12 37M V

* ' 6J COMPREI O VESTIDO SAFARI 9


EU Q I T O 0 Philly @philippadixon -1h
Eu vou ter que tentar todos eles para descobrir W W W 55
COMPUTADOR PESSOAL MSS» /. N
M&
©MARKSANDSPENCER
( SEGUIR )
X______________-
V Qi

Respondendo a @sandyjm12 M&S •


M& ©Marksandspencer
Yay! Estou satisfeito que você encontrou
algo que você gosta :D Obrigado pelo seu Respondendo a @philippadixon

tweet! :) - Jake Não coma todos de uma vez, você vai ficar doente ;)
16:02-9 Jan 2019
Tenha uma linda semana :) - Jake
1º Como ( 15:16-9 Jan 2019

Figuras 3 e 4. M&S Twitter

2.7 Redes Sociais

A parte mais imperativa do Social CRM é garantir que a empresa esteja usando as mídias sociais corretas para
alcançar seu público-alvo, "Há vários anos, a ideia de marketing de mídia social era principalmente limitada
ao Facebook e ao Twitter. Nos últimos anos, esse tipo de marketing se expandiu para incluir sites populares
como Pinterest, Instagram, Snapchat, YouTube e Tumblr." (Adams-Mott, 2018)

Para este projeto, três mídias sociais foram analisadas quanto ao seu potencial: Instagram, Facebook e Twitter.
O Instagram tende a ser comentários curtos, às vezes até emojis – o que é encorajado em sua seção de
comentários (Fingas, 2018) e, portanto, não fornece dados suficientes para analisar a análise de sentimento. O
Facebook contém recursos de desenvolvedor que permitem que os dados sejam gravados por meio de sua
Graph API, no entanto, desde a Cambridge Analytica/Facebook em 2018, o Facebook revogou o acesso a
todas as ferramentas usadas para raspar dados de grupos e páginas (Y, 2019), isso tornou incrivelmente difícil
obter acesso, pois você deve fornecer um protótipo funcional do seu programa antes que o Facebook conceda
acesso. Devido a isso, o Facebook não será usado para análise.

O Twitter sempre foi usado por empresas para suas análises, tanto que o Twitter desenvolveu seu próprio site
"Analytics" em 2014 (Edwards, 2014), também é o mais simples de raspar dados, pois permitem aplicativos
baseados em desenvolvedores web, além de ser o mais fácil de visualizar as opiniões dos usuários através da
interface do usuário do próprio site. Com seu recente aumento para 280 caracteres, o Twitter é a plataforma
perfeita para analisar as opiniões dos consumidores e, portanto, será a única plataforma de mídia social para
este projeto.

10
2.8 Melhores Épocas do Ano Potenciais para Investigar

Há vários momentos em um ano em que os clientes são mais propensos a comprar e, portanto, as empresas
são mais ativas nas mídias sociais e lançam estratégias de marketing na tentativa de atrair negócios. Pode-se
dizer que a melhor época do ano para investigar os sentimentos dos clientes em relação a um negócio é o
período festivo, pois é uma das principais épocas do ano em que as empresas competem pelas compras dos
consumidores britânicos, com o gasto médio de Natal aumentando ano a ano no Reino Unido, e os gastos
anuais do país chegando muito acima da média europeia (Clarke, 2017).

Em torno do período festivo, as mídias sociais são usadas para compartilhar a campanha ou anúncio de Natal
de uma empresa, e pode se tornar um evento anual para uma empresa, ou seja, o anúncio anual de Natal da
John Lewis, que começa a ganhar força a cada ano pelo menos um mês antes do anúncio ser lançado (Google
Trends, 2008). Outras épocas do ano em que o engajamento é maior são eventos como vendas de fim de
temporada, Black Friday, Dia dos Namorados, fim de semana da Páscoa e as férias de verão.

As empresas devem considerar o impacto desses eventos para alcançar o alcance ideal das mídias sociais em
seu setor de mercado. Na verdade, o analista de mídia social James Lovejoy afirmou: "ao ficar quieto ou não
prestar atenção ao que está acontecendo nas redes sociais, muitas marcas estão ficando cegas para como estão
sendo discutidas online e como as redes sociais as afetam". (Ilyashov, 2015).

2.9 Mineração de texto e análise de sentimento

O projeto usará mineração de texto para raspar informações do Twitter para análise. Como há tempo limitado
para que o projeto seja criado, o Machine Learning não pode ser usado, pois isso requer mais dados, bem
como dados de treinamento, portanto, as Regras Linguísticas são a escolha mais sensata. Há muitos benefícios
para as Regras Linguísticas, como análise rápida, dados irregulares fáceis de detectar e análise granular para
dividir os dados em seções menores, como frases ou palavras/emojis usados, todos os quais são benéficos para
um projeto dessa escala (Huddy, 2017).

Depois de minerar os dados, a análise de sentimento será usada para determinar se a sensação geral da
mensagem é positiva, neutra ou negativa, usando Python. Isso permitiria, então, uma conclusão sobre a
opinião geral de uma empresa por seus consumidores, o que, por sua vez, poderia levar a decisões estratégicas
de negócios/marketing; Pak e Paroubek explicaram bem isso, afirmando: "À medida que mais e mais usuários
postam sobre produtos e serviços que usam, ou expressam suas opiniões políticas e religiosas, os sites de
microblogs se tornam fontes valiosas das opiniões e sentimentos das pessoas. Esses dados podem ser usados
de forma eficiente para marketing ou estudos sociais." (Pak & Paroubek, 2010).

11
Quão bom é "bom"? Agora com ainda mais palavras!
Em uma escala de o a 10, onde o é 'muito negativo' e 10 é muito positivo', em geral, quão positiva ou
negativa seria a seguinte palavra/frase para alguém quando você a usasse para descrever algo?

Terrível abismal terrível terrível terrível


Muito ruim Lixo muito ruim
Insatisfatório Mau Pobre
Muito ruim
Muito ruim Um pouco ruim Abaixo da média Média medíocre Não é ruim
Justo
Tudo bem OK
Multa Satisfatória
Um pouco bom Muito bom Decente Acima da média Muito bom Bom ótimo
Muito bom Muito bom Incrível Fantástico Soberbo Brilhante Incrível Excelente
Destacado
Perfeito

12
YouGov
Gráfico 5. YouGov "Como é bom é bom?"
2.10 Conclusão

Após a revisão da
redação de Pontuaçã
diversas fontes o média
através de sites, 121
periódicos, etc., a 134
144
esmagadora
172
maioria do
175
material 176
encontrado 1.85
demonstra a 2.17
credibilidade do 2.48
desenvolvimento 2.60
271
do projeto, que
2.80
será levado 2.85
adiante em suas 3-16
etapas de 3.38
desenvolvimento. 4.29
Ao longo da 509
pesquisa foram 513
543
descobertas 548
informações em 551
torno da 5-70
perspectiva do 580
CRM, e além 582
disso a versão 6.48
moderna, o CRM 6.56
6.62
Social, bem como 6.76
seus benefícios. 6.92
As empresas com 776
as melhores 7.78
estratégias de 7.90
marketing online 8.44
8.74
nos últimos anos e 8.77
as vantagens de 8.77
usar diferentes 8.81
mídias sociais 8.95
para marketing 9.11
9.16
com base em sua
0123456789 10
base de clientes Muito negativo Muito positivo

também foram
analisadas.

13
A pesquisa confirmou que a mídia social ideal para levar adiante para análise é o Twitter, pois dá o maior
alcance ao consumidor, além de confirmar o uso de regras linguísticas para analisar o sentimento dos dados
coletados. A pesquisa também confirmou as melhores épocas do ano para completar o conjunto de dados para
este projeto, no entanto, pode não ser possível coletar dados nessas épocas, pois o cronograma do projeto é de
janeiro a abril, e se o projeto fosse criado usando dados do Período Festivo 2018, essas informações podem
estar desatualizadas até o prazo final do projeto. Portanto, os dados serão coletados quando o projeto atingir
esse ponto específico de desenvolvimento, estimado para março ou abril.

14
3 Seção 3: Pesquisa de Produtos

Como o marketing de mídia social ainda é um mercado emergente, existem vários outros produtos que
permitem que uma empresa revise seu alcance de mídia social, incluindo quantas pessoas olham, se envolvem
e falam sobre suas postagens.

Os Critérios de Usabilidade do Projeto afirmam:


1) O usuário deve ser capaz de acessar postagens do Twitter.
2) O usuário deve ser capaz de ver a Análise de Sentimento em relação a essas postagens.
3) O usuário deve ser capaz de visualizar as visualizações de dados dessas descobertas.

3.1 Gorjeio

Um exemplo disso é o próprio "Twitter Analytics" do Twitter, ao qual todos têm acesso dentro do site do
Twitter. Isso permite que os usuários investiguem o "número de impressões", o "número de engajamentos" e a
"taxa de engajamento (impressões divididas por engajamentos)" por Tweet enviado, bem como quantas
pessoas clicaram no próprio Tweet, clicaram no perfil depois de ver o Tweet e "retweetaram", responderam e
"curtiram".

<7X UNIVERSIDADE DE 49 GREENWICH 1


Índice 3
1 Secção 1: Introdução 5
2 Seção 2: Revisão da Literatura 6
Quão bom é "bom"? Agora com ainda mais palavras! 12
YouGov 13
3 Seção 3: Pesquisa de Produtos 15
3.4 Modelo de Pontuação Ponderada 18
4 Seção 4: Questões e Considerações Legais, Sociais, Éticas e Profissionais 19
5 Seção 5: Requisitos e Metodologia 20
5.5 Metodologia 21
5.6 Justificação da adequação de uma Metodologia ou de um Quadro seguido 23
6 Projetar 23
6.1 Diagrama de caso de uso UML 23
7 Processo de Desenvolvimento 25
7.1 Estágio 1: Busca inicial de código Python 25
7.2 Etapa 2: Implementação da Análise Semântica 29
7.2.1 Iteraçã o 1 29
7.2.2 Iteraçã o 2 29
7.2.3 Iteraçã o 3 29
7.3 Estágio 3: Agrupando os dados no Excel 30
7.4 Etapa 4: Criando visualizações de dados 31
7.5 Caixa de Tempo 34

15
7.6 Potenciais abordagens alternativas 34
8 Teste 35
9 Avaliação 36
9.1 Avaliação do Produto 36
9.2 Auto-Avaliação 37
10 Conclusão 39
10.1 Conclusões sobre Reputação 39
10.2 Conclusões relativas à Rentabilidade 42
11 Bibliografia 43
12 Apêndices 45
12.1 Apêndice A: Figuras 45
12.2 Apêndice B: Relatório contextual 46
12.3 Apêndice C: Código do Notebook Python Jupyter 47
12.4 Apêndice D: Código de Análise Semântica 48
12.5 Apêndice E: Fórmulas de planilha do Excel 51
12.6 Apêndice F: Visualizações de dados do Tableau 53
:o 54
12.7 Apêndice G: Ensaios 57

Gráfico 6. Análise do Twitter

Embora isso forneça uma análise detalhada em Tweets individuais – e se o usuário tiver uma conta Business
ativada permite que ele veja o engajamento de todos os seus tweets combinados – o Twitter Analytics não
permite nenhuma forma de análise de sentimento, pois é limitado a métricas quantitativas em vez de
qualitativas.

Embora seja possível usar a "pesquisa avançada" do Twitter neste caso para procurar palavras-chave para
análise de sentimento, isso é complicado e tedioso, pois o desenvolvedor teria que vasculhar todas as palavras
possíveis que gostaria de pesquisar e formar manualmente o resultado geral dos diferentes resultados.

3.2 Hootsuite Insights

Outro produto que pode ser percebido como semelhante ao Projeto é o Hootsuite Insights, uma função
adicional da ferramenta de análise Hootsuite. Essa ferramenta de análise fornece um detalhamento de
diferentes medidas, como número de menções por site de rede social, geodistribuição, idioma, gênero e o
sentimento médio das mensagens em relação à empresa.

A Hootsuite também permite que a empresa conecte suas contas para mais de 35 redes sociais, como
Facebook, Twitter, YouTube, Google+, LinkedIn, Instagram e Pinterest; não há dúvida de que a Hootsuite é
líder de mercado em Análise de Redes Sociais.

Apesar disso, existem três desvantagens concebíveis para o produto da Hootsuite que não se encaixam nos
requisitos de usabilidade para o Projeto em Desenvolvimento, a primeira é que eles não permitem a
visualização de estatísticas de outras empresas; a maioria dos números que eles oferecem ao Usuário, eles

16
devem estar conectados para visualizar. Além disso, o segundo é o custo do sistema de comercialização; a
capacidade de olhar para "Custom analytics", ou seja, análise de sentimento, faz com que o custo por mês para
seus serviços aumente vertiginosamente de £ 25 por mês para £ 99, o que, dependendo da liquidez do negócio
e de seus gastos, pode estar fora de questão. Finalmente, a terceira desvantagem é semelhante à da Pesquisa
Avançada do Twitter, de modo que, se a empresa quiser investigar a Análise de Sentimento, ela deve inserir
as palavras, frases e emojis que deseja pesquisar por si mesma, em vez de o produto ter um banco de palavras
positivas, neutras e negativas que o sistema poderia buscar imediatamente.

Gráfico 7. Hootsuite Insights

3.3 Semantria para Excel por Lexalytics

A Semantria foi fundada em 2011 em um esforço para tornar a Análise de Sentimento disponível para
públicos mais amplos. A ideia do negócio é analisar a polaridade das postagens de mídia social em relação à
empresa usando extração e categorização de entidades, o que significa que a empresa pode obter uma exibição
aprofundada das emoções dos clientes em relação a eles.

17
Contagem de Polaridade de Categoria de Usuário I
Categoria do Usuário Negativo neutro Total Geral positivo
Hotéis 1 49 37 87
Alimento 2 35 30 67
Atendimento 2 34 26 62
Imóveis 20 16 36
Viajar 1 17 17 35
Tecnologia 4 18 11 33
Software e Internet 2 21 6 29
Arte 1 10 3 14
Jogos eletrônicos 8 5 13
Governo 10 2 12
Casamento 1 8 2 11
Bebidas 1 6 3 10
Saúde 6 4 10
Banheiro 1 4 4 9
Sítio Web 7 1 8
Espaço 1 5 1 7
Lei 2 3 5

Gráfico 8. Lexalíticos

Os benefícios de usar Semantria em oposição ao Hootsuite ou Twitter Analytics é que Semantria é dito para
analisar não apenas as palavras individuais em uma frase, mas também a essência da frase como um todo para
permitir uma análise mais profunda. Isso é útil com a Análise de Sentimento, pois captura momentos em que
as postagens nas mídias sociais podem ter sido escritas de forma sarcástica, o que é típico nos dias atuais.

Embora o Semantria tenha muitas qualidades benéficas como um produto de análise de mídia social, o layout
da ferramenta é particularmente básico, oferecendo apenas nomes de categorias e o número de respostas
relacionadas a ele. Por esta razão, o Semantria não atende aos Critérios de Usabilidade mínimos para o
Projeto, pois não fornece nenhuma forma de visualização de dados, como gráficos ou tabelas, o que tornaria
as informações muito mais fáceis de ler e compreender.

3.4 Modelo de Pontuação Ponderada

Um modelo de pontuação ponderada foi desenvolvido para investigar a usabilidade geral desses três produtos,
considerando os Critérios de Usabilidade. Os critérios mais importantes foram considerados para navegar no
conjunto de dados, e visualizar visualizações de dados e estes permitem o maior contato com os dados, no
entanto, filtrar e classificar os dados também recebeu um grande peso dentro do modelo.

Pontuação de Requisitos
Critérios Peso Gorjeio Hootsuite Insights Semantria
Procurar conjunto de 30% 100 50 0
dados
Classificar dados por 10% 30 50 50
emoção
Classificar dados por 5% 0 60 0
tempo
Classificar dados por 5% 0 50 0
Classificar dados por 10% 100 0 25
empresa
Filtrar dados por 10% 100 100 60
palavra ou frase
Exibir visualizações 30% 0 60 0
de dados
Escores Ponderados 100% 53 51 13.5

Para concluir, embora todos os programas mencionados tenham seus próprios benefícios para uso, nenhum
deles cobre todos os três critérios de usabilidade, como mostrado no modelo de pontuação ponderada por
nenhum dos produtos encontrados durante a pesquisa de produtos resultando em mais de 55/100, daí porque o
Projeto que está sendo criado se destaca sozinho em seu campo.

18
4 Seção 4: Questões e Considerações Legais, Sociais, Éticas e
Profissionais

Como acontece com qualquer projeto que está sendo criado on-line, o desenvolvedor deve levar séria
consideração em relação a quaisquer possíveis problemas que possam surgir desde o seu início. O
Regulamento Geral de Proteção de Dados (RGPD) que entrou em vigor em maio de 2018 deve ser levado em
conta, pois o objetivo do projeto é coletar dados de indivíduos sem informá-los. No entanto, como os sites de
Redes Sociais estão cientes de que muitas empresas coletam dados de seus sites para marketing e outros fins,
está escrito nos Termos e Condições desses sites que os dados do Usuário podem ser coletados. Apesar disso,
ainda é social e eticamente ambíguo coletar dados de pessoas para esses fins sem informá-las sobre isso, pois
a grande maioria do público nunca lerá os Termos e Condições (Cakebread, 2017).

Devido ao recente escândalo envolvendo o Facebook e a Cambridge Analytica, o Facebook e muitas outras
mídias sociais reforçaram sua segurança envolvendo aplicativos feitos por usuários de terceiros. Esse
movimento foi iniciado de boa-fé porque eles queriam proteger os dados de seus consumidores, no entanto,
isso significa que tornou muito mais difícil extrair dados desses sites; sendo o Facebook o processo mais
demorado para obter a autorização para coletar isso, mesmo que o aplicativo esteja sendo criado para fins
científicos ou educacionais.

A Lei de Proteção de Dados de 2018 é a implementação específica do GDPR no Reino Unido, que controla
como as informações pessoais de uma pessoa são usadas por organizações ou empresas. Por exemplo, uma
empresa deve garantir que as informações pessoais sejam "usadas de forma justa, legal e transparente",
"usadas para fins especificados e explícitos" e "mantidas por não mais do que o necessário" (Gov.uk, 2018).

Poderia ser considerado legal, social, eticamente e profissionalmente elusivo no interesse deste projeto, como
é altamente improvável que o desenvolvedor entre em contato com o proprietário de cada conta para receber
permissão para usar suas postagens de mídia social. Se uma pessoa entrasse em contato com um site de mídia
social para ter seus dados apagados, o que está bem dentro de seus direitos desde que a GDPR foi
implementada, ela não saberia se seus dados foram usados por qualquer outra parte sem sua permissão,
portanto, suas informações ainda podem existir apesar da pessoa exercer seu "direito de ser esquecida" (Art.
17 GDPR).

Existem considerações profissionais que devem ser levadas em conta, nas quais os dados específicos
coletados abrigam as opiniões do cliente sobre vários concorrentes para a marca do usuário. Essas
informações não devem ser visualizadas por nenhum funcionário que não tenha necessidade de visualizá-las,
pois os dados brutos coletados usando o código Python podem incluir nomes de usuário, nomes e locais, e
outras informações pessoais que as mídias sociais coletam em seus Usuários.

19
5 Seção 5: Requisitos e Metodologia

5.1 Análise de Requisitos

Como o Projeto não suscita Partes Interessadas de terceiros, onde um sistema pode ter estabelecido seus
requisitos por meio de pesquisas e questionários, o Desenvolvedor não conseguiu. Devido a isso, os
Requisitos resultaram principalmente de discussões com os clientes, bem como da investigação dos Sistemas
da Concorrência e da descoberta dos aspectos que o Desenvolvedor acredita que eles poderiam ter adicionado
para promover seus programas.

5.2 Comparação de sistemas

Para coletar os dados do Twitter, a melhor solução é usar uma combinação de aplicativos de terceiros e
Python, o que permite ao desenvolvedor coletar os dados exatos de que precisa e negar quaisquer partes do
arquivo que considere desnecessárias.

Depois de coletar os dados, eles precisam ser exportados, isso permite que o desenvolvedor examine o
conjunto de dados e encontre quaisquer anomalias, além de garantir que os dados tenham sido coletados
corretamente. A melhor solução possível para isso é usar o Excel para criar as fórmulas para a Análise de
Sentimento, antes de carregar os dados em uma ferramenta de visualização de dados, como o Tableau.

5.3 Requisitos funcionais

Os requisitos funcionais para este projeto são os seguintes:


1) Os usuários são capazes de navegar facilmente o conjunto de dados completo (ou seja, postagens de
mídia social)
2) Os usuários podem classificar os dados por tempo
3) Os usuários podem classificar os dados por emoção
4) Os usuários podem classificar os dados por gênero
5) Os usuários podem classificar dados por empresa
6) Os usuários podem filtrar dados por palavras específicas
7) Os usuários podem editar e remover dados
8) Os usuários podem visualizar uma variedade de visualizações de dados pré-feitas para dados
9) Os usuários podem criar suas próprias visualizações de dados para dados
10) Os usuários podem exportar suas visualizações de dados individualmente
11) Os usuários podem exportar suas visualizações de dados como um todo
12) Os usuários podem carregar conjuntos de dados para análise
13) O desenvolvedor é capaz de carregar conjuntos de dados para análise

5.4 Requisitos não funcionais

Os requisitos não funcionais para este projeto são os seguintes:


1) Os dados devem ser mantidos de forma segura
2) O projeto deve funcionar sem problemas com interrupções mínimas
3) O projeto deve atualizar-se se quaisquer novos dados forem adicionados ao conjunto de dados
4) Os Dados individuais de uma pessoa devem poder ser eliminados, se solicitado
5) O projeto deve ser amigável

20
Uma tabela MoSCoW deve ser fornecida para formar a ordem de prioridade para os requisitos
estabelecidos. Estes são divididos em "Deve ter", "Deveria ter", "Poderia ter" e "Não terá (desta
vez)".

Não Requisito. Moscovo?


.1) Os usuários são capazes de navegar facilmente o conjunto de dados completo Deve ter
(ou seja, postagens de mídia social)
2) Os usuários podem classificar os dados por tempo Deve ter

3) Os usuários podem classificar os dados por emoção Deve ter

4) Os usuários podem classificar os dados por gênero Poderia ter

5) Os usuários podem classificar dados por empresa Deve ter

6) Os usuários podem filtrar dados por palavras específicas Deve ter

7) Os usuários podem editar e remover dados Poderia ter

Os usuários podem visualizar uma variedade de visualizações de dados pré-


8) Deve ter
feitas para dados

9) Os usuários podem criar suas próprias visualizações de dados para dados Deve ter

10) Os usuários podem exportar suas visualizações de dados individualmente Deve ter

11) Os usuários podem exportar suas visualizações de dados como um todo Deve ter

12) Os usuários podem carregar conjuntos de dados para análise Não terá

13) O desenvolvedor é capaz de carregar conjuntos de dados para análise Poderia ter

A quantidade de requisitos "Must have" priorizados nunca deve ser superior a 60%, dentro deste
projeto existem 6 "Must have" e 13 requisitos totais o que dá uma porcentagem de 46%, com os
requisitos "Should have" obrigando outros 23%. Consequentemente, não deve haver preocupações
em relação ao momento deste Projeto.

5.5 Metodologia

Para que a maioria dos projetos seja bem-sucedida, a equipe do projeto deve seguir uma metodologia
adequada durante toda a sua criação. O projeto será desenvolvido utilizando uma metodologia iterativa
DSDM Atern; isso se deve em grande parte aos oito princípios da DSDM Atern que se conectam com os
ideais do programa:

Princípio 1. "Foco na necessidade do negócio"

21
Como o projeto diz respeito especificamente a uma empresa e ao que eles querem descobrir sobre uma
conexão entre o uso de mídias sociais e reputação/lucros, ele se relaciona muito com o primeiro princípio do
DSDM "Foco na Necessidade do Negócio". Os programadores precisarão de comunicação e feedback
constantes entre si e a empresa para avaliar os requisitos, além de estabelecer um entendimento mais profundo
sobre o que o negócio precisa, predominantemente por meio da técnica MoSCoW.

Princípio 2. "Entregar no prazo"

Outro princípio da Atern, "Entregar no Prazo", é relacionável com o projeto, pois há um prazo estrito de 29 de abril

para que o projeto e os relatórios sejam escritos e concluídos. Isso pode ser alcançado principalmente através
da definição de prazos conscientes para manter o projeto progredindo fluidamente e com foco nas prioridades
de negócios durante todo o processo.

Além disso, outro aspecto do DSDM que diz respeito ao tempo é a "regra 80:20". Como o projeto se
concentra na coleta de dados das mídias sociais, isso pode ser considerado como uma grande porcentagem do
projeto geral, portanto, é provável que 80% do projeto possa ser concluído em 20% do tempo, e os 80%
restantes do tempo possam ser usados para adicionar detalhes finos e aumentar a funcionalidade.

Princípio 3. "Colabore"

Trabalhar em equipe durante todo o projeto, e incluindo a entrada e feedback do cliente, garante que o melhor
projeto possível seja criado. Isso permite:

1) Uma maior compreensão da tarefa em questão e do resultado esperado.


2) Maior velocidade em que o resultado é alcançado.
3) Uma propriedade compartilhada entre os criadores do projeto e os clientes.

Para garantir que isso seja alcançado, o líder do projeto deve envolver ativamente todos na equipe para formar
uma mentalidade de "equipe única", bem como capacitá-los a tomar decisões sobre o projeto.

Princípio 4. "Nunca comprometa a Qualidade"

Este princípio estabelece que o nível de qualidade para o qual o projeto deve ser concluído deve ser acordado
no início do planejamento, e todo o trabalho concluído garante que esse nível seja atingido.

O Gerente de Projeto deve, consequentemente, definir o nível de qualidade previsto no início da formação do
projeto e garantir que a qualidade não se torne uma variável eventual. Além disso, eles devem garantir o teste
do projeto no início do desenvolvimento e continuamente depois, o que pode ser realizado por meio de vários
métodos, como testes de funcionalidade, usabilidade ou desempenho.

Princípio 5. "Desenvolver iterativamente"

Da mesma forma que o princípio quatro, o princípio cinco se concentra no desenvolvimento e teste do projeto
por meio de um estilo de desenvolvimento iterativo. Para conseguir isso, o gerente de projeto, enquanto
desenvolve iterativamente, deve garantir e confirmar continuamente que o sistema correto está sendo
construído. Então, se necessário, altere o desenvolvimento do projeto para garantir que ele esteja alcançando a
melhor produção possível, passando a experimentar e evoluir o projeto.

Princípio 6. "Construir incrementalmente a partir de bases sólidas"

22
O princípio seis refere-se diretamente aos benefícios do negócio, pois implica que a construção incremental
permite que o projeto seja liberado mais cedo para o Cliente, o que a partir de agora permite que os
desenvolvedores entendam o escopo do negócio e relacionem as atualizações potenciais aos seus requisitos
operacionais.

Isso é possível estabelecendo uma grande quantidade do projeto antecipadamente antes do início do
desenvolvimento, além de se esforçar para uma entrega antecipada do produto final. É essencial que o
desenvolvedor se concentre no que ele quer que seja produzido – em vez de como ele planeja chegar a ele –
ao longo disso.

Princípio 7. "Comunique-se de forma contínua e clara"

Como a má comunicação é frequentemente citada como a maior causa individual de fracasso do projeto, as
técnicas e princípios associados ao DSDM Atern são concebidos para melhorar a comunicação entre os
membros da equipe de desenvolvimento para garantir um modelo de negócios bem-sucedido.

A maneira superlativa de o Gerente de Projetos garantir que esse princípio seja mantido é garantindo
atividades que incentivem a comunicação efetiva entre a equipe, como organizar workshops e solicitar
documentação presencial. Além disso, a interação entre a equipe e os acionistas, tanto formal quanto informal,
é imprescindível. Isso pode ser completado mantendo a documentação, como itinerários.

Princípio 8. "Demonstrar controle"

O princípio final implica que a equipe esteja no controle do projeto em todos os momentos. Isso é conseguido
sendo proativo ao monitorar e controlar o progresso feito com o projeto, além de ser capaz de provar a
qualquer momento que eles estão no controle. Isso deve ser estabelecido em toda a equipe, usando níveis
adequados de formalidade no dia a dia para garantir o procedimento, bem como gerenciar contratos e outras
necessidades de negócios de acordo.

5.6 Justificação da adequação de uma Metodologia ou de um Quadro seguido

A principal razão pela qual a DSDM Atern foi escolhida como metodologia para esta operação é que o projeto
está em conformidade com muitos de seus princípios, como "foco na necessidade do negócio" e "entregar no
prazo". A utilização dessa metodologia garante a criação de um produto específico, que é estabelecido pelas
necessidades do negócio, bem como datas precisas para a conclusão de cada aspecto do projeto. A grande
quantidade de planejamento e detalhes que o DSDM incentiva certifica que o projeto seria concluído no
prazo.

6 Projetar
6.1 Diagrama de caso de uso UML
O diagrama de caso de uso ilustrado abaixo (Figura 9.) demonstra as várias ações que um usuário pode
concluir por meio do código, bem como as limitações. Como mostrado abaixo, um Ator (Usuário) é capaz de
'Input Query' para o código a ser pesquisado, 'Listar' os dados, o que inclui ser capaz de visualizar uma lista de
Tweets, bem como permitir a exportação dos dados do programa para um arquivo .csv. Eles também devem
ser capazes de encerrar o programa.

23
Gráfico 9. Draw.io

24
7 Processo de Desenvolvimento

7.1 Estágio 1: Busca inicial de código Python

Durante o primeiro estágio de desenvolvimento, a tarefa principal foi escrever o código que permitiria ao
Cliente recuperar um número definido de tweets do Twitter que incluíssem uma determinada palavra ou frase,
decidida pelo Cliente. Para fazer isso, um aplicativo do Twitter é necessário. A partir de novembro de 2017, o
Twitter exigiu que todos os usuários criassem uma conta de desenvolvedor do Twitter para criar um
aplicativo, no qual eles devem concordar com vários requisitos legais e éticos e especificar a natureza do
aplicativo que estão criando (Roth, 2018).

Apps > Mining Demo UoG

Detalhes do aplicativo Permissões de chaves e tokens

Detalhes do aplicativo

Ícone do aplicativo

O ícone do aplicativo é padrão, clique em editar para carregar.

Nome do aplicativo

Mineração Demo UoG

Descrição

Minere dados de tweets públicos que incluem palavras-chave (nomes de empresas) ou hashtags

URL do site

https://twitter.com/

Entrar com o Twitter

Desactivado

URL de retorno de chamada

Nenhum

URL dos Termos de Serviço

URL da política de privacidade

Nome da organização

URL do site da organização

Uso do aplicativo

App será usado para extrair dados para uso pessoal para um projeto de conclusão de curso da Universidade. Só será usado para descobrir tweets que #
ou escrever o nome de uma empresa para encontrar a opinião geraldo público. Isso (no projeto) será então comparado com a lucratividade da empresa
para ver se há uma ligação entre a atividade online, a reputação e o lucro.

Figura 10. Desenvolvedores do Twitter, 'Detalhes do aplicativo'

Ao longo do processo de candidatura foi reiteradamente afirmado que a Aplicação iria ser desenvolvida para
fins Educativos, pois isso aumenta as suas hipóteses de aprovação. Agradavelmente, o Aplicativo foi

25
aprovado dentro de cinco minutos após seu envio e, em seguida, recebeu várias chaves de API e tokens de
acesso para permitir que um pedaço de código acesse o Twitter por meio de um sistema de terceiros, neste
caso, o Jupyter Notebook.

Apps > Mining Demo UoG

Detalhes do aplicativo Chaves e tokens Permissões

Chaves e tokens

Chaves de API do consumidor

Revogar J Regenerar

Gráfico 11. Twitter Developer, 'Chaves e tokens' (Chaves e tokens editados)

Uma vez que o aplicativo tivesse sido aprovado e pudesse coletar dados do Twitter, as chaves e tokens
poderiam ser implementados dentro do código. De acordo com o sexto princípio do DSDM, "Build Iteratively
from Firm Foundations", a base para o projeto foi escrever o código que buscava os dados do Twitter, garantir
que funcionasse e recuperar os tipos de dados necessários (como tweet inteiro, tempo e nome de usuário) e,
em seguida, implementar o fator de análise de sentimento.

Para ajudar na criação deste projeto, foi importada uma biblioteca Python baseada no Twitter, Tweepy ("bliti",
2019), que permite fácil acesso aos Tweets por meio da API do Twitter. A Tweepy oferece um grande número
de trechos de código e tutoriais em sua documentação, o que ajuda milhares de pessoas a usar seu sistema para
simplificar o código no qual os dados são solicitados ao Twitter, além de especificar as variáveis exatas
necessárias. O código do usuário do github ritvikmath também foi usado como estrutura para buscar os
Tweets ( ritvikmath , 2018).

O código inicial para esta etapa do projeto foi projetado para verificar a linha do tempo do desenvolvedor
como precaução para garantir que o código estava funcionando – isso sendo possível por meio do recurso
'célula' do Jupyter Notebook – antes de permitir que o usuário insira uma palavra ou frase. O programa irá
então pesquisar os 100 tweets mais recentes que incluem essa consulta e enviá-los na tela para o usuário
navegar, antes de exportá-los em um arquivo de .csv com o nome do usuário escolhido.

Iterações
Iteração Data Código Resultado
1 24/2/19 Importar CSV Falhar

# Criando o objeto API ao passar informações Loop infinito dos 17


de autenticação tweets mais recentes
api = tweepy. API(auth)

# Abrir/Criar um arquivo para acrescentar dados


csvFile = aberto('asos3.csv', 'a')

# Usar o gravador csv

26
csvWriter = csv.writer(csvFile)

# Chamando a função user_timeline com nossos


parâmetros
resultados = api.search(q=query,
lang=language)

contador = 0

enquanto contador != 500:


Para tweetar nos resultados:
if (não tweet.retweeted) e ('RT @' não
em tweet.text):
#Write uma linha para o arquivo csv / Eu
uso codificar utf-8
csvWriter.writerow([tweet.created_at,
tweet.user.screen_name, tweet.text])
contador +=1

csvFile.close()
2 25/2/19 Importar CSV O sucesso, no
entanto, remove
# Criando o objeto API ao passar informações emojis
de autenticação
api = tweepy. API(auth)

# Abrir/Criar um arquivo para acrescentar dados


csvFile = aberto('asos5.csv', 'a')

#Use Escritor csv


csvWriter = csv.writer(csvFile)

# Chamando a função user_timeline com nossos


parâmetros
Resultados = api.search(q=query,
lang=language, count=100)

Para tweetar nos resultados:


if (não tweet.retweeted) e ('RT @' não em
tweet.text):
#Write uma linha para o arquivo csv / Eu
uso codificar utf-8
csvWriter.writerow([tweet.created_at,
tweet.user.screen_name, tweet.text.encode('utf-
8')])

csvFile.close()

3 25/2/19 Importar CSV Êxito

# Criando o objeto API ao passar informações


de autenticação
api = tweepy. API(auth)

# Abrir/Criar um arquivo para acrescentar dados


csvFile = aberto('asos3.csv', 'a')

27
#Use Escritor csv
csvWriter = csv.writer(csvFile)

# Chamando a função user_timeline com nossos


parâmetros
resultados = api.search(q=query,
lang=language, count=500)

Para tweetar nos resultados:


if (não tweet.retweeted) e ('RT @' não em
tweet.text):
#Write uma linha para o arquivo csv / Eu
uso codificar
UTF-8
csvWriter.writerow([tweet.created_at,
tweet.user.screen_name, tweet.text])

csvFile.close()

Embora o código tenha sido parcialmente escrito por Tweepy, havia várias linhas que tiveram que ser
alteradas, adicionadas ou removidas, pois não se encaixavam na especificação do projeto que estava sendo
criado. A parte mais essencial disso envolveu a exportação dos tuítes. Acredita-se que, especialmente nos dias
atuais nas mídias sociais, grande parte da análise semântica é baseada em emojis e emoticons usados pelo
público. Como tal, o código relativo à exportação de tweets para um arquivo .csv teve que ser editado para
garantir que não houvesse qualquer formatação dentro do processo que removesse os emojis, ou os tornasse
ilegíveis por uma planilha.

Houve um problema inicial ao abrir os documentos criados pelo programa. O Excel foi necessário para criar
as fórmulas necessárias para analisar os tweets adequadamente, no entanto, não é capaz de ler emojis de um
arquivo .csv. Como o programa foi desenvolvido usando um MacBook, no entanto, o desenvolvedor também
teve acesso ao Numbers do pacote iWorks pela Apple. Abrir os arquivos .csv no Numbers e exportá-los para
um arquivo .xlsx para depois abrir no Excel foi uma solução perfeita para isso, pois .xlsx arquivos também
podem ser usados no software Data Visualisation.

Gráfico 12. Abrindo um arquivo .csv no Excel


@boohoo 2019-04-10 16:19:06 Helenbrzzz
https://t.co/rSACWgxIWp
@boohoo 2019-04-10 16:17:25 Krtaaa93 @ boohoo Esquerda

@boohoo 2019-04-10 16:14:22 DanWarren1982 @afcjohnboy @DannyBrookerS @ boohoo E uma guia de barra de £ 705

@boohoo 2019-04-10 16:11:06 FerozFabRev


Estive à procura de uma jaqueta nova para idades & encontrei o perfeito no ©boohoo A busca finalmente acabou. V
@booboo 2019-04-10 16:11:00 TNEZ ©boohoo É quarta-feira rapazes

@boohoo 2019-04-10 16:10:50 gravesO3 ©boohoo Esquerda ev

@boohoo 2019-04-10 16:10:43 Missouriano51 ©boohoo Certo, por favor

@boohoo 2019-04-10 16:05:13 Devynnaomi


Meu primeiro pacote de ©boohoo veio no correio 5
@boohoo 2019-04-10 1601:34 LucyPurtFace Atualmente editando como uma mulher louca para obter este ©vídeo boohoo maternidade haul até hoje à noite no meu canal. Link será... https ://t.co/qf5oVe Toqe

@booboo 2019-04-10 15:58:43 Y8Meenz ©boohoo por que boohoo repetidamente bagunçar meu pedido
©@shellbabes96 boohoo Hey Shell, desculpe ouvir isso! Você pode me enviar o número do seu pedido via mensagem direta e eu vou... Disponível em:
@boohoo 2019-04-10 15:54:33 boohoo cshelp
https:/t.co/Yw1nKBhf6Q
©boohoo eu recebi o meu pedido hoje que eu quero devolver eu não consigo encontrar o meu número de ordem você pode enviá-lo para mim por favor ... Disponível
@boohoo 2019-04-10 15:53:32 Shelly41
em: https:/t.co/bDIYhc4JRH
@boohoo 2019-04-10 15:46:53 Duck_Face_79
©boohoo Direito •
@boohoo 2019-04-10 15:44:12 Manni_K28 ©boohoo Esquerda

@boohoo 2019-04-10 15:38:45 Donnababy99 ©boohoo Esquerda v

28
Gráfico 13. Abrindo o mesmo arquivo .csv no Numbers

7.2 Etapa 2: Implementação da Análise Semântica

7.2.1 Iteração 1

O próximo estágio de desenvolvimento foi escrever o código necessário para escanear cada tweet individual e
dar-lhe uma classificação de dez, dependendo de quão positivo ou negativo o tweet parecia. Usar Python para
codificação rapidamente se tornou um incômodo devido à falta de um recurso de "caso" ou "switch" que a
codificação em Java ou C++ teria possuído.

Embora não seja particularmente atraente esteticamente, a decisão foi tomada para utilizar várias declarações
"se" que verificariam cada tweet individualmente dentro do .csv "para loop" e procurariam diferentes palavras
comuns que pudessem aparecer. Essas palavras foram estabelecidas inicialmente através do YouGov "How
Good is Good?" Diagrama (Figura 5.), referenciado na Seção 2 do relatório, então construído com vários
artigos sobre o sentimento dos emojis (Novak, Smailovic, Sluban, & Mozetic, 2015), (Lim, 2018) e
(Brandwatch, 2019).

7.2.2 Iteração 2

Depois de criar a base inicial para o código, ele foi executado várias vezes. Qualquer tweet que não estivesse
dando uma classificação semântica era analisado para ver qual linguagem era usada e o contexto em que era
usada, o que permitia ao desenvolvedor aumentar a linguagem a ser analisada no futuro.

Outra questão destacada foi que muitos emojis que não foram mencionados em nenhum dos artigos de
pesquisa não estavam sendo classificados. Usando um site que conta cada vez que um emoji é usado em um
tweet (emojitracker, 2019), o desenvolvedor analisou os trinta principais emojis que estão sendo usados em
todo o mundo e visualizou várias centenas de tweets por emoji para analisar o contexto geral de quando esse
emoji é usado, antes de implementá-los no código.

Uma vez implementados, um grande número de Tweets amostrados retornaria com um valor semântico
anexado. No entanto, ao refletir sobre os dados amostrados dos arquivos .csv, descobriu-se que o verdadeiro
contexto dos Tweets muitas vezes se tornava mal interpretado, pois o código nem sempre podia determinar o
resultado implícito da mensagem.

Exemplos incluem o código que classifica um Tweet como negativo devido ao emoji escolhido pelo usuário,
mesmo que a linguagem usada ao lado dele tenha sido de fato positiva. Em outro caso, o código teve
dificuldades para determinar se o feedback era positivo ou negativo, devido à linguagem conflitante usada. O
código valorizou os emojis usados como 5/10, uma pontuação indiferente e despreocupada, enquanto a
linguagem escolhida mais tarde no Tweet marcou um 8/10 ou 9/10 muito mais positivo.

7.2.3 Iteração 3

Devido a esses tweets com vários significados potenciais "escapando pelas rachaduras", foi decidido que o
código deveria ser editado para resumir o valor de cada palavra, frase ou emoji/emoticon usado.

Por exemplo, com o tweet:

" Obrigado @hm por vender esta camiseta incrível &^^V Totalmente apaixonado https://t.co/50tfmtlwNU"

O emoji tem um valor de 5, pois pode ser usado em um sentido positivo ou negativo, o emoji de coração tem
um valor de 8, e a palavra 'amor' tem um valor de 9. Dentro das iterações 1 e 2, o valor deste tweet teria
registrado como 5, devido ao emoji ser a primeira coisa mencionada no tweet; uma vez que o código foi
editado com um 'Contador' e 'Soma' dos valores, este tweet então retornou um valor semântico de (5+8+9)/3,

29
para um valor geral de 7,3 recorrente. Após novas execuções operacionais de arquivos .csv com esta nova
versão do código para procurar quaisquer omissões de linguagem, foi aprovado para ser a versão final.

7.3 Estágio 3: Agrupando os dados no Excel

O arquivo excel foi projetado para conter cinco colunas de dados que foram considerados mais importantes
para análise:
- O nome da empresa em discussão
- A hora do Tweet
- O nome de usuário do Tweeter
- O próprio Tweet
- A classificação semântica

Como explicado anteriormente, devido aos emojis não formatados corretamente no Excel, o conjunto de
dados foi inicialmente compilado no Numbers e, em seguida, exportado como um arquivo .xlsx para ser
aberto e classificado no Excel. As funções de classificação e filtragem dentro do aplicativo significavam que
quaisquer tweets sem valor semântico poderiam ser negados da amostra de dados, pois não tinham nenhum
propósito na análise, e também teriam interferido nos cálculos feitos dentro do documento.

Foi nesse ponto que as visualizações de dados tiveram que ser planejadas, pois as fórmulas criadas tinham que
ajudar a visualizar os dados. Os cálculos escolhidos foram:
1) Classificação semântica média de Tweets por Empresa.
2) Número de Tweets Semânticos no exemplo.
3) Número de Tweets por hora do dia.
4) Número de Tweets por Empresa por classificação de 1 a 10.

Esses cálculos foram transmitidos por meio de uma combinação das fórmulas "COUNT", "COUNTIF",
"COUNTIFS", "SUM" e "SUMIF" que apresentavam os dados de forma numérica dentro da planilha Excel,
ao lado dos próprios dados. Estas fórmulas são apresentadas no apêndice E.

30
IOLALNO.
OEIWEITSOA COMPANHIA IEIn TWEETS POR
cowAraUxmIIER HORA HOU
1.00
ASOS 128 655 5.12 ASOS 1,424,000 ASOS 128 01:00 3
1.00
BOOMOO 109 595 5 78 BOOMOO 609,400 BOOMOO 103 02:00 2
htpsan.coDhGU4p54 1.00
H&M 40 268 558 H&M 184.600 H&M 48 03:00 3
TPS n.co/nydv6kRTGH 1.00
SAUDADES 97 604 5 6 23 SAUDADES 415.300 SAUDADES 97 04:00 8
Uca... 1.00
NASTY GAL 72 386 5.39 NASTY GAL 22.259 NASTY GAL 72 05:00 5
Iep... 1.00 148,200
ZARA 30 220 6.11 ZARA ZARA 36 06:00 um
1.00
Total: 484 07:00 ela
1.00
8 00 horas 11
1.00
9 00 horas 18
. Disponível em: 2 00
https:n.co/1016Xe98zn 10:00 21
'Shamoonyou 2 00
11:00 38
2.00
12:00 23
itps: n.colg9/7LIxTEC 2.00
13:00 46
Ng: 2.00
14:00 14
soin.colyuUIBzN4W) 2.00
15:00 25
2.00
16:00 33
https McouHB6ZPeQGD 2.00
17:00 41
ps:/n.co/TQ1 wBe3UTe 2.00
18:00 21
2.00
19:00 66
2.00
20:00 18
4.00
21:00 49
4.00
22:00 14
um desonesto 4.00
23:00 t
TBF 5.00
12:00 2
5.00

s:/n.co/4q281syhH7 5 00

5.00

ordem toromcthem 5.00


novamente x
5.00

*— 5.00

an.co/Mk3QNTO6PD 5.00

n... 5.00

nttps :/R.co/SCRnOXZKhG 5.00

500

Gráfico 14. Captura de tela de dados numéricos ao lado de dados de tweet na planilha do Excel

Usar o Excel para poder visualizar o conjunto de dados era imprescindível, pois se relaciona com vários dos
treze requisitos encontrados na Seção 5 do relatório, tais como:
- Usuáriossão capazes de navegar facilmente pelo conjunto de dados completo (ou seja, postagens de
mídia social) (Req. Número 1)
- Usuáriossão capazes de classificar dados por tempo (Req. Número 2)
- Usuáriossão capazes de classificar dados por emoção (Req. Número 3)
- Usuáriossão capazes de classificar por empresa (Req. Número 5)
- Usuáriossão capazes de filtrar dados por palavras específicas (Req. Número 6)
- Usuáriossão capazes de editar e remover dados (Req. Número 7)

Enquanto a maioria desses requisitos eram "Must haves" na tabela MoSCoW, alguns deles eram "Should
haves" e, portanto, estão excedendo a expectativa do cliente ao serem incluídos no projeto.

7.4 Etapa 4: Criando visualizações de dados

O software escolhido para o projeto foi o Tableau, devido às suas vastas capacidades que permitiram a criação
de seis visualizações diferentes dos dados para apresentar ao cliente. Ter uma ampla variedade de
visualizações que podem ser facilmente compactadas em um ou dois painéis para facilitar a leitura significa
que o cliente pode tomar uma decisão informada sobre quanto investir em seu CRM Social. A simplicidade do
Tableau também garante que, uma vez que o projeto seja entregue ao cliente, ele possa visualizar, editar e
adicionar mais dados ao conjunto de dados, com o treinamento correto.

Embora o Tableau tenha desenvolvido várias iterações de seu software para diferentes níveis de análise de
dados, o produto padrão e, portanto, o usado para este projeto foi o "Tableau Desktop 2019.1". Depois de
abrir o Tableau, ele pergunta instantaneamente qual fonte de dados deve ser "Conectar" para importar os
dados. Isso torna extremamente fácil, como "Microsoft Excel" está no topo da lista de opções e é simplificado
para o nome do software, em oposição ao nome da extensão de nome de arquivo, '.xlsx'. Depois disso, é
simples escolher as colunas de dados a serem usadas, e o Tableau responde colocando as colunas no que

31
acredita serem "dimensões" e "medidas" para criar com precisão o tipo correto de visualização.

Dimensões doente P •
Abe Padrão de nome da empresa

Abe Nome da empresa para médias


Abe Nome da Empresa para No. De Tweets Semânticos
Abe Nome da Empresa para o Número Total de Tweets
e Hora

# Nº de Tweets por Classificação


Abe Cabeçalhos de tweet separados
Abe Separe as palavras do Tweet
E Hora do Tweet
Abe Tweet

Abe Nome de usuário

Abe Nomes de medidas

Medidas
# ASOS
# MÉDIA
# Boohoo
# H&M
# Saudades
# Gal desagradável
# Não. De Tweets Semânticos em Amostra
# NÃO. DE TWEETS
# Classificação semântica
# SOMA DOS TWEETS
# Total nº. De Tweets na Página do Twitter da Empresa no Reino Unido & Página de Ajuda
# Tweets por hora
# Zara
# Número de Registros
# Valores de medida

Gráfico 15. Tableau dividindo as colunas em 'Dimensões' e 'Medidas'

A primeira visualização demonstra uma "Nuvem de Palavras" do idioma mais usado nos Tweets coletados.
Isso foi difícil de construir no início, pois o Tableau não tem a capacidade de dividir frases em palavras
individuais. Portanto, os Tweets tiveram que ser divididos usando o recurso 'Text to Columns' no Excel, que
pega uma amostra de dados e a divide em palavras individuais, depositando cada uma em uma célula
diferente. Embora útil, ele fez com que o documento parecesse desarrumado e, portanto, foi concluído no final
do processo para que pudesse ser colocado fora de vista, à direita das tabelas mostradas na Figura 14.

Depois que essa operação foi concluída, as vinte e sete colunas em que os Tweets foram divididos tiveram que
ser mescladas para permitir a criação da Nuvem de Palavras. É aqui que o recurso 'Pivot' do Tableau é usado.
Isso cria dois valores de qualquer número selecionado pelo Usuário: uma combinação de colunas de
cabeçalhos e uma combinação de colunas de valores.

Posteriormente, a função 'Filtro' teve que ser usada para peneirar as palavras genéricas que não têm qualquer
valor semântico. O benefício desse recurso é trazer à tona os dados descritivos que mostrarão o contexto
pretendido do cliente, o criador do Tweet.

Nessa ocasião, uma vez concluído esse processo, um total de 236 valores foram negados da amostra, como
'também', 'faz', 'oi', 'eu', etc. A amostra foi então deixada com palavras que explicavam por que os Tweets
existiam, por exemplo, 'entrega' demonstra que grande parte da amostra tinha uma pergunta ou declaração
sobre entrega, 'devoluções', etc. além de várias palavras para demonstrar emoções, como 'curtir', 'bom',
'amoroso', 'fofo', etc.

Foi importante incluir uma representação visual dos dados da amostra, bem como os números por trás da
análise, pois permite ao cliente visualizar as emoções transmitidas em um espectro maior do que a
positividade/negatividade. Passar o mouse sobre as palavras na visualização revela quantas vezes essa palavra
foi declarada dentro da amostra, que, se filtrada pelo Top 50 usado, é entre 7 – 45 vezes por palavra.
A segunda visualização criada demonstra a classificação semântica média de cada empresa em ordem da mais
alta para a mais baixa. Isso foi criado por meio de uma tabela feita dentro da Planilha Excel que permitiu que
um valor denominado "Classificação Semântica" (por empresa) fosse colocado em um eixo, e os valores
correspondentes de "Nome da Empresa" fossem colocados no outro. Foi importante criar isso, pois dá ao
cliente uma visão rápida de quais empresas têm as reações mais positivas ou negativas de seus clientes. Eles
podem então se concentrar nos dados dessas empresas ao olhar para as outras visualizações ou podem optar
por ainda olhar para os dados como um todo.

32
Este foi um dos gráficos mais fáceis de criar, pois as informações eram simples de transportar da Planilha.
Além disso, para facilitar a visualização desses dados pelo Cliente de forma amigável, os valores semânticos
de cada empresa foram colocados em cima do gráfico, o que é útil para esse cenário, já que os valores médios
das três principais empresas (Missguided, H&M e Zara) estão separados por apenas 0,12.

A terceira visualização de dados utiliza um gráfico de pizza que exibe quantos Tweets foram enviados em
geral, por hora do dia. Esta foi uma das visualizações mais difíceis de criar; O Tableau não permite que
valores simplesmente "HH:MM" sejam um formato válido, portanto, ele gera sua própria data (01/01/1899)
para usar como espaço reservado. Devido a isso, ao criar o gráfico de pizza, era necessário verificar se os
rótulos no gráfico e nas teclas não incluíam a data do espaço reservado, pois isso tornaria o gráfico confuso e
distraído de seus dados.

Da mesma forma que a segunda visualização, para facilitar a leitura das informações "de relance" para o
Cliente, foram adicionados rótulos que explicam a qual hora cada segmento do gráfico se correlaciona. Com
essas informações, é simples perceber as horas mais populares para que os Tweets sejam enviados, e onde o
Cliente gostaria da quantidade exata de Tweets por hora, ele pode simplesmente passar o mouse sobre o
gráfico dentro do Tableau e ele divulgará essas informações.

Um gráfico de pizza adicional, a quarta visualização, foi criado para exibir o número total de Tweets por
empresa coletados na amostra. Como o projeto é uma investigação não apenas sobre o valor semântico, mas
também sobre a popularidade das empresas em questão, este diagrama exibe facilmente os nomes de cada
empresa e o número exato de Tweets na amostra que elas possuem.

Ter esse diagrama demonstra que, apesar de uma empresa talvez ter mais Tweets enviados a eles do que
qualquer outra, a maioria deles não poderia mostrar nenhum valor sentimental e simplesmente ser curiosa e
mundana, em oposição a opiniões que poderiam influenciar outros clientes em potencial. Esse diagrama era
relativamente fácil de criar no Tableau, especialmente depois de criar um gráfico de pizza na visualização
anterior.

A penúltima visualização é um detalhamento do número de Tweets por Rating – de 10 – por empresa. Cada
empresa tem seu próprio gráfico de barras rotulado de 1 a 10 que mostra o número de Tweets que eles
receberam dentro de cada classificação, que o Cliente pode passar o mouse para ver o número exato de
Tweets, no entanto, não foi assim que foi inicialmente planejado para ser apresentado.

A ideia original para essa visualização era apresentar um gráfico de barras empilhado que demonstrasse o
número total de Tweets no conjunto de dados com cada valor de 10, isso demonstraria qual empresa recebeu
um número notável de Tweets dentro desse valor. Como os dados foram coletados do Excel usando fórmulas,
os dados – de forma semelhante às palavras individuais para a Nuvem de Palavras – teriam que ter sido
mesclados com um Pivot, no entanto, isso foi problemático, pois cada conjunto de dados só pode ter um Pivot.

Isso significava que, ao tentar dinamizar os dados juntos, ele se mesclava com os dados da Nuvem do Word e
tornava ambos os conjuntos de valores ilegíveis. Embora isso tenha sido frustrante, os dados ainda fazem
sentido lógico por si só e são facilmente compreensíveis como seis gráficos de barras separados.

A sexta e última visualização foi a única estatística que não veio diretamente dos dados coletados, pois
funciona como informação de fundo sobre as empresas estudadas para fornecer ao Cliente informações
adicionais. Ele apresenta um gráfico de barras que exibe o número de Tweets que cada empresa enviou em
sua página do Twitter no Reino Unido, bem como sua "Página de Ajuda", se eles possuírem um, a partir de 10
de 2019. Isso é útil para comparar o quão ativa uma empresa está nas mídias sociais com os dados
abril de

complementados de outras visualizações.

Depois que essas visualizações foram construídas, dois Dashboards foram gerados e vinculados para criar um
meio para visualizar facilmente os resultados.

Esses painéis foram divididos em "Coletando estatísticas", que contém:

33
- Tweets por hora
- Número de Tweets por empresa
- Contagem geral de Tweets da empresa em suas páginas do Twitter

Bem como "Análise Estatística" que contém:


- A Nuvem Mundial
- Classificação semântica média por empresa
- Detalhamento do número de Tweets por classificação por empresa.

Como todas as informações não caberiam em um painel, era imperativo garantir que a forma como os dados
são apresentados ao cliente fosse amigável. Isto foi conseguido dividindo-os nas três visualizações relativas à
base das estatísticas, e as três visualizações relativas à análise, aprofundando-se nos dados, pois esta parecia
ser a abordagem mais lógica.

Um aspecto fundamental da apresentação desses diagramas foi garantir que eles fossem fáceis de inferir, pois
cada diagrama segue o mesmo esquema de cores de vinte cores diferentes – chamado Tableau 20 nas
configurações do Tableau – para mantê-lo uniforme e esteticamente aceitável para o cliente. Isso teve que ser
ligeiramente alterado para visualização três devido a haver mais de 20 entradas. Onde fazia sentido e não
tornava a visualização muito cheia, etiquetas eram colocadas no próprio gráfico, pois isso eliminava a
necessidade de uma "chave" acima, ao lado ou abaixo de cada diagrama, pois estes ocupavam espaço valioso.

7.5 Caixa de Tempo

Tarefa Tarefa Status da tarefa


Número
1 Pesquisa Inicial Concluído a tempo
2 Levantamento de requisitos Concluído a tempo
3 Escrita de código Concluído a tempo
4 Execute código a cada duas horas das 12h às 12h para Executou o código pelo menos 5 vezes por
cada empresa (7 vezes por empresa) empresa, no entanto alguns Tweets
apareceram em mais de uma amostra
devido à falta de Tweets sobre essa
empresa nas 2 horas.

Concluído a tempo
5 Projeto e Desenvolvimento de Planilhas Excel Concluído a tempo
6 Compilação e exportação de dados para Excel Concluído a tempo
7 Fórmulas criadas no Excel Concluído a tempo
8 Visualizações de dados criadas Todas as visualizações criadas de acordo
com o plano, exceto o gráfico de barras
empilhado, que foi adaptado.

Concluído a tempo.
9 Teste de Função Concluído a tempo
10 Corrigir quaisquer erros encontrados no período de Concluído a tempo
11 teste
Apresentação do Produto ao Cliente Concluído a tempo
12 Relatório Final Concluído a tempo
13 Produto Final Concluído a tempo
7.6 Potenciais abordagens alternativas

Vários métodos foram considerados durante as diferentes etapas de desenvolvimento do projeto. Um exemplo
disso foi durante o processo de design preliminar, quando houve debate em torno se o conjunto de dados
deveria ser apresentado como um banco de dados SQL, ou dentro de uma planilha como Excel ou Numbers.

Os pontos positivos de manter os dados dentro de um banco de dados é que ele é mais seguro e possui um
nível de segurança maior do que uma planilha. Isso ocorre porque é mais difícil excluir registros
acidentalmente e é criptografado para um padrão mais alto do que uma planilha típica. No entanto, pode-se

34
argumentar que um número maior do público em geral pode visualizar e editar planilhas em comparação com
o conhecimento de SQL. Devido a isso, erros podem ser cometidos se uma pessoa inexperiente tentar editar os
dados dentro do banco de dados.

Depois de reunir os dados, um outro dilema envolveu a decisão de qual ferramenta de visualização usar, já
que cada um dos líderes de mercado tem seus próprios pontos fortes e fracos. Uma opção possível era o
Power BI, uma ferramenta de propriedade da Microsoft que se conecta diretamente ao Excel para criar
gráficos e painéis a partir dos dados. Outro foi o SiSense, que permite a visualização de dados, mas se
considera uma "solução de análise de big data" para analisar e visualizar grandes volumes de dados.

Depois de analisar os pontos positivos e negativos das três opções, o Tableau foi escolhido devido à sua
riqueza de recursos em relação à visualização de dados – que é tudo o que era necessário naquele estágio do
processo de desenvolvimento – além de receber uma chave de licença gratuita para o Tableau Desktop.

8 Teste
Após o desenvolvimento dos dois painéis para apresentar os dados ao cliente, todo o projeto do Tableau
passou por testes completos e abrangentes para garantir que estava funcionando conforme o esperado. Isso
pode ser encontrado no Apêndice G. O teste 9 demonstrou que uma fórmula criada para contabilizar o número
de Tweets por hora não estava se comportando corretamente. Encontrar isso me permitiu corrigir a fórmula e
forçar uma atualização nas visualizações para garantir que elas mantivessem os dados corretos. Todos os
outros 26 testes passaram pela primeira vez.

35
9 Avaliação

9.1 Avaliação do Produto

Para analisar se o projecto foi um sucesso, penso que é imperativo olhar para os requisitos recolhidos e ver se
foram cumpridos de acordo com a definição de prioridades do MoSCoW.

Não. Requisito. Moscovo? Final


Produto?
1) Os usuários são capazes de navegar facilmente o conjunto de dados Deve ter Sim
completo (ou seja, postagens de mídia social)

2) Os usuários podem classificar os dados por tempo Deve ter Sim

3) Os usuários podem classificar os dados por emoção Deve ter Sim

4) Os usuários podem classificar os dados por gênero Poderia ter Não

5) Os usuários podem classificar dados por empresa Deve ter Sim

6) Os usuários podem filtrar dados por palavras específicas Deve ter Sim

7) Os usuários podem editar e remover dados Poderia ter Sim/Não

8) Os usuários podem visualizar uma variedade de visualizações de dados Deve ter Sim
pré-feitas para dados

9) Os usuários podem criar suas próprias visualizações de dados para dados Deve ter Sim

10) Os usuários podem exportar suas visualizações de dados individualmente Deve ter Sim

11) Os usuários podem exportar suas visualizações de dados como um todo Deve ter Sim

12) Os usuários podem carregar conjuntos de dados para análise Não terá Possível

13) O desenvolvedor é capaz de carregar conjuntos de dados para análise Poderia ter Possível

Dos treze requisitos coletados, todos os requisitos que foram inicialmente classificados como "devem ter" ou
"deveriam ter" foram implementados com sucesso, o único "não" definitivo dentro dos requisitos é em relação
à classificação de dados por gênero. Isso ocorre porque o Twitter não habilita essa opção nativamente, e
envolveria um nível profundo de aprendizado de máquina para analisar nomes de usuários, nomes de exibição
e tweets para analisar se o sistema acredita que uma conta é masculina ou feminina. Todos os outros requisitos
poderiam ser um "sim" com o treinamento correto sobre o sistema.

Apesar da grande maioria dos requisitos serem atendidos, ainda acredito que há muito que pode ser melhorado
em relação ao sistema que criei. Em primeiro lugar, o plano inicial era analisar dados do Facebook e
Instagram, bem como do Twitter, no entanto, devido ao GDPR, o longo processo de solicitar permissão para
construir um aplicativo no Facebook em 2019 requer mais tempo e orçamento do que eu tinha como estudante
universitário. Isso se deve a eles exigirem um protótipo inteiro do aplicativo que você está construindo antes
de aprová-lo.

Além disso, como o Facebook possui o Instagram e eles não têm uma plataforma para aplicativos de terceiros

36
dentro do próprio aplicativo Instagram, um tipo diferente de ferramenta de raspagem de dados teria que ter
sido codificado e testado, o que novamente exigiu muito mais tempo do que eu tive para trabalhar no projeto.

Acredito também que, com mais tempo, o projeto poderia ter coletado muito mais dados do que possui
atualmente, o que daria uma representação mais precisa das opiniões do público sobre as empresas. Isso
também teria me permitido analisar mais semântica e melhorar ainda mais a área específica do código que
detecta o sentimento desses dados.

No entanto, sinto que este projecto contém uma representação completa das opiniões do público em linha
relativamente a determinadas empresas. O código referente à análise semântica também fornece uma leitura
precisa dos pensamentos de um consumidor, e as visualizações de dados criadas por meio do Tableau
mostram uma variedade de maneiras interessantes de olhar para os dados coletados. Isso permite uma análise
amigável para um significado mais profundo quando comparado ao sucesso geral de uma empresa.

Se este projeto tivesse iterações futuras, ele se beneficiaria de ser adaptado em um banco de dados para
segurança e velocidade de coleta e recuperação de dados, pois isso formaria mais estrutura para o projeto. O
número de empresas monitoradas poderia ser aumentado, e também acredito que seria uma boa ideia ter
"ouvintes de fluxo" implementados que raspariam cada Tweet à medida que ele é postado e o carregariam no
banco de dados, em vez de ter uma pessoa executando manualmente o código a cada uma ou duas horas.

Em versões futuras do projeto, eu também garantiria que há semanas e meses de dados, pois isso desbloqueia
a possibilidade de analisar o sentimento médio dos Tweets mês a mês, bem como o volume de Tweets
coletados. Isso poderia ser visualizado por meio do Tableau como uma comparação dos dados individuais de
cada empresa, bem como uma avaliação do mercado como um todo.

9.2 Auto-Avaliação

Considerando meu nível de habilidade como um estudante universitário com conhecimento de codificação
simplista, acredito que criei este projeto da melhor maneira possível.

Quando comecei a pesquisar este projeto, eu sabia que teria que aprender uma linguagem de codificação na
qual eu tivesse experiência mínima, se houver, já que as quatro ou cinco linguagens de codificação que
conheço bem eu venho aprendendo desde o Ensino Médio. Por causa disso, quando decidi pelo Python para
minha linguagem de codificação, eu sabia que o projeto seria uma luta para criar, mas eu estava ansioso para o
desafio, pois achei o tópico do meu projeto fascinante, e não havia como criar o projeto que eu queria sem dar
uma chance ao aprendizado de Python.

Uma desvantagem disso, no entanto, foi que eu talvez estivesse colocando muita pressão sobre mim mesmo
para aprender uma linguagem de codificação totalmente nova no meu último ano de universidade. Várias
vezes fiquei preso em um pedaço relativamente simples de código que acredito que teria conhecido a solução
para que minha educação na linguagem correspondesse à de Java, HTML ou CSS. Devido a isso, sinto como
se eu perdesse vários dias mudando pequenas partes do meu código para investigar onde eu tinha errado, o
que geralmente acabava sendo um problema com a minha sintaxe, e não com qualquer código escrito em si.

Dada a chance de criar todo o projeto novamente, acredito que muitas das melhorias que eu faria seriam
baseadas no tempo. Eu começaria a aprender Python e completar tutoriais no início do ciclo de
desenvolvimento para que eu pudesse gastar menos tempo resolvendo meu código. Eu poderia então gastar
mais tempo desenvolvendo o projeto e aumentando o escopo: seja o tamanho do conjunto de dados, o número
de empresas analisadas ou a confiabilidade da análise semântica.

Se me fosse dada a possibilidade, eu também gastaria mais tempo desenvolvendo meu conjunto de
habilidades com o Tableau, já que é um sistema tão poderoso e capaz, e sinto como se tivesse apenas pastado
a superfície de suas capacidades.

Apesar disso, comecei este projeto querendo analisar o quão positivas ou negativas eram as opiniões das
pessoas nas redes sociais e mostrar os resultados, e desenvolvi um programa que faz exatamente isso.
Consegui cumprir todos os requisitos que inicialmente me propus a cumprir na Seção 5 do relatório, e aprendi
uma nova linguagem de codificação que me ajudará muito no setor de Análise de Dados.

37
É por estas razões que acredito ter criado um bom modelo de trabalho, que cumpra as metas e objetivos a que
me propus inicialmente a alcançar, e estou feliz com o meu trabalho.

38
10 Conclusão
Este relatório inicialmente se propôs a investigar se há uma conexão entre o quão ativa uma empresa é nas
mídias sociais, sua reputação on-line com seus clientes e seus lucros, por meio de análise semântica e
visualização de dados dos resultados.

10.1 Conclusões sobre Reputação

As visualizações de dados criadas destacam a conexão potencial entre o quão proativa uma empresa é on-line
e a reputação média que ela tem com seus clientes ou potenciais clientes.

Total nº. De Tweets na Página do Twitter da Empresa

Figura 16. Número total de Tweets enviados da Página do Twitter da Empresa (Reino Unido, se possível) e da Página de Ajuda (se
aplicável)

Como é mostrado, o número de Tweets enviados por cada empresa varia drasticamente entre as seis empresas
escolhidas para o estudo. Em ordem do mais para o menos:
1) ASOS
2) Boohoo
3) Saudades
4) H&M
5) Zara
6) Gal desagradável

39
Figura 17. Classificação semântica média por empresa

Isso se desenvolve quando comparado à classificação semântica média de cada empresa a partir dos Tweets
coletados, em que:
1) Saudades
2) H&M
3) Zara
4) Boohoo
5) Gal desagradável
6) ASOS

A primeira comparação interessante, é a empresa que enviou mais Tweets por quase 800.000, ou seja, ASOS,
tem a classificação de valor semântico mais baixa, enquanto H&M e Zara, que enviaram alguns dos menores
números de Tweets de suas contas corporativas do Twitter, e têm menos presença online, têm uma
classificação semântica mais alta. À primeira vista, parece que há pouca correlação entre os dois gráficos
mostrados, no entanto, quando os dados são revisados sem a inclusão de uma das empresas, os gráficos têm
uma correlação clara entre eles.

Pode-se argumentar que a interação com o cliente (ou seja, o CRM Social) no Twitter inspira os clientes a
pensar conscientemente sobre a marca e, portanto, eles são mais propensos a querer comprar lá. Várias
marcas, geralmente voltadas para as gerações mais jovens, enviam fotos engraçadas, citações, quizzes ou
outras postagens que incentivam a comunicação entre elas e seus clientes.

Uma dessas marcas, a Missguided, posta fotos ou vídeos que eles acreditam que sua base de usuários acha
"relacionáveis" todos os dias. Os clientes então reagem a essas postagens e as tratam da mesma forma que
fariam se uma conta não corporativa a tivesse enviado, e respondem ao Tweet com sua reação ou marcando
um amigo nele com um comentário. A publicação desse tipo de conteúdo inunda o feed da empresa com a
resposta dos clientes, bem como a tag "@Missguided".

Missguided Q @Missguided • Abr 23


Ninguém:

Nenhuma pessoa:

Eu bêbado:

Figura 18. Tweet Errôneo

40
21:30 Paigelouisee2 ©Missguided Phil e grant / zac e Cody 7.00
Missgulde d
Missgulde
21:31 Anna_Jane_R ©Missguided Zac e Cody 7.00
d
Missgulde 10:43 Sianduff 7.50
©Missguided Slay vibe 37 @callysmitherman
d
Missguide 10:43 ModsOf Diversidade ©@ericafmstyle Missguided Isso é incrível Érica. 7.50

Missgulde
11:00 Saudades Memórias V https:/t.co/lw8kaemOs3 7.50
d
Missgulde 17:30 Saudades Obrigado a todos que entraram eu Parabéns a esses bebês ♦ 7.50
d

Missguide d 09:16 shazywaz2003 ©Missguided Slay ameixa t 800

Missguide d 09:35 Charlieeeann ©@ClaireH202 Missguided dttso pronto 9 8.00


Missguide
10:33 Kelli enewton ©Missguided SNATCHED GLOW 8.00
d
Missguide
d
10:39 Elistuesday
©@Corleelizabethx Missguided Há até 50% de desconto em tudo hoje: https://t.co/3qxGkGbpxJ v' 8.00

Missgulde 11:23 _TanyaCMakeup 8.00


Eu era aquela menina Q 9 t htips7/ t.c <yoPVBA8leVq
d
Missguide
11:29 Sra. SandraB @Missguided_help Olá pergunta de um cliente francês o código que você me enviou não funciona no site 8.00
d
adoro como a missguided ter anunciado esta enorme venda quando realmente eles aumentaram os preços originais, então realmente estamos pagando
Missguide d 13:39 Shelleyb_97 8.00
mais :))))
Missguide adoro como a missguided ter anunciado esta enorme venda quando realmente eles aumentaram os preços originais, então realmente estamos pagando
13:39 Shelleyb_97 8 00
d mais :))))

Missguide d 13:42 Helena Smiddy Todos os arrepios V http$://t.co/m4l1xZakkY 8.00

Missguide
d
13:42 Helena Smiddy Todos os arrepios V https://t.co/m411xZakkY 8.00
Missguide
d 14:00 itslxurenjade Eu não posso dizer o quão animado 1 da manhã para isso!!! Um dos meus filmes favoritos da Disney GWhttpsi/t .co/lpA4TGJrOK 8.00
Missguide
d
14:00 itslxurenjade
GW https://t.co/lpA4TGJrOK 8.00

Missguide
d
16:56 TheBlckhipster Preciso de todas as peças dessa ©coleção Playboy x ©Missguided na minha vida o mais rápido possível e 8.00

Missguide
d
Missguide
17:45 Amygardnerr
©Missguided Ekkkkk ser incrível v 8.00

d 17:46 Beccccaaa_X ©Missguided ©leesamoconnor Sugar Angel e Lit Gem dt 8.00

Missguide 18:40 Odavies73 ©Saudades de Zack e Cody da vida da suíte • 8.00


d

Figura 19. Trecho do conjunto de dados


Este trecho de uma fração dos dados demonstra como a Missguided inunda seu fluxo no Twitter com uma
grande quantidade de pessoas simplesmente conversando com a empresa, em vez de fazer perguntas ou
compartilhar opiniões sobre ela. Cada um desses Tweets tem uma classificação de 7 ou acima devido à
linguagem positiva usada no Tweet, apesar do Tweet realisticamente não ter nada a ver com a empresa em si.

Devido a isso, se o Missguided for negado a partir dos resultados e das visualizações de dados, um padrão
muito mais claro é revelado.

Total nº. De Tweets na Página do Twitter da Empresa

Figura 20. Missguided negado

Classificação semântica média por empresa


Empresa N..

H&M m 6.174

Zara m 6.111

Boohoo n 5.948
Nasty Gal m 5.435

ASOS m 5.117

01234567

Avg. Classificação semântica -

Gráfico 21. Missguided negado


Se o Missguided for removido, olhando para as classificações semânticas versus a atividade da empresa,

41
mostra-se que, curiosamente, quanto mais ativa uma empresa é nas mídias sociais, pior é a reputação que ela
tem online de seus clientes. As empresas ASOS, Boohoo e Nasty Gal – todas baseadas exclusivamente online,
têm as três piores classificações médias semânticas, enquanto H&M e Zara, que têm uma presença online e
offline constante, apesar de menos Tweets, têm uma classificação geral mais alta.

Pode-se argumentar que isso ocorre porque quanto mais ativa uma empresa é nas mídias sociais, mais
comentários ela tende a inspirar, bem como a ideia de que as pessoas são menos propensas a dar feedback
positivo sobre uma interação ou produto se for bom, mas são mais propensas a dar feedback negativo se for
ruim (Thomas, 2018). Isso poderia dar uma visão sobre a razão pela qual as empresas on-line têm as piores
classificações e, portanto, pode-se dizer que quanto mais impacto uma empresa faz nas mídias sociais, pior
reputação ela pode ter online.

10.2 Conclusões relativas à Rentabilidade


A partir de pesquisas encontradas sobre a lucratividade de cada empresa, a maioria das quais aborda o
exercício fiscal encerrado recentemente, uma série de estatísticas foram descobertas e analisadas em
comparação com os dados encontrados na Seção 10.1:
- A empresa com a classificação semântica mais alta, H&M, anunciou que os lucros caíram pelo sétimo
trimestre consecutivo de dezembro de 2018 a fevereiro de 2019, queda de 1,5% em relação ao ano
anterior (Irish Times, 2019).
- 2ª maior classificação semântica, os lucros da Zara registrados em janeiro de 2018 aumentaram 30%
para £ 40,86 milhões em relação ao ano anterior (Companies House, 2018).
- Em , as receitas da Boohoo aumentaram 48% e os lucros aumentaram 38%, para 59,9 milhões de

libras (Kinder, 2019).


- 4º, Nasty Gal, de propriedade da Boohoo, as vendas aumentaram 96% para £ 47,9 milhões (Kinder ,

2019), com as receitas absorvidas pela Boohoo.


- 5ª, e a classificação semântica mais baixa, ASOS reportado dentro do período de 6 meses de 28 de agosto de

2018
até o 28 de fevereiro de 2019, os lucros caíram 87% na comparação com o ano anterior (BBC News,
dia

2019)
- A Missguided sofreu um prejuízo antes dos impostos de £ 46 milhões de abril de 2017 a abril de
2018, em comparação com um prejuízo de £ 1,6 milhão no ano anterior, que eles atribuíram ao
"investimento prematuro" (BBC News, 2019).

Mais uma vez há pouca correlação entre os números apresentados. Apesar disso, pode-se dizer que há uma
pequena associação entre o quão ativa uma empresa é nas mídias sociais e seus rendimentos relacionados. A
Boohoo, a segunda conta corporativa mais ativa, teve um aumento de quase 50%, a ASOS, enquanto caiu
87% nos lucros antes de impostos, ganhou um aumento de 14% em suas vendas ano a ano, e o faturamento do
grupo Missguided no ano aumentou 4,9% para £ 215,91 milhões (Nazir, 2019).

Há algo a ser dito sobre a lucratividade dos mercados on-line no século 21, que pode ser analisado analisando
através de suas respostas de mídia social usando os sistemas sugeridos neste relatório. Embora pareça que,
quanto mais ativa uma empresa é nas mídias sociais, maior a probabilidade de receber comentários negativos:
isso não deve necessariamente ser visto como algo negativo, ser mais ativa e se comunicar mais com os
clientes parece aumentar as vendas.

42
11 Bibliografia
"Bliti". (2019, 4). Pinça. Retirado de Tweepy: https://www.tweepy.org/
Adams-Mott, A. (2018, p. 6). Vantagens e desvantagens do marketing de mídia social. Consultado em 1 9, 2019, from Small Business
Chronicles: http://smallbusiness.chron.com/advantages-disadvantages- social-media-marketing-21890.html
Šilingas, D., & Butleris, R. (2015). Rumo à implementação de um framework para modelagem de requisitos de software no
MagicDraw UML. Tecnologia da Informação e Controle, 38(2).
Ajmera, J., Ahn, H.-i., Nagarajan, M., Verma, A., & Contratante, D. (2013). Um sistema de CRM para mídias sociais. WWW '13
Anais da 22ª conferência internacional sobre World Wide Web, 49-58.
Arnold, A. (2017, p. 10). Conveniência x experiência: os millennials adoram o streaming, mas não estão prontos para o despejo
Cinema ainda. Retirado da Forbes:
https://www.forbes.com/sites/andrewarnold/2017/10/26/millennials-love-streaming-but- não estão prontos para despejar-
cinema-ainda/#2d11e7b56311
BBC News Brasil (2019, p. 4). Os lucros da ASOS despencam 87% após ano difícil. Retirado da BBC News:
https://www.bbc.co.uk/news/business-47877688
BBC News Brasil (2019, p. 1). A cadeia de moda Missguided vê as perdas aumentarem à medida que os custos aumentam. Retirado
da BBC News: https://www.bbc.co.uk/news/business-46783114
Brandwatch. (2019, 3 29). Os emojis mais populares. Retirado de Brandwatch: https://www.brandwatch.com/blog/the-most-popular-
emojis/
Bullock, L. (2018, 11 27). O maior fracasso das redes sociais de 2018. Retirado da Forbes:
https://www.forbes.com/sites/lilachbullock/2018/11/27/biggest-social-media-fails- 2018/#da9943518f8c
Pão de bolo, C. (2017, 11 15). Você não está sozinho, ninguém lê os termos dos contratos de serviço. Retirado do Business Insider:
https://www.businessinsider.com/deloitte-study-91-percent-agree-terms-of-service- sem-leitura-2017-11?r=US&IR=T
Castronovo, C., & Huang, L. (2012). Mídias Sociais em um Modelo Alternativo de Comunicação de Marketing.
Revista de Marketing Desenvolvimento e Competitividade, 117-131.
Clarke, J. (2017, p. 11). Os compradores do Reino Unido devem gastar mais neste Natal em comparação com o ano passado.
Retirado de Independent: https://www.independent.co.uk/news/business/news/uk-shopping-christmas- forecast-british-
consumers-brexit-a8031606.html
Coleman, A. (2003). Dicionário Oxford de Psicologia. Nova Iorque: Oxford University Press, p.77.
Casa das Empresas. (2018, 1). Relatório Anual e Demonstrações Financeiras referentes ao exercício findo em 31 de janeiro de 201.
Retirado de Companies House: https://s3.eu-west-2.amazonaws.com/document-api-
images-live.ch.gov.uk/docs/sdOxhBqVYBtgmcjTTqR2-
Tm72MSHyljBSTk8S7U_Z9g/aplicação-pdf? X-AMZ-Algorithm=AWS4-HMAC-
SHA256&X-AMZ-Content-Sha256=UNSIGNED-PAYLOAD&X-Amz-
Credencial = ASIAWRGBDBV3LGD5ORE6%2F20190425%
Switch de CRM. (2013). Um Breve Histórico da Gestão do Relacionamento com o Cliente. Obtido do CRM Switch:
https://www.crmswitch.com/crm-industry/crm-industry-history/
Dia, T. (2013). Sucesso na Escrita Acadêmica. Palgrave.
Eadicicco, L. (2015, p. 12). Os americanos verificam seus telefones 8 bilhões de vezes por dia. Retirado de Time:
http://time.com/4147614/smartphone-usage-us-2015/
Edosomwan, S., Kalangot Prakasan, S., Kouame, D., Watson, J., & Seymour, T. (2011). A História das Mídias Sociais e seu Impacto
nos Negócios. Revista de Gestão Aplicada e Empreendedorismo, 79-91.
Edwards, J. (2014, 08 28). O Twitter agora mostra exatamente quantas pessoas veem seus tweets - e é hipnotizante. Retirado do
Business Insider: https://www.businessinsider.com/twitter- analytics-dashboard-launched-2014-8?r=US&IR=T
Emojitracker. (2019, 4 3). Rastreador de Emoji. Retirado de Emoji Tracker: http://emojitracker.com
Fingas, J. (2018, 09 09). Os atalhos de emojis do Instagram ajudam você a comentar em tempo recorde. Retirado do Engadget:
https://www.engadget.com/2018/09/09/instagram-emoji-
atalhos/?guccounter=1&guce_referrer_us=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce
_referrer_cs=LoLm0cHSgd1SMKMPFZcxtQ
Fortin, J. (2018, 1 13). H&M fecha lojas na África do Sul em meio a protestos por camisa 'macaca'. Retirado do The New York
Times: https://www.nytimes.com/2018/01/13/world/africa/hm-south-africa- protesto.html
Gates, B. (1999). Negócios na Velocidade do Pensamento: Usando um Sistema Nervoso Digital. Pinguim.
Google Trends. (2008). Tendência "John Lewis Christmas". Retirado do Google:
https://trends.google.com/trends/explore?geo=GB&q=John%20Lewis%20christmas

43
Gov.uk. (2018). Proteção de Dados. Retirado de GOV.UK: https://www.gov.uk/data-protection
Huddy, G. (2017, p. 10 19). Como funciona a análise de texto para mídias sociais. Retirado de Crimson Hexagon:
https://www.crimsonhexagon.com/blog/how-text-analytics-works-for-social-media/
Ilyashov, A. (2015). Veja como as marcas de luxo estão fazendo muito mal nas redes sociais (e os poucos que quebram o molde).
Retirado de https://www.refinery29.com/en-us/2015/10/95018/luxury-fashion- brands-social-media
Irish Times. (2019, 3). Obtido em https://www.irishtimes.com/business/retail-and-services/h-m- lucro-cai-menos-que-do-esperado-
depois-de-restrições-descontos-1,3842804
José, S. (2017). Como a Nike está usando os canais digitais para impulsionar as vendas. Retirado de Digiday UK:
https://digiday.com/marketing/nike-using-digital-channels-drive-sales/
Kinder, T. (2019, 4 25). O Instagram ajuda a Boohoo a abocanhar um aumento de vendas. Retirado do The Times:
https://www.thetimes.co.uk/article/instagram-set-helps-boohoo-to-snap-up-a-sales-increase- 5ffdssrbh
Lim, K. H. (2018, 04). Emojis Positivos e Negativos utilizados para a Análise de Sentimento. Retirado de
ResearchGate: https://www.researchgate.net/figure/Positive-and-negative-emojis-used-for-the- sentimento-
analysis_fig3_324639092
Semana de Marketing. (2018, 9 13). Como uma campanha do Facebook mudou a abordagem da M&M para anúncios para
dispositivos móveis.
Retirado de Marketing Week: https://www.marketingweek.com/2018/09/13/facebook- mms-mobile-ads/
McIntyre, H. (2016, p. 7). Os millennials não estão mais muito interessados no rádio tradicional. Retirado da Forbes:
https://www.forbes.com/sites/hughmcintyre/2016/07/12/millennials-estão-muito-interessados-em-rádio-tradicional-
qualquer-mais/#b7e7bf37c4e4
Nazir, S. (2019, p. 1). Missguided relata prejuízo de £ 46,7 milhões. Retirado de Retail Gazette:
https://www.retailgazette.co.uk/blog/2019/01/missguided-reports-46-7m-loss/
Novak, P. K., Smailovic, J., Sluban, B., & Mozetic, I. (2015). Sentimento de emojis. Plos Um.
O'flynn, R. (2017, 7 17). A maneira como o biscoito social desmorona: a genialidade do marketing de mídia social da Oreo.
Retirado de 201digital: https://www.201digital.co.uk/way-social-cookie-crumbles-genius- oreos-social-media-marketing-
can-learn/
Pak, A., & Paroubek, P. (2010). Twitter como corpus para análise de sentimentos e mineração de opinião. LREc, 1320-1326.
Portocarrero, J. M., Delicato, F. C., Pires, P. F., Gámez, N., Fuentes, L., Ludovino, D., & Ferreira, P. (2014). Redes de sensores sem
fio autônomos: uma revisão sistemática da literatura. Revista de Sensores.
Red Hot Penny. (2018, 16 de agosto). O Social Scorecard - Moda e Acessórios 2018. Consultado em novembro
8, 2018, de https://www.redhotpenny.com/social-scorecard-fashion-accessories- 2018/#wpcf7-F4557-P4549-O1
Ritvikmath. (2018, 6 18). Raspagem de dados. Obtido do github:
https://github.com/ritvikmath/ScrapingData/blob/master/Scraping%20Twitter%20Data.ipyn b
Roberts, M. (2018, 6 12). A melhor rede de restaurantes do Twitter reage ao IHOP mudar seu nome para 'IHOb'.
Retirado de Pessoas: https://people.com/food/ihop-name-change-ihob-twitter-reactions/
Roth, Y. (2018, p. 7). Novos requisitos do desenvolvedor para proteger nossa plataforma. Retirado do Twitter:
https://blog.twitter.com/developer/en_us/topics/tools/2018/new-developer-requirements-to- proteger nossa plataforma.html
Rouse, M. (2017, p. 9). Definição: CRM social. Retirado de WhatIs.com:
https://searchcrm.techtarget.com/definition/social-CRM
Rudestam, K. E., & Newton, R. R. (2007). Sobrevivendo à sua dissertação: um guia abrangente de conteúdo e
Processo (3ª ed.). SÁLVIA.
Thiagarajan, S. (2018, p. 11). Facebook, Instagram ou Twitter? Estratégia de mídia social que você deve seguir. Retirado do
Economic Times: https://economictimes.indiatimes.com/small-biz/marketing- branding/marketing/facebook-instagram-or-
twitter-social-media-strategy-that-you-should- follow/articleshow/66471776.cms
Tomás, A. (2018, 2). A proporção secreta que prova por que as avaliações dos clientes são tão importantes. Retirado de Inc.:
https://www.inc.com/andrew-thomas/the-hidden-ratio-that-could-make-or-break-your- company.html
Tobin, B. (2018, 7 10). IHOP muda de nome de volta de IHOB. Retirado do USA Today:
https://eu.usatoday.com/story/money/2018/07/09/ihop-changes-name-back- ihob/769310002/
Y, E. (2019, 01 30). 5 coisas que você precisa saber antes de raspar dados do Facebook. Retirado de Octoparse:
https://www.octoparse.com/blog/5-things-you-need-to-know-before-scraping- data-from-facebook
YPulse. (2018, 6). AS 10 MARCAS QUE A GERAÇÃO Z E OS MILLENNIALS MAIS CONFIAM. Retirado de
YPULSE: https://www.ypulse.com/post/view/the-10-brands-gen-z-millennials-trust-most

44
12 Apêndices

12.1 Apêndice A: Figuras

Gráfico 1.
YPulse. (2018, 6). AS 10 MARCAS QUE A GERAÇÃO Z E OS MILLENNIALS MAIS CONFIAM.
Retirado de
YPULSE: https://www.ypulse.com/post/view/the-10-brands-gen-z-millennials-trust-most

Gráfico 2.
Google Trends (2019) GOOGLE TRENDS SOCIAL CRM. Obtido do Google Trends:
https://trends.google.com/trends/explore?date=all&q=Social%20CRM

Figura 3&4.
Twitter (2019) Marks & Spencer Conta do Twitter. Retirado do Twitter:
https://twitter.com/marksandspencer/with_replies
Figure 5.
Smith, M (2018) Quão bom é "bom"? Retirado de YouGov:
https://yougov.co.uk/topics/lifestyle/articles-reports/2018/10/02/how-good-good

Figure 6.
Twitter Analytics (2018) Como usar o Twitter Analytics. Retirado do Business Twitter:
https://business.twitter.com/en/analytics.html

Figure 7.
Hootsuite (2018) Ferramentas de análise de sentimento para profissionais de marketing de mídia social.
Retirado de Blog.Hootsuite:
https://blog.hootsuite.com/social-media-sentiment-analysis-tools/

Figure 8.
Lexalytics (2018) Semantria para Excel. Retirado de Lexalytics:
https://www.lexalytics.com/semantria/excel
Figure 9.
Draw.io (2019) Diagrama criado por Desenvolvedor. Desenvolvido e baixado de Draw.io: draw.io

Figure 10.
Twitter Developer (2019) Detalhes do aplicativo. Retirado do Twitter:
https://developer.twitter.com/en/apps/16124184

Figure 11.
Twitter Developer (2019) Chaves e tokens. Retirado do Twitter:
https://developer.twitter.com/en/apps/16124184

Figure 12.
"Dados -0 classificações.xlsx"

Figure 13.
"Dados -0 classificações.xlsx"

Figure 14.
"Dados -0 classificações.xlsx"

Figure 15.

45
Tableau, "Visualizações de dados.twb"

Figure 16.
Tableau, "Visualizações de dados.twb"

Figure 17.
Tableau, "Visualizações de dados.twb"

Figure 18.
Missguided Twitter Account (abril, 2019) Twitter. Retirado do Twitter:
https://twitter.com/Missguided/status/1120779470191955970

Figure 19.
"Dados -0 classificações.xlsx"

Figure 20.
Tableau, "Visualizações de dados.twb"

Figure 21.
Tableau, "Visualizações de dados.twb"

12.2 Apêndice B: Relatório contextual

«Metas e objetivos

Para investigar isso, o projeto coletará dados de três das mídias sociais mais populares (Twitter, Facebook e
Instagram) para várias empresas de varejo e indexará os resultados com base em quão positivas/negativas são
as palavras/fraseados. Essas informações serão exibidas por meio de um software de visualização de dados e
comparadas com os lucros anuais de cada uma das empresas para determinar se existe uma ligação entre o
quão ativa uma empresa é nas mídias sociais e a quantidade de lucros que ela obtém por ano.

[n] = Dias

1.1 Relatório de investigação


1.1.1 Escreva um relatório contextual sobre o projeto que descreverá um esboço se o que o projeto
está esperando criar, e a linha do tempo de como ele deve ser criado, para permitir uma melhor compreensão.
1.1.2 Escrever Introdução [2.0]
1.1.3 Escrever Revisão de Literatura [6.0]
1.1.4 Escrever pesquisa de produto [10.0]
1.1.5 Escrever plano para o 2º período [6.0]

1.2 Documentação de projeto


1.2.1 Escreva uma documentação de design para fornecer informações sobre o projeto projetado e o
processo usado.
1.2.2 Especificação de requisitos de gravação [4.0]
1.2.3 Descrever a solução atual, bem como a solução proposta [2.0]
1.2.4 Criar design de dados [2.0]
1.2.5 Criar design de arquitetura [3.0]
1.2.6 Criar design de interface [5.0]
1.2.7 Criar design de procedimento [3.0]

1.3 Implementação
1.3.1 Coletar e armazenar dados de mídias sociais
1.3.1.1 Os dados de várias mídias sociais serão raspados dos sites usando scripts Python.
Isso permitirá que eles sejam analisados posteriormente.

46
1.3.1.2 Raspe dados do Twitter. [10.0]
1.3.1.3 Raspe dados do Instagram. [10.0]
1.3.1.4 Raspe dados do Facebook. [10.0]
1.3.2 Coletar e armazenar referências de indexação.
1.3.2.1 Armazene várias palavras e frases em um documento e indexe-as com base em quão
positivas ou negativas as palavras aparecem por meio de uma combinação de pesquisa (80%) e suposições
pessoais com base na relevância da idade do desenvolvedor (20%).
1.3.2.2 Pesquise e reúna palavras e frases para obter uma taxa de
positividade. [5.0]
1.3.2.3 Insira-os em um documento e estabeleça as proporções para cada
entrada de dados. [5.0]
1.3.3 Criar uma representação visual dos dados
1.3.3.1 Usando um sistema de dashboard como o Tableau, crie uma visualização física dos
resultados da pesquisa para mostrar ao cliente.
1.3.3.2 Importe dados para o sistema de painel. [1.0]
1.3.3.3 Exiba os dados dentro do sistema usando várias tabelas e gráficos para facilitar a
visualização pelo Cliente. [10.0]

1.4 Relatório de Avaliação


1.4.1 Escrever um relatório de avaliação do projeto para avaliar os resultados positivos e negativos,
bem como estabelecer se a investigação inicial foi um sucesso.
1.4.2 Escreva um resumo executivo. [1.0]
1.4.3 Escreva a introdução ao projeto. [2.0]
1.4.4 Escreva o propósito e os objetivos da avaliação. [5.0]
1.4.5 Escreva uma avaliação da metodologia. [4.0]
1.4.6 Avaliar os resultados do projeto [10.0]
1.4.7 Avaliar as áreas de melhoria [2.0]
1.4.8 Escrever conclusão e recomendação para o negócio [3.0]'

12.3 Apêndice C: Código do Notebook Python Jupyter


importação tweepy
access_token = '312899257-
ZjXYlHt8PQSXuUrNc2HunsANmP7eUi9Htt7crV1T'
access_token_secret =
'Otko0azkxW46bAki1ph1OPOWX4NhII7yi3ng41e5HGNdR'
consumer_key = 'iXsoJx26WfBePQscEMPMCaabg' consumer_secret =
'fK0TWiME7CSRSV8CaoOIyUXwQ3VlRlP4NsAHcx2OCU86HyWm6B'
# Criando o objeto de autenticação
auth = tweepy. OAuthHandler(consumer_key, consumer_secret)
# Definindo seu token de acesso e segredo
auth.set_access_token(access_token, access_token_secret)
# Criando o objeto API ao passar informações de autenticação api =
tweepy. API(auth)
# Usando o objeto API para obter tweets de sua linha do tempo e
armazenando-o em uma variável chamada public_tweets public_tweets =
api.home_timeline()
# foreach através de todos os tweets puxados
para tweet em public_tweets:
# imprimindo o texto armazenado dentro do objeto tweet
impressão(tweet.user.screen_name)
impressão(tweet.text)
impressão(tweet.user.location)
impressão()

# Criando o objeto API ao passar informações de autenticação api =

47
tweepy. API(auth)
# O termo de pesquisa que você deseja encontrar
query = "Universidade de Greenwich"
# Código do idioma (segue os padrões ISO 639-1) idioma = "en"
# Chamando a função user_timeline com nossos parâmetros resultados
= api.search(q=query, lang=language, count=100)
# foreach através de todos os tweets puxados
Para tweetar nos resultados:
if (não tweet.retweeted) e ('RT @' não em tweet.text):
# imprimindo o texto armazenado dentro do objeto tweet
print(tweet.user.screen_name,"Tweeted:",tweet.text)
print()
Importar CSV
# Criando o objeto API ao passar informações de autenticação api =
tweepy. API(auth)
# Abrir/Criar um arquivo para acrescentar dados
csvFile = aberto('asos3.csv', 'a')
#Use csv Writer csvWriter = csv.writer(csvFile)
# Chamando a função user_timeline com nossos parâmetros resultados
= api.search(q=query, lang=language, count=500)
Para tweetar nos resultados:
if (não tweet.retweeted) e ('RT @' não em tweet.text):
#Write uma linha para o arquivo csv / Eu uso codificar utf-8
csvWriter.writerow([tweet.created_at,
tweet.user.screen_name, tweet.text])

csvFile.close()

12.4 Apêndice D: Código de Análise Semântica


Importar CSV
# Criando o objeto API ao passar informações de autenticação api =
tweepy. API(auth)
# Abrir/Criar um arquivo para acrescentar dados
csvFile = aberto('zara 10 abril 23 00.csv', 'a')
# Usar o gravador csv
csvWriter = csv.writer(csvFile)
# Chamando a função user_timeline com nossos parâmetros
Resultados = api.search(q=query, lang=language, count=100)
classificação = 0
contador = 0
finalRating = 0

Para tweetar nos resultados:

48
if (não tweet.retweeted) e ('RT @' não em tweet.text):
#Write uma linha para o arquivo CSV
se 'abismal' em tweet.text ou 'terrível' em
tweet.text ou 'terrível' em tweet.text ou 'horrível' em tweet.text
ou 'terrível' em tweet.text ou 'muito ruim' em tweet.text ou 'muito
ruim' em tweet.text ou ' 3 ' em tweet.text ou '6)' em tweet.text ou
' 6)' em tweet.text ou
em tweet.text ou 'pior' em tweet.text ou 'indignado' em
tweet.text ou 'nojento' em tweet.text ou 'hate' em tweet.text:
rating = rating + 1
contador += 1
se 'lixo' em tweet.text ou 'insatisfatório' em
tweet.text ou 'ruim' em tweet.text ou 'pobre' em tweet.text ou '6'
em tweet.text ou '2' em tweet.text ou ':(' em tweet.text ou '):' em
tweet.text ou ' • ' em tweet.text ou 'annoy' em tweet.text ou
'annoy' em tweet.text ou

'mijo' em tweet.text ou 'errado' em tweet.text ou 'ridículo' em


tweet.text ou 'sucks' em tweet.text ou 'esperando' em tweet.text:
classificação = classificação + 2 contador += 1
se 'muito ruim' em tweet.text ou 'muito ruim' em
tweet.text ou 'um pouco ruim' em tweet.text ou 'abaixo da média' em
tweet.text ou 'W' em tweet.text ou '63' em tweet.text ou '' em
tweet.text ou '' em tweet.text ou '' em tweet.text ou 'delay' em
tweet.text ou 'delay' em tweet.text ou 'risível' © em tweet.text:
classificação = classificação + 3 contador += 1
se 'medíocre' em tweet.text ou em tweet.text ou
'SP' em tweet.text ou 'G' em tweet.text ou '0' em tweet.text ou '$'
em tweet.text ou 'not shocked' em tweet.text ou ' ' em tweet.text:
classificação = classificação + 4 contador += 1
se 'médio' em tweet.text ou 'not bad' em tweet.text
ou 'fair' em tweet.text ou 'alright' em tweet.text ou 'ok' em
tweet.text ou 'ok' em tweet.text ou 'satisfatório' em tweet.text ou
'fine' em tweet.text ou 'um pouco bom' em tweet.text ou 'um pouco
bom' em tweet.text ou ‘6’ em tweet.texto ou 't ' em
tweet.text ou ' (' em
tweet.text ou ‘6’ emtweet.texto ou '60 ' em tweet.text ou ' S' em
tweet.text ou emtweet.texto ou 'omg' em tweet.text ou 'mas' em
tweet.text ou 'reembolso' em tweet.text:
classificação = classificação + 5 contador += 1
se 'muito bom' em tweet.text ou 'decente' em
tweet.text ou 'acima da média' em tweet.text ou 'muito bom' em
tweet.text ou 'bom' em tweet.text ou ' 6 ' em tweet.text ou 'L ' em
tweet.text ou em tweet.text ou ' 5 ' em tweet.text ou 'U' em
tweet.text ou ' like' em tweet.text:
classificação = classificação + 6 contador += 1
se 'ótimo' em tweet.text ou 'gr8' em tweet.text ou
'realmente bom' em tweet.text ou 'rlly good' em tweet.text ou 'very
good' em tweet.text ou 'v good' em tweet.text ou '' 9' em
tweet.text ou ‘6’ emtweet.texto ou 'C9' emtweet.texto ou
'O' em tweet.texto
ou 'de' em tweet.texto ou ‘5’ emtweet.texto ou «W

49
em tweet.texto
ou ':)' em tweet.text ou '(:' em tweet.text ou ' *' em tweet.text
ou ‘%‘ em tweet.texto ou ‘6’ emtweet.texto ou
‘%‘ em tweet.texto
ou ‘0‘ em tweet.texto ou 'G' em tweet.texto:
classificação = classificação + 7 contador += 1
<7X UNIVERSIDADE DE 49 GREENWICH 1
Índice 3
1 Secção 1: Introdução 5
2 Seção 2: Revisão da Literatura 6
Quão bom é "bom"? Agora com ainda mais palavras! 12
YouGov 13
3 Seção 3: Pesquisa de Produtos 15
3.4 Modelo de Pontuação Ponderada 18
4 Seção 4: Questões e Considerações Legais, Sociais, Éticas e Profissionais 19
5 Seção 5: Requisitos e Metodologia 20
5.5 Metodologia 21
5.6 Justificação da adequação de uma Metodologia ou de um Quadro seguido 23
6 Projetar 23
6.1 Diagrama de caso de uso UML 23
7 Processo de Desenvolvimento 25
7.1 Estágio 1: Busca inicial de código Python 25
7.2 Etapa 2: Implementação da Análise Semântica 29
7.2.1 Iteraçã o 1 29
7.2.2 Iteraçã o 2 29
7.2.3 Iteraçã o 3 29
7.3 Estágio 3: Agrupando os dados no Excel 30
7.4 Etapa 4: Criando visualizações de dados 31
7.5 Caixa de Tempo 34
7.6 Potenciais abordagens alternativas 34
8 Teste 35
9 Avaliação 36
9.1 Avaliação do Produto 36
9.2 Auto-Avaliação 37
10 Conclusão 39
10.1 Conclusões sobre Reputação 39
10.2 Conclusões relativas à Rentabilidade 42
11 Bibliografia 43
12 Apêndices 45
12.1 Apêndice A: Figuras 45

50
12.2 Apêndice B: Relatório contextual 46
12.3 Apêndice C: Código do Notebook Python Jupyter 47
12.4 Apêndice D: Código de Análise Semântica 48
12.5 Apêndice E: Fórmulas de planilha do Excel 51
12.6 Apêndice F: Visualizações de dados do Tableau 53
:o 54
12.7 Apêndice G: Ensaios 57

classificação = classificação + 8 contador += 1


se 'soberbo' em tweet.text ou 'brilhante' em
tweet.text ou 'incrível' em tweet.text ou 'excelente' em tweet.text
ou 'excelente' em tweet.text ou em tweet.text ou em tweet.text ou
em tweet.text ou 'O' em tweet.text ou '1' em tweet.text ou
'love ' em tweet.text:
classificação = classificação + 9
contador += 1
se 'perfeito' em tweet.text: rating = rating + 10
contador += 1
se contador == 0: classificação = 0 mais:
finalRating = classificação/contador
csvWriter.writerow([consulta, tweet.created_at,
tweet.user.screen_name, tweet.text, finalRating])
rating = 0 contador = 0 finalRating = 0
csvFile.close()

12.5 Apêndice E: Fórmulas de planilha do Excel

G H Eu J

NOME DA EMPRESA NÃO. DOS TWEETS SOMA DOS TWEETS MÉDIA

ASOS =CONTARSE(A1:A485,"ASOS") =SOMASE(A1:A485,"ASOS",E1:E485) =I2/H2

BOOHOO =COUNTIF(A1:A485,"Boohoo") =SUMIF(A1:A485,"Boohoo",E1:E485) =I3/H3

H&M =CONTAGEM(A1:A485,"H&M") =SOMASE(A1:A485,"H&M",E1:E485) =I4/H4

SAUDADES =COUNTIF(A1:A485,"Missguided") =SOMASE(A1:A485,"Missguided",E1:E485) =I5/H5

NASTY GAL =COUNTIF(A1:A485,"Nasty Gal") =SUMIF(Al:A485,"Nasty Gal",El:E485) =I6/H6

ZARA =COUNTIF(Al:A485,"Zara") =SOMA SE (A 1 :A485,"Zara",E 1 :E485) =17/H7

51
NOME DA EMPRESA NQ. QF5EMANTJC Tiff£EIS£i AMOSTRA

ASOS =CONTARSE(A1:A485,"ASOS")

BOOHOO =COUNTIF(Al:A484,"Boohoo")

H&M =CONTAGEM(A1:A485,"H&M")

SAUDADES =COUNTIF(Al:A484,"Missguided")

NASTY GAL =COUNTIF(Al:A485,"Nasty Gal")

ZARA =COUNTIF(Al:A485,"Zara")

Total: =SOMA(P2:P7)

R S

HORA TWEETS POR HORA

0.0416666666666667 =CONTADORES(B2:B485,">=01:00",B2:B485,"<02:00")

0.0833333333333333 =CONTADORES(B2:B485,">=02:00",B2:B485,"<03:00")

0.125 =CONTADORES(B2:B485,">=03:00",B2:B485,"<04:00")

0.166666666666667 =CONTADORES(B2:B485,">=04:00",B2:B485,"<05:00")

0.208333333333333 =COUNTIFS(B2:B485,">=05:00",B2:B485,"<06:00")

0.25 =CONTADORES(B2:B485,">=06:00",B2:B485,"<07:00")

0.291666666666667 =COUNTIFS(B2:B485,">=07:00",B2:B485,"<08:00")

0.333333333333333 =CONTADORES(B2:B485,">=08:00",B2:B485,"<09:00")

0.375 =CONTADORES(B2:B485,">=09:00",B2:B485,"<10:00")

0.416666666666667 =COUNTIFS(B2:B485,">=10:00",B2:B485,"<11:OO")

0.458333333333333 =CONTADORES(B2:B485,">=11:00",B2:B485,"<12:00")

0.5 =CONTADORES(B2:B485,">=12:00",B2:B485,"<13:00")

0.541666666666667 =COUNTIFS(B2:B485,">=13:00",B2:B485,"<14:00")

0.583333333333333 =COUNTIFS(B2:B485,">= 14:00",B2:B485,"<15:00")

0.625 =COUNTIFS(B2:B485, ">=15:00",B2:B485,"<16:00")

0.666666666666667 =C0UNTIFS(B2:B485,">=16:00",B2:B485,"<17:00")

0.708333333333333 =CONTADORES(B2:B485,">=17:00",B2:B485,"<18:00")

0.75 =COUNTIFS(B2:B485,">=18:00",B2:B485,"<19:00")

0.791666666666667 =CONTADORES(B2:B485,">=19:00",B2:B485,"<20:00")

0.833333333333333 =CONTADORES(B2:B485,">=20:00",B2:B485,"<21:00")

0.875 =CONTADORES(B2:B485, ">=21:00",B2:B485,"<22:00")

0.916666666666667 =COUNTIFS(B2:B485,">=22:OO",B2:B485,"<23:OO")

0.958333333333333 =CONTADORES(B2:B485,">=23:00",B2:B485,"<=23:59")

0 =CONTADORES(B2:B485,">=00:00",B2:B485,"<01:00")

52
Número ASOS

1 =COU NTI FS(A1 :A485,"ASOS", el: E485,1)

2 =CONTADORES(A1:A485,"ASOS",E1:E485,2)

3 =COUNTIFS(Al:A485,"ASOS"/El:E485,">=3",El:E485 /'<=3.9")

4 =CONTADORES(A1:A485,"ASOS"/E1:E485/">=4",E1:E485,"<=4,9")

5 =CONTADORES(A1:A485,"ASOS",E1:E485,">=5"/E1:E485,"<=5,9")

6 =COUNTIFS(Al:A485,"ASOS",El:E485/">=6"/El:E485,"<=6.9")

7 =CONTADORES(A1:A485,"ASOS"/E1:E485,">=7",E1:E485,"<=7,9")

8 =CONTADORES(A1:A485,"ASOS",E1:E485,">=8",E1:E485,"<=8,9")

9 =CONTADORES(A1:A485,"ASOS",E1:E485,">=9",E1:E485,"<=9,9")

10 =CONTADORES(A1:A485,"ASOS"/E1:E485,10)

12.6 Apêndice F: Visualizações de dados do Tableau

53
Filtros Padrão de nome da
Classificação semântica média por empresa

empresa
Empresa N..
■ ASOS
■ Boohoo
Missguided 6.232
■ H&M
Marcas H&M Zara
milh 6.174 milh 6.111 ■ Saudades
000 Automático- Boohoo ■ Gal desagradável
5.948

:o
Cor Etiqueta de tamanho
Nasty Gal
ASOS
I 5.435
5.117
■ Zara

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5
Detalhe Dica de ferramenta
Avg. Classificação semântica =

Empresa Nam..
AVG(Semântica.
.

54
55
Página lii Colunas Nome da Empresa
s fo..
:= Linhas r MEDIAN(Total No. De..

Filtros Nome da empresa Tot...


Total nº. De Tweets na Página do Twitter da ■ ASOS
Nome da empresa para
T.. Empresa ■ BOOHOO
■ H&M
■ SAUDADES
Marcas
1400K ■ NASTY GAL
■ ZARA
Oo0
Automático

1200K

Q
Dica de
ferrame

Empresa Nam.. 1O00K


L
2

80OK

600K

400K

ZOOK

ASOS BOOHOO MISSGUI.. H&M ZARA NASTY


GAL

Estatísticas Básicas Relativas aos


Dados Coletados
Total nº. De Tweets na Página do Twitter da Proporção de Tweets Semânticos por
Empresa Nome da Empresa para o Número Total
Empresa
de Tweets

1000K

LIVRO
36
ZARA
128
72 GAL
ASOS
NASTY

ASOS BOOHOO MISSGUIDED H&M ZARA NASTY GAL

Tweets por Hora

97
MISSGUIDED
103

2324 67g
BOOHOO

48
I //>9
1
H&M

//10

Análise Semântica
da Estatística

56
Análise dos dados coletados

12.7 Apêndice G: Ensaios

Teste Visualização Teste realizado Resultado Esperado Resultado Real Passa/


Número falha?

1 Nuvem de Garantir que os A palavra "fofa" deve A palavra "bonito" Passar


palavras dados sejam aparecer 8 vezes se aparece 8 vezes, 10 se
exibidos com inserida na Planilha do você incluir Tweets
precisão Excel duplicados, o que o
Tableau nega quando
importa os dados
2 Nuvem de Clicar em uma Palavra deve aparecer O resultado esperado Passar
palavras palavra realçada com o número
de vezes que aparece, o
resto das palavras estão
acinzentadas
3 Nuvem de Selecionando várias Todas as palavras devem O resultado esperado Passar
palavras palavras aparecer destacadas com
o número de vezes que
aparecem, o resto das
palavras estão
acinzentadas

57
4 Nuvem de Garantindo que o Passar o mouse sobre a O resultado esperado Passar
palavras recurso de foco palavra mostra o número
funcione de vezes que ela é
mencionada no conjunto
de dados
5 Classificação Verifique se os Verifique se os O resultado esperado Passar
semântica média dados são exibidos resultados estão
corretamente correlacionados com a
"Tabela de Médias" na
6 Classificação Clicando em uma A barra deve aparecer O resultado esperado Passar
semântica média barra realçada enquanto o
restante do gráfico está
acinzentado
7 Classificação Selecionando várias As barras devem O resultado esperado Passar
semântica média barras aparecer realçadas
enquanto o restante do
gráfico está acinzentado
8 Classificação Garantindo que o Passar o mouse sobre O resultado esperado Passar
semântica média recurso de foco uma barra mostra a
funcione classificação semântica
média dessa empresa
9 Tweets por hora Verifique se os Confira 11h para ver se Classificação e filtro de Falhar
Gráfico de pizza dados são exibidos Planilha também dá planilha dá 39
corretamente resultado de 38
10 Tweets por hora Verifique se os Confira 11h para ver se O resultado esperado Passar
Gráfico de pizza dados são exibidos Planilha também dá
corretamente (v2) resultado de 39
11 Tweets por hora Clicando em um O segmento deve O resultado esperado Passar
Gráfico de pizza segmento aparecer realçado
enquanto o restante do
gráfico de pizza está
12 Tweets por hora Selecionando vários Os segmentos devem O resultado esperado Passar
Gráfico de pizza segmentos aparecer realçados
enquanto o restante do
gráfico de pizza está
13 Tweets por hora Garantindo que o Passar o mouse sobre um O resultado esperado Passar
Gráfico de pizza recurso de foco segmento mostra o
funcione número de Tweets
correspondentes àquela
hora
14 Tweets Verifique se os Verifique se "ASOS" no O resultado esperado Passar
semânticos por dados são exibidos filtro na planilha do
empresa corretamente Excel é igual a 128
15 Tweets Clicando em um O segmento deve O resultado esperado Passar
semânticos por segmento aparecer realçado
empresa enquanto o restante do
gráfico de pizza está
16 Tweets Selecionando vários Os segmentos devem O resultado esperado Passar
semânticos por segmentos aparecer realçados
empresa enquanto o restante do
gráfico de pizza está
17 Tweets Garantindo que o Passar o mouse sobre um O resultado esperado Passar
semânticos por recurso de foco segmento mostra o
empresa funcione número de Tweets dessa
empresa no conjunto de
dados

58
18 Tweets por Verifique se os Verifique se existem 5 O resultado esperado Passar
classificação por dados são exibidos tweets para Missguided
empresa corretamente com uma classificação
entre 3-3.9
19 Tweets por Clicando em uma A barra deve aparecer O resultado esperado Passar
classificação por barra realçada enquanto o
empresa restante do gráfico está
acinzentado
20 Tweets por Selecionando várias As barras devem O resultado esperado Passar
classificação por barras aparecer realçadas
empresa enquanto o restante do
gráfico está acinzentado
21 Tweets por Garantindo que o Passar o mouse sobre O resultado esperado Passar
classificação por recurso de foco uma barra mostra o
empresa funcione número de Tweets dessa
classificação e da
22 Número total de Clicando em uma A barra deve aparecer O resultado esperado Passar
tweets na página barra realçada enquanto o
da empresa no restante do gráfico está
Twitter acinzentado
23 Número total de Selecionando várias As barras devem O resultado esperado Passar
tweets na página barras aparecer realçadas
da empresa no enquanto o restante do
Twitter gráfico está acinzentado
24 Número total de Garantindo que o Passar o mouse sobre O resultado esperado Passar
tweets na página recurso de foco uma barra mostra o
da empresa no funcione número de Tweets das
Twitter páginas do Twitter dessa
empresa
25 Painel de Coleta O link do botão O resultado esperado Passar
de Estatísticas Garantir que a Entrar no modo de
Análise de apresentação e clicar no
Estatísticas funcione botão deve transferir o
no Modo de usuário para o painel de
Apresentação análise de estatísticas
26 Análise do Painel Entrar no modo de O resultado esperado Passar
de Estatísticas Garantir que o botão apresentação e clicar no
vinculado à Coleta botão deve transferir o
de Estatísticas usuário para o Painel de
funcione no Modo Estatísticas de Coleta
de Apresentação
27 Painel de Coleta Garantir que o link Clicar no botão enquanto O resultado esperado Passar
de Estatísticas do botão Análise de estiver na versão pública
estatísticas funcione da pasta de trabalho do
no Tableau Public Tableau deve transferir o
usuário para o Painel de
análise de estatísticas
28 Análise do Painel Garantir que o link Clicar no botão enquanto O resultado esperado Passar
de Estatísticas do botão para estiver na versão pública
coletar estatísticas da pasta de trabalho do
funcione no Tableau Tableau deve transferir o
Public usuário para o Painel de
coleta de estatísticas

59

Você também pode gostar