Escolar Documentos
Profissional Documentos
Cultura Documentos
DE 49 GREENWICH
COMP1682: Projeto de Conclusão de Curso
Uma investigação sobre se uma empresa mais ativa nas redes sociais é mais
"bem-sucedida" do que uma com menos presença online
Nome do Aluno
000111111
Abstrair
O Projeto tem como objetivo descobrir se as Empresas que usam as Redes Sociais como ferramenta de
marketing para se conectar com os Clientes têm uma melhor reputação e/ou são mais lucrativas do que uma
Empresa sem uma, ou com uma presença online muito pequena.
1
Agradecimentos
O projeto criado não teria sido possível sem muitas pessoas ótimas que me incentivaram ao longo dos últimos
quatro anos, obrigado.
Também um enorme obrigado à minha família por ter comigo como a primeira pessoa a ir para a
Universidade: minha mãe por sempre garantir que eu estivesse bem e oferecer lanches quando necessário, meu
pai por sempre acreditar em mim desde o momento em que eu disse a ele que queria entrar em Ciência da
Computação, dizendo que eu poderia fazer qualquer coisa desde o momento em que comecei a estudar.
Minhas irmãs também precisam de reconhecimento extra por fornecer viagens para Byron Burger e
McDonalds, e verificações gramaticais/ortográficas sempre que eu precisar delas.
2
Índice
<7X UNIVERSIDADE DE 49 GREENWICH.....................................................................................1
Índice..........................................................................................................................................3
1 Secção 1: Introdução...........................................................................................................5
2 Seção 2: Revisão da Literatura...........................................................................................6
Quão bom é "bom"? Agora com ainda mais palavras!................................................12
YouGov................................................................................................................................13
3 Seção 3: Pesquisa de Produtos..........................................................................................15
3.4 Modelo de Pontuação Ponderada..............................................................................18
4 Seção 4: Questões e Considerações Legais, Sociais, Éticas e Profissionais.....................19
5 Seção 5: Requisitos e Metodologia...................................................................................20
5.5 Metodologia...............................................................................................................21
5.6 Justificação da adequação de uma Metodologia ou de um Quadro seguido.............23
6 Projetar.................................................................................................................................23
6.1 Diagrama de caso de uso UML.................................................................................23
7 Processo de Desenvolvimento..............................................................................................25
7.1 Estágio 1: Busca inicial de código Python................................................................25
7.2 Etapa 2: Implementação da Análise Semântica.........................................................29
7.2.1 Iteraçã o 1.............................................................................................................29
7.2.2 Iteraçã o 2.............................................................................................................29
7.2.3 Iteraçã o 3.............................................................................................................29
7.3 Estágio 3: Agrupando os dados no Excel..................................................................30
7.4 Etapa 4: Criando visualizações de dados........................................................................31
7.5 Caixa de Tempo.........................................................................................................34
7.6 Potenciais abordagens alternativas............................................................................34
8 Teste..................................................................................................................................35
9 Avaliação..........................................................................................................................36
9.1 Avaliação do Produto................................................................................................36
9.2 Auto-Avaliação..........................................................................................................37
10 Conclusão............................................................................................................................39
10.1 Conclusões sobre Reputação.....................................................................................39
10.2 Conclusões relativas à Rentabilidade...........................................................................42
11 Bibliografia.........................................................................................................................43
12 Apêndices............................................................................................................................45
12.1 Apêndice A: Figuras.....................................................................................................45
12.2 Apêndice B: Relatório contextual................................................................................46
12.3 Apêndice C: Código do Notebook Python Jupyter......................................................47
12.4 Apêndice D: Código de Análise Semântica.................................................................48
3
12.5 Apêndice E: Fórmulas de planilha do Excel.............................................................51
12.6 Apêndice F: Visualizações de dados do Tableau......................................................53
:o......................................................................................................................................................54
12.7 Apêndice G: Ensaios.................................................................................................57
1.1
4
1 Secção 1: Introdução
1.1 Fundo
Sempre foi importante para as empresas comercializar seus produtos e, na última década, o público começou
a perceber como as mídias sociais se tornaram cada vez mais importantes na publicidade das empresas. As
pessoas usam as Redes Sociais para expressar qualquer opinião, emoção, preocupação ou reclamação que
tenham em relação aos produtos e serviços que utilizam. Na maioria das vezes, os consumidores estão
postando porque querem uma resposta de algum tipo do público em geral ou da própria empresa.
Este projeto tentará identificar se há uma ligação entre uma empresa com uma boa estratégia on-line e se isso
tem um efeito sobre sua reputação geral – e a quantidade de lucros obtidos – em comparação com os lucros de
empresas que usam as mídias sociais com menos frequência, ou talvez nem isso.
Na era digital moderna, com muitos compradores on-line pertencentes às gerações Millennial ou Gen-Z, as
empresas estão tentando aumentar suas posições nas mídias sociais, pois acreditam que uma boa presença nas
mídias sociais leva a um aumento no relacionamento, reputação e, portanto, um aumento nos lucros. O
projeto criará um conjunto de dados a partir de postagens nas redes sociais, analisará a positividade ou
negatividade da frase e transformará esses dados em visualizações para exibir as emoções dos públicos de
várias empresas.
O cliente deste projeto e relatório é um varejista de roupas de rua em ascensão. Eles estão determinando se
devem investir em uma presença on-line em uma tentativa de aumentar sua lucratividade, pois isso envolveria
a contratação de pessoal de atendimento ao cliente para monitorar as mídias sociais, fotógrafos para fazer
upload de postagens de alta qualidade, o que, portanto, exigiria muito tempo e dinheiro.
1.3 Aproximação
Este relatório começa discutindo uma revisão da literatura na Seção 2 e prossegue investigando produtos
similares que existem no mercado na Seção 3. Seguem-se as possíveis considerações jurídicas, sociais, éticas
e políticas na Seção 4, e uma discussão dos requisitos e da metodologia usada para o desenvolvimento na
Seção 5. A secção 6 concentra-se nos planos de concepção do projecto, a secção 7 demonstrará as etapas
tomadas durante cada fase do processo de desenvolvimento. A Seção 8 analisa o teste e a verificação das
capacidades do projeto, a Seção 9 é centrada na avaliação do projeto, bem como do Desenvolvedor. A secção
10 conclui com as conclusões do projecto global.
5
2 Seção 2: Revisão da Literatura
2.1 Abordagem da pesquisa bibliográfica
A pesquisa realizada para o projeto foi uma combinação de várias fontes online e físicas, para identificar
quaisquer tendências em Social Media Marketing/Social Customer Relationship Management, ou suposições
que já existem dentro do setor de mercado. Como a área de marketing de mídia social é um tópico
relativamente novo dentro da tecnologia, não há uma abundância de textos físicos amplos apoiando ou
negando qualquer argumento em relação a isso. De fato, muitos livros/textos físicos sobre o tema estão
focados nas fórmulas utilizadas para analisar os dados encontrados, em vez de opinar a favor ou contra o uso.
As fontes on-line, como revistas, artigos e outros sites, permitem obter material muito mais moderno, em
relação a uma maior variedade de opiniões e estudos nos últimos anos; Assim, a maioria das fontes e
materiais ao longo da revisão da literatura é on-line.
Dentro da sociedade moderna, tornou-se uma provação mensal testemunhar uma marca fazer um negócio
falso. A seguir:
1) A maioria dos meios de comunicação discutiria isso em detalhes.
2) O público, clientes ou não, então compartilha suas opiniões e indignações em suas mídias sociais
pessoais, ou nas mídias sociais da empresa.
3) A empresa provavelmente emitiria um pedido de desculpas e excluiria todas as evidências de tais
falsidades.
4) O mundo seguiria em frente.
Somente em 2018, o Snap Chat perdeu quase US$ 2 bilhões de celebridades que compartilharam seu novo
distain para a empresa em relação a algumas mudanças na interface do usuário, bem como alguns anúncios
antiéticos sendo aprovados (Bullock, 2018). O IHOP nos EUA perdeu milhões de dólares mudando sua marca
de IHOB para IHOP depois que a nova mudança de nome para "International House of Burgers" foi recebida
horrivelmente em todo o mundo, resultando em clientes e inúmeras empresas zombando deles por tentarem a
mudança (Tobin, 2018) (Roberts, 2018). Houve indignação em janeiro com as escolhas de modelos da H&M
em relação a moletons com temática animal em sua coleção infantil, resultando em perda de lucro, e
protestos/tumultos em algumas de suas lojas em toda a África do Sul (Fortin, 2018).
Desde o rápido desenvolvimento da tecnologia, a informação é significativamente mais fácil de descobrir nos
dias modernos do que era há apenas uma década, o que permitiu que o fenômeno global da mentalidade da
máfia se espalhasse. Isso significa que um erro de marketing que pode ter sido encoberto no passado, é
colocado sob o microscópio e analisado nos dias atuais. Essa mentalidade de máfia ou indignação tende a ter
um efeito contínuo na reputação de uma empresa e, portanto, todas as empresas devem ser especialmente
cautelosas com seu marketing e mídias sociais.
6
6 M&'s 61.3 6 M&'s 59.1
7 Amazona 59.3 7 Google 56.3
Notavelmente, de acordo com uma Pesquisa sobre Confiança de Marca da YPulse, as marcas que têm os
maiores índices de fidelidade entre os Millennials/Gen-Z são aquelas que tendem a anunciar nas mídias
sociais e têm uma grande presença online, como Nike (Joseph, 2017), Oreo (O'flynn, 2017) e M&M's
(Marketing Week, 2018), bem como as marcas domésticas típicas, como Amazon e Apple.
De acordo com (Edosomwan, Kalangot Prakasan, Kouame, Watson, & Seymour, 2011), "a mídia social pode
ser chamada de estratégia e um veículo para a transmissão, enquanto as redes sociais são uma ferramenta e
uma utilidade para se conectar com os outros", e se alinha com a visão comum de negócios de que "Se o
objetivo de uma empresa é alcançar os clientes onde eles estão, uma presença nas redes sociais parece
necessária." (Adams-Mott, 2018).
Esse consenso geral é o que tem levado as empresas a segmentar seus clientes on-line, usando aplicativos de
mídia social em vez de métodos tradicionais de publicidade, como em um jornal, no rádio ou na televisão. Por
exemplo, uma pesquisa mostrou que jovens de 17 a 35 anos pegam seus telefones de 50 a 75 vezes por dia
(Eadicicco, 2015), enquanto em um estudo divulgado pela Music Business Association, apenas 12% dos
jovensmillennials ouviam rádio e 51% ouviam serviços de streaming como Spotify ou Apple Music
(McIntyre, 2016).
Além disso, 67% dos Millennials pagam por 1-3 serviços de streaming como alternativa a pagar por televisão
a cabo ou assistir a canais de TV que exigem uma licença de TV, devido à liberdade que eles têm sobre o que
querem assistir, a falta de publicidade quebra por toda parte, tudo por um preço muito mais baixo do que a
família típica pagaria pela televisão a cabo (Arnold, 2017).
O Customer Relationship Management (CRM) tem existido como uma abordagem para gerenciar as trocas de
uma empresa com clientes atuais – e potenciais – usando análise de dados. Embora a ideia de sistemas de
marketing baseados no clientetenha sido discutida ao longo da década de 1980, amplamente trazida pelo
sistema de marketing de banco de dados de Robert e Kate Kestnbaum (CRM Switch, 2013), o primeiro
sistema criado com foco especializado em CRM não foi até a Siebel Systems em 1993.
Esse novo sistema e seus ideais foram bem recebidos pelos revolucionários, como (Gates, 1999) disse certa
vez "como você coleta, gerencia e usa informações determinará se você ganha ou perde". Essa ideia de coletar
e analisar informações, como tendências baseadas no cliente, abriu caminho para a Gestão de Relacionamento
com o Cliente que vemos hoje, ou seja, "Os clientes que se envolvem em uma conversa na página de marca de
mídia social de uma empresa esperam atenção e resolução para suas preocupações da empresa, assim como
fariam em um canal de CRM tradicional, como telefone ou e-mail". (Ajmera, Ahn, Nagarajan, Verma, &
Contratante, 2013). Devido a isso, pode-se argumentar que as interações de mídia social que você vê os
clientes tendo todos os dias com as empresas on-line é um dos usos mais eficazes do CRM nos dias atuais.
7
2.4.1 Benefícios do CRM com Social Media Marketing
O Social Customer Relationship Management envolve o uso de serviços de mídia social e tecnologia para
permitir que as empresas se comuniquem melhor com sua base de clientes, como descobrir a quantidade de
tráfego na web, o número de "seguidores" em mídias sociais específicas, bem como a quantidade de menções
que uma empresa pode receber nesses sites (Castronovo & Huang, 2012). Enquanto o CRM tradicional foi
desenvolvido na década de 80, o Social CRM só começou a se tornar um tópico de conversa na última década
devido ao aumento de usuários nas mídias sociais ao longo desse período de tempo.
É importante notar, no entanto, que, enquanto o CRM tradicional se baseia em "coletar e gerenciar dados
atuais do cliente", o CRM Social é "mais uma estratégia para o engajamento do cliente", pois permite que as
empresas rastreiem as comunicações de vendas, bem como as interações nas mídias sociais. O Social CRM
ajudou a criar um caminho para clientes em potencial, conversando com eles em sua própria plataforma de
mídia social preferida, e os ajuda a compartilhar suas próprias experiências com milhares de outras pessoas
on-line (Rouse, 2017).
8
Juros de horas extras © •<>«
A partir de outubro de 2018, as marcas 'High Street' que foram classificadas como "as mais bem-sucedidas
nas mídias sociais do Reino Unido", de acordo com a Red Hot Penny, são varejistas mais caras, como Nike,
Adidas, Tommy Hilfiger, Doc Martens e Marks Spencer. Essas marcas "demonstram que conhecem seu
público em todos os canais e podem envolvê-lo ativamente de forma natural". (Red Hot Penny, 2018). Isso
pode, no entanto, decorrer do "efeito bandwagon" (Coleman, 2003), já que as marcas são todas nomes
conhecidos de longo prazo, portanto, pode haver um leve viés. Isso deixa uma lacuna no mercado, ou seja, por
alternativas mais baratas, com as quais as empresas digitais podem se engajar.
Se você fosse investigar essas cinco empresas e excluir as duas com os preços mais altos (Tommy Hilfiger e
Doc Martens), as marcas têm cada uma mais de 30.000 tweets em seus respectivos Twitters de empresas. A
Nike (@nike), por exemplo, tem mais de 35.500 tweets, apesar de seus últimos quatro tweets postados (em
2019) terem sido dois meses antes, novembro de 2018. Isso ocorre porque sua conta no Twitter passa horas
respondendo aos tweets do Cliente, negativos ou positivos, para mostrar à sua base de clientes que eles estão
cuidando deles como uma forma de fidelizá-los.
Em uma escala muito maior, Marks & Spencer (@marksandspencer), tem mais de 416.000 tweets, e ao longo
de seu dia de trabalho (8h às 22h) responde a centenas de clientes, direcionando reclamações para sua caixa
de entrada de mensagens diretas ou endereços de e-mail para que as preocupações do cliente não passem
despercebidas, respondendo a comentários de elogios e informando os clientes sobre consultas gerais, como
horários de abertura da loja e quando os produtos provavelmente estarão de volta ao estoque.
9
Essas interações são o que tem possibilitado um bom nível de confiança em uma empresa para seus clientes e
são o que os inspira a incluir as mídias sociais do negócio em seu dia a dia, apesar de nunca ter conhecido a
pessoa do outro lado da tela, colocado simplesmente pelo Economic Times, "seu público se importa com você
se você for de alguma ajuda para eles" (Thiagarajan, 2018).
tweet! :) - Jake Não coma todos de uma vez, você vai ficar doente ;)
16:02-9 Jan 2019
Tenha uma linda semana :) - Jake
1º Como ( 15:16-9 Jan 2019
A parte mais imperativa do Social CRM é garantir que a empresa esteja usando as mídias sociais corretas para
alcançar seu público-alvo, "Há vários anos, a ideia de marketing de mídia social era principalmente limitada
ao Facebook e ao Twitter. Nos últimos anos, esse tipo de marketing se expandiu para incluir sites populares
como Pinterest, Instagram, Snapchat, YouTube e Tumblr." (Adams-Mott, 2018)
Para este projeto, três mídias sociais foram analisadas quanto ao seu potencial: Instagram, Facebook e Twitter.
O Instagram tende a ser comentários curtos, às vezes até emojis – o que é encorajado em sua seção de
comentários (Fingas, 2018) e, portanto, não fornece dados suficientes para analisar a análise de sentimento. O
Facebook contém recursos de desenvolvedor que permitem que os dados sejam gravados por meio de sua
Graph API, no entanto, desde a Cambridge Analytica/Facebook em 2018, o Facebook revogou o acesso a
todas as ferramentas usadas para raspar dados de grupos e páginas (Y, 2019), isso tornou incrivelmente difícil
obter acesso, pois você deve fornecer um protótipo funcional do seu programa antes que o Facebook conceda
acesso. Devido a isso, o Facebook não será usado para análise.
O Twitter sempre foi usado por empresas para suas análises, tanto que o Twitter desenvolveu seu próprio site
"Analytics" em 2014 (Edwards, 2014), também é o mais simples de raspar dados, pois permitem aplicativos
baseados em desenvolvedores web, além de ser o mais fácil de visualizar as opiniões dos usuários através da
interface do usuário do próprio site. Com seu recente aumento para 280 caracteres, o Twitter é a plataforma
perfeita para analisar as opiniões dos consumidores e, portanto, será a única plataforma de mídia social para
este projeto.
10
2.8 Melhores Épocas do Ano Potenciais para Investigar
Há vários momentos em um ano em que os clientes são mais propensos a comprar e, portanto, as empresas
são mais ativas nas mídias sociais e lançam estratégias de marketing na tentativa de atrair negócios. Pode-se
dizer que a melhor época do ano para investigar os sentimentos dos clientes em relação a um negócio é o
período festivo, pois é uma das principais épocas do ano em que as empresas competem pelas compras dos
consumidores britânicos, com o gasto médio de Natal aumentando ano a ano no Reino Unido, e os gastos
anuais do país chegando muito acima da média europeia (Clarke, 2017).
Em torno do período festivo, as mídias sociais são usadas para compartilhar a campanha ou anúncio de Natal
de uma empresa, e pode se tornar um evento anual para uma empresa, ou seja, o anúncio anual de Natal da
John Lewis, que começa a ganhar força a cada ano pelo menos um mês antes do anúncio ser lançado (Google
Trends, 2008). Outras épocas do ano em que o engajamento é maior são eventos como vendas de fim de
temporada, Black Friday, Dia dos Namorados, fim de semana da Páscoa e as férias de verão.
As empresas devem considerar o impacto desses eventos para alcançar o alcance ideal das mídias sociais em
seu setor de mercado. Na verdade, o analista de mídia social James Lovejoy afirmou: "ao ficar quieto ou não
prestar atenção ao que está acontecendo nas redes sociais, muitas marcas estão ficando cegas para como estão
sendo discutidas online e como as redes sociais as afetam". (Ilyashov, 2015).
O projeto usará mineração de texto para raspar informações do Twitter para análise. Como há tempo limitado
para que o projeto seja criado, o Machine Learning não pode ser usado, pois isso requer mais dados, bem
como dados de treinamento, portanto, as Regras Linguísticas são a escolha mais sensata. Há muitos benefícios
para as Regras Linguísticas, como análise rápida, dados irregulares fáceis de detectar e análise granular para
dividir os dados em seções menores, como frases ou palavras/emojis usados, todos os quais são benéficos para
um projeto dessa escala (Huddy, 2017).
Depois de minerar os dados, a análise de sentimento será usada para determinar se a sensação geral da
mensagem é positiva, neutra ou negativa, usando Python. Isso permitiria, então, uma conclusão sobre a
opinião geral de uma empresa por seus consumidores, o que, por sua vez, poderia levar a decisões estratégicas
de negócios/marketing; Pak e Paroubek explicaram bem isso, afirmando: "À medida que mais e mais usuários
postam sobre produtos e serviços que usam, ou expressam suas opiniões políticas e religiosas, os sites de
microblogs se tornam fontes valiosas das opiniões e sentimentos das pessoas. Esses dados podem ser usados
de forma eficiente para marketing ou estudos sociais." (Pak & Paroubek, 2010).
11
Quão bom é "bom"? Agora com ainda mais palavras!
Em uma escala de o a 10, onde o é 'muito negativo' e 10 é muito positivo', em geral, quão positiva ou
negativa seria a seguinte palavra/frase para alguém quando você a usasse para descrever algo?
12
YouGov
Gráfico 5. YouGov "Como é bom é bom?"
2.10 Conclusão
Após a revisão da
redação de Pontuaçã
diversas fontes o média
através de sites, 121
periódicos, etc., a 134
144
esmagadora
172
maioria do
175
material 176
encontrado 1.85
demonstra a 2.17
credibilidade do 2.48
desenvolvimento 2.60
271
do projeto, que
2.80
será levado 2.85
adiante em suas 3-16
etapas de 3.38
desenvolvimento. 4.29
Ao longo da 509
pesquisa foram 513
543
descobertas 548
informações em 551
torno da 5-70
perspectiva do 580
CRM, e além 582
disso a versão 6.48
moderna, o CRM 6.56
6.62
Social, bem como 6.76
seus benefícios. 6.92
As empresas com 776
as melhores 7.78
estratégias de 7.90
marketing online 8.44
8.74
nos últimos anos e 8.77
as vantagens de 8.77
usar diferentes 8.81
mídias sociais 8.95
para marketing 9.11
9.16
com base em sua
0123456789 10
base de clientes Muito negativo Muito positivo
também foram
analisadas.
13
A pesquisa confirmou que a mídia social ideal para levar adiante para análise é o Twitter, pois dá o maior
alcance ao consumidor, além de confirmar o uso de regras linguísticas para analisar o sentimento dos dados
coletados. A pesquisa também confirmou as melhores épocas do ano para completar o conjunto de dados para
este projeto, no entanto, pode não ser possível coletar dados nessas épocas, pois o cronograma do projeto é de
janeiro a abril, e se o projeto fosse criado usando dados do Período Festivo 2018, essas informações podem
estar desatualizadas até o prazo final do projeto. Portanto, os dados serão coletados quando o projeto atingir
esse ponto específico de desenvolvimento, estimado para março ou abril.
14
3 Seção 3: Pesquisa de Produtos
Como o marketing de mídia social ainda é um mercado emergente, existem vários outros produtos que
permitem que uma empresa revise seu alcance de mídia social, incluindo quantas pessoas olham, se envolvem
e falam sobre suas postagens.
3.1 Gorjeio
Um exemplo disso é o próprio "Twitter Analytics" do Twitter, ao qual todos têm acesso dentro do site do
Twitter. Isso permite que os usuários investiguem o "número de impressões", o "número de engajamentos" e a
"taxa de engajamento (impressões divididas por engajamentos)" por Tweet enviado, bem como quantas
pessoas clicaram no próprio Tweet, clicaram no perfil depois de ver o Tweet e "retweetaram", responderam e
"curtiram".
15
7.6 Potenciais abordagens alternativas 34
8 Teste 35
9 Avaliação 36
9.1 Avaliação do Produto 36
9.2 Auto-Avaliação 37
10 Conclusão 39
10.1 Conclusões sobre Reputação 39
10.2 Conclusões relativas à Rentabilidade 42
11 Bibliografia 43
12 Apêndices 45
12.1 Apêndice A: Figuras 45
12.2 Apêndice B: Relatório contextual 46
12.3 Apêndice C: Código do Notebook Python Jupyter 47
12.4 Apêndice D: Código de Análise Semântica 48
12.5 Apêndice E: Fórmulas de planilha do Excel 51
12.6 Apêndice F: Visualizações de dados do Tableau 53
:o 54
12.7 Apêndice G: Ensaios 57
Embora isso forneça uma análise detalhada em Tweets individuais – e se o usuário tiver uma conta Business
ativada permite que ele veja o engajamento de todos os seus tweets combinados – o Twitter Analytics não
permite nenhuma forma de análise de sentimento, pois é limitado a métricas quantitativas em vez de
qualitativas.
Embora seja possível usar a "pesquisa avançada" do Twitter neste caso para procurar palavras-chave para
análise de sentimento, isso é complicado e tedioso, pois o desenvolvedor teria que vasculhar todas as palavras
possíveis que gostaria de pesquisar e formar manualmente o resultado geral dos diferentes resultados.
Outro produto que pode ser percebido como semelhante ao Projeto é o Hootsuite Insights, uma função
adicional da ferramenta de análise Hootsuite. Essa ferramenta de análise fornece um detalhamento de
diferentes medidas, como número de menções por site de rede social, geodistribuição, idioma, gênero e o
sentimento médio das mensagens em relação à empresa.
A Hootsuite também permite que a empresa conecte suas contas para mais de 35 redes sociais, como
Facebook, Twitter, YouTube, Google+, LinkedIn, Instagram e Pinterest; não há dúvida de que a Hootsuite é
líder de mercado em Análise de Redes Sociais.
Apesar disso, existem três desvantagens concebíveis para o produto da Hootsuite que não se encaixam nos
requisitos de usabilidade para o Projeto em Desenvolvimento, a primeira é que eles não permitem a
visualização de estatísticas de outras empresas; a maioria dos números que eles oferecem ao Usuário, eles
16
devem estar conectados para visualizar. Além disso, o segundo é o custo do sistema de comercialização; a
capacidade de olhar para "Custom analytics", ou seja, análise de sentimento, faz com que o custo por mês para
seus serviços aumente vertiginosamente de £ 25 por mês para £ 99, o que, dependendo da liquidez do negócio
e de seus gastos, pode estar fora de questão. Finalmente, a terceira desvantagem é semelhante à da Pesquisa
Avançada do Twitter, de modo que, se a empresa quiser investigar a Análise de Sentimento, ela deve inserir
as palavras, frases e emojis que deseja pesquisar por si mesma, em vez de o produto ter um banco de palavras
positivas, neutras e negativas que o sistema poderia buscar imediatamente.
A Semantria foi fundada em 2011 em um esforço para tornar a Análise de Sentimento disponível para
públicos mais amplos. A ideia do negócio é analisar a polaridade das postagens de mídia social em relação à
empresa usando extração e categorização de entidades, o que significa que a empresa pode obter uma exibição
aprofundada das emoções dos clientes em relação a eles.
17
Contagem de Polaridade de Categoria de Usuário I
Categoria do Usuário Negativo neutro Total Geral positivo
Hotéis 1 49 37 87
Alimento 2 35 30 67
Atendimento 2 34 26 62
Imóveis 20 16 36
Viajar 1 17 17 35
Tecnologia 4 18 11 33
Software e Internet 2 21 6 29
Arte 1 10 3 14
Jogos eletrônicos 8 5 13
Governo 10 2 12
Casamento 1 8 2 11
Bebidas 1 6 3 10
Saúde 6 4 10
Banheiro 1 4 4 9
Sítio Web 7 1 8
Espaço 1 5 1 7
Lei 2 3 5
Gráfico 8. Lexalíticos
Os benefícios de usar Semantria em oposição ao Hootsuite ou Twitter Analytics é que Semantria é dito para
analisar não apenas as palavras individuais em uma frase, mas também a essência da frase como um todo para
permitir uma análise mais profunda. Isso é útil com a Análise de Sentimento, pois captura momentos em que
as postagens nas mídias sociais podem ter sido escritas de forma sarcástica, o que é típico nos dias atuais.
Embora o Semantria tenha muitas qualidades benéficas como um produto de análise de mídia social, o layout
da ferramenta é particularmente básico, oferecendo apenas nomes de categorias e o número de respostas
relacionadas a ele. Por esta razão, o Semantria não atende aos Critérios de Usabilidade mínimos para o
Projeto, pois não fornece nenhuma forma de visualização de dados, como gráficos ou tabelas, o que tornaria
as informações muito mais fáceis de ler e compreender.
Um modelo de pontuação ponderada foi desenvolvido para investigar a usabilidade geral desses três produtos,
considerando os Critérios de Usabilidade. Os critérios mais importantes foram considerados para navegar no
conjunto de dados, e visualizar visualizações de dados e estes permitem o maior contato com os dados, no
entanto, filtrar e classificar os dados também recebeu um grande peso dentro do modelo.
Pontuação de Requisitos
Critérios Peso Gorjeio Hootsuite Insights Semantria
Procurar conjunto de 30% 100 50 0
dados
Classificar dados por 10% 30 50 50
emoção
Classificar dados por 5% 0 60 0
tempo
Classificar dados por 5% 0 50 0
Classificar dados por 10% 100 0 25
empresa
Filtrar dados por 10% 100 100 60
palavra ou frase
Exibir visualizações 30% 0 60 0
de dados
Escores Ponderados 100% 53 51 13.5
Para concluir, embora todos os programas mencionados tenham seus próprios benefícios para uso, nenhum
deles cobre todos os três critérios de usabilidade, como mostrado no modelo de pontuação ponderada por
nenhum dos produtos encontrados durante a pesquisa de produtos resultando em mais de 55/100, daí porque o
Projeto que está sendo criado se destaca sozinho em seu campo.
18
4 Seção 4: Questões e Considerações Legais, Sociais, Éticas e
Profissionais
Como acontece com qualquer projeto que está sendo criado on-line, o desenvolvedor deve levar séria
consideração em relação a quaisquer possíveis problemas que possam surgir desde o seu início. O
Regulamento Geral de Proteção de Dados (RGPD) que entrou em vigor em maio de 2018 deve ser levado em
conta, pois o objetivo do projeto é coletar dados de indivíduos sem informá-los. No entanto, como os sites de
Redes Sociais estão cientes de que muitas empresas coletam dados de seus sites para marketing e outros fins,
está escrito nos Termos e Condições desses sites que os dados do Usuário podem ser coletados. Apesar disso,
ainda é social e eticamente ambíguo coletar dados de pessoas para esses fins sem informá-las sobre isso, pois
a grande maioria do público nunca lerá os Termos e Condições (Cakebread, 2017).
Devido ao recente escândalo envolvendo o Facebook e a Cambridge Analytica, o Facebook e muitas outras
mídias sociais reforçaram sua segurança envolvendo aplicativos feitos por usuários de terceiros. Esse
movimento foi iniciado de boa-fé porque eles queriam proteger os dados de seus consumidores, no entanto,
isso significa que tornou muito mais difícil extrair dados desses sites; sendo o Facebook o processo mais
demorado para obter a autorização para coletar isso, mesmo que o aplicativo esteja sendo criado para fins
científicos ou educacionais.
A Lei de Proteção de Dados de 2018 é a implementação específica do GDPR no Reino Unido, que controla
como as informações pessoais de uma pessoa são usadas por organizações ou empresas. Por exemplo, uma
empresa deve garantir que as informações pessoais sejam "usadas de forma justa, legal e transparente",
"usadas para fins especificados e explícitos" e "mantidas por não mais do que o necessário" (Gov.uk, 2018).
Poderia ser considerado legal, social, eticamente e profissionalmente elusivo no interesse deste projeto, como
é altamente improvável que o desenvolvedor entre em contato com o proprietário de cada conta para receber
permissão para usar suas postagens de mídia social. Se uma pessoa entrasse em contato com um site de mídia
social para ter seus dados apagados, o que está bem dentro de seus direitos desde que a GDPR foi
implementada, ela não saberia se seus dados foram usados por qualquer outra parte sem sua permissão,
portanto, suas informações ainda podem existir apesar da pessoa exercer seu "direito de ser esquecida" (Art.
17 GDPR).
Existem considerações profissionais que devem ser levadas em conta, nas quais os dados específicos
coletados abrigam as opiniões do cliente sobre vários concorrentes para a marca do usuário. Essas
informações não devem ser visualizadas por nenhum funcionário que não tenha necessidade de visualizá-las,
pois os dados brutos coletados usando o código Python podem incluir nomes de usuário, nomes e locais, e
outras informações pessoais que as mídias sociais coletam em seus Usuários.
19
5 Seção 5: Requisitos e Metodologia
Como o Projeto não suscita Partes Interessadas de terceiros, onde um sistema pode ter estabelecido seus
requisitos por meio de pesquisas e questionários, o Desenvolvedor não conseguiu. Devido a isso, os
Requisitos resultaram principalmente de discussões com os clientes, bem como da investigação dos Sistemas
da Concorrência e da descoberta dos aspectos que o Desenvolvedor acredita que eles poderiam ter adicionado
para promover seus programas.
Para coletar os dados do Twitter, a melhor solução é usar uma combinação de aplicativos de terceiros e
Python, o que permite ao desenvolvedor coletar os dados exatos de que precisa e negar quaisquer partes do
arquivo que considere desnecessárias.
Depois de coletar os dados, eles precisam ser exportados, isso permite que o desenvolvedor examine o
conjunto de dados e encontre quaisquer anomalias, além de garantir que os dados tenham sido coletados
corretamente. A melhor solução possível para isso é usar o Excel para criar as fórmulas para a Análise de
Sentimento, antes de carregar os dados em uma ferramenta de visualização de dados, como o Tableau.
20
Uma tabela MoSCoW deve ser fornecida para formar a ordem de prioridade para os requisitos
estabelecidos. Estes são divididos em "Deve ter", "Deveria ter", "Poderia ter" e "Não terá (desta
vez)".
9) Os usuários podem criar suas próprias visualizações de dados para dados Deve ter
10) Os usuários podem exportar suas visualizações de dados individualmente Deve ter
11) Os usuários podem exportar suas visualizações de dados como um todo Deve ter
12) Os usuários podem carregar conjuntos de dados para análise Não terá
13) O desenvolvedor é capaz de carregar conjuntos de dados para análise Poderia ter
A quantidade de requisitos "Must have" priorizados nunca deve ser superior a 60%, dentro deste
projeto existem 6 "Must have" e 13 requisitos totais o que dá uma porcentagem de 46%, com os
requisitos "Should have" obrigando outros 23%. Consequentemente, não deve haver preocupações
em relação ao momento deste Projeto.
5.5 Metodologia
Para que a maioria dos projetos seja bem-sucedida, a equipe do projeto deve seguir uma metodologia
adequada durante toda a sua criação. O projeto será desenvolvido utilizando uma metodologia iterativa
DSDM Atern; isso se deve em grande parte aos oito princípios da DSDM Atern que se conectam com os
ideais do programa:
21
Como o projeto diz respeito especificamente a uma empresa e ao que eles querem descobrir sobre uma
conexão entre o uso de mídias sociais e reputação/lucros, ele se relaciona muito com o primeiro princípio do
DSDM "Foco na Necessidade do Negócio". Os programadores precisarão de comunicação e feedback
constantes entre si e a empresa para avaliar os requisitos, além de estabelecer um entendimento mais profundo
sobre o que o negócio precisa, predominantemente por meio da técnica MoSCoW.
Outro princípio da Atern, "Entregar no Prazo", é relacionável com o projeto, pois há um prazo estrito de 29 de abril
para que o projeto e os relatórios sejam escritos e concluídos. Isso pode ser alcançado principalmente através
da definição de prazos conscientes para manter o projeto progredindo fluidamente e com foco nas prioridades
de negócios durante todo o processo.
Além disso, outro aspecto do DSDM que diz respeito ao tempo é a "regra 80:20". Como o projeto se
concentra na coleta de dados das mídias sociais, isso pode ser considerado como uma grande porcentagem do
projeto geral, portanto, é provável que 80% do projeto possa ser concluído em 20% do tempo, e os 80%
restantes do tempo possam ser usados para adicionar detalhes finos e aumentar a funcionalidade.
Princípio 3. "Colabore"
Trabalhar em equipe durante todo o projeto, e incluindo a entrada e feedback do cliente, garante que o melhor
projeto possível seja criado. Isso permite:
Para garantir que isso seja alcançado, o líder do projeto deve envolver ativamente todos na equipe para formar
uma mentalidade de "equipe única", bem como capacitá-los a tomar decisões sobre o projeto.
Este princípio estabelece que o nível de qualidade para o qual o projeto deve ser concluído deve ser acordado
no início do planejamento, e todo o trabalho concluído garante que esse nível seja atingido.
O Gerente de Projeto deve, consequentemente, definir o nível de qualidade previsto no início da formação do
projeto e garantir que a qualidade não se torne uma variável eventual. Além disso, eles devem garantir o teste
do projeto no início do desenvolvimento e continuamente depois, o que pode ser realizado por meio de vários
métodos, como testes de funcionalidade, usabilidade ou desempenho.
Da mesma forma que o princípio quatro, o princípio cinco se concentra no desenvolvimento e teste do projeto
por meio de um estilo de desenvolvimento iterativo. Para conseguir isso, o gerente de projeto, enquanto
desenvolve iterativamente, deve garantir e confirmar continuamente que o sistema correto está sendo
construído. Então, se necessário, altere o desenvolvimento do projeto para garantir que ele esteja alcançando a
melhor produção possível, passando a experimentar e evoluir o projeto.
22
O princípio seis refere-se diretamente aos benefícios do negócio, pois implica que a construção incremental
permite que o projeto seja liberado mais cedo para o Cliente, o que a partir de agora permite que os
desenvolvedores entendam o escopo do negócio e relacionem as atualizações potenciais aos seus requisitos
operacionais.
Isso é possível estabelecendo uma grande quantidade do projeto antecipadamente antes do início do
desenvolvimento, além de se esforçar para uma entrega antecipada do produto final. É essencial que o
desenvolvedor se concentre no que ele quer que seja produzido – em vez de como ele planeja chegar a ele –
ao longo disso.
Como a má comunicação é frequentemente citada como a maior causa individual de fracasso do projeto, as
técnicas e princípios associados ao DSDM Atern são concebidos para melhorar a comunicação entre os
membros da equipe de desenvolvimento para garantir um modelo de negócios bem-sucedido.
A maneira superlativa de o Gerente de Projetos garantir que esse princípio seja mantido é garantindo
atividades que incentivem a comunicação efetiva entre a equipe, como organizar workshops e solicitar
documentação presencial. Além disso, a interação entre a equipe e os acionistas, tanto formal quanto informal,
é imprescindível. Isso pode ser completado mantendo a documentação, como itinerários.
O princípio final implica que a equipe esteja no controle do projeto em todos os momentos. Isso é conseguido
sendo proativo ao monitorar e controlar o progresso feito com o projeto, além de ser capaz de provar a
qualquer momento que eles estão no controle. Isso deve ser estabelecido em toda a equipe, usando níveis
adequados de formalidade no dia a dia para garantir o procedimento, bem como gerenciar contratos e outras
necessidades de negócios de acordo.
A principal razão pela qual a DSDM Atern foi escolhida como metodologia para esta operação é que o projeto
está em conformidade com muitos de seus princípios, como "foco na necessidade do negócio" e "entregar no
prazo". A utilização dessa metodologia garante a criação de um produto específico, que é estabelecido pelas
necessidades do negócio, bem como datas precisas para a conclusão de cada aspecto do projeto. A grande
quantidade de planejamento e detalhes que o DSDM incentiva certifica que o projeto seria concluído no
prazo.
6 Projetar
6.1 Diagrama de caso de uso UML
O diagrama de caso de uso ilustrado abaixo (Figura 9.) demonstra as várias ações que um usuário pode
concluir por meio do código, bem como as limitações. Como mostrado abaixo, um Ator (Usuário) é capaz de
'Input Query' para o código a ser pesquisado, 'Listar' os dados, o que inclui ser capaz de visualizar uma lista de
Tweets, bem como permitir a exportação dos dados do programa para um arquivo .csv. Eles também devem
ser capazes de encerrar o programa.
23
Gráfico 9. Draw.io
24
7 Processo de Desenvolvimento
Durante o primeiro estágio de desenvolvimento, a tarefa principal foi escrever o código que permitiria ao
Cliente recuperar um número definido de tweets do Twitter que incluíssem uma determinada palavra ou frase,
decidida pelo Cliente. Para fazer isso, um aplicativo do Twitter é necessário. A partir de novembro de 2017, o
Twitter exigiu que todos os usuários criassem uma conta de desenvolvedor do Twitter para criar um
aplicativo, no qual eles devem concordar com vários requisitos legais e éticos e especificar a natureza do
aplicativo que estão criando (Roth, 2018).
Detalhes do aplicativo
Ícone do aplicativo
Nome do aplicativo
Descrição
Minere dados de tweets públicos que incluem palavras-chave (nomes de empresas) ou hashtags
URL do site
https://twitter.com/
Desactivado
Nenhum
Nome da organização
Uso do aplicativo
App será usado para extrair dados para uso pessoal para um projeto de conclusão de curso da Universidade. Só será usado para descobrir tweets que #
ou escrever o nome de uma empresa para encontrar a opinião geraldo público. Isso (no projeto) será então comparado com a lucratividade da empresa
para ver se há uma ligação entre a atividade online, a reputação e o lucro.
Ao longo do processo de candidatura foi reiteradamente afirmado que a Aplicação iria ser desenvolvida para
fins Educativos, pois isso aumenta as suas hipóteses de aprovação. Agradavelmente, o Aplicativo foi
25
aprovado dentro de cinco minutos após seu envio e, em seguida, recebeu várias chaves de API e tokens de
acesso para permitir que um pedaço de código acesse o Twitter por meio de um sistema de terceiros, neste
caso, o Jupyter Notebook.
Chaves e tokens
Revogar J Regenerar
Uma vez que o aplicativo tivesse sido aprovado e pudesse coletar dados do Twitter, as chaves e tokens
poderiam ser implementados dentro do código. De acordo com o sexto princípio do DSDM, "Build Iteratively
from Firm Foundations", a base para o projeto foi escrever o código que buscava os dados do Twitter, garantir
que funcionasse e recuperar os tipos de dados necessários (como tweet inteiro, tempo e nome de usuário) e,
em seguida, implementar o fator de análise de sentimento.
Para ajudar na criação deste projeto, foi importada uma biblioteca Python baseada no Twitter, Tweepy ("bliti",
2019), que permite fácil acesso aos Tweets por meio da API do Twitter. A Tweepy oferece um grande número
de trechos de código e tutoriais em sua documentação, o que ajuda milhares de pessoas a usar seu sistema para
simplificar o código no qual os dados são solicitados ao Twitter, além de especificar as variáveis exatas
necessárias. O código do usuário do github ritvikmath também foi usado como estrutura para buscar os
Tweets ( ritvikmath , 2018).
O código inicial para esta etapa do projeto foi projetado para verificar a linha do tempo do desenvolvedor
como precaução para garantir que o código estava funcionando – isso sendo possível por meio do recurso
'célula' do Jupyter Notebook – antes de permitir que o usuário insira uma palavra ou frase. O programa irá
então pesquisar os 100 tweets mais recentes que incluem essa consulta e enviá-los na tela para o usuário
navegar, antes de exportá-los em um arquivo de .csv com o nome do usuário escolhido.
Iterações
Iteração Data Código Resultado
1 24/2/19 Importar CSV Falhar
26
csvWriter = csv.writer(csvFile)
contador = 0
csvFile.close()
2 25/2/19 Importar CSV O sucesso, no
entanto, remove
# Criando o objeto API ao passar informações emojis
de autenticação
api = tweepy. API(auth)
csvFile.close()
27
#Use Escritor csv
csvWriter = csv.writer(csvFile)
csvFile.close()
Embora o código tenha sido parcialmente escrito por Tweepy, havia várias linhas que tiveram que ser
alteradas, adicionadas ou removidas, pois não se encaixavam na especificação do projeto que estava sendo
criado. A parte mais essencial disso envolveu a exportação dos tuítes. Acredita-se que, especialmente nos dias
atuais nas mídias sociais, grande parte da análise semântica é baseada em emojis e emoticons usados pelo
público. Como tal, o código relativo à exportação de tweets para um arquivo .csv teve que ser editado para
garantir que não houvesse qualquer formatação dentro do processo que removesse os emojis, ou os tornasse
ilegíveis por uma planilha.
Houve um problema inicial ao abrir os documentos criados pelo programa. O Excel foi necessário para criar
as fórmulas necessárias para analisar os tweets adequadamente, no entanto, não é capaz de ler emojis de um
arquivo .csv. Como o programa foi desenvolvido usando um MacBook, no entanto, o desenvolvedor também
teve acesso ao Numbers do pacote iWorks pela Apple. Abrir os arquivos .csv no Numbers e exportá-los para
um arquivo .xlsx para depois abrir no Excel foi uma solução perfeita para isso, pois .xlsx arquivos também
podem ser usados no software Data Visualisation.
@boohoo 2019-04-10 16:14:22 DanWarren1982 @afcjohnboy @DannyBrookerS @ boohoo E uma guia de barra de £ 705
@booboo 2019-04-10 15:58:43 Y8Meenz ©boohoo por que boohoo repetidamente bagunçar meu pedido
©@shellbabes96 boohoo Hey Shell, desculpe ouvir isso! Você pode me enviar o número do seu pedido via mensagem direta e eu vou... Disponível em:
@boohoo 2019-04-10 15:54:33 boohoo cshelp
https:/t.co/Yw1nKBhf6Q
©boohoo eu recebi o meu pedido hoje que eu quero devolver eu não consigo encontrar o meu número de ordem você pode enviá-lo para mim por favor ... Disponível
@boohoo 2019-04-10 15:53:32 Shelly41
em: https:/t.co/bDIYhc4JRH
@boohoo 2019-04-10 15:46:53 Duck_Face_79
©boohoo Direito •
@boohoo 2019-04-10 15:44:12 Manni_K28 ©boohoo Esquerda
28
Gráfico 13. Abrindo o mesmo arquivo .csv no Numbers
7.2.1 Iteração 1
O próximo estágio de desenvolvimento foi escrever o código necessário para escanear cada tweet individual e
dar-lhe uma classificação de dez, dependendo de quão positivo ou negativo o tweet parecia. Usar Python para
codificação rapidamente se tornou um incômodo devido à falta de um recurso de "caso" ou "switch" que a
codificação em Java ou C++ teria possuído.
Embora não seja particularmente atraente esteticamente, a decisão foi tomada para utilizar várias declarações
"se" que verificariam cada tweet individualmente dentro do .csv "para loop" e procurariam diferentes palavras
comuns que pudessem aparecer. Essas palavras foram estabelecidas inicialmente através do YouGov "How
Good is Good?" Diagrama (Figura 5.), referenciado na Seção 2 do relatório, então construído com vários
artigos sobre o sentimento dos emojis (Novak, Smailovic, Sluban, & Mozetic, 2015), (Lim, 2018) e
(Brandwatch, 2019).
7.2.2 Iteração 2
Depois de criar a base inicial para o código, ele foi executado várias vezes. Qualquer tweet que não estivesse
dando uma classificação semântica era analisado para ver qual linguagem era usada e o contexto em que era
usada, o que permitia ao desenvolvedor aumentar a linguagem a ser analisada no futuro.
Outra questão destacada foi que muitos emojis que não foram mencionados em nenhum dos artigos de
pesquisa não estavam sendo classificados. Usando um site que conta cada vez que um emoji é usado em um
tweet (emojitracker, 2019), o desenvolvedor analisou os trinta principais emojis que estão sendo usados em
todo o mundo e visualizou várias centenas de tweets por emoji para analisar o contexto geral de quando esse
emoji é usado, antes de implementá-los no código.
Uma vez implementados, um grande número de Tweets amostrados retornaria com um valor semântico
anexado. No entanto, ao refletir sobre os dados amostrados dos arquivos .csv, descobriu-se que o verdadeiro
contexto dos Tweets muitas vezes se tornava mal interpretado, pois o código nem sempre podia determinar o
resultado implícito da mensagem.
Exemplos incluem o código que classifica um Tweet como negativo devido ao emoji escolhido pelo usuário,
mesmo que a linguagem usada ao lado dele tenha sido de fato positiva. Em outro caso, o código teve
dificuldades para determinar se o feedback era positivo ou negativo, devido à linguagem conflitante usada. O
código valorizou os emojis usados como 5/10, uma pontuação indiferente e despreocupada, enquanto a
linguagem escolhida mais tarde no Tweet marcou um 8/10 ou 9/10 muito mais positivo.
7.2.3 Iteração 3
Devido a esses tweets com vários significados potenciais "escapando pelas rachaduras", foi decidido que o
código deveria ser editado para resumir o valor de cada palavra, frase ou emoji/emoticon usado.
" Obrigado @hm por vender esta camiseta incrível &^^V Totalmente apaixonado https://t.co/50tfmtlwNU"
O emoji tem um valor de 5, pois pode ser usado em um sentido positivo ou negativo, o emoji de coração tem
um valor de 8, e a palavra 'amor' tem um valor de 9. Dentro das iterações 1 e 2, o valor deste tweet teria
registrado como 5, devido ao emoji ser a primeira coisa mencionada no tweet; uma vez que o código foi
editado com um 'Contador' e 'Soma' dos valores, este tweet então retornou um valor semântico de (5+8+9)/3,
29
para um valor geral de 7,3 recorrente. Após novas execuções operacionais de arquivos .csv com esta nova
versão do código para procurar quaisquer omissões de linguagem, foi aprovado para ser a versão final.
O arquivo excel foi projetado para conter cinco colunas de dados que foram considerados mais importantes
para análise:
- O nome da empresa em discussão
- A hora do Tweet
- O nome de usuário do Tweeter
- O próprio Tweet
- A classificação semântica
Como explicado anteriormente, devido aos emojis não formatados corretamente no Excel, o conjunto de
dados foi inicialmente compilado no Numbers e, em seguida, exportado como um arquivo .xlsx para ser
aberto e classificado no Excel. As funções de classificação e filtragem dentro do aplicativo significavam que
quaisquer tweets sem valor semântico poderiam ser negados da amostra de dados, pois não tinham nenhum
propósito na análise, e também teriam interferido nos cálculos feitos dentro do documento.
Foi nesse ponto que as visualizações de dados tiveram que ser planejadas, pois as fórmulas criadas tinham que
ajudar a visualizar os dados. Os cálculos escolhidos foram:
1) Classificação semântica média de Tweets por Empresa.
2) Número de Tweets Semânticos no exemplo.
3) Número de Tweets por hora do dia.
4) Número de Tweets por Empresa por classificação de 1 a 10.
Esses cálculos foram transmitidos por meio de uma combinação das fórmulas "COUNT", "COUNTIF",
"COUNTIFS", "SUM" e "SUMIF" que apresentavam os dados de forma numérica dentro da planilha Excel,
ao lado dos próprios dados. Estas fórmulas são apresentadas no apêndice E.
30
IOLALNO.
OEIWEITSOA COMPANHIA IEIn TWEETS POR
cowAraUxmIIER HORA HOU
1.00
ASOS 128 655 5.12 ASOS 1,424,000 ASOS 128 01:00 3
1.00
BOOMOO 109 595 5 78 BOOMOO 609,400 BOOMOO 103 02:00 2
htpsan.coDhGU4p54 1.00
H&M 40 268 558 H&M 184.600 H&M 48 03:00 3
TPS n.co/nydv6kRTGH 1.00
SAUDADES 97 604 5 6 23 SAUDADES 415.300 SAUDADES 97 04:00 8
Uca... 1.00
NASTY GAL 72 386 5.39 NASTY GAL 22.259 NASTY GAL 72 05:00 5
Iep... 1.00 148,200
ZARA 30 220 6.11 ZARA ZARA 36 06:00 um
1.00
Total: 484 07:00 ela
1.00
8 00 horas 11
1.00
9 00 horas 18
. Disponível em: 2 00
https:n.co/1016Xe98zn 10:00 21
'Shamoonyou 2 00
11:00 38
2.00
12:00 23
itps: n.colg9/7LIxTEC 2.00
13:00 46
Ng: 2.00
14:00 14
soin.colyuUIBzN4W) 2.00
15:00 25
2.00
16:00 33
https McouHB6ZPeQGD 2.00
17:00 41
ps:/n.co/TQ1 wBe3UTe 2.00
18:00 21
2.00
19:00 66
2.00
20:00 18
4.00
21:00 49
4.00
22:00 14
um desonesto 4.00
23:00 t
TBF 5.00
12:00 2
5.00
s:/n.co/4q281syhH7 5 00
5.00
*— 5.00
an.co/Mk3QNTO6PD 5.00
n... 5.00
500
Gráfico 14. Captura de tela de dados numéricos ao lado de dados de tweet na planilha do Excel
Usar o Excel para poder visualizar o conjunto de dados era imprescindível, pois se relaciona com vários dos
treze requisitos encontrados na Seção 5 do relatório, tais como:
- Usuáriossão capazes de navegar facilmente pelo conjunto de dados completo (ou seja, postagens de
mídia social) (Req. Número 1)
- Usuáriossão capazes de classificar dados por tempo (Req. Número 2)
- Usuáriossão capazes de classificar dados por emoção (Req. Número 3)
- Usuáriossão capazes de classificar por empresa (Req. Número 5)
- Usuáriossão capazes de filtrar dados por palavras específicas (Req. Número 6)
- Usuáriossão capazes de editar e remover dados (Req. Número 7)
Enquanto a maioria desses requisitos eram "Must haves" na tabela MoSCoW, alguns deles eram "Should
haves" e, portanto, estão excedendo a expectativa do cliente ao serem incluídos no projeto.
O software escolhido para o projeto foi o Tableau, devido às suas vastas capacidades que permitiram a criação
de seis visualizações diferentes dos dados para apresentar ao cliente. Ter uma ampla variedade de
visualizações que podem ser facilmente compactadas em um ou dois painéis para facilitar a leitura significa
que o cliente pode tomar uma decisão informada sobre quanto investir em seu CRM Social. A simplicidade do
Tableau também garante que, uma vez que o projeto seja entregue ao cliente, ele possa visualizar, editar e
adicionar mais dados ao conjunto de dados, com o treinamento correto.
Embora o Tableau tenha desenvolvido várias iterações de seu software para diferentes níveis de análise de
dados, o produto padrão e, portanto, o usado para este projeto foi o "Tableau Desktop 2019.1". Depois de
abrir o Tableau, ele pergunta instantaneamente qual fonte de dados deve ser "Conectar" para importar os
dados. Isso torna extremamente fácil, como "Microsoft Excel" está no topo da lista de opções e é simplificado
para o nome do software, em oposição ao nome da extensão de nome de arquivo, '.xlsx'. Depois disso, é
simples escolher as colunas de dados a serem usadas, e o Tableau responde colocando as colunas no que
31
acredita serem "dimensões" e "medidas" para criar com precisão o tipo correto de visualização.
Dimensões doente P •
Abe Padrão de nome da empresa
Medidas
# ASOS
# MÉDIA
# Boohoo
# H&M
# Saudades
# Gal desagradável
# Não. De Tweets Semânticos em Amostra
# NÃO. DE TWEETS
# Classificação semântica
# SOMA DOS TWEETS
# Total nº. De Tweets na Página do Twitter da Empresa no Reino Unido & Página de Ajuda
# Tweets por hora
# Zara
# Número de Registros
# Valores de medida
A primeira visualização demonstra uma "Nuvem de Palavras" do idioma mais usado nos Tweets coletados.
Isso foi difícil de construir no início, pois o Tableau não tem a capacidade de dividir frases em palavras
individuais. Portanto, os Tweets tiveram que ser divididos usando o recurso 'Text to Columns' no Excel, que
pega uma amostra de dados e a divide em palavras individuais, depositando cada uma em uma célula
diferente. Embora útil, ele fez com que o documento parecesse desarrumado e, portanto, foi concluído no final
do processo para que pudesse ser colocado fora de vista, à direita das tabelas mostradas na Figura 14.
Depois que essa operação foi concluída, as vinte e sete colunas em que os Tweets foram divididos tiveram que
ser mescladas para permitir a criação da Nuvem de Palavras. É aqui que o recurso 'Pivot' do Tableau é usado.
Isso cria dois valores de qualquer número selecionado pelo Usuário: uma combinação de colunas de
cabeçalhos e uma combinação de colunas de valores.
Posteriormente, a função 'Filtro' teve que ser usada para peneirar as palavras genéricas que não têm qualquer
valor semântico. O benefício desse recurso é trazer à tona os dados descritivos que mostrarão o contexto
pretendido do cliente, o criador do Tweet.
Nessa ocasião, uma vez concluído esse processo, um total de 236 valores foram negados da amostra, como
'também', 'faz', 'oi', 'eu', etc. A amostra foi então deixada com palavras que explicavam por que os Tweets
existiam, por exemplo, 'entrega' demonstra que grande parte da amostra tinha uma pergunta ou declaração
sobre entrega, 'devoluções', etc. além de várias palavras para demonstrar emoções, como 'curtir', 'bom',
'amoroso', 'fofo', etc.
Foi importante incluir uma representação visual dos dados da amostra, bem como os números por trás da
análise, pois permite ao cliente visualizar as emoções transmitidas em um espectro maior do que a
positividade/negatividade. Passar o mouse sobre as palavras na visualização revela quantas vezes essa palavra
foi declarada dentro da amostra, que, se filtrada pelo Top 50 usado, é entre 7 – 45 vezes por palavra.
A segunda visualização criada demonstra a classificação semântica média de cada empresa em ordem da mais
alta para a mais baixa. Isso foi criado por meio de uma tabela feita dentro da Planilha Excel que permitiu que
um valor denominado "Classificação Semântica" (por empresa) fosse colocado em um eixo, e os valores
correspondentes de "Nome da Empresa" fossem colocados no outro. Foi importante criar isso, pois dá ao
cliente uma visão rápida de quais empresas têm as reações mais positivas ou negativas de seus clientes. Eles
podem então se concentrar nos dados dessas empresas ao olhar para as outras visualizações ou podem optar
por ainda olhar para os dados como um todo.
32
Este foi um dos gráficos mais fáceis de criar, pois as informações eram simples de transportar da Planilha.
Além disso, para facilitar a visualização desses dados pelo Cliente de forma amigável, os valores semânticos
de cada empresa foram colocados em cima do gráfico, o que é útil para esse cenário, já que os valores médios
das três principais empresas (Missguided, H&M e Zara) estão separados por apenas 0,12.
A terceira visualização de dados utiliza um gráfico de pizza que exibe quantos Tweets foram enviados em
geral, por hora do dia. Esta foi uma das visualizações mais difíceis de criar; O Tableau não permite que
valores simplesmente "HH:MM" sejam um formato válido, portanto, ele gera sua própria data (01/01/1899)
para usar como espaço reservado. Devido a isso, ao criar o gráfico de pizza, era necessário verificar se os
rótulos no gráfico e nas teclas não incluíam a data do espaço reservado, pois isso tornaria o gráfico confuso e
distraído de seus dados.
Da mesma forma que a segunda visualização, para facilitar a leitura das informações "de relance" para o
Cliente, foram adicionados rótulos que explicam a qual hora cada segmento do gráfico se correlaciona. Com
essas informações, é simples perceber as horas mais populares para que os Tweets sejam enviados, e onde o
Cliente gostaria da quantidade exata de Tweets por hora, ele pode simplesmente passar o mouse sobre o
gráfico dentro do Tableau e ele divulgará essas informações.
Um gráfico de pizza adicional, a quarta visualização, foi criado para exibir o número total de Tweets por
empresa coletados na amostra. Como o projeto é uma investigação não apenas sobre o valor semântico, mas
também sobre a popularidade das empresas em questão, este diagrama exibe facilmente os nomes de cada
empresa e o número exato de Tweets na amostra que elas possuem.
Ter esse diagrama demonstra que, apesar de uma empresa talvez ter mais Tweets enviados a eles do que
qualquer outra, a maioria deles não poderia mostrar nenhum valor sentimental e simplesmente ser curiosa e
mundana, em oposição a opiniões que poderiam influenciar outros clientes em potencial. Esse diagrama era
relativamente fácil de criar no Tableau, especialmente depois de criar um gráfico de pizza na visualização
anterior.
A penúltima visualização é um detalhamento do número de Tweets por Rating – de 10 – por empresa. Cada
empresa tem seu próprio gráfico de barras rotulado de 1 a 10 que mostra o número de Tweets que eles
receberam dentro de cada classificação, que o Cliente pode passar o mouse para ver o número exato de
Tweets, no entanto, não foi assim que foi inicialmente planejado para ser apresentado.
A ideia original para essa visualização era apresentar um gráfico de barras empilhado que demonstrasse o
número total de Tweets no conjunto de dados com cada valor de 10, isso demonstraria qual empresa recebeu
um número notável de Tweets dentro desse valor. Como os dados foram coletados do Excel usando fórmulas,
os dados – de forma semelhante às palavras individuais para a Nuvem de Palavras – teriam que ter sido
mesclados com um Pivot, no entanto, isso foi problemático, pois cada conjunto de dados só pode ter um Pivot.
Isso significava que, ao tentar dinamizar os dados juntos, ele se mesclava com os dados da Nuvem do Word e
tornava ambos os conjuntos de valores ilegíveis. Embora isso tenha sido frustrante, os dados ainda fazem
sentido lógico por si só e são facilmente compreensíveis como seis gráficos de barras separados.
A sexta e última visualização foi a única estatística que não veio diretamente dos dados coletados, pois
funciona como informação de fundo sobre as empresas estudadas para fornecer ao Cliente informações
adicionais. Ele apresenta um gráfico de barras que exibe o número de Tweets que cada empresa enviou em
sua página do Twitter no Reino Unido, bem como sua "Página de Ajuda", se eles possuírem um, a partir de 10
de 2019. Isso é útil para comparar o quão ativa uma empresa está nas mídias sociais com os dados
abril de
Depois que essas visualizações foram construídas, dois Dashboards foram gerados e vinculados para criar um
meio para visualizar facilmente os resultados.
33
- Tweets por hora
- Número de Tweets por empresa
- Contagem geral de Tweets da empresa em suas páginas do Twitter
Como todas as informações não caberiam em um painel, era imperativo garantir que a forma como os dados
são apresentados ao cliente fosse amigável. Isto foi conseguido dividindo-os nas três visualizações relativas à
base das estatísticas, e as três visualizações relativas à análise, aprofundando-se nos dados, pois esta parecia
ser a abordagem mais lógica.
Um aspecto fundamental da apresentação desses diagramas foi garantir que eles fossem fáceis de inferir, pois
cada diagrama segue o mesmo esquema de cores de vinte cores diferentes – chamado Tableau 20 nas
configurações do Tableau – para mantê-lo uniforme e esteticamente aceitável para o cliente. Isso teve que ser
ligeiramente alterado para visualização três devido a haver mais de 20 entradas. Onde fazia sentido e não
tornava a visualização muito cheia, etiquetas eram colocadas no próprio gráfico, pois isso eliminava a
necessidade de uma "chave" acima, ao lado ou abaixo de cada diagrama, pois estes ocupavam espaço valioso.
Concluído a tempo
5 Projeto e Desenvolvimento de Planilhas Excel Concluído a tempo
6 Compilação e exportação de dados para Excel Concluído a tempo
7 Fórmulas criadas no Excel Concluído a tempo
8 Visualizações de dados criadas Todas as visualizações criadas de acordo
com o plano, exceto o gráfico de barras
empilhado, que foi adaptado.
Concluído a tempo.
9 Teste de Função Concluído a tempo
10 Corrigir quaisquer erros encontrados no período de Concluído a tempo
11 teste
Apresentação do Produto ao Cliente Concluído a tempo
12 Relatório Final Concluído a tempo
13 Produto Final Concluído a tempo
7.6 Potenciais abordagens alternativas
Vários métodos foram considerados durante as diferentes etapas de desenvolvimento do projeto. Um exemplo
disso foi durante o processo de design preliminar, quando houve debate em torno se o conjunto de dados
deveria ser apresentado como um banco de dados SQL, ou dentro de uma planilha como Excel ou Numbers.
Os pontos positivos de manter os dados dentro de um banco de dados é que ele é mais seguro e possui um
nível de segurança maior do que uma planilha. Isso ocorre porque é mais difícil excluir registros
acidentalmente e é criptografado para um padrão mais alto do que uma planilha típica. No entanto, pode-se
34
argumentar que um número maior do público em geral pode visualizar e editar planilhas em comparação com
o conhecimento de SQL. Devido a isso, erros podem ser cometidos se uma pessoa inexperiente tentar editar os
dados dentro do banco de dados.
Depois de reunir os dados, um outro dilema envolveu a decisão de qual ferramenta de visualização usar, já
que cada um dos líderes de mercado tem seus próprios pontos fortes e fracos. Uma opção possível era o
Power BI, uma ferramenta de propriedade da Microsoft que se conecta diretamente ao Excel para criar
gráficos e painéis a partir dos dados. Outro foi o SiSense, que permite a visualização de dados, mas se
considera uma "solução de análise de big data" para analisar e visualizar grandes volumes de dados.
Depois de analisar os pontos positivos e negativos das três opções, o Tableau foi escolhido devido à sua
riqueza de recursos em relação à visualização de dados – que é tudo o que era necessário naquele estágio do
processo de desenvolvimento – além de receber uma chave de licença gratuita para o Tableau Desktop.
8 Teste
Após o desenvolvimento dos dois painéis para apresentar os dados ao cliente, todo o projeto do Tableau
passou por testes completos e abrangentes para garantir que estava funcionando conforme o esperado. Isso
pode ser encontrado no Apêndice G. O teste 9 demonstrou que uma fórmula criada para contabilizar o número
de Tweets por hora não estava se comportando corretamente. Encontrar isso me permitiu corrigir a fórmula e
forçar uma atualização nas visualizações para garantir que elas mantivessem os dados corretos. Todos os
outros 26 testes passaram pela primeira vez.
35
9 Avaliação
Para analisar se o projecto foi um sucesso, penso que é imperativo olhar para os requisitos recolhidos e ver se
foram cumpridos de acordo com a definição de prioridades do MoSCoW.
6) Os usuários podem filtrar dados por palavras específicas Deve ter Sim
8) Os usuários podem visualizar uma variedade de visualizações de dados Deve ter Sim
pré-feitas para dados
9) Os usuários podem criar suas próprias visualizações de dados para dados Deve ter Sim
10) Os usuários podem exportar suas visualizações de dados individualmente Deve ter Sim
11) Os usuários podem exportar suas visualizações de dados como um todo Deve ter Sim
12) Os usuários podem carregar conjuntos de dados para análise Não terá Possível
13) O desenvolvedor é capaz de carregar conjuntos de dados para análise Poderia ter Possível
Dos treze requisitos coletados, todos os requisitos que foram inicialmente classificados como "devem ter" ou
"deveriam ter" foram implementados com sucesso, o único "não" definitivo dentro dos requisitos é em relação
à classificação de dados por gênero. Isso ocorre porque o Twitter não habilita essa opção nativamente, e
envolveria um nível profundo de aprendizado de máquina para analisar nomes de usuários, nomes de exibição
e tweets para analisar se o sistema acredita que uma conta é masculina ou feminina. Todos os outros requisitos
poderiam ser um "sim" com o treinamento correto sobre o sistema.
Apesar da grande maioria dos requisitos serem atendidos, ainda acredito que há muito que pode ser melhorado
em relação ao sistema que criei. Em primeiro lugar, o plano inicial era analisar dados do Facebook e
Instagram, bem como do Twitter, no entanto, devido ao GDPR, o longo processo de solicitar permissão para
construir um aplicativo no Facebook em 2019 requer mais tempo e orçamento do que eu tinha como estudante
universitário. Isso se deve a eles exigirem um protótipo inteiro do aplicativo que você está construindo antes
de aprová-lo.
Além disso, como o Facebook possui o Instagram e eles não têm uma plataforma para aplicativos de terceiros
36
dentro do próprio aplicativo Instagram, um tipo diferente de ferramenta de raspagem de dados teria que ter
sido codificado e testado, o que novamente exigiu muito mais tempo do que eu tive para trabalhar no projeto.
Acredito também que, com mais tempo, o projeto poderia ter coletado muito mais dados do que possui
atualmente, o que daria uma representação mais precisa das opiniões do público sobre as empresas. Isso
também teria me permitido analisar mais semântica e melhorar ainda mais a área específica do código que
detecta o sentimento desses dados.
No entanto, sinto que este projecto contém uma representação completa das opiniões do público em linha
relativamente a determinadas empresas. O código referente à análise semântica também fornece uma leitura
precisa dos pensamentos de um consumidor, e as visualizações de dados criadas por meio do Tableau
mostram uma variedade de maneiras interessantes de olhar para os dados coletados. Isso permite uma análise
amigável para um significado mais profundo quando comparado ao sucesso geral de uma empresa.
Se este projeto tivesse iterações futuras, ele se beneficiaria de ser adaptado em um banco de dados para
segurança e velocidade de coleta e recuperação de dados, pois isso formaria mais estrutura para o projeto. O
número de empresas monitoradas poderia ser aumentado, e também acredito que seria uma boa ideia ter
"ouvintes de fluxo" implementados que raspariam cada Tweet à medida que ele é postado e o carregariam no
banco de dados, em vez de ter uma pessoa executando manualmente o código a cada uma ou duas horas.
Em versões futuras do projeto, eu também garantiria que há semanas e meses de dados, pois isso desbloqueia
a possibilidade de analisar o sentimento médio dos Tweets mês a mês, bem como o volume de Tweets
coletados. Isso poderia ser visualizado por meio do Tableau como uma comparação dos dados individuais de
cada empresa, bem como uma avaliação do mercado como um todo.
9.2 Auto-Avaliação
Considerando meu nível de habilidade como um estudante universitário com conhecimento de codificação
simplista, acredito que criei este projeto da melhor maneira possível.
Quando comecei a pesquisar este projeto, eu sabia que teria que aprender uma linguagem de codificação na
qual eu tivesse experiência mínima, se houver, já que as quatro ou cinco linguagens de codificação que
conheço bem eu venho aprendendo desde o Ensino Médio. Por causa disso, quando decidi pelo Python para
minha linguagem de codificação, eu sabia que o projeto seria uma luta para criar, mas eu estava ansioso para o
desafio, pois achei o tópico do meu projeto fascinante, e não havia como criar o projeto que eu queria sem dar
uma chance ao aprendizado de Python.
Uma desvantagem disso, no entanto, foi que eu talvez estivesse colocando muita pressão sobre mim mesmo
para aprender uma linguagem de codificação totalmente nova no meu último ano de universidade. Várias
vezes fiquei preso em um pedaço relativamente simples de código que acredito que teria conhecido a solução
para que minha educação na linguagem correspondesse à de Java, HTML ou CSS. Devido a isso, sinto como
se eu perdesse vários dias mudando pequenas partes do meu código para investigar onde eu tinha errado, o
que geralmente acabava sendo um problema com a minha sintaxe, e não com qualquer código escrito em si.
Dada a chance de criar todo o projeto novamente, acredito que muitas das melhorias que eu faria seriam
baseadas no tempo. Eu começaria a aprender Python e completar tutoriais no início do ciclo de
desenvolvimento para que eu pudesse gastar menos tempo resolvendo meu código. Eu poderia então gastar
mais tempo desenvolvendo o projeto e aumentando o escopo: seja o tamanho do conjunto de dados, o número
de empresas analisadas ou a confiabilidade da análise semântica.
Se me fosse dada a possibilidade, eu também gastaria mais tempo desenvolvendo meu conjunto de
habilidades com o Tableau, já que é um sistema tão poderoso e capaz, e sinto como se tivesse apenas pastado
a superfície de suas capacidades.
Apesar disso, comecei este projeto querendo analisar o quão positivas ou negativas eram as opiniões das
pessoas nas redes sociais e mostrar os resultados, e desenvolvi um programa que faz exatamente isso.
Consegui cumprir todos os requisitos que inicialmente me propus a cumprir na Seção 5 do relatório, e aprendi
uma nova linguagem de codificação que me ajudará muito no setor de Análise de Dados.
37
É por estas razões que acredito ter criado um bom modelo de trabalho, que cumpra as metas e objetivos a que
me propus inicialmente a alcançar, e estou feliz com o meu trabalho.
38
10 Conclusão
Este relatório inicialmente se propôs a investigar se há uma conexão entre o quão ativa uma empresa é nas
mídias sociais, sua reputação on-line com seus clientes e seus lucros, por meio de análise semântica e
visualização de dados dos resultados.
As visualizações de dados criadas destacam a conexão potencial entre o quão proativa uma empresa é on-line
e a reputação média que ela tem com seus clientes ou potenciais clientes.
Figura 16. Número total de Tweets enviados da Página do Twitter da Empresa (Reino Unido, se possível) e da Página de Ajuda (se
aplicável)
Como é mostrado, o número de Tweets enviados por cada empresa varia drasticamente entre as seis empresas
escolhidas para o estudo. Em ordem do mais para o menos:
1) ASOS
2) Boohoo
3) Saudades
4) H&M
5) Zara
6) Gal desagradável
39
Figura 17. Classificação semântica média por empresa
Isso se desenvolve quando comparado à classificação semântica média de cada empresa a partir dos Tweets
coletados, em que:
1) Saudades
2) H&M
3) Zara
4) Boohoo
5) Gal desagradável
6) ASOS
A primeira comparação interessante, é a empresa que enviou mais Tweets por quase 800.000, ou seja, ASOS,
tem a classificação de valor semântico mais baixa, enquanto H&M e Zara, que enviaram alguns dos menores
números de Tweets de suas contas corporativas do Twitter, e têm menos presença online, têm uma
classificação semântica mais alta. À primeira vista, parece que há pouca correlação entre os dois gráficos
mostrados, no entanto, quando os dados são revisados sem a inclusão de uma das empresas, os gráficos têm
uma correlação clara entre eles.
Pode-se argumentar que a interação com o cliente (ou seja, o CRM Social) no Twitter inspira os clientes a
pensar conscientemente sobre a marca e, portanto, eles são mais propensos a querer comprar lá. Várias
marcas, geralmente voltadas para as gerações mais jovens, enviam fotos engraçadas, citações, quizzes ou
outras postagens que incentivam a comunicação entre elas e seus clientes.
Uma dessas marcas, a Missguided, posta fotos ou vídeos que eles acreditam que sua base de usuários acha
"relacionáveis" todos os dias. Os clientes então reagem a essas postagens e as tratam da mesma forma que
fariam se uma conta não corporativa a tivesse enviado, e respondem ao Tweet com sua reação ou marcando
um amigo nele com um comentário. A publicação desse tipo de conteúdo inunda o feed da empresa com a
resposta dos clientes, bem como a tag "@Missguided".
Nenhuma pessoa:
Eu bêbado:
40
21:30 Paigelouisee2 ©Missguided Phil e grant / zac e Cody 7.00
Missgulde d
Missgulde
21:31 Anna_Jane_R ©Missguided Zac e Cody 7.00
d
Missgulde 10:43 Sianduff 7.50
©Missguided Slay vibe 37 @callysmitherman
d
Missguide 10:43 ModsOf Diversidade ©@ericafmstyle Missguided Isso é incrível Érica. 7.50
Missgulde
11:00 Saudades Memórias V https:/t.co/lw8kaemOs3 7.50
d
Missgulde 17:30 Saudades Obrigado a todos que entraram eu Parabéns a esses bebês ♦ 7.50
d
Missguide
d
13:42 Helena Smiddy Todos os arrepios V https://t.co/m411xZakkY 8.00
Missguide
d 14:00 itslxurenjade Eu não posso dizer o quão animado 1 da manhã para isso!!! Um dos meus filmes favoritos da Disney GWhttpsi/t .co/lpA4TGJrOK 8.00
Missguide
d
14:00 itslxurenjade
GW https://t.co/lpA4TGJrOK 8.00
Missguide
d
16:56 TheBlckhipster Preciso de todas as peças dessa ©coleção Playboy x ©Missguided na minha vida o mais rápido possível e 8.00
Missguide
d
Missguide
17:45 Amygardnerr
©Missguided Ekkkkk ser incrível v 8.00
Devido a isso, se o Missguided for negado a partir dos resultados e das visualizações de dados, um padrão
muito mais claro é revelado.
H&M m 6.174
Zara m 6.111
Boohoo n 5.948
Nasty Gal m 5.435
ASOS m 5.117
01234567
41
mostra-se que, curiosamente, quanto mais ativa uma empresa é nas mídias sociais, pior é a reputação que ela
tem online de seus clientes. As empresas ASOS, Boohoo e Nasty Gal – todas baseadas exclusivamente online,
têm as três piores classificações médias semânticas, enquanto H&M e Zara, que têm uma presença online e
offline constante, apesar de menos Tweets, têm uma classificação geral mais alta.
Pode-se argumentar que isso ocorre porque quanto mais ativa uma empresa é nas mídias sociais, mais
comentários ela tende a inspirar, bem como a ideia de que as pessoas são menos propensas a dar feedback
positivo sobre uma interação ou produto se for bom, mas são mais propensas a dar feedback negativo se for
ruim (Thomas, 2018). Isso poderia dar uma visão sobre a razão pela qual as empresas on-line têm as piores
classificações e, portanto, pode-se dizer que quanto mais impacto uma empresa faz nas mídias sociais, pior
reputação ela pode ter online.
2018
até o 28 de fevereiro de 2019, os lucros caíram 87% na comparação com o ano anterior (BBC News,
dia
2019)
- A Missguided sofreu um prejuízo antes dos impostos de £ 46 milhões de abril de 2017 a abril de
2018, em comparação com um prejuízo de £ 1,6 milhão no ano anterior, que eles atribuíram ao
"investimento prematuro" (BBC News, 2019).
Mais uma vez há pouca correlação entre os números apresentados. Apesar disso, pode-se dizer que há uma
pequena associação entre o quão ativa uma empresa é nas mídias sociais e seus rendimentos relacionados. A
Boohoo, a segunda conta corporativa mais ativa, teve um aumento de quase 50%, a ASOS, enquanto caiu
87% nos lucros antes de impostos, ganhou um aumento de 14% em suas vendas ano a ano, e o faturamento do
grupo Missguided no ano aumentou 4,9% para £ 215,91 milhões (Nazir, 2019).
Há algo a ser dito sobre a lucratividade dos mercados on-line no século 21, que pode ser analisado analisando
através de suas respostas de mídia social usando os sistemas sugeridos neste relatório. Embora pareça que,
quanto mais ativa uma empresa é nas mídias sociais, maior a probabilidade de receber comentários negativos:
isso não deve necessariamente ser visto como algo negativo, ser mais ativa e se comunicar mais com os
clientes parece aumentar as vendas.
42
11 Bibliografia
"Bliti". (2019, 4). Pinça. Retirado de Tweepy: https://www.tweepy.org/
Adams-Mott, A. (2018, p. 6). Vantagens e desvantagens do marketing de mídia social. Consultado em 1 9, 2019, from Small Business
Chronicles: http://smallbusiness.chron.com/advantages-disadvantages- social-media-marketing-21890.html
Šilingas, D., & Butleris, R. (2015). Rumo à implementação de um framework para modelagem de requisitos de software no
MagicDraw UML. Tecnologia da Informação e Controle, 38(2).
Ajmera, J., Ahn, H.-i., Nagarajan, M., Verma, A., & Contratante, D. (2013). Um sistema de CRM para mídias sociais. WWW '13
Anais da 22ª conferência internacional sobre World Wide Web, 49-58.
Arnold, A. (2017, p. 10). Conveniência x experiência: os millennials adoram o streaming, mas não estão prontos para o despejo
Cinema ainda. Retirado da Forbes:
https://www.forbes.com/sites/andrewarnold/2017/10/26/millennials-love-streaming-but- não estão prontos para despejar-
cinema-ainda/#2d11e7b56311
BBC News Brasil (2019, p. 4). Os lucros da ASOS despencam 87% após ano difícil. Retirado da BBC News:
https://www.bbc.co.uk/news/business-47877688
BBC News Brasil (2019, p. 1). A cadeia de moda Missguided vê as perdas aumentarem à medida que os custos aumentam. Retirado
da BBC News: https://www.bbc.co.uk/news/business-46783114
Brandwatch. (2019, 3 29). Os emojis mais populares. Retirado de Brandwatch: https://www.brandwatch.com/blog/the-most-popular-
emojis/
Bullock, L. (2018, 11 27). O maior fracasso das redes sociais de 2018. Retirado da Forbes:
https://www.forbes.com/sites/lilachbullock/2018/11/27/biggest-social-media-fails- 2018/#da9943518f8c
Pão de bolo, C. (2017, 11 15). Você não está sozinho, ninguém lê os termos dos contratos de serviço. Retirado do Business Insider:
https://www.businessinsider.com/deloitte-study-91-percent-agree-terms-of-service- sem-leitura-2017-11?r=US&IR=T
Castronovo, C., & Huang, L. (2012). Mídias Sociais em um Modelo Alternativo de Comunicação de Marketing.
Revista de Marketing Desenvolvimento e Competitividade, 117-131.
Clarke, J. (2017, p. 11). Os compradores do Reino Unido devem gastar mais neste Natal em comparação com o ano passado.
Retirado de Independent: https://www.independent.co.uk/news/business/news/uk-shopping-christmas- forecast-british-
consumers-brexit-a8031606.html
Coleman, A. (2003). Dicionário Oxford de Psicologia. Nova Iorque: Oxford University Press, p.77.
Casa das Empresas. (2018, 1). Relatório Anual e Demonstrações Financeiras referentes ao exercício findo em 31 de janeiro de 201.
Retirado de Companies House: https://s3.eu-west-2.amazonaws.com/document-api-
images-live.ch.gov.uk/docs/sdOxhBqVYBtgmcjTTqR2-
Tm72MSHyljBSTk8S7U_Z9g/aplicação-pdf? X-AMZ-Algorithm=AWS4-HMAC-
SHA256&X-AMZ-Content-Sha256=UNSIGNED-PAYLOAD&X-Amz-
Credencial = ASIAWRGBDBV3LGD5ORE6%2F20190425%
Switch de CRM. (2013). Um Breve Histórico da Gestão do Relacionamento com o Cliente. Obtido do CRM Switch:
https://www.crmswitch.com/crm-industry/crm-industry-history/
Dia, T. (2013). Sucesso na Escrita Acadêmica. Palgrave.
Eadicicco, L. (2015, p. 12). Os americanos verificam seus telefones 8 bilhões de vezes por dia. Retirado de Time:
http://time.com/4147614/smartphone-usage-us-2015/
Edosomwan, S., Kalangot Prakasan, S., Kouame, D., Watson, J., & Seymour, T. (2011). A História das Mídias Sociais e seu Impacto
nos Negócios. Revista de Gestão Aplicada e Empreendedorismo, 79-91.
Edwards, J. (2014, 08 28). O Twitter agora mostra exatamente quantas pessoas veem seus tweets - e é hipnotizante. Retirado do
Business Insider: https://www.businessinsider.com/twitter- analytics-dashboard-launched-2014-8?r=US&IR=T
Emojitracker. (2019, 4 3). Rastreador de Emoji. Retirado de Emoji Tracker: http://emojitracker.com
Fingas, J. (2018, 09 09). Os atalhos de emojis do Instagram ajudam você a comentar em tempo recorde. Retirado do Engadget:
https://www.engadget.com/2018/09/09/instagram-emoji-
atalhos/?guccounter=1&guce_referrer_us=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce
_referrer_cs=LoLm0cHSgd1SMKMPFZcxtQ
Fortin, J. (2018, 1 13). H&M fecha lojas na África do Sul em meio a protestos por camisa 'macaca'. Retirado do The New York
Times: https://www.nytimes.com/2018/01/13/world/africa/hm-south-africa- protesto.html
Gates, B. (1999). Negócios na Velocidade do Pensamento: Usando um Sistema Nervoso Digital. Pinguim.
Google Trends. (2008). Tendência "John Lewis Christmas". Retirado do Google:
https://trends.google.com/trends/explore?geo=GB&q=John%20Lewis%20christmas
43
Gov.uk. (2018). Proteção de Dados. Retirado de GOV.UK: https://www.gov.uk/data-protection
Huddy, G. (2017, p. 10 19). Como funciona a análise de texto para mídias sociais. Retirado de Crimson Hexagon:
https://www.crimsonhexagon.com/blog/how-text-analytics-works-for-social-media/
Ilyashov, A. (2015). Veja como as marcas de luxo estão fazendo muito mal nas redes sociais (e os poucos que quebram o molde).
Retirado de https://www.refinery29.com/en-us/2015/10/95018/luxury-fashion- brands-social-media
Irish Times. (2019, 3). Obtido em https://www.irishtimes.com/business/retail-and-services/h-m- lucro-cai-menos-que-do-esperado-
depois-de-restrições-descontos-1,3842804
José, S. (2017). Como a Nike está usando os canais digitais para impulsionar as vendas. Retirado de Digiday UK:
https://digiday.com/marketing/nike-using-digital-channels-drive-sales/
Kinder, T. (2019, 4 25). O Instagram ajuda a Boohoo a abocanhar um aumento de vendas. Retirado do The Times:
https://www.thetimes.co.uk/article/instagram-set-helps-boohoo-to-snap-up-a-sales-increase- 5ffdssrbh
Lim, K. H. (2018, 04). Emojis Positivos e Negativos utilizados para a Análise de Sentimento. Retirado de
ResearchGate: https://www.researchgate.net/figure/Positive-and-negative-emojis-used-for-the- sentimento-
analysis_fig3_324639092
Semana de Marketing. (2018, 9 13). Como uma campanha do Facebook mudou a abordagem da M&M para anúncios para
dispositivos móveis.
Retirado de Marketing Week: https://www.marketingweek.com/2018/09/13/facebook- mms-mobile-ads/
McIntyre, H. (2016, p. 7). Os millennials não estão mais muito interessados no rádio tradicional. Retirado da Forbes:
https://www.forbes.com/sites/hughmcintyre/2016/07/12/millennials-estão-muito-interessados-em-rádio-tradicional-
qualquer-mais/#b7e7bf37c4e4
Nazir, S. (2019, p. 1). Missguided relata prejuízo de £ 46,7 milhões. Retirado de Retail Gazette:
https://www.retailgazette.co.uk/blog/2019/01/missguided-reports-46-7m-loss/
Novak, P. K., Smailovic, J., Sluban, B., & Mozetic, I. (2015). Sentimento de emojis. Plos Um.
O'flynn, R. (2017, 7 17). A maneira como o biscoito social desmorona: a genialidade do marketing de mídia social da Oreo.
Retirado de 201digital: https://www.201digital.co.uk/way-social-cookie-crumbles-genius- oreos-social-media-marketing-
can-learn/
Pak, A., & Paroubek, P. (2010). Twitter como corpus para análise de sentimentos e mineração de opinião. LREc, 1320-1326.
Portocarrero, J. M., Delicato, F. C., Pires, P. F., Gámez, N., Fuentes, L., Ludovino, D., & Ferreira, P. (2014). Redes de sensores sem
fio autônomos: uma revisão sistemática da literatura. Revista de Sensores.
Red Hot Penny. (2018, 16 de agosto). O Social Scorecard - Moda e Acessórios 2018. Consultado em novembro
8, 2018, de https://www.redhotpenny.com/social-scorecard-fashion-accessories- 2018/#wpcf7-F4557-P4549-O1
Ritvikmath. (2018, 6 18). Raspagem de dados. Obtido do github:
https://github.com/ritvikmath/ScrapingData/blob/master/Scraping%20Twitter%20Data.ipyn b
Roberts, M. (2018, 6 12). A melhor rede de restaurantes do Twitter reage ao IHOP mudar seu nome para 'IHOb'.
Retirado de Pessoas: https://people.com/food/ihop-name-change-ihob-twitter-reactions/
Roth, Y. (2018, p. 7). Novos requisitos do desenvolvedor para proteger nossa plataforma. Retirado do Twitter:
https://blog.twitter.com/developer/en_us/topics/tools/2018/new-developer-requirements-to- proteger nossa plataforma.html
Rouse, M. (2017, p. 9). Definição: CRM social. Retirado de WhatIs.com:
https://searchcrm.techtarget.com/definition/social-CRM
Rudestam, K. E., & Newton, R. R. (2007). Sobrevivendo à sua dissertação: um guia abrangente de conteúdo e
Processo (3ª ed.). SÁLVIA.
Thiagarajan, S. (2018, p. 11). Facebook, Instagram ou Twitter? Estratégia de mídia social que você deve seguir. Retirado do
Economic Times: https://economictimes.indiatimes.com/small-biz/marketing- branding/marketing/facebook-instagram-or-
twitter-social-media-strategy-that-you-should- follow/articleshow/66471776.cms
Tomás, A. (2018, 2). A proporção secreta que prova por que as avaliações dos clientes são tão importantes. Retirado de Inc.:
https://www.inc.com/andrew-thomas/the-hidden-ratio-that-could-make-or-break-your- company.html
Tobin, B. (2018, 7 10). IHOP muda de nome de volta de IHOB. Retirado do USA Today:
https://eu.usatoday.com/story/money/2018/07/09/ihop-changes-name-back- ihob/769310002/
Y, E. (2019, 01 30). 5 coisas que você precisa saber antes de raspar dados do Facebook. Retirado de Octoparse:
https://www.octoparse.com/blog/5-things-you-need-to-know-before-scraping- data-from-facebook
YPulse. (2018, 6). AS 10 MARCAS QUE A GERAÇÃO Z E OS MILLENNIALS MAIS CONFIAM. Retirado de
YPULSE: https://www.ypulse.com/post/view/the-10-brands-gen-z-millennials-trust-most
44
12 Apêndices
Gráfico 1.
YPulse. (2018, 6). AS 10 MARCAS QUE A GERAÇÃO Z E OS MILLENNIALS MAIS CONFIAM.
Retirado de
YPULSE: https://www.ypulse.com/post/view/the-10-brands-gen-z-millennials-trust-most
Gráfico 2.
Google Trends (2019) GOOGLE TRENDS SOCIAL CRM. Obtido do Google Trends:
https://trends.google.com/trends/explore?date=all&q=Social%20CRM
Figura 3&4.
Twitter (2019) Marks & Spencer Conta do Twitter. Retirado do Twitter:
https://twitter.com/marksandspencer/with_replies
Figure 5.
Smith, M (2018) Quão bom é "bom"? Retirado de YouGov:
https://yougov.co.uk/topics/lifestyle/articles-reports/2018/10/02/how-good-good
Figure 6.
Twitter Analytics (2018) Como usar o Twitter Analytics. Retirado do Business Twitter:
https://business.twitter.com/en/analytics.html
Figure 7.
Hootsuite (2018) Ferramentas de análise de sentimento para profissionais de marketing de mídia social.
Retirado de Blog.Hootsuite:
https://blog.hootsuite.com/social-media-sentiment-analysis-tools/
Figure 8.
Lexalytics (2018) Semantria para Excel. Retirado de Lexalytics:
https://www.lexalytics.com/semantria/excel
Figure 9.
Draw.io (2019) Diagrama criado por Desenvolvedor. Desenvolvido e baixado de Draw.io: draw.io
Figure 10.
Twitter Developer (2019) Detalhes do aplicativo. Retirado do Twitter:
https://developer.twitter.com/en/apps/16124184
Figure 11.
Twitter Developer (2019) Chaves e tokens. Retirado do Twitter:
https://developer.twitter.com/en/apps/16124184
Figure 12.
"Dados -0 classificações.xlsx"
Figure 13.
"Dados -0 classificações.xlsx"
Figure 14.
"Dados -0 classificações.xlsx"
Figure 15.
45
Tableau, "Visualizações de dados.twb"
Figure 16.
Tableau, "Visualizações de dados.twb"
Figure 17.
Tableau, "Visualizações de dados.twb"
Figure 18.
Missguided Twitter Account (abril, 2019) Twitter. Retirado do Twitter:
https://twitter.com/Missguided/status/1120779470191955970
Figure 19.
"Dados -0 classificações.xlsx"
Figure 20.
Tableau, "Visualizações de dados.twb"
Figure 21.
Tableau, "Visualizações de dados.twb"
«Metas e objetivos
Para investigar isso, o projeto coletará dados de três das mídias sociais mais populares (Twitter, Facebook e
Instagram) para várias empresas de varejo e indexará os resultados com base em quão positivas/negativas são
as palavras/fraseados. Essas informações serão exibidas por meio de um software de visualização de dados e
comparadas com os lucros anuais de cada uma das empresas para determinar se existe uma ligação entre o
quão ativa uma empresa é nas mídias sociais e a quantidade de lucros que ela obtém por ano.
[n] = Dias
1.3 Implementação
1.3.1 Coletar e armazenar dados de mídias sociais
1.3.1.1 Os dados de várias mídias sociais serão raspados dos sites usando scripts Python.
Isso permitirá que eles sejam analisados posteriormente.
46
1.3.1.2 Raspe dados do Twitter. [10.0]
1.3.1.3 Raspe dados do Instagram. [10.0]
1.3.1.4 Raspe dados do Facebook. [10.0]
1.3.2 Coletar e armazenar referências de indexação.
1.3.2.1 Armazene várias palavras e frases em um documento e indexe-as com base em quão
positivas ou negativas as palavras aparecem por meio de uma combinação de pesquisa (80%) e suposições
pessoais com base na relevância da idade do desenvolvedor (20%).
1.3.2.2 Pesquise e reúna palavras e frases para obter uma taxa de
positividade. [5.0]
1.3.2.3 Insira-os em um documento e estabeleça as proporções para cada
entrada de dados. [5.0]
1.3.3 Criar uma representação visual dos dados
1.3.3.1 Usando um sistema de dashboard como o Tableau, crie uma visualização física dos
resultados da pesquisa para mostrar ao cliente.
1.3.3.2 Importe dados para o sistema de painel. [1.0]
1.3.3.3 Exiba os dados dentro do sistema usando várias tabelas e gráficos para facilitar a
visualização pelo Cliente. [10.0]
47
tweepy. API(auth)
# O termo de pesquisa que você deseja encontrar
query = "Universidade de Greenwich"
# Código do idioma (segue os padrões ISO 639-1) idioma = "en"
# Chamando a função user_timeline com nossos parâmetros resultados
= api.search(q=query, lang=language, count=100)
# foreach através de todos os tweets puxados
Para tweetar nos resultados:
if (não tweet.retweeted) e ('RT @' não em tweet.text):
# imprimindo o texto armazenado dentro do objeto tweet
print(tweet.user.screen_name,"Tweeted:",tweet.text)
print()
Importar CSV
# Criando o objeto API ao passar informações de autenticação api =
tweepy. API(auth)
# Abrir/Criar um arquivo para acrescentar dados
csvFile = aberto('asos3.csv', 'a')
#Use csv Writer csvWriter = csv.writer(csvFile)
# Chamando a função user_timeline com nossos parâmetros resultados
= api.search(q=query, lang=language, count=500)
Para tweetar nos resultados:
if (não tweet.retweeted) e ('RT @' não em tweet.text):
#Write uma linha para o arquivo csv / Eu uso codificar utf-8
csvWriter.writerow([tweet.created_at,
tweet.user.screen_name, tweet.text])
csvFile.close()
48
if (não tweet.retweeted) e ('RT @' não em tweet.text):
#Write uma linha para o arquivo CSV
se 'abismal' em tweet.text ou 'terrível' em
tweet.text ou 'terrível' em tweet.text ou 'horrível' em tweet.text
ou 'terrível' em tweet.text ou 'muito ruim' em tweet.text ou 'muito
ruim' em tweet.text ou ' 3 ' em tweet.text ou '6)' em tweet.text ou
' 6)' em tweet.text ou
em tweet.text ou 'pior' em tweet.text ou 'indignado' em
tweet.text ou 'nojento' em tweet.text ou 'hate' em tweet.text:
rating = rating + 1
contador += 1
se 'lixo' em tweet.text ou 'insatisfatório' em
tweet.text ou 'ruim' em tweet.text ou 'pobre' em tweet.text ou '6'
em tweet.text ou '2' em tweet.text ou ':(' em tweet.text ou '):' em
tweet.text ou ' • ' em tweet.text ou 'annoy' em tweet.text ou
'annoy' em tweet.text ou
49
em tweet.texto
ou ':)' em tweet.text ou '(:' em tweet.text ou ' *' em tweet.text
ou ‘%‘ em tweet.texto ou ‘6’ emtweet.texto ou
‘%‘ em tweet.texto
ou ‘0‘ em tweet.texto ou 'G' em tweet.texto:
classificação = classificação + 7 contador += 1
<7X UNIVERSIDADE DE 49 GREENWICH 1
Índice 3
1 Secção 1: Introdução 5
2 Seção 2: Revisão da Literatura 6
Quão bom é "bom"? Agora com ainda mais palavras! 12
YouGov 13
3 Seção 3: Pesquisa de Produtos 15
3.4 Modelo de Pontuação Ponderada 18
4 Seção 4: Questões e Considerações Legais, Sociais, Éticas e Profissionais 19
5 Seção 5: Requisitos e Metodologia 20
5.5 Metodologia 21
5.6 Justificação da adequação de uma Metodologia ou de um Quadro seguido 23
6 Projetar 23
6.1 Diagrama de caso de uso UML 23
7 Processo de Desenvolvimento 25
7.1 Estágio 1: Busca inicial de código Python 25
7.2 Etapa 2: Implementação da Análise Semântica 29
7.2.1 Iteraçã o 1 29
7.2.2 Iteraçã o 2 29
7.2.3 Iteraçã o 3 29
7.3 Estágio 3: Agrupando os dados no Excel 30
7.4 Etapa 4: Criando visualizações de dados 31
7.5 Caixa de Tempo 34
7.6 Potenciais abordagens alternativas 34
8 Teste 35
9 Avaliação 36
9.1 Avaliação do Produto 36
9.2 Auto-Avaliação 37
10 Conclusão 39
10.1 Conclusões sobre Reputação 39
10.2 Conclusões relativas à Rentabilidade 42
11 Bibliografia 43
12 Apêndices 45
12.1 Apêndice A: Figuras 45
50
12.2 Apêndice B: Relatório contextual 46
12.3 Apêndice C: Código do Notebook Python Jupyter 47
12.4 Apêndice D: Código de Análise Semântica 48
12.5 Apêndice E: Fórmulas de planilha do Excel 51
12.6 Apêndice F: Visualizações de dados do Tableau 53
:o 54
12.7 Apêndice G: Ensaios 57
G H Eu J
51
NOME DA EMPRESA NQ. QF5EMANTJC Tiff£EIS£i AMOSTRA
ASOS =CONTARSE(A1:A485,"ASOS")
BOOHOO =COUNTIF(Al:A484,"Boohoo")
H&M =CONTAGEM(A1:A485,"H&M")
SAUDADES =COUNTIF(Al:A484,"Missguided")
ZARA =COUNTIF(Al:A485,"Zara")
Total: =SOMA(P2:P7)
R S
0.0416666666666667 =CONTADORES(B2:B485,">=01:00",B2:B485,"<02:00")
0.0833333333333333 =CONTADORES(B2:B485,">=02:00",B2:B485,"<03:00")
0.125 =CONTADORES(B2:B485,">=03:00",B2:B485,"<04:00")
0.166666666666667 =CONTADORES(B2:B485,">=04:00",B2:B485,"<05:00")
0.208333333333333 =COUNTIFS(B2:B485,">=05:00",B2:B485,"<06:00")
0.25 =CONTADORES(B2:B485,">=06:00",B2:B485,"<07:00")
0.291666666666667 =COUNTIFS(B2:B485,">=07:00",B2:B485,"<08:00")
0.333333333333333 =CONTADORES(B2:B485,">=08:00",B2:B485,"<09:00")
0.375 =CONTADORES(B2:B485,">=09:00",B2:B485,"<10:00")
0.416666666666667 =COUNTIFS(B2:B485,">=10:00",B2:B485,"<11:OO")
0.458333333333333 =CONTADORES(B2:B485,">=11:00",B2:B485,"<12:00")
0.5 =CONTADORES(B2:B485,">=12:00",B2:B485,"<13:00")
0.541666666666667 =COUNTIFS(B2:B485,">=13:00",B2:B485,"<14:00")
0.666666666666667 =C0UNTIFS(B2:B485,">=16:00",B2:B485,"<17:00")
0.708333333333333 =CONTADORES(B2:B485,">=17:00",B2:B485,"<18:00")
0.75 =COUNTIFS(B2:B485,">=18:00",B2:B485,"<19:00")
0.791666666666667 =CONTADORES(B2:B485,">=19:00",B2:B485,"<20:00")
0.833333333333333 =CONTADORES(B2:B485,">=20:00",B2:B485,"<21:00")
0.916666666666667 =COUNTIFS(B2:B485,">=22:OO",B2:B485,"<23:OO")
0.958333333333333 =CONTADORES(B2:B485,">=23:00",B2:B485,"<=23:59")
0 =CONTADORES(B2:B485,">=00:00",B2:B485,"<01:00")
52
Número ASOS
2 =CONTADORES(A1:A485,"ASOS",E1:E485,2)
3 =COUNTIFS(Al:A485,"ASOS"/El:E485,">=3",El:E485 /'<=3.9")
4 =CONTADORES(A1:A485,"ASOS"/E1:E485/">=4",E1:E485,"<=4,9")
5 =CONTADORES(A1:A485,"ASOS",E1:E485,">=5"/E1:E485,"<=5,9")
6 =COUNTIFS(Al:A485,"ASOS",El:E485/">=6"/El:E485,"<=6.9")
7 =CONTADORES(A1:A485,"ASOS"/E1:E485,">=7",E1:E485,"<=7,9")
8 =CONTADORES(A1:A485,"ASOS",E1:E485,">=8",E1:E485,"<=8,9")
9 =CONTADORES(A1:A485,"ASOS",E1:E485,">=9",E1:E485,"<=9,9")
10 =CONTADORES(A1:A485,"ASOS"/E1:E485,10)
53
Filtros Padrão de nome da
Classificação semântica média por empresa
empresa
Empresa N..
■ ASOS
■ Boohoo
Missguided 6.232
■ H&M
Marcas H&M Zara
milh 6.174 milh 6.111 ■ Saudades
000 Automático- Boohoo ■ Gal desagradável
5.948
:o
Cor Etiqueta de tamanho
Nasty Gal
ASOS
I 5.435
5.117
■ Zara
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5
Detalhe Dica de ferramenta
Avg. Classificação semântica =
Empresa Nam..
AVG(Semântica.
.
54
55
Página lii Colunas Nome da Empresa
s fo..
:= Linhas r MEDIAN(Total No. De..
1200K
Q
Dica de
ferrame
80OK
600K
400K
ZOOK
1000K
LIVRO
36
ZARA
128
72 GAL
ASOS
NASTY
97
MISSGUIDED
103
2324 67g
BOOHOO
48
I //>9
1
H&M
//10
Análise Semântica
da Estatística
56
Análise dos dados coletados
57
4 Nuvem de Garantindo que o Passar o mouse sobre a O resultado esperado Passar
palavras recurso de foco palavra mostra o número
funcione de vezes que ela é
mencionada no conjunto
de dados
5 Classificação Verifique se os Verifique se os O resultado esperado Passar
semântica média dados são exibidos resultados estão
corretamente correlacionados com a
"Tabela de Médias" na
6 Classificação Clicando em uma A barra deve aparecer O resultado esperado Passar
semântica média barra realçada enquanto o
restante do gráfico está
acinzentado
7 Classificação Selecionando várias As barras devem O resultado esperado Passar
semântica média barras aparecer realçadas
enquanto o restante do
gráfico está acinzentado
8 Classificação Garantindo que o Passar o mouse sobre O resultado esperado Passar
semântica média recurso de foco uma barra mostra a
funcione classificação semântica
média dessa empresa
9 Tweets por hora Verifique se os Confira 11h para ver se Classificação e filtro de Falhar
Gráfico de pizza dados são exibidos Planilha também dá planilha dá 39
corretamente resultado de 38
10 Tweets por hora Verifique se os Confira 11h para ver se O resultado esperado Passar
Gráfico de pizza dados são exibidos Planilha também dá
corretamente (v2) resultado de 39
11 Tweets por hora Clicando em um O segmento deve O resultado esperado Passar
Gráfico de pizza segmento aparecer realçado
enquanto o restante do
gráfico de pizza está
12 Tweets por hora Selecionando vários Os segmentos devem O resultado esperado Passar
Gráfico de pizza segmentos aparecer realçados
enquanto o restante do
gráfico de pizza está
13 Tweets por hora Garantindo que o Passar o mouse sobre um O resultado esperado Passar
Gráfico de pizza recurso de foco segmento mostra o
funcione número de Tweets
correspondentes àquela
hora
14 Tweets Verifique se os Verifique se "ASOS" no O resultado esperado Passar
semânticos por dados são exibidos filtro na planilha do
empresa corretamente Excel é igual a 128
15 Tweets Clicando em um O segmento deve O resultado esperado Passar
semânticos por segmento aparecer realçado
empresa enquanto o restante do
gráfico de pizza está
16 Tweets Selecionando vários Os segmentos devem O resultado esperado Passar
semânticos por segmentos aparecer realçados
empresa enquanto o restante do
gráfico de pizza está
17 Tweets Garantindo que o Passar o mouse sobre um O resultado esperado Passar
semânticos por recurso de foco segmento mostra o
empresa funcione número de Tweets dessa
empresa no conjunto de
dados
58
18 Tweets por Verifique se os Verifique se existem 5 O resultado esperado Passar
classificação por dados são exibidos tweets para Missguided
empresa corretamente com uma classificação
entre 3-3.9
19 Tweets por Clicando em uma A barra deve aparecer O resultado esperado Passar
classificação por barra realçada enquanto o
empresa restante do gráfico está
acinzentado
20 Tweets por Selecionando várias As barras devem O resultado esperado Passar
classificação por barras aparecer realçadas
empresa enquanto o restante do
gráfico está acinzentado
21 Tweets por Garantindo que o Passar o mouse sobre O resultado esperado Passar
classificação por recurso de foco uma barra mostra o
empresa funcione número de Tweets dessa
classificação e da
22 Número total de Clicando em uma A barra deve aparecer O resultado esperado Passar
tweets na página barra realçada enquanto o
da empresa no restante do gráfico está
Twitter acinzentado
23 Número total de Selecionando várias As barras devem O resultado esperado Passar
tweets na página barras aparecer realçadas
da empresa no enquanto o restante do
Twitter gráfico está acinzentado
24 Número total de Garantindo que o Passar o mouse sobre O resultado esperado Passar
tweets na página recurso de foco uma barra mostra o
da empresa no funcione número de Tweets das
Twitter páginas do Twitter dessa
empresa
25 Painel de Coleta O link do botão O resultado esperado Passar
de Estatísticas Garantir que a Entrar no modo de
Análise de apresentação e clicar no
Estatísticas funcione botão deve transferir o
no Modo de usuário para o painel de
Apresentação análise de estatísticas
26 Análise do Painel Entrar no modo de O resultado esperado Passar
de Estatísticas Garantir que o botão apresentação e clicar no
vinculado à Coleta botão deve transferir o
de Estatísticas usuário para o Painel de
funcione no Modo Estatísticas de Coleta
de Apresentação
27 Painel de Coleta Garantir que o link Clicar no botão enquanto O resultado esperado Passar
de Estatísticas do botão Análise de estiver na versão pública
estatísticas funcione da pasta de trabalho do
no Tableau Public Tableau deve transferir o
usuário para o Painel de
análise de estatísticas
28 Análise do Painel Garantir que o link Clicar no botão enquanto O resultado esperado Passar
de Estatísticas do botão para estiver na versão pública
coletar estatísticas da pasta de trabalho do
funcione no Tableau Tableau deve transferir o
Public usuário para o Painel de
coleta de estatísticas
59