Você está na página 1de 23

TRABALHO DE ANÁLISE DE MÍDIAS SOCIAIS

F G V - M B A B U S I N E S S A N A L I T I C S E B I G D ATA
Professor Fernando Ferreira

FABRIKAM
GRUPO 3
Brenda Brites
Diego Guerrieri
G u i l h e r m e To r t e l o t e
Vanessa Elizardo

FABRIKAM 2
TEMA: FAKE NEWS
O que são fake news?

A expressão fake news ganhou as páginas dos jornais e a internet nos


últimos anos. No entanto, nem todos sabem ao certo o que significa fake
news. O termo vem do inglês fake (falsa/falso) e news (notícias). Dessa
forma, em português, a palavra significa notícias falsas. Apesar de ter se
destacado recentemente, a expressão é bem mais antiga e data do final do
século XIX. Fake News são as informações falsas que viralizam entre a
população como se fosse verdade. Atualmente, elas estão, principalmente,
relacionadas às redes sociais.

A internet possibilita que as notícias se espalhem em uma velocidade cada


vez maior e as redes sociais aceleraram ainda mais esse processo.

FABRIKAM 3
OBJETIVO
Foco da pesquisa

Pesquisar as últimas páginas de noticias


envolvendo o tema Fake News no site Globo.com
(G1).

A partir dos dados queremos identificar as


principais comunidades e os termos mais
frequentes ligados ao tema.

"https://g1.globo.com/busca/?q=Fake+news"

FABRIKAM 4
METODOLOGIAS UTILIZADAS

C O L E TA D E I N F O R M A Ç Õ E S ANÁLISE DE DADOS
ü Técnica de web scraping utilizando a biblioteca Rvest do ü Para análise dos dados coletados foram utilizadas as
software R. bibliotecas WordCloud2, SpacyR, Tideverse, entre outras do R.

ü Dados da coleta: ü Foram eliminados os links de vídeo do GloboPlay e realizadas


algumas transformações para melhoria dos dados, como
ü 100 páginas pesquisadas
remoção de stop words, números, pontuação, espaços e links
ü 507 links de notícias obtidos
não capturados (vazios).

ü No resultado final foram obtidos 18.593 termos no total. Para


as categorias consideradas, organização e pessoas,
encontramos 8.760 termos.

ü Para análise e visualização da rede foi utilizado o software


Gephi.
FABRIKAM 5
ANÁLISES REALIZADAS

FABRIKAM
Visão Geral da Rede Métrica

MÉTRICAS Grau Médio


Grau Ponderado
27,802
100,529

DA
Diâmetro da Rede 6
Densidade do grafo 0,33
Modularidade 0,409

REDE Componentes Conectados 19

Visão Geral dos Nós e Arestas Métrica

Coef. De Clustering Médio Nó 0,879

Comprimento médio de caminho 2,509

FABRIKAM 7
DENSIDADE
Rede de Informações
11.774 Arestas Densidade é a razão do número de arestas
existentes sobre o número de arestas possíveis
em um grafo.

Para esta rede podemos identificar uma baixa

847 Nós densidade, considerando que a rede não tem


direção.

0,033 Densidade

FABRIKAM 8
FREQUÊNCIA

Nuvem de palavras (word cloud) é um gráfico digital


que mostra o grau de frequência das palavras
relacionados a um tema ou documento. Quanto
mais a palavra é utilizada, mais chamativa é a
representação dessa palavra no gráfico.

Para este caso podemos identificar que as notícias


relacionadas à fake news tem uma alta frequência
das palavras MINISTRO, STF, SUPREMO, LIBERDADE,
PRESIDENTE.

Além disso, percebemos alguns personagens


envolvidos nas notícias: Procurador Geral Augusto
Aras, Ministros do STF Edson Fachin e Alexandre
Moraes e o presidente Bolsonaro.

FABRIKAM 9
ENTIDADES MAPEADAS

Em NER (Named Entity Recognition) é o


reconhecimento de entidades nomeadas e
anotações de papéis semânticos.

Pessoas PER
Locais LOC
Organizações ORG
Nomes NAM
Outros MISC

Total Total Análise Para análise serão considerados apenas as


18.593 8.760 47% categorias organização e pessoas, que
representa 47% da base.

FABRIKAM 10
MODULARIDADE

É uma medida da estrutura de redes ou gráficos.


Esta media foi projetada para medir a força da
divisão de uma rede em módulos (também
chamados de clusters ou comunidades).

A comunidade 7 é muito representativa.


Identificamos que esta comunidade possui muitos
nós relacionados à órgãos investigativos e pessoas
que foram demonstradas na nuvem de palavras.

As comunidades 5 e 10 são bastante


Modularidade Qtde de Nós representativas depois da 7. As demais
0,409 353
+ Representativa comunidades são similares e não ultrapassam 50
Comunidade 7
Comunidades (%) Comunidade nós
27 42%
FABRIKAM 11
GRAFO MODULARIDADE

FABRIKAM 12
GRAU MÉDIO

O grau médio ajuda a identificar os nós com


maior número de conexões (maior grau) e
assim poderemos destacá-los no grafo
aumentando seu tamanho.

O gráfico apresenta o número de conexões


(eixo x) versus a quantidade de nós (eixo y).

Desta forma podemos entender que a maioria


dos nós tem poucas conexões.

Grau Médio
27,802

FABRIKAM 13
GRAFO GRAU MÉDIO

Nós mais
conectados

FABRIKAM 14
CENTRALIDADE

Centralidade de grau é definida como o


número de ligações incidentes de um vértice.
O grau pode ser interpretado como a
O quão rápido um nó pode alcançar a todos O quão provável um nó é uma rota direta entre dois probabilidade que o vértice tem de receber
nós do grafo
alguma informação da rede

Distância de um determinado nó até o nó mais O quão bem conectado o nó é em relação a nós


distante dele na rede bem conectadas

FABRIKAM 15
GRAFOS CENTRALIDADES

Closeness
Betweeness

FABRIKAM 16
GRAFO CENTRALIDADES
Auto Vetor
Excentricidade

FABRIKAM 17
PAGERANK

É uma variante da centralidade do vetor próprio.

Como a centralidade de grau mede o número


de vizinhos diretos, a centralidade Katz mede o
número de todos os nós que podem ser
conectados através de um caminho.

Foi utilizada uma probabilidade de 0,85 e um


critério de parada épsilon de 0,001.

FABRIKAM 18
GRAFO PAGE RANK

FABRIKAM 19
R ES U LTA D O DA A N Á L I S E

• As maior incidência de notícias de fake news


está relacionada com membros dos poderes
executivo, legislativo, judiciário e pessoas
envolvidas que constam em investigações.

FABRIKAM 20
PRINCIPAIS MÉTRICAS DOS NÓS RELEVANTES
Id v_name modularity_class degree closnesscentrality betweenesscentrality eigencentrality Hub
n414 Jair Bolsonaro 15 469 0,6880 77.072,4195 1,0000 0,1978
n44 Alexandre de Moraes 15 316 0,6027 22.072,5404 0,8504 0,1751
n473 Luciano Hang 7 247 0,5648 12.558,3531 0,7586 0,1587
n637 PSL 7 231 0,5581 14.917,5284 0,6987 0,1455
n300 Fake News 7 204 0,5436 13.498,6233 0,5360 0,1072
n134 Câmara 7 192 0,5370 5.831,4501 0,6072 0,1246
n692 Rodrigo Maia 7 183 0,5329 6.679,5258 0,5940 0,1220
n540 Moraes 7 179 0,5265 4.061,6650 0,6054 0,1260
n253 Eduardo Bolsonaro 7 178 0,5265 5.629,2723 0,5068 0,1016
n53 Allan dos Santos 7 174 0,5291 3.986,2570 0,6600 0,1412

Ranking degree
Allan dos Santos
Eduardo Bol sonaro
Moraes
Rodrigo Maia
Câmara
Fak e News
PSL
Luciano Hang
Alexandre de Moraes
Jair Bolsonaro

0 50 100 150 200 250 300 350 400 450 500

FABRIKAM 21
COMPARAÇÃO DE REDES EGO

JAIR BOLSONARO ALEXANDRE MORAES


FABRIKAM 22
REFERÊNCIAS

Apostilas da matéria
Apostila Gephi - Academia

Wikipedia
https://pt.wikipedia.org/wiki/Centralidade
https://github.com/gephi/gephi/wiki/PageRank

FABRIKAM

Você também pode gostar