Você está na página 1de 7

19/07/2021 `` Tudo de que discordo é #FakeNews '': Correlacionando Polarização Política e Propagação de Desinformação

Página 1

“Tudo que eu discordo é #FakeNews”:


Correlacionando polarização política e disseminação de desinformação
Manoel Horta Ribeiro, Pedro H. Calais, Virgılio AF Almeida, Wagner Meira Jr.
Universidade Federal de Minas Gerais
Belo Horizonte, Minas Gerais, Brasil
{manoelribeiro, pcalais, virgilio, meira} @ dcc.ufmg.br

ABSTRATO 1. INTRODUÇÃO
Um desafio importante no processo de rastreamento e detecção Redes sociais online mudaram os hábitos de consumo de notícias
a disseminação de desinformação é entender a lacuna na de muitos, pois apresentam as notícias em uma estrutura que difere dramaticamente
as visões políticas entre as pessoas que se engajam com os chamados icamente a partir de tecnologias de mídia anteriores [ 26 ]. Conteúdo online pode
”Notícias falsas”. Um possível fator responsável por esta lacuna é a opinião ser espalhado com pouca ou nenhuma filtragem, e fontes com insignificante ou
polarização, que pode levar o público em geral a classificar reputação desconhecida pode atingir tantos leitores quanto eu já estabelecido-
tenda que discordam ou que querem desacreditar como falsa. Neste trabalho, nós saídas de dia [ 1]. Os lucros derivam principalmente de cliques que afetam o
estudar a relação entre polarização política e conteúdo leitor ao site da mídia, o que aumenta a “tabloidização”
relatado por usuários do Twi er como relacionado a “notícias falsas”. Nós investigamos das manchetes [ 7]. e informações às quais os usuários são expostos
como a polarização pode criar narrativas distintas sobre o que desinfor- é selecionado através de algoritmos de recomendação [25 ], que podem
mação realmente é. Realizamos nosso estudo com base em dois conjuntos de dados criar ”bolhas de filtro”, separando os usuários das informações (e notícias)
coletado de Twi er. O primeiro conjunto de dados contém tweets sobre os EUA que discorda de seus pontos de vista [ 29] .
política em geral, a partir da qual calculamos a inclinação política Nesse contexto, dois fenômenos têm sido cada vez mais recebidos
de cada usuário para o Partido Republicano e Democrático. No ção devido ao seu impacto potencial em importantes projetos sociais
segundo conjunto de dados, coletamos tweets e URLs que ocorreram com cesses [1 , 3]: a rápida propagação de um número crescente de insubstanti-
Palavras-chave e hashtags relacionadas a "notícias falsas", como #FakeNews informações falsas ou falsas online [12 ], recentemente nomeadas como "notícias falsas",
e #AlternativeFact, bem como reações a tais tweets e e o aumento da polarização de opinião [ 1, 15]. Estudos anteriores
URLs. Em seguida, analisamos a relação entre polarização e sugerem uma interação dupla entre os dois. e polarizado ”eco
o que é percebido como desinformação e se os usuários estão des- as comunidades da câmara são mais suscetíveis à disseminação de
ignorar informações que discordam como falsas. Nossos resultados mostram desinformação [ 12] . Por outro lado, a desinformação desempenha um papel fundamental
um aumento na polarização de usuários e URLs (em termos de seus na criação de grupos polarizados [ 43]. Outra forma de esses fenômenos
pontos de vista políticos associados) para informações marcadas com pode interagir é quando os usuários classificam incorretamente as notícias como fontes de
palavras-chave e hashtags de notícias, quando comparadas a informações que não desinformação simplesmente devido a desacordo, não porque relata
rotulado como "notícias falsas". Discutimos o impacto de nossas descobertas sobre fatos reais, falsos ou imprecisos [23 ]. Este comportamento cria alternativas
os desafios de rastrear "notícias falsas" no banco em curso contra narrativas do que é realmente falso, o que depende da política de alguém
desinformação. ideologia, e que, em última análise, estabelece a linha entre tendenciosa e
informações falsas mais borradas.
CONCEITOS CCS Neste artigo, realizamos uma análise inicial sobre os relacionamentos
• Computação centrada no ser humano → Análise de redes sociais; Em- e as interações entre o debate polarizado e a disseminação de
informações sobre conjuntos de dados coletados do Twi er1. Nós examinamos o
estudos piratas em computação colaborativa e social;
seguintes questões de pesquisa:

PALAVRAS-CHAVE Q1: Como a polarização está quantitativamente relacionada com

arXiv: 1706.05924v2 [cs.SI] 17 de julho de 2017


notícias falsas, polarização de opinião, bolhas de filtro, desinformação

Formato de referência ACM:


informações percebidas como ou relacionadas a notícias falsas?
P2: Os usuários estão designando conteúdo do qual discordam?
Manoel Horta Ribeiro, Pedro H. Calais, Virgılio AF Almeida, Wagner Meira com desinformação?
Jr .. 2017. “Tudo que eu discordo é #FakeNews”: Analisamos um conjunto de dados composto de tweets sobre conteúdo associado a
Correlating Political Polarization and Spread of Misinformation. Em pro- “Notícias falsas” e tuítes gerais sobre a política dos EUA. Nossa metodologia-
ceedings of DATA SCIENCE + JOURNALISM @ KDD 2017, Halifax, Canadá, ogy emprega um método de detecção de comunidade projetado para estimar
Agosto de 2017 (DS + J'17), 8 páginas. o grau de polarização de cada usuário 2 inclinando-se para o Demo-
DOI: 10.475 / 123 4
partidos cráticos ou republicanos, conforme ilustrado na Figura 1 . Com base nestes
Permissão para fazer cópias digitais ou impressas de parte ou de todo este trabalho para uso pessoal ou
estimativas, correlacionamos os níveis de polarização do usuário às suas interações
o uso da sala de aula é concedido sem taxa, desde que as cópias não sejam feitas ou distribuídas
para lucro ou vantagem comercial e que as cópias contenham este aviso e a citação completa com # tweets relacionados a # FakeNews e URLs externos. Nós analisamos
na primeira página. Os direitos autorais dos componentes de terceiros deste trabalho devem ser respeitados.
1h ps: // twi er.com/
Para todos os outros usos, entre em contato com o proprietário / autor (es).
2 Empregamos o termo polarização tanto para os fenômenos coletivos de oposição de
DS + J'17, Halifax, Canadá
opiniões e designar quanto um usuário individual ou URL se inclina para um conjunto de
© 2017 Copyright pertence ao proprietário / autor (es). 123-4567-24-567 / 08/06. . . $ 15,00
pontos de vista ou uma ideologia.
DOI: 10.475 / 123 4

https://translate.googleusercontent.com/translate_f 1/7
19/07/2021 `` Tudo de que discordo é #FakeNews '': Correlacionando Polarização Política e Propagação de Desinformação

Página 2

DS + J'17, agosto de 2017, Halifax, Canadá Manoel Horta Ribeiro. et al.

processos como eleições políticas e políticas públicas [2 ]. De perto


ligadas a "notícias falsas" estão as chamadas "narrativas alternativas", como
teorias da conspiração [33 ]. Há um esforço contínuo na pesquisa
comunidade para compreender a propagação e propagação de tais tipos
de conteúdo. Algumas das abordagens tomadas são para propor rede
modelos de difusão [ 37, 40] e análise de características estruturais da rede
da propagação de desinformação nas redes sociais online [ 20,
22] .
Alguns esforços também foram feitos para detectar informações incorretas, incluindo
estratégias de ing que aplicam métodos baseados em texto [ 10] , checagem de fatos
por meio de gráficos de conhecimento [8 ], soluções de crowdsourcing [32] e
inclusive verificando a autenticidade das imagens veiculadas online [30 ]. antes
também são iniciativas recentes na detecção da disseminação de informações incorretas
ção usando regularidades em seus padrões de propagação por meio de
redes, com sucesso limitado até agora [ 11] . Além disso, previ-
nossos estudos também um vazio para conter a disseminação de desinformação,
encontrar maneiras quase ideais de disseminar informações que podem
reverter o dano causado por um boato [5] ou mesmo estratégias para esclarecer
desinformação de uma perspectiva fisicológica [ 23] .
Figura 1: Rede de retuítes mostrando democratas (em azul) Outra linha de pesquisa envolve a existência de políticas
e republicanos (em vermelho) divididos em duas comunidades distintas bots que espalham desinformação. Existem vários estudos sobre o
nidades. Qual é o impacto de tal polarização no que é impacto de tais bots em países específicos [ 14, 17], bem como em mais
percebidas como “notícias falsas”? estudos gerais sobre suas estratégias e particularidades [42 ] e sobre
métodos para detectá-los [13 ]. A existência de tais bots pode
como a polarização de tais tweets e URLs está relacionada aos seus têm papel estratégico no debate político, influenciando, por exemplo,
popularidade e com a frequência com que estão associados ao tema as hashtags populares no Twi er [17 ] e são uma ameaça à saúde
de desinformação por parte dos usuários. Também analisamos a diferença de polarização e discurso político produtivo. isso faz o entendimento
relações entre usuários que apenas discutem política e aqueles que e o combate da rede de bots é um desafio importante para o
se envolver com tweets e URLs relacionados a notícias falsas. comunidade científica [ 34] .
Nosso processo de análise de dados mostra três conclusões principais: e associação entre polarização de opinião e "notícias falsas"
as acusações foram sugeridas na mídia como fortes; pessoas
(1) Há um aumento na polarização dos URLs e usuários
associado a palavras-chave e hash tags relacionadas a notícias falsas; iria apenas rotular como "falsas" quaisquer informações ou fontes que não
suporte [ 4, 28]. Do ponto de vista sociológico, polarização
(2) Grupos polarizados citam fontes em seu lado das especificações políticas
trum para marcar ou condenar notícias e declarações dadas pelo pode ser formalmente entendido como um estado que "se refere à extensão
outro grupo oposto como falso; às quais as opiniões sobre uma questão se opõem em relação a alguns
(3) Os usuários polarizados empregam termos como "notícias falsas" para se referir máximo teórico ”, e, como processo, é o aumento de tal
para conteúdo com o qual eles discordam particularmente. oposição ao longo do tempo, fazendo com que um grupo social se dividisse em
dois subgrupos com pontos de vista conflitantes e antagônicos re-
Discutimos o impacto dessas descobertas no balanço em andamento contra
a respeito de um tópico [18 , 31, 35]. Compreendendo a polarização online
a disseminação de desinformação online. Sugerimos, por ex-
discussões e as estruturas sociais induzidas pelo debate polarizado
amplo, que se aproxima com base em crowd-source [32 ] para detectar falsos
é importante porque a polarização de opiniões induz a segregação
as notícias podem se tornar tendenciosas para ideologias políticas, uma vez que o
na sociedade, fazendo com que pessoas com pontos de vista diferentes se tornem
narrativas sobre o que é falso parecem ser bastante diferentes entre os grupos
isolados em ilhas onde todos pensam como eles. Tal ”filtro
com ideologias diferentes.
bolhas ”causadas por sistemas de mídia social limitam a exposição dos usuários
O restante deste artigo está organizado da seguinte forma. Seção 2
para conteúdo ideologicamente diverso, e é uma preocupação crescente [ 15, 21].
analisa trabalhos anteriores sobre a disseminação de desinformação online
Algoritmos de recomendação em contextos de mídia social podem aumentar
e na polarização de opinião. Seção 3 descreve a metodologia
a escala de polarização ainda mais, pois eles podem se separar automaticamente
por trás dos processos de coleta e análise de dados. Seção 4
arar usuários de pontos de vista alternativos sobre questões polarizadas, não
apresenta e discute os resultados de nossa análise. Finalmente, Seção 5
mostrando aqueles em seus feeds [ 29] .
conclui o artigo e delineia direções de pesquisas futuras.
Este trabalho é o primeiro vazio para testar a hipótese de que "falso
notícias ”narrativas são correlacionadas à polarização política. É diferente
2. TRABALHO RELACIONADO de grande parte do trabalho pré-existente, pois considera a possibilidade de
A disseminação de desinformação online3 e as "notícias falsas" tornaram-se
indivíduos marcando como conteúdo de informação incorreta do qual discordam
um tópico cada vez mais importante por seu possível impacto na sociedade com. Se significativo, isso adiciona outra camada de complexidade ao
3 Algumas fontes distinguem desinformação e desinformação com base na intenção, nós problema, pois precisamos distinguir as "notícias falsas" percebidas daquilo que é
usar desinformação para ambos. na verdade, desinformação.

Página 3

https://translate.googleusercontent.com/translate_f 2/7
19/07/2021 `` Tudo de que discordo é #FakeNews '': Correlacionando Polarização Política e Propagação de Desinformação
“Tudo que eu discordo é #FakeNews”:
Correlacionando polarização política e disseminação de desinformação DS + J'17, agosto de 2017, Halifax, Canadá

Figura 2: Metodologia para coletar os URLs identificados como notícias falsas, tweets gerais que tweetaram este URL e tweets gerais sobre
política e, em seguida, construir um conjunto de dados que englobe as reações polarizadas dos usuários a um URL. Também exemplificamos como o
o cálculo da polarização da URL é realizado no lado direito, conforme discutido posteriormente na Seção 3.3

3. METODOLOGIA minutos, usamos a API de pesquisa do Twiper para extrair


Nesta seção, descrevemos a metodologia usada para coletar os dados tweets que incluem os URLs mais relevantes armazenados e
e os métodos mais importantes usados ​no processo de análise de dados. metadados sobre os usuários que tweetaram sobre eles. é deixar
nós capturamos o contexto em torno dos URLs de uma forma mais ampla
cenário, sem associação necessária à desinformação-
3.1 Coleta de Dados
palavras-chave ou hashtags relacionadas. Nós exemplificamos isso com dois
Nossa estratégia de coleta de dados é mostrada na Figura 2. Estudamos dois
tweets que mencionam o mesmo URL com contextos diferentes:
conjuntos de dados em conjunto, ambos obtidos da Twi er. primeiro conjunto de dados
foi construído para monitorar narrativas e discussões em torno de falsos Contexto de notícias falsas: Huffing ComPost é um
notícias. Para isso, realizamos duas coletas de dados simultâneas Piada. Ninguém acredita em seus #fakepolls
esforços, usando o Stream4 e as APIs de pesquisa5. API e Stream ou #fakenews. #MAGA {URL}
permite que você reúna grandes quantidades de dados que estão sendo tweetados Contexto de notícias falsas indiretas : canadense
enquanto a API de pesquisa permite que você pesquise tweets que mencionam visualizações dos EUA atingiram o menor nível histórico, pesquisa
palavras-chave específicas (entre inúmeros outros parâmetros). programas, {URL}
O objetivo deste processo de coleta de duas etapas é construir uma
(1) Na primeira etapa, coletamos o fluxo de tweets que contêm
visão completa do debate de notícias falsas no Twi er: podemos ver
usando as seguintes palavras-chave e hashtags de Twi er
ambos os usuários que estão se referindo a um conteúdo (ou seja, um URL ou outro
API Stream:
tweet) como uma fonte potencial de notícias falsas e usuários que estão citando,
{fakenews, #fakenews, fake-news, # fake-news,
propagando ou interagindo com o mesmo conteúdo sem doer
posttruth, #posttruth, post-truth,
para ele, o rótulo de notícias falsas.
# post-truth, alternativefact,
O segundo conjunto de dados que usamos foi obtido coletando tweets
#alternativefact, alternative-fact,
sobre a política dos EUA em geral da Twi er Stream API. Nós usamos
# factual-alternativo}
palavras-chave e hashtags, como {Hillary Clinton, #potus,
Em seguida, procedemos ao armazenamento dos URLs mencionados, sejam
é um URL externo ou um URL para outro tweet. Para ex- Donald Trump, Casa Branca, Democratas, Republicanos ...}.
A utilidade deste conjunto de dados neste trabalho é oferecer dados suficientes
amplo:
para calcular com precisão o grau de polarização dos usuários do
URL externo : Trump Schools CNN Reporter
Conjunto de dados FN com relação às suas inclinações para os republicanos e
em 1990 - então deixa cair o microfone - literalmente
Democratas. Isso é explicado em detalhes na Seção 3.2.
{URL} #fakenews
Algumas observações sobre a metodologia são:
Outro tweet : RT @ {Usuário}: Este é um
(1) Retweets e tweets de citações são considerados URLs para
abuso de seu escritório. {Tweet}
(2) Na segunda etapa, os URLs armazenados são padronizados e outro tweet;
consumido por outro processo de coleta de dados. A cada 15 (2) a escolha de 15 minutos como um tempo padrão foi imposto por
limitações da API de pesquisa do Twier;
4h ps: //dev.twi er.com/streaming/overview
5h ps: //dev.twi er.com/rest/public/search

Página 4

DS + J'17, agosto de 2017, Halifax, Canadá Manoel Horta Ribeiro. et al.

(3) As etapas 1 e 2 de coleta de dados foram realizadas a partir de 07 de maio Em nosso estudo de caso específico, existem apenas duas comunidades, portanto
2017 a 25 de maio de 2017, enquanto a coleta da etapa 3 foi podemos definir a polarização de um usuário u com uma polaridade atribuída
feito de agosto de 2016 a maio de 2017. valor de ização u ∈ [0,5, 1,0] ∪ [−1,0, −0,5] como uma variável aleatória
Usando essas fontes de dados, podemos analisar URLs que P u : [-1, 1] ↦ → [0, 1] de modo que:
ocorreu com tags #fakenews (obtidas na etapa 1), o associado
reações a este URL na forma de tweets (obtidos na etapa 2), e {2 (- u + 0,5) se u ∈ D

https://translate.googleusercontent.com/translate_f 3/7
19/07/2021 `` Tudo de que discordo é #FakeNews '': Correlacionando Polarização Política e Propagação de Desinformação
a polarização de alguns dos usuários que tweetaram (obtida em Pu= 2 ( u - 0,5) se u ∈ R (1)
etapa 3). Isso é representado no lado direito da Figura 2. Onde R e D são os grupos polarizados de republicanos e democratas.
Quando capturamos qualquer URL contido em um tweet, estamos capturando Observe que estamos simplesmente mudando o domínio do valor como-
muitos tipos diferentes de interações não triviais. Por exemplo, tem assinado pelo algoritmo de polarização para um mais intuitivo ([-1, 1]).
foi mostrado que retuítes podem expressar discordância [16 ]. ese Podemos ainda definir a polarização absoluta do usuário como um fator aleatório
sutilezas têm pouco impacto em nossa análise, pois estamos interessados variável A u : [0, 1] ↦ → [0, 1] de modo que:
não no tipo de reação que um usuário tem, mas se os usuários de
grupos polarizados de forma diferente reagem aos mesmos URLs. Au=|Pu| (2)

3.2 Estimando a polarização política do usuário 3.3 Estimando a polarização política do URL
A principal unidade de informação que queremos correlacionar com notícias falsas- Outro aspecto dos dados que precisa ser modelado é o
tweets relacionados é o grau de polarização dos usuários Twi er para cada ização de um URL, ou em outras palavras, como ele reverbera através
lado principal na política dos EUA - republicanos e democratas. Notar que usuários em comunidades polarizadas opostas. Nós de nimos o grau
como afirmado anteriormente, sobrecarregamos a palavra polarização para denotar de polarização de um URL com base na polarização de usuários que
o quanto um indivíduo se inclina para um conjunto de pontos de vista ou uma ideologia. reagiu a isso. Para simplificar, consideramos como URLs qualquer
Há uma infinidade de métodos projetados para classificar os políticos links externos ao Twi er ou links para outros tweets, e as reações são
inclinação de usuários de mídia social, que normalmente se agrupam tweets normais, citações, respostas e retuítes que interagem com o
em comunidades bem separadas [9 , 41]. Embora nossa metodologia URL
não depende do algoritmo de agrupamento de grafos específico, encontrando Definimos a polarização de um URLk, dados dois grupos polarizados
comunidades em tópicos polarizados é facilitado pelo fato de que geralmente é dos usuários R e D, como uma variável aleatória P k : [0, 1] n ↦ → [0, 1] que é
sementes simples de encontrar - usuários que anteriormente eram conhecidos por pertencerem a umda polarização dos usuários P u que reagiram a ela:
a média
comunidade específica. No caso dos conjuntos de dados Twi er que levamos em
consideração, o per l o cial de políticos e partidos políticos n
1
são sementes naturais que podem ser alimentadas a um agrupamento semissupervisionado Pk= Pu (3)
n
algoritmo que expande as sementes para as comunidades formadas ao redor u ∈U (k)

eles [6 , 19, 24]. Esse cálculo é representado no lado direito da Figura 2.


Assumimos que o número de comunidades K formadas em torno de um De maneira semelhante à que fizemos para a polarização dos usuários, podemos
o tópico T é conhecido de antemão e é um parâmetro do nosso método. defina ainda a polarização de URL absoluta como uma variável aleatória
Para estimar as tendências do usuário em relação a cada um dos grupos K (K = 2 para A k : [0, 1] n ↦ → [0, 1]:
Democratas, republicanos), empregamos uma estratégia semelhante à propagação de rótulos
egy baseado em passeio aleatório com reinícios [38 ]: um caminhante aleatório Ak=|Pk| (4)
parte de cada semente e viaja no retuíte da mensagem do usuário
grafo bipartido escolhendo aleatoriamente uma aresta para decidir qual nó 3.4 Domínios e URLs impactantes
deve ser a próxima. Com uma probabilidade (1 - α) = 0,85, o aleatório Uma parte importante de nossa análise é tentar encontrar evidências de que
walker reinicia o processo de caminhada aleatória de sua semente original. os usuários estão empregando termos relacionados a “notícias falsas” para expressar discordância
Como consequência, o caminhante aleatório tende a passar mais tempo ment, ao invés de uma falta mais factual de vericidade no conteúdo, eles
dentro do cluster a sua semente pertence [ 6]. Cada nó é então atribuído tweet sobre. Para fazer isso, analisamos os domínios de URL mencionados por
à sua semente mais próxima (ou seja, comunidade), conforme mostrado nas cores dos nós cada
em lado polarizado em tweets associados à desinformação. Nós
a amostra do gráfico exibido na Figura 1. também analisa qualitativamente o conteúdo de alguns dos URLs que
e a proximidade relativa de cada nó para os dois conjuntos de sementes produzem gerou as reações mais significativas.
uma probabilidade de que este nó pertence a cada uma das duas comunidades, Para gerar os domínios, analisamos os URLs externos mencionados
e pode ser interpretado como uma estimativa de sua inclinação política. nos tweets. Em seguida, calculamos a polarização política de cada
Por exemplo, se a proximidade do nó X às sementes republicanas for 0,01 e domínio exatamente como fazemos para URLs completos. As nuvens de palavras são gener-
sua proximidade com as sementes democratas é de 0,04, o passeio aleatório baseado para todos os URLs externos com polarização absoluta A k maior
resultados do algoritmo de detecção da comunidade a que esse nó pertence de 0,5, um para cada respectivo grupo polarizado. Para a análise
a comunidade democrata com 80% de probabilidade. Observe que este do conteúdo dos principais URLs reagidos, selecionamos aleatoriamente 75 de
a natureza da modelagem captura que alguns nós podem ser mais neutros os 150 principais URLs (tweets e externos). Destes, temos igualmente
do que outros. Para mais detalhes sobre a comunidade baseada em caminhadas aleatórias estrato de tamanho em que A k pertence aos intervalos [0, 0,32], [0,33, 0,66]
algoritmo de detecção, consulte [ 6] . ou [0,67, 1]. Em seguida, analisamos o conteúdo dos URLs para obter informações sobre
maneiras diferentes de emergir a temática das notícias falsas.

Página 5

“Tudo que eu discordo é #FakeNews”:


Correlacionando polarização política e disseminação de desinformação DS + J'17, agosto de 2017, Halifax, Canadá
Estatísticas Gerais Usuários compartilhados Usuários ativos compartilhados
Fonte #Comercial # usuários ativos #tweets #urls Política Relacionada a FN Relacionada a FN Relacionada a FN
Relacionado a FN 374.191 101.031 833.962 109.397 - 29,22% - 37, 61%
Política 4.164.604 247.435 246.103.385 - 2,62% - 15,72% -

Tabela 1: Caracterização geral das fontes de dados. A intersecção entre o conjunto de dados de Política e os Relacionados a FN é importante
tão importante quanto o usamos para caracterizar a polarização dos usuários e, conseqüentemente, dos URLs nos conjuntos de dados relacionados ao FN .

Usuários = todos Usuários = inativos Usuários = ativos


0,89
0,88
0,87
0,86
0,85

https://translate.googleusercontent.com/translate_f 4/7
19/07/2021 `` Tudo de que discordo é #FakeNews '': Correlacionando Polarização Política e Propagação de Desinformação
Abdômen.
0,84 Valores
0,83
0,82
Relacionado a FN Política Relacionado a FN Política Relacionado a FN Política
Fonte Fonte Fonte

Figura 3: Polarização absoluta média do usuário para os usuários no conjunto de dados Relacionado a FN e Política . As barras de erro são os
Intervalos de confiança de 95% calculados usando bootstrap. O aumento na polarização no conjunto de dados FN-Related sugere que
o tema da desinformação aumenta a polarização em um tópico já polarizado (política).

4 RESULTADOS A Figura 4 mostra que, no conjunto de dados coletados, o aumento no


Começamos caracterizando os dois conjuntos de dados em termos de tweets, número de reações tem um impacto negativo na média polar
URLs e usuários, conforme ilustrado na Tabela 1 . Lembre-se de que a análise ização de um URL. Uma melhor interpretação desses resultados seria
sobre URLs são todos realizados usando os tweets do conjunto de dados requerem um mapeamento das interações dos usuários. A Figura 5 mostra
chamamos FN-Related e a polarização dos usuários do conjunto de dados um aumento da polarização quando os URLs são constantemente associados
chamada Política. atado com palavras-chave relacionadas a ”notícias falsas”. Isso contribui para o
hipótese de que a temática “falso novo” é polarizadora.
Os tamanhos dos conjuntos de dados diferem significativamente, mas a interseção entre
eles nos concede um número significativo de usuários para realizar o anal-
ysis com (29,22% dos 374.191 usuários no conjunto de dados FN-Related). 4.2 Polarização e Domínios de URL
Se definirmos os usuários ativos na Política como o menor conjunto Geramos nuvens de palavras conforme descrito na Seção 3 .4, e o
dos usuários responsáveis ​por 80% dos tweets coletados, temos que resultados podem ser vistos na Figura 6 (a) para usuários com tendência democrata e
a interseção com os usuários do conjunto de dados FN-Related cresce na Figura 6 (b) para usuários com tendência republicana. Analisando o típico
significativamente, aumentando para 15,72% dos 2,62% originais. níveis de confiança em relação a diferentes fontes de mídia reunidos pelo Pew
Centro de Pesquisa [ 27] , podemos ver que a nuvem de palavras com tendência democrática
4.1 Polarização e Tweets contém domínios para fontes de notícias como e Washington Post
Começamos analisando a diferença na polarização dos usuários em e e o New York Times, que supostamente tem a confiança dos liberais
o conjunto de dados Política e o conjunto de dados FN-Related. Observe que todos e desconfiado pelos conservadores. Da mesma forma, a tendência republicana
os usuários que conhecemos a polarização do segundo também estão em wordcloud contém domínios para fontes de notícias como Breitbart e
o primeiro. A Figura 3 mostra a polarização média em tais conjuntos de dados Fox News, da confiança dos conservadores e da desconfiança dos liberais.
olhando para todos os usuários, mas considerando usuários ativos ou inativos. e Isso implica que o grupo polarizado não menciona diretamente alguns
aumento significativo na polarização dos usuários associados relatório ou notícia como falsa, mas reage a links de fontes que eles
com URLs que co-ocorreram com termos relacionados a "notícias falsas" é um concordo com o tema “notícias falsas”. Também indica que as fontes
indicação de que o tema "notícias falsas" aumenta a polarização em que os usuários de uma certa ideologia política confiam têm um significado significativo
a discussão já polarizada da política. pacto sobre sua visão do que é falso, já que os estão citando como fonte
Outra perspectiva que pode ser vista é como a polarização em vez da informação que eles acreditam ser desinformação.
ção de URLs muda de acordo com as características das reações
associado a ele. Analisamos dois aspectos, a saber: qual é o impacto 4.3 Analisando os principais URLs reagidos
do número de reações em torno de um URL para sua polarização, Analisando os tweets que receberam mais reações e que
e qual é o impacto da porcentagem de reações usando a chave co-ocorrido com palavras-chave relacionadas a "notícias falsas" nos permite ser mais
palavras e hashtags relacionadas a notícias falsas para a polarização do entender como eles estão sendo usados. Realizamos nosso qualitativo
URL Ordenando os URLs de acordo com essas métricas, traçamos o análise dando e discutindo exemplos do estrato diferente
polarização média de cada um de seus quartis nas Figuras 4 e 5, nós de nimos e inspecionamos.
respectivamente. Analisamos outros tweets e URLs externos separadamente.

Página 6

DS + J'17, agosto de 2017, Halifax, Canadá Manoel Horta Ribeiro. et al.

É Tweet = Falso É Tweet = Verdadeiro É Tweet = Falso É Tweet = Verdadeiro


0,90 0,90
0,85 0,85
0,80 0,80
0,75 0,75
0,70 0,70
Abdômen.
0,65 Polarização Abdômen.
0,65 Polarização

0,60 0,60
T1 Q2 3º T Q4 T1 Q2 3º T Q4 T1 Q2 3º T Q4 T1 Q2 3º T Q4
Número de reações Número de reações Associação com desinformação Associação com desinformação
(Quartis) (Quartis) Palavras-chave (quartis) Palavras-chave (quartis)

Figura 4: Polarização média por número de reações a Figura 5: Polarização média por proporção de tweets com
um URL (quartis). Barras de erro representam 95% de confiança em o URL que contém as palavras-chave relacionadas à desinformação
terval. (quartis).

https://translate.googleusercontent.com/translate_f 5/7
19/07/2021 `` Tudo de que discordo é #FakeNews '': Correlacionando Polarização Política e Propagação de Desinformação

(a) Usuários com tendência democrata. (b) usuários com tendência republicana.

Figura 6: Nuvens de domínio de tuítes relacionados a # FakeNews. Observe a presença de sites com a mesma ideologia dos usuários em
os grupos polarizados. Isso indica que os usuários estão reagindo a fontes com as quais concordam em narrativas relacionadas a notícias falsas.

Entre os URLs selecionados aleatoriamente, por exemplo, o principal reagiu Por fim, também podemos encontrar instâncias de usuários realmente marcando
URL externo no estrato altamente polarizado A k ∈ [0,67, 1] é um fatos ou histórias como falsos. Um exemplo de tal caso é um altamente polarizado
notícia sobre Michael Flynn sendo considerado inocente pelo FBI Notícia de tendência democrática A k ∈ [0,67, 1] apontando a repreensão
de seu relacionamento com o russo [ 36] : de uma história supostamente de "notícias falsas" sobre o assassinato da equipe do DNC:

New York Post: FBI liberta Michael Flynn na investigação Raw Story: Família explode mídia de direita por
ligando-o à Rússia espalhando notícias falsas sobre a chefia assassinada do DNC
É importante notar que o envolvimento de Flynn com Donald enquanto o escândalo da Rússia se aprofunda
A campanha de Trump torna esta informação mais favorável Não encontramos exemplos de URLs externos de uma fonte conhecida por
para usuários com tendência republicana. Con rmando o resultado obtido com ter a confiança de um grupo ideológico polarizado pelo oposto
a análise das nuvens de palavras na Seção 4.2, no entanto, o resultado político em nossa amostragem estratificada. No entanto, existem casos
é polarizado para indivíduos que apóiam o Partido Republicano. de tweets onde isso acontece. Por exemplo, o seguinte tweet
Isso sugere que os usuários estão descartando principalmente uma narrativa de outro por Donald J. Trump [39 ] 6 é polarizado em direção à tendência democrática
fontes da mídia que sugeriram a ligação de Flynn com a Rússia. e Comercial:
termos associados a "notícias falsas", portanto, não estão sendo empregados e conluio Rússia-Trump
@realdonaldtrump:
para denotar que um conteúdo em si é falso, mas denotar outras peças de história é uma farsa total, quando este contribuinte financiado
informações como falsas. fim da charada?
Outro uso do termo que podemos encontrar analisando o mais re- Neste caso, os usuários com tendência democrática podem ter sugerido que o que
URLs agidos referem-se a notícias que podem ser vistas como ridículas. Um de
Donald Trump está dizendo que é falso. Estudos anteriores também mostraram
os URLs mais reagidos no estrato menos polarizado A k ∈ [0, 0,32], que retuítes de personalidades conhecidas muitas vezes denotam antag-
é sobre um prisioneiro que foi esvaziado para escapar da prisão vestido de mulher
onismo [ 16] .
em Honduras [ 4] :
Embora esta análise não seja significativa para compreender o
Telégrafo: Prisioneira vestida de mulher fracassada evasão desses diferentes usos de termos relacionados a "notícias falsas",
lance de fuga fornece uma visão sobre a infinidade de cenários que co-ocorrem com
é o uso, embora não necessariamente prejudicial para a de- palavras-chave e hashtags relacionadas à desinformação.
bate, pode representar um desafio para as técnicas automatizadas para detectar 6 Nós aqui apenas discutimos a polarização em torno de um tweet de uma pessoa pública, não
desinformação, se eles empregam quais usuários em uma rede como infringir os termos de uso do Contrato e Política de Desenvolvedor do Twi er.
Twi er tag tão falso quanto um recurso.

Página 7

“Tudo que eu discordo é #FakeNews”:


Correlacionando polarização política e disseminação de desinformação DS + J'17, agosto de 2017, Halifax, Canadá

5 CONCLUSÃO E TRABALHO FUTURO REFERÊNCIAS


[1] Hunt Allco e Ma hew Gentzkow. 2017. Redes sociais e notícias falsas no
Este trabalho é o primeiro vazio para observar correlações entre políticas
Eleição de 2016. Relatório técnico. Escritório Nacional de Pesquisa Econômica.
polarização ical e a disseminação de desinformação, em particular [2] Hunt Allco e Ma hew Gentzkow. 2017. Redes Sociais e Notícias Falsas no
”Notícias falsas”. Para enfrentar o desafio prático de ter acesso a um Eleições de 2016. Working Paper 23089. National Bureau of Economic Research.
h ps: //doi.org/10.3386/w23089
conjunto pré-classificado de artigos de notícias ou tweets falsos, monitoramos o
[3] Eytan Bakshy, Solomon Messing e Lada A Adamic. 2015. Exposição a ide-
URLs externos e tweets associados a hash relacionado a "notícias falsas" notícias e opiniões diversificadas no Facebook. Science 348, 6239 (2015),
tags e palavras-chave. Procuramos tweets reagindo a esses URLs 1130–1132.
[4] Adam Boult. 2017. Prisioneira vestida de mulher em uma tentativa de fuga fracassada . hp: // www.
e calculou a polarização dos usuários que reagiram a eles telegraph.co.uk/news/2017/05/10/prisoner-dressed-woman-failed-escape-bid/.
usando um conjunto de dados auxiliares mais gerais sobre política. Nós examinamos (2017). Acesso em: 25-05-2017.

a associação entre polarização e notícias falsas, analisando [5] Ceren Budak, Divyakant Agrawal e Amr El Abbadi. 2011. Limitando a propagação
de desinformação nas redes sociais. Em Proceedings of the 20th international
o impacto de vários fatores em URLs e usuários relacionados a "notícias falsas" conferência na World Wide Web. ACM, 665-674.
nós conhecíamos a polarização de. Também analisamos as diferentes fontes [6] Pedro H. Calais, Adriano Veloso, Wagner Meira, Jr e Virgilio Almeida. 2011
Do preconceito à opinião: uma abordagem de aprendizagem por transferência para o sentimento em tempo real
que são mencionados como "falsos" pelos usuários e descritos qualitativamente Análise. Em Proc. da 17ª Conferência ACM SIGKDD sobre descoberta de conhecimento
cenários diferentes onde a terminologia é aplicada. e mineração de dados. San Diego, CA.
Descobrimos que o debate sobre notícias falsas no Twi er é altamente [7] Abhijnan Chakraborty, Bhargavi Paranjape, Sourya Kakarla e Niloy Ganguly.
2016. Stop Clickbait: Detecção e prevenção de clickbaits na mídia de notícias online.
polarizado em termos do grau de preconceito dos usuários que reagem sobre In Advances in Social Networks Analysis and Mining (ASONAM), 2016 IEEE / ACM
URLs relacionados a “notícias falsas” e em termos dos diferentes conjuntos de URL Conferência Internacional em. IEEE, 9–16.
[8] Giovanni Luca Ciampaglia, Prashant Shiralkar, Luis M. Rocha, Johan Bollen,
domínios com os quais democratas e republicanos se engajam. Nós também
Filippo Menczer e Alessandro Flammini. 2015. Checagem de fatos computacionais
descobriram que, em nosso conjunto de dados, a polarização média era maior de Redes de Conhecimento. PLOS ONE 10, 6 (06 2015), 1–13. h ps: //doi.org/10.
quando muitos indivíduos marcavam um URL como falso. essas descobertas 1371 / journal.pone.0128193
[9] Michael Conover, Jacob Ratkiewicz, Ma hew Francisco, Bruno Gonçalves,
sugerem que há um aumento na polarização no contexto de
Alessandro Flammini e Filippo Menczer. 2011. Polarização política em Twi er.
conteúdo relacionado ou percebido como notícia falsa. está traçando Em Proc. 5ª Conferência Internacional AAAI sobre Weblogs e Mídia Social (ICWSM).
de uma relação entre polarização e conteúdo relacionado ao falso [10] Niall J. Conroy, Victoria L. Rubin e Yimin Chen. 2015. Engano Automático
Detecção: Métodos para Encontrar Notícias Falsas. Em Proceedings of the 78th ASIS & T
as notícias abordam nossa primeira questão de pesquisa.
Reunião Anual: Ciência da Informação com Impacto: Pesquisa na e para a Comunidade
e análise das nuvens de palavras do democrata e republicano nity (ASIST '15). American Society for Information Science, Silver Springs, MD,
usuários de aprendizagem, bem como o exame qualitativo dos contextos EUA, Artigo 82, 4 páginas. hp: //dl.acm.org/citation.cfm? id = 2857070.2857152
[11] Mauro Conti, Daniele Lain, Riccardo Lazzere i, Giulio Loviso o e Walter
onde palavras-chave relacionadas a informações incorretas e hashtags são empregadas um rociocchi. 2017. É sempre o dia da mentira! Na Di culdade de So-
sugerem que há um uso signi cativo da chave relacionada a "notícias falsas" Classificação de desinformação de rede cial por meio de recursos de propagação. CoRR
abs / 1701.04221 (2017). hp: //arxiv.org/abs/1701.04221
palavras para expressar desacordo. Essas descobertas abordam nosso segundo [12] Michela Del Vicario, Alessandro Bessi, Fabiana Zollo, Fabio Petroni, Antonio
questão de pesquisa. No entanto, a medida em que isso acontece Scala, Guido Caldarelli, H. Eugene Stanley e Walter a rociocchi. 2016. e

https://translate.googleusercontent.com/translate_f 6/7
19/07/2021 `` Tudo de que discordo é #FakeNews '': Correlacionando Polarização Política e Propagação de Desinformação
precisa ser avaliada quantitativamente, pois nossas análises não permitem o disseminação de desinformação online. Proceedings of the National Academy of
Sciences 113, 3 (2016), 554–559.
medição do impacto de tal uso. [13] Emilio Ferrara, Onur Varol, Clayton Davis, Filippo Menczer e Alessandro
O impacto da polarização no combate aos presentes de notícias falsas Flammini. 2014. e ascensão dos bots sociais. pré-impressão arXiv arXiv: 1407.5225 (2014).
[14] Michelle C Forelle, Philip N Howard, Andrés Monroy-Hernández e Saiph
novos desafios e oportunidades. Por um lado, se um signi cativo
Selvagem. 2015. Os bots políticos e a manipulação da opinião pública na Venezuela.
quantidade de mensagens relacionadas ao conteúdo de notícias falsas (2015).
desacordo, temos que métodos de aprendizado de máquina que usam [15] Kiran Garimella, Gianmarco De Francisci Morales, Aristides Gionis e Michael
Mathioudakis. 2017. Equilibrando pontos de vista opostos para reduzir a controvérsia, em
o que os usuários indicam como falso como um recurso pode se tornar tendencioso para
Anais da Décima ACM International Conf. na pesquisa na web e dados
um lado do espectro de polarização. Por outro lado, podemos Mineração. WSDM.
usar técnicas de detecção de comunidade para adicionar polarização como um recurso [16] Pedro Calais Guerra, Roberto CSNP Souza, Renato M Assunç˜ao e Wagner
Meira Jr. 2017. Antagonismo também flui por retuítes: e impacto de out-of-
que distingue falsos e tendenciosos, ou até mesmo usuários que não são Otes contextuais em análise de polarização de opinião. pré-impressão arXiv arXiv: 1703.03895
não extremamente polarizado, o que teria um perfil mais confiável (2017).
julgamento do que é desinformação. [17] Philip N Howard e Bence Kollanyi. 2016. Bots, # StrongerIn e # Brexit:
propaganda computacional durante o Referendo Reino Unido-UE. Baixar navegador
Como trabalho futuro, queremos explorar métodos para identificar diferentes é papel (2016).
narrativas em torno de histórias que emergem em comunidades polarizadas distintas [18] DJ Isenberg. 1986. Polarização de grupo: Uma revisão crítica e meta-análise.

nidades. Isso poderia alinhar potenciais "notícias falsas" ou extremamente polarizadas Journal of Personality and Social Psychology 50, 6 (1986), 1141-1151. h ps:
//doi.org/10.1037/0022-3514.50.6.1141
artigos com outros que os refutam ou rejeitam, fornecendo um mecanismo [19] Isabel M. Kloumann e Jon M. Kleinberg. 2014. Associação da comunidade
anismo para regular a propagação e desinformação da polarização Identificação de Pequenos Conjuntos de Sementes. Em Proceedings of the 20th ACM SIGKDD
Conferência Internacional sobre Descoberta de Conhecimento e Mineração de Dados (KDD '14).
causa na sociedade [12 , 43]. Outra direção interessante seria ACM, New York, NY, USA, 1366–1375.
seja para explorar ainda mais a associação de notícias falsas e polarização, [20] Sejeong Kwon, Meeyoung Cha, Kyomin Jung, Wei Chen e Yajun Wang. 2013
Características proeminentes de propagação de rumores nas redes sociais online. Em mineração de dados
encontrar declarações que são comprovadas como falsas por verificadores de fatos e mod-
(ICDM), 2013 IEEE 13ª Conferência Internacional sobre. IEEE, 1103-1108.
elimina as interações complexas (como citações e respostas) entre [21] David Lazer. 2015. e ascensão do algoritmo social. Science 348 (2015), 1090–1091.
usuários em redes sociais como Twi er. [22] Kristina Lerman e Rumi Ghosh. 2010. Contágio de informação: um empírico
estudo da divulgação de notícias nas redes sociais Digg e Twi er. ICWSM 10
(2010), 90–97.
RECONHECIMENTOS [23] Stephan Lewandowsky, Ullrich KH Ecker, Colleen M Seifert, Norbert Schwarz,
e John Cook. 2012. A desinformação e sua correção continuaram in uência
Este trabalho é parcialmente financiado pelo CNPq, CAPES, FAPEMIG, In-
e debiasing bem-sucedido. Psychological Science in the Public Interest 13, 3 (2012),
Web, MASWEB e INCT-Cyber. 106–131.

Página 8

DS + J'17, agosto de 2017, Halifax, Canadá Manoel Horta Ribeiro. et al.

[24] Q. Liao, Fu Wai-Tat e Markus Strohmaier. 2016. #Snowden: Compreensão [34] VS Subrahmanian, Amos Azaria, Skylar Durst, Vadim Kagan, Aram Galstyan,
Viés introduzido por diferenças comportamentais de grupos de opinião nas mídias sociais. Kristina Lerman, Linhong Zhu, Emilio Ferrara, Alessandro Flammini e Filippo
Em Proceedings of the SIGCHI (CHI '16). ACM. Menczer. 2016. e DARPA Twi er bot challenge. Computer 49, 6 (2016), 38–46.
[25] Q Vera Liao e Wai-Tat Fu. 2013. Além da bolha do filtro: efeitos interativos [35] Cass R. Sunstein. 2002. e Lei de Polarização de Grupo. Journal of Political
de ameaça percebida e envolvimento de tópico na exposição seletiva de informações. Philosophy 10, 2 (2002), 175–195. hp: //dx.doi.org/10.1111/1467-9760.00148
Em Anais da conferência SIGCHI sobre fatores humanos em sistemas de computação. [36] Joe Tacopino. 2017 FBI liberta Michael Flynn dentrosonda
ACM, 2359-2368. ligando ele para Rússia. hp: //nypost.com/2017/01/24/
[26] Regina Marchi. 2012. Com o Facebook, blogs e notícias falsas, os adolescentes rejeitam o jornal i-clears-michael-ynn-in-probe-linking-him-to-russia /. (2017). Acessado:
“objetividade” istica. Journal of Communication Inquiry 36, 3 (2012), 246–262. 25/05/2017.
[27] Amy Mitchell, Je rey Go fried, Jocelyn Kiley e Katerina Eva Matsa. 2014. [37] Marcella Tambuscio, Giancarlo Ru o, Alessandro Flammini e Filippo Menczer.
Polarização política e hábitos de mídia. Pew Research Center (2014). 2015. Efeito de checagem de fatos sobre boatos virais: um modelo de disseminação de desinformação
[28] Will Oremus. 2016. Stop Calling Everything ”Fake News”. hp: //www.slate.com/ nas redes sociais. Em anais da 24ª Conferência Internacional sobre o Mundo
artigos / tecnologia / tecnologia / 2016/12 / pare de chamar tudo de notícia falsa. Wide Web. ACM, 977-982.
html. (2016). Acesso em: 25-05-2017. [38] Hanghang Tong, Christos Faloutsos e Jia-Yu Pan. 2008. Passeio aleatório com
[29] Eli Pariser. 2011 Bolha do filtro: o que a Internet está escondendo de você. Pinguim reiniciar: soluções e aplicativos rápidos. Knowl. Inf. Syst. 14, 3 (2008), 327-346.
REINO UNIDO. [39] Donald J. Trump. 2017 h ps: // twi er.com/realdonaldtrump/status/
[30] Cecilia Pasquini, Carlo Brune a, Andrea F Vinci, Valentina Cono er e Giulia 861713823505494016. (2017). Acesso em: 25-05-2017.
Boato. 2015. Rumo à verificação da integridade da imagem em notícias online. Dentro [40] Jiajia Wang, Laijun Zhao e Rongbing Huang. 2014. 2SI2R boato espalhado-
Multimedia & Expo Workshops (ICMEW), 2015 IEEE International Conference on. modelo de integração em redes homogêneas. Physica A: Mecânica Estatística e seus
IEEE, 1–6. Applications 413 (2014), 153–161.
[31] Bethany Bryson Paul DiMaggio, John Evans. 1996. American's Social [41] Felix Ming Fai Wong, Chee Wei Tan, Soumya Sen e Mung Chiang. 2013
A itudes se tornam mais polarizados? Amer. J. Sociology 102, 3 (1996), 690–755. anti-inclinação política de tweets e retuítes. Em Proceedings of the
h ps: //doi.org/10.2307/2782461 Sétima Conferência Internacional sobre Weblogs e Mídias Sociais, ICWSM 2013,
[32] Jacob Ratkiewicz, Michael Conover, Mark R Meiss, Bruno Gonçalves, Alessandro Cambridge, Massachuse s, EUA.
Flammini e Filippo Menczer. 2011. Detecção e rastreamento de abusos políticos em [42] Samuel C. Woolley. 2016. Potência de automação: interferência de bots sociais em todo o mundo
Mídia social. ICWSM 11 (2011), 297–304. política. Primeira segunda-feira, 21, 4 (2016).
[33] Kate Starbird. 2017. Examinando o ecossistema de mídia alternativa em torno do [43] Fabiana Zollo, Petra Kralj Novak, Michela Del Vicario, Alessandro Bessi, Igor
Produção de Narrativas Alternativas de Eventos de Tiro em Massa no Twi er. (2017). Mozetic, Antonio Scala, Guido Caldarelli e Walter a rociocchi. 2015. Emo-
h ps: //www.aaai.org/ocs/index.php/ICWSM/ICWSM17/paper/view/15603 dinâmica internacional na era da desinformação. PloS one 10, 9 (2015), e0138740.

https://translate.googleusercontent.com/translate_f 7/7

Você também pode gostar