Algoritmos No Jornalismo

DESCRIÇÃO
A lógica dos algoritmos, os conceitos básicos, o impacto de sua utilização na vida cotidiana,
especificamente no jornalismo de dados.
PROPÓSITO
Compreender a lógica básica dos algoritmos, principalmente quando articulados às tecnologias
computacionais, dá ao jornalista no século XXI acesso a ferramentas poderosas de
investigação e análise.
OBJETIVOS
MÓDULO 1
Reconhecer os conceitos básicos, a lógica e a construção de algoritmos
MÓDULO 2
Identificar o uso dos algoritmos no jornalismo
INTRODUÇÃO
Você já ouviu falar muito em algoritmos? Essa palavra virou mais uma daquelas que muitas
pessoas utilizam, mas poucos efetivamente sabem o que significa, e mais, como eles
impactam o nosso cotidiano. Isso é justificado pela variedade de contextos em que aparece.
Ouve-se falar em algoritmos que decidem a ordem do que você vai ver nas suas redes sociais,
algoritmos que moldam opiniões, que protegem passageiras de carros chamados por
aplicativos, algoritmos racistas e machistas, além de muitas outras atribuições.
Um algoritmo pode ser usado para, de acordo com o seu gosto, com o que você já consumiu e
filmes que viu, fazer a recomendação de outros filmes.
Vamos a uma boa dica:
Há uma safra recente de documentários sobre o assunto. Vale buscá-los para conhecer ainda
mais esse universo.
 ALGORÍTIMO
 REDES
 INFLUÊNCIA
O streaming, um serviço que oferece o acesso à mídia de forma direta sem armazenamento
intermediário, é um bom exemplo. Se você buscar pelo primeiro filme a seguir, é possível que o
algoritmo sugira os dois outros filmes que têm conteúdo relacionado.
Dessa forma:
Indicados para você:

Coded Bias, 2020
Documentário
Direção: Shalini Kantayya
Roteiro: Shalini Kantayya
O Dilema das Redes, 2020
Documentário
Direção: Jeff Orlowski
Roteiro: Jeff Orlowski, Davis Coombe, Vickie Curtis
Privacidade hackeada, 2019
Documentário
Direção: Karim Amer, Jehane Noujaim
Roteiro: Karim Amer, Pedro Kos, Erin Barnett
MÓDULO 1
 Reconhecer os conceitos básicos, a lógica e a construção de algoritmos
O QUE SÃO OS ALGORITMOS E O QUE

ELES QUEREM COM VOCÊ?
Essa pergunta norteará nossa leitura. Então, antes de aprofundá-la, vamos perder o medo da
matemática que envolve a questão.
ALGORITMOS SEM MEDO

O que significam os algoritmos no mundo contemporâneo e como impactaram o jornalismo?
Clique a assista!
Carregando conteúdo
Algoritmos são uma sequência de instruções que visam a alcançar um objetivo desejado.
Qualquer criança aprende a trabalhar com algoritmos desde a escola. Não acredita?
25
X 34
???
Pense em como você fazia contas de multiplicar com lápis e papel: 25 x 34. Ao menos nos
anos 1980, era assim que as escolas ensinavam.
Multiplica o quatro pelo cinco. Dá 20. Desce o zero, sobe dois.

2
25
X 34
0
2
25
X 34
100
Multiplica o quatro pelo dois. Dá oito. Soma os dois que subiram antes. Dá dez. Como não há
mais nenhuma casa, pode escrever o dez inteiro.
Agora, a dezena. Comece escrevendo um zero embaixo da primeira casa.
2
25
X 34
100
0
1
25
X 34
100
50
Multiplica o três pelo cinco. Dá quinze. Desce o cinco para a segunda casa, uma antes do final,
e sobe um.
Multiplica o três pelo dois. Dá seis. Soma aquele um que subiu, dá sete. Desce isso.
1
25
X 34
100
750
100
+750
850
Agora some os dois números do resultado: 100 + 750 = 850
Professores de matemática criativos em escolas mais modernas do que as de três décadas

atrás usam menos passos para chegar ao mesmo resultado. Bons debates sobre o assunto
têm sido feitos sobre a relação entre a matemática e as gerações, em especial a geração Z
(nascidos entre 2000 e 2015) e a Alpha (nascidos a partir de 2015).
 RESUMINDO
Esse professores mais modernos empregam algoritmos mais eficientes, que “rodam” mais
rápido na cabeça do aluno.
Pense em uma receita de bolo, que também é um algoritmo. Existe uma ordem mais ou menos
certa de passos a seguir. Além disso, não adianta colocar os ingredientes no forno antes de
colocar a farinha. (Embora, em algumas receitas, seja uma questão de preferência acrescentar
o leite antes ou depois da farinha.)
MÃO NA MASSA
Está com dúvida? Tente descrever algoritmos que mostrem o passo a passo necessário para
cumprir a tarefas de fritar um ovo:
ALGORITMO A
Abrir a geladeira;
Pegar um ovo;
Levar à frigideira;
Quebrar a casca na lateral da frigideira;
Abrir o ovo;
Colocar a casca no lixo;
Colocar manteiga na frigideira;
Acender o fogo;
Utilizar uma espátula para virar o ovo;
Retirar o ovo;
Apagar o fogo.
ALGORITMO B
Pegar a frigideira;
colocar no fogão;
pegar manteiga;
ir à geladeira;
pegar o ovo;
quebrar em um copo;
acender o fogo;
colocar o ovo no óleo;
desligar o fogo;
jogar a casca no prato, e colocar o ovo frito no lixo.
ALGORITMO C
Acender o fogo;
apagar o fogo;
colocar a frigideira;
correr na geladeira;
pegar o ovo;
colocar o ovo na frigideira;
jogar manteiga por cima;
quebrar a casca.
Quem vai comer ovo frito? Seu fogão tem quatro ou seis bocas? Não importa, mas você sabe
pela sequência finita o resultado esperado: qual ovo vai ser comestível e qual não vai.
Agora é a sua vez. Você pode tentar fazer o mesmo com as seguintes ações:
Dirigir um carro para, saindo da garagem de casa, dar a volta na quadra.
Encontrar uma palavra no dicionário. (Bônus: pesquise como esse algoritmo é codificado por
programadores).
Mas isso não parece tão perigoso, ou fascinante. Lembre-se de que a Matemática é a
interpretação do mundo pelos homens. Elementos que fazem parte de nosso cotidiano, o
conjunto de eventos possíveis, estabelecimento de sequências... tudo isso é a percepção do
que devemos fazer.
O mundo digital reproduz a mesma lógica. Mudam as bases numéricas, as formas, mas o
princípio será reproduzido. De agora em diante vamos ao mundo digital, afinal, ainda
precisamos explicar como o mundo digital e a aplicação dos algoritmos modificaram para
sempre as relações humanas e o jornalismo em especial.
No caso dos algoritmos digitais, eles dependem de três partes principais:
1
Um modelo matemático
2
Dados para alimentar esse modelo
3
Uma definição de sucesso
Vamos entender o que essas partes significam?
O MODELO MATEMÁTICO
Os modelos matemáticos buscam descrever aspectos do mundo real em termos calculáveis,
da maneira mais fiel possível. A descrição nunca será perfeita, porque vários aspectos da
realidade não cabem em uma fórmula matemática. O que ela precisa é descrever como se
comporta, em média, a maioria dos casos.
Uma classe de modelo matemático que qualquer adolescente aprende a aplicar na escola é o
das leis do movimento de Newton, nas aulas de Física. Lembra?
Para calcular a velocidade, você divide a distância pelo tempo
Para calcular a aceleração, você divide a variação da velocidade pela variação do tempo.
Para calcular a força, você multiplica a massa pela aceleração.
São modelos matemáticos simples, elegantes e que funcionam para a maioria dos casos.
De todos os algoritmos utilizados atualmente em serviços digitais, talvez os mais famosos

sejam os de recomendação de conteúdo. As redes sociais vivem de recomendar conteúdo a
você. O modelo de negócio de serviços de streaming depende de você encontrar mais e mais
coisas a que gostaria de assistir – quando você não encontra, é mais fácil deixar de pagar a
assinatura mensal. Para isso, elas precisam “adivinhar” de que você gosta para mostrar mais
daquilo.
As empresas que ofertam esse tipo de serviço precisam de uma métrica para saber se estão
indo bem ou não. Desse modo, as empresas definem seu sucesso por quantas horas você
passa por mês assistindo a conteúdo. Por isso, elas oferecem tantas séries: a qualquer
momento, há cerca de 13 mil opções à disposição e é fácil se perder entre elas ou passar mais
tempo procurando o que assistir do que assistindo o que encontrou. Por isso, eles indicam
conteúdo.
Em 2016, segundo o site Business Insider, portal de notícias especializado nas questões de
tecnologias globais, as empresas de streaming empregavam cerca de mil programadores
apenas para aperfeiçoar o modelo matemático que oferece coisas para o assinante acessar em
seguida.
 VOCÊ SABIA
Todo ano são realizados centenas de testes, direcionados a 300 mil usuários para ver o que
pode ser melhorado. Esses assinantes dificilmente sabem que são cobaias.
Há alguns anos, essas empresas também faziam desafios de programação para que pessoas
externas ajudassem a melhorar seu algoritmo. As melhores soluções eram contempladas com
vultosos prêmios em dinheiro.
Essas recomendações, como as da Netflix, são altamente personalizadas, até certo ponto.
Partem do conhecimento de tudo o que você e todos os outros assinantes assistiram. Então, o
modelo matemático leva em conta o acervo de filmes vistos para determinar quais gostos são
parecidos com o seu.
 EXEMPLO
Quem assiste a muitos filmes de super-heróis receberá mais e mais recomendações para
assistir a filmes de super-heróis. Mais ainda: teoricamente, alguém que assistisse a mais filmes
da Marvel (Homem-Aranha, Thor, Os Vingadores etc.) tenderia a receber dicas para assistir a
filmes da Marvel com mais frequência do que a filmes do Disney Channel (Batman x
Superman, Liga da Justiça etc.).
Ao mesmo tempo, eles não têm interesse em personalizar demais as recomendações porque
isso dificultaria ao assinante a descoberta de opções que ainda não conhece e que talvez
possa gostar.
COMO SE MATEMATIZA ISSO?

Uma maneira é levando em conta as horas que você gastou assistindo a cada filme. Se você
assistiu a apenas poucos minutos de um filme e depois desistiu, é razoável supor que não
gostou dele. O número mágico com que se trabalha é 90 segundos. A Netflix lançou, em 2016,
trailers como forma de capturar a atenção do espectador. Se você foi ver outra coisa antes de
um minuto e meio, é um indicativo de que aquele conteúdo não prendeu a sua atenção. Isso
pode ser usado como peso nos filmes que você viu.
Para identificar perfis de gostos semelhantes, é possível calcular pares de filmes. Digamos: se
você assistiu a todos os seis filmes da primeira fase do Universo Cinemático da Marvel, é
possível formar 15 pares entre eles (se são seis filmes, calculamos 5+4+3+2+1):
1. Homem de Ferro + Hulk
2. Homem de Ferro + Homem de Ferro 2
3. Homem de Ferro + Thor
4. Homem de Ferro + Capitão América
5. Homem de Ferro + Os Vingadores
6. Hulk + Homem de Ferro 2
7. Hulk + Thor
8. Hulk + Capitão América
9. Hulk + Os Vingadores
10. Homem de Ferro 2 + Thor
11. Homem de Ferro 2 + Capitão América
12. Homem de Ferro 2 + Os Vingadores
13. Thor + Capitão América
14. Thor + Os Vingadores
15. Capitão América + Os Vingadores
Se alguém assistiu a apenas cinco deles, essa pessoa assistiu a 10 pares de filmes (4+3+2+1),
deixando de lado todos os cinco pares destacados. O gosto dessa pessoa é 75% parecido com
o seu, então, é mais ou menos seguro dizer que pessoas com o gosto semelhante ao dela
também gostaram de Homem de Ferro 2.
 COMENTÁRIO
A matemática usada para isso muitas vezes é bastante complexa. Caso não se importe em não
entender completamente algo que vai ler, porque é realmente difícil, um exemplo hipotético
está disponível no site Data Hackers, portal de ciência de dados que mostra tipos de sistema
de recomendação.
O modelo matemático é codificado por programadores em instruções de programação, não

raro usando aprendizado de máquina — elemento da inteligência artificial, que permite a um
programa decidir o que fazer com base no que infere a partir dos dados, sem instruções
explícitas do programador.
POR ISSO, MUITAS VEZES, COMPARAMOS

ALGORITMOS A “CAIXAS PRETAS” — O
PROGRAMADOR PREPARA AS LINHAS GERAIS, MAS
DEPOIS DE DISPONIBILIZAR O PROGRAMA PARA
EXECUÇÃO TUDO O QUE ACONTECE LÁ DENTRO
ESTÁ FORA DO SEU CAMPO DE VISÃO.
Entre as linguagens mais utilizadas atualmente para a programação de algoritmos estão R e

Python.
R
Segundo o Instituto Brasileiro de Pesquisa e Análise de Dados (2020), R é uma a linguagem de

programação estatística ou um conjunto de pacotes e ferramentas estatísticas munido de
funções que facilitam sua utilização, desde a criação de simples rotinas até análises de dados
complexas, com visualizações bem-acabadas. É completamente gratuito, de livre distribuição,
e muito fácil de se aprender – há uma enorme quantidade de tutoriais e ajuda disponíveis
gratuitamente na internet. Além de excelente para criar rotinas e sistematizar tarefas
repetitivas, é também uma ótima ferramenta para criar relatórios e gráficos (GUERRA et al.,
2020).
PYTHON
É uma linguagem de programação multiplataforma utilizada para as mais diversas aplicações

para web, games e dispositivos móveis. É uma linguagem aberta (open source), orientada a
objetos e pode se comunicar com aplicações desenvolvidas em outras linguagens como C++ e
Java. É uma forma de programar mais simples, em que as linhas de um código são executadas
sequencialmente, sendo possível chamar funções e utilizar diversas estruturas até seu código
alcançar o objetivo desejado.
OS DADOS
As instruções de programação são aplicadas a ingredientes, no caso os dados, que são
capturados de diversas maneiras.
Ainda mantendo o exemplo dos algoritmos de recomendação de conteúdo, pense no seu feed
de redes sociais. Tantas pessoas e empresas participam das redes que seria impossível
mostrar em tempo real todo o conteúdo de todo mundo que alguém segue. Por isso, e visando
a manter as pessoas pelo máximo de tempo possível no site, as empresas do setor usam
algoritmos de recomendação. Eles buscam com isso mostrar coisas que tenham a maior
probabilidade de manter você no site. É por isso que você deixa de ver postagens de amigos
com quem parou de interagir, mas, de repente, esses amigos reaparecem em sua timeline com
uma foto de um casamento, filho ou morte na família, que teve muitas e muitas curtidas antes
de chegar até a sua tela.
 VOCÊ SABIA
Durante todo o tempo que você passa navegando em redes sociais, cada clique seu é
mensurado. Se você clicou em um link, isso fica registrado. Se você curtiu um post, isso fica
registrado.
Ao longo do tempo, você deixou pistas suficientes para que os computadores centrais da rede
tenham um modelo matemático do que lhe interesse. Mas não é só com você, é com bilhões
de pessoas simultaneamente. Algumas deixam mais informações, outras menos. Se você vive
em uma cidade e interage muito com pessoas que consistentemente vivem em outra cidade,
mesmo que você não diga de onde é, deixou pistas suficientes para que o algoritmo calcule
que você mora longe da família.
Depois de coletada, essa informação pode ser considerada importante para anunciantes. Parte
do modelo de negócio das grandes empresas de tecnologia, as big techs, é a venda de
anúncios direcionados. Assim, digamos, uma empresa aérea pode, em setembro, colocar
anúncios na sua rede social favorita, direcionados a pessoas que moram longe da família,
visando a vender passagens antecipadas com desconto para quem vai visitar nas festas de fim
de ano. Mulheres jovens, casadas, mas sem filhos, em alguns casos, começam a receber
indicações de vídeos de bebês sem pesquisar por eles.
 QUER TESTAR?
Entre na sua rede social favorita. Vá em “Configurações”. Ou, se houver uma opção mais
específica, clique em algo como “Configurações de anúncios”. Procure as referências a
categorias e interesses. Abra as duas e veja por que assuntos e pessoas a rede social sabe
que você se interessa. Lembre-se de que você pode remover ou desabilitar a coleta dessas
informações. Tome decisões a respeito. Observe as mais importantes e reflita como o
algoritmo chegou a essa conclusão.
UMA POLÊMICA IMPORTANTE É SOBRE O QUANTO
PODE SER FEITO E COLETADO E COMO ESSES
DADOS PODEM SER UTILIZADOS. ESSAS POLÊMICAS
ESTÃO NO CENTRO DOS DEBATES SOBRE BANCO
DE DADOS E REGULAMENTAÇÕES DO USO DESSAS
REDES.
A DEFINIÇÃO DE SUCESSO
Como avaliar o sucesso de um algoritmo? Quando se fala em sucesso, fala-se do objetivo final
buscado pelo algoritmo. Se ele oferece um produto de acordo com o que supõe ser a
preferência do consumidor, o sucesso é a compra; se o algoritmo oferece um conteúdo de
acordo com o que supõe ser a preferência do leitor, o sucesso é o clique. Quanto melhor o
algoritmo “acertar” a previsão sobre as preferências, maiores serão as taxas de compra e
clique, ou seja, mais pessoas terão o comportamento desejado.
Geralmente, estamos falando de dinheiro. Mas nem sempre.
UMA FRASE FAMOSA DA HISTÓRIA DA PUBLICIDADE

TERIA SIDO DITA PELO NEGOCIANTE E POLÍTICO
JOHN WANAMAKER (1838-1922), UM DOS PIONEIROS
DO MARKETING: DE CADA DOIS DÓLARES QUE SE
GASTA EM ANÚNCIOS, UM É JOGADO NO LIXO. O
PROBLEMA SERIA SABER QUAL.
As big techs investem milhões de dólares em tecnologia e lobby para conhecer o máximo
possível sobre você e oferecer anúncios mais certeiros a seus anunciantes, para que tenham
uma ideia melhor de qual dólar é jogado fora. Um anúncio de creme de barbear na televisão é
muito caro e mostrado a todos: homens, mulheres e crianças, mas nem todos fazem parte de
seu público-alvo.
Na publicidade baseada em algoritmos, produtos para barba podem ser oferecidos apenas a
homens de determinada faixa etária e até com determinadas preferências socioculturais — um
shampoo vegano para barba dificilmente apareceria em intervalos comerciais na TV, mas na
internet poderia ser um relativo sucesso entre homens jovens urbanos, com ao menos alguma
simpatia pela alimentação 100% vegetal.
BIG TECHS
As grandes cias de tecnologia do mundo, como Amazon, Netflix, Facebook, appel, Microsoft
entre outras.
 ATENÇÃO
O importante para muitas empresas não é mais necessariamente ser o número um de toda
uma categoria de produtos, e sim ser o número um dentro do seu nicho de mercado específico.
Só que, para ter essas informações sobre cada consumidor, as redes sociais precisam manter
as pessoas engajadas com o conteúdo lá publicado, seja por amigos, seja por influenciadores,
seja por empresas. Conforme você manifesta interesse por alguns conteúdos e não por outros,
conforme você interage com grupos e pessoas, você está fornecendo dados para alimentar o
algoritmo.
É o famoso engajamento, ou seja, interação entre pessoas, perfis e conteúdo. Os algoritmos

das redes sociais tornaram o engajamento uma espécie de imperativo, buscado por todos.
Empresas querem que suas mensagens “viralizem”. Agências que selecionam pessoas para
trabalhar com mídias sociais pedem que candidatos mostrem exemplos de quando “hitaram”.
Mas o que gera engajamento? O pesquisador Jonah Berger (2020) fez estudos importantes a
respeito. Coletando uma série de postagens com variados graus de sucesso, Berger propôs o
modelo “STEPPS” para explicar quais fatores atraem engajamento. Nem sempre eles atuam
sozinhos.
VIRALIZAR
Velocidade e volume de dispersão de uma mensagem (seja ela um meme, seja qualquer outra
imagem, como uma propaganda inclusive, ou ainda música, vídeo etc.), que alcança números
impressionantes.
HITAR
Hitar é fazer sucesso ou alcançar o auge de um objetivo.
STEPPS
O nome é um trocadilho com a palavra steps em inglês, que significa “passos”, “fase” ou
“degrau”.
STEPPS
O primeiro S é de “Social Currency” (moeda de troca social). As pessoas comentam e

compartilham aquilo que pega bem, o que as faz parecerem bacanas e espertas, o que faz
com que elas mostrem que pertencem a uma turma ou são leais a alguém.
STEPPS
O T é de “Triggers” (gatilhos). As pessoas gostam de falar sobre aquilo que está sendo
falado. Quem não gosta de reality shows não tem com quem conversar no Brasil nas terças à
noite nos primeiros meses do ano, quando todos estão de olho no resultado de um programa
do tipo. Datas comemorativas são um gatilho de conversa importante, também.
STEPPS
O E é de “Emoção”. As pessoas falam e compartilham aquilo que mais mexe com elas.
Emoções extremas mexem de maneira extrema. O que é absurdamente engraçado ou
absolutamente odioso engaja muito mais do que aquilo que é apenas triste ou simpático.
STEPPS
O primeiro P é de “Público”. Quanto mais for mostrado, mais valor tem. A lógica do
engajamento se mede por compartilhamentos e curtidas. Para muitos, tanto faz se o
compartilhamento é por amor ou ódio. Quanto mais aparece, mais influência ganha.
STEPPS
O segundo P é de “Practical Value” (valor prático). Aquilo que tem utilidade para a vida. Por
exemplo: aprendi a fazer upgrade de componentes do meu computador usando vídeos do
YouTube, compartilhei no dia e agora estou aqui comentando com alunos que sequer estou
vendo.
STEPPS
O segundo S é de “Stories” (histórias). Somos seres sociais e gostamos de gente. A história

de uma criança doente nos comove muito mais do que as estatísticas de mortalidade infantil.
Canais de televisão usam esse recurso com muito mais eficácia do que meios impressos.
ESSES FATORES INTERAGEM ENTRE SI E SE

REFLETEM NA MANEIRA COMO O CONTEÚDO É
PRODUZIDO. O MAIS BELO INFOGRÁFICO SOBRE
MORTALIDADE INFANTIL NUNCA VAI ATRAIR O
MESMO ENGAJAMENTO QUE UMA HISTÓRIA DE UMA
CRIANÇA QUE MORREU (SEGUNDO S), CONTADA EM
UMA DATA COMO O DIA DA CRIANÇA (T), APELANDO
À EMOÇÃO (E), POR ALGUÉM MUITO CONHECIDO
(PRIMEIRO P), NA SUA CIDADE (PRIMEIRO S),
ESPECIALMENTE SE INCLUIR RECOMENDAÇÕES
PARA QUE ISSO NÃO OCORRA NA SUA FAMÍLIA
(SEGUNDO P).
Em boas mãos, isso é uma grande ferramenta de trabalho. Mas os craques no uso desses
fatores são os produtores de notícias falsas, que sequer precisam se ater à realidade em sua
busca por engajamento. Eles querem provocar emoções fortes, de qualquer maneira, porque
nada engaja tanto quanto emoções extremas.
DEPOIMENTO
Uma experiência: em 2018, coletei informações de posts do Facebook sobre a eleição, da

página de um grande jornal e de uma página de fake news. Classifiquei as postagens pelas
reações predominantes, as “carinhas”. Enquanto no jornal as reações se distribuíam pelas
cinco reações básicas do Facebook (carinha raivosa, gargalhada, coração, tristeza e uau), no
site de fake news nove a cada dez posts tinha como reação principal a carinha raivosa. Ao
mesmo tempo, a página das fake news tinha reações mais presentes do que as páginas de um
grande jornal. Será que isso é um padrão?
Gráfico elaborado por Marcelo Soares
1
Observe todos os posts de sua página favorita das suas mídias sociais nos últimos dias. Quais
foram os mais compartilhados? Quais são as reações predominantes, tirando o  ? Por que
isso aconteceu? Registre, e faça isso com recorrência, de tempos em tempos.
Localize notícias sobre algum sistema que utiliza algoritmo, sem ser de recomendação de
conteúdo, e pesquise mais a respeito dele. O que você consegue inferir sobre quais são os
dados de que ele se alimenta e qual a proveniência? Quais são os possíveis problemas nessa
proveniência? O que você consegue inferir sobre quais são suas medidas de sucesso? O que
você consegue descobrir sobre o que seu modelo matemático leva em conta? Um site de
notícias oficial, uma página oficial governamental, algo em que tenha padrões mais
reconhecíveis.
Troque suas opiniões nas suas redes, veja as reações, perceba os interesses, note se você
acaba por alimentar algum padrão.
ESPERA. EU ALIMENTAR UM PADRÃO?
SIM, VOCÊ!!!!!!!!!!!
Não é por que está lendo sobre isso que não será influenciado pela programação, pelos
algoritmos. Todos somos, a diferença é passar a perceber.
OS ENGENHEIROS DO CAOS
Outro tipo de objetivo que os algoritmos podem ser calibrados para buscar é o de influenciar a
opinião pública em torno de determinadas ideias e pessoas.   
O caso mais conhecido é o da controvérsia em torno da empresa Cambridge Analytica, que

teria cruzado informações pessoais obtidas do Facebook com pesquisas que definiram o perfil
“psicográfico” de pessoas. Cambridge Analytica surgiu como uma empresa de tecnologia, mas
se notabilizou nas eleições de Donald Trump, quando se levanta a questão de seu potencial de
articulação nessa eleição. Existem controvérsias, versões, exageros, mas vale a leitura sobre
esses eventos.
 VOCÊ SABIA
Debates similares ocorreram nas eleições presidenciais do Brasil de 2018, a respeito de

disparos de mensagens de WhatsApp por robôs, não por pessoas.
A partir de algumas perguntas sobre atitudes, os perfis psicográficos classificam pessoas em

alguns grupos, no modelo OCEAN:
Tendo os dados do que curtem e compartilham as pessoas que responderam ao questionário,
teoricamente seria possível descobrir que gostos estão relacionados a quais tipos de
personalidade. Com isso, seria possível pensar em formular mensagens diferentes voltadas a
diferentes perfis psicológicos e direcionar mensagens a essas pessoas, utilizando as mesmas
ferramentas usadas para publicidade.
 SAIBA MAIS
Marketing político é a aplicação de tudo o que se faz para vender, desde produtos à venda de
ideias, pessoas e políticas públicas. Natural que o marketing político adotasse imediatamente a
lógica do engajamento e das redes sociais. Por meio delas, a pessoa pública fala diretamente
ao seu público, sem mediadores. O crescimento desse fenômeno foi anotado por Ricardo
Gandour em seu livro Jornalismo em retração, poder em expansão (2020).
QUANDO TODOS OPERAM DE BOA-FÉ, ISSO É

EXCELENTE. 😇
MAS E QUANDO NEM TODOS OPERAM DE BOA-FÉ?
😈
Na Itália, a partir de 2007, o empresário Gianroberto Casaleggio resolveu criar um movimento
político completamente baseado na exploração do engajamento digital, explorando as
características dos algoritmos, visando a exacerbar emoções e a mobilizar a opinião pública.
Não precisava usar necessariamente a verdade, apenas popularidade e fortes emoções. Em
2009, encontrou o personagem certo para encarnar esse movimento: o comediante Beppe
Grillo, que trouxe ao discurso político algumas das expressões mais chulas do idioma de Dante
Alighieri.
Comediante Beppe Grillo.
Era o “Movimento Cinco Estrelas”, que menos de uma década depois ascendeu ao poder na
Itália. Foi um dos primeiros dos grandes movimentos populistas modernos que se espalharam
primeiro pela Europa e depois pelo mundo, inspirando alguém como Steve Bannon a fazer o
mesmo nos Estados Unidos, apadrinhando um apresentador de reality shows. No Brasil,
fenômeno semelhante ocorreu com um político chamado a comentar temas polêmicos em
programas de auditório e de comédia.
A política italiana vinha em um ciclo de fracasso após fracasso desde que a Operação Mãos
Limpas inviabilizou boa parte da classe política. Políticos populistas, como o bilionário Silvio
Berlusconi, assumiram o poder e se envolveram em tantos casos de corrupção e escândalos
sexuais que conseguiram desmoralizar ainda mais a atividade política.
Giuliano da Empoli (2019) percebeu que o jogo político não envolvia mais unir as pessoas em
volta de um denominador comum. Mas, ao contrário, “inflamar as paixões do maior número
possível de grupelhos”. Avalia ele que, para conquistar uma maioria, muito grupos não buscam
mais convergir para o centro, e sim unir-se aos extremos. Empoli relata como o Movimento
Cinco Estrelas e os outros que o copiaram deram à luz a atual onda populista ao redor do
mundo, usando a lógica do engajamento em mídias sociais:
O jogo não consiste mais em unir as pessoas em torno de um denominador comum, mas, ao
contrário, em inflamar as paixões do maior número possível de grupelhos para, em seguida,
adicioná-los, mesmo à revelia. Para conquistar uma maioria, eles não vão convergir para o
centro, e sim unir-se aos extremos. Cultivando a cólera de cada um sem se preocupar com a
coerência do coletivo, o algoritmo dos engenheiros do caos dilui as antigas barreiras
ideológicas e rearticula o conflito político tendo como base uma simples oposição entre “o
povo” e “as elites”. No caso do Brexit, assim como nos casos de Trump e da Itália, o sucesso
dos nacional-populistas se mede pela capacidade de fazer explodir a cisão esquerda/direita
para captar os votos de todos os revoltados e furiosos, e não apenas dos fascistas.
Naturalmente, como as redes sociais, a nova propaganda se alimenta sobretudo de emoções
negativas, pois são essas que garantem a maior participação, daí o sucesso das fake news e
das teorias da conspiração. Mas tal tipo de comunicação possui também um lado festivo e
libertário, comumente desconhecido daqueles que enfatizam unicamente a faceta sombria do
Carnaval populista. O escárnio vem sendo, desde então, a ferramenta mais eficiente para
dissolver as hierarquias. Durante o Carnaval, um bom e libertador ataque de riso é capaz de
enterrar a ostentação do poder, suas regras e suas pretensões. Nada mais devastador para a
autoridade que o impertinente, que a transforma em objeto de ridículo.
(EMPOLI, 2019, p.21)
Ou seja, os engenheiros do caos também são arquitetos do caô.
Tudo isso tem consequências importantes para o dia a dia e para a vida pública, que vêm
sendo debatidas ao redor do mundo. Para que esse debate esclareça melhor o cidadão
comum, é preciso que ele esteja presente de maneira mais qualificada no jornalismo.
VERIFICANDO O APRENDIZADO
MÓDULO 2
 Identificar o uso dos algoritmos no jornalismo
E O JORNALISMO COM ISSO?

Até aqui, parece que falamos principalmente de publicidade, de redes sociais e de política, mas
por que estamos falando disso se este assunto é sobre jornalismo?
Se você assistiu ao filme Todos os Homens do Presidente (Direção de Alan J. Pakula, 1976),
sobre a investigação do caso Watergate pelos repórteres Carl Bernstein e Bob Woodward,
pode se lembrar da cena em que o Garganta Profunda instrui Bernstein: “siga o dinheiro”. .
SE VOCÊ ENTENDE O FLUXO DO DINHEIRO, ESTÁ

MAIS PERTO DE COMPREENDER OS INCENTIVOS
QUE LEVAM AS COISAS A SEREM CONFIGURADAS DA
MANEIRA COMO SÃO.
Na última década, a publicidade algorítmica praticamente destruiu os modelos de negócio

tradicionais que sustentaram a produção de jornalismo ao longo do século XX. O uso de
algoritmos por redes sociais, focadas no engajamento, também criou outros modelos de
negócio, como o “marketing de influenciadores”, de um lado, e os sites de fake news, de outro.
Philip Meyer no livro Os jornais podem desaparecer?, escrito em 2004, aponta que o principal
patrimônio que restara às empresas jornalísticas, em meio à crise ainda bem mais incipiente do
modelo de negócio, era sua marca e sua credibilidade. Dez anos depois da publicação do livro,
a principal forma de acesso a notícias era por meio de redes sociais.
NAS REDES SOCIAIS, HÁ POUCA COISA QUE
PERMITA DIFERENCIAR ENTRE UM LINK DA FOLHA
DE S. PAULO, UM JORNAL TRADICIONAL, E OUTRO
JORNAL, COM NOME PARECIDO, MAS QUE, NA
VERDADE, É UM SITE QUE DIVULGA FAKE NEWS.
COM ISSO, AS MARCAS FORAM ERODIDAS TAMBÉM,
ESPECIALMENTE ENTRE LEITORES QUE NÃO SE
IMPORTAM COM A PROCEDÊNCIA DO CONTEÚDO.
 ATENÇÃO
Para que as fake news ganhem espaço, é preciso antes criar os fake readers.
Ainda assim, existem pontos de contato muito importantes entre os algoritmos e o jornalismo.
Podemos pensá-los como bancas de revistas, repórteres e, cada dia mais, como pauta.
OS ALGORITMOS COMO BANCA DE REVISTAS
Já falamos sobre o uso dos algoritmos de recomendação de conteúdo, que praticamente

usurparam o papel que antes era quase exclusivamente cumprido pelas bancas de revista e
videolocadoras. Isso levou a uma especialização importante de funções dentro das redações:
as maiores, atualmente, têm equipes especializadas em postar conteúdo em mídias sociais e
em adequar textos para que sejam mais bem encontrados pelos buscadores.
O Google News, serviço criado após o 11 de setembro de 2001, causou certa sensação
quando foi criado, porque destacava conteúdo sem a intermediação de editores. Toda a
seleção do que seria mostrado com destaque seria baseada em algoritmos. Isso acabou
criando conflitos com empresas jornalísticas ao redor do mundo.
OS ALGORITMOS COMO REPÓRTERES
Também podemos pensar em algoritmos como instrumentos de apuração jornalística. O jornal

Los Angeles Times tem sua sede na Califórnia, um estado que fica exatamente sobre o
encontro de duas placas tectônicas. A cada terremoto, teme-se que possa ser o “Big One”, um
terremoto de alta magnitude, com chances de ocorrer em data não precisada, e que causará
alta destruição, separando parte de Los Angeles do restante dos Estados Unidos.
Não se sabe quando ele virá, e os terremotos também não costumam marcar hora; terremotos,
porém, são sempre uma notícia importante no maior jornal local. Até há dez anos, era preciso
que houvesse alguém na redação de olho nos órgãos de monitoramento para saber se havia
elevação de atividade tectônica. Nos anos 1980, provavelmente, isso era feito por telefone.
Em 2011, repórteres do jornal criaram o Quakebot, um robô repórter que só cobre terremotos.
Trata-se de um algoritmo, que monitora o feed do United States Geological Survey (USGS), o
Serviço Geológico dos Estados Unidos, 24 horas por dia, para saber informações sobre
terremotos. A partir das informações desse feed, caso o terremoto cumpra alguns requisitos, é
gerado um texto. Esses requisitos são basicamente local e magnitude.
QUALQUER TERREMOTO QUE OCORRA EM LOS

ANGELES É NOTÍCIA. SAINDO DA SEDE DO JORNAL,
QUANTO MAIS LONGE OCORRER O TERREMOTO,
MAIS SEVERO ELE PRECISA SER PARA SER
NOTICIADO.
Repare na imagem a seguir como o texto é basicamente o mesmo, mudando apenas a
magnitude, a data e a localização. No século passado, um professor na faculdade de
jornalismo costumava dizer que “o lide é um formulário que a gente preenche”. Apesar da
generalização simplificadora, o Quakebot prova que qualquer robô escreve um lide burocrático.
O texto completo desta postagem, de 11 de abril de 2021, tem mais seis parágrafos depois do
lide. O primeiro fala a que distância de grandes cidades californianas o terremoto ocorreu. O
segundo fala há quantos dias não ocorriam terremotos acima da magnitude 3. O terceiro conta
quantos terremotos de magnitude 3 e 4 ocorrem por ano na Califórnia, na média dos últimos
três anos. O quarto convida o leitor a contar ao USGS se aconteceu alguma coisa. Vale traduzir
um trecho importante:
USGS
Órgão do governo americano de serviços geológicos.
MESMO QUE VOCÊ NÃO TENHA SENTIDO ESTE

PEQUENO TERREMOTO, NUNCA SE SABE QUANDO
VIRÁ O BIG ONE. PREPARE-SE SEGUINDO NOSSO
GUIA DE PREPARO PARA TERREMOTOS EM CINCO
PASSOS E CONSTRUINDO SEU PRÓPRIO KIT DE
EMERGÊNCIA.
ESTA NOTÍCIA FOI GERADA AUTOMATICAMENTE

PELO QUAKEBOT, UM APLICATIVO
COMPUTADORIZADO QUE MONITORA OS ÚLTIMOS
TERREMOTOS DETECTADOS PELO USGS. UM EDITOR
DO TIMES REVISOU ESSE POST ANTES DE ELE SER
PUBLICADO. SE VOCÊ ESTIVER INTERESSADO EM
SABER MAIS SOBRE O SISTEMA, VISITE NOSSA LISTA
DE PERGUNTAS E RESPOSTAS FREQUENTES.
Fonte: Earthquake: Magnitude 3.1 quake near Ridgecrest, Calif. – Los Angeles Times
OS ALGORITMOS COMO PAUTA
Atualmente, embora os algoritmos sejam cada vez mais usados na sociedade, a Imprensa
ainda os cobre basicamente pela voz do vendedor. Uma pesquisa sobre algoritmos, publicada
em Portugal durante vários meses de 2021, aponta que os press-releases de empresas de
tecnologia são a principal fonte de notícias sobre algoritmos. Raramente mais de uma fonte é
citada nos textos.
 RESUMINDO
As empresas dizem o que querem sobre como seus algoritmos são maravilhosos e raramente
são questionadas por isso.
O PROBLEMA COM ESSA ABORDAGEM CRÉDULA É

QUE ALGORITMOS TÊM CONSEQUÊNCIAS.
Algumas das aplicações mais socialmente sensíveis do uso de algoritmos estão na área da
segurança, especialmente em aplicações de reconhecimento facial, que já são comuns no
Brasil. Estas são algumas notícias a respeito publicadas na imprensa brasileira:
“Dois homens foragidos da Justiça foram presos após serem flagrados por câmeras de
reconhecimento facial em Salvador. De acordo com a Secretaria de Segurança Pública da
Bahia (SSP-BA), um deles foi preso na manhã desta terça-feira (4). Ambos tinham mandados
de prisão em aberto por crimes relacionados ao tráfico de drogas. O homem preso nesta terça
foi reconhecido ao trafegar por um dos pontos monitorados pelas câmeras. Segundo a SSP-
BA, o equipamento apontou semelhança de 95%. O suspeito tinha mandado decretado pela 1ª
Vara Criminal, Júri e Execuções Penais de Irecê, cidade da região Sudoeste da Bahia.” (G1,
2021)
“A Prefeitura de Paulista, na Região Metropolitana do Recife, iniciou, nesta quarta-feira (7), a

implantação de internet grátis, câmeras de reconhecimento facial e monitoramento de placas
de carros. [...]O secretário Marcelo Menezes afirma que a implementação dos equipamentos é
um avanço significativo na segurança dos moradores. ‘Temos um banco de dados, então logo
que seja identificado qualquer pessoa que tenha cometido um delito perante as câmeras, a
central de monitoramentos será acionada, e as autoridades, Polícia Civil, Militar e Guarda Civil
serão acionadas para que seja feita a prisão da pessoa reconhecida’, detalhou” (FOLHA DE
PERNAMBUCO, 2021)
“O Governo Municipal de Penha instala mais uma unidade de totem tecnológico de
monitoramento em parceria com a Polícia Militar na Praia do Trapiche. Com essa instalação, a
cidade conta com duas áreas monitoradas em 360º graus. [...] Segundo o prefeito de Penha,
Aquiles da Costa, o equipamento tem a tecnologia de reconhecimento facial de suspeitos, a
vistoria da velocidade dos veículos que trafegam na região central e, através de um botão de
emergência, é possível o contato direto com a Polícia Militar local.” (JORNAL FOLHA DO
LITORAL, 2021)
Qual o problema? Um só: os 95% de precisão que esses textos vendem significam que uma a
cada 20 pessoas identificadas pode não ser quem se imagina que seja. Os motivos podem ser
diversos, variando da qualidade das fotos disponíveis no acervo para identificar a pessoa até a
calibragem dos algoritmos de reconhecimento facial.
EM 2021, FUNCIONÁRIOS DA AMAZON — UMA DAS

PRINCIPAIS BIG TECHS QUE INVESTIRAM NA
CRIAÇÃO DE ALGORITMOS DE RECONHECIMENTO
FACIAL — DENUNCIARAM QUE OS ALGORITMOS
ESTAVAM MAL CALIBRADOS PARA RECONHECER
PESSOAS NEGRAS (EL PAÍS, 2021). QUANTO MAIS
ESCURA FOSSE A PELE, MAIOR A CHANCE DE A
PESSOA SER CONFUNDIDA COM OUTRA.
Em outros países, há diversos casos de pessoas que, confundidas com suspeitos pelos
algoritmos do sistema criminal, foram à Justiça e venceram. Esses casos, porém, só têm
chegado à imprensa brasileira pelas agências de notícias, que não faz quase nenhuma
cobertura jornalística sobre o assunto. Sobretudo porque, caso haja processos movidos pelo
cidadão lesado pela tecnologia, o Judiciário brasileiro é lento e as primeiras sentenças podem
demorar anos até que saiam. Mas também há outras complexidades.
COMO INVESTIGAR ALGORITMOS?

Existem duas formas de entender como os algoritmos “pensam”.
DIRETA
A forma mais improvável é a direta, com acesso ao seu código-fonte. O código-fonte é a

programação dos passos do algoritmo: quais são os ingredientes, em que ordem são
aplicados, por quanto tempo bate, por quanto tempo fica no forno. Para tirar o máximo dessa
análise, é preciso ser um expert em computação, porque é preciso entender como os dados
são coletados, organizados, tratados.
QUANDO SE USA ALGORITMOS BASEADOS EM

APRENDIZADO DE MÁQUINA NÃO SUPERVISIONADO,
NEM QUEM ESCREVEU O PROGRAMA SABE AO
CERTO O PESO DE CADA FATOR NO PRODUTO FINAL,
POIS ELE MUDA DE ACORDO COM AS VARIAÇÕES
DOS DADOS, SEM QUE NINGUÉM POSSA VER O QUE
ACONTECE LÁ DENTRO. SÃO OS ALGORITMOS DE
“CAIXA-PRETA”, COMO CLASSIFICAM OS
ESPECIALISTAS, EM REFERÊNCIA À CÂMARA
ESCURA ONDE SE REVELAVAM FOTOGRAFIAS.
Mas, inicialmente, é preciso ter acesso ao código-fonte. Empresas comerciais tratam seus
algoritmos como segredos a sete chaves, tornando a prática quase inacessível. A abertura dos
algoritmos produzidos pelo poder público é uma questão ainda em fase de pacificação – na
França, órgãos públicos são obrigados a publicar uma lista dos algoritmos que usam e abrir
seus passos. Entretanto, essa ainda não é a praxe na maioria dos países. No Brasil, parte da
discussão do estabelecimento de marco regulatório das redes sociais passa por esse debate.
INDIRETA
A maneira indireta de investigar algoritmos acaba sendo a mais usada por pesquisadores e
também pode ser utilizada por jornalistas.
Para descobrir que o algoritmo do YouTube levava a uma espiral de radicalização a cada nova
indicação de vídeo, visando a manter o engajamento, a pesquisadora Zeynep Tufekci (2017)
acessou o site a partir de máquinas nunca antes usadas para ver o que acontecia.
Para constatar que o algoritmo da busca do Google atribuía o adjetivo “bonita” muito mais a
fotos de mulheres com biotipo europeu, pesquisadores da Universidade Federal de Minas
Gerais (ARAÚJO; MEIRA JUNIOR; ALMEIDA, 2016) fizeram buscas de imagens em várias
línguas, rasparam as imagens resultantes e verificaram o resultado.
Para compreender que o reconhecimento facial da Amazon não reconhecia rostos de pessoas
de pele muito escura, a pesquisadora Joy Buolamwini (2017) rodou testes com milhares de
imagens de rostos.
RASPAGEM DE DADOS
A raspagem de dados é uma coleta qualificada de dados, uma varredura com foco específico,
mas a partir de informações a princípio não organizadas em tabelas, planilhas etc. Informações
cuja coleta seria, teoricamente, manual, como dados em PDF, por exemplo, ou, neste caso, em
imagens.
Em 2020, a jornalista Julia Angwin lançou o primeiro site especializado na investigação

jornalística dos efeitos sociais dos algoritmos, o The Markup. Uma de suas editorias se chama
“Google, o Gigante”. Com base em uma das suas investigações, um grupo de defesa dos
direitos civis abriu processo exigindo uma auditoria dos critérios de equidade nos anúncios.
Havia um bloqueio para anúncios a vídeos marcados com a frase “Black Lives Matter” (“Vidas
negras importam”), que visava a evitar ação de trolls, mas não havia nenhuma restrição a
anúncios em vídeos marcados com a frase “White Lives Matter” (“Vidas brancas importam”),
criados em muitos casos por neonazistas, facilitando sua monetização.
O site descreve assim a sua missão:
TROLLS
No jargão da internet, trolls são pessoas que visam a desestabilizar discussões sadias ou
democráticas, em geral enviando mensagens provocativas e controversas em redes sociais,
que geram respostas irritadiças de outros membros e tiram o foco da discussão inicial e mais
importante.
THE MARKUP É UMA REDAÇÃO SEM FINS

LUCRATIVOS QUE INVESTIGA COMO INSTITUIÇÕES
PODEROSAS ESTÃO USANDO A TECNOLOGIA PARA
MUDAR NOSSA SOCIEDADE. SOMOS UM NOVO TIPO
DE ORGANIZAÇÃO DE MÍDIA, CONTANDO COM UMA
EQUIPE SEM PARALELO DE JORNALISTAS
QUANTITATIVOS QUE FAZEM INVESTIGAÇÕES
SIGNIFICATIVAS E GUIADAS POR DADOS.
NOSSA ABORDAGEM É CIENTÍFICA: CONSTRUÍMOS

CONJUNTOS DE DADOS INÉDITOS, BLINDAMOS
NOSSA APURAÇÃO E MOSTRAMOS NOSSO
TRABALHO. CHAMAMOS ISSO DE MÉTODO MARKUP.
SENDO UMA REDAÇÃO SEM FINS LUCRATIVOS,
NOSSO JORNALISMO EXISTE PARA SERVIR AO
PÚBLICO. E É POR ISSO QUE ADOTAMOS A
FILOSOFIA DE MOSTRAR OS BASTIDORES DO NOSSO
TRABALHO. SEMPRE QUE POSSÍVEL,
PUBLICAREMOS OS CONJUNTOS DE DADOS E O
CÓDIGO QUE USAMOS PARA NOSSAS
INVESTIGAÇÕES, BEM COMO UMA METODOLOGIA
DETALHADA DESCREVENDO OS DADOS, SUA
PROVENIÊNCIA E AS TÉCNICAS ESTATÍSTICAS
USADAS EM NOSSAS ANÁLISES.
(THE MARKUP, s.d. Tradução SOARES, 2021)
ALGORITMOS COMO SOLUÇÃO

Vamos reler e lembrar o que vimos até aqui, buscando recapitular em como isso transforma o
jornalismo.
Carregando conteúdo
O CASO DAS DOAÇÕES COM

RECONHECIMENTO FACIAL
No Brasil, o papel de questionar os algoritmos tem sido feito geralmente por ONGs e ativistas.
Em abril de 2021, a Central Única das Favelas (CUFA) começou a usar no Rio de Janeiro um
aplicativo com algoritmo de reconhecimento facial para identificar beneficiários de doações. Os
moradores de comunidades eram fotografados e seus rostos eram comparados a uma base de
dados que teria 2 milhões de faces. Nina da Hora, ativista dos direitos digitais, apresentadora
do podcast Ogunhê e estudante de Ciência da Computação na PUC-RJ, fez publicamente no
Twitter as perguntas certas. Após o debate em torno do tuíte dela, a CUFA suspendeu o uso
desse aplicativo
Marcelo Soares entrevistou Nina sobre esse caso, com exclusividade para este tema.
COMO VOCÊ FICOU SABENDO DO USO DO

APLICATIVO PELA CUFA PARA AUTENTICAR
BENEFICIÁRIOS DE DOAÇÕES E QUAL FOI SUA
REAÇÃO INICIAL?
Eu fiquei sabendo pelo Twitter, na divulgação deles, muita gente me marcou e eu não tinha
parado para entender o que realmente era. A primeira coisa que eu pensei foi: qual a
necessidade disso? Com algoritmos ou tecnologias digitais, qualquer solução demanda pensar
a necessidade. É uma necessidade de público-alvo ou é uma necessidade da sociedade? Nos
últimos três anos, venho visualizando que temos muito mais formas de repensar sobre o que
deveria ser público-alvo e o que deveria ser solução para a sociedade. Está difícil de separar
isso. Em algum momento, isso ficou tão presente, que ficou fácil as pessoas não pensarem nas
consequências para o todo, nas questões de inclusão. Os outros questionamentos que fiz,
muito ligados aos dados e à privacidade, também vêm desse estudo e reflexão.
SUA PARTICIPAÇÃO NO DEBATE SOBRE O

RECONHECIMENTO FACIAL FOI UM TUÍTE COM
PERGUNTAS CERTEIRAS. O QUE AS PESSOAS
DEVEM PERGUNTAR QUANDO INTERAGEM COM
ALGORITMOS?
Eu não queria saber o resultado final, não queria saber quantas pessoas eles conseguiram
evitar de receber o benefício indevidamente após o uso do reconhecimento facial. O processo
pode não influenciar o resultado como positivo ou negativo, mas pode enviesar como essa
tecnologia vai ser manuseada na sociedade. Tenho muita preocupação. Como cidadãos, temos
total poder para criticar essas tecnologias. Precisamos tirar da frente a ideia de que soluções
tecnológicas de algoritmo estão ligadas só ao resultado. Isso acaba nos viciando em querer
saber só o resultado, precisamos saber o processo.
Além da necessidade daquela solução, precisamos nos perguntar para onde está indo o que se
está compartilhando, armazenando. Não se trata apenas das respostas técnicas, mas
precisamos fazer a crítica para chegar a entender o processo. As perguntas, quando
questionamos o algoritmo, precisam estar ligadas ao processo, não ao resultado. Não pergunte
quantas pessoas serão fotografadas ou reconhecidas pelo algoritmo, pergunte quem vai ter
acesso a esses rostos. Quem são as empresas que vão receber isso como parte de um
contrato, uma parceria? Qual o nível de segurança dessa base de dados?
AS TECNOLOGIAS DE RECONHECIMENTO FACIAL,
ADOTADAS SOB O PRETEXTO DE AUMENTAR A
SEGURANÇA, VÊM SENDO CRITICADAS AO REDOR
NO MUNDO POR AUMENTAREM A CHANCE DE
INJUSTIÇAS. QUAL O CENÁRIO QUE VOCÊ VÊ NO
USO DESSA TECNOLOGIA?
Vejo um cenário total de caos. Atualmente, nós, como pessoas que criam e manuseiam
tecnologias que envolvem alguma tecnologia de dados, precisamos estar ligados se estamos
contemplando a sociedade ou se estamos contemplando quem nós entendemos como cliente.
Vamos começar a entrar numa complexidade de entendimento sobre quem é o público-alvo. Se
esse público é a sociedade, precisamos parar para pensar nas possíveis consequências
negativas que envolvem não só o público com que se está acostumado a lidar. No caso do
reconhecimento facial, não consigo visualizar que mesmo tendo aplicações positivas não se vá
chegar a usos negativos, porque uma coisa leva à outra. Usar essa tecnologia para algo bom
pode acabar legitimando também o uso negativo. Não podemos esquecer que a história
dessas tecnologias de vigilância, de biometria digital, começa com o propósito de proteger mais
a população. Mas olha no que esse propósito se tornou. Não podemos supor que a tecnologia
só tenha lados positivos. Quando a gente critica as consequências negativas da tecnologia
como o reconhecimento facial, conseguimos aprofundar o debate. Para mim, como mulher
negra da área da computação, lutar pelo banimento dessa tecnologia ajuda movimentos
negros, indígenas, LGBTQI+, pessoas com deficiência. São populações diretamente afetadas.
A IMPORTÂNCIA DA PROTEÇÃO DE DADOS

PESSOAIS
Se você chegou até aqui, já faz ideia das consequências do uso dos dados pessoais. Sem
transparência, mesmo dados obtidos legalmente podem levar a casos de discriminação, por
exemplo. Mas a proteção dos dados pessoais é muito maior do que isso. Ela precisa ser
garantida na obtenção, no armazenamento e na transparência sobre o uso.
NA DÉCADA PASSADA, VÁRIOS PAÍSES COMEÇARAM
A APROVAR LEIS QUE DISCIPLINAM O USO E
TRATAMENTO DE DADOS PESSOAIS. A MAIS FAMOSA
É A GDPR (GENERAL DATA PROTECTION
REGULATION) EUROPEIA.
NO BRASIL, ENTROU EM VIGOR A LEI GERAL DE

PROTEÇÃO DOS DADOS (LGPD), QUE VISA A
DISCIPLINAR O ASSUNTO NO PAÍS.
É POR ISSO QUE TODO SITE QUE VOCÊ ACESSA

PEDE SUA PERMISSÃO PARA ARMAZENAR COOKIES,
E TODA FARMÁCIA EM QUE VOCÊ VAI COMPRAR UM
ANTITÉRMICO PEDE SUA AUTORIZAÇÃO PARA USAR
SEU CPF E TUDO O MAIS QUE ELA DESCOBRIU
SOBRE VOCÊ QUANDO VOCÊ ACHAVA QUE ESTAVA
APENAS GANHANDO DESCONTOS.
“O pleno cumprimento da LGPD pressupõe que as organizações façam uma boa gestão de
riscos, isto é, mantenham boa documentação sobre suas bases de dados, façam mapeamento
dos riscos existentes e medidas para sua mitigação, elaborem planos de resposta a incidentes,
entre outras boas práticas”, afirmou Fernanda Campagnucci, diretora executiva da ONG Open
Knowledge Brasil, que tem se especializado em acompanhar o tema da proteção de dados
pessoais, em uma entrevista bastante completa à Controladoria-Geral da União (2021) sobre a
necessidade de monitorar a implementação da LGPD no Brasil.
Segundo ela, não deve haver conflito entre a proteção de dados pessoais e o direito
constitucional de acesso a informações públicas, de que falamos no tema sobre jornalismo de
dados. “O que pode haver — e que temos que tomar cuidado — são equívocos ou exageros na
interpretação da aplicação da LGPD nos casos em que há informação pessoal de interesse
público e que pode e deve ser divulgada. A própria LGPD faz essa previsão”, declarou
Campagnucci (2021).
Em outro artigo, escrito para a Associação Brasileira de Jornalismo Investigativo (ABRAJI,

2020), Campagnucci desenvolveu uma proposta de que cada vez mais precisamos não apenas
de jornalismo “de” dados como também de jornalismo “sobre” dados. Cada dia se torna mais
necessário aos jornalistas entender e explicar ao público como são tratados os dados que, na
prática, descrevem cada um de nós em nossas relações com o poder público e as empresas, e
esse é um desafio que mal começamos a tentar cumprir.
 BOA PRÁTICA
Uma prática interessante é pesquisar com seus colegas os cuidados que cada um toma para
proteger seus dados pessoais, verificando se (e por que razão) consideram o assunto
importante. E questione-se: quais informações você não gostaria que as pessoas
conhecessem sobre você? Que informações você não vê problema em abrir? Por quê?.
VERIFICANDO O APRENDIZADO
CONCLUSÃO
CONSIDERAÇÕES FINAIS
Para tratarmos de um assunto que muita gente ouve falar, mas poucos conhecem sem
generalizações, começamos pelos fundamentos: afinal o que é um algoritmo? Uma sequência
com um conjunto finito de possibilidades. Algoritmo é uma representação matemática da
observação da vida humana dessa sequência. O que temos de soma para além disso é
linguagem, detalhamentos das linguagens possíveis para adotamos isso. Depois, passamos a
notar que a programação, o mundo digital vive de linguagens. Essas linguagens podem ter
objetivos diversos. Com a evolução da tecnologia de processamento de dados e da
comunicação estamos experimentando uma revolução do uso de algoritmos. Eles servem para
novos tipos de marketing, de vinculação, de engajamento, mudando paradigmas históricos.
Nesse sentido, o que chamamos de jornalismo tem dois campos de observação: o que impacta
em seu próprio ofício, em termos de credibilidade, vozes, impactos do algoritmo sobre a própria
forma de fazer jornalismo, reforçando estereótipos, fazendo do jornalista passageiro da nova
dinâmica de informações. O outro prisma é a disputa, é sobre a transformação desses
processamentos, informações, em pauta, em um novo campo de levantamento de dados,
investigação que permita um novo conjunto de elaboração, de posicionamento.
Seja como for, o mais importante é perceber que é impossível não pensar em jornalismo diante
da nova dinâmica de dados, sem considerar os algoritmos. É necessário pensá-los
criticamente, por exemplo, conhecendo as denúncias do abuso das big techs.
Temos alguns pontos a recuperar e entender melhor. E, para isso, nada melhor do que
conversar um pouco mais com o jornalista Marcelo Soares.
 PODCAST
O jornalista Marcelo Soares retoma alguns pontos de suas lições.
AVALIAÇÃO DO TEMA:
REFERÊNCIAS
ARAÚJO, C. S.; MEIRA JUNIOR, W.; ALMEIDA, V. Identifying Stereotypes in the Online
Perception of Physical Attractiveness. Belo Horizonte: Universidade Federal de Minas
Gerais, 2016.
BERGER, L. Contágio: Por que as coisas pegam. Rio de Janeiro: Alta Books, 2020.
BRASIL. Lei Geral de Proteção de Dados Pessoais. Controladoria-Geral da União, 6 abr.

2021.
BUOLAMWINI, J. Como eu luto com o preconceito em algoritmos. TED Conferences:

TEDxBeacon Street, nov. 2016.
CAMPAGNUCCI, F. Jornalismo enfrentará encruzilhada entre transparência e proteção de

dados. ABRAJI, 15 dez. 2020.
MARTINS, L. Big Tech força redes sociais alternativas a adotarem moderação. Belo
Horizonte: El País, 22 mar. 2021.
EMPOLI, G. Os engenheiros do caos: Como as fake news, as teorias da conspiração e os

algoritmos estão sendo utilizados para disseminar ódio, medo e influenciar eleições. São Paulo:
Vestígio, 2019.
FOLHA DE PERNAMBUCO. Paulista inicia instalação de internet grátis e câmeras de

reconhecimento facial em praças. Portal Folha de Pernambuco, 7 abr. 2021.
G1. 2021. Foragidos da Justiça são presos após serem flagrados por sistema de
reconhecimento facial em Salvador. G1 Bahia, 4 maio 2021.
GANDOUR, R. Jornalismo em retração, poder em expansão: a segunda morte da opinião

pública. São Paulo: Summus, 2020.
O’REILLY, L. Netflix lifted the lid on how the algorithm that recommends you titles to
watch actually works. INSIDER Business, 26 fev. 2016.
JORNAL FOLHA DO LITORAL. Segurança Pública: Totem de Reconhecimento Facial é

instalado na Praia do Trapiche pela Prefeitura de Penha. 26 abr. 2021.
GUERRA, S.; OLIVEIRA, P. F.; MCDONNELL, R. Ciência de Dados com R – Introdução.

Instituto Brasileiro de Pesquisa e Análise de Dados – IBPAD, 2020.
LOS ANGELES TIMES. Earthquake: Magnitude 3.1 quake near Ridgecrest, Calif. Publicado
em: 11 abr. 2021.
MEYER, P. Os Jornais Podem Desaparecer? São Paulo: Contexto, 2004.
THE MARKUP. About us. 2021.

TUFEKCI, Z. Estamos criando uma distopia só para fazer as pessoas clicarem em
anúncios. TED Conferences, LLC, set. 2017.
EXPLORE+
Assista aos filmes Coded Bias, O Dilema das Redes, e Privacidade hackeada.
Leia o relatório Algorithmic Accountability: on the investigation of black boxes, de Nicholas

Diakopoulos, publicado no Columbia Journalism Review, em 3 de dezembro de 2014.
Leia os livros:
Algoritmos de Destruição em Massa, de C. O’Neil, da Editora Rua do Sabão, 2020;
Dominados pelos números: Do Facebook e Google às fake news, os algoritmos que

controlam nossa vida, de D. Sumpter, da editora Bertrand Brasil, 2020.
A máquina do ódio: Notas de uma repórter sobre fake news e violência digital, de P. C.
Mello, da Companhia das Letras, 2020.
CONTEUDISTA
Marcelo Soares
 CURRÍCULO LATTES

Algoritmos No Jornalismo

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Algoritmos No Jornalismo

Enviado por

Direitos autorais:

Formatos disponíveis

DESCRIÇÃO

Reconhecer os conceitos básicos, a lógica e a construção de algoritmos

Identificar o uso dos algoritmos no jornalismo

Vamos a uma boa dica:

Indicados para você:

Direção: Shalini Kantayya

Roteiro: Shalini Kantayya

O Dilema das Redes, 2020

Roteiro: Jeff Orlowski, Davis Coombe, Vickie Curtis

Privacidade hackeada, 2019

Direção: Karim Amer, Jehane Noujaim

Roteiro: Karim Amer, Pedro Kos, Erin Barnett

 Reconhecer os conceitos básicos, a lógica e a construção de algoritmos

O QUE SÃO OS ALGORITMOS E O QUE

ALGORITMOS SEM MEDO

Multiplica o quatro pelo cinco. Dá 20. Desce o zero, sobe dois.

Agora, a dezena. Comece escrevendo um zero embaixo da primeira casa.

Agora some os dois números do resultado: 100 + 750 = 850

Professores de matemática criativos em escolas mais modernas do que as de três décadas

Quebrar a casca na lateral da frigideira;

Colocar a casca no lixo;

Colocar manteiga na frigideira;

Utilizar uma espátula para virar o ovo;

colocar o ovo no óleo;

jogar a casca no prato, e colocar o ovo frito no lixo.

colocar o ovo na frigideira;

jogar manteiga por cima;

No caso dos algoritmos digitais, eles dependem de três partes principais:

Dados para alimentar esse modelo

Uma definição de sucesso

Vamos entender o que essas partes significam?

De todos os algoritmos utilizados atualmente em serviços digitais, talvez os mais famosos

COMO SE MATEMATIZA ISSO?

1. Homem de Ferro + Hulk

2. Homem de Ferro + Homem de Ferro 2

3. Homem de Ferro + Thor

4. Homem de Ferro + Capitão América

5. Homem de Ferro + Os Vingadores

6. Hulk + Homem de Ferro 2

8. Hulk + Capitão América

10. Homem de Ferro 2 + Thor

11. Homem de Ferro 2 + Capitão América

12. Homem de Ferro 2 + Os Vingadores

13. Thor + Capitão América

14. Thor + Os Vingadores

15. Capitão América + Os Vingadores

O modelo matemático é codificado por programadores em instruções de programação, não

POR ISSO, MUITAS VEZES, COMPARAMOS

Entre as linguagens mais utilizadas atualmente para a programação de algoritmos estão R e

Segundo o Instituto Brasileiro de Pesquisa e Análise de Dados (2020), R é uma a linguagem de

É uma linguagem de programação multiplataforma utilizada para as mais diversas aplicações

Geralmente, estamos falando de dinheiro. Mas nem sempre.

UMA FRASE FAMOSA DA HISTÓRIA DA PUBLICIDADE

É o famoso engajamento, ou seja, interação entre pessoas, perfis e conteúdo. Os algoritmos

Hitar é fazer sucesso ou alcançar o auge de um objetivo.

O primeiro S é de “Social Currency” (moeda de troca social). As pessoas comentam e

O segundo S é de “Stories” (histórias). Somos seres sociais e gostamos de gente. A história

ESSES FATORES INTERAGEM ENTRE SI E SE

Uma experiência: em 2018, coletei informações de posts do Facebook sobre a eleição, da

Gráfico elaborado por Marcelo Soares

ESPERA. EU ALIMENTAR UM PADRÃO?

O caso mais conhecido é o da controvérsia em torno da empresa Cambridge Analytica, que