Escolar Documentos
Profissional Documentos
Cultura Documentos
A lógica dos algoritmos, os conceitos básicos, o impacto de sua utilização na vida cotidiana,
especificamente no jornalismo de dados.
PROPÓSITO
Compreender a lógica básica dos algoritmos, principalmente quando articulados às tecnologias
computacionais, dá ao jornalista no século XXI acesso a ferramentas poderosas de
investigação e análise.
OBJETIVOS
MÓDULO 1
MÓDULO 2
INTRODUÇÃO
Você já ouviu falar muito em algoritmos? Essa palavra virou mais uma daquelas que muitas
pessoas utilizam, mas poucos efetivamente sabem o que significa, e mais, como eles
impactam o nosso cotidiano. Isso é justificado pela variedade de contextos em que aparece.
Ouve-se falar em algoritmos que decidem a ordem do que você vai ver nas suas redes sociais,
algoritmos que moldam opiniões, que protegem passageiras de carros chamados por
aplicativos, algoritmos racistas e machistas, além de muitas outras atribuições.
Um algoritmo pode ser usado para, de acordo com o seu gosto, com o que você já consumiu e
filmes que viu, fazer a recomendação de outros filmes.
Há uma safra recente de documentários sobre o assunto. Vale buscá-los para conhecer ainda
mais esse universo.
ALGORÍTIMO
REDES
INFLUÊNCIA
O streaming, um serviço que oferece o acesso à mídia de forma direta sem armazenamento
intermediário, é um bom exemplo. Se você buscar pelo primeiro filme a seguir, é possível que o
algoritmo sugira os dois outros filmes que têm conteúdo relacionado.
Dessa forma:
Documentário
Documentário
Direção: Jeff Orlowski
Documentário
MÓDULO 1
Carregando conteúdo
Algoritmos são uma sequência de instruções que visam a alcançar um objetivo desejado.
Qualquer criança aprende a trabalhar com algoritmos desde a escola. Não acredita?
25
X 34
???
Pense em como você fazia contas de multiplicar com lápis e papel: 25 x 34. Ao menos nos
anos 1980, era assim que as escolas ensinavam.
2
25
X 34
100
Multiplica o quatro pelo dois. Dá oito. Soma os dois que subiram antes. Dá dez. Como não há
mais nenhuma casa, pode escrever o dez inteiro.
2
25
X 34
100
0
1
25
X 34
100
50
Multiplica o três pelo cinco. Dá quinze. Desce o cinco para a segunda casa, uma antes do final,
e sobe um.
Multiplica o três pelo dois. Dá seis. Soma aquele um que subiu, dá sete. Desce isso.
1
25
X 34
100
750
100
+750
850
RESUMINDO
Esse professores mais modernos empregam algoritmos mais eficientes, que “rodam” mais
rápido na cabeça do aluno.
Pense em uma receita de bolo, que também é um algoritmo. Existe uma ordem mais ou menos
certa de passos a seguir. Além disso, não adianta colocar os ingredientes no forno antes de
colocar a farinha. (Embora, em algumas receitas, seja uma questão de preferência acrescentar
o leite antes ou depois da farinha.)
MÃO NA MASSA
Está com dúvida? Tente descrever algoritmos que mostrem o passo a passo necessário para
cumprir a tarefas de fritar um ovo:
ALGORITMO A
Abrir a geladeira;
Pegar um ovo;
Levar à frigideira;
Abrir o ovo;
Acender o fogo;
Retirar o ovo;
Apagar o fogo.
ALGORITMO B
Pegar a frigideira;
colocar no fogão;
pegar manteiga;
ir à geladeira;
pegar o ovo;
quebrar em um copo;
acender o fogo;
desligar o fogo;
ALGORITMO C
Acender o fogo;
apagar o fogo;
colocar a frigideira;
correr na geladeira;
pegar o ovo;
quebrar a casca.
Quem vai comer ovo frito? Seu fogão tem quatro ou seis bocas? Não importa, mas você sabe
pela sequência finita o resultado esperado: qual ovo vai ser comestível e qual não vai.
Agora é a sua vez. Você pode tentar fazer o mesmo com as seguintes ações:
Dirigir um carro para, saindo da garagem de casa, dar a volta na quadra.
Encontrar uma palavra no dicionário. (Bônus: pesquise como esse algoritmo é codificado por
programadores).
Mas isso não parece tão perigoso, ou fascinante. Lembre-se de que a Matemática é a
interpretação do mundo pelos homens. Elementos que fazem parte de nosso cotidiano, o
conjunto de eventos possíveis, estabelecimento de sequências... tudo isso é a percepção do
que devemos fazer.
O mundo digital reproduz a mesma lógica. Mudam as bases numéricas, as formas, mas o
princípio será reproduzido. De agora em diante vamos ao mundo digital, afinal, ainda
precisamos explicar como o mundo digital e a aplicação dos algoritmos modificaram para
sempre as relações humanas e o jornalismo em especial.
1
Um modelo matemático
2
3
O MODELO MATEMÁTICO
Os modelos matemáticos buscam descrever aspectos do mundo real em termos calculáveis,
da maneira mais fiel possível. A descrição nunca será perfeita, porque vários aspectos da
realidade não cabem em uma fórmula matemática. O que ela precisa é descrever como se
comporta, em média, a maioria dos casos.
Uma classe de modelo matemático que qualquer adolescente aprende a aplicar na escola é o
das leis do movimento de Newton, nas aulas de Física. Lembra?
Para calcular a velocidade, você divide a distância pelo tempo
Para calcular a aceleração, você divide a variação da velocidade pela variação do tempo.
Para calcular a força, você multiplica a massa pela aceleração.
São modelos matemáticos simples, elegantes e que funcionam para a maioria dos casos.
Em 2016, segundo o site Business Insider, portal de notícias especializado nas questões de
tecnologias globais, as empresas de streaming empregavam cerca de mil programadores
apenas para aperfeiçoar o modelo matemático que oferece coisas para o assinante acessar em
seguida.
VOCÊ SABIA
Todo ano são realizados centenas de testes, direcionados a 300 mil usuários para ver o que
pode ser melhorado. Esses assinantes dificilmente sabem que são cobaias.
Há alguns anos, essas empresas também faziam desafios de programação para que pessoas
externas ajudassem a melhorar seu algoritmo. As melhores soluções eram contempladas com
vultosos prêmios em dinheiro.
Essas recomendações, como as da Netflix, são altamente personalizadas, até certo ponto.
Partem do conhecimento de tudo o que você e todos os outros assinantes assistiram. Então, o
modelo matemático leva em conta o acervo de filmes vistos para determinar quais gostos são
parecidos com o seu.
EXEMPLO
Quem assiste a muitos filmes de super-heróis receberá mais e mais recomendações para
assistir a filmes de super-heróis. Mais ainda: teoricamente, alguém que assistisse a mais filmes
da Marvel (Homem-Aranha, Thor, Os Vingadores etc.) tenderia a receber dicas para assistir a
filmes da Marvel com mais frequência do que a filmes do Disney Channel (Batman x
Superman, Liga da Justiça etc.).
Ao mesmo tempo, eles não têm interesse em personalizar demais as recomendações porque
isso dificultaria ao assinante a descoberta de opções que ainda não conhece e que talvez
possa gostar.
Para identificar perfis de gostos semelhantes, é possível calcular pares de filmes. Digamos: se
você assistiu a todos os seis filmes da primeira fase do Universo Cinemático da Marvel, é
possível formar 15 pares entre eles (se são seis filmes, calculamos 5+4+3+2+1):
7. Hulk + Thor
9. Hulk + Os Vingadores
Se alguém assistiu a apenas cinco deles, essa pessoa assistiu a 10 pares de filmes (4+3+2+1),
deixando de lado todos os cinco pares destacados. O gosto dessa pessoa é 75% parecido com
o seu, então, é mais ou menos seguro dizer que pessoas com o gosto semelhante ao dela
também gostaram de Homem de Ferro 2.
COMENTÁRIO
A matemática usada para isso muitas vezes é bastante complexa. Caso não se importe em não
entender completamente algo que vai ler, porque é realmente difícil, um exemplo hipotético
está disponível no site Data Hackers, portal de ciência de dados que mostra tipos de sistema
de recomendação.
PYTHON
OS DADOS
As instruções de programação são aplicadas a ingredientes, no caso os dados, que são
capturados de diversas maneiras.
Ainda mantendo o exemplo dos algoritmos de recomendação de conteúdo, pense no seu feed
de redes sociais. Tantas pessoas e empresas participam das redes que seria impossível
mostrar em tempo real todo o conteúdo de todo mundo que alguém segue. Por isso, e visando
a manter as pessoas pelo máximo de tempo possível no site, as empresas do setor usam
algoritmos de recomendação. Eles buscam com isso mostrar coisas que tenham a maior
probabilidade de manter você no site. É por isso que você deixa de ver postagens de amigos
com quem parou de interagir, mas, de repente, esses amigos reaparecem em sua timeline com
uma foto de um casamento, filho ou morte na família, que teve muitas e muitas curtidas antes
de chegar até a sua tela.
VOCÊ SABIA
Durante todo o tempo que você passa navegando em redes sociais, cada clique seu é
mensurado. Se você clicou em um link, isso fica registrado. Se você curtiu um post, isso fica
registrado.
Ao longo do tempo, você deixou pistas suficientes para que os computadores centrais da rede
tenham um modelo matemático do que lhe interesse. Mas não é só com você, é com bilhões
de pessoas simultaneamente. Algumas deixam mais informações, outras menos. Se você vive
em uma cidade e interage muito com pessoas que consistentemente vivem em outra cidade,
mesmo que você não diga de onde é, deixou pistas suficientes para que o algoritmo calcule
que você mora longe da família.
Depois de coletada, essa informação pode ser considerada importante para anunciantes. Parte
do modelo de negócio das grandes empresas de tecnologia, as big techs, é a venda de
anúncios direcionados. Assim, digamos, uma empresa aérea pode, em setembro, colocar
anúncios na sua rede social favorita, direcionados a pessoas que moram longe da família,
visando a vender passagens antecipadas com desconto para quem vai visitar nas festas de fim
de ano. Mulheres jovens, casadas, mas sem filhos, em alguns casos, começam a receber
indicações de vídeos de bebês sem pesquisar por eles.
QUER TESTAR?
Entre na sua rede social favorita. Vá em “Configurações”. Ou, se houver uma opção mais
específica, clique em algo como “Configurações de anúncios”. Procure as referências a
categorias e interesses. Abra as duas e veja por que assuntos e pessoas a rede social sabe
que você se interessa. Lembre-se de que você pode remover ou desabilitar a coleta dessas
informações. Tome decisões a respeito. Observe as mais importantes e reflita como o
algoritmo chegou a essa conclusão.
UMA POLÊMICA IMPORTANTE É SOBRE O QUANTO
PODE SER FEITO E COLETADO E COMO ESSES
DADOS PODEM SER UTILIZADOS. ESSAS POLÊMICAS
ESTÃO NO CENTRO DOS DEBATES SOBRE BANCO
DE DADOS E REGULAMENTAÇÕES DO USO DESSAS
REDES.
A DEFINIÇÃO DE SUCESSO
Como avaliar o sucesso de um algoritmo? Quando se fala em sucesso, fala-se do objetivo final
buscado pelo algoritmo. Se ele oferece um produto de acordo com o que supõe ser a
preferência do consumidor, o sucesso é a compra; se o algoritmo oferece um conteúdo de
acordo com o que supõe ser a preferência do leitor, o sucesso é o clique. Quanto melhor o
algoritmo “acertar” a previsão sobre as preferências, maiores serão as taxas de compra e
clique, ou seja, mais pessoas terão o comportamento desejado.
As big techs investem milhões de dólares em tecnologia e lobby para conhecer o máximo
possível sobre você e oferecer anúncios mais certeiros a seus anunciantes, para que tenham
uma ideia melhor de qual dólar é jogado fora. Um anúncio de creme de barbear na televisão é
muito caro e mostrado a todos: homens, mulheres e crianças, mas nem todos fazem parte de
seu público-alvo.
Na publicidade baseada em algoritmos, produtos para barba podem ser oferecidos apenas a
homens de determinada faixa etária e até com determinadas preferências socioculturais — um
shampoo vegano para barba dificilmente apareceria em intervalos comerciais na TV, mas na
internet poderia ser um relativo sucesso entre homens jovens urbanos, com ao menos alguma
simpatia pela alimentação 100% vegetal.
BIG TECHS
As grandes cias de tecnologia do mundo, como Amazon, Netflix, Facebook, appel, Microsoft
entre outras.
ATENÇÃO
O importante para muitas empresas não é mais necessariamente ser o número um de toda
uma categoria de produtos, e sim ser o número um dentro do seu nicho de mercado específico.
Só que, para ter essas informações sobre cada consumidor, as redes sociais precisam manter
as pessoas engajadas com o conteúdo lá publicado, seja por amigos, seja por influenciadores,
seja por empresas. Conforme você manifesta interesse por alguns conteúdos e não por outros,
conforme você interage com grupos e pessoas, você está fornecendo dados para alimentar o
algoritmo.
Mas o que gera engajamento? O pesquisador Jonah Berger (2020) fez estudos importantes a
respeito. Coletando uma série de postagens com variados graus de sucesso, Berger propôs o
modelo “STEPPS” para explicar quais fatores atraem engajamento. Nem sempre eles atuam
sozinhos.
VIRALIZAR
Velocidade e volume de dispersão de uma mensagem (seja ela um meme, seja qualquer outra
imagem, como uma propaganda inclusive, ou ainda música, vídeo etc.), que alcança números
impressionantes.
HITAR
STEPPS
O nome é um trocadilho com a palavra steps em inglês, que significa “passos”, “fase” ou
“degrau”.
STEPPS
O T é de “Triggers” (gatilhos). As pessoas gostam de falar sobre aquilo que está sendo
falado. Quem não gosta de reality shows não tem com quem conversar no Brasil nas terças à
noite nos primeiros meses do ano, quando todos estão de olho no resultado de um programa
do tipo. Datas comemorativas são um gatilho de conversa importante, também.
STEPPS
O E é de “Emoção”. As pessoas falam e compartilham aquilo que mais mexe com elas.
Emoções extremas mexem de maneira extrema. O que é absurdamente engraçado ou
absolutamente odioso engaja muito mais do que aquilo que é apenas triste ou simpático.
STEPPS
O primeiro P é de “Público”. Quanto mais for mostrado, mais valor tem. A lógica do
engajamento se mede por compartilhamentos e curtidas. Para muitos, tanto faz se o
compartilhamento é por amor ou ódio. Quanto mais aparece, mais influência ganha.
STEPPS
O segundo P é de “Practical Value” (valor prático). Aquilo que tem utilidade para a vida. Por
exemplo: aprendi a fazer upgrade de componentes do meu computador usando vídeos do
YouTube, compartilhei no dia e agora estou aqui comentando com alunos que sequer estou
vendo.
STEPPS
DEPOIMENTO
1
Observe todos os posts de sua página favorita das suas mídias sociais nos últimos dias. Quais
foram os mais compartilhados? Quais são as reações predominantes, tirando o ? Por que
isso aconteceu? Registre, e faça isso com recorrência, de tempos em tempos.
Localize notícias sobre algum sistema que utiliza algoritmo, sem ser de recomendação de
conteúdo, e pesquise mais a respeito dele. O que você consegue inferir sobre quais são os
dados de que ele se alimenta e qual a proveniência? Quais são os possíveis problemas nessa
proveniência? O que você consegue inferir sobre quais são suas medidas de sucesso? O que
você consegue descobrir sobre o que seu modelo matemático leva em conta? Um site de
notícias oficial, uma página oficial governamental, algo em que tenha padrões mais
reconhecíveis.
Troque suas opiniões nas suas redes, veja as reações, perceba os interesses, note se você
acaba por alimentar algum padrão.
SIM, VOCÊ!!!!!!!!!!!
Não é por que está lendo sobre isso que não será influenciado pela programação, pelos
algoritmos. Todos somos, a diferença é passar a perceber.
OS ENGENHEIROS DO CAOS
Outro tipo de objetivo que os algoritmos podem ser calibrados para buscar é o de influenciar a
opinião pública em torno de determinadas ideias e pessoas.
VOCÊ SABIA
SAIBA MAIS
Marketing político é a aplicação de tudo o que se faz para vender, desde produtos à venda de
ideias, pessoas e políticas públicas. Natural que o marketing político adotasse imediatamente a
lógica do engajamento e das redes sociais. Por meio delas, a pessoa pública fala diretamente
ao seu público, sem mediadores. O crescimento desse fenômeno foi anotado por Ricardo
Gandour em seu livro Jornalismo em retração, poder em expansão (2020).
Era o “Movimento Cinco Estrelas”, que menos de uma década depois ascendeu ao poder na
Itália. Foi um dos primeiros dos grandes movimentos populistas modernos que se espalharam
primeiro pela Europa e depois pelo mundo, inspirando alguém como Steve Bannon a fazer o
mesmo nos Estados Unidos, apadrinhando um apresentador de reality shows. No Brasil,
fenômeno semelhante ocorreu com um político chamado a comentar temas polêmicos em
programas de auditório e de comédia.
A política italiana vinha em um ciclo de fracasso após fracasso desde que a Operação Mãos
Limpas inviabilizou boa parte da classe política. Políticos populistas, como o bilionário Silvio
Berlusconi, assumiram o poder e se envolveram em tantos casos de corrupção e escândalos
sexuais que conseguiram desmoralizar ainda mais a atividade política.
Giuliano da Empoli (2019) percebeu que o jogo político não envolvia mais unir as pessoas em
volta de um denominador comum. Mas, ao contrário, “inflamar as paixões do maior número
possível de grupelhos”. Avalia ele que, para conquistar uma maioria, muito grupos não buscam
mais convergir para o centro, e sim unir-se aos extremos. Empoli relata como o Movimento
Cinco Estrelas e os outros que o copiaram deram à luz a atual onda populista ao redor do
mundo, usando a lógica do engajamento em mídias sociais:
O jogo não consiste mais em unir as pessoas em torno de um denominador comum, mas, ao
contrário, em inflamar as paixões do maior número possível de grupelhos para, em seguida,
adicioná-los, mesmo à revelia. Para conquistar uma maioria, eles não vão convergir para o
centro, e sim unir-se aos extremos. Cultivando a cólera de cada um sem se preocupar com a
coerência do coletivo, o algoritmo dos engenheiros do caos dilui as antigas barreiras
ideológicas e rearticula o conflito político tendo como base uma simples oposição entre “o
povo” e “as elites”. No caso do Brexit, assim como nos casos de Trump e da Itália, o sucesso
dos nacional-populistas se mede pela capacidade de fazer explodir a cisão esquerda/direita
para captar os votos de todos os revoltados e furiosos, e não apenas dos fascistas.
Naturalmente, como as redes sociais, a nova propaganda se alimenta sobretudo de emoções
negativas, pois são essas que garantem a maior participação, daí o sucesso das fake news e
das teorias da conspiração. Mas tal tipo de comunicação possui também um lado festivo e
libertário, comumente desconhecido daqueles que enfatizam unicamente a faceta sombria do
Carnaval populista. O escárnio vem sendo, desde então, a ferramenta mais eficiente para
dissolver as hierarquias. Durante o Carnaval, um bom e libertador ataque de riso é capaz de
enterrar a ostentação do poder, suas regras e suas pretensões. Nada mais devastador para a
autoridade que o impertinente, que a transforma em objeto de ridículo.
Tudo isso tem consequências importantes para o dia a dia e para a vida pública, que vêm
sendo debatidas ao redor do mundo. Para que esse debate esclareça melhor o cidadão
comum, é preciso que ele esteja presente de maneira mais qualificada no jornalismo.
VERIFICANDO O APRENDIZADO
MÓDULO 2
Philip Meyer no livro Os jornais podem desaparecer?, escrito em 2004, aponta que o principal
patrimônio que restara às empresas jornalísticas, em meio à crise ainda bem mais incipiente do
modelo de negócio, era sua marca e sua credibilidade. Dez anos depois da publicação do livro,
a principal forma de acesso a notícias era por meio de redes sociais.
NAS REDES SOCIAIS, HÁ POUCA COISA QUE
PERMITA DIFERENCIAR ENTRE UM LINK DA FOLHA
DE S. PAULO, UM JORNAL TRADICIONAL, E OUTRO
JORNAL, COM NOME PARECIDO, MAS QUE, NA
VERDADE, É UM SITE QUE DIVULGA FAKE NEWS.
COM ISSO, AS MARCAS FORAM ERODIDAS TAMBÉM,
ESPECIALMENTE ENTRE LEITORES QUE NÃO SE
IMPORTAM COM A PROCEDÊNCIA DO CONTEÚDO.
ATENÇÃO
Para que as fake news ganhem espaço, é preciso antes criar os fake readers.
Ainda assim, existem pontos de contato muito importantes entre os algoritmos e o jornalismo.
Podemos pensá-los como bancas de revistas, repórteres e, cada dia mais, como pauta.
OS ALGORITMOS COMO BANCA DE REVISTAS
O Google News, serviço criado após o 11 de setembro de 2001, causou certa sensação
quando foi criado, porque destacava conteúdo sem a intermediação de editores. Toda a
seleção do que seria mostrado com destaque seria baseada em algoritmos. Isso acabou
criando conflitos com empresas jornalísticas ao redor do mundo.
Não se sabe quando ele virá, e os terremotos também não costumam marcar hora; terremotos,
porém, são sempre uma notícia importante no maior jornal local. Até há dez anos, era preciso
que houvesse alguém na redação de olho nos órgãos de monitoramento para saber se havia
elevação de atividade tectônica. Nos anos 1980, provavelmente, isso era feito por telefone.
Em 2011, repórteres do jornal criaram o Quakebot, um robô repórter que só cobre terremotos.
Trata-se de um algoritmo, que monitora o feed do United States Geological Survey (USGS), o
Serviço Geológico dos Estados Unidos, 24 horas por dia, para saber informações sobre
terremotos. A partir das informações desse feed, caso o terremoto cumpra alguns requisitos, é
gerado um texto. Esses requisitos são basicamente local e magnitude.
O texto completo desta postagem, de 11 de abril de 2021, tem mais seis parágrafos depois do
lide. O primeiro fala a que distância de grandes cidades californianas o terremoto ocorreu. O
segundo fala há quantos dias não ocorriam terremotos acima da magnitude 3. O terceiro conta
quantos terremotos de magnitude 3 e 4 ocorrem por ano na Califórnia, na média dos últimos
três anos. O quarto convida o leitor a contar ao USGS se aconteceu alguma coisa. Vale traduzir
um trecho importante:
USGS
Atualmente, embora os algoritmos sejam cada vez mais usados na sociedade, a Imprensa
ainda os cobre basicamente pela voz do vendedor. Uma pesquisa sobre algoritmos, publicada
em Portugal durante vários meses de 2021, aponta que os press-releases de empresas de
tecnologia são a principal fonte de notícias sobre algoritmos. Raramente mais de uma fonte é
citada nos textos.
RESUMINDO
As empresas dizem o que querem sobre como seus algoritmos são maravilhosos e raramente
são questionadas por isso.
Algumas das aplicações mais socialmente sensíveis do uso de algoritmos estão na área da
segurança, especialmente em aplicações de reconhecimento facial, que já são comuns no
Brasil. Estas são algumas notícias a respeito publicadas na imprensa brasileira:
“Dois homens foragidos da Justiça foram presos após serem flagrados por câmeras de
reconhecimento facial em Salvador. De acordo com a Secretaria de Segurança Pública da
Bahia (SSP-BA), um deles foi preso na manhã desta terça-feira (4). Ambos tinham mandados
de prisão em aberto por crimes relacionados ao tráfico de drogas. O homem preso nesta terça
foi reconhecido ao trafegar por um dos pontos monitorados pelas câmeras. Segundo a SSP-
BA, o equipamento apontou semelhança de 95%. O suspeito tinha mandado decretado pela 1ª
Vara Criminal, Júri e Execuções Penais de Irecê, cidade da região Sudoeste da Bahia.” (G1,
2021)
Qual o problema? Um só: os 95% de precisão que esses textos vendem significam que uma a
cada 20 pessoas identificadas pode não ser quem se imagina que seja. Os motivos podem ser
diversos, variando da qualidade das fotos disponíveis no acervo para identificar a pessoa até a
calibragem dos algoritmos de reconhecimento facial.
Em outros países, há diversos casos de pessoas que, confundidas com suspeitos pelos
algoritmos do sistema criminal, foram à Justiça e venceram. Esses casos, porém, só têm
chegado à imprensa brasileira pelas agências de notícias, que não faz quase nenhuma
cobertura jornalística sobre o assunto. Sobretudo porque, caso haja processos movidos pelo
cidadão lesado pela tecnologia, o Judiciário brasileiro é lento e as primeiras sentenças podem
demorar anos até que saiam. Mas também há outras complexidades.
DIRETA
Mas, inicialmente, é preciso ter acesso ao código-fonte. Empresas comerciais tratam seus
algoritmos como segredos a sete chaves, tornando a prática quase inacessível. A abertura dos
algoritmos produzidos pelo poder público é uma questão ainda em fase de pacificação – na
França, órgãos públicos são obrigados a publicar uma lista dos algoritmos que usam e abrir
seus passos. Entretanto, essa ainda não é a praxe na maioria dos países. No Brasil, parte da
discussão do estabelecimento de marco regulatório das redes sociais passa por esse debate.
INDIRETA
A maneira indireta de investigar algoritmos acaba sendo a mais usada por pesquisadores e
também pode ser utilizada por jornalistas.
Para descobrir que o algoritmo do YouTube levava a uma espiral de radicalização a cada nova
indicação de vídeo, visando a manter o engajamento, a pesquisadora Zeynep Tufekci (2017)
acessou o site a partir de máquinas nunca antes usadas para ver o que acontecia.
Para constatar que o algoritmo da busca do Google atribuía o adjetivo “bonita” muito mais a
fotos de mulheres com biotipo europeu, pesquisadores da Universidade Federal de Minas
Gerais (ARAÚJO; MEIRA JUNIOR; ALMEIDA, 2016) fizeram buscas de imagens em várias
línguas, rasparam as imagens resultantes e verificaram o resultado.
Para compreender que o reconhecimento facial da Amazon não reconhecia rostos de pessoas
de pele muito escura, a pesquisadora Joy Buolamwini (2017) rodou testes com milhares de
imagens de rostos.
RASPAGEM DE DADOS
A raspagem de dados é uma coleta qualificada de dados, uma varredura com foco específico,
mas a partir de informações a princípio não organizadas em tabelas, planilhas etc. Informações
cuja coleta seria, teoricamente, manual, como dados em PDF, por exemplo, ou, neste caso, em
imagens.
TROLLS
No jargão da internet, trolls são pessoas que visam a desestabilizar discussões sadias ou
democráticas, em geral enviando mensagens provocativas e controversas em redes sociais,
que geram respostas irritadiças de outros membros e tiram o foco da discussão inicial e mais
importante.
Marcelo Soares entrevistou Nina sobre esse caso, com exclusividade para este tema.
Eu não queria saber o resultado final, não queria saber quantas pessoas eles conseguiram
evitar de receber o benefício indevidamente após o uso do reconhecimento facial. O processo
pode não influenciar o resultado como positivo ou negativo, mas pode enviesar como essa
tecnologia vai ser manuseada na sociedade. Tenho muita preocupação. Como cidadãos, temos
total poder para criticar essas tecnologias. Precisamos tirar da frente a ideia de que soluções
tecnológicas de algoritmo estão ligadas só ao resultado. Isso acaba nos viciando em querer
saber só o resultado, precisamos saber o processo.
Além da necessidade daquela solução, precisamos nos perguntar para onde está indo o que se
está compartilhando, armazenando. Não se trata apenas das respostas técnicas, mas
precisamos fazer a crítica para chegar a entender o processo. As perguntas, quando
questionamos o algoritmo, precisam estar ligadas ao processo, não ao resultado. Não pergunte
quantas pessoas serão fotografadas ou reconhecidas pelo algoritmo, pergunte quem vai ter
acesso a esses rostos. Quem são as empresas que vão receber isso como parte de um
contrato, uma parceria? Qual o nível de segurança dessa base de dados?
AS TECNOLOGIAS DE RECONHECIMENTO FACIAL,
ADOTADAS SOB O PRETEXTO DE AUMENTAR A
SEGURANÇA, VÊM SENDO CRITICADAS AO REDOR
NO MUNDO POR AUMENTAREM A CHANCE DE
INJUSTIÇAS. QUAL O CENÁRIO QUE VOCÊ VÊ NO
USO DESSA TECNOLOGIA?
Vejo um cenário total de caos. Atualmente, nós, como pessoas que criam e manuseiam
tecnologias que envolvem alguma tecnologia de dados, precisamos estar ligados se estamos
contemplando a sociedade ou se estamos contemplando quem nós entendemos como cliente.
Vamos começar a entrar numa complexidade de entendimento sobre quem é o público-alvo. Se
esse público é a sociedade, precisamos parar para pensar nas possíveis consequências
negativas que envolvem não só o público com que se está acostumado a lidar. No caso do
reconhecimento facial, não consigo visualizar que mesmo tendo aplicações positivas não se vá
chegar a usos negativos, porque uma coisa leva à outra. Usar essa tecnologia para algo bom
pode acabar legitimando também o uso negativo. Não podemos esquecer que a história
dessas tecnologias de vigilância, de biometria digital, começa com o propósito de proteger mais
a população. Mas olha no que esse propósito se tornou. Não podemos supor que a tecnologia
só tenha lados positivos. Quando a gente critica as consequências negativas da tecnologia
como o reconhecimento facial, conseguimos aprofundar o debate. Para mim, como mulher
negra da área da computação, lutar pelo banimento dessa tecnologia ajuda movimentos
negros, indígenas, LGBTQI+, pessoas com deficiência. São populações diretamente afetadas.
“O pleno cumprimento da LGPD pressupõe que as organizações façam uma boa gestão de
riscos, isto é, mantenham boa documentação sobre suas bases de dados, façam mapeamento
dos riscos existentes e medidas para sua mitigação, elaborem planos de resposta a incidentes,
entre outras boas práticas”, afirmou Fernanda Campagnucci, diretora executiva da ONG Open
Knowledge Brasil, que tem se especializado em acompanhar o tema da proteção de dados
pessoais, em uma entrevista bastante completa à Controladoria-Geral da União (2021) sobre a
necessidade de monitorar a implementação da LGPD no Brasil.
Segundo ela, não deve haver conflito entre a proteção de dados pessoais e o direito
constitucional de acesso a informações públicas, de que falamos no tema sobre jornalismo de
dados. “O que pode haver — e que temos que tomar cuidado — são equívocos ou exageros na
interpretação da aplicação da LGPD nos casos em que há informação pessoal de interesse
público e que pode e deve ser divulgada. A própria LGPD faz essa previsão”, declarou
Campagnucci (2021).
BOA PRÁTICA
Uma prática interessante é pesquisar com seus colegas os cuidados que cada um toma para
proteger seus dados pessoais, verificando se (e por que razão) consideram o assunto
importante. E questione-se: quais informações você não gostaria que as pessoas
conhecessem sobre você? Que informações você não vê problema em abrir? Por quê?.
VERIFICANDO O APRENDIZADO
CONCLUSÃO
CONSIDERAÇÕES FINAIS
Para tratarmos de um assunto que muita gente ouve falar, mas poucos conhecem sem
generalizações, começamos pelos fundamentos: afinal o que é um algoritmo? Uma sequência
com um conjunto finito de possibilidades. Algoritmo é uma representação matemática da
observação da vida humana dessa sequência. O que temos de soma para além disso é
linguagem, detalhamentos das linguagens possíveis para adotamos isso. Depois, passamos a
notar que a programação, o mundo digital vive de linguagens. Essas linguagens podem ter
objetivos diversos. Com a evolução da tecnologia de processamento de dados e da
comunicação estamos experimentando uma revolução do uso de algoritmos. Eles servem para
novos tipos de marketing, de vinculação, de engajamento, mudando paradigmas históricos.
Nesse sentido, o que chamamos de jornalismo tem dois campos de observação: o que impacta
em seu próprio ofício, em termos de credibilidade, vozes, impactos do algoritmo sobre a própria
forma de fazer jornalismo, reforçando estereótipos, fazendo do jornalista passageiro da nova
dinâmica de informações. O outro prisma é a disputa, é sobre a transformação desses
processamentos, informações, em pauta, em um novo campo de levantamento de dados,
investigação que permita um novo conjunto de elaboração, de posicionamento.
Seja como for, o mais importante é perceber que é impossível não pensar em jornalismo diante
da nova dinâmica de dados, sem considerar os algoritmos. É necessário pensá-los
criticamente, por exemplo, conhecendo as denúncias do abuso das big techs.
Temos alguns pontos a recuperar e entender melhor. E, para isso, nada melhor do que
conversar um pouco mais com o jornalista Marcelo Soares.
PODCAST
O jornalista Marcelo Soares retoma alguns pontos de suas lições.
AVALIAÇÃO DO TEMA:
REFERÊNCIAS
ARAÚJO, C. S.; MEIRA JUNIOR, W.; ALMEIDA, V. Identifying Stereotypes in the Online
Perception of Physical Attractiveness. Belo Horizonte: Universidade Federal de Minas
Gerais, 2016.
BERGER, L. Contágio: Por que as coisas pegam. Rio de Janeiro: Alta Books, 2020.
MARTINS, L. Big Tech força redes sociais alternativas a adotarem moderação. Belo
Horizonte: El País, 22 mar. 2021.
G1. 2021. Foragidos da Justiça são presos após serem flagrados por sistema de
reconhecimento facial em Salvador. G1 Bahia, 4 maio 2021.
O’REILLY, L. Netflix lifted the lid on how the algorithm that recommends you titles to
watch actually works. INSIDER Business, 26 fev. 2016.
LOS ANGELES TIMES. Earthquake: Magnitude 3.1 quake near Ridgecrest, Calif. Publicado
em: 11 abr. 2021.
EXPLORE+
Assista aos filmes Coded Bias, O Dilema das Redes, e Privacidade hackeada.
Leia os livros:
A máquina do ódio: Notas de uma repórter sobre fake news e violência digital, de P. C.
Mello, da Companhia das Letras, 2020.
CONTEUDISTA
Marcelo Soares
CURRÍCULO LATTES