UOL - O melhor conteúdo
Lupa
10 lições jornalísticas na era algorítmica: o método científico como guia
30.05.2023 - 17h51
Rio de Janeiro - RJ

Este artigo foi publicado originalmente no NiemanLab e foi republicado numa parceria com o centro de pesquisas da Universidade de Harvard sob a licença Creative Commons Attribution-NonCommercial-NoDerivatives.


Julia Angwin
A jornalista Julia Angwin anunciou em fevereiro sua saída do "The Markup", o site de jornalismo de dados que ela co-fundou em 2018. Esta é a mensagem que ela enviou aos leitores do site, destacando as lições que aprendeu no comando do portal durante a meia década em que esteve. O texto mostra a importância do método científico na prática do próprio jornalismo, um dos pilares da Lupa. 

"Lamento informar que esta é minha última mensagem para vocês. Depois de fundar o "The Markup" há cinco anos, estou deixando esta redação para seguir outros projetos. Foi uma honra me corresponder com todos vocês, queridos leitores, e sinto-me muito honrada por todos que apoiaram meu projeto. Por favor, mantenham contato comigo através do Twitter, Mastodon ou minha newsletter pessoal. Antes de partir, gostaria de dividir com vocês as lições que aprendi construindo uma redação que integra engenheiros e jornalistas e busca utilizar um novo modelo para a prática de um jornalismo de responsabilidades: o método científico.
Eu fundei o "The Markup" com a ideia de que brigar por conceitos como “objetividade” ou “justiça” pode levar a falsos equivalentes. Uma abordagem melhor, acredito, é que os jornalistas busquem uma hipótese e depois reúnam evidências para testá-la.

No "The Markup", fomos pioneiros em uma série de métodos inspirados na metodologia científica que usavam automação e poder computacional para turbinar nosso jornalismo. Refletindo sobre esse trabalho, descrevo 10 das lições mais importantes que aprendi usando essa nova abordagem.

Julia Angwin, co-fundadora do The Markup, sobre o valor do método científico como guia para produzir jornalismo no mundo atual

1. Importante é diferente de secreto
Em um mundo com recursos limitados, escolher um assunto para investigar é a decisão mais importante que uma redação jornalística toma. No "The Markup", desenvolvemos uma lista de apurações investigativas que os repórteres preenchiam antes de entrar numa história. O topo da lista de verificação não era ocupado por alguma novidade ou ineditismo, mas pela escala — quantas pessoas foram afetadas pelo problema que estávamos investigando? Em outras palavras, optamos por abordar coisas que eram importantes, mas não secretas ou inéditas.
Por exemplo, qualquer pessoa que usa o Google provavelmente já notou que a ferramenta ocupa grande parte da página de resultados da pesquisa com seus próprios interesses comerciais. No entanto, decidimos investir quase um ano para quantificar o quanto o Google estava promovendo seus próprios produtos por meio de links patrocinados/anúncios, porque a qualidade dos resultados de pesquisa do Google afeta quase todo mundo.
Esse tipo de trabalho tem um impacto. A União Europeia já aprovou uma lei que proíbe as plataformas tecnológicas de exercerem esse tipo de auto preferência nas buscas. E há legislação tramitando no Congresso dos EUA prevendo fazer o mesmo.
2. Primeiro hipótese, depois dados 
É extremamente tentador para jornalistas orientados por dados entrar em uma base em busca de uma história, mas essa quase nunca é uma boa maneira de trazer a responsabilidade ao poder público ou aos poderosos. Em vez disso, geralmente essa prática resulta no que eu costumo chamar de histórias do tipo: “Ah, isso é interessante”. As melhores histórias que avaliam o nível de prestação de contas e transparência, baseadas em dados ou não, começam com uma dica ou um palpite, que você pauta e desenvolve em uma hipótese que pode ser testada. 
As hipóteses devem ser elaboradas com cuidado. A afirmação “Facebook é irremediavelmente ruim” não é uma hipótese testável. É uma tese interessante. Uma hipótese é algo comprovável, na linha: o Facebook não cumpriu sua promessa de parar de recomendar grupos políticos durante a eleição presidencial dos Estados Unidos. (nós verificamos; isso não foi feito).
3. Dados são políticos
Os dados são poderosos. Quem os recolhe tem o poder de decidir o que é destacável e o que é ignorado. Pessoas e instituições que têm dinheiro para construir grandes conjuntos de dados raramente têm qualquer vontade de reunir informações que possam ser usadas para desafiar o seu poder. 
É por isso que nós, jornalistas, muitas vezes precisamos coletar nossos próprios dados e foi por isso que ajudei a construir uma redação que tinha o talento de engenharia e o conhecimento em ciências sociais necessários para coletar dados originais em grande escala.
4. Escolha o tamanho daquilo com o que vai trabalhar (faça um corte)

Os dias em que os jornalistas podiam entrevistar três pessoas em um jantar e declarar que o que foi ouvido caracterizava uma tendência, felizmente acabaram. O público está exigindo evidências mais persuasivas da mídia.

Julia Angwin, co-fundadora do The Markup, sobre o que se espera do conteúdo jornalístico

Ao mesmo tempo, porém, nem toda prova requer big data. Foi necessário apenas um documento secreto de um tribunal, fornecido pelo ex-analista da CIA e fonte Edward Snowden, para provar que as agências de inteligência dos EUA estavam coletando secretamente os registros de chamadas de todos os americanos. 
A beleza da estatística é que, mesmo quando você está examinando um volume muito grande de dados, geralmente precisa apenas de uma amostra relativamente pequena para provar o seu ponto de vista. Quando queríamos investigar os algoritmos de recomendação do Facebook, o repórter Surya Mattu reuniu um grupo de mais de 1.000 pessoas que compartilharam seus dados do Facebook conosco. Embora tenha sido uma gota no oceano de mais de dois bilhões de usuários do Facebook, ainda era uma amostra representativa para testar algumas hipóteses sobre o caso.
Trecho do artigo original, publicado pelo Nieman Lab, em fevereiro de 2023
5. Abrace as probabilidades
Se você tiver sorte, às vezes um conjunto de dados revela a verdade sem que você precise fazer nenhuma matemática difícil. Mas para grandes conjuntos de dados, as estatísticas geralmente são a melhor maneira de extrair significados daqueles números. Isso pode significar abraçar algumas descobertas probabilísticas que soam confusas. 
Considere nossa investigação sobre como a Amazon colocou suas próprias marcas no topo dos resultados de pesquisa de seu site de e-commerce. Nós revistamos e mineramos milhares de resultados de pesquisas e descobrimos que a Amazon desproporcionalmente deu a suas marcas o primeiro lugar no topo das respostas: as marcas e os produtos exclusivos da Amazon eram apenas 5,8% dos produtos que apareciam em nossa amostra, mas, quando apareciam,  eles ficavam em primeiro lugar em 19,5% das vezes. 
O problema era que as proporções, sozinhas, não diziam se a Amazon ganhou aquele lugar de forma justa. Talvez seus produtos fossem realmente melhores do que todos os outros? Para ir mais fundo, queríamos ver como as marcas da Amazon se saíam comparadas com o desempenho de produtos com alta avaliação dos clientes (por estrelas) ou com grande número de avaliações.
Para fazer isso, o jornalista investigativo de dados Leon Yin usou uma técnica estatística chamada análise de floresta aleatória que lhe permitiu identificar que ser uma marca da Amazon era o fator mais importante para prever se um produto ganharia o primeiro lugar - muito mais do que quaisquer outros fatores potenciais combinados. As probabilidades - embora fossem um pouco complicadas de explicar - tornaram nossa descoberta muito mais robusta.
6. Sim, você precisa de uma narrativa
Os dados são necessários, mas não suficientes para persuadir os leitores. Os seres humanos estão programados para contar, compartilhar e lembrar histórias. A descoberta estatística é o que é conhecido no jornalismo como o “nut graf” da história, ou seja, aquele parágrafo que resume bem o que vai ser explicado detalhadamente. Você ainda precisa de uma voz humana para ser a espinha dorsal da narrativa. É aqui que as habilidades de reportagem old school de bater em portas e entrevistar toneladas de pessoas ainda são incrivelmente valiosas. É onde a escolha de palavras e editores talentosos fazem toda a diferença na elaboração de um artigo atraente.
7. Ser especialista importa
Jornalistas são generalistas. Mesmo setoristas como eu, que cobrem um único tópico — tecnologia — há décadas precisam mergulhar em novos tópicos diariamente. É por isso que acredito em buscar análises de experts em trabalhos estatísticos. Ao longo dos anos, desenvolvi um processo semelhante ao da revisão acadêmica por pares, no qual compartilho minhas metodologias e achados com estatísticos e especialistas com domínio em qualquer campo sobre o qual estiver escrevendo. 
Nunca compartilho o artigo pronto antes da publicação - o que seria uma ofensa passível de demissão em muitas redações. Mas compartilhar a metodologia estatística me permite proteger meu trabalho e encontrar erros junto a especialistas. Ninguém é mais incentivado a encontrar erros do que o sujeito que é objeto de uma investigação. Então, no "The Markup", costumamos  compartilhar a metodologia que nos permitiu chegar às conclusões da reportagem com os objetos das matérias. Compartilhamos dados, códigos e análises com as pessoas antes da publicação em um processo que chamo de “revisão de adversário”. Isso lhes dá a oportunidade de se envolver com o trabalho de forma significativa e fornecer uma resposta ponderada.
8. A objetividade está morta. vida longa às limitaçÕES
Uma das melhores coisas de usar o método científico como guia é que ele nos leva além dos debates intermináveis sobre se o jornalismo é “justo” ou “objetivo”. 
Em vez de focar na justiça, é melhor focar no que você sabe e no que não sabe. Quando relatou sobre o viés oculto nos algoritmos que aprovam hipotecas no mercado financeiro, o repórter Emmanuel Martinez não conseguiu obter as pontuações de crédito dos candidatos porque as instituições não as divulgam. Então ele destacou a ausência das avaliações de crédito na seção de limitações de sua metodologia. Mas a sua análise ainda era robusta o suficiente para ser citada por três agências federais ao anunciar um novo plano para combater a discriminação de hipotecas com base em vieses na análise de crédito.
9. Mostre seu trabalho
Os jornalistas possuem hoje um problema de confiança. Agora que todos no mundo podem publicar, os jornalistas devem trabalhar mais para provar que sua versão da verdade é  mais confiável. Descobri que mostrar com transparência meu trabalho — compartilhar conjuntos de dados inteiros, o código usado para analisar os dados e uma metodologia extensa — gera confiança nos leitores. Como um bônus adicional, as metodologias geralmente obtêm mais tráfego no site ao longo do tempo do que os artigos narrativos.
10. Nunca desista
Os jornalistas estão em desvantagem. Há seis profissionais de relações públicas para cada jornalista nos Estados Unidos, de acordo com o Bureau of Labor Statistics (o IBGE deles que trata de trabalho e emprego). Isso significa que temos que usar todas as ferramentas possíveis à nossa disposição para fiscalizar o poder. Uma maneira de fazer isso é construir ferramentas que permitam que nosso trabalho continue além do dia em que o artigo foi publicado.
Considere o scanner de privacidade forense em tempo real, Blacklight, que Surya Mattu construiu no "The Markup". Ele executa uma série de testes de privacidade em tempo real em qualquer site. Qualquer repórter pode usar o Blacklight sempre que houver uma notícia relacionada à privacidade. A ProPublica, por exemplo, usou recentemente o Blacklight para revelar que farmácias on-line que vendem pílulas abortivas estavam compartilhando dados confidenciais com o Google e outros parceiros da plataforma.
Vou continuar a perseguir esses princípios em meus próximos projetos. Obrigado por compartilhar a jornada comigo. Foi uma honra.
Clique aqui para ver como a Lupa faz suas checagens e acessar a política de transparência
A Lupa faz parte do
The trust project
International Fact-Checking Network
A Agência Lupa é membro verificado da International Fact-checking Network (IFCN). Cumpre os cinco princípios éticos estabelecidos pela rede de checadores e passa por auditorias independentes todos os anos.
A Lupa está infringindo esse código? FALE COM A IFCN
Tipo de Conteúdo: Artigos
Copyright Lupa. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização.
Women Owned
Assine nossa newsletter
sobre desinformação
Acompanhe nossas redes
Lupa © 2025 Todos os direitos reservados
Feito por
Dex01
Meza Digital