William Bonner não chamou Lula e Alckmin de ladrões; áudio foi manipulado

O apresentador do Jornal Nacional William Bonner não chamou o candidato à Presidência pelo PT, Luiz Inácio Lula da Silva, e seu vice, Geraldo Alckmin, de 'ladrões', ao contrário do que mostra um vídeo compartilhado nas redes. A sequência, que acumula mais de 3 milhões de visualizações desde 22 de julho de 2022, foi alvo de um deepfake, ou seja, uma manipulação com ferramentas de inteligência artificial que faz com que pessoas pareçam dizer ou fazer coisas que nunca fizeram.

O vídeo de 14 segundos começa com uma tela preta com os dizeres 'O encontro de dois bandidos' e emojis de risada. Em seguida, vê-se a abertura do Jornal Nacional, da TV Globo, com a narração de William Bonner repetindo essa frase. A gravação, então, corta para imagens de Lula e Alckmin se abraçando, enquanto o jornalista parece falar: 'Perdão, imagem errada. A imagem seria de outro ladrão, digo, de um ladrão de verdade'.

O conteúdo circula no TikTok (1, 2), Kwai (1, 2), Twitter (1, 2) e Facebook.

Deepfake de áudio

Procurado pelo Comprova, projeto de verificação colaborativa do qual o AFP Checamos faz parte, o jornalista e produtor de deepfakes humorísticas Bruno Sartori explicou que a voz atribuída a Bonner foi produzida a partir da técnica Text to Speech (TTS), que gera áudios sinteticamente a partir de um conteúdo em texto.

O deepfake é uma tecnologia que manipula áudio e vídeos por meio de ferramentas de inteligência artificial.

Sartori exemplificou ainda que a técnica utilizada pelo autor do vídeo analisado foi similar à que ele usou em um conteúdo com a voz da ex-presidente Dilma Rousseff. 'A partir de um banco com dezenas de áudios do William Bonner falando, o computador gera um novo áudio, do zero, baseado no que foi escrito em texto', acrescentou.

Ainda de acordo com Sartori, já existem sites disponíveis ao público capazes de produzir áudios sintéticos de pessoas famosas a partir de conteúdos em texto.

O cientista da computação Anderson de Rezende Rocha, diretor do Instituto de Computação da Unicamp, explica que as falsificações já existem há bastante tempo, a grande mudança é que agora esses conteúdos são criados por inteligência artificial, e não por um ser humano.

'A inteligência artificial permite que você consiga criar falsificações sem precisar da supervisão de um humano, que é substituído por uma técnica chamada 'generative adversarial network' (rede adversarial regenerativa, uma rede de inteligência artificial). Essa rede normalmente tem muitas camadas e parâmetros, e justamente daí sai o nome 'deep' . 'Deepfake' então vem da criação de conteúdo a partir de redes desse tipo, tanto para áudio quanto para vídeo e imagem', assinala.

Esse texto faz parte do Projeto Comprova. Participaram jornalistas da revista piauí e d'O Plural. O material foi adaptado pelo AFP Checamos.

O "Beabá da Política"

A série Beabá da Política reuniu as principais dúvidas sobre eleições em 22 vídeos e reportagens que respondem essas perguntas de forma direta e fácil de entender. Uma demanda cada vez maior, principalmente entre o eleitorado brasileiro mais jovem. As reportagens estão disponíveis no site do Estado de Minas e no Portal Uai e os vídeos em nossos perfis no TikTok, Instagram, Kwai e YouTube.

Jornal Estado de Minas

Leia Mais

Deepfake de áudio

O "Beabá da Política"