A empresa OpenAI lançou na segunda-feira (13/5) a versão mais recente do seu chatbot ChatGPT, de inteligência artificial.
O GPT-4o será aberto para todos os usuários do ChatGPT, incluindo não assinantes.
Esse modelo é mais rápido que os anteriores e foi programado para se assemelhar mais a humanos conversando — às vezes até mesmo com um tom de flerte em suas respostas aos usuários.
A nova versão consegue ler e discutir imagens, traduzir idiomas e identificar emoções a partir de expressões visuais. O robô também possui uma memória para recuperar perguntas anteriores.
O GPT-4o pode ser interrompido durante as suas respostas e a conversa flui com maior facilidade — não existe demora entre se fazer uma pergunta e receber uma resposta.
Falhas
Durante uma demonstração ao vivo usando a versão de voz do GPT-4o, o robô deu sugestões sobre como resolver uma equação simples escrita em um pedaço de papel — em vez de simplesmente resolvê-la. O novo ChatGPT analisou alguns códigos de computador, traduzindo entre italiano e inglês e interpretou as emoções em uma selfie de um homem que aparecia sorrindo.
Com uma calorosa voz feminina de sotaque americano, o GPT-4o cumprimentou as pessoas na demonstração, perguntando como elas estavam. Ao receber um elogio, o robô respondeu: "Pare com isso, você está me fazendo ficar vermelha!".
A demonstração não foi perfeita. Em um momento, o robô confundiu o homem sorridente com uma superfície de madeira e em outra ocasião, começou a resolver uma equação que ainda não lhe tinha sido mostrada.
Isso demonstrou que ainda há um longo caminho a percorrer antes que as falhas e "alucinações" que tornam os chatbots não confiáveis e potencialmente inseguros possam ser resolvidas.
Mas a OpenAI mostrou por que pretende que o GPT-4o se torne a próxima geração de assistente digital de IA, uma espécie de Siri turbinada, que lembra o que foi dito no passado e consegue interagir além da voz ou do texto.
Há outro problema envolvendo essa tecnologia que não apareceu na demonstração feita à imprensa e ao público presente, que gritava e aplaudia o lançamento: o alto preço ambiental dessa tecnologia.
Sabemos que a inteligência artificial consome mais energia do que a computação tradicional e que quanto mais sofisticada ela se torna, mais poder de computação necessita. Não houve menção à sustentabilidade na apresentação da OpenAI.
'Mágico'?
Já vimos chatbots como Grok, de Elon Musk, e Pi, do cofundador da DeepMind, Mustafa Suleyman, priorizarem a "personalidade" de seus produtos, mas a maneira como o GPT-4o lidou perfeitamente com a combinação de texto, áudio e imagens com uma resposta instantânea parece colocar a OpenAI à frente da concorrência.
É claro que, no momento, só temos o que a empresa quis nos mostrar – a demonstração foi cuidadosamente selecionada e gerenciada por eles. Será interessante ver como o GPT-4o lidará em grande escala com os milhões de pessoas que já usam o ChatGPT à medida que for implementado.
A diretora de tecnologia da OpenAI, Mira Murati, descreveu o GPT-4o como "mágico".
Uma escolha de palavras interessante e emotiva: embora esta tecnologia esteja rapidamente ficando mais sofisticada e cada vez mais convincente como companheira, ela não é autoconsciente ou mágica. Trata-se de programação complexa e aprendizagem automática.
Houve rumores sobre uma parceria entre OpenAI e Apple e, embora isso ainda não tenha sido confirmado. Foi revelado durante a apresentação que produtos da Apple foram utilizados por toda parte.
Outro tiro certeiro foi o momento deste evento. Ele aconteceu 24 horas antes de seu rival Google exibir seus mais recentes desenvolvimentos de IA em sua conferência anual, Google IO.