O Google tem se destacado no campo da inteligência artificial com o lançamento do Whisk, um gerador de imagens inovador que utiliza o modelo Imagen 3. Inicialmente disponível apenas nos Estados Unidos, a ferramenta agora está acessível em mais de 100 países, incluindo o Brasil. O Whisk permite que usuários criem imagens personalizadas a partir de comandos, oferecendo uma nova forma de visualizar e remixar ideias.
Lançado oficialmente em dezembro do ano passado, o Whisk foi bem recebido durante seu período de testes. A tecnologia se diferencia por permitir que os usuários enviem prompts com imagens, ao invés de texto, possibilitando a alteração do assunto, cena e estilo de uma foto. Esta abordagem oferece uma experiência única na criação de conteúdo visual.
Como funciona o gerador de imagens Whisk?
O Whisk utiliza o modelo Imagen 3 do Google para combinar três elementos principais em uma imagem: o assunto, a cena e o estilo. Por exemplo, um usuário pode escolher uma foto pessoal como assunto, uma paisagem futurística como cena e um estilo de anime para o visual final. A ferramenta gera automaticamente uma legenda detalhada das imagens, que orienta o Imagen 3 na criação de um remix da foto.
Além disso, o Whisk permite a inserção de prompts de texto para definir melhor o resultado desejado. Isso possibilita descrições detalhadas, como “O assunto está pilotando uma bicicleta voadora”, proporcionando um controle mais preciso sobre o conteúdo gerado.
Quais são as limitações do Whisk?
Embora o Whisk ofereça uma experiência inovadora, é importante notar que os resultados podem não atender sempre às expectativas dos usuários. A ferramenta foca em características principais de cada imagem, o que pode resultar em variações indesejadas no assunto gerado, como altura, peso, penteado ou tom de pele. O Google reconhece essas limitações e continua a trabalhar para aprimorar a tecnologia.
Como acessar e utilizar o Whisk?
O Whisk está disponível através do site oficial do Google Labs, onde os usuários podem explorar suas funcionalidades. Para começar, basta selecionar as imagens desejadas e inserir os prompts necessários para criar a imagem personalizada. A interface intuitiva do Whisk facilita o processo, tornando-o acessível mesmo para aqueles com pouca experiência em edição de imagens.
O futuro da geração de imagens com IA
O lançamento do Whisk marca um avanço significativo na geração de imagens com inteligência artificial. Ao permitir a combinação de diferentes elementos visuais de forma personalizada, o Google está redefinindo como as pessoas interagem com conteúdo visual. À medida que a tecnologia continua a evoluir, espera-se que ferramentas como o Whisk se tornem cada vez mais sofisticadas, oferecendo possibilidades ilimitadas para a criatividade digital.