menu
Tecmundo
Software

Google enfim lança Whisk IA no Brasil e em mais países

A ferramenta de IA generativa do Google combina as capacidades multimodais do Gemini e a criação de imagens do Imagen 3 para gerar imagens inéditas a partir de arquivos e descrições do usuário

Avatar do(a) autor(a): Igor Almenara Carneiro

18/02/2025, às 22:00

Google enfim lança Whisk IA no Brasil e em mais países

(Fonte: Igor Almenara/TecMundo)

O Whisk, ferramenta de geração de imagens com inteligência artificial do Google, agora está disponível em mais de 100 países — incluindo o Brasil. Ainda em fase experimental, o serviço combina as capacidades multimodais do Gemini com a criação do Imagen 3 para criar imagens totalmente novas a partir de inspirações fornecidas pelo usuário.

Lançado em dezembro apenas nos Estados Unidos, o Whisk é mais um experimento do Google Labs, plataforma dedicada a soluções experimentais da gigante das buscas. Na última terça-feira (11), a exclusividade chegou ao fim, permitindo que usuários de diversos países testem a ferramenta.

Diferente dos geradores de imagens tradicionais, o processo de criação no Whisk começa com o envio de uma imagem para análise. Após ser processada pelo Gemini, o usuário descreve em texto as alterações desejadas e o Imagen 3 gera o resultado esperado. É possível fornecer uma única imagem e complementar a solicitação com descrições em texto, ou pedir que a IA combine elementos de diferentes arquivos.

STORYBOARD
Essa imagem foi gerada no Whisk a partir de sugestões entregues pelo Google. (Fonte: Whisk/Reprodução)

O método do Whisk tende a ser mais acessível para usuários com pouca experiência na criação de prompts, algo essencial em ferramentas de geração de imagens. O processo de edição é intuitivo e simplificado, contando até mesmo com sugestões para quem precisa de inspiração.

Como funciona a IA Whisk do Google?

A IA Whisk é alimentada pelo Gemini, modelo multimodal do Google capaz de interpretar imagens enviadas pelo usuário. A partir do arquivo, a IA gera uma descrição em texto (processo conhecido como “Image to Text”, ou I2T), destacando elementos como estilo, personagens, cenário e cores.

undefined
O Whisk trabalha em três frentes simultaneamente: assunto, ambiente e estilo. (Fonte: Whisk/Reprodução)

Essa descrição é usada para criar um prompt detalhado que servirá de base para a nova imagem. O usuário deve descrever o que deseja na composição final, seja no assunto principal, na ambientação ou no estilo da figura. A partir disso, o Imagen 3 transforma a solicitação em uma nova imagem (Text-to-Image, ou T2I).

Whisk é gratuito

O Whisk é totalmente gratuito, mas requer login no Google Labs com uma conta do Google. Além da IA de edição de imagens, a plataforma oferece outras ferramentas experimentais, como o Daily Listen, um Discover narrado por vozes sintéticas; o NotebookLM, um assistente para estudos; e o Jules, um assistente de programação.

Para explorar todas as funcionalidades, basta acessar o site oficial do Google Labs. Você também pode continuar no TecMundo para conferir mais sobre o NotebookLM e suas aplicações nos estudos diários ou brincar com o gerador de imagens nativo do Docs.



Redator de tecnologia desde 2019, ex-Canaltech, atualmente TecMundo e um assíduo universitário do curso de Bacharel em Sistemas de Informação. Pai de pet, gamer e amante de músicas desconhecidas.