O Google anunciou nesta terça-feira (14), durante o Google I/O, o Imagen 3 e o Veo, duas inteligências artificiais (IA) focadas em produção de mídia. A primeira é a nova versão do Imagen, que produz imagens por meio de comandos de texto e a segunda é focada na geração de vídeos, concorrendo diretamente com o Sora, da OpenAI.
As duas plataformas estão disponíveis apenas para um grupo selecionado de criadores no ImageFX e no VideoFX. Ainda não há a previsão de quando elas chegarão para o público geral, mas é possível fazer a inscrição na lista de espera.
O Imagen 3 é a nova versão do gerador de imagens do Google.
De acordo com o Google, o Imagen 3 é capaz de gerar imagens ainda melhores que a sua versão anterior. Houve uma melhoria significativa na compreensão de prompts de comando, o que permite a criação de fotos mais fiéis ao que o usuário deseja.
O Google também destaca que o Imagen 3 é capaz de gerar diversos estilos de fotos, desde pinturas até padrões mais realistas. Outro ponto é que também será possível incluir palavras e até mesmo frases inteiras nas imagens geradas pela IA.
O Imagen 3 também receberá recursos presentes nas versões anteriores, como o inpainting e o outpainting. Por último, o Google também divulgou que algumas ferramentas da IA serão expandidas para outros aplicativos da empresa, como o próprio Gemini, Google Ads, Workspace e mais.
O Veo é o gerador de vídeos do Google
Já o Veo é capaz de gerar vídeos de até um minuto em até 1080p. A ferramenta é capaz de interpretar os comandos do usuário e renderizar os detalhes das cenas. Além disso, também é possível editar os resultados, deslocando elementos e até mesmo inserindo algumas modificações, como movimentos extras.
Outro destaque é que o Veo também permite a adição de imagens para compôr os comandos de geração de vídeos. Basta adicionar a foto e o prompt detalhando os elementos a serem gerados.
O Google também destaca que, futuramente, alguns recursos do Veo estarão disponíveis também para o YouTube Shorts.