A inteligência artificial Grok agora pode interpretar imagens, anunciou um perfil oficial do serviço no X (antigo Twitter). O modelo generativo desenvolvido pela xAI, startup de Elon Musk, pode responder perguntas sobre arquivos apresentados por usuários.
De acordo com o bilionário, o Grok pode até explicar o significado de piadas usando a interpretação de imagens. Contudo, a ferramenta ainda está em desenvolvimento.
Em uma demonstração da ferramenta, o Grok explica uma sequência de quadrinhos. O modelo descreve a cena, explica a premissa da piada, destrincha o humor, os elementos visuais que complementam a piada e camadas adicionais do conteúdo.
eyes have been granted
image understanding now available
— Grok (@grok) October 28, 2024
Essa é a primeira vez que o Grok se torna capaz de interpretar imagens, mas ele já podia gerar figuras com base em descrição em texto. O assistente do X usava uma integração com o modelo FLUX.1 da Black Forest Labs para sintetizar imagens.
Grok now understands images, even explaining the meaning of a joke.
This is an early version. It will rapidly improve.
https://t.co/gQ5BBISVRc
— Elon Musk (@elonmusk) October 28, 2024
Em resposta enviada a um seguidor, Elon Musk mencionou que o Grok será capaz de ler arquivos PDF no futuro. O bilionário não deu uma previsão de quando o recurso será lançado, porém.
Assim como as demais funções do Grok, a interpretação de imagens são exclusivas para assinantes X Premium. A assinatura pode ser contratada a partir de R$ 36,67 por mês.