O Google DeepMind está montando uma nova equipe de pesquisadores de inteligência artificial para construir “modelos de mundo” que possam simular ambientes físicos. Tim Brooks, ex-copresidente do projeto Sora da OpenAI, liderará o esforço. Ingressou na DeepMind em outubro Trabalhar na criação de vídeos e simuladores de mundo do Google.
Os modelos mundiais são um desenvolvimento relativamente novo dentro da IA que pode servir uma variedade de propósitos, como a criação de ambientes de mídia interativos em tempo real para videogames e filmes, e cenários de treinamento realistas para robôs e outros sistemas de IA. Isto faz parte do esforço do Google para alcançar um sistema de inteligência artificial geral, ou AGI, antes dos seus concorrentes.
“A DeepMind tem planos ambiciosos para construir modelos produzidos em massa que simulem o mundo” Brooks anunciou em um post X na segunda-feira. Brooks inclui duas listas de empregos abertas para engenheiros pesquisadores e cientistas com modelos de linguagem multimodal.
“Acreditamos que o pré-treinamento em vídeo e dados multimodais é um caminho importante para a inteligência artificial geral” DeepMind disse em uma descrição de trabalho. “Os modelos mundiais podem potencializar muitos domínios, como raciocínio visual e simulação, planejamento para agentes simulados e entretenimento interativo em tempo real.”
A corrida para ser o primeiro a anunciar o AGI está esquentando, então o foco do Google aqui não é surpreendente. O CEO da OpenAI, Sam Altman, disse recentemente que a empresa descobriu como alcançar uma referência há muito esperada na indústria de tecnologia e que agentes autônomos de IA poderiam começar a ingressar de forma significativa na força de trabalho este ano.
A nova equipe da DeepMind trabalhará junto com os projetos existentes de IA do Google, incluindo seus principais modelos Gemini AI, o gerador de vídeo Veo e o Genie – o modelo mundial anterior do Google para simulação de ambientes 3D em tempo real.