O Google DeepMind publica uma nova versão do modelo Genie 3 AI “World”, que pode produzir ambientes 3D nos quais usuários e agentes da IA podem interagir em tempo real. A empresa também promete que os usuários podem interagir com mundos por muito mais tempo do que antes e que o modelo se lembrará de onde estão as coisas quando você desviar o olhar deles.

É um tipo de sistema de IA que pode simular ambientes para fins como modelos mundiais, educação, entretenimento ou ajudar a treinar robôs ou agentes de IA. Com os modelos mundiais, você faz um pedido e produz uma área onde pode atuar como em um videogame, mas o mundo é criado com AI em vez de ativos 3D. Uma área onde o Google faz muito esforço; Em dezembro, a empresa mostrou a Genene 2, que pode criar mundos interativos com base em uma imagem e uma equipe de ex -modelos mundiais em conjunto da Ferramenta de Produção de Video Sora do Openai.

No entanto, os modelos atualmente têm muitas desvantagens. Genie 2 Worlds, por exemplo, só poderia ser jogado em um minuto. Recentemente, experimentei um “vídeo interativo de uma empresa apoiada pelo parceiro fundador da Pixar e, quando olhei em torno do Google Street View, senti vontade de andar em uma versão turva, onde não esperava e mudei.

Genie 3 parece ser um passo notável. Os usuários poderão produzir mundos com uma solicitação que suporta uma interação contínua de “vários” minutos, que consiste em 10 a 20 segundos de interação com o Genie 2. De acordo com uma postagem no blog. O Google diz que o Genie 3 pode manter as lacunas por cerca de um minuto em memória visual; portanto, se você se afastar de algo em um mundo, coisas como escrever em uma parede ou escrever em um quadro -negro estarão no mesmo lugar. Os mundos também terão uma resolução de 720p e funcionarão a 24 qps.

O Deepmind acrescenta ao Genie 3 o que ele chama de “atividades do mundo rápido. Usando uma solicitação, você pode alterar as condições climáticas em um mundo ou adicionar novos personagens.

No entanto, este provavelmente não é um modelo que você pode tentar por si mesmo. De acordo com o Google, ele é lançado como um “Pesquisa limitada Visualize Olur, que estará disponível para uma pequena coorte de acadêmicos e criadores, para que eles possam entender melhor os riscos dos desenvolvedores e como reduzi -los adequadamente. Além disso, há muitas restrições como as maneiras limitadas que os usuários podem interagir com os mundos produzidos e que o texto liest“ geralmente é criado quando é criado apenas quando o número de pessoas que são fornecidas. Testadores “.

Link da fonte