Participe de nossos boletins informativos diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saber mais


Publicado pela Tencent”Hunyuan3D 2.0”Hoje, um sistema de IA pode transformar imagens únicas ou descrições de texto em modelos 3D detalhados em segundos. Este sistema torna o que normalmente seria um processo longo – que pode levar dias ou semanas para artistas qualificados – uma tarefa rápida e automatizada.

Seguindo seu antecessor, esta nova versão do modelo está disponível como um projeto de código aberto em ambos Um rosto abraçável E GitHubTornando a tecnologia prontamente acessível para desenvolvedores e pesquisadores em todo o mundo.

“A criação de ativos 3D de alta qualidade é um processo demorado para os artistas, tornando a criação automatizada um objetivo de longo prazo para os pesquisadores”, observa a equipe de pesquisa. Relatório técnico. O sistema atualizado baseia-se no seu antecessor, ao mesmo tempo que introduz melhorias significativas em velocidade e qualidade.

Como Hunyuan3D 2.0 converte imagens em modelos 3D

Hunyuan3D 2.0 usa dois componentes principais: Hunyuan3D-DiT Cria a forma básica Pintura Hunyuan3D Adiciona detalhes de superfície. O computador primeiro cria múltiplas visualizações 2D de um objeto e depois as transforma em um modelo 3D completo. Um novo sistema de orientação garante que todas as visualizações do objeto correspondam – resolvendo um problema comum em modelos 3D gerados por IA.

“Posicionamos as câmeras em alturas específicas para capturar a área visível máxima de cada objeto”, explicam os pesquisadores. Esta abordagem, combinada com um método de mesclar diferentes perspectivas, permite que o sistema capture detalhes que outros modelos muitas vezes não percebem, especialmente nas partes superior e inferior dos objetos.

Diagrama mostrando como o Hunyuan3D 2.0 transforma uma imagem de panda em um modelo 3D por meio de técnicas de difusão multivisualização e reconstrução de visualização esparsa. (Crédito: arxiv.org)

Rápido e preciso: o que diferencia o Hunyuan3D 2.0

Os resultados técnicos são impressionantes. Hunyuan3D 2.0 Produz modelos mais precisos e visualmente atraentes do que os sistemas existentes, de acordo com as métricas padrão do setor. A versão padrão cria um modelo 3D completo em 25 segundos, enquanto a versão menor e mais rápida funciona em 10 segundos.

O que diferencia o Hunyuan3D 2.0 é sua capacidade de lidar com entradas de texto e imagem, tornando-o mais versátil do que as soluções anteriores. O sistema também apresenta recursos inovadores, como “Orientação Adaptativa sem Classificador” e “Entradas Híbridas” para ajudar a garantir consistência e detalhes nos modelos 3D gerados.

De acordo com os benchmarks publicados, Hunyuan3D atinge 2,0 Pontuação CLIP 0,809, superando tanto as alternativas de código aberto quanto as alternativas proprietárias. A tecnologia introduz melhorias significativas na composição da textura e na precisão geométrica, superando as soluções existentes em todas as escalas industriais padrão.

Um grande avanço tecnológico na computação é a capacidade de criar modelos de alta resolução sem exigir grande poder de computação. A equipe desenvolveu uma nova maneira de aumentar os detalhes e, ao mesmo tempo, manter as demandas de processamento gerenciáveis ​​– uma limitação frequente de outros sistemas de IA 3D.

Esses desenvolvimentos são importantes para muitas indústrias. Os desenvolvedores de jogos podem criar rapidamente versões de teste de personagens e ambientes. As lojas online podem exibir produtos em 3D. Os estúdios de cinema podem visualizar efeitos especiais com mais eficiência.

Tencent Ao compartilhar quase todas as partes do seu sistema Um rosto abraçávelUma plataforma para ferramentas de IA. Os desenvolvedores agora podem usar código para criar modelos 3D que funcionam com software de design padrão, tornando-os práticos para uso imediato em ambientes profissionais.

Embora esta tecnologia seja um avanço significativo na criação 3D automatizada, ela levanta questões sobre como os artistas trabalharão no futuro. A Tencent vê o Hunyuan3D 2.0 não como um substituto para artistas humanos, mas como uma ferramenta que lida com tarefas técnicas enquanto os criadores se concentram nos resultados artísticos.

À medida que o conteúdo 3D se torna cada vez mais central para jogos, compras e entretenimento, o mesmo acontece com as ferramentas Hunyuan3D 2.0 Criar mundos virtuais sugere um futuro tão simples quanto descrevê-los. O desafio que temos pela frente não é criar modelos 3D, mas decidir o que fazer com eles.


Source link