Notícias

Eu tentei ‘Nano Mananas’ de Gemini para uma edição de imagem. Mudanças de IA foram abertas

Depois de ver toda a Banana-Fanfare para a mais nova ferramenta produtiva de IA do Google, eu sabia que tinha que comprá-la para um retorno. Imagem flash 2.5 Flash, modelo atualizações Sua capacidade de organizar suas fotos localmente em Gêmeos. Os entusiastas da IA ​​chamaram de modelo de “nano banana” incentivado por uma série de teaser com tema de banana. Google gerentes.

Dentro de algumas semanas, as pessoas criaram mais de 200 milhões de imagens de IA e mais de 10 milhões de pessoas matriculadas para usar a aplicação de Gemini, conforme O Google Labs do Google e o vice -presidente de Gemini Josh Woodward.

Ai Atlas Rosette Tag

O Google investiu em modelos de mídia produtiva este ano e deixou versões atualizadas dos modelos de geradores de imagem e vídeo na Conferência Anual de Desenvolvedores da G/O. O gerador de vídeo da AI do Google, Veo 3, ficou atordoado com uma voz sincronizada, a primeira entre os gigantes da AI. E os criadores de conteúdo prepararam mais de 100 milhões de vídeos de IA com o Flow Flow Flow do Google.

Passei muito tempo para testar o software criativo da IA ​​e fiquei empolgado em ver o que o Google cozinhou. No entanto, meu teste de imagem flash 2.5 mostrou que o fato de que algo tem uma entrada chamativa nem sempre significa que sempre viveria para exagerar. Como foi minha experiência com Gemini Nano Mananas: bom, ruim e irritante.

O que funcionou

O modelo de banana Gemini é assustador ao adicionar itens às imagens existentes, ele mistura os itens criados pela IA bem em qualquer imagem que você capturar. Ele também mantém o nível de uma boa consistência estável de caracteres – para que as pessoas nas minhas fotografias não foram muito distorcidas ou desativadas após o processamento da IA. Ambos são distinções importantes para programas de imagem de IA e algo que o Google está trabalhando para melhorar.

Você pode ver esses dois recursos em minha irmã e minha foto. Nossas visões gerais não mudam na versão organizada (à direita) mostrando essa consistência do personagem. Pedi Gemini para adicionar uma terceira irmã que se assemelha aos dois, o que tornou assustador adicionando uma terceira mulher entre nós.

Duas imagens lado a lado. A esquerda é o original de duas meninas escuras, segurando baldes de maçã em frente a uma montanha. A imagem correta é organizada para incluir uma mulher com um terceiro cabelo escuro.

Bem -vindo à família, a irmã AI com uma direita assustadora.

Katelyn Chedraoui/Gêmeos

Também fiquei muito impressionado com a rapidez com que Gêmeos cuspiram as imagens concluídas. Menos de um minuto, ele tirou uma estrela de ouro de mim, e seus gêmeos discutiam regularmente seus desejos com menos de 15 segundos. Além disso, apreciei como ele adiciona uma marca d’água a todas as imagens que criou e organizou-mesmo que eu não goste de como as empresas de tecnologia interrompem os emojis de brilho para a IA, é muito importante ter alguns marcadores produzidos pela IA. Os trabalhos Sentid e Belt Stage do Google também ajudam a distinguir o conteúdo de IA das imagens criadas por seres humanos.

Os Gêmeos também são bons na criação de imagens de IA por atacado, mas em vez de usar o Imagen 4 ou outro gerador de imagens de IA-existem controles e configurações mais práticos que os aproxima do que você deseja com menos trabalho.

O que realmente fez

Existem sérias limitações nas bananas gêmeas. Ele produziu automaticamente imagens quadradas, e as solicitações de seguir -UP que solicitaram a adaptação de imagens a outras dimensões foram ignoradas ou falhadas.

Percebi que a maioria das minhas fotografias reduz a resolução. Primeiro de tudo, tiro fotos com o iPhone 16, que são as câmeras estelares, mas depois de passar pelo modelo de banana Gemini, esses detalhes finos eram geralmente embaçados. Isso é irritante e não vai ganhar nenhum fotógrafo.

Duas imagens lado a lado, à esquerda, um alvo de madeira é um original mostrando um BEX no Bullseye. Deixou ai-düzenli e similares, mas com detalhes menos finos nas cores do anel e grãos de madeira

Embora eu queira iluminar os anéis de destino, ele tem mais riqueza e textura do que a foto original (à esquerda) ai (direita).

Katelyn Chedraoui/Gêmeos

Gêmeos, manualmente, tentei discutir arranjos de fotos que seriam difíceis de fazer. Esta é uma área em que a IA deve ser perfeita na edição de fotos da direção, mas para automatizar arranjos intensivos detalhados. Infelizmente, Gemini realmente lutou com o compromisso aqui imediatamente, então ele não fez o que eu pedi.

Tentei fazer com que Gemini removesse os reflexos de um barulho de um pôster mais louco na sexta -feira, mas eles permaneceram teimosamente. E quanto mais tento remover as reflexões, mais fraca a qualidade da imagem se tornou. Era uma vez, o texto claro não pôde ser lido depois de finalmente desistir, não estou falando sobre os danos acidentais e assustadores a Lindsey Lohan e Jamie Lee Curtis.

A Banana Nano Gêmeos lutou para produzir imagens de tamanhos diferentes. As imagens são um processo de edição de fotos do núcleo -core, mas o navio não usou ou não usou instruções simples de dimensionamento em minhas solicitações.

Duas imagens lado a lado. A esquerda é a filmagem original de um pôster mais louco de filme de sexta -feira em uma parede de tijolos. Os direitos são erradicados e os rostos e as palavras parecem quase os mesmos, exceto ter cuidado

Tudo o que eu queria era que Gemini levantou o reflexo no canto superior direito do pôster, mas, em vez disso, atingiu a linha e os rostos da gravadora.

Katelyn Chedraoui/Gêmeos

Cheguei ao Google sobre os problemas de solução e tamanho e um porta -voz disse: “Continuaremos a se desenvolver no modelo”, ele disse que a empresa de tecnologia está trabalhando ativamente e ativamente a partir de nosso modelo anterior. “

Em geral, Gêmeos Nano Mananas provou -me que o Google é sério em continuar dominando a mídia produtiva. No entanto, existem armadilhas importantes que se concentram na produção de novos elementos, em vez de usar a inteligência artificial para melhorar e ajustar os problemas comuns da fotografia. Por enquanto, o modelo Nano Bananas é o mais adequado para os fãs de Gemini que desejam fazer grandes arranjos rapidamente. Para quem procura ferramentas mais precisas, teremos que esperar o Google pela próxima atualização importante ou encontrar outro programa.

Usabilidade, preços e privacidade de Banana Nano Nano Nano

Você não precisa fazer nada para acessar o novo modelo; A base Gemini é adicionada automaticamente ao modelo de flash 2.5. Os Gêmeos podem ser usados ​​gratuitamente com mais modelos e capas de uso mais altas nos planos de IA do Google. US $ 20 por mês.

Se você é um assinante pago, também pode acessar o modelo via Google AI Studio. A partir daí, tudo o que você precisa fazer é fazer upload de uma foto e escrever sua solicitação. Cada informação usa entre uma a duas mil moedas, dependendo do nível de detalhe necessário. Os usuários da Adobe Express e Firefly também podem acessar o novo modelo.

Google’s Política de privacidade de Gêmeos A IA diz que você pode usar as informações instaladas para melhorar seus produtos, para que a empresa recomenda impedir a instalação de informações sensíveis ou especiais. Empresa Política de uso proibido da IA Também proíbe a criação de materiais ilegais ou abusivos.

Para obter mais informações, consulte os melhores fabricantes de imagens de IA e tudo anunciado no evento do Google Pixel 10.



Link da fonte

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *