O gerador de música AI atualizado de Samo é tecnicamente impressionante, mas ainda não saudável

Quando o recorde principal não está tentando impedir que os casos sejam rótulos, a SUNO ainda está trabalhando para enriquecer seu instrumento musical de IA. O modelo mais recente, SUNO V5, é uma melhoria técnica transparente do que sua versão anterior v4.5+. Mas parece não escapar do maldito vazio que espalha a maior parte da arte da IA.
Existem algumas atualizações da placa na qualidade do áudio, como uma clara separação entre menos artefatos e ferramentas. Algumas faixas feitas usando o V4.5+ podem combinar todas as partes da melodia para fazer as linhas entre o violão, o baixo e as pias. Mas com a V5, os compostos são muito limpos.
Durante uma demonstração, Henry Pips, um gerente de produtos da SUNO, apontou uma música, que inclui uma flauta parecida com um ping como uma flauta: “Eu nunca ouvi falar disso antes nos modelos anteriores … é um som isolado, e esse não é um efeito específico do significado do significado tradicional. O som do som do stoneo é aproximadamente a avaliação porque foi decidido.
Não há arestas para nenhuma voz do SUNO. Tudo está banhado em eco, empilhando com conformidade e arremesso. Mesmo se você for aberto abertamente para não fazer essas coisas, o modelo o ignora.
Samo diz que o V5 é bem compreendido, embora a reivindicação pareça ser questionável no meu teste. Com alguns dos meus impulsos, como “Modern Avant R&B, mas bateria engraçada, peças de melodia atmosférica e vozes respiratórias”, V5 ou V 4.5+ Eu não pareço ser um vencedor claro para dar o que tinha em mente (principalmente Kalela Me coloque de lado). Ambos estavam próximos e me deram as faixas do Downspo com alguns pecados de humor, mas não tinham a ejaculação que eu esperava.
“No início dos anos 90, o Lo-Fi Indy Rock foi gravado com as principais vozes no gravador de foste de 4 faixas e pelo ligeiramente fora do violão” Não consegui encontrar o SUNO em busca do percurso V5. Apesar de tudo que tentei, não consegui nada cuspir na calçada como uma calçada. Ruído solto de preguiçoso eu associar Oblíquo e magia Não está em lugar algum. Em vez disso, peguei a bomba “Indi” com os rifs grossos e os anéis de energia de acionamento limpos. Suno V. apresentou músicas que soam como os macacos do Ártico mais do que qualquer coisa publicada antes do início do século V.
Da mesma forma, no meu experimento, o V5 parecia estar lutando com a época ou décadas das décadas. Quando ouvi “Graudrak no final dos anos 1970”, v4.5+ basicamente a afasta de vozes (e muito mais). Mas o V5 geralmente oferece o Sinthbab de cabeça dos anos 80 e as faixas, mesmo que contenha parte do DNA clássico de Gratrak.
O que eu digo é que os arranjos para criar o modelo V5 da SUNO são muito complicados. Comparado ao V4.5+, há uma prosperidade musical que impede que as coisas sejam repetidas e impede estruturas de músicas muito diferentes. V4.5+ geralmente o conteúdo de ter uma estrutura básica de existência de verso-gorus (com uma ponte em boa medida), V5 é frequentemente as seções frontal ou pós-coro, muitas pontes ou fraturas e geralmente criadas durante a pista mais que uma seção diferente.
Ocasionalmente, isso forneceu resultados interessantes ao remixar faixas existentes. Alguns anos atrás, enviei uma música de um EP que publiquei (que deve ter desencadeado seu filtro de direitos autorais), não vou mentir e gostei de alguns dos meus cantos do meu violão, transformando algumas partes do meu violão em um sintetizador consecutivo e transformando minhas cadeiras grandes em arquezios de motorista.
Mas eu estava perdendo todas essas capas da minha música, eu disse a Solo para criar, eu sou a fonte do caminho, a natureza lo-fi Gravado às 3 horas na minha sala de estar Cerca de seis anos atrás. É o tema que está sendo executado aqui. Embora o SUNO possa refletir as características superficiais do registro antigo ou do desempenho humano da fita dele ou da respiração, sempre parece não realizado.
O FIPS admite que o modelo de voz está criando as falhas únicas de um desempenho humano real. Em sua mensagem inicial na V5, Solo disse que suas “vozes emocionalmente ricas” e “profundidade emocional como o homem”, mas essa frase agora não é de materiais públicos. Em vez disso, a empresa agora optou por descrever as vozes como “naturais, reais”, revelando a mudança como uma “escolha estilística”.
Mas parece até um trecho. Sim, comparado ao V4.5+, as vozes parecem mais seres humanos, que ainda são difíceis. O FIBS explicou: “Quando sentimos que uma voz é emocionalmente plana, está faltando alguns detalhes que ela dá a vantagem e acho que a alta confiabilidade do modelo V5 fornece esses detalhes.
É difícil argumentar com os aspectos técnicos dessa reivindicação – os programas de voz são muito detalhados – mas eles ainda são dolorosos. Cada voz de rock soa como Dragões de Imagem ou Mamford e Sons, cada música de R&B como Adele Sleepwalking ou Atraente Haryana Grande.
Não há arestas para nenhuma voz do SUNO. Tudo está banhado em eco, empilhando com conformidade e arremesso. Mesmo se você for aberto abertamente para não fazer essas coisas, o modelo o ignora. Ouvi a v5 “emoção incontrolável solo de uma performance de voz feminina de Capplail, sem eco e conformidade, sem consequências, vozes secas”. As duas músicas fornecidas por ele estavam tomando banho ao contrário, e os primeiros cantores foram os primeiros cantores, e o som de um baixo. (No entanto, pode ter sido um passe aproximadamente uma voz.) Mas os FIPs não ficam surpresos. “Os modelos ainda não entendem as descrições de consequências específicas e técnicas de registro. A maneira como a voz é feita é muito afetada pela música e pelo humor geral”, disse ele.
Então, eu alimentei as músicas do SUNO Apenas Diferente da pedra rolante ”Abrigo gimmy” Para evitar ser sinalizado por violação de direitos autorais. No começo, o pincel parecia ter todos os elementos que tornariam o original mais extinção. Uma cantora poderosa grita um arranjo completo e bluxy, mas isso teve um impacto emocional em um livro odontológico.
Quando ouço o “abrigo gimmy”,” Este é o caminho de Mary Clayton Voz racha Quando ela é “estupro e matar” durante a ponte, isso me faz sufocar. Este é um militante completamente ruim de Robert Smith, que expressa frustração ”Por que eu não posso ser você”E a respiração de Kurt Cobin é definitivamente fadiga” antes de dar a última linha “Onde você dormiu ontem à noite“Isso diz que este é um homem que luta com fantasmas de verdade.
Em geral, tentando mudar o SUNO para “ruim” – sintonizar, RA, Off Key, Sloppy – inútil. Para todas as conversas das empresas sobre como as vozes do novo modelo são “naturais”, ele não tem as deficiências do peso emocional de uma performance. Os cantores virtuais de Solo ainda estão separados. O Modelo V5 pode entender que uma música em particular deve ser triste, mas não tem uma conexão emocional real com as palavras, porque é a pilha do índice, não um artista.