As empresas de IA estão trabalhando em modelos de voz há um tempo, mas parece que as coisas realmente aumentadas depois que o OpenAI revelou Modo de voz chatgpt.
Agora, a Amazon só tem introduzido Seu novo modelo de voz da AI “Foundation” chamado Nova Sonic. E realmente faz Alexa parecer que ela está vivendo no passado.
Segundo a Amazon, a Nova Sonic “unifica o entendimento e a geração de fala em um único modelo, para permitir mais conversas de voz semelhantes a humanos em aplicativos de IA”. Com as amostras fornecidas, certamente parece mais humano do que as iterações anteriores da empresa de modelos de voz de IA.
Eu comparei o gergel
Por exemplo, existem pausas, tom e inflexões adequadas em palavras, dependendo de onde estão e o que elas significam em uma frase. Amazon forneceu algumas amostras que você pode ouvir aqui e aqui.
Velocidade de luz mashable
Novamente, “mais humano” é a principal descrição aqui. Ainda há muitos sinais de que é uma voz de IA, mas também parece um grande passo sobre assistentes de voz anteriores da IA como Alexa.
A Amazon diz que conseguiu isso combinando vários modelos que seriam tradicionalmente usados, como reconhecimento de fala, grandes modelos de idiomas e texto em fala, em um único modelo unificado. Segundo a Amazon, não apenas entende as nuances no discurso para produzi -lo, mas também entende quando um humano insere seu próprio discurso com essas nuances também.
De acordo com TechCrunchA Nova Sonic já está alimentando a Amazon, Alexa+Alexa+.
Com base em desenvolvimentos recentes, parece que as grandes empresas de IA estão atualmente focadas nos modelos de voz. Portanto, prepare -se para a competição nesse espaço para aquecer. A Amazon já está apontando para as alegações de que o Nova Sonic é aproximadamente 80 % mais barato que o modelo GPT-4O da Openai e promovendo-o como “o mais econômico”.
Atualmente, a Nova Sonic está disponível para desenvolvedores através da plataforma corporativa da Amazon, Bedrock.