O Grupo Qwen da Alibaba lançou o modelo QWQ-32B AI na quarta-feira. Este é um modelo racional baseado no cálculo do tempo de teste estendido com a corrente visível-chin (COT). Embora o tamanho seja pequeno em comparação com o Deepseek-R1, os desenvolvedores dizem que seu desempenho pode ser ajustado com base nas pontuações de referência. Como outros modelos de IA lançados pelo Grupo Qwen, o QWQ-32B é um modelo de IA de código aberto, no entanto, ele não está totalmente aberto.
Modelo de IA racional QWQ-32B lançado
UM Postagem do blogO grupo QWEN do Alibaba descreveu o modelo racional QWQ-32B. Os modelos de IA da série QWQ (Short for Qwen com perguntas) foram introduzidos pela empresa em novembro de 2024. Esses modelos racionais são projetados para fornecer uma alternativa de código aberto à série O1 de O1. O QWQ-32B é um modelo de parâmetros de 32 bilhões que é criado medindo técnicas de aprendizado de reforço (RL).
Os desenvolvedores que explicam o processo de treinamento disseram que a abordagem de escala do RL foi incluída em um ponto de verificação de laboratório a frio. Inicialmente, o RL foi usado apenas para tarefas relacionadas ao índice e matemática, e as respostas foram verificadas para confirmar a precisão. Em seguida, a técnica foi usada para habilidades públicas com verbos baseados em regra. O painel QWEN constatou que esse método aumentou as habilidades gerais do modelo sem reduzir seu desempenho matemático e de índice.
Definições do modelo de AI qwq-32b
Crédito da foto: Alibaba
Os desenvolvedores dizem que essas estruturas de treinamento ajudaram o QWQ-32B a operar no nível da Deepseek-R1, o último modelo de 671 bilhões de tamanho (nos 37 bilhões implementados). Em termos de testes internos, o grupo disse que o Banco Live QWQ-32B (sistema de índice), o IFVEL (uma linguagem bem projetada de bate-papo ou instrução) e a atividade Berkeley Liderança v3 ou PFCL (a capacidade de chamar funções) é chamada.
Desenvolvedores e entusiastas da IA podem ver o peso aberto do modelo na lista de rosto e no ModelCop. Este modelo está disponível sob a licença Apache 2.0, que permite o uso de educação e pesquisa, mas proíbe casos de uso comercial. Além disso, como todos os detalhes do treinamento e o banco de dados não estão disponíveis, a amostra pode ser refletida ou reformada. Deepseek-R1 estava disponível sob a mesma licença.
Na ausência de hardware adequado para executar o modelo de IA localmente, eles podem acessar suas habilidades através do bate -papo Gwen. O menu do seletor de modelos no lado superior da página permitirá que os usuários selecionem o modelo QWQ-32B-Speview.