Os seres humanos venceram os modelos generativos de IA fabricados pelo Google e OpenAI em uma competição internacional de matemática internacional, apesar dos programas atingirem as pontuações no nível do ouro pela primeira vez.
Nenhum dos modelos obteve notas completas – ao contrário de cinco jovens na Olimpíada Matemática Internacional (IMO), uma prestigiada competição anual onde os participantes devem ter menos de 20 anos.
O Google disse na segunda -feira que uma versão avançada de seu Gemini Chatbot havia resolvido cinco dos seis problemas de matemática definidos na IMO, realizada no Queensland da Austrália este mês.
“Podemos confirmar que o Google Deepmind atingiu o marco muito desejado, ganhando 35 de 42 pontos possíveis-uma pontuação na medalha de ouro”, disse a gigante da tecnologia dos EUA, o presidente da IMO, Gregor Dolinar.
“Suas soluções foram surpreendentes em muitos aspectos. Os alunos da IMO acharam que eram claros, precisos e a maioria deles fácil de seguir”.
Cerca de 10 % dos participantes humanos ganharam medalhas de nível ouro e cinco receberam pontuações perfeitas de 42 pontos.
A fabricante de chatgpt nos EUA Openai disse que seu modelo de raciocínio experimental marcou 35 pontos no nível de ouro no teste.
O resultado “alcançou um grande desafio de longa data na IA” em “o maior concurso de matemática do mundo”, escreveu o pesquisador do Openai Alexander Wei nas mídias sociais.
“Avaliamos nossos modelos nos problemas de 2025 IMO nas mesmas regras que os concorrentes humanos”, disse ele.
“Para cada problema, três ex -medalhistas da IMO classificaram independentemente a prova enviada do modelo”.
O Google alcançou uma pontuação de medalha de prata na IMO do ano passado na cidade britânica de Bath, resolvendo quatro dos seis problemas.
Isso levou de dois a três dias de computação-muito mais do que este ano, quando seu modelo de Gemini resolveu os problemas dentro do prazo de 4,5 horas, afirmou.
A IMO disse que as empresas de tecnologia “testaram os modelos de IA de código fechado em particular sobre os problemas deste ano”, os mesmos enfrentados por 641 estudantes concorrentes de 112 países.
“É muito emocionante ver o progresso nas capacidades matemáticas dos modelos de IA”, disse o presidente da IMO, Dolinar.
Os organizadores do concurso não puderam verificar quanto poder de computação havia sido usado pelos modelos de IA ou se houve um envolvimento humano, ele alertou.