Os humanos derrotaram modelos de inteligência artificial desenvolvidos pelo Google e pela OpenAI em uma importante competição internacional de matemática, mesmo com os programas alcançando pela primeira vez pontuações de nível ouro.
Nenhum dos modelos obteve a pontuação máxima. Por outro lado, cinco jovens conquistaram notas perfeitas na Olimpíada Internacional de Matemática (IMO), uma prestigiada competição anual voltada a participantes com menos de 20 anos.
Os organizadores do evento alertaram que não foi possível verificar quanta potência computacional foi utilizada pelos modelos de IA nem se houve alguma intervenção humana no processo.
Na segunda-feira, o Google informou que uma versão avançada do seu chatbot Gemini resolveu cinco dos seis problemas propostos na IMO, realizada este mês em Queensland, na Austrália.
— Podemos confirmar que o Google DeepMind atingiu a tão almejada meta: obteve 35 de 42 pontos, uma marca de medalha de ouro — disse o presidente da IMO, Gregor Dolinar, segundo comunicado da gigante tecnológica.
— Suas soluções foram impressionantes em muitos aspectos. Os avaliadores da IMO as consideraram claras, precisas e, na maioria dos casos, fáceis de acompanhar — acrescentou.
Cerca de 10% dos concorrentes humanos conquistaram medalhas de ouro, e cinco deles obtiveram pontuações perfeitas de 42 pontos.
A OpenAI, criadora do ChatGPT, também afirmou que seu modelo experimental de raciocínio alcançou o nível ouro, com 35 pontos na prova.
— Avaliamos nossos modelos com os problemas da IMO 2025, sob as mesmas regras aplicadas aos participantes humanos — explicou o pesquisador da OpenAI Alexander Wei nas redes sociais.
— Para cada questão, três ex-medalhistas da IMO avaliaram independentemente as respostas apresentadas pelos modelos — completou Wei.