0.7 C
Nova Iorque
sábado, fevereiro 22, 2025

A IA DeepMind do Google pode resolver problemas de matemática a par com os melhores solucionadores humanos


A IA do Google pode vencer os estudantes mais inteligentes do ensino médio em matemática

Alpageometria do Google 2 Ai atinge o nível de estudantes de medalhas de ouro na Olimpíada Matemática Internacional

Os problemas de AI alfageometria2 do Google DeepMind2 definidos na Olimpíada Matemática Internacional.

Wirestock, Inc./alamy Inventory Picture

Há um ano, alfagometria, um solucionador de problemas de inteligência synthetic (AI) criado pelo Google DeepMind, surpreendeu o mundo por apresentando -se no nível de medalhistas de prata na Olimpíada Matemática Internacional (IMO), uma concorrência de prestígio que outline problemas de matemática difíceis para alunos talentosos do ensino médio.

A equipe DeepMind agora diz que o desempenho de seu sistema atualizado, o alfageometria2, superou o nível do medalhista de ouro médio. Os resultados são descritos em uma pré -impressão no ARXIV.

“Eu imagino que não demorará muito para que os computadores estejam recebendo notas completas na IMO”, diz Kevin Buzzard, matemático do Imperial Faculty London.


Sobre apoiar o jornalismo científico

Se você está gostando deste artigo, considere apoiar nosso jornalismo premiado por assinando. Ao comprar uma assinatura, você está ajudando a garantir o futuro das histórias impactantes sobre as descobertas e idéias que moldam nosso mundo hoje.


Resolver problemas na geometria euclidiana é um dos quatro tópicos abordados em problemas de IMO – os outros cobrem os ramos da teoria dos números, álgebra e combinatória. A geometria exige habilidades específicas de uma IA, porque os concorrentes devem fornecer uma prova rigorosa para uma declaração sobre objetos geométricos no avião. Em julho, a Alphageometria2 fez sua estréia pública ao lado de um sistema recém-revelado, o AlphaProof, que o DeepMind desenvolveu para resolver as questões não geometradas nos conjuntos de problemas da IMO.

Linguagem matemática

A alfagometria é uma combinação de componentes que incluem um modelo de linguagem especializado e um sistema ‘neuro-simbólico’-que não treina aprendendo a dados como uma rede neural, mas tem um raciocínio abstrato codificado pelos seres humanos. A equipe treinou o modelo de idioma para falar uma linguagem matemática formal, o que possibilita verificar automaticamente sua saída quanto a rigor lógico – e eliminar as ‘alucinações’, as declarações incoerentes ou falsas que a IA Chatbots estão propensas a fazer.

Para o alfageometria2, a equipe fez várias melhorias, incluindo a integração do modelo de idioma grande de última geração do Google, Gemini. A equipe também introduziu a capacidade de raciocinar movendo objetos geométricos em torno do avião – como mover um ponto ao longo de uma linha para alterar a altura de um triângulo – e resolver equações lineares.

O sistema foi capaz de resolver 84% de todos os problemas de geometria apresentados na IMOS nos últimos 25 anos, em comparação com 54% para a primeira alfagometria. (As equipes da Índia e da China usaram abordagens diferentes no ano passado para obter desempenho no nível da medalha de ouro na geometria, mas em um subconjunto menor de problemas de geometria da IMO.)

Os autores do artigo DeepMind escrevem que futuras melhorias da alfagometria incluirão lidar com problemas de matemática que envolvem desigualdades e equações não lineares, que serão obrigadas a “resolver totalmente a geometria”.

Progresso rápido

O primeiro sistema de IA a obter uma pontuação medalha de ouro para o teste geral pode ganhar um prêmio de US $ 5 milhões chamado AI Mathematical Olympiad Prêmio-embora essa competição exija que os sistemas sejam de código aberto, o que não é o caso de DeepMind.

Buzzard diz que não se surpreende com o rápido progresso feito por DeepMind e pelas equipes indianas e chinesas. Mas ele acrescenta, embora os problemas sejam difíceis, o assunto ainda é conceitualmente simples e há muito mais desafios a serem superados antes que a IA seja capaz de resolver problemas no nível da matemática da pesquisa.

Os pesquisadores da IA ​​aguardarão ansiosamente a próxima iteração da IMO em Sunshine Coast, Austrália, em julho. Uma vez que seus problemas são divulgados para os participantes humanos resolverem, os sistemas baseados em IA também os resolvem. (Os agentes da IA ​​não podem participar da concorrência e, portanto, não são elegíveis para ganhar medalhas.) Novos problemas são vistos como o teste mais confiável para sistemas baseados em aprendizado de máquina, porque não há risco de que os problemas ou seus A solução existia on -line e pode ter ‘vazado’ nos conjuntos de dados de treinamento, distorcendo os resultados.

Este artigo é reproduzido com permissão e foi publicado pela primeira vez em 7 de fevereiro de 2025.

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles