即時國際
2025-07-28 06:03:29

AI模型|数学推理能力大进步! Google、OpenAI达奥数金牌水平

Google公司与人工智能(AI)新创公司OpenAI宣布,他们的AI模型在国际数学奥林匹克(奥数)竞赛夺得金牌。这是AI系统首次在国际奥数比赛中达到金牌的门槛,标志了AI在数学推理能力上的突破。

国际数学奥林匹克竞赛是高中生顶尖数学赛事,今年有6道考题,42分满分,得35分以上可获金牌。有别于AI公司之前运用的方法,Google公司(Google)与OpenAI的模型透过使用自然语言的通用「推理」模型处理数学概念,分别成功解出6道题目中的5题。

相关新闻:黄仁勋访京︱首秀中文点赞中国AI大模型 称将获首批H20晶片许可证

2025年奥数比赛金牌。 X@sato2718

 

2025年奥数比赛金银铜牌。 imojp.org

 

中国队5人满分,全场第一。 X@xuejianosaka

 

参赛队伍分数节录。 IMO官网

 

2025国际数学奥林匹克竞赛题目。

 

2025国际数学奥林匹克竞赛题目。

 

Google AI去年仅获银牌,今年DeepMind使用一款暂未公开的全新模型参赛,搭载了Deep Think推理模式,结果答对5题,以35分获得金牌。而它没有答对的最后一题,做对的人类考生也只有5人。

OpenAI同样用未公开版本解题,比Google更早公布了自己的答案,也是获得35分的金牌水平,但他们没有正式参赛。

Google Deepmind 去年只得银牌,今年获得金牌。 法新社示意图

 

相关新闻:广东首季度GDP仅增4.1%不达标 浙江DeepSeek助力增6%超额完成

美国布朗大学(Brown University)数学教授、Google Deepmind客座研究员郑俊赫(Junehyuk Jung,译音)指出,这项成就意谓著AI将于未来一年内,协助数学家破解尖端数学研究领域的待解难题。郑俊赫告诉路透社:「我认为,等到我们能够运用自然语言解决艰难推理问题的时候,AI和数学家的合作即有望实现。」 

OpenAI企业用户突破300万,9个月增3倍,再推办公新AI功能。

 

OpenAI的突破是透过新型态实验模型达成,该模型的核心在于大规模扩展「测试时计算」(test-time compute)。OpenAI研究员布朗(Noam Brown)表示,这种方法让模型「思考」更久,并且导入平行计算,同时执行多条平行推理路径。布朗拒绝透露它在计算能力上为OpenAI造成多少成本,但坦言「非常昂贵」。

第66届国际数学奥林匹克竞赛在澳洲昆士兰阳光海岸举行,吸引全球 630名数学精英参赛,其中5名选手获得42分满分,得35分以上可获金牌,全部共有67人夺得金牌。