AI模型｜数学推理能力大进步！ Google、OpenAI达奥数金牌水平

Google公司与人工智能（AI）新创公司OpenAI宣布，他们的AI模型在国际数学奥林匹克（奥数）竞赛夺得金牌。这是AI系统首次在国际奥数比赛中达到金牌的门槛，标志了AI在数学推理能力上的突破。

国际数学奥林匹克竞赛是高中生顶尖数学赛事，今年有6道考题，42分满分，得35分以上可获金牌。有别于AI公司之前运用的方法，Google公司（Google）与OpenAI的模型透过使用自然语言的通用「推理」模型处理数学概念，分别成功解出6道题目中的5题。

2025年奥数比赛金牌。 X@sato2718

2025年奥数比赛金银铜牌。 imojp.org

中国队5人满分，全场第一。 X@xuejianosaka

参赛队伍分数节录。 IMO官网

2025国际数学奥林匹克竞赛题目。

Google AI去年仅获银牌，今年DeepMind使用一款暂未公开的全新模型参赛，搭载了Deep Think推理模式，结果答对5题，以35分获得金牌。而它没有答对的最后一题，做对的人类考生也只有5人。

OpenAI同样用未公开版本解题，比Google更早公布了自己的答案，也是获得35分的金牌水平，但他们没有正式参赛。

Google Deepmind 去年只得银牌，今年获得金牌。法新社示意图

美国布朗大学（Brown University）数学教授、Google Deepmind客座研究员郑俊赫（Junehyuk Jung，译音）指出，这项成就意谓著AI将于未来一年内，协助数学家破解尖端数学研究领域的待解难题。郑俊赫告诉路透社：「我认为，等到我们能够运用自然语言解决艰难推理问题的时候，AI和数学家的合作即有望实现。」

OpenAI企业用户突破300万，9个月增3倍，再推办公新AI功能。

OpenAI的突破是透过新型态实验模型达成，该模型的核心在于大规模扩展「测试时计算」（test-time compute）。OpenAI研究员布朗（Noam Brown）表示，这种方法让模型「思考」更久，并且导入平行计算，同时执行多条平行推理路径。布朗拒绝透露它在计算能力上为OpenAI造成多少成本，但坦言「非常昂贵」。

第66届国际数学奥林匹克竞赛在澳洲昆士兰阳光海岸举行，吸引全球 630名数学精英参赛，其中5名选手获得42分满分，得35分以上可获金牌，全部共有67人夺得金牌。