“深层思维”宣布人工智能测试得分达国际数学奥赛金牌水平
创始人
2025-07-22 16:01:06
0

新华社伦敦7月22日电 谷歌旗下“深层思维”公司21日宣布,其搭载了“深度思考”能力的高级版“双子座(Gemini)”人工智能模型测试得分达到国际数学奥林匹克竞赛(IMO)金牌水平,该成绩已获官方认证。

“深层思维”公司在官网发布公报说,高级版“双子座”模型的“深度思考”模式成功解答了2025年国际数学奥林匹克竞赛6道题目中的5道,共获35分,达到金牌水平。相关解题方案已在网上公布。

“我们可以证实,谷歌‘深层思维’已达成这一备受期待的里程碑,在总分42分中获得35分——这已达到(今年)金牌分数线。”国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授说。他称解题方案在诸多方面都“令人惊叹”。国际数学奥林匹克竞赛评分员认为这些方案清晰、精确,且大多数都易于理解。

国际数学奥林匹克竞赛自1959年起每年举办一届,参赛选手需在两天(每天各4.5小时)内解答涉及代数、组合数学、几何和数论四大领域的6道极具难度的题目。近年来,该竞赛成为检验人工智能模型解决高级数学问题能力和推理能力的热门挑战。

“深层思维”公司推出的人工智能模型AlphaProof与AlphaGeometry 2组合解答了2024年国际数学奥林匹克竞赛6道题中的4道,以28分的成绩达到当年银牌水平。为了让这两个模型理解题目,专家先将题目从自然语言翻译成特定计算机语言,解题总共耗费两到三天的计算时间。今年,高级版“双子座”测试成果相比去年有显著进展,它直接根据自然语言描述的题目给出数学证明,并在竞赛时限内完成挑战。竞赛协调员采用与学生选手解题方案相同的标准对其进行正式评分和认证。

“深层思维”公司说,今年取得的成果得益于高级版“双子座”的“深层思考”模式——这是一种针对复杂问题的增强推理模式,融合了“并行思维”等最新技术。这种模式设置可使模型在给出最终答案之前,同时探索并整合多种可能的解决方案,而非沿着单一、线性思路推进。(完)

相关内容

热门资讯

俄乌第三轮直接谈判结束,双方同... 俄乌第三轮直接谈判顺利结束,这一消息为紧张局势带来了一丝缓和的曙光。双方在谈判桌上展现出了一定的沟通...
周鸿祎预言:智能体时代来临,中... 在2025年第二十四届中国互联网大会的盛大开幕式上,360集团的创始人周鸿祎就智能体的发展轨迹、面临...
“未来互联网·夏尔希里新对话”... 央广网博乐7月24日消息(记者郭璁悦)7月23日,以“数字赋能边疆 科技引领未来”为主题的“未来互联...
沙海寻铀:塔里木盆地地下182... 一周之内,我国铀资源勘探开发接连迎来重大进展。 先是7月12日,位于内蒙古鄂尔多斯的“国铀一号”示范...
美众议院议长:众议院本周无需就... 美众议院议长宣布,本周众议院无需就公布爱泼斯坦案记录进行投票。这一决定引发了各方的关注与讨论。爱泼斯...
原创 为... 作为一名常年混迹数码圈的发烧友,我见识过太多标榜"高性价比"的入门耳机,且在中低端降噪耳机中,一直存...
中国信通院开展面向大模型的全栈... 【中国信通院开展面向大模型的全栈国产软硬件系统适配测试工作】财联社7月23日电,中国信息通信研究院依...
Win 11升级这个劫,我是非... 不知道现在大伙儿电脑都用的啥系统? 随着 Win 10 死期将至,大伙们可能必须得升级 Win 11...
时代电气:2024年度新兴装备... 证券之星消息,时代电气(688187)07月23日在投资者关系平台上答复投资者关心的问题。 投资者:...
2025年宝安图书馆第五届“馆... 7月23日下午,第五届馆长少年智慧营“我的图书馆升级计划”创新提案赛在宝安图书馆负一楼报告厅2落下帷...