OpenAI发布GPT-5-Codex升级版本提升编程智能体性能
创始人
2025-09-16 19:41:30
0

来源:至顶网

OpenAI周一宣布,将为其AI编程智能体Codex发布新版本的GPT-5。该公司表示,这个名为GPT-5-Codex的新模型在"思考"时间上比以往模型更加灵活动态,在编程任务上可以花费几秒钟到七小时不等的时间。因此,它在编程智能体基准测试中表现更佳。

新模型现已在Codex产品中推出——可通过终端、IDE、GitHub或ChatGPT访问——面向所有ChatGPT Plus、Pro、Business、Edu和Enterprise用户。OpenAI表示计划未来向API客户提供该模型。

此次更新是OpenAI努力让Codex在与其他AI编程产品竞争中更具优势的一部分,这些竞品包括Claude Code、Anysphere的Cursor或微软的GitHub Copilot。由于用户需求强烈,AI编程工具市场在过去一年变得更加拥挤。Cursor在2025年初ARR超过5亿美元,而类似的代码编辑器Windsurf则成为混乱收购尝试的焦点,其团队最终在Google和Cognition之间分裂。

OpenAI表示,GPT-5-Codex在SWE-bench Verified(衡量编程智能体能力的基准)以及衡量大型成熟代码库重构任务性能的基准测试中,都优于GPT-5。

该公司还表示,他们训练GPT-5-Codex进行代码审查,并请经验丰富的软件工程师评估模型的审查评论。据报告,工程师们发现GPT-5-Codex提交的错误评论更少,同时增加了更多"高影响力评论"。

在一次简报中,OpenAI的Codex产品负责人Alexander Embiricos表示,性能提升很大程度上归功于GPT-5-Codex的动态"思考能力"。用户可能熟悉ChatGPT中GPT-5的路由器,它根据任务复杂性将查询引导到不同模型。Embiricos说GPT-5-Codex工作方式类似,但内部没有路由器,可以实时调整在任务上工作的时长。

Embiricos表示,相比于在开始时就决定在问题上使用多少计算能力和时间的路由器,这是一个优势。相反,GPT-5-Codex可以在处理问题五分钟后决定需要再花一个小时。Embiricos说他见过该模型在某些情况下需要超过七小时的时间。

Q&A

Q1:GPT-5-Codex相比之前的模型有什么改进?

A:GPT-5-Codex的主要改进是具有动态"思考能力",可以根据任务复杂性实时调整处理时间,从几秒钟到七小时不等。它在编程智能体基准测试中表现更佳,代码审查时错误评论更少,高影响力评论更多。

Q2:哪些用户可以使用GPT-5-Codex?

A:目前GPT-5-Codex已向所有ChatGPT Plus、Pro、Business、Edu和Enterprise用户推出,可通过终端、IDE、GitHub或ChatGPT访问。OpenAI计划未来向API客户提供该模型。

Q3:GPT-5-Codex与其他AI编程工具相比有什么优势?

A:GPT-5-Codex的主要优势是其动态思考能力,不像传统路由器在开始时就决定计算资源分配,它可以在处理过程中实时调整,在问题处理五分钟后决定是否需要更多时间,最长可达七小时。

相关内容

热门资讯

具身智能机器人“全国挑战赛”在... 在9月12日举行的江苏省具身智能机器人产业联盟第一次成员大会上,埃斯顿杯全国大学生具身智能机器人应用...
好评中国|数字化赋能,让文化瑰... 9月16日至17日,以“数联古今 智绘文明——携手构建网络空间命运共同体”为主题的2025年世界互联...
渐冻症治疗新药来了,湖南首针开... 华声在线9月16日讯(全媒体记者 高煜棋 通讯员 乔木)9月16日,记者从中南大学湘雅医院了解到,6...
中方划下红线,有了美国支持后,... 仗着有美国的支持,菲律宾再派十几艘船只擅闯黄岩岛,中方是如何展开反制的?为维护黄岩岛自然生态系统多样...
上新!阜阳这几项产品入选省级名... 近日,安徽省新产品(2025年第二批)认定结果出炉,全省共有160项产品入选,我市防静电超细纤维复合...
线下场景价值重构:数字化浪潮下... 普华永道预测,2028 年中国数字户外市场规模将达 625 亿元,其中 AI 赋能型广告占比超 35...
以军向也门荷台达港发出撤离警告 当地时间16日,以色列国防军向胡塞武装控制的也门西部荷台达港发出“紧急”撤离警告,以军将于未来几小时...
降低大模型幻觉、让企业AI输出... 智东西 作者 | ZeR0 编辑 | 漠影 智东西9月16日报道,生成式AI幻觉问题是令人们不敢信任...
深夜,变态邻居又开始了…… 家住一楼的小葵怎么也没想到,只是睡一觉的功夫,天就塌了。深夜时分,隔壁邻居竟偷偷瞒着所有人,私自找泥...
永城经开区:数智赋能助产业升级 9月9日,在位于永城经济技术开发区的帅翼驰(河南)新材料科技有限公司的智能互联铝合金材质效车间内,自...