OpenAI最强模型GPT-5.4发布,争夺企业市场
创始人
2026-03-06 22:41:22
0

来源:21世纪经济报道

随着AI大模型进入智能体时代,技术竞赛从语言能力转向多模态,企业市场应用落地成为竞争焦点。

3月5日,OpenAI发布新一代大模型GPT-5.4,并称其为OpenAI目前功能最强大、效率最高的专业级模型,同时面向ChatGPT及API平台推出GPT-5.4 Pro版本。

(资料图)

新模型主打智能体编程,也更贵了

OpenAI介绍,GPT-5.4在专业工作、智能体执行和复杂知识任务上表现出色,面向复杂专业工作场景进行了重点优化,重点提升了创建和编辑文档、表格、演示文稿的能力,并在编程能力上达到领先水平。

OpenAI测评显示,GPT-5.4在事实陈述方面将错误率降低了33%。与之对应,在GDPval测试中,GPT-5.4在44种职业任务里,有83%的结果达到或超过专业人士水平,GPT-5.2为70.9% 。

智能体(Agent)能力亦成为此次升级重点,GPT-5.4还具备原生电脑操作能力,能够结合截图、键盘鼠标指令与工具调用,在不同应用之间执行复杂工作。

OpenAI介绍,GPT-5.4可以解读浏览器界面截图,执行发送邮件和安排行程等工作。OpenAI测评显示,在桌面环境测试OSWorld-Verified下拿到75%的成绩,比Anthropic的Claude Opus 4.6的72.7%表现更好。

在官方展示中,GPT-5.4表现了出色的工作执行能力。例如用户把一项复杂任务交给GPT-5.4 Thinking时,模型会先给出一段前置计划,说明接下来准备如何搜索、整理和执行,用户还可以在执行过程中随时补充要求,模型再据此调整方向,生成更贴合需求的最终结果。

此外,在办公场景中,GPT-5.4能够围绕销售演示、排班表或制造流程图等任务,直接生成演示文稿、表格和文档;在开发者场景中,它还可以结合截图以及键盘、鼠标操作,在不同软件之间完成复杂任务。

GPT-5.4当日上线了ChatGPT网站、智能助手App、API调用平台和编程产品Codex,其中GPT-5.4 Thinking面向付费订阅用户开放,以取代GPT-5.2 Thinking,后者为付费用户保留三个月,并将于6月5日下线。GPT-5.4 Pro则面向开发者与企业用户开放。

价格方面,虽然OpenAI方面强调新模型耗费Token更少、效率更高,但性能提高的结果是价格上涨。GPT-5.4输入价格2.5美元/百万token,输出价格15美元/百万token;GPT-5.4 Pro输入30美元/百万token,输出180美元/百万token。输入价格比GPT-5.2和GPT-5.2-Pro大幅上涨了42.9%。

与Anthropic竞争升温

尽管GPT-5.4能力出色,但在AI市场上,OpenAI面临着与Anthropic的激烈竞争。

Anthropic由OpenAI前研究高管、主导GPT-2模型训练的Dario Amodei于2021年创立,其核心创始团队均出身于OpenAI,旗下AI模型及同名AI应用Claude与OpenAI展开竞争。

Anthropic旗下尖端大模型Claude凭借突出的编程能力,正受到越来越多企业客户青睐。金融科技公司Ramp近期发布报告称,其通过分析平台上数万家美国企业的信用卡及账单支付数据,来追踪企业软件支出变化。该报告显示,截至2026年2月,在企业AI聊天工具订阅支出占比上,Anthropic已超过OpenAI。

在收入方面,Anthropic虽仍落后于OpenAI,但追赶速度明显加快。Anthropic最新年化收入已逼近200亿美元,企业客户收入占主要来源。相比之下,OpenAI截至2026年2月底的年化收入已突破250亿美元,较2025年底约214亿美元进一步增长,与Anthropic更偏企业端的收入结构相比,OpenAI除了企业和开发者业务外,还依托ChatGPT订阅费维持庞大现金流。

因此,本次GPT-5.4重点提升的智能体和编程能力,正是瞄准了Anthropic的优势市场,大力吸引企业客户。

中信证券研报表示,从OpenAI企业端AI的数据来看,2025年企业级AI处于场景探索阶段,用户数和流量实现高增,能力平权和人员降本价值凸显,且行业整体渗透率仍有较大提升空间。中信证券认为,2026年以强化学习技术发展为基础的Agent将持续演进,带动AI从降本到增收打开更多应用场景,其中数据分析、代码生成、人力招聘、销售辅助、智能客服等场景需求较为清晰。

值得注意的是,尽管ChatGPT凭借先发优势在消费者市场占据主导,但OpenAI近期卷入的军事应用争议为对手提供了机会。随着Anthropic公开反对将技术用于大规模监控及军事用途,并因此与美国政府产生摩擦,这一鲜明的立场反而推动了Claude用户数激增。

数据显示,上周六Claude下载量突破10.2万次,较前一周增长48%,而ChatGPT则持平于29.7万次。本周,Claude首次超越ChatGPT,登顶美国App Store下载榜首。Anthropic官方证实,因为“空前的需求”,其服务一度出现短暂中断。

此前在2月27日,OpenAI宣布开启新一轮1100亿美元融资,包括软银集团300亿美元、英伟达300亿美元以及亚马逊的500亿美元。同期OpenAI披露,ChatGPT目前周活跃用户已突破9亿,个人订阅用户规模超过5000万。

OpenAI还称,2026年年初以来,订阅用户的增长势头显著提速,1月和2月的新增订阅用户数有望创下历史单月最高纪录。自2026年年初以来,OpenAI推出的编程工具Codex的周活跃用户量已增长至160万,增长了两倍多。

相关内容

热门资讯

德国总理:美国正在被伊朗羞辱 德国之声4月27日报道,德国总理默茨在访问一所学校时表示,在当前的持续冲突中,伊朗领导层正试图羞辱美...
理响中国|“长”歌以行,风云激... 光阴如梭,东方潮阔。这里是中国的长三角,世界的长三角。无论过去、现在还是未来,这片土地都因时代而生,...
白宫:特朗普及其国安团队开会讨... 新华社华盛顿4月27日电 美国白宫新闻秘书莱维特27日在记者会上证实,总统特朗普及其国家安全团队当天...
人民日报刊文:日本放开杀伤性武... 日本放开杀伤性武器出口推高地缘冲突风险(国际论坛)常思纯《人民日报》(2026年04月28日 第 0...
医疗保障法草案二审:明确生育保... 满足多样化健康保障需求本报记者 彭 波4月27日,医疗保障法草案二审稿提请十四届全国人大常委会第二十...
天津一景区发生自转旋翼机事故1... 澎湃新闻记者 吕新文中国民用航空华北地区管理局4月22日公布《豪客通航“10•1”天津长芦汉盐旅游区...
卡塔尔埃米尔与美国总统特朗普通... 当地时间24日,卡塔尔埃米尔塔米姆与美国总统特朗普通电话,重点就中东地区局势以及伊朗与美国谈判问题交...
男子30年前被扣押2859克黄... 澎湃新闻记者 王鑫家住辽宁省大连市的潘永嘉近日向澎湃新闻反映称,三十年前,他在大连周水子机场被盖州市...
商务部:取消反制欧盟两家金融机... 中华人民共和国商务部令二〇二六年 第1号鉴于欧盟已取消对中国两家金融机构的制裁措施,现公布《关于取消...
过去24小时共有5艘船只通过霍... 总台记者当地时间24日获悉,过去24小时内,共有5艘船只通过霍尔木兹海峡,其中包括一艘伊朗油轮。(总...