林俊旸离职后,阿里Qwen3.5首次发新
创始人
2026-03-20 17:53:42
0

智东西

作者|江宇

编辑|冰倩

智东西3月20日报道,今日,阿里千问最新旗舰模型预览版Qwen3.5-Max-Preview正式亮相,并登上全球大模型评测平台LMArena。在最新榜单中,该模型拿下1464分,进入第一梯队,同时带动阿里千问跻身全球大模型实验室前五、国内第一

在强调模型基础能力对比的without style control评测条件下,其整体性能以1470分的成绩,强势进入全球前列,排名全球第六、国内第一

Arena Expert专家榜单来看,该模型位列第十,分数为1498,排在GPT-5.4、Claude Opus 4.5系列、Claude Sonnet 4.6以及Gemini 3 pro等模型之后,但已经超过GPT-5.2-chat-latest、Claude Sonnet 4.5(thinking版本)以及Gemini 3 Flash等模型,与头部模型形成贴身竞争。

从分项能力表现来看,Qwen3.5-Max-Preview在数学和文本任务上均进入前列。其数学能力进入全球前五专家级文本能力进入前十

从与前代模型Qwen3-Max与Qwen2.5-Max的对比数据来看,这一版本的提升在多个高频文本与推理场景中。

Qwen3.5-Max-Preview在创意写作任务上提升57分,数学能力提升49分,娱乐、体育与媒体类任务提升48分,整体文本能力提升45分,同时在写作、文学与语言相关任务中同样提升45分。整体能力呈现出较为均衡的提升。

从Qwen3-Max的参数规模推测,Qwen3.5-Max很可能是阿里当前参数规模最大的模型,且大概率仍为闭源旗舰模型。

今年以来,阿里已陆续开源发布Qwen3.5系列模型,覆盖从0.8B到397B不同规模,共8款不同尺寸,有较完整的开源梯度。其中,Qwen3.5-Plus采用约3970亿总参数、170亿激活参数的结构,在同尺寸模型中表现较为突出。

结语:第一轮成绩落地,Qwen3.5-Max等待正式版验证

模型层的突破正成为阿里AI转型的第一张王牌。

Qwen3.5-Max-Preview已经先给出了第一轮成绩单,但这一版本仍处于预览阶段。接下来,随着正式版本发布,其能力表现和稳定性是否进一步提升,是这款旗舰模型真正要回答的问题。

相关内容

热门资讯

尹乃菁请辞获准!马英九前发言人... 海峡导报综合报道 中国国民党今天(22日)发布党务人事命令,原文传会主委尹乃菁因个人生涯规划请辞获准...
林内热水器不点火原因 林内热水器不点火的原因有几种:1、电源不通,整个电路断开导致热水器不点火。2、按钮损坏,无法输出启动...
燃气灶金属针不点火怎么办 燃气灶金属针不点火是一种常见的故障,不能忽视。如果您遇到了这种情况,以下是您可以尝试的一些解决方法:...
燃气灶点火针不放电什么原因?怎... 燃气灶点火针不放电什么原因:1、电池电量不足,或者干脆没电,要扩大范围算,电池松脱也属于此类情形。2...
燃气灶出气小原因 燃气灶是我们日常生活中常用的厨房用具。它的使用频率非常高,但是有时候我们会遇到燃气灶出气小的问题,这...
燃气灶打不出气是啥原因 燃气灶打不出气通常有以下几个原因:1. 气路堵塞:燃气灶内的气路可能会被油脂或其他物质堵塞,导致气体...
“甲酰胺纸尿裤”之争,谁来为孩... 舆论站队并不能解决问题,孩子的健康不能赌,既然都呼吁成立国家级调查组,这或许是最可行的出路据南方日报...
财政部:在政府采购活动中对46... 关于在政府采购活动中对有关美国企业采取相关措施的通知财库〔2026〕10号各中央预算单位,各省、自治...
赴清荷之约 揽好运“莲莲” 这... 紫荆山公园荷花清雅脱俗金明池遗址公园的宋韵荷景鹤壁五岩山山间清荷嫣然绽放洛阳中国国花园鸟儿落在含苞待...
伊媒:对美国的考验已经开始 美伊签署谅解备忘录后,首场谈判于6月21日在瑞士举行。这次谈判虽然出现波折,但是取得了一定的成果。伊...