林俊旸离职后,阿里Qwen3.5首次发新
创始人
2026-03-20 17:53:42
0

智东西

作者|江宇

编辑|冰倩

智东西3月20日报道,今日,阿里千问最新旗舰模型预览版Qwen3.5-Max-Preview正式亮相,并登上全球大模型评测平台LMArena。在最新榜单中,该模型拿下1464分,进入第一梯队,同时带动阿里千问跻身全球大模型实验室前五、国内第一

在强调模型基础能力对比的without style control评测条件下,其整体性能以1470分的成绩,强势进入全球前列,排名全球第六、国内第一

Arena Expert专家榜单来看,该模型位列第十,分数为1498,排在GPT-5.4、Claude Opus 4.5系列、Claude Sonnet 4.6以及Gemini 3 pro等模型之后,但已经超过GPT-5.2-chat-latest、Claude Sonnet 4.5(thinking版本)以及Gemini 3 Flash等模型,与头部模型形成贴身竞争。

从分项能力表现来看,Qwen3.5-Max-Preview在数学和文本任务上均进入前列。其数学能力进入全球前五专家级文本能力进入前十

从与前代模型Qwen3-Max与Qwen2.5-Max的对比数据来看,这一版本的提升在多个高频文本与推理场景中。

Qwen3.5-Max-Preview在创意写作任务上提升57分,数学能力提升49分,娱乐、体育与媒体类任务提升48分,整体文本能力提升45分,同时在写作、文学与语言相关任务中同样提升45分。整体能力呈现出较为均衡的提升。

从Qwen3-Max的参数规模推测,Qwen3.5-Max很可能是阿里当前参数规模最大的模型,且大概率仍为闭源旗舰模型。

今年以来,阿里已陆续开源发布Qwen3.5系列模型,覆盖从0.8B到397B不同规模,共8款不同尺寸,有较完整的开源梯度。其中,Qwen3.5-Plus采用约3970亿总参数、170亿激活参数的结构,在同尺寸模型中表现较为突出。

结语:第一轮成绩落地,Qwen3.5-Max等待正式版验证

模型层的突破正成为阿里AI转型的第一张王牌。

Qwen3.5-Max-Preview已经先给出了第一轮成绩单,但这一版本仍处于预览阶段。接下来,随着正式版本发布,其能力表现和稳定性是否进一步提升,是这款旗舰模型真正要回答的问题。

相关内容

热门资讯

《武林外传》20年:演员现状,... 有人的地方就叫江湖。江湖瞬息万变,只有一种东西永存,就是侠义。时间弹指一挥,《武林外传》开播20周年...
小米新一代SU7涨价引争议,发... 来源:滚动播报 (来源:财闻) 新一代SU7较初代SU7涨价4000元,新一代SU7上市后,社交媒体...
马斯克“扫货”光伏设备 AI加... 来源:财联社 《科创板日报》3月20日讯 “太空将是迄今为止放置AI最便宜的地方。在36个月内,或者...
春分遇上“龙抬头”,下次要到2... 春分平昼夜,“苍龙”正“抬头”。3月20日将迎来一场罕见的天象巧合——“龙抬头”与春分相遇。同为春季...
为什么对伊朗的战争不可能“打了... 静楠:“反政权=支持外部军事干预”可能是特朗普及其支持者最深的误判。战争在相当程度上让伊朗社会重新凝...
丹麦被曝向格陵兰岛派遣部队:必... 澎湃新闻记者 谢瑞强 实习生 邱姿爽丹麦方面被曝已制定应急方案:一旦美国对格陵兰岛采取军事行动,驻扎...
山地物流“新农具”来了 一款新... 来源:新华网 记者3月20日从中国兵器工业集团西安爱生技术集团有限公司获悉,由该公司研发的“爱生灵鹊...
二线CPO厂商加速突围,谁弹性... CPO作为下一代光互联核心技术,通过将光引擎与交换机芯片共封装,实现功耗降低、密度提升与成本优化,是...
广东有人在深山张网捕鸟,志愿者... 极目新闻记者 刘琴3月20日,博主“渔猎齐哥”在社交平台发布视频称,在肇庆市封开县的深山里,有人张网...
特斯拉200亿元光伏大单曝光,... 【文/观察者网 阮佳琪】 当地时间20日,路透社援引知情人士消息称,特斯拉正计划从包括苏州迈为科技...