上海人工智能实验室开源通用多模态大模型书生・万象3.5
创始人
2025-09-05 02:21:28
0
🤖 由 文心大模型 生成的文章摘要

前文介绍了上海人工智能实验室

上海人工智能实验室(上海AI实验室)宣布开源通用多模态大模型书生・万象3.5(InternVL3.5),其推理能力、部署效率与通用能力全面升级。此次开源标志着人工智能领域在多模态技术方面取得了重大突破,为全球科研人员和开发者提供了更强大的工具。

InternVL3.5本次开源涵盖了9种不同尺寸的模型,参数范围从10亿至2410亿,以满足各种场景下的多样化需求。其中,旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获得了77.7分的高分,在所有开源模型中位居榜首。该模型的多模态通用感知能力超越了GPT-5,文本能力也在主流开源多模态大模型中独占鳌头。

与之前的InternVL3.0相比,InternVL3.5在图形用户界面(GUI)智能体、具身空间感知、矢量图像理解与生成等多个特色任务上取得了显著提升。上海AI实验室的研究团队在此次升级中,着重强化了InternVL3.5在实际应用中的智能体与文本思考能力,实现了在多个关键场景中从“理解”到“行动”的跨越,这一成果得到了多项评测的验证。

GUI交互方面,InternVL3.5在ScreenSpot-v2元素定位任务中获得了92.9分的优异成绩,超越了同类模型。该模型不仅支持WindowsUbuntu系统的自动化操作,还在WindowsAgentArena任务中大幅领先于Claude-3.7-Sonnet。在具身智能体测试中,InternVL3.5展现出了对物理空间关系的理解能力,并能够规划导航路径,在VSI-Bench测试中以69.5分的成绩超过了Gemini-2.5-Pro。在矢量图形理解与生成方面,InternVL3.5在SGP-Bench测试中刷新了开源纪录,其生成任务的FID值也优于GPT-4o和Claude-3.7-Sonnet。

具体而言,InternVL3.5具备跨平台操作能力,可在Windows、Mac、Ubuntu、Android等多个平台上识别界面元素,并自主执行鼠标和键盘操作,实现诸如恢复已删除文件、导出PDF、邮件添加附件等任务的自动化。此外,InternVL3.5还具备更强的grounding能力,能够在全新的复杂小样本具身场景中实现泛化,配合抓取算法,支持可泛化的长程物体抓取操作,助力机器人更高效地完成物品识别、路径规划与物理交互。

作为上海AI实验室书生大模型体系的重要组成部分,InternVL专注于视觉模型技术。目前,InternVL全系列的全网下载量已突破2300万次,显示出其在全球范围内的广泛应用和影响力。

上海AI实验室开源InternVL3.5,旨在推动多模态大模型技术的进一步发展,促进全球科研人员和开发者之间的合作与创新。通过提供这一强大的开源工具,实验室希望加速人工智能在各个领域的应用,为解决现实世界的复杂问题提供更多可能性。

相关内容

热门资讯

马克龙:26国将“在停火或和平... 新华社巴黎9月4日电(记者唐霁 周楚昀)法国总统马克龙4日在首都巴黎举行的支持乌克兰“志愿联盟”线上...
原创 华... 华为在9月份的首场新品发布会已结束,推出了众多新品,比如三折叠屏、新平板mini版本、新耳机等,可谓...
我来教大家新闲游开挂神器🔼讲... 新道游反杀挂大厅房卡咨询微信号:【327668588】无需打开、直接添加1.添加微信号:【32766...
关于ㄌ长虹大厅充值房卡ㄐ房卡... 关于ㄌ长虹大厅充值房卡ㄐ房卡充值客服 买挂去哪个网站【添加微信:327668588】 关于ㄌ长虹大厅...
神龙大厅房卡怎么购买 「重大通仪表制造业要发展壮大,既要向国外先进企业学习,又要矢志不移坚持自主创新,坚定创新信心,着力增...
实测教程分享♣♤战皇金华房卡... 实测教程分享♣♤战皇金华房卡在哪买۞۩详细房卡怎么购买教程推荐 买挂去哪个网站【添加微信:32766...
代理盘点“熊猫来了有没有挂辅... 代理盘点“熊猫来了有没有挂辅助”联系购房卡客服 咨询房卡加微号:327668588领优惠卡培训会现场...
新手必搜“熊猫来了辅助开挂操... 新手必搜“熊猫来了辅助开挂操作方法”没挂千万别去玩 买挂去哪个网站【添加微信:327668588】 ...
大神揭秘鲨鱼众娱人皇大厅贝壳... 大神揭秘鲨鱼众娱人皇大厅贝壳互娱ㄝ各种房卡开控挂优势出 加:微(327668588)炸 金 花链接房...
拓维信息湖南新设云智科技公司,... 近日,一家专注于人工智能领域的新公司——湖南拓维云智科技有限责任公司正式成立,引起了业界的广泛关注。...