科技日报记者 刘霞
美国斯坦福大学日前发布研究报告指出,在能力与采用率方面,中国的人工智能(AI)模型——尤其是开放权重的大语言模型,已接近甚至部分领先于国际先进水平。
报告彰显了这样一个事实:当今年1月DeepSeek公司推出的推理模型DeepSeek-R1震动全球投资界、令英伟达单日市值蒸发近千亿美元时,这家杭州初创企业并非中国AI领域的“孤勇者”,而是一个更庞大而多元生态体系的缩影。中国开放权重AI模型在全球范围内的广泛采用,正悄然重塑全球AI技术领域的竞争格局。
中国开放权重模型表现优异
开放权重指AI模型的参数权重可被公开下载、使用与修改,开发者能在官方应用或接口之外独立运行并调整模型,以适应自身需求。美国OpenAI公司的ChatGPT、谷歌公司的“双子座”(Gemini)等闭源模型的内部机制受到严密保护,相比之下,阿里巴巴、DeepSeek等公司提供的开源模型,则允许开发者按需定制软件内容。
斯坦福报告重点分析了4个具有代表性的中国大语言模型系列:阿里巴巴的通义千问、DeepSeek-R1、月之暗面的KimiK2,以及智谱AI(现已更名为Z.ai)的GLM-4.5。
报告显示,在涵盖通用推理、代码生成与工具使用等多项基准测试中,这些中国AI模型已接近全球顶尖水平。所有进入前22名的中国开放权重模型,均超越了OpenAI的开源模型GPT-oss。
多项数据指向同一结论:在开源大模型领域,中国已从追赶者转变为领跑者。例如,通义千问的能力可媲美Anthropic的Claude,并接近OpenAI与谷歌公司的最佳模型,同时还具备显著的成本优势。
中国AI模型获海外青睐
凭借开源、低成本等优势,中国AI模型的成本效益正在重塑全球商业决策。
开发平台OpenRouter与美国硅谷著名风投机构“安德里森·霍罗威茨”12月发布的报告显示,中国开放权重模型在全球的使用率从2024年底的1.2%大幅攀升至今年8月的近30%。
中国人民大学重阳金融研究院院长王文指出,中国的开源模型“价格实惠,部分甚至免费,且性能良好”。一位匿名美国企业家表示,其公司通过采用通义千问而非ChatGPT等专有模型,每年节省约40万美元。“如果追求顶尖功能,或许会选择OpenAI、Anthropic或谷歌的模型,但大多数应用场景其实并不需要。”
英伟达、人工智能公司Perplexity以及斯坦福大学员工均在工作中使用通义千问。Airbnb首席执行官布莱恩·切斯基今年11月透露,公司客服聊天机器人选用通义千问而非ChatGPT,原因很简单:“(通义千问)又快又便宜”。
据美国前哨网站报道,2025年9月,通义千问正式超越Meta的Llama,成为“抱抱脸”(HuggingFace)平台下载量最高的大语言模型。截至12月中旬,其累计下载量已达约3.85亿次,高于Llama的3.46亿次。MiniMax与Z.ai的模型在海外同样广受欢迎。
中国AI模型开发持续快速迭代。不少企业已投身于AI代理的研发竞赛——这类具备推理能力的程序能通过聊天机器人完成在线任务,如订票、管理日程等。友好且开源的设计,如月之暗面去年11月发布的KimiK2,已被广泛视为生成式AI发展的下一个前沿。
引领全球AI生态与治理
斯坦福报告指出,中国AI模型的快速崛起助推了全球AI技术的广泛采用。前哨网站的报道也指出,今年1月以来,基于通义千问与DeepSeek衍生的模型数量持续增长。截至今年9月,中国模型的衍生版本已占“抱抱脸”当月新增衍生模型的63%。这意味着全球开发者社区正以前所未有的速度,围绕中国模型构建应用生态。
该报告同样认为,中国开放权重模型在全球的广泛采用可能重塑全球技术获取和依赖模式,影响全球AI治理、安全以及竞争格局。
报告主要作者、斯坦福大学以人为本AI研究所政策研究负责人卡罗琳·迈因哈特认为,开放模型的本质有利于技术接受更广泛的审视。中国AI健康平台BOKHealth首席技术官高飞对此表示认同,他强调,开源的透明度与共享特质,本身就是建立信任的最佳途径。
DeepSeek-R1的发布甚至影响了美国对开放权重模型的政策态度。2025年7月,白宫发布《美国AI行动计划》,将开放权重模型提升为战略资产。一个月后,OpenAI时隔近6年首次发布采用Apache2.0许可证的开放权重模型。其首席执行官萨姆·奥尔特曼在与记者交流时坦言,中国开源模型的竞争是促成该决定的关键因素。
迈因哈特强调,AI领域的全球领导地位,不仅取决于专有系统的先进程度,也依赖于开放权重模型在全球的覆盖、采纳与规范影响力。