信仰与突围:2026人工智能趋势前瞻
创始人
2025-12-23 00:41:40
0

王齐昂 独立科技观察者

谁也无法想到,ChatGPT迎来三周年之际,没有庆祝和纪念,反而是内部发布的一封红色警报,再次敲响了人工智能竞争白热化的战鼓。在受到Gemini 3惊艳效果的威胁下,Open AI加速推出了GPT 5.2,用更多的资源,在多项指标上实现了反超。但三年下来,各大模型之间的性能差距和范式差异持续缩小,业界出现不少质疑的声音,认为大模型发展正面临天花板。但也有很多人坚定看好AGI的到来,产业充满了更多的争论和分化。

站在2025的年尾,回顾来时之路,从DeepSeek的火热,到GPT4o 后吉卜力动画的流行,Sora2的与山姆奥特曼同框,再到谷歌Nano Banana生图的各种机器猫讲解。有时似乎有恍如隔世之感,一项今年的技术,仿佛已是多年前的流行。

展望2026,我们不仅感受到对大模型智能瓶颈和投资回报不确定性的焦虑,看到更多的非共识,也看到大家的坚守和信仰,以及有望在多个方向的突围,更多的期待和探索正在扑面而来。

信仰

1.Scalling Law驱动向AGI持续进化

自 ChatGPT 横空出世以来,业界主流都相信只要不断增加算力、扩充数据、堆叠参数,机器的智能就会像物理定律一样增长,直至触达 AGI 的奇点。

然而,随着这两年大模型智能的升级逐渐放缓,以及数据枯竭论等观点,对规模法则的质疑之声越来越大。Scaling Law 究竟是通往神坛的阶梯,还是人类在数学和统计学迷宫中建造的一座注定无法封顶的巴别塔?对此,Gary Marcus 认为大模型并不真正理解世界,只是在巨量语料中拟合了语言相关性,而真正的智能应包含抽象化、因果建模、符号推理与长期记忆。近日伊利亚在播客中表示,规模法则正在接近极限,强化学习虽然消耗巨大算力,但并不能算作真正的扩展。未来的突破将来自更好的学习方式,而不是简单扩展规模。

伊利亚的观点有其道理,因为真正需要的不是规模,而是解决问题的好方法。但是在底层架构没有突破性创新、训练方法没有颠覆式变革的背景下,规模法则仍然是一条可行的路径。从工程与产业逻辑看,Scaling Law 依然是目前最可靠、最实用的一条增长路径。其优势在于:第一,能力提升可预测,可通过增加训练 FLOPs 和优化数据等方式,预测模型能力;第二,产业投入可评估,算力、算法、数据等要素可按线性扩展;第三,人才与工程体系不必推翻重来,可在原架构基础上以工程化、优化算法等方式不断迭代。

11月以来Gemini 3发布后的上佳表现,DeepSeek V3.2的研究,都印证了规模法则在现阶段依然有效。这也给美国轰轰烈烈的AI新基建,增添了一份底气。美国当前规划建设的大型数据中心项目总装机容量已突破 45 吉瓦GW,这场建设热潮预计将吸引超 2.5 万亿美元投资。针对未来算力需求,黄仁勋还提出了3个Scaling Law的观点,认为在预训练、后训练强化学习,以及推理过程中,均存在规模法则,从而支撑算力的持续增长。

黄仁勋在接受Bg2 Pod访谈中提出的AI Scaling Law

数据是当前大模型进化中最迫切的难题。因为算力暂不构成主要瓶颈,参数规模可以继续放大,而高质量可用数据则持续稀缺。业界正在探索一套系统性的扩数据方法。当前大家一定程度的的共识是:并非简单寻找更多互联网语料,而是通过合成数据、推理过程数据、强化学习数据、环境反馈数据、多模态数据与具身数据等方式,构建可放大的数据生成体系。希望不只是被动收集数据,而是构建一种可工程化、可控制、可规模化生产的能力。并通过更好的学习算法,让学习效率进一步提升。

可预见的未来,将是New Scaling Law的时代,它将不仅仅是简单的堆砌算力,而是往数量扩大和质量提升两个方向扩展。加之算力资源的充沛支持,研究员们可以有大量资源去探索算法和架构的更多可能优化路径,从而有望带来底层能力的突破。而AGI 很可能来自 scaling 与结构性创新的结合,包括世界模型、新的高效训练架构、具身智能、长期记忆机制、工具化执行链路以及更高水平的对齐系统等。

2.多模态的ChatGPT时刻到来,有望推动智能非线性跃升

谷歌Gemini、OpenAI Sora等多模态模型,已经可以很好地总结文字内容,并提炼生成栩栩如生的PPT、播客内容和视频动画,实现了对内容的深度理解,可以说是迎来了多模态的ChatGPT时刻。如果类比生命进化过程,语言其实是高级的智能形态,而这一波的大模型的突破反而是从语言开始的,与生命进化刚好走了相反的路线。未来,多模态技术的进步,可以从另一个方向去探索智能的进化,极有可能成为推动 AI 智能水平出现非线性跃升的关键因素之一。

5亿多年前的寒武纪,“眼睛”器官开始出现,动物进化速度大幅提

长期以来,大语言模型主要在文本空间中学习世界,其理解并非真正理解,其感知也并非真正感知,本质上来源于语言对现实的高度压缩与抽象。尽管这种方式已经展现出惊人的语言推理与知识整合能力,但它始终面对一个根本性限制,即模型所接触的世界,是经过人类过滤、描述和重构的二手世界。有一个生动的比喻是:虽然大模型可以绘声绘色地描述红酒的香气和味道,但大模型没有喝过一口红酒,也没有打翻过一个酒杯。

多模态模型的进步,有机会在一定程度上改变这一前提。图像、视频、语音等模态并非对世界的解释,而是对世界状态的直接投射。它们天然包含空间连续性、时间演化以及隐含的物理约束,如物体恒常性、遮挡关系、运动轨迹和因果顺序等。这些信息在文本中难以被完整表达,却在多模态数据中以被动但强制的方式存在。模型在学习多模态时,不得不面对一个更加接近真实世界的结构性约束空间,这为形成更稳健的世界模型提供了可能。

更重要的是,多模态为人工智能打开了“感知—决策—行动”闭环技术通道的可能性。当多模态感知与工具使用、机器人控制、软件操作相等结合时,智能将不再局限于回答问题、生成内容,而可以在环境中尝试、修正和规划,从而通过反馈来持续优化,实现智能的跃升。

3.研究探索在底层架构和学习范式等领域多点开花

对大模型行业来说,研究驱动一直是核心的范式。大量的实验在研发中必不可少,以小团队为单位开展多个方向的实验齐头并进,一直是OpenAI等前沿机构的有效组织方式。这种有点赛马机制的模式,对于大模型这个路线仍然不断迭代变化的领域非常契合。预计新的一年,在底层架构、训练范式、评测方法、长期记忆机制、Agent等多领域,都有望诞生更多突破性成果。

近两年,全球涌现了一批非共识且极具技术个性的实验室。包括伊利亚主打安全的SSI,已吸引30亿美金的投资,聚焦安全超智能;原OpenAI CTO Mira建立的Thinking Machines Lab,专注于解决AI系统可靠性、可定制性及多模态协作等问题,刚刚推出首款产品 Tinker,可以帮助开发者和研究人员微调语言模型。在物理世界与智能体结合的方向上,李飞飞创立的World Labs专注于空间智能,旨在让AI模型理解三维环境与物理规律,试图填补大语言模型在物理交互层面的空白。杨立昆从Meta离职后,将投身专注高级机器智能的 AI 初创公司AMI,目标是构建能理解物理世界、具备持久记忆、推理并能规划复杂动作序列的系统。在智能体方向上,欧洲的H Company认为,如果 AI 不能持续解决复杂现实问题,那么再流畅的对话能力也只是表象智能。重点研发能持续解决复杂任务的认知系统,希望能打造能像人一样操作工具、执行复杂工作流的超级Agent。

在底层架构与训练范式创新方面,行业内也出现了很多值得期待的研究。日本的Sakana AI,是明确站在主流大模型 Scaling Law 路线对立面的一家实验室,由多位前 Google DeepMind 核心研究员创立,包括Transformer 论文的主要作者之一的Llion Jones。他们推崇演化与群体智能,探索降低算力依赖的高效路径。一是演化式模型(Evolutionary AI),不追求一次性训练出完美模型,而是通过变异、选择和组合,让模型在动态过程中不断进化。二是群体智能与多模型协作,将多个能力互补、结构不同的模型视为一个生态系统,通过协作而非单体最优,产生更强的整体智能。具有麻省理工学院背景的Liquid AI则开发了液体神经网络架构,是对神经网络应当如何运作的一次底层重构。他们认为真正通用、鲁棒的智能系统,应该是随环境而变的,而不是像现在的预训练是一次训练、终身冻结的。这正是液体一词的含义,即网络不是固态结构,而是可连续演化的动态系统。在长期记忆方面,谷歌提出了嵌套学习(Nested Learning)的概念,试图从根源上解决灾难性遗忘的问题。就像人类的大脑,短期记忆(海马体)和长期记忆(大脑皮层)协同工作。谷歌设计了一套快慢系统,模型内部被设计成不同的功能,有的部分专门负责快速适应当前的新任务,有的部分则负责通过长期记忆来巩固通用知识。

评测牵引日益成为驱动大模型研发的重要范式。当前,静态刷榜导致的数据污染、人类标注昂贵且难以扩展、以及模型能力在某些维度上开始超越普通评估者,都给大模型评测带来重大挑战。行业内正在探索更多新的评测方法,例如,在Agent 与长期任务评测方面, 学界和工业界正在围绕 Agent 能力构建需要跨多步、跨工具、跨状态管理的评测体系。包括DeepMind 的复杂任务规划环境、OpenAI 内部的多工具协作任务、以及学术界的 SWE-bench、WebArena、AgentBench 等。这些评测不再关心模型是否答对一道题,而是能否在长时间尺度内完成目标、纠错、更新策略,真实暴露规划与记忆短板。又如,动态、交互式与仿真环境评测,代表性探索包括基于游戏、模拟世界或数字孪生环境的评测。模型的每一步决策都会改变后续状态,错误具有累积效应。当然,评测的挑战也许是一个长期的难题,因为评测指标本身容易陷入古德哈特定律的陷阱,即当一个指标成为目标时,它就不再是一个好的指标。

大模型评测体系框架示意

4.仿真数据将在物理AI上大放异彩

机器人的物理世界数据极其匮乏,尤其是复杂的灵巧操作,真机采集一条数据可能至少需要几分钟,成本在 1-10 美元;而仿真生成一条数据的边际成本趋近于零,且能并行运行数万个实例。因此,在早中期研发、可控环境任务范围内,仿真数据将成为绝对主流,Sim-to-Real 的鸿沟正在被生成式AI填平。

在规模与覆盖面上,真机采集的瓶颈不是采不到,而是采得慢、采得贵、采得不够广。而仿真能把极端光照、遮挡、碰撞、稀有故障、不同摩擦、质量、关节间隙等长尾场景以指数级的低成本优势覆盖。在可控与可复现方面,物理 AI 研发需要严谨的回归测试和安全验证,而仿真能把变量锁定,把问题定位从玄学变成可诊断的问题。在跨本体迁移上,现实数据常常绑死在某个硬件本体、某套传感器与标定上,而仿真则天然适合做多本体、多观测、多动作空间的统一生成与对齐,这一点在多机器人和多任务训练范式里尤为关键。对此,产学研界已经有一些研究和实践,如,上海人工智能实验室构建的合成数据集 InternData-A1 ,包含超过 63 万条轨迹、总计 7433 小时数据,涵盖 4 种具身形态、18 项技能、70 项任务及 227 个场景,涉及刚性、铰接、可变形及流体物体的操控。采用与 π0 相同的架构,完全在 InternData-A1 上预训练一个模型,发现该模型在 49 项仿真任务、5 项真实世界任务以及 4 项长时程灵巧操作任务上的表现与官方 π0 模型相当,验证了仿真数据的有效性。银河通用发布了灵巧手功能性抓取合成大数据集——DexonomySi,包含超 950 万条高质量抓取姿态,覆盖超 1 万个物体、31 种常用抓握类型,涵盖人类抓握分类法中约 94% 的类型。依托这一数据范式,自研了面向零售行业的端到端具身大模型 GroceryVLA,并实现了在复杂货架上的机器人双手自主取物。谷歌的Genie 3,让模型学会预测下一帧会发生什么,为机器人和自动驾驶汽车的训练提供了无限可能的模拟环境。

当然,不可否认,真机派的担忧也是成立的:仿真永远会有建模误差,如接触、材料、软体、磨损、传感器时序与噪声等,而且真实世界的意外组合也是无穷无尽。

需要有真机数据的重点领域示意

因此,在物理AI的早中期研发中,仿真能够以极低成本提供覆盖长尾的多模态经验,支撑策略成型、泛化训练与系统评测等,承担 90% 以上的数据与验证工作。而真机数据则集中用于物理锚定、残差校准与产品级验收等。这一仿真主供给、真机强纠偏的范式,已经从学术论文走向 NVIDIA、DeepMind 等公司的工业化实践,仿真不再是演示工具,而正在成为物理 AI 的数据基础设施。

5.AI4S有望出现变革行业的新突破

过去几年,AI for Science(AI4S)最具象征意义的成果无疑是 AlphaFold。它在蛋白质结构预测上的突破,让人们对基础学科研究范式的重塑充满希望。但与此同时,一个普遍的质疑也随之而来:这些突破离产业仍然太远。从药物研发到材料工程,现实世界的研发周期、验证成本和组织复杂度,并未因为某一个模型而发生根本性改变。

那么,2026 年是否会成为一个转折点?答案并非简单的是或否。但从科研前沿、产业实践和国家政策三条线索同时观察,一个清晰的信号正在浮现:AI for Science 正在从模型驱动的学术突破,转向系统工程化的科研生产力。这类转变,可能是行业被真正改变的前兆。

AI for Science 迟迟难以影响产业,核心障碍并不在预测不够准,而在验证太贵、太慢,以及太难复制。正因如此,一个极具信号意义的变化正在发生,AI 正在被直接嵌入实验系统本身。谷歌 DeepMind将于2026年在英国建立基于AI的自动化科研实验室,首批研究方向包括超导体、半导体材料等关键科学领域,这是AI Science从算法走向实验物理试验平台的重要标志。实验室并非简单的让机器人做实验,而是AI 负责假设生成与实验编排、机器人系统执行实验、数据自动回流,用于模型更新和策略优化,整个流程形成可复现、可规模化的闭环。这一步的意义在于,它第一次让 AI4S 从建议者变成执行者,打通实验闭环,让材料科学、化学工程和药物筛选等领域,具备了被真正加速、甚至被重构的条件。

AI与人工研发的各阶段差异

《AI-Driven Automation Can Become the Foundation of Next-Era Science of Science Research》

另一个不可忽视的变化,来自国家层面。美国在近期明确将 AI for Science 上升为国家战略重点,特朗普政府在2025年底签署了《启动创世纪任务》行政令,该计划由美国能源部(DOE)牵头,目标是建立全国性的AI科学平台,通过整合联邦科研数据、超算资源和AI模型,实现科学研究的加速和跨学科突破。该计划聚焦先进制造业、生物技术、关键材料、核裂变与核聚变能源、量子信息科学、半导体与微电子领域。这将有望打通美国联邦政府几十年积累的庞大科学数据集,包括能源、生物、核物理等内部绝密数据,并将其与国家实验室的超算资源结合,专门用于训练科学基础模型。这意味获得许可的美国本土企业可能首次获得海量的高质量科学数据来训练模型,解决了AI4S高质量数据匮乏的最大痛点。

如果说2026年的AI4S可以大规模商业落地、具有清晰的ROI、全面替代现有研发模式,那么大概率还为时尚早。但如果定义为某些领域的研发周期可能出现数量级压缩、自动化实验与 AI workflow 成为头部机构的标准配置、科研组织开始围绕 AI agents 重构分工,那么2026 年很可能正是这一转折开始显现的年份。

突围

1.模应一体推动AI网络效应,智联网雏形初显

在过去的互联网发展叙事中,几乎都遵循着同一条路径,从用户规模扩大 到网络价值上升,再到粘性增强和形成壁垒,搜索、电商、社交和短视频等,无一例外。然而,令人意外的是,自 2022 年大模型能力实现跃迁以来,尽管 AI 的智能突飞猛进,但类似移动互联网时代的网络效应始终没有真正出现。用 ChatGPT 的人更多了,已经达到接近10亿周活,但模型并不会因此自动变得更强,而且用户之间的连接关系很弱,并没有形成类似电商的供给和需求的双边网络,或社交网络那样的壁垒。这构成了AI时代的一个难题,AI 能力已经很强,但平台效应极弱,梅特卡夫定律在大模型领域尚未见效。

在“裸模型”阶段,大模型本身并不具备孕育网络效应的天然条件。传统互联网产品之所以能够形成网络效应,本质上依赖于使用行为本身就是反馈和优化的信号。但大模型完全不同,绝大多数用户与模型的交互是一次性的、私有的,既不能直接回流训练,也难以在不同用户之间复用。即便可以收集部分数据,也必须面对隐私、版权、分布偏移与对齐风险等复杂问题。更深一层的原因在于,大模型当前创造的价值,主要来源于模型对个体的能力提升,而不是用户之间的关系密度。大模型很强,但它解决的是帮人做好一件事情,而不是用户之间是否因为这个系统产生新的协作、交易或社会连接。在这种结构下,AI 是生产力工具,还不是平台。

正是在这样的背景下,模型与应用一体化是可能的破局点。当模型开始拥有稳定身份、长期记忆,并持续参与用户的工作、决策与协作过程时,AI 才第一次具备了成为平台的能力。这种延伸正在向2个方向展开:

一是模型接入更多的应用,更像是现在的互联网平台的形态,更多是+AI的功能。典型如GPT最新推出的智能购物功能,通过询问用户的需求和喜好,结合用户历史对话,嵌入了商品推荐和电商导流。目前的初步探索更像是一个研究型购物的体验,尚无法满足用户逛的需求。还有GPT推出的群聊功能,也是希望团队可以在一个对话内持续积累知识沉淀,加强协作联系。再有就是Sora2在视频社交方面的尝试,一度网络上出现了大量跟山姆奥特曼互动的视频。虽然后续留存数据不好,但其推出的Cameo个人数字形象功能,允许用户创建自己的数字分身并和好友一起出演视频,也是希望由此建立起社交关系链和用户画像体系。

GPT新进推出的智能购物电商

另一种则可能是更具颠覆式的智联网新形态,是AI+。目前很多大模型内置的Agent和开发平台,是这个模式的雏形,但还远不止于此。当每个个人、团队乃至组织都拥有自己的 Agent,这些 Agent 可以彼此调用、分工、协作,网络的基本节点就不再只是人,而更多是具备行动能力的智能体。随着使用规模扩大,Agent 网络中可调用的能力、工具和经验不断丰富,单个 Agent 的实际效能也随之提升。这种用得越多,整体越强的正反馈,可能会是 AI 时代最原生的网络效应。

未来的Agent网络效应会出现多种形式,一是交易型网络,这可能是Agent协作的新双边市场,当用户的私人助理Agent接收到预订去深圳的出差行程指令时,它不会去下载携程App,而是直接在云端呼叫差旅平台的票务Agent、酒店的预订Agent以及网约车的出行Agent。在供给端,接入该协议标准的服务型Agent越多,用户Agent能解决的问题就越复杂、越闭环,体验越好。在需求端,拥有私人Agent的用户基数越大,服务商就会开发出更多的服务型Agent接入该网络,从而形成新的AI双边市场。二是知识型网络,假设一名资深工程师教会了模型处理一种复杂问题并形成技能,这一技能可以经过脱敏处理,发布在模型的技能库中。下一秒,地球另一端的另一位工程师遇到同样问题时,模型就能立刻调用这一技能。 用户越多,模型处理过的长尾场景越多,模型的技能经验值就越高。这种由千万用户在真实场景中打磨出的隐性知识库,会让大模型越用越聪明,并构建极高的数据和经验壁垒。三是工作流型网络。复杂任务一旦被反复执行,就会被不断拆解、模块化和标准化,最终形成成熟的 AI 工作流。当这些流程被更多人使用,它们本身就会变得更加可靠、高效,新用户的进入门槛也会随之降低。网络效应不再体现在人多热闹,而体现在生产范式的持续进化。在此基础上,多边市场形态也会逐渐浮现。用户、专业 Agent、工具、数据与知识源,共同构成一个由模型统一调度的复杂网络。以智能购物为例,AI 不再只是推荐商品,而是贯穿选品、比价、谈判、定制和供应链反馈的完整链条,甚至反向影响供给结构。这类网络的价值,不在于单次交易,而在于系统性优化。四是社交型网络。AI不再只是群聊里的一个被动@的对象,而是成为社交网络的超级连接器。比如在一个大的集团企业中,AI持续分析组织内的文档和项目进度。当员工A提出一个难题时,AI能主动介入@A,“虽然我不知道答案,但我检测到群里的B可能了解这个问题,建议你们沟通”。这时可以启动跟B的Agent沟通,来获取授权的信息,或者直接找到B来沟通,扩大协作网络。

模型与应用一体化的真正意义,很可能不是做一个超级 App,而是构建一个以模型为认知核心、以应用为关系容器、以 Agent 为基本节点的智能网络,这才是 AI 时代可能出现的新型平台。

大模型的潜在网络效应

2.迈入个性化软件的新时代

当 AI Coding 逼近普适生产力之后,软件不再是一种工业化产品,而将变成高度个性化、情境化、即时化的工具形态。

AI界的大V安德烈·卡帕斯关于软件3.0时代的论断,揭示了软件开发正在经历1940年软件1.0以来最深刻的范式转移。今年3月,Anthropic首席执行官Dario Amodei表示,未来3到6个月,AI将编写90%的代码,而在12个月内,几乎所有的代码都可能由AI编写。美团创始人王兴曾披露,美团内部已有52%的代码由AI生成。公司90%的工程师已频繁使用AI工具,部分团队甚至依赖AI完成90%以上的代码编写。腾讯发布的《2025腾讯研发大数据报告》透露,腾讯月均新增代码3.25亿行,每月完成需求37万个,构建交付2520万次。超过90%的腾讯工程师使用AI编程助手CodeBuddy辅助编程,50%的新增代码由AI辅助生成。

Anthropic 的工程师和研究人员最常使用 Claude 来修复代码错误和了解代码

软件生产的核心瓶颈从编码能力转移到了问题定义能力,自然语言、示例、上下文描述,正在成为主要的编程接口,甚至出现了vibe coder 的新称谓。软件不再是专业工程师的专属产物,而是一种可随需生成的表达介质,就像 PPT、Excel、Notion 页面一样。

编程供给侧的充裕将彻底激活需求侧的长尾市场。由于构建软件应用的成本极低,软件将具备千人千面的生成能力,真正实现从人适应软件到软件适应人的范式转移,软件个性化和情景化成为可能。

一部分新生成的工具,因为解决的是很多人都会遇到的问题,会自然地被分享、复用,甚至形成小规模的生态。包括Hugging Face Spaces 上大量由个人搭建的小应用,Chrome 插件中越来越多功能很小,但很有用的工具,其实都是这种微软件的思想。只是之前门槛太高,人们只有需求,而缺乏软件编程能力。

在Vibe Coding的帮助下,我们正在进入一个软件平权的新阶段。在未来,编写软件会像写文章、发朋友圈一样简单自然。软件将成为人类表达思想、解决问题、感知世界的一种基本媒介。在这个新时代,核心竞争力不再是掌握复杂的语法或架构模式,而是对他人的共情能力、对问题的定义能力,甚至是天马行空的想象力。

3.行业落地从探索试错到性价比和ROI验证

过去两年,AI在各行业的落地经历了一次明显的阶段跃迁。从早期的概念验证(PoC)和零散试点,逐步进入核心业务流程与一线生产系统。与此同时,一个变化也在同步发生。企业和投资人对AI的关注点,正在从技术是否先进,迅速转向是否真正创造了可衡量的业务价值。ROI(投资回报率)与性价比,正在成为AI行业应用的第一性问题。

麦肯锡最新的《2025年AI现状报告》揭示,更多企业开始使用AI,但真正的规模化部署依然稀少。至少在一个职能中常态化使用AI的企业比例,从去年的78%上升至88%。但在企业层面,多数机构仍停留在探索或试点阶段,多数企业尚未将其深度嵌入工作流和业务流程,距离释放企业级价值仍有不小差距,AI改善整体利润的案例仍较少见,AI高绩效企业仅6%。

麦肯锡调研:在各职能中,智能体应用进入规模化阶段的受访者比例均未超过10%

OpenAI近日发布的企业级 AI 现状报告,对近 100 家企业的 9000 名员工开展调研后发现,过去一年,ChatGPT Enterprise 的每周消息量增加了约 8 倍,员工人均消息发送量提升了 30%,组织平均推理 token 消耗量增长约 320 倍。75% 的员工表示在工作中使用 AI 提升了工作速度或产出质量。员工表示平均每日节省 40–60 分钟,而重度用户每周可节省超过 10 小时。这些数据虽然展示了使用量的增长,却也反映了一个现实,未来还需要更多有力的数据,来说明AI创造的经济效益。

背后的原因,企业在早期部署阶段,AI更多以Copilot的形态存在,承担的是信息检索、文本生成、简单问答等边缘性任务。这类应用的特点是部署快、风险低,但对组织整体效率和成本结构的影响有限,因此也很难形成清晰的价值闭环。而当前正在发生的积极变化是,AI开始逐步深入行业流程的中后段。下一步,可验证的收益会发生在生产效率提升、客户响应速度加快、营销指标改善、研发生产力提高等方面,未来潜在的深度收益将来自流程再造、智能体协同、个性化服务、预测决策与供应链智能化等领域。

由此,我们正在告别以工时为单位的生产力时代,迈向以决策为单位的创造力时代。当AI应用进一步深入,未来的最小作战单元,可能就是一个拥有深厚行业Know-how的人类专家,带着十几个硅基数字员工,像一家微型公司一样独立交付结果。当“一个人+N个智能体”成为工作新常态,企业的管理逻辑、绩效考核甚至人才定义,都面临着前所未有的重构。管理的对象,从人变成了人和机器共同构成的生产系统。传统以工时、过程、层级为核心的管理逻辑,将逐步失效。取而代之的是以结果交付、质量稳定性和风险控制为中心的新范式。

4.AI眼镜有望迎来千万台终端的临界点

在消费电子的历史长河中,1000万台从来不是一个简单的数字,而是一道划分极客玩具与大众消费品的命运分水岭。如今,目光聚焦到了AI眼镜身上。随着Meta Ray-Ban等头部产品的销量激增,权威机构预测2026年单品牌有望冲击1000万台出货量。值得期待的还有谷歌XR生态,包括三星Galaxy XR、中国的XREAL的Project Aura等,将以安卓+Gemini的组合拳,推进安卓XR生态的进化。巴克莱研究的分析师预测,AI智能眼镜这一新兴产业将在不久的将来带来颠覆性变革,预计2035年的销量将达到6000万副。雷朋眼镜制造商依视路公司也于近期表示,将提前实施年产能1000万件可穿戴设备的生产计划,以满足超出预期的强劲需求。这不仅意味着硬件形态的成熟,更预示着继PC、手机之后,有望迎来第三次计算平台的迁徙——从指尖互联走向感官互联。

巴克莱研究预测智能眼镜销量2025-2035

硬件做减法是这一波AI眼镜成功的关键,过去的AR和VR眼镜一定程度上陷入了必须有完美屏幕的误区,导致产品重达数百克且续航仅1-2小时,用户无法全天佩戴。 Meta的成功在于它敏锐地捕捉到了当前的甜蜜点,放弃高成本的显示模组,成功将重量控制在接近普通眼镜的50g以内,并结合大模型的多模态能力,让眼镜首先成为一个合格的穿戴设备和拍照摄像设备,其次才是一个计算设备。这种无屏胜有屏的策略,极大地降低了制造难度和用户购买门槛。

当AI眼镜成为新入口,软件生态将可能发生翻天覆地的变化。在手机上,我们的操作逻辑是以应用为中心,而在眼镜上的操作逻辑将转变为以意图为中心。用户只需发出指令,如帮我叫车回家,眼镜背后的Agent将自动调用底层网约车服务接口完成服务。这意味着,图形用户界面(GUI)将退居二线,自然语言交互和多模态感知将成为主导。技能商店可能会取代应用商店,未来的开发者不再是开发一个独立的App,而是开发一个个技能插件(Skill)。如,星巴克不再需要开发眼镜版App,只需提供一个点单Skill给通用的AI助理调用。眼镜拥有的摄像头将产生海量的前所未有的数据,用户看到了什么、关注了什么都可以数字化。这些数据一方面可以为机器人和空间智能研发提供海量的第一视角训练数据;另一方面,可能催生全新的推荐算法和广告模式,如当你盯着一家餐厅招牌超过3秒,眼镜便会显示大众点评的评分标签。当然,在AI眼镜领域,个人隐私和脱敏,以及相关的法律和伦理规范约束将更为重要。

或许借由AI眼镜,我们可以告别低头族,通过一副轻便的眼镜,将强大的AI算力戴在身上。这不仅是硬件形态的革命,更可能是人类生活方式的回归,让科技退回到背景之中,这将让人们重新抬起头,更加关注真实的世界,同时拥有更强的感知和智能。

5.AI安全和负责任成为模型研发和应用必选项

AI能力的提升以及AGI目标的日益逼近,让安全成为更多人关注的重点,从最为夸张的AI毁灭人类,到日常应用中的伦理和价值等问题,全社会对AI安全的关注度日益提升。根据墨尔本大学与毕马威联合发布的 《人工智能信任度、态度与应用:2025 全球研究报告》 对 47 个国家的 48000 人的调研显示:尽管 66%受访者已经在经常使用AI,但超半数(58%)仍认为其不可信赖。相比 2022 年 ChatGPT 发布前在 17 国开展的同类研究,如今的 AI 普及率已显著提升,但公众信任度反而呈现下降趋势,且忧虑情绪随之上升。

毕马威调研“Trust and acceptance of AI systems”

在此背景下,AI安全技术的研发和相关规则的建立就显得更为重要,2个关键词或许会勾勒出明年的重点:安全算力与AI治理委员会。

安全算力:AI安全相关技术成为业界热点,将有超过10%的算力投入到安全领域。这里的安全主要涵盖安全评估、对齐实验、红队测试等,与纯能力提升的预训练、微调和后训练强化学习等区分开来。两年前,OpenAI就曾经宣布成立 Superalignment 团队,明确表示将在未来四年内,将其算力的 20%用于超级智能对齐研究。但山姆奥特曼并未信守承诺,这也是导致伊利亚出走的重要原因之一。而伊利亚成立的新公司名为SSI(Safe Superintelligence),核心就是着眼于对超人工智能安全的研究,两年来已融资30亿美金,估值320亿美元。不少安全研究者主张,随着能力增长,应当维持一个恒定且足够高的算力份额长期投入安全研究、监测和缓解安全问题,而不是能力上去了再补安全。美国与欧盟的法规提案都把高风险模型的系统性测试、评估和监控写进了强制义务,这也隐含着安全算力将形成刚性成本。而且,随着模型越来越具备长程任务能力,安全评估不再是跑几个 benchmark,而要跑多步 agent 任务、模拟长期行为等,这对算力需求将是指数级放大的。

AI治理委员会:越来越多的企业会建立类似AI安全和伦理委员会的机构。这个机构不再是一个简单的研究和对外宣传、沟通的组织,而是深度嵌入到从基础大模型到AI产品研发的全流程。很多大公司都已经建立起了相对完整的安全机制:如Google DeepMind 内部有专门的 Responsibility & Safety 团队,参与从模型训练到评估部署的全过程,在模型训练前设定能力边界,评估生物安全、网络攻击等方面的危险能力。在训练后,还要对模型进行系统性红队测试和安全评估,评估结果达标的,才能上线到Gemini、AI搜索等产品。微软早在2017年就成立了伦理委员会Aether Committee,涵盖安全、偏见、公平、可靠性、人机交互等领域,其结论会被纳入微软工程体系的必选流程,如Office、Copilot、Azure AI等。Anthropic则成立了长期利益信托(LTBT)机制,是由5位财务中立成员构成的独立机构,旨在确保公司治理始终与研发并维护先进 AI 系统,持久造福人类的使命一致。Anthropic致力于推动Constitutional AI宪法AI),将安全直接嵌入到训练数据和奖励模型中。

AI 安全与负责任已经不再是附加在模型研发和应用之上的道德选项,而是正在演变为与算力、算法、数据同等重要的基础性要素。一方面,公众信任度的下降与忧虑情绪的上升,正在反向塑造技术路线和商业决策。没有可信安全机制的模型,将难以进入关键行业和主流市场。另一方面,监管框架的逐步成型,将使安全评估、对齐实验和持续监控从最佳实践变成准入门槛。在这样的背景下,安全算力和 AI 治理委员会并非短期应对舆论或监管的权宜之计,而是大模型时代的长期制度安排。

*特别致谢腾讯研究院产业研究中心多位同学的讨论和启发

彩蛋:欢迎一起来微信问一问,谈谈你的期待。

相关内容

热门资讯

今日重大消息“冷酷牛牛.真的有... 网上科普关于“冷酷牛牛有没有挂”话题很是火热,小编也是针对冷酷牛牛作*弊开挂的方法以及开挂对应的知识...
终于明白“毛豆大厅炸金花.怎么... 您好:毛豆大厅炸金花这款游戏可以开挂,确实是有挂的,需要了解加客服微信【9752949】很多玩家在这...
今日重大通报“十胡卡.到底是不... 您好:十胡卡这款游戏可以开挂,确实是有挂的,需要了解加客服微信【4282891】很多玩家在这款游戏中...
玩家攻略科普“哪吒重生.有挂吗... 您好:哪吒重生这款游戏可以开挂,确实是有挂的,需要了解加客服微信【4282891】很多玩家在这款游戏...
今日重大发现“天天十三水.可以... 网上科普关于“天天十三水有没有挂”话题很是火热,小编也是针对天天十三水作*弊开挂的方法以及开挂对应的...
终于了解“新老夫子拼三张.开挂... 家人们!今天小编来为大家解答新老夫子拼三张透视挂怎么安装这个问题咨询软件客服徽9752949的挂在哪...
今日重大发现“龙泰棋牌.究竟有... 您好:龙泰棋牌这款游戏可以开挂,确实是有挂的,需要了解加客服微信【9752949】很多玩家在这款游戏...
【第一消息】“乐友棋牌.可以开... 【第一消息】“乐友棋牌.可以开挂吗?”太坑了原来有挂您好,乐友棋牌这个游戏其实有挂的,确实是有挂的,...
终于明白“九九牌游十三水.究竟... 有 亲,根据资深记者爆料九九牌游十三水是可以开挂的,确实有挂(咨询软件无...
今日重大发现“天天福建麻将.辅... 网上科普关于“天天福建麻将有没有挂”话题很是火热,小编也是针对天天福建麻将作*弊开挂的方法以及开挂对...