出品|搜狐科技
作者|常博硕
编辑|杨锦
硅谷的AI圈里,有两个名叫“Yao Shunyu”的年轻人。一个是前OpenAI成员、现腾讯首席AI科学家姚顺雨,执掌腾讯混元大模型。另一个,则是本科毕业于清华基科班、在斯坦福斩获高能物理博士,从Anthropic的强化学习核心团队又去Google DeepMind的姚顺宇。
近日,姚顺宇接受了一次公开访谈。在将近四小时的访谈中,他解构了前沿AI实验室的技术泡沫、硅谷大公司的组织架构,以及那个正在远去的个人英雄主义时代。
姚顺宇称自己是一个“著名的悲观主义者”,在他身上,我们还能看到一种不依附于任何学术门阀、随时准备自我折磨与自我颠覆的反叛精神。
“光脚不怕穿鞋”的“Underdog”
姚顺宇出生在宁夏一个因煤矿而存在的小城市——大武口。直到小学后半段,他才随父母举家搬迁到了上海。
“我小时候挺菜的。”姚顺宇回忆,自己读的初中上南中学东校完全是个无名之辈,整个大环境比较躺平,竞赛这类词汇在当时根本不在他的考虑范围内。中考前,上海的高中实行预录取制度。面对当时高高在上的“四大名校”,他做出了人生中第一个令人费解的决定,放弃名校普通班,义无反顾地去稍逊一筹的格致中学竞赛班。
他喜欢当一个“光脚不怕穿鞋”的“Underdog(不被看好的弱者)”。
“我这个人的个性就是总是爱干一些自己不太会的事”,他喜欢困难带给他的兴奋感,也喜欢和自己较劲,“我之前从没搞过竞赛,但我觉得没干过,一定要找机会干一下,因为它难。”
在竞赛保送制度开始锐减的当年,他没能杀入国家集训队。高三那年,姚顺宇阴差阳错地参加了清华大学的一个夏令营,偶然得知学校正在搞针对北京学生的自主招生。一个上海的高中生,突发奇想地开始给清华招生办老师疯狂发短信:“你给北京的同学考,为什么不给上海的考?大家都在一条线上进行竞争。”
这种“光脚不怕穿鞋”的精神,竟然撬开了机会的大门。招生办老师被说服了,统一组织了考试,姚顺宇拿到了降至一本线录取的自主招生名额,迈进了清华大学的校门。
他回忆道:“人生最重要的道理就是胆子要大。你不争取是永远得不到的,争取了也有可能得不到,但不争取就绝对得不到。”
“为什么要把时间浪费在伺候老登身上?”
在清华,姚顺宇进入了基础科学班(基科班)。大二那年,受杨振宁先生创立的高等研究院氛围影响,他一头扎进了王忠老师的课题组,开始研究一种被称为“非厄米系统”的开放量子体系。
那是他科研生涯的第一个巅峰。在这个极其考验量子力学和统计力学理解深度的前沿方向上,他与导师系统性地建立了一套描述方法,颠覆了过去用布洛赫波描述非厄米系统的传统范式。由于实现了一次“范式级别的更新”,他的工作在国际上引发了大量的跟进研究。
然而,当所有人觉得这位物理新星将在凝聚态理论领域大放异彩时,他又选择逃跑,去斯坦福读高能理论物理学博士。
“抓住一次范式变化确实能让你名声大噪,获得更多引用和好的教职,但对我来说,它已经不令人激动了。”
虽然都属于物理学,但姚顺宇本科与博士的两个方向几乎没有任何联系。“我觉得说难听了就是爱折磨自己,说好听的是挑战自己。”
他很享受被折磨,他说:“如果一个人是为了学习更多的东西,丰富自己的精力和能力而被折磨,我觉得是值得的。”
但斯坦福的五年博士生涯,带给他的是一场深刻的幻灭。高能理论物理已经发展到了实验设备完全追不上的尺度,这导致理论的对错无法被客观验证。
“当这个领域完全没有实验和客观标准的时候,谁做的好,谁做的不好,其实就依赖于领域内一些老登的主观判断。你在那个领域呆的时间越长,就越觉得这件事儿蠢。人这一辈子也没多长,为什么要把自己的时间浪费在伺候老登身上?”
姚顺宇对“老登”这个词有着纯粹的学术性痛恨。在他眼中,人老了会分裂成两种状态:一种是德高望重的长者,甘愿为年轻人铺路;另一种则是自己不懂、却偏偏极度渴望指手画脚。
“我以前可能没有这么恨老登,可能就是当你自己有越来越多判断的时候,那些蠢的人就显得更蠢。”姚顺宇表示,他觉得自己可能有厌蠢症。
他说,他花了五年学了很多知识,买了一个大教训,那就是要做有客观评价标准的事,做对这个世界能产生影响的事。
目前的AI领域对姚顺宇来说是客观的:“你其实不用太担心,因为自己的观点惹到什么人,只要你的观点是自洽的,最终你在这个领域做的怎么样,是有客观的评价标准的。”
从Anthropic到Google,做AI“不需要脑子”
2024年秋天,在伯克利做博士后仅仅两个星期的姚顺宇向校方递交了辞呈,他决定去和硅谷最炙手可热的AI独角兽Anthropic谈谈。
他踩中了大规模强化学习(RL)爆发的末班车尾巴,作为Horizon团队的核心研究员,完整地参与了Claude 3.7乃至后续模型的后训练(Post-training)过程,亲手用代码将Claude的Agent能力推上了神坛。
后来,在政治纠纷闹的沸沸扬扬的时候,他选择了离开。“你看到文化的稀释以及一些不干活的人的激增是非常明显的。而且在一些非技术层面的公共立场上,CEO达里奥(Dario Amodei)个人的一些情绪和倾向,甚至影响到了整个公司的战略风向。”
从Anthropic离职后,他并没有选择回国,“那时候我离开了Anthropic,之后决定要去哪的时候,最大的动机是我想学一些不一样的东西。对我来说,我可能就没有更着重的去考虑说能够我去领导一个项目之类的。我更多的是在那个时候优先去学习一些东西,所以那个时候我选择去了(Google DeepMind旗下的)Gemini。”
目前,业内流传着Scaling Law已经撞墙的说法,但姚顺宇表示:“预训练依然在过去的几个月里疯狂变强,未来四个月我看不到任何到头的迹象。那些说撞墙的人,多半是因为自己工作里有 Bug 没找出来。”
在DeepMind,姚顺宇正在推进的两个方向是ML Coding(让AI自动做AI研究)和Long Horizon(长周期任务执行)。
ML Coding的目的是让AI能够自己研究自己,能自己跑实验、分析结果、提出新假设,完成全链路闭环。长周期任务执行是让模型学会像人一样选择性遗忘,能够在有限的上下文窗口里,处理近乎无限的任务。这是Agent走向实际应用的必经之路。
在他看来,目前AI的原生场景只有Coding,聊天框本质上是搜索的延伸。
为什么AI能够在Coding上率先实现突破,在他看来第一是因为在这个场景下反馈信号非常清晰。代码能不能跑通、输入输出对不对,是非常容易量化和测试的事情。这对强化学习来说,是最理想的训练土壤。其次是数据底座得天独厚。在GitHub等平台上沉淀了过去几十年人类最优秀程序员留下的高质量代码,这是任何其他领域都难以企及的先发优势。
姚顺宇是一个悲观的人,即使在AI风暴中心,他依然认为未来AI会替代掉软件工程师。“AI会让少部分人变得更强,但会让大部分人失去他们的独特价值。所以说我觉得对于传统的软件工程来说,最后的结果可能就是现在千分之一的人干了过去所有人的工作,拿着现在100倍的工资。”
现在,一个顶级AI研究员的薪水已经十分高昂,整个行业不断把技术突破,叙述为天才推动历史。但姚顺宇却说:AI这个事儿本来也不太需要脑子。“我觉得这个行业最重要的特质就是靠谱,就是做事细,然后对自己做的事负责任。那些东西我觉得都是一些本科生就能干的活。”
他不断强调:“AI本身才是那个浪。”他说,任何一个项目,少了自己都不会停止。“大家现在每个人都是冲浪的人,而不是那个浪本身。”在他看来,真正推动一切的,其实是整个时代性的技术浪潮。
个体只是站上了浪尖,而浪本身,不会因为任何一个人的缺席而停止。