“教”AI“读懂”复杂世界
创始人
2026-03-11 06:43:26
0

来源:滚动播报

(来源:新华日报)

□ 本报记者 谢诗涵

长期以来,如何让机器理解复杂语义,是人工智能领域的一块“硬骨头”。日前,东南大学计算机科学与工程学院、软件学院、人工智能学院耿新教授团队,凭借在“标记分布学习理论与方法”上的原创性突破,荣获2025年度吴文俊人工智能科学技术奖自然科学奖一等奖。这个“中国智能科技最高奖”背后,是团队近20年的持续深耕。

“机器学习,就是利用算法从数据中自动归纳规律,并利用这些规律对未知数据进行预测或决策。”谈及获奖项目,耿新介绍,以机器学习中的核心分支——监督学习为例,传统监督学习在面对一个复杂对象时,往往只能给出简单的“是或否”的判断,“比如,一幅图像里有猫、狗、大树等多个元素,传统的标注会告诉我们‘有猫、有狗、有树’,但它不会告诉我们,不同元素在画面里占多少比重,‘显著程度’分别有多高,这可能导致机器在面对真实世界的复杂场景时,理解出现偏差。”

面对这一痛点,耿新教授团队创新提出标记分布学习的理念,其雏形最早可追溯到2007年。经过近10年的积累与打磨,团队终于在2016年将一个完整范式推向学界。该范式的核心突破在于:不仅是给图像打上标签,还要为每一个标签赋予“描述度”。这相当于让AI完成一次认知升维:从判断图像里“有什么”,进阶到理解每个元素“有多少”,从而对复杂对象进行更细腻、更精确的刻画。

“提出想法还不够,想要让它立得住,还得建立基础理论、开发相应算法、推进应用落地……从理论到应用都得走通。”耿新回忆,“最难的就是构建基础理论这一块。比如一个核心点叫‘标记增强机制’。现实中,大家为了节省标注成本,往往只标一个简单的逻辑标记,并没有给出描述度信息。我们要做的,就是通过数据分析,把这些缺失的描述度给恢复出来。”为了保证恢复出来的效果是可靠的,团队耗费3年多构建完整的理论框架;而另一个核心点“标记分布泛化理论”,团队同样打磨近3年。

作为机器学习领域的一个新兴研究方向,标记分布学习吸引了大量国际同行跟研,其中包括哈佛、斯坦福、耶鲁、牛津、剑桥等世界顶尖大学。

自2018年起,美国宇航局(NASA)在“好奇号”火星车的矿物分析任务中,就采用了标记分布学习作为核心算法。团队成员、东南大学计算机学院副教授徐宁介绍,火星矿物的化学成分非常复杂,以前的统计方法很难预测超过3种元素的化学成分。该算法通过分析矿物晶体的X射线衍射数据,能精准预测多种化学元素及其丰度,帮助科学家还原火星地质历史。

此外,标记分布学习还被应用于集成电路领域,支撑构建芯片设计大模型,助力芯片设计自主化。目前,团队正在将这一技术应用于大模型的“安全对齐”研究。“大模型生成的内容,有时候可能不安全,或者跟人类的价值观有冲突。”徐宁透露,如何让大模型与人类的价值观“对齐”,使其更符合人类预期,恰好是标记分布学习未来可以发挥作用的方向。

相关内容

热门资讯

美参议院通过决议,旨在限制特朗... 当地时间6月23日,美国国会参议院以50票赞成、48票反对通过众议院此前已通过的关于伊朗的战争权力决...
美国允许伊朗队下一场比赛前2天... △当地时间6月22日,伊朗国家足球队在墨西哥蒂华纳进行赛前训练。当地时间6月23日,美国国土安全部发...
以色列前总理承认,曾密送星链试... 以色列反对党领导人、前总理贝内特6月23日在耶路撒冷的一场公开活动上承认,他2021年至2022年担...
特朗普称国际原子能机构核查人员... 当地时间6月23日,美国总统特朗普表示,伊朗在国际原子能机构核查问题上的说法是错误的。他同时表示,核...
伊朗总统称若无导弹伊朗已成加沙 当地时间6月23日,正在巴基斯坦访问的伊朗总统佩泽希齐扬在接受采访时表示,伊美谅解备忘录中不包含伊朗...
黎总统称谈判必须确保“以色列结... 新华社贝鲁特6月23日电(记者曹昌浩)黎巴嫩总统奥恩23日表示,黎巴嫩政府不会接受任何低于“以色列结...
华为向左,字节向右:赛力斯的“... 在2026中国汽车重庆论坛上,赛力斯集团董事长张兴海大倒苦水,存储芯片涨了5倍,碳酸锂从8万涨到18...
平板首批:联想AI平板拯救者Y... IT之家 6 月 23 日消息,联想拯救者官方今日宣布,联想 AI 平板拯救者 Y700“平板首批”...
链博会聚焦数智赛道 四川向全球... 中新网北京6月23日电 (单鹏 吕杨)22日至26日,第四届中国国际供应链促进博览会(以下简称链博会...
我国首本英文数据期刊Data ... IT之家 6 月 23 日消息,据央视新闻,今天(6 月 23 日),我国首本英文数据期刊 Data...