“教”AI“读懂”复杂世界
创始人
2026-03-11 06:43:26
0

来源:滚动播报

(来源:新华日报)

□ 本报记者 谢诗涵

长期以来,如何让机器理解复杂语义,是人工智能领域的一块“硬骨头”。日前,东南大学计算机科学与工程学院、软件学院、人工智能学院耿新教授团队,凭借在“标记分布学习理论与方法”上的原创性突破,荣获2025年度吴文俊人工智能科学技术奖自然科学奖一等奖。这个“中国智能科技最高奖”背后,是团队近20年的持续深耕。

“机器学习,就是利用算法从数据中自动归纳规律,并利用这些规律对未知数据进行预测或决策。”谈及获奖项目,耿新介绍,以机器学习中的核心分支——监督学习为例,传统监督学习在面对一个复杂对象时,往往只能给出简单的“是或否”的判断,“比如,一幅图像里有猫、狗、大树等多个元素,传统的标注会告诉我们‘有猫、有狗、有树’,但它不会告诉我们,不同元素在画面里占多少比重,‘显著程度’分别有多高,这可能导致机器在面对真实世界的复杂场景时,理解出现偏差。”

面对这一痛点,耿新教授团队创新提出标记分布学习的理念,其雏形最早可追溯到2007年。经过近10年的积累与打磨,团队终于在2016年将一个完整范式推向学界。该范式的核心突破在于:不仅是给图像打上标签,还要为每一个标签赋予“描述度”。这相当于让AI完成一次认知升维:从判断图像里“有什么”,进阶到理解每个元素“有多少”,从而对复杂对象进行更细腻、更精确的刻画。

“提出想法还不够,想要让它立得住,还得建立基础理论、开发相应算法、推进应用落地……从理论到应用都得走通。”耿新回忆,“最难的就是构建基础理论这一块。比如一个核心点叫‘标记增强机制’。现实中,大家为了节省标注成本,往往只标一个简单的逻辑标记,并没有给出描述度信息。我们要做的,就是通过数据分析,把这些缺失的描述度给恢复出来。”为了保证恢复出来的效果是可靠的,团队耗费3年多构建完整的理论框架;而另一个核心点“标记分布泛化理论”,团队同样打磨近3年。

作为机器学习领域的一个新兴研究方向,标记分布学习吸引了大量国际同行跟研,其中包括哈佛、斯坦福、耶鲁、牛津、剑桥等世界顶尖大学。

自2018年起,美国宇航局(NASA)在“好奇号”火星车的矿物分析任务中,就采用了标记分布学习作为核心算法。团队成员、东南大学计算机学院副教授徐宁介绍,火星矿物的化学成分非常复杂,以前的统计方法很难预测超过3种元素的化学成分。该算法通过分析矿物晶体的X射线衍射数据,能精准预测多种化学元素及其丰度,帮助科学家还原火星地质历史。

此外,标记分布学习还被应用于集成电路领域,支撑构建芯片设计大模型,助力芯片设计自主化。目前,团队正在将这一技术应用于大模型的“安全对齐”研究。“大模型生成的内容,有时候可能不安全,或者跟人类的价值观有冲突。”徐宁透露,如何让大模型与人类的价值观“对齐”,使其更符合人类预期,恰好是标记分布学习未来可以发挥作用的方向。

相关内容

热门资讯

特朗普真要撤还是玩狼来了? 美以伊冲突打满了整整一个月,终于要迎来大结局了?当地时间3月31号,特朗普在白宫公开表态,美国将在两...
长园精密取得数据备份装置专利,... 国家知识产权局信息显示,长园精密自动化科技(苏州)有限公司取得一项名为“数据备份装置”的专利,授权公...
原创 销... 4月1日,岚图汽车发布最新交付数据:3月交付新车15,019辆,同比增长50.1%,环比增长79.7...
美防长涉内幕交易丑闻持续发酵 英国《金融时报》近日披露,美国和以色列对伊朗发起军事打击前数周,美国国防部长赫格塞思的一名投资经纪人...
新河科技申请静置钟罩焊接方法及... 国家知识产权局信息显示,深圳市新河科技有限公司申请一项名为“静置钟罩焊接方法、焊接机器人”的专利,公...
104人重写底层,OpenCl... 新智元报道 编辑:元宇 【新智元导读】 104位开发者联手,全球最火开源AI助手OpenClaw再...
Anthropic意外泄露Cl... Anthropic公司的Claude Code命令行界面应用程序的完整源代码(非模型本身)已被泄露并...
“他要跑路”让世界炸了!伊朗毫... 特朗普北京时间周三晚上最新发帖,声称“伊朗新政权总统比他的前任们理性得多,也没那么极端,刚刚向美国请...
甘肃酒泉:科技赋能解锁大棚种植... 物联网、智能温控、水肥一体化……近日,在甘肃省酒泉市肃州区的戈壁温室大棚里,一系列农业新技术、新设备...