AI下半场,比的不是“懂多少”而是“能干啥”
创始人
2026-06-18 17:21:32
0

国家数据局日前印发的《关于推进行业高质量数据集建设的行动实施方案》(以下简称《方案》)提出,到2028年底建成一批覆盖重点领域、经过应用验证的行业高质量数据集,打造一批数据驱动人工智能创新发展的典型应用场景。国家数据局的这份《方案》,给AI发展备足了“燃料”。但燃料堆在仓库里不会自动产生动力,还需要产业端的“发动机”来点燃。当数据集建设从政策文件变成车间里的生产力、从实验室的指标变成市场上的现金流,中国AI才算真正跑完了产业化的“最后一公里”。

截至2026年第一季度,全国已建成高质量数据集超过11.6万个,总体量超过960PB,日均词元调用量突破140万亿。这组数字放在全球AI竞赛的背景下看,传递的信号很清晰:中国AI的发展逻辑正在发生一次关键转向。过去两三年,业界热衷于比拼模型参数、算力规模和通用对话能力,某种程度上是一场“大力出奇迹”的竞赛。而如今,11.6万个行业数据集的布局,意味着竞争重心从“谁能聊天更溜”转向“谁能真正扎进产业里干活”。

这种转向有其必然性。通用大模型再聪明,进了工厂、农田、医院、驾驶舱,面对的都是高度专业化的场景。没有经行业数据“喂养”的模型,就像拿着百科全书去修发动机,知识渊博却无从下手。《方案》聚焦工业制造、智慧能源、交通运输,乃至低空经济、具身智能、智能驾驶等创新领域,正是因为看到了这一点——AI的下半场,比的不是“懂多少”,而是“能干啥”。

不过,数据集建起来只是第一步。960PB的数据体量已经相当可观,但真正的瓶颈不在于“有没有”,而在于“转不转得起来”。《方案》提出要形成“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的数据飞轮,这个表述值得细品。飞轮要转起来,靠的不是一次性把燃料堆满,而是每个环节都能持续产生动力。眼下行业数据分散沉淀、标准不一、模型适配不强,本质上就是飞轮的齿轮还没咬合好。

更深层的变化藏在“词元交易”这个提法里。《方案》提出探索词元交易等新型交易模式,构建可量化、可定价的数据价值体系。这意味着数据正从传统的“生产资料”变成可流通的“数字资产”。一旦数据的价值可以被精确计量和顺畅流通,整个AI产业的协作方式都将被重塑。数据标注企业、模型开发商、行业应用方之间的关系,将从松散的合作变成紧密的价值链条。

当然,从文件到现实还有距离。低空经济需要多模态的物理交互数据,具身智能需要高精度的仿真数据,智能驾驶需要海量的场景测试数据,这些都不是靠行政命令就能快速催生的,需要企业在真实场景中反复试错、持续回流。换句话说,高质量数据集不是“建”出来的,而是“用”出来的。只有让数据在产业应用里不断打磨、迭代、验证,才能真正称得上“高质量”。

(作者:吴霞)

相关内容

热门资讯

张雪被粉丝吐槽合影时有情绪,本... 6月17日,张雪在直播连麦中遭到粉丝吐槽“我跟您合影的时候,您就有点生气了,当时对我的态度就是有一点...
父子误食小区喷敌敌畏果子后洗胃... 随着夏季气温持续升高、雨水增多,蚊蝇等病媒生物滋生繁殖进入旺季,不少物业公司会对小区公共区域、绿化景...
“哈兰德实在太哈兰德了” 梅开... “哈兰德实在太哈兰德了”  【“哈兰德实在太哈兰德了”】北京时间6月17日凌晨,2026年美加墨世界...
自然资源部开展台湾岛以东管辖海... 为全面了解我国管辖海域自然生态状况,支撑服务海洋生态保护,6月16日至18日,自然资源部东海局“向阳...
凤凰女记者:美伊签备忘录,伊朗... 伊美远程签署谅解备忘录,伊朗各界和民众有什么反应?凤凰卫视驻德黑兰记者李睿发回最新报道:许多曾经反对...
瑞士外交部:美伊会谈19日在比... 新华社日内瓦6月18日电(记者王其冰) 瑞士外交部18日表示,美国和伊朗计划与调解方巴基斯坦、卡塔尔...
备战世界杯比赛时训练场地上空现... 【环球网报道 记者 张江平】综合法新社等媒体报道,对于韩国队世界杯训练场地上空出现不明无人机,韩国队...
首艘平陆运河智能船舶示范船试航... 昨天,在广西贵港建造的首艘5000吨级平陆运河智能船舶示范船“北港运河002”试航,标志着平陆运河智...
“网络文明大讲堂”活动启动仪式... “网络文明大讲堂”活动启动仪式暨首场讲座活动现场。赵洋 摄 6月16日,“网络文明大讲堂”活动启动仪...
华为申请编码方法及译码方法专利... 国家知识产权局信息显示,华为技术有限公司申请一项名为“编码方法、译码方法及相关装置”的专利,公开号C...