构建AI就绪数据文化的五项关键行动
创始人
2025-09-11 18:42:11
0

人工智能或许占据了所有新闻头条,但在每个成功部署的背后,都有一个不那么引人注目但重要得多的因素:强大的数据文化。对于寻求释放生成式AI价值的企业来说,仅仅拥有数据甚至模型是不够的。关键在于数据如何被创建、管理、共享和信任。

在此,四位经验丰富的领导者分享了他们让企业数据始终保持AI就绪状态的经验。他们都将数据视为战略资产。尽管他们的组织在使命和规模上差异很大,但他们的经验都聚焦于IT领导者可以采取的五项关键行动,以建立强大且有能力的数据文化。

**将数据视为产品,而非副产品**

组织必须进行的第一个文化转变是将数据视为产品本身,而不是运营的废气排放,这个产品在设计时考虑了目的性、可用性和管理。将数据视为产品意味着像产品管理一样思考:定义所有权、标准化格式、确保版本控制,并预期企业范围内的下游用例。

DHL供应链北美公司首席信息官Mike Kreider表示,他的组织已经将这种思维模式制度化。"数据产品是来自一个或多个系统的标准化数据集,格式化以便轻松重用,"他说。例如,装运数据产品支持运营、物流和业务发展。它们还为DHL的提案生成器等生成式AI工具提供动力。"如果数据产品不存在或不干净,工具就无法工作,"他补充道。

Kreider强调,定义数据产品不仅仅是技术任务,更关乎业务对齐。每个产品都有已确定的业务负责人和生命周期计划,包括如何更新和退役。"我们不想要没人觉得有责任的孤儿数据产品,"他说。这种所有权意识确保产品对AI应用保持最新和可靠。

IBM同样围绕数据产品构建AI就绪性。IBM软件高级副总裁Dinesh Nirmal指出了自助服务的需要。"如果团队无法轻松找到并信任正确的数据集,他们就无法快速创新,"他说,并补充说IBM编目化、管控的数据产品使受信任的数据集在企业范围内对AI工程师可用,使他们能够专注于构建解决方案而不是搜索输入。

**让可观测性和可追溯性成为信任的核心**

成熟的数据文化不仅需要高质量的数据,还需要对其来源、转换和用途的完全可见性。可观测性和可追溯性是信任的支柱,提供了解释或纠正输出的背景,以及合规性的审计轨迹。

邓白氏公司通过自主开发的工具DataShield和DataWatch监控超过850亿个数据质量可观测性点。前者在输入点强制执行标准,后者长期监控所有数据,使区域团队能够识别问题、实施改进计划,并衡量修复是否有效。它还确保质量得到持续维护和增强。

另一个自主开发的工具ChatDQ让员工用自然语言查询元数据,每个答案都引用其来源。"如果我无法追溯,我就无法信任,"该公司全球数据策略高级副总裁Andy Crisp说。他指出,可追溯性是保持组织竞争力的关键。拥有来自30,000多个来源的超过6亿条商业记录,"这是确保当客户要求洞察时,我们能够支持它的唯一方法,"他说。

这种方法通过封闭的反馈循环得到强化。区域数据负责人将可观测性发现带给本地团队以推动改进,而客户洞察小组收集客户反应以确认质量变化是有意义的。

同样,DHL供应链在每个生成式AI项目中嵌入可观测性。"我们跟踪数据来自哪里、如何变化以及谁接触了它,"Kreider说。仪表板不仅显示数据质量分数,还显示随时间的趋势,将质量转化为可衡量和有动机的东西。

**将治理融入基础**

数据治理是合规问题,但它也是一种文化价值,标志着纪律、前瞻性和正确行事的承诺。在AI背景下,治理意味着建立访问、保留、分类和质量的策略,这些策略得到一致和自动的执行。

联合国世界粮食计划署首席数据官Magan Naidoo将治理提升为董事会级别的问题。"我们的数据策略和AI策略得到了执行主任的认可,高层的这种对齐改变了一切,"他说。

这种自上而下的支持给了WFP平衡区域自治与全球标准的权威,这是在80多个国家协调运营的重要步骤。Naidoo指出,许多办公室认为他们已经达到了高标准,但引入外部专家来对照全球规范基准实践帮助揭示了关键差距,并创造了变革的紧迫性。

他还指出,在人道主义背景下,国家主任在巨大的运营压力下工作,通常任期较短,使长期倡议更难优先考虑。通过将治理框架为共享的、组织范围的路线图,WFP能够将短期任务需求与数据转型所需的持续努力对齐。这与一致的沟通和领导参与相结合,帮助转变观念,从"治理即官僚主义"转向"治理即推动者"。

在IBM,他们通过公司的元数据平台和保留政策操作化治理。"你不能在事后加上合规性,"Nirmal说。"如果数据从摄取到访问和删除都没有得到治理,它就不是AI就绪的。"通过自动化分类和保留规则,IBM确保合规性是日常运营的一部分,而不是事后考虑。

**让数据素养成为每个人的工作**

在高效运作的数据文化中,每个人——无论角色如何——都对数据概念、质量期望和分析思维有基本的流利度。数据素养民主化洞察,使人们能够负责任地使用AI。

在WFP,Naidoo率先推出了强制性数据素养项目,定制为六种语言并嵌入入职培训。在HR和执行主任的强力支持下,完成率接近100%,后续网络研讨会和参与会议持续获得高于行业基准的净推荐分数。使用高质量开放获取内容的可选AI素养项目的参与度与必修课程相匹配——这表明好奇心和参与度很高。

Naidoo强调,数据素养不仅关乎技术技能,还要在全球多语言组织中创建共同语言。为了实现这一点,WFP设计的内容反映了其国家办事处的运营现实,结合了来自现场运营、物流和受益者管理的示例。网络研讨会经常展示员工将新技能应用于真实人道主义挑战的案例研究,强化良好数据实践的直接影响。"当人们看到更好的数据质量意味着更快的食品交付或更准确的援助目标定位时,他们就会成为这一事业的拥护者,"Naidoo说。

在邓白氏公司,Crisp强调,如果人们无法解释输出,仅有管道是无用的。"你可以构建世界上最好的数据管道,但如果你的员工不知道如何使用它们,那就只是管道工程,"他说。他衡量成熟度的标准是员工是否能够毫不犹豫地列出数据质量的所有八个维度。

**将结构化和非结构化数据整合作为标准实践**

除非AI获得完整的画面——来自记录系统的结构化数据与文档、电子邮件和图像等非结构化数据的结合,否则AI无法提供全部价值。成熟的数据文化开发统一这两个世界的管道和工具,并确保两者的治理和性能。

IBM估计新企业数据的90%是非结构化的。"你需要结构化的支付历史和非结构化的电子邮件来正确回答计费问题,"Nirmal说。他的团队使用SQL-RAG合并结构化和非结构化来源,将客户服务准确性提高到98%。

SQL-RAG是一种将传统SQL数据库查询与RAG结合的方法,为AI模型提供更丰富、更准确的上下文。它使用SQL从关系数据库中提取相关的结构化数据,同时从其他来源检索非结构化信息。由此产生的组合具有结构化记录的精确性和非结构化内容的细致入微,导致更完整和可靠的输出。

邓白氏公司对整合结构化和非结构化数据提供了另一个视角。Crisp指出,客户洞察通常来自将公司统计数据与非结构化客户反馈(如支持票据或调查评论)混合。通过应用自动化实体识别并将这些非结构化洞察链接到其全球数据库中的结构化记录,邓白氏公司能够精确定位质量问题,揭示新兴趋势,并将改进反馈到其数据产品中。这不仅提高了AI准确性,还确保数据反映真实世界的客户体验。

同样,DHL供应链将结构化物流数据与来自装运图像、司机注释和传感器读数的非结构化信息整合。Kreider解释说,关联这些多样化的输入能够实现更精确的运营预测和风险检测,帮助公司预防延误并优化路线。这种统一视图将孤立的数据集转换为丰富的、AI就绪的信息生态系统。

随着模型演进和技术变化,有一件事保持不变:数据文化定义成功。模型可以重新训练。架构可以重建。但没有正确的思维模式,AI努力会停滞或适得其反。"模型会来来去去,但你的数据策略必须持久,"Nirmal说。"而那个策略不是从实验室或仪表板开始,而是从文化开始。"

Q&A

Q1:为什么要将数据视为产品而不是副产品?

A:将数据视为产品意味着在设计时考虑目的性、可用性和管理,就像产品管理一样:定义所有权、标准化格式、确保版本控制,并预期企业范围内的下游用例。这种所有权意识确保数据产品对AI应用保持最新和可靠。

Q2:什么是数据可观测性和可追溯性?为什么重要?

A:可观测性和可追溯性提供了数据来源、转换和用途的完全可见性,是信任的支柱。它们提供了解释或纠正输出的背景,以及合规性的审计轨迹。如邓白氏公司所说"如果我无法追溯,我就无法信任"。

Q3:SQL-RAG技术是什么?有什么优势?

A:SQL-RAG是一种将传统SQL数据库查询与检索增强生成技术结合的方法,为AI模型提供更丰富、更准确的上下文。它使用SQL提取结构化数据,同时检索非结构化信息。这种组合具有结构化记录的精确性和非结构化内容的细致入微,IBM使用此技术将客户服务准确性提高到98%。

相关内容

热门资讯

技巧保你赢!开元斗牛怎么开挂... 有亲,根据资深记者爆料开元是可以开挂的,确实有挂(咨询软件无需打开直接加微835087887)您好,...
美特使访白俄披露特朗普亲笔信和... 当地时间9月11日,白俄罗斯总统卢卡申科在明斯克会见到访的美国总统特使约翰·科尔。白俄罗斯通讯社9月...
推荐辅助!星空游戏轻松赢牌,... 有亲,根据资深记者爆料星空游戏是可以开挂的,确实有挂(咨询软件无需打开直接加微1...
腾讯开源混元MT翻译模型系列 腾讯控股有限公司今天开源了一个新的语言模型系列——混元MT系列,该系列专门针对翻译任务进行了优化。 ...
一分钟解说!欢乐吓牌有挂确实... 您好:欢乐吓牌这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多玩家在...
大模型会吃掉所有软件?外滩大会... AI会重构用户入口、商业模式与产业分工吗?9月11日,2025Inclusion·外滩大会开幕式《破...
应有尽有.微扑克透视软件教程... 有亲,根据资深记者爆料德州扑克是可以开挂的,确实有挂(咨询软件无需打开直接加微835087887)您...
猿编程携星瀚智能套装亮相202... 本报讯 (记者袁传玺)9月10日,中国国际服务贸易交易会(以下简称“服贸会”)在北京开幕。其中,本届...
推荐的啦!德友汇透视挂软件[... 您好:“德友汇这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多玩家在...
明白一款!德扑之星开挂神器下... 您好:“德扑之星这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多玩家...