“一场关于Data与AI的融合革命正在数据库领域悄然上演。
当大模型掀起全球智能浪潮,当企业数据量以指数级攀升,一个问题愈发紧迫:AI时代,我们需要什么样的数据库?
是继续沿用“一个业务多个库”的碎片化架构?还是寻求一种更统一、更智能、更融合的数据底座?
2025年11月18日,OceanBase用实力给出了答案。在年度发布会上,OceanBase发布并开源了其首款AI数据库OceanBase seekdb(简称seekdb)。开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”的AI数据基座。
据介绍,该产品支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,并兼容Hugging Face、LangChain等30余种主流AI框架。这一产品实现了数据库从传统“业务支撑系统”迈向“AI原生数据入口”的新功能,也是OceanBase自启动“Data×AI”战略以来的一份答卷。
毫无疑问,我们正站在AI技术重塑产业格局的十字路口。数据库的角色正在被彻底重构——它不再仅仅是存储数据的仓库、记录交易的账本或进行分析的引擎,而是正在成为智能系统中真正可信的“数据中枢”。
长期以来默默居于幕后的数据库基础设施,正在被AI浪潮推向舞台中央,经历着从被动“存储数据”到主动“理解数据”的战略跃迁,这不仅要求数据库具备数据管理能力,更需要深度融合模型能力,实现数据与智能的有机结合。
在技术快速迭代的背景下,数据库领域呈现出三个“变”与“不变”。
三个变化:数据处理量级正在从传统的GB/TB级跃升至PB/EB级,这对数据库的扩展性提出了前所未有的挑战;多模混合搜索成为刚需,企业需要同时处理结构化、半结构化和非结构化数据;技术平权趋势明显,数据库用户从专业的开发者扩展到普通的业务人员。
三个不变:数据库的核心价值保持不变,仍然需要处理事务和分析问题,这是企业运营的基础;优秀的查询优化器在处理复杂查询时依然不可或缺;丰富的生态兼容功能仍然是数据库成功的关键因素。
这三个“变”与“不变”,构成了OceanBase把握AI时代机遇的重要坐标。
“AI的真正瓶颈不在模型,而在数据。”OceanBase CEO杨冰指出,“尤其在金融、政务等高敏感场景,传统多系统架构不仅复杂低效,更易引发权限与延迟风险。”
面对时代的挑战,OceanBase提出了独具特色的“一体化”解决方案。
为什么是一体化?
符合技术发展规律:从早期的大型机集中式,到互联网时代的分布式架构,再到AI时代的一体化融合,技术发展呈现出"合久必分,分久必合"的螺旋式上升规律。一体化架构正是这种规律在当前阶段的体现。
响应企业核心诉求:维护多套系统的成本、复杂度以及数据一致性问题,已经成为很多企业的"不能承受之重"。一体化架构通过简化技术栈,显著降低了企业的总拥有成本(TCO)。
为AI应用提供最优数据通路:当智能成为业务的核心竞争力时,数据的处理效率直接决定了企业的创新速度。一体化架构为AI应用提供了最简化的数据通路,加速了从数据到价值的转化过程。
OceanBase一体化涵盖架构、负载和多云三个维度:
架构一体化:单机与分布式的统一
让用户无需在“性能”与“扩展性”之间做选择题。同一套引擎既能在单机环境下稳定运行,也能在分布式环境中弹性扩展。
负载一体化:TP、AP与AI的融合
更突破性的是,OceanBase实现了TP(事务处理)、AP(分析处理)与AI工作负载在单一引擎内的融合。
多云一体化:一套架构,全球运行
在云原生层面,OceanBase已稳定运行于阿里云、华为云、腾讯云、AWS、Azure等七大主流云平台。这种多云原生能力让企业真正实现“一套架构,全球运行”,为出海企业提供了关键的技术支点。
如果说一体化架构是骨骼,那么混合搜索就是OceanBase在AI时代的"智能大脑"。
为什么混合搜索如此关键?
我们来看一个场景。当用户提出"找一下去年华东区销量最好的几款新能源汽车的相关技术文档"这样的需求时,传统的单一搜索方式就显得力不从心。
这个看似简单的查询实际上涉及多个维度的数据处理:需要向量搜索来理解"销量最好"的语义含义;需要关系查询来过滤"去年""华东区""新能源汽车"这些条件;需要全文检索在技术文档中匹配关键内容;还需要图索引来关联车型与技术文档的关系。
OceanBase的混合搜索技术将稠密向量、稀疏向量、全文搜索、关系过滤等进行深度融合,通过智能的全局重排序输出最优结果。这种能力使得数据库不再是被动的数据存储容器,而是能够"理解"用户意图的智能助手。
在OceanBase技术团队的思考中,向量搜索只是AI数据库的初级阶段,最终都将演进为混合搜索。
基于对AI时代,数据库的战略思考,以及一体化架构的技术突破,OceanBase推出了AI原生数据库——seekdb。
“seekdb不是传统数据库的功能叠加,而是专为AI时代重构的AI原生数据库。”杨冰表示,“它继承OceanBase的代码和设计理念,更轻量、更敏捷,目标是成为大模型与私有数据融合计算的‘实时入口层’。我们希望与开发者一起,在混合搜索、多模融合等方向加速迭代、大胆创新。”
据Gartner预测,到2028年,支持生成式AI的数据库支出将达2180亿美元,占市场74%。但MIT研究显示,超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。seekdb带来三大核心突破:
一是AI原生混合搜索能力。seekdb支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在低延迟的同时提升精度。依托成熟的事务引擎,它支持实时写入与ACID一致性,并兼容MySQL生态。此外,seekdb支持标量、向量、文本、JSON和GIS等多模数据的统一存储与检索。例如,在反欺诈场景中,可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”,无需跨系统调用,兼顾性能与安全。
二是极简部署,开箱即用。seekdb最低仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可轻松集成至智能Agent、开发工具链或本地应用,大幅降低AI应用的工程门槛。
三是更开发者友好。seekdb以Apache 2.0协议全球开源,开发者可自由使用、修改和扩展。产品全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议,无缝融入AI生态;并提供SQL及PythonSDK,适配不同开发习惯。同期开源的PowerRAG智能文档解析框架与PowerMem分层记忆架构,后者在LOCOMO Benchmark上以73.70分登顶SOTA,Token消耗降低96%,大幅节省推理成本。
作为OceanBase“Data×AI”战略的关键一环,seekdb既可独立使用,也可平滑融入新发布的OceanBase 4.4一体化融合版本。该版本首次将TP、AP与AI能力集成于单一内核,兼具分布式扩展、多云部署与金融级高可用,帮助企业避免后期架构重构风险。商用LTS版本将于2026年2月2日推出。
目前,OceanBase的混合搜索能力已在多个行业成功落地,充分验证了其技术价值:中国联通基于混合搜索构建统一AI知识库,有效解决了私有文档的权限管理与高效检索难题;蚂蚁百宝箱则基于混合搜索实现智能体的实时在线搜索,显著提升了信息获取的精准性与响应效率。
“这不仅是技术产品,更是开发范式的跃迁。”杨冰表示,“传统数据库只‘存’数据,而seekdb能‘理解’数据语义,混合搜索正是AI原生数据库的关键分水岭。”过去十五年,OceanBase在“双11”等极限场景锤炼出的工程化能力,正转化为AI时代的底层优势,在AI原生混合搜索、多模融合、TP/AP/AI一体化、多云原生等方向持续突破。
4000家客户验证的技术实力
OceanBase CEO杨冰在发布会上透露了一组令人振奋的数字:自2020年商业化以来,OceanBase全球客户数已突破4000家,连续五年年均增速超过100%。目前,其技术已深入金融、政务、通信、零售、制造、互联网等十余个领域,服务覆盖16个国家和地区、60多个地域、240多个可用区。
这一成绩的背后是OceanBase"专有云+公有云"的双轮驱动战略,更根植于15年技术深耕与工程化能力实践。
专有云:核心系统的信任之选
OceanBase专有云凭借卓越的稳定性和一致性,成为高要求领域的核心系统首选。过去一年客户数增长50%,在金融领域实现全面突破,正加速拓展至政务、电信、交通、能源、医疗等政企领域:
•覆盖全部政策性银行、5/6国有大行,覆盖超100家资产规模千亿级以上银行
•在非银领域,75%头部保险、80%头部券商、60%头部基金公司已部署OceanBase
政企领域拓展全面提速:
•人社系统:江西率先完成养老保险全国统筹系统升级,获人社部认可;海南、重庆、浙江等十余省份相继跟进;目前服务全国1/3省级人社系统
•通信领域:深度覆盖三大运营商,中国移动1/3省级公司、中国联通超300套核心系统、中国电信翼支付全链路完成部署;广东移动六大区域核心CRM/计费系统实现从集中式向分布式架构升级,打造“广东样板”
公有云:第二增长曲线加速成长
作为“第二增长曲线”,OB Cloud近三年客户数年均增长115%,营收占比达30%。其多云原生能力支持七大云平台无缝运行,助力高德实现性能提升25%、成本降低50%,支撑安踏并购后业务高速增长。
全球化布局与生态建设
OceanBase已建立覆盖全球的服务网络,在马来西亚、欧洲、北美设立三大服务中心,构建“Follow-the-sun”支持体系。生态建设成效显著,合作伙伴贡献专有云超70%收入,公有云生态收入年增速达300%。
站在十五年新起点,OceanBase正式开启“Data×AI”新范式。
“十五年磨一剑,OceanBase将持续深化‘Data×AI’战略。”杨冰表示,“以‘一体化’理念推进架构、存储与负载的全面融合,打造面向未来的一体化数据底座;同时加大全球开源投入,加速全球化进程,坚定迈向世界级数据库。”
OceanBase用4000家客户的实践表明,在AI时代,一体化不是选择题,而是必答题。当数据与智能的边界日益模糊,当实时与融合成为刚需,谁能更好地打通数据与AI的任督二脉,谁就能在未来的竞争中占据先机。
这条路并不好走,但正如OceanBase十五年来的坚持——做基础设施,是良心活。世界级数据库的梦想,正在一步步照进现实。