海报新闻记者萨伟北京报道。 11月18日,在2025年Oceanbase年会上,Oceanbase发布并开放了首个AI数据库Oceanbase SeekdB(简称SeekdB)。开发者只需三行代码即可快速构建知识库、代理等AI应用,轻松应对百亿级多模式数据采集,真正实现“开箱即用”的AI数据库。该产品支持矢量、全文、标量和空间地理数据的统一混合搜索,深度融合AI推理和数据处理,兼容Huggingface、Langchain等30余种主流AI框架。该产品实现了从传统的“业务支撑系统”到“AI原生数据门户”的全新数据库功能。这也是Oceanbase推出“数据×AI”战略的一个答案。 CEO杨兵表示:“希望Oceanbase能够探索AI时代数据库的范式转变。”杨冰认为AI真正的瓶颈不是模型,而是数据。尤其是在金融、政务等高度敏感的场景下,AI需要能够完成毫秒级的实时推理,并安全地整合隐私数据。传统架构依赖于划分多个系统的数据链路,不仅复杂、效率低下,而且容易导致授权混乱和延迟风险。 “SeekdB不是传统数据库的叠加功能,而是专为AI时代打造的AI原生数据库。”杨兵表示,“它继承了Code和Oceanbase的设计理念,更轻量、更敏捷,旨在成为大模型和私有数据融合计算的‘实时输入层’。我们希望与开发者一起,在混合搜索、多模式融合等方向上加速迭代、大胆创新。” Gartner 预测,到 2028 年,支持生成式 AI 的数据库支出将达到2180亿美元,占市场74%。然而,MIT研究表明,由于数据多模态碎片化、系统链路长度长、权限管理复杂等原因,95%以上的企业AI项目难以实施。SeekdB带来三大突破:一是AI混合搜索能力。SeekdB支持将向量检索、全文检索和标量过滤集成在一个查询中,并采用“粗排序+精排序”多级检索机制,在提高准确率的同时降低延迟。依托成熟的事务引擎,支持实时写入和Acid一致性,兼容MySQL生态。此外,SeekdB支持标量、向量、文本、json和GIS等多模态数据的统一存储和检索。例如,在反欺诈场景中,可以直接查询“近7天交易额超过5万元、位置异常、类似历史欺诈样本的行为”无需系统调用,兼顾性能和安全性。第二种是极简部署,开箱即用。 SeekdB 最低仅需 1 核 CPU 和 2GB 内存,假设 RTAHAN PIP 安装一键安装并秒级启动,兼容嵌入式和客户端/服务器双部署模式,并可轻松与智能代理集成。构建区块链或本地应用,大幅降低AI应用的工程门槛。第三,开发商更加友善。 SeekdB在Apache 2.0协议下全球开源,开发者可以自由使用、修改和扩展。产品全面兼容Huggingface、Dify、Langchain等30多个AI框架和MCP大模型协议,与AI生态系统无缝集成;并提供SQL和Python SDK来适应不同的开发实践。同时开源PowerRag智能文档解析框架而PowerMem分层内存架构在机车基准测试中以73.70的成绩登顶SOTA,代币消耗降低96%,大幅节省托管成本。作为Oceanbase“数据×AI”战略的关键组成部分,SeekdB可以独立使用,也可以无缝集成到新发布的Oceanbase 4.4版本中。该版本首次将TP、AP和AI能力集成到单核中,具备分布式可扩展性、多云部署和财务高可用性,帮助企业规避重新架构的风险。商用LTS版本将于2026年2月2日上线。目前,Oceanbase的混合搜索能力已在多个行业成功落地,充分证明了其技术价值:中国联通正在构建基于混合搜索的统一AI知识库,有效解决了NG同意管理和私密文档高效检索的问题;蚂蚁宝藏e Box基于混合搜索实现代理实时在线搜索,显着提高信息检索的准确性和响应效率。 “这不仅是一个技术产品,更是一次开发范式的转变。”杨兵表示,“传统数据库只是‘存储’数据,而SeekdB可以‘理解’数据的语义。混合搜索是AI原生数据库的分水岭。”十五年来,Oceanbase在“双11”等极端情况下磨练出来的工程能力正在转化为AI时代的底层优势,在AI-Native混合搜索、多模式融合、TP/AP/AI融合、多云原生等方向不断突破。由于Oceanbase由蚂蚁集团于2010年创立,目前已服务全球4000多家企业,涵盖金融、政企、能源、通信、零售、制造、互联网等关键领域。云服务 OB Cloud 是最重要的全球唯一支持阿里云、华为云、腾讯云、百度智能云、AWS、GCP、Azure七大云厂商的数据库产品。业务覆盖全球16个国家和地区、60多个地区、240多个存在区域。杨兵强调:“未来的数据库必须同时服务‘人’和‘智能体’。支持数据库中的AI混合交易、分析和搜索,驱动数据源实时、可靠的智能。” SeekdB现已在GitHub开源,新域名Oceanbase.ai同步激活,全球开发者均可免费下载使用。此举是Oceanbase实施AI战略的重大一步,旨在加速行业迈向“智能原生”架构,为全球智能转型提供更具包容性和可操作性的数据基础。