C
ChaoBro

DigitalOcean 推出 Knowledge Bases:全托管 RAG 服务,MCP 集成开箱即用

DigitalOcean 推出 Knowledge Bases:全托管 RAG 服务,MCP 集成开箱即用

发生了什么

DigitalOcean 正式推出 Knowledge Bases,一项全托管的 RAG(检索增强生成)服务。从数据摄取到最终检索,整个 RAG 流水线全部托管:

  • 数据摄取:支持上传文档、网页抓取、API 数据源
  • 自动分块:智能文本分块策略
  • 嵌入生成:内置嵌入模型,无需额外配置
  • 向量检索:高性能向量数据库
  • 重排序:高级 Reranking 算法提升检索精度

核心功能亮点

功能说明
RAG Playground可视化测试不同分块策略、嵌入模型和检索参数
高级重排序两阶段检索(向量检索 + Reranker),显著提升相关性
两个新开源模型DigitalOcean 发布的专属嵌入模型和重排序模型
MCP 集成通过 Model Context Protocol 直接连接 Claude/Cursor 等工具
全托管无需自行维护向量数据库、嵌入服务等基础设施

为什么值得关注

RAG 一直是 AI 应用中最复杂的基础设施之一。典型自建方案需要:

  1. 选择向量数据库(Pinecone / Milvus / Weaviate / pgvector)
  2. 选择嵌入模型(OpenAI / Cohere / 开源)
  3. 实现分块策略
  4. 实现重排序
  5. 搭建检索 API
  6. 监控和维护

DigitalOcean Knowledge Bases 将上述所有步骤打包为一个点击即用的服务。对于中小团队来说,这大大降低了 RAG 应用的入门门槛。

MCP 集成的意义

通过 MCP(Model Context Protocol)集成,Knowledge Bases 可以直接作为 Claude Desktop、Cursor、OpenClaw 等工具的数据源。这意味着:

  • 在 Claude Desktop 中直接查询企业知识库
  • 在 Cursor 中让 AI 基于内部文档回答编码问题
  • 在 Agent 框架中自动检索相关知识

竞品对比

维度DigitalOcean KBPineconeWeaviate CloudMilvus Cloud
全托管
内置嵌入需配置需配置
内置分块
内置重排序
MCP 集成
RAG Playground
定价按用量按向量数按节点按节点

DigitalOcean 的优势在于端到端的 RAG 流水线,而不仅是向量数据库。竞品需要自行组合多个服务才能实现同等功能。

行动建议

  • 已有 DO 基础设施的团队:可直接在现有账户中启用,无需额外供应商
  • 快速原型开发:RAG Playground 让开发者可以在浏览器中测试不同配置,迭代速度快
  • 中小团队生产环境:全托管模式省去了运维成本
  • 个人开发者:关注定价细节,按用量模式对低流量场景友好

需要注意的

  • 作为新服务,生产级稳定性和 SLA 尚待验证
  • 两个新开源模型的性能需要社区基准测试
  • 对超大知识库(百万级文档)的处理能力待观察