发生了什么
DigitalOcean 正式推出 Knowledge Bases,一项全托管的 RAG(检索增强生成)服务。从数据摄取到最终检索,整个 RAG 流水线全部托管:
- 数据摄取:支持上传文档、网页抓取、API 数据源
- 自动分块:智能文本分块策略
- 嵌入生成:内置嵌入模型,无需额外配置
- 向量检索:高性能向量数据库
- 重排序:高级 Reranking 算法提升检索精度
核心功能亮点
| 功能 | 说明 |
|---|---|
| RAG Playground | 可视化测试不同分块策略、嵌入模型和检索参数 |
| 高级重排序 | 两阶段检索(向量检索 + Reranker),显著提升相关性 |
| 两个新开源模型 | DigitalOcean 发布的专属嵌入模型和重排序模型 |
| MCP 集成 | 通过 Model Context Protocol 直接连接 Claude/Cursor 等工具 |
| 全托管 | 无需自行维护向量数据库、嵌入服务等基础设施 |
为什么值得关注
RAG 一直是 AI 应用中最复杂的基础设施之一。典型自建方案需要:
- 选择向量数据库(Pinecone / Milvus / Weaviate / pgvector)
- 选择嵌入模型(OpenAI / Cohere / 开源)
- 实现分块策略
- 实现重排序
- 搭建检索 API
- 监控和维护
DigitalOcean Knowledge Bases 将上述所有步骤打包为一个点击即用的服务。对于中小团队来说,这大大降低了 RAG 应用的入门门槛。
MCP 集成的意义
通过 MCP(Model Context Protocol)集成,Knowledge Bases 可以直接作为 Claude Desktop、Cursor、OpenClaw 等工具的数据源。这意味着:
- 在 Claude Desktop 中直接查询企业知识库
- 在 Cursor 中让 AI 基于内部文档回答编码问题
- 在 Agent 框架中自动检索相关知识
竞品对比
| 维度 | DigitalOcean KB | Pinecone | Weaviate Cloud | Milvus Cloud |
|---|---|---|---|---|
| 全托管 | ✅ | ✅ | ✅ | ✅ |
| 内置嵌入 | ✅ | ❌ | 需配置 | 需配置 |
| 内置分块 | ✅ | ❌ | ❌ | ❌ |
| 内置重排序 | ✅ | ❌ | ❌ | ❌ |
| MCP 集成 | ✅ | ❌ | ❌ | ❌ |
| RAG Playground | ✅ | ❌ | ❌ | ❌ |
| 定价 | 按用量 | 按向量数 | 按节点 | 按节点 |
DigitalOcean 的优势在于端到端的 RAG 流水线,而不仅是向量数据库。竞品需要自行组合多个服务才能实现同等功能。
行动建议
- 已有 DO 基础设施的团队:可直接在现有账户中启用,无需额外供应商
- 快速原型开发:RAG Playground 让开发者可以在浏览器中测试不同配置,迭代速度快
- 中小团队生产环境:全托管模式省去了运维成本
- 个人开发者:关注定价细节,按用量模式对低流量场景友好
需要注意的
- 作为新服务,生产级稳定性和 SLA 尚待验证
- 两个新开源模型的性能需要社区基准测试
- 对超大知识库(百万级文档)的处理能力待观察