Graphify 一周 3.8 万星:把任意文件夹变成知识图谱的 AI 编码助手插件

Graphify 一周 3.8 万星:把任意文件夹变成知识图谱的 AI 编码助手插件

如果你用过 Claude Code 或 Cursor 处理一个大型项目,大概率遇到过这样的场景:AI 助手对代码库的某个模块完全陌生,每次对话都要重新解释上下文。Graphify 试图用知识图谱来解决这个结构性问题。

它解决什么问题

Graphify 是一个 Python 项目(MIT 许可证),核心功能是把任意文件夹——代码、文档、论文、甚至图片和视频——自动构建成一个可查询的知识图谱,并以”技能”(skill)形式接入主流 AI 编码助手。

项目由 safishamsi 维护,截至 4 月 29 日已获得 37,989 颗 Star 和 4,199 个 Fork,创建后仅约一周。这个增长速度在开源 AI 工具中相当罕见。

工作原理

Graphify 的架构分两层:

构建层:扫描目标文件夹,用 LLM 提取实体、关系和层次结构,存入图数据库。不同于向量数据库的 chunk-level 检索,知识图谱保留了概念之间的显式连接——函数调用链、文档引用关系、主题关联。

查询层:以 skill 形式注册到 AI 编码助手。支持的平台包括 Claude Code、Codex、Cursor、Gemini CLI、GitHub Copilot CLI、OpenClaw、Factory Droid、Trae、Google Antigravity 等。当 AI 助手需要理解代码库结构时,通过图谱查询获取结构化的上下文,而不是依赖单纯的文本相似度匹配。

与传统 RAG 的区别

维度向量检索 RAGGraphify 知识图谱
检索单位文本片段(chunk)实体+关系
多跳查询困难,需要多次检索天然支持
结构感知无,丢失代码层次保留函数/模块/文档层级
适用场景单一事实查询跨文档/跨模块的综合分析

FalkorDB 最近的 GraphRAG-Bench 测试也验证了这一趋势:图结构 RAG 在多跳推理任务上的准确率显著高于传统向量检索。Graphify 的实践方向与评测结果一致。

快速上手

# 克隆项目
git clone https://github.com/safishamsi/graphify.git
cd graphify

# 安装依赖
pip install -r requirements.txt

# 构建知识图谱
python graphify.py --input /path/to/your/project

# 作为 skill 接入 Claude Code
# 在 Claude Code 中启用 Graphify skill

项目最近更新频繁(4 月 29 日仍有 push),社区活跃度高。MIT 许可证允许商业使用。

观察点

  • 图谱构建的准确度和速度在超大型代码库(百万行级)上的表现尚待验证
  • 目前主要依赖 LLM 提取实体关系,成本和质量受底层模型影响
  • 与 GraphRAG SDK、Neo4j 等方案的对比评测尚未出现

对于经常需要让 AI 助手理解复杂代码库的开发者来说,这是一个值得立即试用的工具。如果你的项目有超过 50 个模块或大量交叉引用的文档,知识图谱方式可能带来明显的上下文质量提升。

主要来源