C
ChaoBro

学术科研也 Agent 化了:从选题到发表的 Claude Code 全流程

学术科研也 Agent 化了:从选题到发表的 Claude Code 全流程

科研圈的人大概都有过这种经历:花三天时间整理文献引用格式,花两天调整论文排版,花一天检查数据一致性——然后发现真正写"我提出"后面那句话的时间,不到半天。

academic-research-skills 这个项目,就是冲着这件事来的。

6.6K 星,384 次 commit。它是一个 Claude Code 插件,把学术研究从选题到发表的完整流程拆成了可交互的 Agent 技能链。

核心理念:AI 是副驾驶,不是驾驶员

项目首页第一段就写得很清楚:

AI is your copilot, not the pilot. This tool won't write your paper for you.

它不帮你写论文。它处理的是脏活累活——找文献、格式化引用、验证数据、检查逻辑一致性。真正需要人类大脑的部分——定义问题、选择方法、解释数据、写下"I argue that"后面的话——留给你自己。

这不是什么谦虚的说法,而是一个经过验证的工程决策。

为什么不搞全自动?

项目引用了 Lu 等人 2026 年发表在 Nature 上的论文(The AI Scientist),那篇论文做了第一个完全自主的 AI 研究系统——并且真的在顶级 ML 会议的盲审中发表了论文(ICLR 2026 workshop,得分 6.33/10,超过 workshop 平均分 4.87)。

但它的 Limitations 部分列出了一长串全自动 AI 研究的失败模式:实现 bug、幻觉结果、捷径依赖、把 bug 重新包装成 insight、方法论捏造、frame-lock、引用幻觉。

ARS(academic-research-skills 的缩写)的设计前提就是:一个被 AI 增强的人类研究者,比全自动系统或纯人类都更好。

流水线架构

ARS 把科研流程拆成了几个阶段,每个阶段有对应的 Claude Code 技能:

研究规划(ars-plan)。 用苏格拉底式对话走一遍你的论文结构,帮你理清研究问题、方法选择和贡献定位。不是直接给你一个选题,而是通过多轮提问帮你自己想清楚。

深度研究(deep-research)。 调用 Semantic Scholar API 验证文献,跑 anti-leakage protocol 防止信息泄露,用 VLM 验证图表。

论文撰写(academic-paper)。 Style Calibration 功能会从你过去的作品中学习你的写作风格,Writing Quality Check 会捕捉那些让文章看起来像机器生成的模式。目标是提升质量,而不是帮你伪装成人类写的。

论文评审(academic-paper-reviewer)。 reviewer 有一个可选的 calibration 模式,可以用你提供的 gold set 测量它自己的 FNR/FPR。

学术流水线(academic-pipeline)。 把上面所有阶段串起来,带 7-mode blocking checklist 的 integrity gate。

Style Calibration 的细节

这个项目最值得称道的设计之一是 Style Calibration。

大多数 AI 写作工具的问题是输出风格太"AI"了——句式整齐、过渡词滥用、缺乏个性。ARS 的做法是从你过去的作品中学习你的风格,然后在生成内容时尽量模仿。这不是简单的人称替换,而是更深层的风格迁移。

Writing Quality Check 则会反过来工作:它检测你的文章里哪些模式会让人觉得"这像是 AI 写的",然后提醒你修改。两个工具配合使用,一个模仿你的风格,一个过滤掉 AI 的痕迹。

安装和使用

在 Claude Code(v3.7.0+)里装这个插件只需要两行命令:

/plugin marketplace add Imbad0202/academic-research-skills
/plugin install academic-research-skills

然后试试 /ars-plan 走一遍论文结构规划,或者直接跳到 quick install 看前置要求。

可选依赖包括 Pandoc(生成 DOCX)和 tectonic + 思源宋体 TC(生成 APA 7.0 格式的 PDF)。Markdown 输出不需要任何额外依赖。

跟 local-deep-research 的区别

你可能已经用过或听说过 LearningCircuit 的 local-deep-research(就是上周在 GitHub Trending 上那个 ~95% SimpleQA 的项目)。两者定位不同:

local-deep-research 是一个独立的深度研究 Agent,可以本地跑,侧重信息检索和问答。

academic-research-skills 是一个 Claude Code 插件,侧重学术论文的完整生产流程——从选题规划到最终成稿,强调 human-in-the-loop 的协作模式。

如果你要做的是"查资料",local-deep-research 更合适。如果你要写论文,academic-research-skills 的流水线更对口。


主要来源: