天博官网(TBSports) 6.4k Stars！用Claude Code写论文的全套活水线，有东说念主打包开源了

发布日期：2026-05-17 18:55 来源：未知作者：admin 浏览次数：

听雨发自凹非寺量子位 | 公众号 QbitAI

用Claude Code写论文的一整套活水线，有东说念主打包开源出来了。

竣工戳中了学生党的痛点，github星标直达6.4k。

academic-research-skills

技俩名叫academic-research-skills（以下简称ARS），是一套Claude Code手段包。

内部涵盖4个skill，分裂对应论文的商议、写稿、审稿、定稿。

只需两行敕令装置，成功一条龙串起整套学术商议活水线。

academic-research-skills

只可说，我读研的时候怎么没碰到这种好东西呢…

暗示图

4个skill，跑通整套科研经由

ARS的中枢架构由4个skill构成，它们各司其职，拼在沿途即是一条从选题到交稿的完满链路。

我这里还作念了图，各人不错看得相比直不雅：

AG真人中国官方网站

Deep Research是一支13个Agent的商议团队。

它风雅文献调研、商议问题构建、法子论狡计，还能写系统性的PRISMA综述。

团队里有专门作念文献溯源的Agent，会调用Semantic Scholar API考据每一篇援用的真确性。

有苏格拉底导师Agent，通过对话指挥商议者理清想路。

还有妖怪代言东说念主Agent，专门挑刺，防患商议者在早期就堕入想维定式。

Academic Paper是一支12个Agent的写稿团队。

从大纲狡计、论证构建、草稿撰写，到双语节录生成、图表可视化、援用局势周折，全经由覆盖。

特殊值得一提的是立场校准功能，AI会学习你过往作品的写稿立场，让输出更像你我方写的，而不是千人一面的AI味。

输出局势援救Markdown、DOCX、LaTeX，最终不错编译成APA 7.0或IEEE局势的PDF。

Academic Paper Reviewer是一支7个Agent的审稿团队。

模拟真确学术期刊的评审经由，由主编EIC指导三位限度审稿东说念主，再加上一个妖怪代言东说念主，从法子论、学科视角、跨学科价值等多个维度打分。

评分接纳0到100的量化轨范，80分以上收受，65到79小修，50到64大修，50以下拒稿。

审稿团队还会输出详备的修改阶梯图，告诉作家下一步该作念什么。

Academic Pipeline是经由编排器，把前边三个团队串联成一条10阶段的活水线。

从商议、写稿、完满性查验、同业评审、校正、最终查验，到发表准备和经由总结，每个阶段王人有明确的居品和查验点。

你不错在职意阶段插入，比如一经有了初稿，就从Stage 2.5的完满性查验开动；收到了审稿见地，成功从Stage 4的校正切入。

用度参考也很透明，一篇1.5万字的论文，全程跑下来节略4到6好意思元。

相比寥落义的狡计

用Claude Code作念学术商议的开源技俩一经许多了，可是深扒之后，开云体育(中国)官方网站我发现ARS在底层狡计上如故有些过东说念主之处。

不错简便总结为一句话：系统性防患AI搞砸学术商议。

第一，援用核验。

AI写论文最忌讳的，即是幻觉援用。

不仅仅假造不存在的著述，还包括标题相似但作家年份全错、DOI真确但推行对不上等更掩盖的情况。

ARS在Deep Research阶段就埋了一个援用核验机制，每一篇文献王人要过Semantic Scholar API的存在性证据。

不是简便查一下标题对分歧，而是用Levenshtein相似度算法作念暧昧匹配，阈值设在0.70以上才算通过。

第二，完满性闸门。

在活水线的Stage 2.5和Stage 4.5，有两说念不可跳过的完满性闸门，会运行一份7项AI失败情势查验清单。

这份清单成功来自2026年Nature上发表的一项全自主AI科研商议，其中总结了7种翻车情势，覆盖援用幻觉、数据抓造、法子论作秀等情形。

7种翻车情势

任安在2.5被符号为SUSPECTED的问题，必须在4.5酿成CLEAR，大略由东说念主工手动覆盖并留住纪录。

狡计逻辑是：把「我笃信AI不会出错」酿成「我条件AI说明它没出错」。

实测中，这套机制在一篇真确论文里抓到了15个伪造援用和3个统计无理。

第三，反夤缘条约，让AI勇于说不。

大巨额AI用具王人有一个隐形时弊，凑趣用户。你让它改，它就改，哪怕改得更差。

是以ARS在审稿门径专门狡计了反夤缘机制。

审稿团队里有一个Devil’s Advocate，天博官网(TBSports)也即是妖怪代言东说念主，服务是挑刺。

但挑完刺之后，还有一个败北阈值条约。

DA的反驳会被评分1到5，如若低于4分，写稿团队不允许承认。

换句话说，AI不成为了显得好互助就轻佻败北。

同期，曲折强度在校正过程中必须保持。如若第一轮审稿把法子论批多礼无完皮，作家校正后不成让审稿东说念主短暂变得温情。

评分轨迹也会被跟踪，任何维度的分数下跌王人会被符号为总结。

这和软件工程里的不引入新Bug原则一样，改一个场所不成搞砸另一个场所。

第四，三层数据终止，不让AI偷看谜底。

ARS把数据流严格分红三层：

Layer 1是原始输入，默许不的确，可能幻觉、过期、带偏见。

Layer 2是通过完满性考据后的居品。

Layer 3是评分轨范、参考谜底和金标数据，这层材料始终不成出现时写稿AI的凹凸文中。

具体完了上，写稿团队和审稿团队分两次沉寂调用，中间有阶段范畴终止。

写稿AI只可收到审稿AI的当然说话响应，比如「第二章论证越过，提倡补充对比实验」。

但它看不到原始的评分轨范，也不知说念每个维度占若干分。

这个狡计的灵感来自于Anthropic本年的w2s-researcher商议，其中也用了雷同的三层终止模子。

论断是当AI能读取标签数据时，成果可能不是真实泛化，而是在优假名义特征。

处置决策不是更好的教唆词，而是结构上的终止。

终末少量，厚实文档化，「我不保证能复现」。

学术界频繁遭受「这个成果我复现不了」的问题。ARS给每个居品生成一个repro_lock文献，纪录运行时的完满成就。

但文献里有一段强制声明，LLM输出不是字节级可复现的，模子提供商会更新权重而不改模子ID，外部API每天复返不同的数据。

这个文献仅仅成就文档，不是重放保证。

在更新日记上，不错看到ARS一经阅历了许多轮迭代。从2月上线到现时，提交的commit数达到了三百屡次。

从每次版块更替中，也能看出作家对AI学术商议系统风险有着长远清爽。

这亦然我合计现时学术商议AI用具的要津所在——

让AI帮你写论文并不难，要点是怎么防患它出错、凑趣，让悉数这个词经由变得更系统更可靠。

ARS的狡计玄学，不错总结为README里那句话：

「AI是你的副驾驶，不是飞翔员。」

怎么装置

装置形貌很简便，如若你一经在用Claude Code，只需要两行敕令：

/plugin marketplace add Imbad0202/academic-research-skills/plugin install academic-research-skills

考据装置是否得胜，运行：

/ars-plan

然后形容你正在写的论文主题，ARS就会启动苏格拉底对话，帮你梳表面文结构。

如若你偏好单条敕令测试，也不错用：

/ars-lit-review “你的商议主题”

不外最简便的装置方针，其实是成功把SKILL.md上传到claude.ai技俩学问库。

不需要装置Claude Code，绽放浏览器就能用。

不外要预防，这种形貌不援救多Agent并行，功能上是单Agent版块，合适轻度体验；想跑完满活水线如故需要Claude Code。

还有少量，技俩援救繁体汉文和英文。

那么，又到了各人最关怀的，要花若干钱的门径。

作家推选使用Claude Opus 4.7搭配Max订阅研讨。

完满跑完10个阶段，单次可浮滥杰出20万输入token和10万输出token，单独使用某个子模块则少得多。

Max订阅研讨分两档，每月100刀或200刀，相配未低廉。

但如若你的科研经费不错报销的话，那…

暗示图

本文来自微信公众号“量子位”，作家：关注前沿科技，36氪经授权发布。

上一篇：上一篇：天博体育(TBSports)官方网站皇后城锦标赛沃德跳动第三轮殷若宁T10科达T19

下一篇：下一篇：天博体育官方网站乌克兰总统办公室前主任叶尔马克交纳保释金, 约束审前羁押

天博盘口

天博官网(TBSports) 6.4k Stars！用Claude Code写论文的全套活水线，有东说念主打包开源了