6.4k Stars！用Claude Code寫論文的全套流水線，有人打包開源了

聽雨發自凹非寺

量子位 | 公眾號 QbitAI

用Claude Code寫論文的一整套流水線，有人打包開源出來了論文。

完全戳中了學生黨的痛點，github星標直達6.4k論文。

6.4k Stars！用Claude Code寫論文的全套流水線，有人打包開源了

專案名叫academic-research-skills（以下簡稱ARS），是一套Claude Code技能包論文。

裡面涵蓋4個skill，分別對應論文的研究、寫作、審稿、定稿論文。

只需兩行命令安裝，直接一條龍串起整套學術研究流水線論文。

只能說，我讀研的時候怎麼沒碰到這種好東西呢…

展開全文

4個skill論文，跑通整套科研流程

ARS的核心架構由4個skill組成，它們各司其職，拼在一起就是一條從選題到交稿的完整鏈路論文。

我這裡還做了圖論文，大家可以看得比較直觀：

△AI生成

Deep Research是一支13個Agent的研究團隊論文。

它負責文獻調研、研究問題構建、方法論設計，還能寫系統性的PRISMA綜述論文。

團隊裡有專門做文獻溯源的Agent，會呼叫Semantic Scholar API驗證每一篇引用的真實性論文。

有蘇格拉底導師Agent，透過對話引導研究者理清思路論文。

還有魔鬼代言人Agent，專門挑刺，防止研究者在早期就陷入思維定式論文。

△AI生成

Academic Paper是一支12個Agent的寫作團隊論文。

從大綱設計、論證構建、草稿撰寫，到雙語摘要生成、圖表視覺化、引用格式轉換，全流程覆蓋論文。

特別值得一提的是風格校準功能，AI會學習你過往作品的寫作風格，讓輸出更像你自己寫的，而不是千篇一律的AI味論文。

輸出格式支援Markdown、DOCX、LaTeX，最終可以編譯成APA 7.0或IEEE格式的PDF論文。

△AI生成

Academic Paper Reviewer是一支7個Agent的審稿團隊論文。

模擬真實學術期刊的評審流程，由主編EIC帶領三位領域審稿人，再加上一個魔鬼代言人，從方法論、學科視角、跨學科價值等多個維度打分論文。

評分採用0到100的量化標準，80分以上接受，65到79小修，50到64大修，50以下拒稿論文。

審稿團隊還會輸出詳細的修改路線圖，告訴作者下一步該做什麼論文。

△AI生成

Academic Pipeline是流程編排器，把前面三個團隊串聯成一條10階段的流水線論文。

從研究、寫作、完整性檢查、同行評審、修訂、最終檢查，到發表準備和流程總結，每個階段都有明確的產物和檢查點論文。

你可以在任意階段插入，比如已經有了初稿，就從Stage 2.5的完整性檢查開始；收到了審稿意見，直接從Stage 4的修訂切入論文。

費用參考也很透明，一篇1.5萬字的論文，全程跑下來大約4到6美元論文。

△AI生成比較有意思的設計

用Claude Code做學術研究的開源專案已經很多了，但是深扒之後，我發現ARS在底層設計上還是有些過人之處論文。

可以簡單總結為一句話：系統性防止AI搞砸學術研究論文。

第一，引用核驗論文。

AI寫論文最忌諱的，就是幻覺引用論文。

不只是編造不存在的文章，還包括標題相似但作者年份全錯、DOI真實但內容對不上等更隱蔽的情況論文。

ARS在Deep Research階段就埋了一個引用核驗機制，每一篇文獻都要過Semantic Scholar API的存在性確認論文。

不是簡單查一下標題對不對，而是用Levenshtein相似度演算法做模糊匹配，閾值設在0.70以上才算透過論文。

△AI生成

第二，完整性閘門論文。

在流水線的Stage 2.5和Stage 4.5，有兩道不可跳過的完整性閘門，會執行一份7項AI失敗模式檢查清單論文。

這份清單直接來自2026年Nature上發表的一項全自主AI科研研究，其中總結了7種翻車模式，覆蓋引用幻覺、資料捏造、方法論造假等情形論文。

任何在2.5被標記為SUSPECTED的問題，必須在4.5變成CLEAR，或者由人工手動覆蓋並留下記錄論文。

設計邏輯是：把「我相信AI不會出錯」變成「我要求AI證明它沒出錯」論文。

實測中，這套機制在一篇真實論文裡抓到了15個偽造引用和3個統計錯誤論文。

第三，反諂媚協議，讓AI敢於說不論文。

大多數AI工具都有一個隱形毛病，討好使用者論文。你讓它改，它就改，哪怕改得更差。

所以ARS在審稿環節專門設計了反諂媚機制論文。

審稿團隊裡有一個 Devil’s Advocate，也就是魔鬼代言人，職責是挑刺論文。

但挑完刺之後，還有一個讓步閾值協議論文。

DA的反駁會被評分1到5，如果低於4分，寫作團隊不允許承認論文。

△AI生成

換句話說，AI不能為了顯得好合作就輕易讓步論文。

同時，攻擊強度在修訂過程中必須保持論文。如果第一輪審稿把方法論批得體無完膚，作者修訂後不能讓審稿人突然變得溫柔。

評分軌跡也會被追蹤，任何維度的分數下降都會被標記為迴歸論文。

這和軟體工程裡的不引入新Bug原則一樣，改一個地方不能搞砸另一個地方論文。

第四，三層資料隔離，不讓AI偷看答案論文。

ARS把資料流嚴格分成三層論文：

Layer 1是原始輸入，預設不可信，可能幻覺、過時、帶偏見論文。

Layer 2是透過完整性驗證後的產物論文。

Layer 3是評分標準、參考答案和金標資料，這層材料永遠不能出現在寫作AI的上下文中論文。

具體實現上，寫作團隊和審稿團隊分兩次獨立呼叫，中間有階段邊界隔離論文。

寫作AI只能收到審稿AI的自然語言反饋，比如「第二章論證跳躍，建議補充對比實驗」論文。

但它看不到原始的評分標準，也不知道每個維度佔多少分論文。

這個設計的靈感來自於Anthropic今年的w2s-researcher研究，其中也用了同樣的三層隔離模型論文。

結論是當AI能讀取標籤資料時，結果可能不是真的泛化，而是在最佳化表面特徵論文。

解決方案不是更好的提示詞，而是結構上的隔離論文。

△AI生成

最後一點，誠實文件化，「我不保證能復現」論文。

學術界經常遇到「這個結果我復現不了」的問題論文。ARS給每個產物生成一個repro_lock檔案，記錄執行時的完整配置。

但檔案裡有一段強制宣告，LLM輸出不是位元組級可復現的，模型提供商會更新權重而不改模型ID，外部API每天返回不同的資料論文。

這個檔案只是配置文件，不是重放保證論文。

△AI生成

在更新日誌上，可以看到ARS已經經歷了很多輪迭代論文。從2月上線到現在，提交的commit數達到了三百多次。

從每次版本更迭中，也能看出作者對AI學術研究系統風險有著深刻理解論文。

這也是我覺得目前學術研究AI工具的關鍵所在——

讓AI幫你寫論文並不難，重點是如何防止它出錯、討好，讓整個流程變得更系統更可靠論文。

ARS的設計哲學論文，可以總結為README裡那句話：

「AI是你的副駕駛，不是飛行員論文。」

如何安裝

安裝方式很簡單論文，如果你已經在用Claude Code，只需要兩行命令：

/plugin marketplace add Imbad0202/academic-research-skills

/plugin install academic-research-skills

/plugin marketplace add Imbad0202/academic-research-skills

/plugin install academic-research-skills

驗證安裝是否成功論文，執行：

/ars-plan

然後描述你正在寫的論文主題，ARS就會啟動蘇格拉底對話，幫你梳理論文結構論文。

如果你偏好單條命令測試論文，也可以用：

/ars-lit-review “你的研究主題”

不過最簡單的安裝辦法，其實是直接把SKILL.md上傳到claude.ai專案知識庫論文。

不需要安裝Claude Code，開啟瀏覽器就能用論文。

不過要注意，這種方式不支援多Agent並行，功能上是單Agent版本，適合輕度體驗；想跑完整流水線還是需要Claude Code論文。

還有一點，專案支援繁體中文和英文論文。

那麼，又到了大家最關心的，要花多少錢的環節論文。

完整跑完10個階段，單次可消耗超過20萬輸入token和10萬輸出token，單獨使用某個子模組則少得多論文。

但如果你的科研經費可以報銷的話論文，那…

最後嘮一句專案作者論文。

他是Edward Cheng-I Wu（吳政宜），頭像是一個頂著貓貓的可愛男生論文。

他來自中國臺灣論文。在github上，他還做了臺灣正式檔案寫作Skill（公文、存證信函、合約）、本地資料匿名化工具等專案。

專案地址論文：

6.4k Stars！用Claude Code寫論文的全套流水線，有人打包開源了

上海偉傑國際貨物運輸代理有限公司

熱門標籤

相關詞彙