无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

6.4k Stars!用Claude Code寫論文的全套流水線,有人打包開源了

0
分享至

聽雨 發自 凹非寺量子位 | 公眾號 QbitAI

用Claude Code寫論文的一整套流水線,有人打包開源出來了。

完全戳中了學生黨的痛點,github星標直達6.4k。


academic-research-skills

項目名叫academic-research-skills(以下簡稱ARS),是一套Claude Code技能包。

里面涵蓋4個skill,分別對應論文的研究、寫作、審稿、定稿

只需兩行命令安裝,直接一條龍串起整套學術研究流水線。


academic-research-skills

只能說,我讀研的時候怎么沒碰到這種好東西呢…


示意圖

4個skill,跑通整套科研流程

ARS的核心架構由4個skill組成,它們各司其職,拼在一起就是一條從選題到交稿的完整鏈路。

我這里還做了圖,大家可以看得比較直觀:


Deep Research是一支13個Agent的研究團隊。

它負責文獻調研、研究問題構建、方法論設計,還能寫系統性的PRISMA綜述。

團隊里有專門做文獻溯源的Agent,會調用Semantic Scholar API驗證每一篇引用的真實性。

有蘇格拉底導師Agent,通過對話引導研究者理清思路。

還有魔鬼代言人Agent,專門挑刺,防止研究者在早期就陷入思維定式。


Academic Paper是一支12個Agent的寫作團隊。

從大綱設計、論證構建、草稿撰寫,到雙語摘要生成、圖表可視化、引用格式轉換,全流程覆蓋。

特別值得一提的是風格校準功能,AI會學習你過往作品的寫作風格,讓輸出更像你自己寫的,而不是千篇一律的AI味。

輸出格式支持Markdown、DOCX、LaTeX,最終可以編譯成APA 7.0或IEEE格式的PDF。


Academic Paper Reviewer是一支7個Agent的審稿團隊。

模擬真實學術期刊的評審流程,由主編EIC帶領三位領域審稿人,再加上一個魔鬼代言人,從方法論、學科視角、跨學科價值等多個維度打分。

評分采用0到100的量化標準,80分以上接受,65到79小修,50到64大修,50以下拒稿。

審稿團隊還會輸出詳細的修改路線圖,告訴作者下一步該做什么。


Academic Pipeline是流程編排器,把前面三個團隊串聯成一條10階段的流水線。

從研究、寫作、完整性檢查、同行評審、修訂、最終檢查,到發表準備和流程總結,每個階段都有明確的產物和檢查點。

你可以在任意階段插入,比如已經有了初稿,就從Stage 2.5的完整性檢查開始;收到了審稿意見,直接從Stage 4的修訂切入。

費用參考也很透明,一篇1.5萬字的論文,全程跑下來大約4到6美元。


比較有意思的設計

用Claude Code做學術研究的開源項目已經很多了,但是深扒之后,我發現ARS在底層設計上還是有些過人之處。

可以簡單總結為一句話:系統性防止AI搞砸學術研究。

第一,引用核驗。

AI寫論文最忌諱的,就是幻覺引用。

不只是編造不存在的文章,還包括標題相似但作者年份全錯、DOI真實但內容對不上等更隱蔽的情況。

ARS在Deep Research階段就埋了一個引用核驗機制,每一篇文獻都要過Semantic Scholar API的存在性確認。

不是簡單查一下標題對不對,而是用Levenshtein相似度算法做模糊匹配,閾值設在0.70以上才算通過。


第二,完整性閘門。

在流水線的Stage 2.5和Stage 4.5,有兩道不可跳過的完整性閘門,會運行一份7項AI失敗模式檢查清單。

這份清單直接來自2026年Nature上發表的一項全自主AI科研研究,其中總結了7種翻車模式,覆蓋引用幻覺、數據捏造、方法論造假等情形。


7種翻車模式

任何在2.5被標記為SUSPECTED的問題,必須在4.5變成CLEAR,或者由人工手動覆蓋并留下記錄。

設計邏輯是:把「我相信AI不會出錯」變成「我要求AI證明它沒出錯」。

實測中,這套機制在一篇真實論文里抓到了15個偽造引用和3個統計錯誤。

第三,反諂媚協議,讓AI敢于說不。

大多數AI工具都有一個隱形毛病,討好用戶。你讓它改,它就改,哪怕改得更差。

所以ARS在審稿環節專門設計了反諂媚機制。

審稿團隊里有一個Devil’s Advocate,也就是魔鬼代言人,職責是挑刺。

但挑完刺之后,還有一個讓步閾值協議。

DA的反駁會被評分1到5,如果低于4分,寫作團隊不允許承認。


換句話說,AI不能為了顯得好合作就輕易讓步。

同時,攻擊強度在修訂過程中必須保持。如果第一輪審稿把方法論批得體無完膚,作者修訂后不能讓審稿人突然變得溫柔。

評分軌跡也會被追蹤,任何維度的分數下降都會被標記為回歸。

這和軟件工程里的不引入新Bug原則一樣,改一個地方不能搞砸另一個地方。

第四,三層數據隔離,不讓AI偷看答案。

ARS把數據流嚴格分成三層:

Layer 1是原始輸入,默認不可信,可能幻覺、過時、帶偏見。

Layer 2是通過完整性驗證后的產物。

Layer 3是評分標準、參考答案和金標數據,這層材料永遠不能出現在寫作AI的上下文中。

具體實現上,寫作團隊和審稿團隊分兩次獨立調用,中間有階段邊界隔離。

寫作AI只能收到審稿AI的自然語言反饋,比如「第二章論證跳躍,建議補充對比實驗」。

但它看不到原始的評分標準,也不知道每個維度占多少分。

這個設計的靈感來自于Anthropic今年的w2s-researcher研究,其中也用了同樣的三層隔離模型。

結論是當AI能讀取標簽數據時,結果可能不是真的泛化,而是在優化表面特征。

解決方案不是更好的提示詞,而是結構上的隔離。


最后一點,誠實文檔化,「我不保證能復現」。

學術界經常遇到「這個結果我復現不了」的問題。ARS給每個產物生成一個repro_lock文件,記錄運行時的完整配置。

但文件里有一段強制聲明,LLM輸出不是字節級可復現的,模型提供商會更新權重而不改模型ID,外部API每天返回不同的數據。

這個文件只是配置文檔,不是重放保證。


在更新日志上,可以看到ARS已經經歷了很多輪迭代。從2月上線到現在,提交的commit數達到了三百多次。

從每次版本更迭中,也能看出作者對AI學術研究系統風險有著深刻理解。

這也是我覺得目前學術研究AI工具的關鍵所在——

讓AI幫你寫論文并不難,重點是如何防止它出錯、討好,讓整個流程變得更系統更可靠。

ARS的設計哲學,可以總結為README里那句話:

「AI是你的副駕駛,不是飛行員?!?/strong>

如何安裝

安裝方式很簡單,如果你已經在用Claude Code,只需要兩行命令:

/plugin marketplace add Imbad0202/academic-research-skills/plugin install academic-research-skills

驗證安裝是否成功,運行:

/ars-plan

然后描述你正在寫的論文主題,ARS就會啟動蘇格拉底對話,幫你梳理論文結構。

如果你偏好單條命令測試,也可以用:

/ars-lit-review “你的研究主題”

不過最簡單的安裝辦法,其實是直接把SKILL.md上傳到claude.ai項目知識庫

不需要安裝Claude Code,打開瀏覽器就能用。

不過要注意,這種方式不支持多Agent并行,功能上是單Agent版本,適合輕度體驗;想跑完整流水線還是需要Claude Code。

還有一點,項目支持繁體中文和英文。

那么,又到了大家最關心的,要花多少錢的環節。

作者推薦使用Claude Opus 4.7搭配Max訂閱計劃

完整跑完10個階段,單次可消耗超過20萬輸入token和10萬輸出token,單獨使用某個子模塊則少得多。

Max訂閱計劃分兩檔,每月100刀或200刀,相當不便宜。

但如果你的科研經費可以報銷的話,那…


示意圖

本文來自微信公眾號“量子位”,作者:關注前沿科技,36氪經授權發布。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
奧迪A6L暴跌20萬!創20年歷史最低,豪華信仰崩塌?

奧迪A6L暴跌20萬!創20年歷史最低,豪華信仰崩塌?

音樂時光的娛樂
2026-06-30 19:46:32
姐姐前100!妹妹前300!今年高考,北京這對雙胞胎姐妹火了!

姐姐前100!妹妹前300!今年高考,北京這對雙胞胎姐妹火了!

京城教育圈
2026-07-01 12:53:24
13年前 和孔令輝分開,被黑人 扛在肩膀上的她,如今靠著佟大為火

13年前 和孔令輝分開,被黑人 扛在肩膀上的她,如今靠著佟大為火

娛圈挖掘機
2026-07-01 11:39:12
中方不見日大使,日企警告災難將至,中日一旦開戰,結果早已注定

中方不見日大使,日企警告災難將至,中日一旦開戰,結果早已注定

鐵錘侃侃而談
2026-07-01 12:21:28
中央再發鐵令!領導干部出現這15種情形 , 將不能再擔任現職!

中央再發鐵令!領導干部出現這15種情形 , 將不能再擔任現職!

職場資深秘書
2026-06-30 18:29:35
看看中國,再看看美國,歐洲人更難受了……

看看中國,再看看美國,歐洲人更難受了……

環球時報國際
2026-07-01 07:45:23
塔利班高官被摘烏紗帽,干脆回老家招兵買馬!軍閥割據戲碼正上演

塔利班高官被摘烏紗帽,干脆回老家招兵買馬!軍閥割據戲碼正上演

芳芳歷史燴
2026-07-01 06:43:26
最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
蘇提達思蕊梵在愛麗舍宮母女合影,二美表情不同,王后高下立見

蘇提達思蕊梵在愛麗舍宮母女合影,二美表情不同,王后高下立見

花小貓的美食日常
2026-07-01 10:35:18
四川甘孜一山體出現大量落石阻斷道路,當地政府部門:連續降雨導致山體松動后滑坡,未造成人員傷亡

四川甘孜一山體出現大量落石阻斷道路,當地政府部門:連續降雨導致山體松動后滑坡,未造成人員傷亡

洪觀新聞
2026-07-01 15:25:59
我為什么不看《抓特務》

我為什么不看《抓特務》

秋月獨朗
2026-06-25 13:55:24
世界杯比賽前瞻丨英格蘭5-0民主剛果:三獅不怕身體對抗怕另兩樣

世界杯比賽前瞻丨英格蘭5-0民主剛果:三獅不怕身體對抗怕另兩樣

體育世界
2026-07-01 14:08:55
意大利隊沒去成世界杯,場外新聞卻不斷,國腳巴斯托尼被立案調查:涉嫌與一名17歲少女有償往來

意大利隊沒去成世界杯,場外新聞卻不斷,國腳巴斯托尼被立案調查:涉嫌與一名17歲少女有償往來

紅星新聞
2026-07-01 12:24:53
誰能進四強?世界杯1/4分區:法國vs巴拉圭,加拿大vs摩洛哥

誰能進四強?世界杯1/4分區:法國vs巴拉圭,加拿大vs摩洛哥

懂球帝
2026-07-01 07:28:02
跌落神壇:2026退步最慘烈的6所985大學

跌落神壇:2026退步最慘烈的6所985大學

王姐懶人家常菜
2026-06-27 15:52:02
王楚欽說孫穎莎除了打球,其他啥也不會

王楚欽說孫穎莎除了打球,其他啥也不會

最愛乒乓球
2026-06-29 00:06:20
玥兒放暑假回北京!汪小菲獨自陪女兒街頭散步,12歲玥兒變化好大

玥兒放暑假回北京!汪小菲獨自陪女兒街頭散步,12歲玥兒變化好大

秋姐居
2026-06-30 11:35:34
頭號大熱出爐!世界杯6大奪冠熱門來了!阿根廷僅第4,葡萄牙第5

頭號大熱出爐!世界杯6大奪冠熱門來了!阿根廷僅第4,葡萄牙第5

球叮足球
2026-06-03 09:47:29
追覓宇宙已有近千家公司

追覓宇宙已有近千家公司

雷達財經
2026-07-01 12:00:07
35歲男子收到崗位被 AI 取代通知,拒絕大幅降薪后被單位開除。

35歲男子收到崗位被 AI 取代通知,拒絕大幅降薪后被單位開除。

HR薔薇
2026-06-30 16:03:56
2026-07-01 16:44:49
36氪 incentive-icons
36氪
讓一部分人先看到未來
151799文章數 2848974關注度
往期回顧 全部

科技要聞

Claude Code被曝“植入木馬”識別中國用戶

頭條要聞

女生考駕照留下心理陰影 還被練車的"人情世故"整崩潰

頭條要聞

女生考駕照留下心理陰影 還被練車的"人情世故"整崩潰

體育要聞

賣球衣救子的門將,把德國撲出了世界杯

娛樂要聞

張凌赫:我連心疼你都隔著時差

財經要聞

新氧貸款:宣傳年化15%,實際頂格24%

汽車要聞

交付持續攀升再破紀錄 零跑6月全球交付93376臺

態度原創

本地
健康
數碼
房產
親子

本地新聞

強烈建議,全國高校都向這所大學看齊!

狂吃“糯嘰嘰”小心腸梗阻!

數碼要聞

九州風神推出冰域420一體式水冷散熱器,649元

房產要聞

洋房盛大交付,中海丨南海·叁號院獻映世界海岸的人居答案

親子要聞

地震后 家長要注意 這5點知識

無障礙瀏覽 進入關懷版