據(jù)IT之家援引外媒報道,Anthropic 正通過一個由約 1000 名人類軟件工程師參與的項目,提升 Claude Code 的性能。該項目在數(shù)據(jù)標(biāo)注公司 Snorkel AI 內(nèi)部被稱為“Marlin”(馬林魚),其核心在于微調(diào) Claude Code 的回答,使其能夠更接近開發(fā)人員的真實工作環(huán)境。
像 Anthropic 這樣的 AI 公司通常會將數(shù)據(jù)工作外包給諸如 Snorkel 之類的第三方公司,而這些第三方公司會雇傭外包人員來向 AI 教授各種專業(yè)領(lǐng)域的學(xué)科,并執(zhí)行其他任務(wù)以改進(jìn)模型。
兩位參與該 Anthropic 項目的外包人員透露,他們編寫提示詞并審查代碼的報酬為每項任務(wù) 280 美元(約合 1902 元人民幣)。
在 Marlin 項目中,擁有軟件工程背景的外包人員被要求對兩種不同模型生產(chǎn)的代碼進(jìn)行 A/B 測試。他們會比較兩組輸出,選擇自己更偏好的結(jié)果,并判斷模型是否真正達(dá)到了提示詞要求的細(xì)節(jié)程度。
一名外包人員表示,從本質(zhì)上講,就是在訓(xùn)練 Claude Code 生產(chǎn)更簡化、更易于維護(hù)的代碼。據(jù)悉,該項目目前仍在進(jìn)行中。外包人員并不知道他們所評估的是哪個版本的模型。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.