網易首頁 > 網易號 > 正文申請入駐

雙榜第一！文心5.1登頂中文創意寫作綜合實力評測

2026-05-20 09:03:09　來源: 聞道商業

泰國,曼谷舉報

分享至

5月18日，全球權威ICT領域市場研究機構Omdia發布《2026 年基礎模型中文創意寫作能力評估》報告，圍繞中文創意寫作七大核心維度，對 DeepSeek V4、文心5.1（ERNIE 5.1）、GPT 5.5 等 8大國內外主流頂級文本模型展開專業評估。結果顯示，百度文心5.1 成為唯一獨占四項最高評級的模型，穩居中文創意寫作領域綜合實力之首，是為綜合實力最強的市場領導者。

評估報告聚焦中文場景核心需求，從創造力和原創性、敘事質量、語言風格、整體一致性、內容安全、市場影響、合作伙伴和生態七大維度，對參評模型進行全維度、高標準驗證，具備較高行業參考價值。百度文心5.1 則分別在創意和原創性、語言風格、整體一致性、內容安全四大關鍵維度斬獲最高評級，是參與評估的八款模型中唯一達成此項成就的模型。

相較之下，DeepSeek V4、GPT 5.5 等模型雖在部分維度表現優異，但在中文語境理解、文化內涵把握、多維度均衡表現等維度存在短板，未能實現多維度頂級評級全覆蓋。文心 5.1 憑借對中文文化底蘊、語言邏輯及創作規律的深度深耕，已在本土創意寫作場景中形成顯著優勢競爭力。

同日，中文原生創意寫作專項測評基準（SuperCLUE-Writing）正式發布，文心 5.1 同樣以 87.57 分位列創意寫作國內第一、全球第二，在綜合表現上超越 Gemini-3.1-Pro-Preview、GPT-5.5(xhigh)、DeepSeek-V4-Pro(max) 等國內外主流模型。

此前文心 5.1 已在LMArena 搜索榜斬獲國內第一、全球第四，預訓練成本僅為業界同規模模型的 6%，兼具高性能與低成本優勢；4月30日，文心5.1 Preview還登上了LMArena 文本榜國內第一，是榜單前十五名中唯一入圍的國產模型。

全球大模型競技場Arena引用最新斯坦福人工智能指數稱，自2025年初以來，中美大模型多次交替領先，目前整體差距已縮小至約 2.7%。在最受關注的文本賽道中，美國表現最突出的仍是 Anthropic 的 Claude Opus 4.6 Thinking，中國則是以百度的文心 5.1 為代表。

業內人士表示，文本能力仍是基礎模型最核心的底層能力之一。文心5.1在多個權威榜單和評測中的表現，體現了其在文本理解、語言生成等基礎能力上的積累，也反映出基礎模型能力建設的重要性。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.