5月18日,全球權威ICT領域市場研究機構Omdia發布《2026 年基礎模型中文創意寫作能力評估》報告,圍繞中文創意寫作七大核心維度,對 DeepSeek V4、文心5.1(ERNIE 5.1)、GPT 5.5 等 8大國內外主流頂級文本模型展開專業評估。結果顯示,百度文心5.1 成為唯一獨占四項最高評級的模型,穩居中文創意寫作領域綜合實力之首,是為綜合實力最強的市場領導者。
![]()
評估報告聚焦中文場景核心需求,從創造力和原創性、敘事質量、語言風格、整體一致性、內容安全、市場影響、合作伙伴和生態七大維度,對參評模型進行全維度、高標準驗證,具備較高行業參考價值。百度文心5.1 則分別在創意和原創性、語言風格、整體一致性、內容安全四大關鍵維度斬獲最高評級,是參與評估的八款模型中唯一達成此項成就的模型。
相較之下,DeepSeek V4、GPT 5.5 等模型雖在部分維度表現優異,但在中文語境理解、文化內涵把握、多維度均衡表現等維度存在短板,未能實現多維度頂級評級全覆蓋。文心 5.1 憑借對中文文化底蘊、語言邏輯及創作規律的深度深耕,已在本土創意寫作場景中形成顯著優勢競爭力。
同日,中文原生創意寫作專項測評基準(SuperCLUE-Writing)正式發布,文心 5.1 同樣以 87.57 分位列創意寫作國內第一、全球第二,在綜合表現上超越 Gemini-3.1-Pro-Preview、GPT-5.5(xhigh)、DeepSeek-V4-Pro(max) 等國內外主流模型。
![]()
此前文心 5.1 已在LMArena 搜索榜斬獲國內第一、全球第四,預訓練成本僅為業界同規模模型的 6%,兼具高性能與低成本優勢;4月30日,文心5.1 Preview還登上了LMArena 文本榜國內第一,是榜單前十五名中唯一入圍的國產模型。
全球大模型競技場Arena引用最新斯坦福人工智能指數稱,自2025年初以來,中美大模型多次交替領先,目前整體差距已縮小至約 2.7%。在最受關注的文本賽道中,美國表現最突出的仍是 Anthropic 的 Claude Opus 4.6 Thinking,中國則是以百度的文心 5.1 為代表。
業內人士表示,文本能力仍是基礎模型最核心的底層能力之一。文心5.1在多個權威榜單和評測中的表現,體現了其在文本理解、語言生成等基礎能力上的積累,也反映出基礎模型能力建設的重要性。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.