品玩4月15日訊,百度文心大模型團隊正式開源全新文生圖模型ERNIE-Image。
該模型基于單流Diffusion Transformer架構,參數規模僅為8B,僅需24GB顯存的消費級顯卡即可運行,生成效果媲美頂級商業模型。經國際基準測試驗證,ERNIE-Image在通用圖像生成、復雜指令跟隨及文字渲染等任務中均取得開源模型SOTA成績,尤其在中英日韓多語言文字渲染能力上表現突出。
目前,模型權重與推理代碼已在Hugging Face開源,并上線ComfyUI Workflow及GGUF量化方案。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.