日前有消息稱,DeepSeek創(chuàng)始人梁文鋒近期在內(nèi)部溝通中透露,該公司新一代旗艦大模型DeepSeek V4將于4月下旬正式發(fā)布。
相關(guān)消息源透露,DeepSeek V4將實現(xiàn)重大技術(shù)突破,包括萬億參數(shù)規(guī)模、百萬級上下文窗口,并在推理階段首次全面適配華為昇騰等國產(chǎn)AI芯片,成為國內(nèi)首個在全鏈路算力上徹底擺脫英偉達依賴的萬億級大模型,實現(xiàn)推理速度較DeepSeek V3提升35倍、能耗降低40%。
據(jù)稱,DeepSeek V4預(yù)計將以Apache 2.0協(xié)議開源,支持企業(yè)自主部署,并已被阿里、騰訊、字節(jié)等科技巨頭提前預(yù)訂算力資源,計劃集成至其云服務(wù)與AI產(chǎn)品中。
對此傳言,DeepSeek方面尚未進行回應(yīng)。
![]()
需要注意的是此前曾有消息稱,“今年1月左右,DeepSeek V4的一個小參數(shù)版本已給到了一些開源框架社區(qū)開始做適配”。而且3月底DeepSeek經(jīng)歷了一次服務(wù)中斷,恢復(fù)后開發(fā)者實測模型邏輯嚴謹性、代碼生成能力均顯著提升,認為疑似DeepSeek V4灰度測試。
此外,日前DeepSeek迎來更新,對話頁面出現(xiàn)快速模式和專家模式兩種選項,并且這一更新已覆蓋網(wǎng)頁端和移動端。據(jù)了解,這是DeepSeek首次在產(chǎn)品端引入模式分層設(shè)計,并且快速模式與專家模式均支持深度思考和智能搜索。其中,快速模式適配日常對話、即時響應(yīng),專家模式則更擅長處理復(fù)雜問題。
【本文圖片來自網(wǎng)絡(luò)】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.