瑣碎整理 DeepSeek V4 的有價值、有趣信息,明天我會有詳細點的文章出來
順序沒有規律,看到哪隨手貼的
1、神速上線的 Ollama
Ollama 提供了一鍵啟動 deepseek-v4-flash,還有一鍵接入 claude、codex、opencode、openclaw
![]()
,它啟用的 launch 命令,更是神之一筆
2、價格還會更低 ![]()
這個大家應該都看過了
看來 DeepSeek 計劃大量使用華為進行推理
V4 到底用什么訓練的?99% 可能性還是 N 卡
還有更離譜的猜測,不太正確,就不說了
3、量化團隊們可能會集體啞火
本次放出的模型是FP4 + FP8 混合精度
MoE 的專家參數采用了 FP4 精度
模型的大部分其他參數采用 FP8 精度
一是權重壓縮空間不大,二是這種架構量化難度更大
![]()
這么火熱的模型,還不如和開源之時的盛況,幾個小時內就有一堆不同實現路徑的量化版了
V4 Flash 實現尺寸壓縮的只有 Q2 的 105GB、Q3 的 135GB,都是 MLX 架構
![]()
4、本地部署成本比想象中高
即便是 Flash 版本,我看 vlln/ascend 的教程也要 Atlas 800 A2 (64G × 8)
成本應該是 110 萬往上吧?
![]()
對應模型,權重300GB
![]()
5、股價波動——大家漲才是真的漲
國內大漲,核心標的,概念股都在漲
![]()
美國那邊,英偉達,英特爾也在漲
![]()
![]()
大家猜猜什么邏輯?
6、不誘于譽,不恐于誹,率道而行,端然正己 ![]()
這段文字出自《荀子·非十二子》,是荀子對于君子修身與處世原則的極高概括。
感覺,做到太難了。。。
1. 心境的獨立(“不誘于譽,不恐于誹”)
這八個字探討的是如何應對外部評價:
不誘于譽:面對名譽、贊美、鮮花與掌聲,內心保持清醒,不被它們所誘惑、所裹挾。過度的贊美往往是認知的陷阱,容易讓人迷失自我。
不恐于誹:面對誹謗、攻擊、質疑與詆毀,內心保持定力,不因此而恐懼、動搖或急于辯解。這是對內心強大程度的極致考驗。
2. 行為的準則(“率道而行,端然正己”)
這八個字探討的是應當如何自我約束與行動:
率道而行:遵循客觀的“道”(即事物的客觀規律、社會的正義原則),以此作為行動的唯一依據,而不是為了迎合世俗或博取虛名。
端然正己:儀態端正,自我修養嚴謹,從內心到外在都保持正大光明的狀態。這是一種“內圣外王”的修養境界。
![]()
我隨手測了閱讀理解+svg代碼生成+審美,結果是一言難盡,尤其是flash,更差
和上面的排名比較吻合
![]()
但是也有基準(vibe coding)把它排開源第一
![]()
Artificial Analysis在 GDPval-AA 基準中也給了V4 開源第一
![]()
PS:GDPval-AA是面向 “真實經濟價值任務” 的大模型實用性評測基準,側重智能體(agentic)能力與職場生產力的綜合評估。
8、官方API測速
這是比較快的結果
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.