无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek-V3橫空出世,GPT-4時代終結?

0
分享至

眾所周知,過去一年間,大語言模型(LLM)領域經歷了翻天覆地的變化...

回望2023年底,OpenAI的GPT-4還是一座難以逾越的高峰,其他AI實驗室都在思考同一個問題:OpenAI究竟掌握了哪些獨特的技術秘密?
一年后的今天,形勢已發生根本性轉變,據Chatbot Arena排行榜顯示,原始版本的GPT-4(GPT-4-0314)已跌至第70位左右。目前,已有18家機構的70個模型在性能上超越了這個曾經的標桿。

隨著2025年的嶄新啟航,是否意味著AI圈的一顆“王炸”已悄然“引爆”?

近日,國產大模型DeepSeek推出DeepSeek-V3,一個強大的混合專家(Mixture-of-Experts, MoE)語言模型,DeepSeek-V3擁有高達6710億的參數規模,但每次推理僅激活370億參數。
尤其,當o1、Claude、Gemini和Llama 3等模型還在為數億美元的訓練成本苦惱時, DeepSeek-V3用557.6萬美元的預算,在2048個H800 GPU集群上僅花費3.7天/萬億tokens的訓練時間,就達到了足以與它們比肩的性能 。

與此同時,DeepSeek-V3相比其他前沿大模型,性能卻足以比肩乃至更優。

其中,這種設計使得模型在性能和效率上實現了完美平衡,在多項模型測評中,DeepSeek-V3不僅超越了Llama 3.1 405B等頂級開源模型,更在代碼、數學、長文本處理等領域,與GPT-4o和Claude 3.5 Sonnet等閉源模型分庭抗禮。
其次,通過671B的總參數量,在每個token激活37B參數的精準控制下,DeepSeek-V3用14.8萬億高質量多樣化token,構建出了一個能夠超越所有開源模型,直逼GPT-4和Claude-3.5的AI巨人。
另外,在基礎理解能力測試中,DeepSeek-V3與Claude-3.5模型面對中文腦筋急轉彎“小明的媽媽有三個孩子”的問題,DeepSeek V3表現出色,不僅答對還進行了自我驗證。但在英文雙關語“April Fool's Day”的測試中則略顯不足,未能理解其中的語言巧思,而Claude3.5Sonnet則輕松應對。

除此之外,DeepSeek自言,這得益于采用了Multi-head Latent Attention (MLA)和DeepSeek MoE架構,實現了高效的推理和經濟高效的訓練。

Multi-head Latent Attention (MLA):MLA 通過對注意力鍵和值進行低秩聯合壓縮,減少了推理時的 KV 緩存,同時保持了與標準多頭注意力(MHA)相當的性能。

DeepSeekMoE:DeepSeekMoE 采用了更細粒度的專家分配策略,每個 MoE 層包含 1 個共享專家和 256 個路由專家,每個令牌激活 8 個專家,確保了計算的高效性。

因此,在系統架構層面,DeepSeek就使用了專家并行訓練技術,通過將不同的專家模塊分配到不同的計算設備上同時進行訓練,提升了訓練過程中的計算效率。

DeepSeek探索出一個精妙的解決策略,不等到最后再算總和,而是每加128個數就把當前結果轉移到科學計算器上繼續計算。其過程不影響速度,此技術利用了H800 GPU的特點:就像有兩個收銀員,當一個在結算購物籃的同時,另一個便可繼續掃描新商品。
這一策略使得模型訓練速度大幅提升,畢竟核心計算能提升100%的速度,而顯存使用減少也非常明顯,并且模型最終的效果精度損失能做到小于0.25%,幾乎無損。

但由于DeepSeek“大方”開源,Open AI水靈靈地被網友cue進行橫向對比,有一種被push的支配感。

Scale AI創始人亞歷山大·王 (Alexander Wang)更表示,DeepSeek-V3帶來的辛酸教訓是:當美國休息時,中國在工作,以更低的成本、更快的速度迎頭趕上,變得更強。

簡言之,這種變深刻折射出AI領域的變革。在2023年,超越GPT-4還是一個值得載入史冊的重大突破,轉眼至2024年,這一成就已然演變為衡量頂級AI模型的基準線。

而剛到來的2025年,DeepSeek用行動說明,中國大模型創業者,共同參與這場全球創新AI競賽中。

由于篇幅受限,本次的DeepSeek V3就先介紹這么多......

想了解更多半導體行業動態,請您持續關注我們。

奇普樂將在每周,不定時更新~

最后的最后,借由彼得·德魯克的一句名言:

預測未來的最好方法就是創造未來。

愿每一位半導體從業者可以——

化危為機,開創未來!

聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
B費傳射建功!賽季獨造30球,21助打破英超紀錄,激情滑跪慶祝

B費傳射建功!賽季獨造30球,21助打破英超紀錄,激情滑跪慶祝

奧拜爾
2026-05-25 00:20:42
以總理稱同特朗普一致認為須消除伊朗“核威脅”

以總理稱同特朗普一致認為須消除伊朗“核威脅”

新華社
2026-05-25 00:19:01
山西礦難已致90死!國務院“較真碰硬”背后,老板會被判重刑嗎?

山西礦難已致90死!國務院“較真碰硬”背后,老板會被判重刑嗎?

荊門熱點
2026-05-24 09:32:09
你造車沒我專業!當年指著張雪鼻子罵的王鑄,成了2026年最大笑話

你造車沒我專業!當年指著張雪鼻子罵的王鑄,成了2026年最大笑話

周哥一影視
2026-05-23 08:52:01
徐留平被查,據傳3月份已被帶走

徐留平被查,據傳3月份已被帶走

新浪財經
2026-05-24 09:28:14
家里有這種枕頭趕緊扔!致癌物超標、比甲醛還“毒”,很多人還天天用

家里有這種枕頭趕緊扔!致癌物超標、比甲醛還“毒”,很多人還天天用

蓬勃新聞
2026-05-14 23:43:33
《劍星》體模申才恩再穿"戰袍":這身材比例是掃描出來的?

《劍星》體模申才恩再穿"戰袍":這身材比例是掃描出來的?

隊友祭天法力無邊
2026-05-22 17:11:46
《繁花》:見過世面的女人,選男人的時候是非常勢利的,見過世面的男人,選女人的時候是非常清醒的,一切沒你想的那么復雜,都是人性使然

《繁花》:見過世面的女人,選男人的時候是非常勢利的,見過世面的男人,選女人的時候是非常清醒的,一切沒你想的那么復雜,都是人性使然

心理觀察局
2026-05-24 06:46:09
都是女航天員,四人難處天差地別,黎家盈的困境旁人根本想象不到

都是女航天員,四人難處天差地別,黎家盈的困境旁人根本想象不到

夢在深巷aqa
2026-05-24 17:56:55
隨著比分定格2-0,富勒姆和紐卡雙雙無緣下賽季歐戰

隨著比分定格2-0,富勒姆和紐卡雙雙無緣下賽季歐戰

側身凌空斬
2026-05-25 01:00:52
劍南春|阿森納2-1水晶宮聯賽85分收官,熱蘇斯、馬杜埃凱建功

劍南春|阿森納2-1水晶宮聯賽85分收官,熱蘇斯、馬杜埃凱建功

懂球帝
2026-05-25 01:06:25
楊振寧去世5個月后,49歲翁帆現狀:剪了頭發染了色,仍獨居國內

楊振寧去世5個月后,49歲翁帆現狀:剪了頭發染了色,仍獨居國內

照見古今
2026-03-26 19:06:28
溫州一公園發現大蛇!有新消息

溫州一公園發現大蛇!有新消息

溫州草根
2026-05-24 17:26:39
心理學研究發現:凡是主動減少無效社交、經常獨處的人,不是性格孤僻,也不是不合群,而是深刻理解了兩個人際關系的能量守恒定律

心理學研究發現:凡是主動減少無效社交、經常獨處的人,不是性格孤僻,也不是不合群,而是深刻理解了兩個人際關系的能量守恒定律

心理觀察局
2026-05-21 07:14:10
舒馬赫妻子科琳娜照顧丈夫12年耗資20億終迎奇跡

舒馬赫妻子科琳娜照顧丈夫12年耗資20億終迎奇跡

暖心萌阿菇涼
2026-05-24 22:32:19
保安用手接下跳樓女孩,被砸癱瘓無錢救治,女孩家屬:你多管閑事

保安用手接下跳樓女孩,被砸癱瘓無錢救治,女孩家屬:你多管閑事

莫地方
2026-05-25 01:05:03
這位大姐徹底火了!因兩根吸管大鬧奶茶店,臉照曝光,警方已介入

這位大姐徹底火了!因兩根吸管大鬧奶茶店,臉照曝光,警方已介入

譚談社會
2026-05-24 16:56:22
包養10位情婦,睡覺翻牌生下11個私生子,75歲還在拼命生娃!

包養10位情婦,睡覺翻牌生下11個私生子,75歲還在拼命生娃!

來科點譜
2026-02-16 07:12:06
瓜迪奧拉經紀人確認:利雅得勝利曾接觸,但否認天價合同

瓜迪奧拉經紀人確認:利雅得勝利曾接觸,但否認天價合同

賽場速報局
2026-05-24 00:17:31
艾倫談世錦賽致命失誤:女兒第一句話就問怎么打丟黑球

艾倫談世錦賽致命失誤:女兒第一句話就問怎么打丟黑球

快樂加載中21
2026-05-25 00:16:43
2026-05-25 01:40:49
奇普樂芯片技術
奇普樂芯片技術
從硅基上實現Chiplet自動化異構集成方案的先行者!讓芯片的誕生,成為一件簡單的事!
120文章數 37關注度
往期回顧 全部

科技要聞

我戴著攝像頭上班,正在幫AI搶走我飯碗

頭條要聞

山西礦難遇難者家屬:父親年過半百 我們一直勸他別干了

頭條要聞

山西礦難遇難者家屬:父親年過半百 我們一直勸他別干了

體育要聞

唐斯發牌,大頭逆襲:騎士跌向殘忍夏季

娛樂要聞

王鶴棣掉粉超20萬!代言和作品遭抵制

財經要聞

什么情況下,本輪AI大行情會結束?

汽車要聞

國民家轎再上新 帝豪向上系列限時5.59萬起

態度原創

本地
旅游
藝術
游戲
公開課

本地新聞

用云錦的方式,打開江蘇南京

旅游要聞

漫步黃山腳下 邂逅茶香與綠野風光(組圖)

藝術要聞

砸12億!中國第一座“星穹大球”,上海人沸騰!

《霍格沃茨之遺》續作或將公布?知名爆料人暗示

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版