我的創業故事:《
大家好,我是微笑哥。
大家可能聽說過很多次,DeepSeek V4 就要愛了,這一次可能是最靠譜的時間點了。
就在上周,多位知情人士透露,DeepSeek創始人梁文鋒在內部已經明確了節奏:下一代旗艦大模型V4,計劃于4月下旬正式與公眾見面。
![]()
雖然官方還沒按下那個最終的發布按鈕,但網頁端悄悄上線的“快速模式”和“專家模式”,以及頻繁的灰度測試,都在預示我們它很快要來了。
為什么跳票這么久?可能很大的一個原因是,DeepSeek 又要搞一次國內AI大模型誰也沒有做過的事情。
那就是完全使用國產AI芯片。
有關注中國AI發展的人都知道,過去我們一直被卡脖子的不僅是芯片制程,更是英偉達CUDA生態的軟件護城河。
但這一次,DeepSeek V4干了一件牛逼的事情:完全運行在華為昇騰950PR芯片之上,底層代碼從CUDA全面轉向華為自研的CANN框架。
這意味著什么?在極端的外部封鎖下,“國產模型+國產芯片”這條獨立技術路線,不僅走通了,還跑出了加速度。
聽說阿里、字節、騰訊等巨頭已經聞風而動,提前預訂了數十萬片昇騰芯片,導致芯片價格直接飆升了20% 。
現在感覺 DeepSeek 的使命,就是在 AI 領域替國人探索哪些無人區,等 DeepSeek 帶頭搞出來后,國產其它模型再跟進普及。
就比如 DeepSeek V3 出來后,讓國產的其它大模型,迅速的拉平了和國外大模型差距。
甚至 DeepSeek 公司每次發表新論文的時候,國內外的各大模型大廠,都會迅速跟進研究、融入到自己的模型中。
綜合目前多方信源,DeepSeek V4預計將采用萬億參數(1T)的MoE(混合專家)架構,更夸張的是,它的上下文窗口直接拉到了100萬Tokens。
但其實我覺得 DeepSeek V4 雖然會比 V3 更好,但一定沒有大家像之前期待的那么炸裂。
本質上來講,DeepSeek 在大模型公司中,仍然屬于比較小的公司,不管人力還是各種資源畢竟是有限的。
我們要尊重是事物發展規律。平心而論,DeepSeek已經做得很優秀了。
它用最少的錢,跑出了最強的模型;它以一己之力,把全球AI推理成本打了下來。它已經完成了中國AI史上最重的一幕:證明了我們不僅能做,還能做得比硅谷更好。
但隨之而來的,是沉重得近乎窒息的關注與期望。
當一個公司被貼上“全村的希望”、“國家AI旗手”的標簽時,每一次宕機都會被無限放大,每一個延期都會被過度解讀。
這種壓力,足以壓垮任何一家創業公司。
我們應該用正常的眼光來看待更多“平凡、也會犯錯的 DeepSeek",哪怕崩潰了,V4 不那么驚艷,也并不影響 DeepSeek 的歷史地位,已經它仍然是一家巨牛逼的公司。
![]()
PS:
去年開始,我一直在死磕“AI+跨境”。很多人問我,普通人現在入場跨境電商還有沒有機會?我的答案是:有,而且是降維打擊的機會。
我們實操了6家店,3個月內單店營收穩步破萬,更重要的是,新學員的出單率拿到了90%以上。
![]()
AI跨境目前以每年50%-80%的速度增長,在這個大幅度增長的背景下會誕生無數個機遇,我們普通人只需要抓住一個即可。
建議你先了解一下,試錯的成本并不高錯過的代價確很大,加下面微信自動發《AI跨境搞錢手冊》,看完對這個項目會有一個系統的了解。
加我微信,自動發資料
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.