網易首頁 > 網易號 > 正文 申請入駐

“90后”的他半月內兩上《新聞聯播》,現在又交新作業

0
分享至

4月10日下午,中共中央政治局常委、國務院總理李強主持召開經濟形勢專家和企業家座談會,“90后”楊植麟作為企業家代表發言。

楊植麟是在場唯一一位來自獨立大模型企業的代表,這也是他半個月內第二次出鏡《新聞聯播》。

3月28日,參加2026中關村論壇年會的楊植麟,出鏡《新聞聯播》,分享感悟。


4月20日,楊植麟帶領的Kimi團隊再交出新作業——Kimi發布最新一代模型Kimi K2.6,上線即開源。

這距離Kimi發布K2.5模型剛過去兩個多月時間,在多個大模型基準測試中,K2.6模型均持平或優于GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro等閉源模型,并在全球開源模型中排名第一。

2025年最后一天,楊植麟曾發布一封內部信,其中寫道:接下來公司最重要的目標是超越Anthropic等前沿公司,成為世界領先的AGI公司。

隨著Kimi頻繁發布并開源新的模型,并陸續公布其在MuonClip、Kimi Linear 和 Attention Residuals 等大模型底層架構方面的技術進展和思考,外界愈發清晰地看到:這家中國大模型創業公司,正以底層技術重構和開源生態,加速逼近AGI的終極目標。

國產開源大模型,正成為全球AI新標準

相較于上一代模型K2.5,Kimi最新上線的K2.6在長程任務執行、Agent集群等能力上表現出大幅躍遷。

K2.6被看作是Kimi“迄今最強的代碼模型”,在測試中可以不間斷編碼13小時,編寫或修改超過4000行代碼,在Kimi內部評測中,K2.6 的成績比 K2.5 提升了約 20%;Agent集群能力上,K2.6支持 300 個子 Agent 并行完成 4000 個協作步驟,不僅數量上較K2.5翻了幾番,任務完成度和交付質量也有顯著提升。

這意味著,Kimi僅用了不到三個月,即在通用Agent、代碼、視覺理解等模型關鍵能力上得到全面提升,并迅速登上全球開源模型第一位的寶座。

楊植麟曾在2026 中關村論壇的演講中談道,Kimi做的很多技術創新可以被任何人獲取,然后大家能夠去形成一個生態系統,一起去推動 AI 領域的發展,“開源讓每一個企業、每一個研究者、每一個終端的用戶能非常低門檻地獲取智能,這是一個非常重要的事情。”

從全球范圍來看,開源路線正在讓以Kimi為代表的國產大模型加速普及應用,并獲得更大的全球影響力。美國麻省理工學院與開源平臺“抱抱臉”去年11月份發布的一份聯合報告顯示,過去一年,中國研發的開源模型全球下載量占比達到17.1%,反超美國的15.8%,位居全球第一。

中國的AI開源生態,正在重塑全球創新體系。如楊植麟所說,以Kimi 為代表的很多開源模型,正在全世界所有的模型廠商的評測中被作為一個標準,也成為很多研究機構的研究樣本。

新技術直擊AI底層架構,引發硅谷熱議

楊植麟將Kimi的進化邏輯歸納為三個維度的共振:Token 效率、長上下文以及智能體集群(Agent Swarms)。基于這一邏輯,在大模型底層架構方面,Kimi團隊通過技術重構的方式,探索提升模型訓練效率和能力的可能性。

3月18日,在被稱為“AI春晚”的英偉達GTC大會上,楊植麟受邀演講,也是主會分享嘉賓中僅有的一位專注基礎大模型的創業公司代表。

在這場全球頂尖AI創業者、學者云集的“盛會”,楊植麟首次系統性地披露了Kimi K2.5模型背后的技術路線圖,并將焦點對準了大模型中被沿用多年的底層架構。他認為,要推動大模型智能上限的持續突破,必須對優化器、注意力機制及殘差連接等底層基石進行重構。而Kimi正是通過對上述底層架構進行重構,逐步突破模型Scaling的瓶頸,讓模型更短時間內變得更“聰明”和更好用。

就在楊植麟演講的兩天前,Kimi發布了一篇名為《Attention Residuals》(注意力殘差)的技術報告,火速受到硅谷AI專家和企業家的關注。

馬斯克在社交媒體上轉發了Kimi這一報告的推文并稱:“Kimi這項工作令人印象深刻”;OpenAI前研究副總裁、o1系列推理模型主要發明者Jerry Tworek表示,Kimi的這一技術突破標志著“深度學習2.0”的到來,他認為這種創新將在未來的AI發展中起到至關重要的作用。

前OpenAI聯合創始人Andrej Karpathy認為,Kimi團隊的創新不僅挑戰了現有的深度學習架構,還推動了注意力機制在大規模模型中的進一步應用。

從追趕到并跑,國產大模型重構AI生態

過去兩年國產大模型技術進展突飛猛進:從追趕GPT到部分性能在全球大模型榜單登頂;從大語言模型能力攀升到多模態模型逐漸成熟并實現商業化落地。

得益于技術上的開創性進展,在全球大模型競賽中,我國已經涌現出一批能與世界頂尖大模型媲美的自研大模型,成為全球AI創新中不容忽視的新變量。

同樣值得關注的是,AI大模型能力的躍升正在反哺我國整體的AI生態,帶動國產芯片、算力等協同共進,推動國產AI走向自主可控。

日前,Kimi發布最新論文《Prefill-as-a-Service》,該研究解決了大模型推理中預填充和解碼兩個階段在不同芯片上分別運行的問題,有望推動異構計算規模化落地;此外,該報告顯示,來自谷歌、華為及阿里平頭哥等更多類型的芯片,可切實用于大語言模型推理,不僅能延長舊款芯片生命周期,同時還能降低大模型整體運行成本,為國產芯片參與大模型推理打開了大門。

長遠來看,當大模型的能力不斷突破上限,人工智能賦能千行百業便成為當下的重中之重。“十五五”規劃建議明確提出,全面實施“人工智能+”行動,以人工智能引領科研范式變革,搶占人工智能產業應用制高點。

不可否認的是,在將AI能力轉化為生產力的下一階段,以Kimi為代表的大模型創業公司還將繼續提供關鍵技術支撐,帶來顛覆性的創新成果,讓人工智能不斷突破邊界,在更多場景實現規模化應用。

文/張曉慧 圖/企業供圖

校對 柳寶慶

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

貝殼財經 incentive-icons
貝殼財經
新京報旗下財經品牌
63612文章數 13994關注度
往期回顧 全部

專題推薦

洞天福地 花海畢節 山水饋贈里的“詩與遠方

無障礙瀏覽 進入關懷版