无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

月之暗面黃震昕:Kimi不做重交付,FDE難點不在于模型廠商

0
分享至


今年以來,當頭部的大模型廠商在圍繞模型迭代、產品力、融資、上市等集體搶占時間窗口時,商業化這個命題也被悄然塞進了他們的時間表里。

結合近期Kimi對外的披露,以及與月之暗面Kimi B端負責人黃震昕的交流,可以梳理出這家公司在商業化路徑上的一系列戰略選擇與自我定位。

在過去兩年間,Kimi首次大規模應用二階優化器Muon取代了已成為行業標準10年之久的Adam優化器,推出基于KDA注意力機制的Kimi Linear架構,以及推出注意力殘差方案,對計算效率得以大幅提升。

關于Harness,Kimi的判斷是:隨著基礎模型變強,對外部復雜Harness的要求會降低,類似去年Prompt工程熱度的下降。因此Kimi內部已開始實踐Loop Engineering(循環工程)。

黃震昕認為,隨著Token市場價格走高,用戶對于高性能的Token需求仍有支付意愿,同時,雖然由于芯片荒和算力成本上升導致成本在漲,但模型廠商也在通過技術優化,將Token的實際成本往下降低。

在定價策略上,Kimi的定位是做高性能模型,而非最便宜的模型。尤其是伴隨今年模型價格的集體上漲,背后核心原因仍然是全球算力供應跟不上Token需求增長。為此,Kimi對沖成本壓力的方式是通過技術優化,其KV-Cache命中率達到90%以上。

“評估模型價格不能只看輸入輸出定價,還要看KV-Cache命中率。只要命中,成本就會降很多,能給用戶節省成本。” 黃震昕告訴筆者。

作為Kimi B端負責人,黃震昕還著重提及了Kimi在To B業務的布局,包括三層服務體系:模型層提供K2.7 Code、K2.6等基礎模型;架構層提供API及Agent SDK;產品層推出企業版,包含Kimi Agent集群、Kimi Code、Kimi Work等工具。黃震昕指出,Kimi不會做太重的交付工作,“模型本身還有大量技術難題待攻克,Kimi能把模型做好已經非常不易。”

對于企業級應用所需的“最后一公里”服務,Kimi選擇通過FDE合作伙伴來完成端到端交付,而非自建重服務團隊。在行業解決方案層面,Kimi也在嘗試與亞馬遜云科技等合作構建金融、醫療、制造等垂直場景的方案,前者提供模型能力,而后者主要提供行業經驗與客戶資源。

以下是黃震昕在亞馬遜云科技中國峰會上的演講全文。

我是月之暗面(Moonshot AI)的黃震昕,負責公司的B端業務。很高興能在亞馬遜云科技中國峰會上和大家分享我們的思考。

我加入月之暗面時,就被一個愿景所吸引:致力于尋找將能源轉化為智能的最優解。為什么選擇這個命題?人類歷史上有三次真正的能源變遷。第一次是我們學會了利用陽光,第二次是我們發掘了煤炭,第三次,也就是現在,我們正在學習如何將能源高效地轉化為智能。前兩次轉化是線性的、有限的,而這一次轉化是可逆的、可擴展的、可存儲的。

關于實現這一最優解,我們的目標一直是做出全球領先的模型。因此,對于月之暗面來說,擴大模型規模(Scaling)是一個必選項。大家從新聞中也了解到,我們近期完成了規模不小的融資,但和海外同行相比,這筆資金并不算多。因此,我們致力于找到效率的最優解。

為此,我們選擇了三個技術方向,因為它們對應了智能體的三個核心能力維度:聰明程度、干活時長(Long Context)和協作能力(Agent Swarm)。

第一,聰明程度。數據并非無限,在相同的算力下,誰能學得更聰明,誰就更具優勢。

第二,干活時長。這決定了模型如何能處理更長時間的任務,同時不忘記最初的目標是什么。

第三,協作能力。單個智能體再強大,也有其局限性。如何讓多個智能體有效組隊,協作完成復雜的用戶任務,是另一個關鍵。

這三個維度結合起來,就是AI產品能力的整體體現。自2025年以來,我們在這三個方向上都取得了關鍵突破。大家可以看到,Kimi的每一項創新,都瞄準了最基礎的模型架構,而不僅僅是工程效率的優化。

以優化器為例,經典的Adam優化器誕生于11年前,我們將一種新的優化技術運用到了大部分訓練中,使實際數據的使用效率提升了27%,整體效率直接翻倍。在長文本(Long Context)方面,傳統的Attention架構誕生于八年前,我們推出了Kimi Linear Attention技術,將在下一代模型中應用。傳統架構下,模型擴大十倍,訓練和推理成本將擴大一百倍;而采用新技術后,僅需十倍的算力即可實現。此外,殘差連接技術誕生于十年前,我們推出了注意力殘差(Attention Residual)技術,使效率提升了25%。

馬斯克也曾專門為我們的技術點贊。可以說,模型的規模瓶頸正在被我們逐一解決,更大規模、更高質量的模型成為可能。一個行業常識是,KV緩存命中率很大程度上影響用戶的最終使用成本。我們通過研發Kimi的工程優化,持續提升效率,降低KV緩存失效率,從而降低了API的使用成本,讓更多用戶能夠用得起。

最近,我們也發布了Kimi K2.7,其代碼能力大幅提升。我們還特別推出了高速版本,輸出速度達到了180 token/秒。很多朋友反饋,用上之后就再也回不去了。這也是我們努力通過推理優化提升客戶體驗的例證。

Kimi是一家注重審美的公司,我們的品牌調性很明確,專注于生產力領域。我們把有限的能源和算力,集中在學術研究、軟件工程、復雜推理等領域。長期使用的用戶會發現,我們的核心場景始終圍繞著提升生產力。

大家可能對Kimi的印象更多停留在To C端,但其實我們在To B領域也并非簡單地售賣API,而是提供了一整套完整的生產力賦能體系。該體系具備三層能力:

模型層:Kimi持續做最強的基礎模型。目前底座已涵蓋K2.7 Code、K2.6和K2.5等模型,為企業級應用提供堅實的智能底座。

服務層:Kimi提供豐富的API,開發者可以借此進行深度集成,將Kimi的能力無縫嵌入到企業自身的工作流中,例如網頁搜索、PPT生成等。

工具/產品層:Kimi提供包括Kimi Agent集群、Kimi Code、Kimi Claw、Kimi Work等開箱即用的產品。該層級直接解決企業真實場景中的復雜問題,例如讓Agent自動處理報表、生成行業分析、管理項目文檔等。

在全球化業務拓展方面,Kimi正攜手亞馬遜云科技推進全球業務協同,借助其從基礎設施層到應用落地層面的全方位助力,實現全球化規模加速,為全球企業賦能生產力:

基礎設施和服務層面:Kimi運行在亞馬遜云科技遍布全球的數據中心和網絡基礎設施上,獲得了穩定可靠的算力支持,確保模型運行得又快又穩。Kimi多個模型現已登陸Amazon SageMaker,讓更多開發者可以進行模型的訓練與推理,大幅降低使用門檻。同時,Amazon Bedrock已經接入了Kimi K2.5等開源模型,未來Kimi正在積極推進接入更多最新模型,讓用戶無需自行管理基礎設施或單獨部署服務器就能使用Kimi模型。此外,Amazon Bedrock Guardrails的企業級安全能力也將自動適用于Kimi,提供有害內容過濾、提示詞攻擊防護以及企業合規保障。

業務合作層面:Kimi已登陸亞馬遜云科技Marketplace,直接觸達全球數百萬活躍企業客戶。全球客戶可以通過該數字軟件市場簡化采購流程,實現一鍵使用、按量付費與零門檻接入。同時,借助APN合作伙伴網絡,Kimi正在快速拓展企業客戶。

垂直行業層面:Kimi與亞馬遜云科技聯合打造行業解決方案,已覆蓋金融、醫療、制造等垂直行業場景。在合作中,Kimi提供核心大模型,亞馬遜云科技發揮其豐富的行業經驗與客戶資源,共同將Kimi的能力無縫嵌入到企業的真實業務流程中。

以上就是今天的分享。我們期待與亞馬遜云科技攜手,繼續探索將能源轉化為智能的最優解。

(作者 | 楊麗,編輯 | 楊林)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
荷蘭足球再次倒在世界杯點球大戰,摩洛哥挺進16強

荷蘭足球再次倒在世界杯點球大戰,摩洛哥挺進16強

澎湃新聞
2026-06-30 12:00:28
澤連斯基對普京的回應

澤連斯基對普京的回應

名人茍或
2026-06-30 17:27:45
血流成河!南非“清算日”臨近:暴徒持砍刀逐戶搜捕,數千人逃亡

血流成河!南非“清算日”臨近:暴徒持砍刀逐戶搜捕,數千人逃亡

世界熱點背后解讀
2026-06-29 20:10:23
國家出手僅3天,謝娜再迎噩耗,終究是遭到了跨界撈金的反噬

國家出手僅3天,謝娜再迎噩耗,終究是遭到了跨界撈金的反噬

丁丁鯉史紀
2026-06-30 17:25:45
讓北宋頭痛不已的“契丹”,是現在的哪個民族,說出來你或許不信

讓北宋頭痛不已的“契丹”,是現在的哪個民族,說出來你或許不信

芳芳歷史燴
2026-06-30 12:46:45
李鐵的罪,不光在于利益輸送,還在于他封死了中國男足世界杯之路

李鐵的罪,不光在于利益輸送,還在于他封死了中國男足世界杯之路

丁懰驚悚影視解說
2026-06-08 11:03:59
斯卡洛尼緊急調整計劃:阿根廷全隊放假,應對美國極端高溫

斯卡洛尼緊急調整計劃:阿根廷全隊放假,應對美國極端高溫

寶哥精彩賽事
2026-06-30 01:31:31
iPhone 18 Pro 發布時間來了,售價首次過萬!

iPhone 18 Pro 發布時間來了,售價首次過萬!

XCiOS俱樂部
2026-06-29 20:31:18
哈弗茨:我不知道該說什么,這是我第二屆世界杯,卻再次犯錯

哈弗茨:我不知道該說什么,這是我第二屆世界杯,卻再次犯錯

懂球帝
2026-06-30 14:22:11
摩洛哥,一個只有46萬km2的沙漠小國,怎么“裝了”3840萬人?

摩洛哥,一個只有46萬km2的沙漠小國,怎么“裝了”3840萬人?

清沐執筆
2026-06-18 17:26:43
三年1.764億!猛龍誠意滿滿以促成小卡回歸:美記稱交易籌碼增加

三年1.764億!猛龍誠意滿滿以促成小卡回歸:美記稱交易籌碼增加

顏小白的籃球夢
2026-06-30 14:24:28
森保一:作為主教練我要向所有日本球迷道歉,是我能力不足

森保一:作為主教練我要向所有日本球迷道歉,是我能力不足

懂球帝
2026-06-30 03:32:08
韓紅基金會回應“韓紅宣布退出公益行業”:網傳的朋友圈截圖是不實信息,目前韓紅正在參與百人援蒙的義診活動

韓紅基金會回應“韓紅宣布退出公益行業”:網傳的朋友圈截圖是不實信息,目前韓紅正在參與百人援蒙的義診活動

魯中晨報
2026-06-30 15:38:37
新一屆港姐亮相紅毯,這審美又回來了

新一屆港姐亮相紅毯,這審美又回來了

娛你同歡
2026-06-28 20:48:27
當年我養豬供侄子上大學,他當上官再沒回老家,直到我被村霸欺負

當年我養豬供侄子上大學,他當上官再沒回老家,直到我被村霸欺負

五元講堂
2025-08-21 15:12:14
大放厥詞,卻慘遭三連敗!這次,鄭欽文終于為自己的狂妄付出代價

大放厥詞,卻慘遭三連敗!這次,鄭欽文終于為自己的狂妄付出代價

一窺究竟
2026-06-30 11:44:39
油價調整通知!預期跌幅,汽柴油價格將會繼續大跌0.61元/升-0.73元/升!

油價調整通知!預期跌幅,汽柴油價格將會繼續大跌0.61元/升-0.73元/升!

肥東論壇
2026-06-29 22:55:39
世界杯最大冷門!3大罪人葬送德意志榮光,病態傳控毀掉德國足球

世界杯最大冷門!3大罪人葬送德意志榮光,病態傳控毀掉德國足球

阿友田侃故事
2026-06-30 08:21:53
日元擊穿四十年底線,今年數萬億日元干預成果盡數回吐,東京深陷政策死結

日元擊穿四十年底線,今年數萬億日元干預成果盡數回吐,東京深陷政策死結

華爾街見聞官方
2026-06-30 01:06:02
董路官宣與孫臣曦一家斷絕往來,培養9年反目成仇,陳年恩怨曝光

董路官宣與孫臣曦一家斷絕往來,培養9年反目成仇,陳年恩怨曝光

林輕吟
2026-06-18 19:31:32
2026-06-30 17:56:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
135876文章數 862355關注度
往期回顧 全部

科技要聞

iPhone18 Pro遭泄密!印度代工商惹禍

頭條要聞

無人機攻防正酣 烏克蘭卻在此時給俄羅斯出了個難題

頭條要聞

無人機攻防正酣 烏克蘭卻在此時給俄羅斯出了個難題

體育要聞

大熱倒灶壓力給到法國 王楚揭法國隊隱患

娛樂要聞

韓紅稱要退出公益,多位名人挽留

財經要聞

韓國萬億"芯"基建:存儲能否成AI時代油田

汽車要聞

誰懂啊家人們!爹味和班味一點都沒,這臺底盤最硬國產大獵裝太上頭!

態度原創

手機
親子
家居
藝術
公開課

手機要聞

中興暢行70 Plus手機發售:展銳T9100 + 8G + 256G售2099元

親子要聞

太好了!蘇西的餐廳又增加一位成員!

家居要聞

傳奇筑 日常詩

藝術要聞

喬治·莫蘭迪簡潔的靜物畫,色彩看著太舒服了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版