无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

日本大模型要超過中美?“河豚AI”干翻GPT-5.5比肩Fable5,到底隱藏著什么秘密?

0
分享至


2026 年 6 月 22 日,日本 AI 獨角獸 Sakana AI 扔下了一枚炸彈:新模型“河豚(Fugu Ultra)”正式發布。


開場就是一張讓人倒吸涼氣的成績單——在目前難度最高、水分最少的真實代碼修復榜單 SWE-Bench Pro 上,Fugu Ultra 拿下 73.7 分。


作為對比,OpenAI 的 GPT-5.5 只有 58.6,Anthropic 的 Claude Opus 4.8 是 69.2。Sakana 甚至公開宣稱:Fugu 已經和剛被美國出口管制“一夜下架”的頂級模型 Claude Fable 5 旗鼓相當。


日本 AI 踩在 GPT-5.5 的肩膀上,煉出了新一代的神級大模型?

真正自以為看懂的人,立即從震驚變成群嘲:這哪是大模型,它分明是個“包工頭”!核心只是一個 7B 參數小模型的“指揮家”,參數不大,自己不干活,把任務拆給池子里的 GPT-5.5、Opus、Gemini,最后匯總交卷。


“高級 API 路由器”“套殼的”“大廠一斷供它明天就死”……罵聲一片。

但深入調研分析后重新審視了這家公司極其反常的底層邏輯。

結論:可能大家都看錯了。

Sakana AI 與 OpenAI 的差異,根本不是技術路線,而是兩種截然不同的“第一性原理”與“世界觀”的碰撞。

這條估值高達 26.5 億美元的日本“河豚”身上,藏著三個比跑分更性感、也更殘酷的真相。今天,我們連同它底褲里的秘密,一個個拆給你看。

真相一:你以為它是套殼?這是“進化論”的降維打擊


Fugu 不親自解題,只干 3 件事,全部用自然語言完成,不用人類寫代碼配置:

  1. 拆任務

    :拿到用戶問題,自動拆成好幾步細分小活;

  2. 選人派活

    :判斷每一步交給哪個 AI 最合適,比如規劃交給 Gemini、寫代碼交給 GPT5、校對交給 Claude;

  3. 定信息權限

    :規定每個 AI 能看到前面哪些步驟的結果(有的只看原始問題,有的能看所有人的答案)。

舉個例子:用戶要寫復雜算法題Conductor 自動安排:

  • 第一步:Gemini 做解題思路規劃(看不到別的結果)

  • 第二步:GPT5 按思路寫代碼(只看 Gemini 的規劃)

  • 第三步:Claude 檢查代碼 bug(看前面兩個人全部輸出)

簡單選擇題它就偷懶:直接派 1 個 AI 一步出答案,不浪費算力。

Fugu 只是個“做編排的包工頭”?

Anthropic、OpenAI 篤信“Scaling Law(規模法則)”,這是一種“神創論”暴力美學:燒幾百億美金、建幾個核電站,試圖煉出一個全知全能的超級大腦。

而 Sakana(日語“河豚”)的哲學,是“演化論”與群體智慧。大自然從不靠算力設計完美的生物,而是靠“組合與變異”讓適應力最強的基因活下來。

Fugu并不是簡單編排API組合 , 它有深入骨髓的硬件級優化:

Sakana 和全球算力霸主英偉達聯合發布了 TwELL 稀疏數據架構,直接改寫了 CUDA 底層內核的計算邏輯,硬生生把大模型的真實推理速度拔高了 20%。

零成本造血的“AI 科學家”: 他們做出了能自己寫代碼、自己發《Nature》論文的 The AI Scientist 系統,把單篇頂級論文的產出成本壓到了 15 美元。

加上能修改自己底層代碼的 DGM(達爾文-哥德爾機),Sakana 擁有了一座成本趨零、7x24 小時自我迭代的超級研發中心。

用最底層的 CUDA 榨干硬件性能,用演化算法“白嫖”并融合全球開源小模型,再用強化學習做 Fugu 的頂層調度。這不叫套殼,這叫生態系統對單體怪獸的“全棧工程壓制”。

真相二:跑分“吊打”是人造神話,這其實是一臺昂貴的“逆熵引擎”

來自知名開發者 Julian Goldie 對 Sakana AI 的三個模型 和 Fusion(一個基于 OpenRouter 的多模型路由器/編排系統) 的真實視覺構建測試對比。

測試對象

  • Fugu Ultra :Sakana 的頂級旗艦模型

  • Fugu Mini :Sakana 的輕量快速版

  • Fusion :第三方路由器方案(把提示同時發給 3~5 個不同大模型 并行運行 → 一個“裁判模型”(Judge)融合輸出)

最終排名:
1. Fugu Ultra(視覺質量王者)
2. Fusion(穩定第二,性價比高)
3. Fugu Mini(速度快,但質量和 Bug 較多)

但是一個常規的復雜任務,Fugu 能拖拖拉拉跑上 30 分鐘。輸入 $5/M,輸出高達 $30/M。由于多層循環編排,實際花銷可能是單調大模型的好幾倍。代價如此高昂,企業為什么還要用它?

隨著大模型算力越來越便宜,制造“幻覺”和垃圾信息的成本趨近于零(算力熵增)。

Fugu 系統里的 7B 指揮家,為了挑戰模型的不確定性,通過打回重寫、交叉驗證,不斷將大模型輸出中的“混亂”剔除,強行提取出“絕對正確的代碼”。

未來Token 價格會越來越便宜,而“在混亂信息中建立確定性秩序”的能力,才是宇宙中最昂貴的能力。

Fugu 賣的根本不是模型,而是一臺能抵抗幻覺的“逆熵引擎”。

真相三:“主權AI”崛起,日本財閥的真金白銀投入


為什么 Fugu 偏偏選在 6 月 22 日發布?

因為 10 天前的 6 月 12 日,美國商務部一紙出口管制,逼迫 Anthropic 把頂級模型對全球非美客戶一鍵下架。無數海外企業的業務一夜停擺。

這就是企業級客戶最深的恐懼:“單一供應商鎖定(Vendor Lock-in)”。

日本最大的券商大和證券、金融巨頭三井住友銀行(SMBC),甚至涉足軍工的三菱重工,早就用真金白銀買單,把 Sakana 的系統深度嵌入了資產管理和情報處理的血脈里。

一個帶著美國西海岸價值觀的單體大模型,永遠無法映射日本金融業的保守規則,也無法對齊嚴苛的數據隱私法。

因此,金融業永遠不會依賴于一家模型提供商,因此誰掌握了這個網絡的“路由編排”,誰就掌握了主權。

為了收割這波“主權紅利”,Sakana 打出了一套完美的 B端雙鉗攻勢:

底層用 Fugu 的編排層提供了魯棒性,不會因為個別模型斷供而停止服務。

應用層則直接推出了核心產品 Marlin(自治研究代理) ,它 是一款針對企業決策和深度研究設計的自治研究代理(Autonomous Research Agent)


Marlin 專注于長時間的深度推理與長周期任務,無需人工干預即可自主進行長達 8 小時以上的假設驗證、網頁檢索和信息整合。

直接生成 100 頁帶嚴格引用的投行級研報。它對企業的 Team 版定價,直接賣到 $2495/月(近2萬人民幣/月)。

當普通套殼應用還在 C 端為 20 美金的月費卷生卷死時,Sakana 已經用輕資產撬動了極高客單價的政企訂閱。這才是風投眼里的印鈔機。

終局推演:硅基知識發現的奇點,與懸在頭頂的開源之劍

算清了這筆賬,你就會明白為什么 Sakana 能在不到兩年內,估值狂飆到 26.5 億美元。


看看它股東名單:

NVIDIA 給算力底座,Google 給全球生態,日本三大銀行給巨額訂單,甚至連美國情報局背景的 IQT 基金都入局為其安全背書。

加上精準榨取了日本政府的 GENIAC 補貼計劃(免費白嫖國家級超算集群),這哪里是一家創業公司?這分明是跨國資本巨頭在日本布下的“主權 AI 聯合艦隊”。

但懸在它頭頂的達摩克利斯之劍,真的不存在嗎?

有的。但真正的死穴,絕不是 OpenAI 封它的 API 接口,而是“開源生態的反噬”。

Sakana 的高資本效率,高度依賴于 Llama、Mistral 等開源模型權重的無償開放。一旦美國以國家安全為由收緊開源協議,失去免費“原材料”的 Sakana,其“演化融合”的魔法就會瞬間失效,被拉回燒錢煉大模型的無底洞。

最后,送給所有 AI 創業者的終極啟示:

  1. 小團隊別碰底座大模型,ALL IN 編排: 連估值 26 億美金的獨角獸都不去死磕底層參數了。把大模型當成極其廉價的水電煤,去建你自己的“Agent OS”(智能體操作系統),在單一前沿模型與多智能體調度之間自由切換,這才是未來的核心資產。

  2. 尋找大廠進不去的行業盲區: 去解決真實行業里因為斷供、合規、數據隱私而產生的具體痛點。大廠模型再聰明,也跨不過金融和軍工的政企安檢門。

跑分超越 GPT 只是營銷手段。商業的本質,永遠是回答三個問題:

  1. 你的系統是不是一臺合格的逆熵引擎?

  2. 你的命根子是不是攥在開源巨頭手里?

  3. 以及,誰愿意為你的不可替代性,每月支付 2495 美金?

附:本文核心數據與論據核實來源(參考引用表)

為了保證一級市場研判的嚴謹性,本文所有核心數據、論文背景及商業案例均來源于以下公開或權威盡調渠道,非營銷杜撰:

1. 核心技術報告與頂會論文背書: Fugu 系統的核心架構方法論基于其被國際表征學習大會(ICLR 2026)接收的兩篇論文,分別為負責角色分配的 TRINITY 模型和負責強化學習協同的 Conductor 架構。相關論文與數據集詳見技術報告 arXiv:2606.21228v1 及 arXiv:2512.04388 / arXiv:2512.04695。

2. 跑分數據與成本定價源:

SWE-Bench Pro 的 73.7 分、超越 Claude Opus 4.8 和 GPT-5.5 的對比數據,以及輸入 $5/M、輸出 $30/M 的定價,均截取自 Sakana AI 官方于 2026 年 6 月 22 日發布的 Fugu 產品發布基準測試表及 Pricing 官網頁面。

3. 底層執行技術與自動化科研突破:

與 NVIDIA 聯合開發的 TwELL (Tile-wise ELLPACK) 稀疏架構帶來 20% 加速的論文發表于 ICML 2026。(出處:Sakana AI & NVIDIA 聯合發布報告,Sparser, Faster, Lighter Transformer Language Models)

將單篇頂會論文生成成本壓至 15 美元的自動化系統 The AI Scientist 發表在頂級學術期刊《Nature》主刊上。(出處:The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery)

代碼自演化系統 DGM (Darwin G?del Machine) 技術詳情亦來自官方發布。

4. B端商業化訂單與定價實錘:

政企綁定案例: Sakana AI 深度綁定大和證券(Daiwa Securities Group)用于資產管理咨詢平臺,綁定三井住友銀行(SMBC)自動生成提案,以及深度參與日本防務生態(如三菱重工等)的信息均來自其官方企業級案例通報與日本媒體的公開報道。

Marlin 產品定價: Sakana Marlin(深度研究代理)針對企業級客戶的高昂 Team 版定價($2495/月)及其邊際成本收斂邏輯,源于其 SaaS 訂閱頁面及第三方數據調研機構(如 Tech Jacks Solutions)的商業分析。

5. 融資、估值與股東結構:

公司在 2025 年 11 月完成 1.35 億美元 B 輪融資、投后估值達到 26.5 億美元的數據由官方披露,并經 Crunchbase 及 GetLatka 等創投數據平臺確認。

包括 NVIDIA、Google(Alphabet)、花旗集團(Citi)、三菱 UFJ、KDDI,以及 In-Q-Tel (IQT) 等極其豪華的地緣與產業資本入局,均可追溯至相應投融資新聞公報(如 Citi Makes Strategic Investment in Sakana AI)。

6. 政府補貼與宏觀紅利: 其利用日本政府 GENIAC 計劃(725 億日元規模)免費獲取國家級超級計算 GPU 集群的事實,由日本經濟產業省(METI)與 NEDO 官方公示確認。

7. 開發者實測反饋與開源局限:

部分開源代碼框架可見于官方 GitHub:?https://github.com/SakanaAI/fugu?(核心權重未開源)。

關于 Fugu 在復雜任務上高達 30 分鐘的延遲以及成本過高的批評,匯總自知名 AI 學者 Ethan Mollick、開發者 Julian Goldie 等在 X (Twitter) 及 Hacker News 上的真實測試反饋。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
保時捷女銷冠再獲2026年上半年銷冠,本人回應:雖然累,但從未經歷倦怠期,希望沖刺全球銷量排名

保時捷女銷冠再獲2026年上半年銷冠,本人回應:雖然累,但從未經歷倦怠期,希望沖刺全球銷量排名

極目新聞
2026-06-30 15:19:55
221名女囚漂洋過海,下船時全員懷孕,這批女囚竟生出了一個國家

221名女囚漂洋過海,下船時全員懷孕,這批女囚竟生出了一個國家

抽象派大師
2026-07-01 01:39:46
搬去印度的代價,iPhone18全泄露,天價罰單后,蘋果再遭重錘

搬去印度的代價,iPhone18全泄露,天價罰單后,蘋果再遭重錘

王新喜
2026-06-30 18:30:27
比賽還剩3天,阿根廷先迎來一個超級大喜訊,取勝佛得角徹底穩了

比賽還剩3天,阿根廷先迎來一個超級大喜訊,取勝佛得角徹底穩了

零度眼看球
2026-07-01 09:08:01
張檬曬一家三口,1歲兒子像爸爸漂亮的像女孩,小五甘當全職奶爸

張檬曬一家三口,1歲兒子像爸爸漂亮的像女孩,小五甘當全職奶爸

八怪娛
2026-07-01 09:35:20
臺灣問題即將突破臨界點,兩大跡象表明,大陸或要準備出手了!

臺灣問題即將突破臨界點,兩大跡象表明,大陸或要準備出手了!

嘆為觀止易
2026-07-01 13:29:04
33塊勞力士+22塊歐米茄!25歲哈蘭德憑什么比41歲C羅更懂足球?

33塊勞力士+22塊歐米茄!25歲哈蘭德憑什么比41歲C羅更懂足球?

念洲
2026-06-30 20:35:06
德天空:因德國隊世界杯出局,布朗將在德國接受拜仁的體檢

德天空:因德國隊世界杯出局,布朗將在德國接受拜仁的體檢

懂球帝
2026-07-01 07:33:53
67歲王朔晚年現狀:獨居北京、5病纏身,每天都要吃一根哈根達斯

67歲王朔晚年現狀:獨居北京、5病纏身,每天都要吃一根哈根達斯

音樂時光的娛樂
2026-07-01 09:05:19
魏敏芝現狀:在美國當導演,全家定居夏威夷,如今40歲胖到不敢認

魏敏芝現狀:在美國當導演,全家定居夏威夷,如今40歲胖到不敢認

白面書誏
2026-06-29 21:16:24
良性腫瘤變肝癌,山東一男子CT報告時隔8年出現反轉,醫院回應:家屬取報告時間太早,次日才確定結論,確有未及時通知的問題,愿溝通賠償

良性腫瘤變肝癌,山東一男子CT報告時隔8年出現反轉,醫院回應:家屬取報告時間太早,次日才確定結論,確有未及時通知的問題,愿溝通賠償

大風新聞
2026-07-01 10:21:03
沒有證據?那就發明證據!從中國第一“女福爾摩斯”到冤案制造者

沒有證據?那就發明證據!從中國第一“女福爾摩斯”到冤案制造者

許三歲
2026-06-24 11:06:59
歐洲瘋搶中國空調連外掛都用上了!奧地利程序員寫3個AI全天監控,驅車200公里截胡全國“最后一臺”

歐洲瘋搶中國空調連外掛都用上了!奧地利程序員寫3個AI全天監控,驅車200公里截胡全國“最后一臺”

每日經濟新聞
2026-07-01 01:45:22
美國大滿貫:林詩棟3-0橫掃日本名將,下一輪大戰世界第11

美國大滿貫:林詩棟3-0橫掃日本名將,下一輪大戰世界第11

釘釘陌上花開
2026-07-01 11:29:59
隨著哈蘭德一劍封喉,挪威2-1險勝非洲勁旅,晉級2026世界杯16強

隨著哈蘭德一劍封喉,挪威2-1險勝非洲勁旅,晉級2026世界杯16強

側身凌空斬
2026-07-01 02:58:05
3場5球追平挪威隊史紀錄!哈蘭德絕殺后坦言:戰勝巴西隊機會非常小

3場5球追平挪威隊史紀錄!哈蘭德絕殺后坦言:戰勝巴西隊機會非常小

紅星新聞
2026-07-01 08:20:15
合作30年,巴斯夫宣布退出

合作30年,巴斯夫宣布退出

中國石油石化
2026-07-01 01:44:29
馮德萊恩極端反華,如果歐盟非挨頓揍才知道疼,中國將成全他們

馮德萊恩極端反華,如果歐盟非挨頓揍才知道疼,中國將成全他們

娛樂小可愛蛙
2026-07-01 13:47:51
尿液有這2個表現,盡快就醫,千萬別把自己拖成尿毒癥!

尿液有這2個表現,盡快就醫,千萬別把自己拖成尿毒癥!

路醫生健康科普
2026-07-01 12:05:03
KTV里那些女孩,最后都嫁誰了?老經理一番話,聽的讓人心酸

KTV里那些女孩,最后都嫁誰了?老經理一番話,聽的讓人心酸

千秋文化
2026-06-28 20:09:25
2026-07-01 15:51:00
PM熊叔
PM熊叔
聊AI科技+商業,一人公司的產品經理
6文章數 0關注度
往期回顧 全部

科技要聞

AI寫了90%代碼,大廠程序員的煎熬時刻

頭條要聞

嘉峪關一景區NPC被游客掰斷手臂:互程中對方突然發力

頭條要聞

嘉峪關一景區NPC被游客掰斷手臂:互程中對方突然發力

體育要聞

賣球衣救子的門將,把德國撲出了世界杯

娛樂要聞

羅晉大孤山素顏照,禿頂白發引熱議

財經要聞

新氧貸款:宣傳年化15%,實際頂格24%

汽車要聞

交付持續攀升再破紀錄 零跑6月全球交付93376臺

態度原創

數碼
旅游
藝術
公開課
軍事航空

數碼要聞

千元家用打印機:打印質量好,兼顧作業打印,首選惠普連供打印機

旅游要聞

120座臨江房車別墅投用 湖南湘潭完善旅發大會配套設施

藝術要聞

這5件2026屆畢業油畫作品,被中國美術學院美術館收藏

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美伊代表前往多哈 談判方式出現"重大倒退"

無障礙瀏覽 進入關懷版