“我們當時應該把證據一起拿出來的。”亞歷克斯·惠登(Alex Whedon)回憶起上個月那場風波,語氣里帶著一絲事后才悟到的遺憾。他是AI創業公司Subquadratic的聯合創始人兼首席技術官,這家總部位于邁阿密的公司剛從“隱身模式”走出來就掀翻了輿論場——因為他們說,自己解決了一個困擾大型語言模型近十年的數學瓶頸。
你沒聽錯,就是那個讓所有大模型一邊燒錢、一邊喘著粗氣運算的核心問題。用惠登的話說,要是當初直接把獨立測試結果扔出來,就沒那么多人排隊罵他“AI界的Theranos”了。不過現在,他們終于把“收據”擺上了臺面。
![]()
先說清楚Subquadratic到底說自己干了什么。簡單講,他們搞出了一個叫SubQ的新型大語言模型,號稱比市面上任何模型都更快、更省電、更省錢。更狠的是,SubQ能一次性處理的文本量是大多數其他模型的12倍往上——這意味著你可以無腦扔給它幾百份文檔或者一整個代碼倉庫,讓它慢慢消化。而在編程這類關鍵任務上,它的表現居然能和Google DeepMind、OpenAI、Anthropic這些巨頭推出的最強模型打得有來有回。
聽著是不是像天方夜譚?當時整個AI圈子就是這么想的。人工智能工程師丹·麥卡蒂爾(Dan McAteer)在X平臺上發的帖子精準概括了大眾心態:“SubQ要么是自Transformer以來最大的突破……要么就是AI界的Theranos。”
這頂帽子扣得可不輕。眾所周知,Theranos是那個曾經靠吹噓“一滴血檢測百病”吸金無數的硅谷騙局。把一家初創公司跟它類比,翻譯成人話就是:“你最好不是在講故事。”
最初的質疑并非出于惡意。Subquadratic第一次亮相時,手頭確實只有幾項自己公布的測試分數,SubQ也沒有大規模開放給外界試用。你想想,一個突然從地下冒出來的團隊,說自己的技術把整個行業苦戰了十年都沒攻克的瓶頸給捅穿了,卻只掏出幾頁PPT——這在AI圈子里,挨罵是標準待遇。
但現在距離那場風暴過去了一個月,事情開始變得有意思了。
Subquadratic把Appen這家第三方獨立評估公司請來給SubQ做測試。這就像你自稱百米跑過了博爾特,然后請國際田聯派人現場計時——是騾子是馬,拉出來溜溜。Appen專門干的就是給各家模型打分評估的活兒,在業內有一定公信力。測試結果出來后,Appen生成式AI研究總監珍妮·辛南-辛格(Jeanine Sinanan-Singh)的反應挺說明問題。“對我來說這真的很令人興奮,它驗證了他們的架構,”她說,“我當時心想,‘哇,這可能改變游戲規則’,因為模型在速度和低效方面確實很掙扎。”
但她也補了一句大實話:如果你自己說自己的成績很炸裂,可信度就會打折。這正是第三方驗證的價值所在——讓數據替你說話,而不是讓你的嘴替數據吹牛。
那么,這個讓Appen都覺得興奮的“游戲規則改變者”到底改了什么?要理解這一點,你得先搞懂大模型一直被什么卡著脖子。這個話題說來也不復雜,我盡量用生活化的語言講給你聽。
現階段幾乎所有的大型語言模型,包括ChatGPT背后那類產品,都建立在一個叫Transformer的架構上。你可以把Transformer理解成模型世界里的“流水線設計圖紙”,它負責定義信息怎么在模型內部流動、怎么被加工。這張圖紙有個天生的毛病:隨著你要求模型一次性處理的文本變長,它需要的計算量不是線性增長,而是以平方級的速度往上躥。比如處理一段100個詞的文字需要100份算力的話,處理200個詞可能就需要400份,400個詞就需要1600份。這個特性在學術界有個名字叫“二次復雜度瓶頸”,而它就是那個讓所有大模型“一邊燒錢一邊喘粗氣”的罪魁禍首。
近十年來,全世界聰明的腦袋都在想一件事:能不能改改這張圖紙,讓算力需求和文本長度之間的關系從平方級降下來?如果能降到接近線性——也就是處理200個詞只要200多份算力——那省下來的電費和算力可不是一星半點。Subquadratic聲明自己做到的,正是這個。
它的名字本身就是線索:“Subquadratic”直譯過來就是“次二次”,數學上指的就是那些增長速度比平方級更慢的函數類型。這家公司的命名相當于把自己的技術路線直接印在了名片上。
根據目前公開的信息,SubQ模型用了一種不同的處理方式,繞開了傳統Transformer架構中那個最笨重的部分。說“繞開”也許不夠準確,更精確的表達是“重新設計了信息交互的機制”。傳統模型里,每次處理文本時,每一個詞都要和整個上下文里的所有其他詞打一遍招呼,相當于全班同學每次上課都得互相擊掌一輪——人少還好,一個班50個人就是1225次擊掌,100個人就是4950次。SubQ的做法則是改變了擊掌的規則,讓每個人只需要跟少數幾個關鍵人物擊掌,還能保證信息傳達不出錯。這樣一來計算量自然會斷崖式下降。
Appen的測試結果似乎在多個維度上印證了這套架構的有效性:SubQ在速度快了若干倍的同時,能耗和成本曲線都出現了明顯下探,而且在長文本處理任務上表現出色。編程能力方面,它和目前頂尖的商業模型較勁時“或多或少持平”——這個措辭很嚴謹,“持平”不是“超越”,但也足以說明這套新架構在性能上不含糊。
當然,這不代表SubQ會在所有方面取代現有模型。Subquadratic自己也沒這么說。在特定類型的任務上,比如需要一次性吞掉整本參考文檔才能做事的長鏈條分析、大規模代碼庫級別的理解與重構,SubQ可以用傳統模型幾分之一的成本跑出快幾倍的速度。但在其他一些任務上,現有的巨頭模型可能仍然更勝一籌。
Subquadratic的野心比做一款單點產品要大得多。公司聯合創始人兼首席執行官賈斯汀·丹格爾(Justin Dangel)在描述公司愿景時說了一句挺大膽的話:“我們希望我們正在開啟一個效率的新時代。我們認為幾年之后沒人會在Transformer架構上搭建模型了。”
這句話放在一個月前可能被噴得體無完膚,但在Appen的測試結果擺出來之后,至少值得聽一聽。它本質上是一個商業判斷與技術預判的混合體:如果次二次復雜度的架構確實能在保證性能的同時把成本結構打下來,那么產業的天平遲早會傾斜。這種傾斜可能是漸進式的——一開始是某些對成本極度敏感或上下文長度需求極大的場景率先切換,然后隨著新架構生態的完善,再逐步擴展到更主流的應用中去。
回頭看看Subquadratic這次從“被群嘲”到“獲背書”的過程,本身就是一個很好的傳播學案例。一家還沒拿出完整證據的公司,先拋出一個石破天驚的聲明,然后被輿論按在地上摩擦,接著不急不慢地掏出第三方報告,完成一輪漂亮的輿論反轉。惠登自己反思說,如果當初發布時就同時放出獨立基準測試結果,“大部分的質疑都會被預先化解”。這句話道出了科技傳播中一條隱形規則:你說的數字越驚人,你越不應該自己當那個念數字的人。
讓一個中立的、有專業信譽的第三方站出來替你念,比你喊一百遍“我們真的做到了”都管用。因為人們天然會懷疑那些能從好消息中直接獲利的人。Subquadratic如果真能把SubQ做成了,估值飛升、用戶涌入、行業地位改寫——這些收益太大了,大到任何理性的外部觀察者都不得不先假定你有可能在吹牛。
這就是為什么惠登說“我們現在花時間確保未來的任何結果在公開之前都經過了充分驗證”。吃了虧,學會了規矩,接下來每一步都得走得嚴絲合縫。
說回SubQ本身。它到底能不能擔得起“自Transformer以來最大突破”這個稱號,現在下結論還太早。AI行業不缺驚艷的Demo,缺的是經得起大規模部署考驗、在各種刁鉆場景下不掉鏈子的穩健產品。SubQ需要通過更多維度的測試,需要在更多人手里跑出穩定的表現,需要在真實業務場景中證明自己確實能省下真金白銀。到那個時候,我們才能比較有把握地說,那個近十年的瓶頸是不是真的被捅穿了。
但有一點已經比較清楚了:這次不是空穴來風。Appen的獨立測試結果給出了實打實的正向信號,表明SubQ所代表的技術路線至少不是一場精心包裝的騙局。它可能還有缺陷,可能在某些邊角情況下表現不穩,可能還需要一段時間來追趕傳統架構積累多年的工程優化——但它身上那股“用新思路硬剛老問題”的氣質,確實讓人想起AI領域每一次真正有意義的架構變遷。
最后說一個有趣的細節。Subquadratic選在這個時間點高調出山,本身就踩在了一個行業情緒的微妙節點上。過去兩年,大模型的參數規模瘋狂膨脹,訓練成本飆到了天文數字,能耗賬單讓所有云廠商都肉疼。整個行業嘴上喊著“越大越好”,心里其實都在嘀咕:這條路還能走多遠?如果每提升一個百分點的性能就要多燒一座電廠的電力,這個商業模式遲早要撞上物理定律的南墻。
在這種集體焦慮的背景下,任何能顯著降低計算復雜度的技術突破都會獲得加倍的關注和加倍的質疑。人們渴望它存在,又害怕又一次被科技泡沫收割期待。Subquadratic接下來要做的,就是在聚光燈下,一條一條兌現自己許下的數字。如果它成功了,幾年之后當我們回頭看時,今年春天的這場亮相,也許真的會被標記為某個新時代的前奏。
而現在,我們能說的只有一句話:初步證據顯示,這件事值得繼續盯著。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.