網易首頁 > 網易號 > 正文 申請入駐

大模型新史:春秋將逝,戰國啟闔

0
分享至

兩千多年前,中國迎來第一次全國性大分裂,諸侯連年征戰,天下格局也隨之動蕩不定。

但正如常言所道,“天下大勢,分久必合”,經過近300年的兼并戰爭,數百個諸侯紛紛覆滅,最終只剩下少數幾個主要國家,歷史進入七國爭雄的戰國時期。

歷史不會簡單重演,但總會飛來幾只似曾相識的燕子。這一次的“燕子”,名叫大模型。

從被稱為AIGC的“iPhone時刻”的ChatGPT誕生以來,正如智能手機的iPhone時刻不只屬于蘋果公司,而是帶來了一大批智能手機品牌的崛起一樣,大模型也迎來了“百模大戰”。

據GitHub的統計數據,到2023年底,僅國內已經發布的大語言模型數量,即已接近300個。加上海外企業,全球大模型數量已超過400個。

巧合的是,當初東周王室分封的諸侯數量,也是400多個。

盡管大模型空前廣闊復雜的應用場景,以及不同廠商在細分領域優劣勢的客觀存在,決定了大模型不會像PC一樣出現Windows一統天下的格局,也不會像智能手機一樣僅由iOS、Android兩個主要玩家壟斷市場;但大模型本身超強的適應能力,也決定了百度李彥宏所說的“99%陪跑”,更有可能成為行業的未來景象。

新的歷史正在上演,而在敘事上,大模型研發者們,似乎已經選擇了當初谷歌打下Android江山的劇本。

去年12月,阿里云正式發布并開源“業界最強開源大模型”通義千問720億參數模型Qwen-72B。

1月17日,商湯科技與上海AI實驗室聯合香港中文大學和復旦大學發布的新一代大語言模型書生·浦語2.0宣布開源。

1月29日,Meta發布的“Code Llama家族中體量最大、性能最好的模型版本” Code Llama70B,也選擇了開源。

1月30日,科大訊飛發布首個基于全國產化算力平臺”飛星一號”的開源大模型——星火開源-13B。

公開信息顯示,Meta的LLama、OPT,谷歌的T5、MT5、FLAN-T5以及UU2,Big Science的BLOOM、T0、BLOOMZ等國內外主流大模型,均走上了開源道路。

艾倫人工智能研究所等5機構最近公布的開源模型OLMo,更是將模型權重、完整訓練代碼、數據集和訓練過程全部予以公開,玩起了大模型的“真·完全開源”模式。

國內外頭部廠商紛紛加入這場“開源熱”,意味著“加速快跑”已成為行業共識。大家都希望跑在前面,成為李彥宏口中那剩下的1%。

而留給后來者的機會窗口也正緩緩關閉。因為在競爭再度空前激烈的大模型賽道上,所有參賽者都明白,這不是一場排位賽,而是一場淘汰賽。

大模型的“戰國時代”,似乎已經遙遙在望。

推開“戰國”的大門

Android的發展歷程,堪稱互聯網行業底層操作系統開源的教科書。

作為一個開源系統,Android較之此前占據優勢的塞班、黑莓、WP,以至同樣出身名門的plamOS(惠普)、BADA OS(三星)、MeeGo(英特爾+諾基亞),本身并沒有多大突破。但是由于開發者可以自由訪問系統底層,通過其源代碼進行二次開發,App的開發門檻、周期都得以大幅縮短,并且可以根據自己的需求和風格定制界面和功能,市場自然更容易接受。

手機廠商也樂得將更多的精力,投入到系統的打磨上,改善用戶的使用體驗。因此,我們所熟知的小米、魅族、vivo、OPPO等手機廠商,基本都是基于Android的深度定制打造的自身操作系統。

回望模型,開源大模型的出現,讓AI 應用的開發周期和成本大幅降低,加快人工智能的普及。以Meta發布的Code Llama70B為例,據稱,其API調用成本大約比 GPT-4 便宜了 30 倍。在Llama2 發布兩個月后,通過 Hugging Face 的 Llama 模型下載量就超過 3000 萬次。國內興起的AIGC,不少應用的基礎模型就是 Llama2。

正如Meta 首席科學家、深度學習三巨頭之一 Yann LeCun所說:“閉源證明了大模型路線的可行性,而開源則通過繁榮的生態,讓大模型變得易用、可用。”

而這次大模型的“開源熱”,除了市場推廣邏輯的復刻外,還有更現實的利益考量,那就是算力資源的匱乏。

根據不同的機構測算,GPT-4 的訓練需要的 A100 數量大約在10000-25000 張的區間。“百模大戰”所消耗的算力規模可想而知。

更富邏輯性的說法則是,過去4年間,大模型參數量以年均400%的速度增長,AI算力需求增長超過15萬倍,傳統算力基礎設施已無法滿足大模型、生成式AI的訓練需求。

正是在這一背景下,業內早就提出,AI大模型的合理發展路徑,應該是“可能僅有少數企業會開發基礎大模型,其他各行各業將根據自身業務需求、數據量等,接入大模型平臺,開發屬于自己的模型”。

國內大模型的先發者百度CEO李彥宏更是直言:“好幾百個基礎模型,這是對社會資源巨大的浪費。”

另一方面,“百模大戰”對于技術升級的意義或許也確實不大。

盡管目前各家大模型在數據、算法等各個層面千差萬別,但核心的技術路線,事實上都是6年前誕生的Transformer 架構。ChatGPT的名字中,GPT的T,指的就是Transformer。Copilot、 DALL·E 3 、 Midjourney、Runway……這一年不斷刷新我們認知的 AI 產品,背后的核心技術架構都是Transformer。

這也解釋了為什么ChatGPT之后,新的大模型會如此密集出現。ChatGPT的最大功績,不是創造了新的AI工具,而是讓大家看到了AI革命性突破的確定路徑。這與前文提到的智能手機的iPhone時刻可謂異曲同工。

在同樣的架構之下,訓練出再多再好的大模型,最終意義或許就是刷個榜而已。

1月30日,上海人工智能實驗室推出的大模型開源開放評測體系司南(OpenCompass2.0),發布了2023年度大模型評測榜單,榜單顯示,整體技術能力居于GPT4與GPT3.5之間的大模型數量,已多達7個,其中不乏國產大模型身影。

但在實際應用上,李彥宏表示:“國內數百個大模型調用量加起來,還不如文心一個多。”

既然這樣,把資源集中在幾個更有實力的大模型上,的確是更優選擇。

從政策上來看,開源也是行業大勢所趨。早在2017年,中國發布的《新一代人工智能發展規劃》就將開源、開放作為基本原則寫入了規劃。2023年,科技部副部長吳朝暉也表示,中國堅持開源協作,加強大模型技術持續創新,協同解決透明性、穩定性等共性問題,加快形成大模型的產業生態。

因此,當下大模型發展的“春秋時期”,是市場、企業、政策多方合力,共同用開源推開了“戰國”的大門。

“分晉”?“代齊”?

開源將改變大語言模型的格局已毋庸置疑。如何應對?相信誰也給不出終極答案。

但既然“似曾相識燕歸來”,我們不妨再次將眼光轉向兩千多年前的那個時代。

歷史從春秋轉入戰國,有兩個標志性的事件,一是三家分晉,二是田氏代齊。這兩大事件,也為大模型廠商們面對開源后加快的市場洗牌,提供了兩個有效的應對思路。

三家分晉的最終成行,在于趙、魏、韓三家勢弱的公卿,通過聯合取勝,消滅了勢強的智家,從而各自分得了晉國的部分領土。對于大模型廠商來說,這意味著一種合縱抗敵,各得其利的思路。

海外比較具有代表性的案例當屬Hugging Face開源社區。作為世界最大的大模型托管平臺,Hugging Face近日推出了開源、可定制的AI 助手Hugging Chat Assistants。除了免費之外,其與GPTs和GPT Store另一個重要區別在于:后兩者完全依賴于OpenAI的專有大模型GPT-4以及GPT-4 Vision/Turbo,而前者的用戶可以自由選擇多個開源LLM來驅動AI助手。

Hugging Chat Assistants推出后不久,就受到AI社區許多開發者的稱贊,認為它在某些方面“超越了GPTs”,成為其追趕閉源系統競爭對手方面的不二法寶。

在國內,2023年9月5日,由重慶市大數據應用發展管理局牽頭,華為、阿里、騰訊、百度、京東、科大訊飛等50多家國內頭部大模型企業加入的,全國首個大模型聯盟智博會正式宣告成立,極大地推動了大模型產業生態發展。這與Android系統發布當天,Google公司宣布聯合摩托羅拉、高通、HTC和T-Mobile在內的30多家公司,共同組建全球性的開放手機聯盟,以推動Android普及,看上去頗有幾分相似。

回顧歷史,田氏代齊中的田氏,則是通過“有德于民”,而使“齊之民歸之如流水”,最終取代姜氏,掌握了齊國的政權。這種給與下游生態合作伙伴及客戶更多實惠,從而提升其合作意愿的思路,更適合有實力的大模型廠商。

譬如2023年9月5日召開的百度云智大會上,百度即宣布,推出大模型新生態政策,為伙伴提供資金、算力、技術、營銷等全方位的強力支持。百度如今能做到“國內數百個大模型調用量加起來,還不如文心一個多”的成績,與此不無關系。

當然,從大模型長期發展的復雜性來說,需要考慮的因素遠不止此。數據安全、許可協議標準、商業模式等等問題,在如今的發展階段,仍然處于未解之中。

但,Android先例在前,無論選擇“分晉”還是“代齊”路線,抑或其他,大模型廠商們通過開源加快搶占市場的用心,早已堅不可摧。“春秋時代”戰事的終結,也早已由此注定。

Android的命名靈感,來自一個充滿野心的科幻作品《未來夏娃》。在這部小說中,作者試圖創造出一個完美的機器生命。正是出于對作者利爾·亞當科學精神的致敬,Android之父安迪·魯賓,將本書女主角的名字,用在了自己開發的操作系統之上。大模型廠商們,誰又將造出AI時代的“未來夏娃”,我們拭目以待。

聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
湖北千億國企,8年5名高管落馬!錢都去哪兒了?

湖北千億國企,8年5名高管落馬!錢都去哪兒了?

五味財經
2026-04-23 20:06:00
聯盟第5高的薪水還是被胖揍!沖冠黃了,重建也沒戲,大交易雙輸

聯盟第5高的薪水還是被胖揍!沖冠黃了,重建也沒戲,大交易雙輸

阿浪的籃球故事
2026-04-23 16:03:28
北京搖號真相,0.5%的中簽率!普通指標“萬能牌”坑了誰?

北京搖號真相,0.5%的中簽率!普通指標“萬能牌”坑了誰?

右耳遠聞
2026-04-22 17:51:03
防不住!戰術拆解:哈登一人,為何能讓猛龍防守顧此失彼

防不住!戰術拆解:哈登一人,為何能讓猛龍防守顧此失彼

一登侃球
2026-04-24 00:25:54
特魯姆普澆滅趙心童世界第一!11位種子全晉級,墨菲死里逃生

特魯姆普澆滅趙心童世界第一!11位種子全晉級,墨菲死里逃生

觀察鑒娛
2026-04-23 10:58:02
黑絲的誘惑:不是穿給別人看,是穿給自己的自信

黑絲的誘惑:不是穿給別人看,是穿給自己的自信

疾跑的小蝸牛
2026-04-23 22:15:54
地球文明已經重啟過9次,地心世界真的存在,入口在布達拉宮地下

地球文明已經重啟過9次,地心世界真的存在,入口在布達拉宮地下

易玄
2024-12-07 02:14:06
旅行后,你對哪個城市祛魅了?網友:異域風情哈爾濱

旅行后,你對哪個城市祛魅了?網友:異域風情哈爾濱

夜深愛雜談
2026-04-17 17:29:36
新娘確實漂亮,但我更喜歡戴眼鏡那個。

新娘確實漂亮,但我更喜歡戴眼鏡那個。

動物奇奇怪怪
2026-04-12 12:44:36
史詩級重建計劃!皇馬今夏最多8人離隊,2億補強短板,克洛普帶領新戰艦

史詩級重建計劃!皇馬今夏最多8人離隊,2億補強短板,克洛普帶領新戰艦

林子說事
2026-04-23 08:18:56
北京地鐵取消“左行右立”,扶梯上這么站才安全,很多人還在錯

北京地鐵取消“左行右立”,扶梯上這么站才安全,很多人還在錯

荷蘭豆愛健康
2026-04-24 02:48:04
87年幫村長家曬糧睡偏房,夜里我竟摸到條粗黑辮子,一道女聲響起

87年幫村長家曬糧睡偏房,夜里我竟摸到條粗黑辮子,一道女聲響起

卡西莫多的故事
2026-04-20 14:44:05
51歲何潤東騎自行車買早飯,妻子林姵希蹬車小腿纖細,很般配

51歲何潤東騎自行車買早飯,妻子林姵希蹬車小腿纖細,很般配

娛樂圈圈圓
2026-04-22 10:45:56
徹底改變!捷達正式換標

徹底改變!捷達正式換標

新浪財經
2026-04-24 00:42:22
人社部、教育部明確:中小學幼兒園教師招聘,放寬至38周歲(含)以下

人社部、教育部明確:中小學幼兒園教師招聘,放寬至38周歲(含)以下

南方都市報
2026-04-23 14:34:07
記者:CBA賽制頻繁變更,對聯賽的職業化發展是有損傷的

記者:CBA賽制頻繁變更,對聯賽的職業化發展是有損傷的

懂球帝
2026-04-23 23:24:51
安徽宿州一中學突發火災,現場黑煙滾滾,從教學樓內噴涌而出,學生緊急疏散,無人員傷亡,應急部門:起火點并非教室,具體原因仍在調查中

安徽宿州一中學突發火災,現場黑煙滾滾,從教學樓內噴涌而出,學生緊急疏散,無人員傷亡,應急部門:起火點并非教室,具體原因仍在調查中

瀟湘晨報
2026-04-23 20:16:52
我33歲到沙特務工,當地人很闊綽,男女界限很嚴,光棍一大片

我33歲到沙特務工,當地人很闊綽,男女界限很嚴,光棍一大片

千秋文化
2026-04-22 20:25:24
34歲美國退伍軍人發現孩子非親生,在法院外開槍怒殺孩子生父,被判處40年監禁,律師:他一直被蒙在鼓里,將孩子當成自己的骨肉

34歲美國退伍軍人發現孩子非親生,在法院外開槍怒殺孩子生父,被判處40年監禁,律師:他一直被蒙在鼓里,將孩子當成自己的骨肉

大風新聞
2026-04-23 18:33:05
首都挨炸,美軍竟遞刀子!又一中東土豪掀桌,重金求巴鐵核武鎮場

首都挨炸,美軍竟遞刀子!又一中東土豪掀桌,重金求巴鐵核武鎮場

云舟史策
2026-04-24 07:23:13
2026-04-24 08:23:00
旗幟財經 incentive-icons
旗幟財經
資深媒體人創辦
246文章數 56關注度
往期回顧 全部

藝術要聞

罕見曝光!毛澤東 36 幅經典對聯,每一幅都是絕品!

頭條要聞

特朗普發文后 伊朗最高領袖、總統、議長、外長齊發聲

頭條要聞

特朗普發文后 伊朗最高領袖、總統、議長、外長齊發聲

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

普華永道賠償10億 恒大股東見到"回頭錢"

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

時尚
房產
教育
親子
軍事航空

李昀銳:林深見木

房產要聞

三亞安居房,突然官宣!

教育要聞

家長要電子試卷被說派頭大?天津這起家校誤會,沒有真正的贏家!

親子要聞

新華讀報|打乒乓球有助提高兒童注意力

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進入關懷版