无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

國產大模型“集體”更新后能力有多強?記者實測

0
分享至


近期,國產大模型迎來密集更新。從模型性能、應用場景到落地能力全面提升,同時在海外開發者平臺,Token調用量超過美國。

國產大模型集體更新有哪些亮點?

為什么能夠吸引全球開發者來體驗使用?

記者近期對幾款大模型進行了實測

一起了解

能力究竟有多強?記者實測來了

近期,國產大模型迎來井噴式更新,且Token調用量排名持續在海外開發者平臺OpenRouter上名列前茅。數據顯示,截至5月4日至5月10日當周,中國主要大模型周調用量達到7.94萬億Token,對比美國模型3.76萬億Token,調用量超美國兩倍。

國產大模型都有哪些能力迭代呢?記者做了一個實測。



當前,騰訊混元大模型在海外開發者平臺排名第一。依托該模型賦能,只要輸入一句話的指令,沒有任何技術背景的人也可以按需生成一個微信小程序的應用。

另一個大模型Kimi K2.6則主打智能體能力。它一次最多可以調動300個子智能體,并行完成4000個協作步驟,持續代碼開發時間長達5天,將復雜任務執行時間縮短3倍以上。


記者給Kimi提出任務進行實測:參考一個旅游推薦集錦,制作一個包含34個旅行目的地的網站。只用了一個小時,一個名為“探索中國”的網站就建好了,部分熱門景點還可以跳轉至購票和預約頁面。這個效率對比傳統工程師敲代碼已經快到難以想象。

月之暗面Kimi研究員 杜羽倫:它具有非常強的長程代碼能力。它在我們內部、外部的很多任務上可以單獨跑十幾個小時,并且寫4000多行代碼,不需要人為干預。


而在這輪模型迭代中,最大的亮點是以國產開源大模型DeepSeek為代表的大模型,進入了百萬token上下文時代。百萬token上下文可以簡單理解為大模型一次能“記住”或者“看完”的信息量,大約相當于75萬個漢字,能力比之前的國產開源模型翻了4至8倍。

記者將約80萬字的《西游記》全書投喂給了最新的DeepSeek大模型。

孫悟空被唐僧驅逐出去幾次,原因是什么?

它9秒鐘給出了答案:三次,并告訴了對應的章節和情節。由于這個情節跨越全文,所以答案是它基于全文理解基礎之上給出的。

記者還考驗了DeepSeek的代碼能力。


請將所有的妖怪羅列出來,并根據出現的順序作出妖怪圖譜,并以動態html網頁形式展示。

DeepSeek開啟了思考,僅僅數分鐘操作,一個西游記妖怪圖譜的搜索引擎就做好了,里面包含不同門類、不同特點的歸納。它還細心地為搜索引擎設計了一個logo。記者嘗試搜索,真的找到了相關妖怪的介紹。


DeepSeek的迭代真正令人贊嘆的,不僅僅是它能解決的問題,還有它的成本:目前,DeepSeek-V4-Flash百萬token的輸出價格僅為0.28美元,這個價格是美國頂尖大模型GPT-5.5的約百分之一。正是因為極致的性價比和綜合能力,DeepSeek-V4成了國際開發者OpenClaw上智能體“龍蝦”的默認大模型。在百萬上下文極長推理的背后,DeepSeek的推理計算量卻降至上一代模型的27%。也就是說,它并不是靠算力硬扛,而是通過架構創新將成本實打實地打了下來。

如何實現性能和性價比“雙重”升級?

國產大模型集體能力升級的背后,是我國大模型技術在開源生態上的緊密合作。從模型的技術迭代到芯片的系統適配,我國大模型技術如何實現性能和性價比的雙重升級?

無論是DeepSeek最新升級的V4模型,還是Kimi K2.6,它們都是開源模型。開源就是將軟件或者技術的源代碼公開,允許任何人自由查看、使用、修改和分發。開源主要的目的是希望通過社區協作的方式推動技術的共同改進。

開源合作 國產大模型生態協作加深

記者翻看了DeepSeek迭代后發布的技術報告,從中發現了國產大模型之間的緊密合作。比如,DeepSeek-V4中關鍵的一個優化器,其有效性率先由另一個國產大模型團隊Kimi驗證,DeepSeek在技術報告中公開致謝。在開源生態中,大家不需要重復“造輪子”,這也是模型迭代效率和整體水平加速提升的一個重要原因。


月之暗面Kimi研究員 杜羽倫:我們的優化器加速了DeepSeek模型的訓練,它可以增加一倍的訓練效率。我認為技術的開源鼓勵了各家公司做更快AI的迭代。

不僅僅是開源生態下大模型能力之間的互相借鑒,本次DeepSeek的更新在成本和效率上做到了更底層的優化。DeepSeek的技術報告中指出,它已經在系統層面完成了跨平臺適配,可以同時運行在英偉達和華為昇騰兩套硬件架構之上。通過底層代碼的深度遷移以及芯片和模型的協同優化,DeepSeek-V4在華為昇騰芯片上的推理效率實現了低延遲、高吞吐,證明了國產芯片能“跑得好”頂級模型。


同時,由北京智源研究院自主研發的AI大模型操作系統FlagOS,也在DeepSeek-V4發布當天完成了10個國產芯片廠商對新模型的開源適配,讓大模型能在更多架構和國產芯片上運行,提高效率,降低成本。記者來到國家超算中心,基于智源研究院研發的FlagOS,工作人員將算力中心不同品牌的芯片進行了第一時間適配。


國家超算互聯網應用發展主任 安磊:超算互聯網目前已經匯聚了超過340家線上的合作伙伴,提供了超過7300款的軟件和應用。FlagOS也是我們整個生態里比較重要的一個伙伴。超算互聯網秉持了開放開源、合作共贏的心態,為國產芯片和國產算力對接,尤其是國產模型的對接,提供普惠式的技術服務和支撐底座。

北京智源研究院副院長兼總工程師 林詠華:過去這三年不斷堅持,首先是能夠讓不同的芯片廠商都接入我們的技術棧,讓我們的技術棧能夠跑到不同的芯片上,這要克服很多芯片架構的差異、芯片指令集的差異,這些事還是很有挑戰性的。今天我們已經支持了10多家芯片企業,超過30款芯片。

大模型深度賦能

到底能為我們做什么?

開源生態和產業鏈上下游協作推動國產大模型加速優化。同時,隨著大模型能力的提升,它也更加深度賦能各類場景應用。戳視頻,看大模型升級如何助力人工智能技術的應用走入我們的工作和生活。

皮膚的紋理、眼部細節、鸚鵡的羽毛層次……剛剛升級的可靈視頻大模型全新迭代了全球首個原生4K直出功能,可以幫助影視制作者省去復雜的后期處理,直接達到電影院線的畫面質感。


一位專業的動畫片導演,正在利用大模型的新能力進行一部動畫電影的創作。從美術師設計的手稿到生成出單幀圖片,再到用視頻大模型生成出動態效果,電影畫面的細節和清晰度都得到了保障。


AI長片電影執行導演 曹漢:之前也會有一些提升分辨率的工具,比如說1080P提升到4K,因為它不是原生的,可能分辨率提升后人物面部會有一些很微妙的變化,有一點不像那個人了。可靈大模型因為是原生4K,生成的視頻可以更還原角色,這可能是后期提升分辨率沒辦法達到的。


大模型能力的提升可以幫助導演團隊打造出清晨陽光下細微的灰塵變化,看到人物臉上的雀斑,展示出不同層次的物品和光影的透視效果,甚至連老木頭桌子上的陳年油污都清晰可見,從而讓動畫電影的制作效率和效果雙雙提升。

在大模型技術賦能下,同樣實現了效率提升的還有我們的日常生活。近期,千問大模型完成迭代,與淘寶全面打通,網友們只要提出自己的購買需求,不管是具體的還是模糊的,甚至可以配合圖片等多模態信息,大模型就可以完成推薦。


千問AI購物項目負責人 黎煜章:淘寶20年積累的40億的商品數據庫,包括背后的一些訂單交易能力、物流履約能力,翻譯給千問大模型,讓千問大模型能夠理解用戶一些隱性的需求。舉個例子,用戶說想買一個掃地機器人,家里有貓。大模型通過我們的訓練后,可以關聯到像防毛發纏繞、需要高溫消毒等商品屬性標簽,能夠快速搜索到符合用戶需求的商品。

從上網購物到網絡打車,再到航空公司訂票,人工智能正在打通越來越多的網絡生態,幫助用戶更加直接地完成各類干活的任務。深度走入工作和生活場景,也將成為下一步大模型技術發展的趨勢。

國產大模型靠什么贏下一程?

如今,大模型技術已經從單純的拼參數走向拼性價比、拼應用落地、拼“干活”能力。在這個過程中,中國大模型產業發展又將迎來哪些機遇?

近期,斯坦福大學發布了《2026年AI指數報告》,報告的目的是通過數據與實證分析呈現AI發展現狀與趨勢。在這份400多頁的報告中,可以看到,隨著AI能力的持續進化,全球超90%的頂尖大模型在博士級科學問題、多模態推理、競賽數學等任務上已追平或超越人類水平。中美AI大模型性能差距已大幅縮小至2.7%。而在近期中國大模型頻頻迭代的背后,也折射出技術發展的新趨勢。


清華大學技術創新研究中心主任 陳勁:大模型已經走出單純模仿的發展道路,正在通過和國產芯片的整合,包括精巧的算力,包括我國豐富的數據資源相結合,以獨特的高性價比和強大的工程化能力,已經構成了強大的全球競爭力。

大模型技術落地 走向好用和高性價比

正如這份報告所指出的,未來大模型能力的關鍵并不在于誰的評分更高,而在于與落地場景結合后,誰的使用更加穩定、更加便宜、更加合規。產品和落地能力已成為目前大模型技術競爭的一個重要方向。


數據顯示,截至2025年底,我國累計有748款生成式AI服務完成備案,全年新增446款。2026年《政府工作報告》首次將“打造智能經濟新形態”寫入頂層設計,同時強調“完善人工智能治理”,表明大模型的發展與安全已同步進入國家戰略規劃。專家同時指出,大模型安全治理能力與技術進步速度之間還存在治理滯后的“剪刀差”。

清華大學技術創新研究中心主任 陳勁:進一步加強安全防范體系的建設,建立以倫理剎車的機制,建立起人工智能行業的安全評估模型,從被動響應到主動防御。安全為準繩,促進人工智能健康和諧發展。

(總臺央視記者 張春玲 張喆)

原標題:《國產大模型“集體”更新后能力有多強?記者實測》

欄目主編:張武 文字編輯:盧曉川

來源:作者:央視新聞客戶端

聲明:包含AI生成內容

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
莫氏雞煲第二場直播就被永封,不懂平臺規則,說錯一句話就涼了

莫氏雞煲第二場直播就被永封,不懂平臺規則,說錯一句話就涼了

新游戲大妹子
2026-05-17 13:06:37
特朗普離京后,中方公布:500架波音夢碎,美方大單直接打骨折

特朗普離京后,中方公布:500架波音夢碎,美方大單直接打骨折

阿鳧愛吐槽
2026-05-18 03:22:12
西方沒料到,特朗普訪華后的最大清醒:美國已容不下對華強硬派!

西方沒料到,特朗普訪華后的最大清醒:美國已容不下對華強硬派!

悅心知足
2026-05-18 05:38:34
保密期限終到期,中央首長透露:毛岸英真相,可以向外界公開了

保密期限終到期,中央首長透露:毛岸英真相,可以向外界公開了

歷史點行
2026-03-29 13:38:28
坐標貴州!剛調任國資委幾個月,這位區委書記轉崗的一把手就栽了

坐標貴州!剛調任國資委幾個月,這位區委書記轉崗的一把手就栽了

起喜電影
2026-05-17 21:26:42
A股周一開盤:超3400只個股下跌,三大指數集體飄綠

A股周一開盤:超3400只個股下跌,三大指數集體飄綠

大象新聞
2026-05-18 10:07:11
北京中午前后降雨會再次加強,最新天氣預報來了

北京中午前后降雨會再次加強,最新天氣預報來了

魯中晨報
2026-05-17 10:35:19
一吃心臟好,二吃睡得香,建議:立夏后多吃這3菜,身體棒,別錯過

一吃心臟好,二吃睡得香,建議:立夏后多吃這3菜,身體棒,別錯過

江江食研社
2026-05-16 22:04:41
楊子靠山真的倒了?巨力索具被立案調查,全網都在夸黃圣依太明智

楊子靠山真的倒了?巨力索具被立案調查,全網都在夸黃圣依太明智

童叔不飆車
2026-05-18 00:10:43
3-1沙特后,浮嶋敏鼓勵球隊:我還很饑餓,繼續贏啊!

3-1沙特后,浮嶋敏鼓勵球隊:我還很饑餓,繼續贏??!

懂球帝
2026-05-17 23:03:58
鐘南山發現:能活到90歲的老人,基本在60歲,就已經不做這6事了

鐘南山發現:能活到90歲的老人,基本在60歲,就已經不做這6事了

醫學科普匯
2026-05-13 23:30:08
84年,葉帥找宋時輪辦事遭拒,葉怒道:我看你是嫌麻煩,不想干吧

84年,葉帥找宋時輪辦事遭拒,葉怒道:我看你是嫌麻煩,不想干吧

熾史
2026-05-18 08:35:51
申花醫療組無敵了!司機腦漿燃盡了,他下課,吳金貴謝暉誰救火?

申花醫療組無敵了!司機腦漿燃盡了,他下課,吳金貴謝暉誰救火?

刀鋒體育
2026-05-17 12:29:34
紐約第一假名媛安娜戴電子腳銬,展示穿黑絲襪,被批厚臉皮博關注

紐約第一假名媛安娜戴電子腳銬,展示穿黑絲襪,被批厚臉皮博關注

譯言
2026-05-17 09:11:05
正式申請交易!字母哥指定加盟湖人聯手東契奇,申京或成火箭交易

正式申請交易!字母哥指定加盟湖人聯手東契奇,申京或成火箭交易

布斯基
2026-05-17 23:55:11
大蒜再次被點名!醫生發現:吃得越多,結腸癌患者病情或好轉?

大蒜再次被點名!醫生發現:吃得越多,結腸癌患者病情或好轉?

橘子約定
2026-05-17 22:38:48
69年周總理前來勸說,主席打斷道:放兩顆原子彈,但不要對外公布

69年周總理前來勸說,主席打斷道:放兩顆原子彈,但不要對外公布

歷史龍元閣
2026-05-16 13:45:19
武統、和統都沒希望了?臺軍事專家曾言:中國已經走上了第3條路

武統、和統都沒希望了?臺軍事專家曾言:中國已經走上了第3條路

別吵吵
2026-05-16 09:41:16
18年了!汶川地震丟下學生逃跑的“范跑跑”,如今竟過成了這樣?

18年了!汶川地震丟下學生逃跑的“范跑跑”,如今竟過成了這樣?

一盅情懷
2026-05-14 09:05:26
不是大白邊!上海失利真因找到!賽后評分:3人表現拉胯拖累全隊

不是大白邊!上海失利真因找到!賽后評分:3人表現拉胯拖累全隊

老吳說體育
2026-05-17 23:54:31
2026-05-18 10:36:49
上觀新聞 incentive-icons
上觀新聞
站上海,觀天下
484155文章數 761486關注度
往期回顧 全部

科技要聞

國產大模型“集體”更新后能力有多強?

頭條要聞

牛彈琴:特朗普很焦慮 出訪回國后幾小時就召高官開會

頭條要聞

牛彈琴:特朗普很焦慮 出訪回國后幾小時就召高官開會

體育要聞

生死戰只拿3分的核心,還有留的必要嗎?

娛樂要聞

盧昱曉道歉:認識到問題嚴重性!

財經要聞

安徽酒局上,還有多少古井貢酒?

汽車要聞

車長超5米/雙動力可選 昊鉑S600預售權益價18.89萬起

態度原創

旅游
教育
時尚
公開課
軍事航空

旅游要聞

云臺山臨時閉園!已預約游客可全額退款

教育要聞

莫讓懲戒變羞辱!教育的底線是守護孩子尊嚴

夏天褲子不用多買,提前準備幾條休閑的闊腿褲,百搭舒適顯瘦

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

黎以停火再延長 空襲卻未停止

無障礙瀏覽 進入關懷版