无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

國產(chǎn)大模型“集體”更新后能力有多強(qiáng)?記者實(shí)測

0
分享至


近期,國產(chǎn)大模型迎來密集更新。從模型性能、應(yīng)用場景到落地能力全面提升,同時(shí)在海外開發(fā)者平臺(tái),Token調(diào)用量超過美國。

國產(chǎn)大模型集體更新有哪些亮點(diǎn)?

為什么能夠吸引全球開發(fā)者來體驗(yàn)使用?

記者近期對(duì)幾款大模型進(jìn)行了實(shí)測

一起了解

能力究竟有多強(qiáng)?記者實(shí)測來了

近期,國產(chǎn)大模型迎來井噴式更新,且Token調(diào)用量排名持續(xù)在海外開發(fā)者平臺(tái)OpenRouter上名列前茅。數(shù)據(jù)顯示,截至5月4日至5月10日當(dāng)周,中國主要大模型周調(diào)用量達(dá)到7.94萬億Token,對(duì)比美國模型3.76萬億Token,調(diào)用量超美國兩倍。

國產(chǎn)大模型都有哪些能力迭代呢?記者做了一個(gè)實(shí)測。



當(dāng)前,騰訊混元大模型在海外開發(fā)者平臺(tái)排名第一。依托該模型賦能,只要輸入一句話的指令,沒有任何技術(shù)背景的人也可以按需生成一個(gè)微信小程序的應(yīng)用。

另一個(gè)大模型Kimi K2.6則主打智能體能力。它一次最多可以調(diào)動(dòng)300個(gè)子智能體,并行完成4000個(gè)協(xié)作步驟,持續(xù)代碼開發(fā)時(shí)間長達(dá)5天,將復(fù)雜任務(wù)執(zhí)行時(shí)間縮短3倍以上。


記者給Kimi提出任務(wù)進(jìn)行實(shí)測:參考一個(gè)旅游推薦集錦,制作一個(gè)包含34個(gè)旅行目的地的網(wǎng)站。只用了一個(gè)小時(shí),一個(gè)名為“探索中國”的網(wǎng)站就建好了,部分熱門景點(diǎn)還可以跳轉(zhuǎn)至購票和預(yù)約頁面。這個(gè)效率對(duì)比傳統(tǒng)工程師敲代碼已經(jīng)快到難以想象。

月之暗面Kimi研究員 杜羽倫:它具有非常強(qiáng)的長程代碼能力。它在我們內(nèi)部、外部的很多任務(wù)上可以單獨(dú)跑十幾個(gè)小時(shí),并且寫4000多行代碼,不需要人為干預(yù)。


而在這輪模型迭代中,最大的亮點(diǎn)是以國產(chǎn)開源大模型DeepSeek為代表的大模型,進(jìn)入了百萬token上下文時(shí)代。百萬token上下文可以簡單理解為大模型一次能“記住”或者“看完”的信息量,大約相當(dāng)于75萬個(gè)漢字,能力比之前的國產(chǎn)開源模型翻了4至8倍。

記者將約80萬字的《西游記》全書投喂給了最新的DeepSeek大模型。

孫悟空被唐僧驅(qū)逐出去幾次,原因是什么?

它9秒鐘給出了答案:三次,并告訴了對(duì)應(yīng)的章節(jié)和情節(jié)。由于這個(gè)情節(jié)跨越全文,所以答案是它基于全文理解基礎(chǔ)之上給出的。

記者還考驗(yàn)了DeepSeek的代碼能力。


請(qǐng)將所有的妖怪羅列出來,并根據(jù)出現(xiàn)的順序作出妖怪圖譜,并以動(dòng)態(tài)html網(wǎng)頁形式展示。

DeepSeek開啟了思考,僅僅數(shù)分鐘操作,一個(gè)西游記妖怪圖譜的搜索引擎就做好了,里面包含不同門類、不同特點(diǎn)的歸納。它還細(xì)心地為搜索引擎設(shè)計(jì)了一個(gè)logo。記者嘗試搜索,真的找到了相關(guān)妖怪的介紹。


DeepSeek的迭代真正令人贊嘆的,不僅僅是它能解決的問題,還有它的成本:目前,DeepSeek-V4-Flash百萬token的輸出價(jià)格僅為0.28美元,這個(gè)價(jià)格是美國頂尖大模型GPT-5.5的約百分之一。正是因?yàn)闃O致的性價(jià)比和綜合能力,DeepSeek-V4成了國際開發(fā)者OpenClaw上智能體“龍蝦”的默認(rèn)大模型。在百萬上下文極長推理的背后,DeepSeek的推理計(jì)算量卻降至上一代模型的27%。也就是說,它并不是靠算力硬扛,而是通過架構(gòu)創(chuàng)新將成本實(shí)打?qū)嵉卮蛄讼聛怼?/strong>

如何實(shí)現(xiàn)性能和性價(jià)比“雙重”升級(jí)?

國產(chǎn)大模型集體能力升級(jí)的背后,是我國大模型技術(shù)在開源生態(tài)上的緊密合作。從模型的技術(shù)迭代到芯片的系統(tǒng)適配,我國大模型技術(shù)如何實(shí)現(xiàn)性能和性價(jià)比的雙重升級(jí)?

無論是DeepSeek最新升級(jí)的V4模型,還是Kimi K2.6,它們都是開源模型。開源就是將軟件或者技術(shù)的源代碼公開,允許任何人自由查看、使用、修改和分發(fā)。開源主要的目的是希望通過社區(qū)協(xié)作的方式推動(dòng)技術(shù)的共同改進(jìn)。

開源合作 國產(chǎn)大模型生態(tài)協(xié)作加深

記者翻看了DeepSeek迭代后發(fā)布的技術(shù)報(bào)告,從中發(fā)現(xiàn)了國產(chǎn)大模型之間的緊密合作。比如,DeepSeek-V4中關(guān)鍵的一個(gè)優(yōu)化器,其有效性率先由另一個(gè)國產(chǎn)大模型團(tuán)隊(duì)Kimi驗(yàn)證,DeepSeek在技術(shù)報(bào)告中公開致謝。在開源生態(tài)中,大家不需要重復(fù)“造輪子”,這也是模型迭代效率和整體水平加速提升的一個(gè)重要原因。


月之暗面Kimi研究員 杜羽倫:我們的優(yōu)化器加速了DeepSeek模型的訓(xùn)練,它可以增加一倍的訓(xùn)練效率。我認(rèn)為技術(shù)的開源鼓勵(lì)了各家公司做更快AI的迭代。

不僅僅是開源生態(tài)下大模型能力之間的互相借鑒,本次DeepSeek的更新在成本和效率上做到了更底層的優(yōu)化。DeepSeek的技術(shù)報(bào)告中指出,它已經(jīng)在系統(tǒng)層面完成了跨平臺(tái)適配,可以同時(shí)運(yùn)行在英偉達(dá)和華為昇騰兩套硬件架構(gòu)之上。通過底層代碼的深度遷移以及芯片和模型的協(xié)同優(yōu)化,DeepSeek-V4在華為昇騰芯片上的推理效率實(shí)現(xiàn)了低延遲、高吞吐,證明了國產(chǎn)芯片能“跑得好”頂級(jí)模型。


同時(shí),由北京智源研究院自主研發(fā)的AI大模型操作系統(tǒng)FlagOS,也在DeepSeek-V4發(fā)布當(dāng)天完成了10個(gè)國產(chǎn)芯片廠商對(duì)新模型的開源適配,讓大模型能在更多架構(gòu)和國產(chǎn)芯片上運(yùn)行,提高效率,降低成本。記者來到國家超算中心,基于智源研究院研發(fā)的FlagOS,工作人員將算力中心不同品牌的芯片進(jìn)行了第一時(shí)間適配。


國家超算互聯(lián)網(wǎng)應(yīng)用發(fā)展主任 安磊:超算互聯(lián)網(wǎng)目前已經(jīng)匯聚了超過340家線上的合作伙伴,提供了超過7300款的軟件和應(yīng)用。FlagOS也是我們整個(gè)生態(tài)里比較重要的一個(gè)伙伴。超算互聯(lián)網(wǎng)秉持了開放開源、合作共贏的心態(tài),為國產(chǎn)芯片和國產(chǎn)算力對(duì)接,尤其是國產(chǎn)模型的對(duì)接,提供普惠式的技術(shù)服務(wù)和支撐底座。

北京智源研究院副院長兼總工程師 林詠華:過去這三年不斷堅(jiān)持,首先是能夠讓不同的芯片廠商都接入我們的技術(shù)棧,讓我們的技術(shù)棧能夠跑到不同的芯片上,這要克服很多芯片架構(gòu)的差異、芯片指令集的差異,這些事還是很有挑戰(zhàn)性的。今天我們已經(jīng)支持了10多家芯片企業(yè),超過30款芯片。

大模型深度賦能

到底能為我們做什么?

開源生態(tài)和產(chǎn)業(yè)鏈上下游協(xié)作推動(dòng)國產(chǎn)大模型加速優(yōu)化。同時(shí),隨著大模型能力的提升,它也更加深度賦能各類場景應(yīng)用。戳視頻,看大模型升級(jí)如何助力人工智能技術(shù)的應(yīng)用走入我們的工作和生活。

皮膚的紋理、眼部細(xì)節(jié)、鸚鵡的羽毛層次……剛剛升級(jí)的可靈視頻大模型全新迭代了全球首個(gè)原生4K直出功能,可以幫助影視制作者省去復(fù)雜的后期處理,直接達(dá)到電影院線的畫面質(zhì)感。


一位專業(yè)的動(dòng)畫片導(dǎo)演,正在利用大模型的新能力進(jìn)行一部動(dòng)畫電影的創(chuàng)作。從美術(shù)師設(shè)計(jì)的手稿到生成出單幀圖片,再到用視頻大模型生成出動(dòng)態(tài)效果,電影畫面的細(xì)節(jié)和清晰度都得到了保障。


AI長片電影執(zhí)行導(dǎo)演 曹漢:之前也會(huì)有一些提升分辨率的工具,比如說1080P提升到4K,因?yàn)樗皇窃模赡芊直媛侍嵘笕宋锩娌繒?huì)有一些很微妙的變化,有一點(diǎn)不像那個(gè)人了。可靈大模型因?yàn)槭窃?K,生成的視頻可以更還原角色,這可能是后期提升分辨率沒辦法達(dá)到的。


大模型能力的提升可以幫助導(dǎo)演團(tuán)隊(duì)打造出清晨陽光下細(xì)微的灰塵變化,看到人物臉上的雀斑,展示出不同層次的物品和光影的透視效果,甚至連老木頭桌子上的陳年油污都清晰可見,從而讓動(dòng)畫電影的制作效率和效果雙雙提升。

在大模型技術(shù)賦能下,同樣實(shí)現(xiàn)了效率提升的還有我們的日常生活。近期,千問大模型完成迭代,與淘寶全面打通,網(wǎng)友們只要提出自己的購買需求,不管是具體的還是模糊的,甚至可以配合圖片等多模態(tài)信息,大模型就可以完成推薦。


千問AI購物項(xiàng)目負(fù)責(zé)人 黎煜章:淘寶20年積累的40億的商品數(shù)據(jù)庫,包括背后的一些訂單交易能力、物流履約能力,翻譯給千問大模型,讓千問大模型能夠理解用戶一些隱性的需求。舉個(gè)例子,用戶說想買一個(gè)掃地機(jī)器人,家里有貓。大模型通過我們的訓(xùn)練后,可以關(guān)聯(lián)到像防毛發(fā)纏繞、需要高溫消毒等商品屬性標(biāo)簽,能夠快速搜索到符合用戶需求的商品。

從上網(wǎng)購物到網(wǎng)絡(luò)打車,再到航空公司訂票,人工智能正在打通越來越多的網(wǎng)絡(luò)生態(tài),幫助用戶更加直接地完成各類干活的任務(wù)。深度走入工作和生活場景,也將成為下一步大模型技術(shù)發(fā)展的趨勢。

國產(chǎn)大模型靠什么贏下一程?

如今,大模型技術(shù)已經(jīng)從單純的拼參數(shù)走向拼性價(jià)比、拼應(yīng)用落地、拼“干活”能力。在這個(gè)過程中,中國大模型產(chǎn)業(yè)發(fā)展又將迎來哪些機(jī)遇?

近期,斯坦福大學(xué)發(fā)布了《2026年AI指數(shù)報(bào)告》,報(bào)告的目的是通過數(shù)據(jù)與實(shí)證分析呈現(xiàn)AI發(fā)展現(xiàn)狀與趨勢。在這份400多頁的報(bào)告中,可以看到,隨著AI能力的持續(xù)進(jìn)化,全球超90%的頂尖大模型在博士級(jí)科學(xué)問題、多模態(tài)推理、競賽數(shù)學(xué)等任務(wù)上已追平或超越人類水平。中美AI大模型性能差距已大幅縮小至2.7%。而在近期中國大模型頻頻迭代的背后,也折射出技術(shù)發(fā)展的新趨勢。


清華大學(xué)技術(shù)創(chuàng)新研究中心主任 陳勁:大模型已經(jīng)走出單純模仿的發(fā)展道路,正在通過和國產(chǎn)芯片的整合,包括精巧的算力,包括我國豐富的數(shù)據(jù)資源相結(jié)合,以獨(dú)特的高性價(jià)比和強(qiáng)大的工程化能力,已經(jīng)構(gòu)成了強(qiáng)大的全球競爭力。

大模型技術(shù)落地 走向好用和高性價(jià)比

正如這份報(bào)告所指出的,未來大模型能力的關(guān)鍵并不在于誰的評(píng)分更高,而在于與落地場景結(jié)合后,誰的使用更加穩(wěn)定、更加便宜、更加合規(guī)。產(chǎn)品和落地能力已成為目前大模型技術(shù)競爭的一個(gè)重要方向。


數(shù)據(jù)顯示,截至2025年底,我國累計(jì)有748款生成式AI服務(wù)完成備案,全年新增446款。2026年《政府工作報(bào)告》首次將“打造智能經(jīng)濟(jì)新形態(tài)”寫入頂層設(shè)計(jì),同時(shí)強(qiáng)調(diào)“完善人工智能治理”,表明大模型的發(fā)展與安全已同步進(jìn)入國家戰(zhàn)略規(guī)劃。專家同時(shí)指出,大模型安全治理能力與技術(shù)進(jìn)步速度之間還存在治理滯后的“剪刀差”。

清華大學(xué)技術(shù)創(chuàng)新研究中心主任 陳勁:進(jìn)一步加強(qiáng)安全防范體系的建設(shè),建立以倫理剎車的機(jī)制,建立起人工智能行業(yè)的安全評(píng)估模型,從被動(dòng)響應(yīng)到主動(dòng)防御。安全為準(zhǔn)繩,促進(jìn)人工智能健康和諧發(fā)展。

(總臺(tái)央視記者 張春玲 張喆)

原標(biāo)題:《國產(chǎn)大模型“集體”更新后能力有多強(qiáng)?記者實(shí)測》

欄目主編:張武 文字編輯:盧曉川

來源:作者:央視新聞客戶端

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1949年,60萬國軍敗退臺(tái)灣,國民黨高層為安撫潰兵,出了三個(gè)昏招

1949年,60萬國軍敗退臺(tái)灣,國民黨高層為安撫潰兵,出了三個(gè)昏招

飯小妹說歷史
2026-05-17 08:55:40
東京出差7天,說點(diǎn)大實(shí)話,打破你對(duì)日本的所有濾鏡

東京出差7天,說點(diǎn)大實(shí)話,打破你對(duì)日本的所有濾鏡

老特有話說
2026-05-17 13:07:52
恭喜哈登!東決賽程出爐:超8.2w人看好晉級(jí)總決賽!

恭喜哈登!東決賽程出爐:超8.2w人看好晉級(jí)總決賽!

運(yùn)籌帷幄的籃球
2026-05-18 16:13:04
這個(gè)信號(hào),很不一般

這個(gè)信號(hào),很不一般

牛彈琴
2026-05-19 06:39:07
惡臭彌漫、垃圾圍村,央視曝光多地違法傾倒亂象

惡臭彌漫、垃圾圍村,央視曝光多地違法傾倒亂象

澎湃新聞
2026-05-17 23:02:03
實(shí)探柳州5.2級(jí)地震震中:馬路中央現(xiàn)深坑,圍墻倒塌砸壞汽車,三層民居門戶懸空

實(shí)探柳州5.2級(jí)地震震中:馬路中央現(xiàn)深坑,圍墻倒塌砸壞汽車,三層民居門戶懸空

極目新聞
2026-05-18 19:46:41
我年過六十歲才恍然大悟:為什么大多數(shù)女人都對(duì)六十歲以上的男人敬而遠(yuǎn)之,甚至?xí)鲃?dòng)回避,兩個(gè)原因

我年過六十歲才恍然大悟:為什么大多數(shù)女人都對(duì)六十歲以上的男人敬而遠(yuǎn)之,甚至?xí)鲃?dòng)回避,兩個(gè)原因

心理觀察局
2026-05-04 08:51:10
周杰倫一家現(xiàn)身溫州機(jī)場!10歲海瑟薇神似昆凌,大方揮手超有范兒

周杰倫一家現(xiàn)身溫州機(jī)場!10歲海瑟薇神似昆凌,大方揮手超有范兒

阿褲趣聞君
2026-05-19 00:25:36
張嘉益拍戲有個(gè)鐵規(guī)矩,合同條款都好商量,唯獨(dú)一條不能改,劇組得給孫浩安排個(gè)角色

張嘉益拍戲有個(gè)鐵規(guī)矩,合同條款都好商量,唯獨(dú)一條不能改,劇組得給孫浩安排個(gè)角色

可愛小菜
2026-05-15 15:39:11
第一次感受到維C的“殺傷力”,2塊錢一瓶,就能搞定8個(gè)麻煩事

第一次感受到維C的“殺傷力”,2塊錢一瓶,就能搞定8個(gè)麻煩事

室內(nèi)設(shè)計(jì)師有料兒
2026-05-09 10:26:26
訪華結(jié)束才3天,美方代表槍口就對(duì)準(zhǔn)中國,沒有了在北京時(shí)的態(tài)度

訪華結(jié)束才3天,美方代表槍口就對(duì)準(zhǔn)中國,沒有了在北京時(shí)的態(tài)度

顯微鏡下的人性
2026-05-19 03:12:26
中美峰會(huì)當(dāng)天,伊朗出手:扣押中方“海上軍火庫”,釋放警告信號(hào)

中美峰會(huì)當(dāng)天,伊朗出手:扣押中方“海上軍火庫”,釋放警告信號(hào)

小正說娛樂
2026-05-19 04:56:44
他和馬斯克是同學(xué),在特斯拉打工5年,在上海創(chuàng)業(yè)已是知名富豪

他和馬斯克是同學(xué),在特斯拉打工5年,在上海創(chuàng)業(yè)已是知名富豪

素衣讀史
2026-05-16 21:57:14
18個(gè)兒子108孫!800年古墓橫跨高速引發(fā)熱議,網(wǎng)友:會(huì)影響風(fēng)水嗎

18個(gè)兒子108孫!800年古墓橫跨高速引發(fā)熱議,網(wǎng)友:會(huì)影響風(fēng)水嗎

火山詩話
2026-05-17 09:57:06
最難欺騙的三大星座,頭腦精明,智慧超然,總能一眼看透人心

最難欺騙的三大星座,頭腦精明,智慧超然,總能一眼看透人心

知書夜話
2026-05-19 04:38:13
活塞球迷意難平!不止因?yàn)?4-125慘敗騎士,更多在于以下這五點(diǎn)!

活塞球迷意難平!不止因?yàn)?4-125慘敗騎士,更多在于以下這五點(diǎn)!

田先生籃球
2026-05-18 12:49:28
中南大學(xué)男生錄高考加油視頻,帥得被質(zhì)疑是AI,本人回應(yīng):只是普通帥哥,目前單身,被要聯(lián)系方式出于禮貌都會(huì)同意

中南大學(xué)男生錄高考加油視頻,帥得被質(zhì)疑是AI,本人回應(yīng):只是普通帥哥,目前單身,被要聯(lián)系方式出于禮貌都會(huì)同意

揚(yáng)子晚報(bào)
2026-05-16 08:47:38
從140斤瘦到110斤,我就靠“早上吃夠蛋白質(zhì)”這一個(gè)笨辦法!

從140斤瘦到110斤,我就靠“早上吃夠蛋白質(zhì)”這一個(gè)笨辦法!

健身狂人
2026-05-17 04:28:03
一代飲品傳奇跌落神壇,巔峰營收50億,如今身背21億債務(wù)黯然退市

一代飲品傳奇跌落神壇,巔峰營收50億,如今身背21億債務(wù)黯然退市

小蘭聊歷史
2026-04-26 06:09:36
SpaceX星艦V3首飛:推遲24小時(shí)背后的太空野心

SpaceX星艦V3首飛:推遲24小時(shí)背后的太空野心

知識(shí)碎碎念
2026-05-19 00:12:41
2026-05-19 07:15:00
上觀新聞 incentive-icons
上觀新聞
站上海,觀天下
484724文章數(shù) 761506關(guān)注度
往期回顧 全部

科技要聞

蘋果WWDC26定檔6月9日凌晨:iOS27將亮相

頭條要聞

賴清德要求美國繼續(xù)向臺(tái)出售武器 外交部表態(tài)

頭條要聞

賴清德要求美國繼續(xù)向臺(tái)出售武器 外交部表態(tài)

體育要聞

58順位的保羅,最強(qiáng)第三中鋒

娛樂要聞

票房會(huì)破14億!口碑第一電影出現(xiàn)了

財(cái)經(jīng)要聞

中國芯片,怎么突然不便宜了?

汽車要聞

40.98萬起!充電5分鐘純電續(xù)航420km 騰勢N9閃充版勝算有多少?

態(tài)度原創(chuàng)

數(shù)碼
游戲
房產(chǎn)
親子
藝術(shù)

數(shù)碼要聞

聯(lián)想拯救者自帶線移動(dòng)電源P5發(fā)售,169元

《GTA6》多個(gè)取景地在現(xiàn)實(shí)已消失!開發(fā)太久的弊端

房產(chǎn)要聞

突發(fā)!海口重磅調(diào)規(guī)!碧桂園要解套;新埠島要起飛了!

親子要聞

不能做危險(xiǎn)的事情 #大型挖掘機(jī)挖土玩具 #工程車玩具

藝術(shù)要聞

民進(jìn)黨忽然公開國民黨領(lǐng)袖日記,輿論嘩然!

無障礙瀏覽 進(jìn)入關(guān)懷版