无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

破解領域視頻數據理解難題，華為GTS提出關鍵幀動態選擇新范式

2026-06-27 10:37:58　來源: 新智元

北京舉報

0

分享至

新智元報道

【新智元導讀】多模態大模型正試圖從「看畫面」進化到「懂世界」。但面對動輒數小時的真實業務長視頻，所有大模型玩家都撞上了一堵極其現實的高墻：視頻那么長，算力那么貴，幀，到底該怎么選？

多模態大模型正試圖從「看畫面」進化到「懂世界」。但面對動輒數小時的真實業務長視頻，所有大模型玩家都撞上了一堵極其現實的高墻：視頻那么長，算力那么貴，幀，到底該怎么選？

為了妥協算力，目前的行業慣例是「均勻采樣」——讓模型每隔幾秒機械地「睜一次眼」。但這套看似公平的邏輯，在通信等復雜領域場景中卻顯得極為脆弱。因為業務事件的發生，從不按照節拍器來。

痛點：垂直業務場景的「冰與火之歌」

在專業的領域視頻中，「看滿全場」絕不等于「看懂細節」。關鍵事件在時間軸上極度「非均勻分布」，這導致均勻采樣常常在兩個極端里反復橫跳：

「久坐不動」的無效冗余：比如專業培訓、技術課程，一頁教案可能長達十幾分鐘。如果均勻采樣，大量近乎雷同的靜態畫面不僅白白燒掉算力，還會讓大模型直接「看花眼」。
「電光石火」的瞬間遺漏：在現網割接、機房工勘等長錄像中，99% 的時間可能是無意義的靜默等待，但決定成敗的核心動作往往轉瞬即逝。均勻采樣在這種場景下，無異于大海撈針，一漏致命。

這逼出了一個終極拷問：能不能讓模型在不知道提問的前提下，自己判斷「哪些畫面最值得看」？

破局：LFS幀選擇器給大模型裝上「定位巡航」

面對這一行業共性難題，華為GTS研發部AI數據團隊給出了全新解法——LFS（Learnable Frame Selector，可學習幀選擇器）。

LFS打破了「按時間間隔抽幀」的刻板印象。它的核心判斷極度干脆：幀的價值，只取決于它是否包含關鍵動作與場景變化。

近日，該項「視頻關鍵幀選擇」研究成果已正式被人工智能頂級國際會議IJCAI 2026接收。

論文首頁信息

? 論文標題：LFS: Learnable Frame Selector for Event-Aware and Temporally Diverse Video Captioning

? 論文鏈接：https://arxiv.org/abs/2601.14594

? 論文作者團隊：華為 GTS研發部 AI數據團隊

圖 1：LFS 訓練與推理整體框架

核心技術：超輕量級CNN重塑幀選擇邏輯

LFS并不笨重，它的選幀閉環僅靠三招，便實現了四兩撥千斤的奇效。

1. 極致輕量的時間打分：僅 126K參數的「降維打擊」

LFS首先使用凍結的Long-CLIP提取幀特征，隨后將其送入輕量級時間打分網絡TSNet。TSNet通過一維時間CNN精準捕捉局部的動作轉換，并結合全局門控調制，為每一幀生成專屬的「重要性分數」。高分幀，即代表著畫面正在發生關鍵動作或劇烈變化。

值得一提的是團隊在此處極具巧思的算法設計：面對超長視頻帶來的性能壓力，團隊摒棄了調用龐大視覺模型逐幀「重度審視」的傳統路線，而是另辟蹊徑，直接對其文本空間的特征向量進行高速評估。

這種「降維打擊」不僅讓幀選擇過程快如閃電，更將整個一維TSNet模型的參數量極限壓縮至僅126K。這一設計在推理速度與物理顯存占用上展現出了壓倒性的優勢，以極高的計算效率，完美實現了對海量視頻幀的「沙里淘金」。

圖 2：TSNet框架圖。

2. 分層 Top-K：既看「高光瞬間」，也看「完整全場」

如果只挑最高分的幀，容易導致畫面全部扎堆在某一個激烈操作的時間段，LFS巧妙地將時間線劃分為多個片段，在每個片段內提取高分幀。這保證了模型既抓住了重點，又沒錯過視頻的完整生命周期。

3. 零成本接入：Caption 反饋閉環

LFS并沒有人為設定「哪幀重要」的代理指標，而是直接讓凍結Video-LLM 的Caption損失提供反饋。

訓練時，梯度只回傳到輕量的幀選擇器TSNet，視頻大模型本身始終保持凍結，從而將訓練和工程接入成本降至最低。

為了減少Caption生成的偏見并穩定優化過程，作者采用了一種相對Caption損失，即通過從同一采樣視頻幀集上計算的自回歸損失減去均勻采樣的自回歸損失：

其中為計算的自回歸損失：

實驗結果

9大Benchmark上全面提升，8個達成SOTA

數據證明，學會「挑重點」確實能帶來更魯棒的理解力。

在真實業務基準上，搭載LFS的Qwen3-VL-8B整體準確率躍升至75%；在極其考驗關鍵動作捕捉的VDC Detailed子項中，準確率顯著提升至58%。

更硬核的是，LFS 展現出了極強的泛化能力。它生成的高質量Caption能夠直接反哺Zero-shot（零樣本）視頻問答，在MVBench、VideoMME等9個權威開源榜單上均取得穩定且全面的性能提升，除Dream-1K外均取得SOTA表現。

圖3：LFS在9個benchmark上相對基線取得穩定提升。

圖4：LFS在開源VDC benchmark上的效果提升。

后記

長視頻理解的難點，從來不只是「視頻太長」，而是有效信息稀疏、關鍵瞬間易被淹沒。LFS的價值，正是讓模型在有限算力下優先看見真正改變業務語義的畫面。

這種「高性能、高命中」的特性，正精準契合行業垂域面向前沿領域的龐大多模態數據消費需求：

知識沉淀更高效：將數小時的技術課程快速定位到核心講解、關鍵操作與知識跳轉點，讓經驗從視頻里被提煉出來。
作業審計更可信：在網絡割接、配置變更等高風險流程中自動捕捉關鍵幀，為規范復盤、風險定位和質量追溯提供證據鏈。
現場巡檢更智能：精準識別機房工勘、設備巡檢等長錄像中的異常動作和狀態變化，讓一線現場數據沉淀為可檢索、可分析的業務資產。

當AI應用從「能看見」走向「看得準、看得省、看得懂」，視頻數據的價值也不再取決于堆了多少幀，而取決于能否在正確的時刻抓住正確的信息。LFS提供的，正是一條面向行業長視頻理解的高效技術路徑。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Claude Fable 5分批重新上線！GPT-5.6秒跟

量子位 2026-06-26 14:50:29
4 跟貼 4
“C盤占用”風波背后：WPS不想當工具人了

鈦媒體APP 2026-06-26 16:58:33
4 跟貼 4

打工人辦公神器！Fanyigou整頁秒譯效率翻倍，太香了

雷科技 2026-06-26 18:15:43
0 跟貼 0

華為余承東：我們的理念和特斯拉不一樣，目標是超越

金融界 2026-06-26 21:47:14
50 跟貼 50
史上最香的Pura？華為Pura 90 Pro越用越有味

雷科技 2026-05-08 20:27:00
0 跟貼 0

OpenAI又動了數億人的默認模型：沒更聰明，卻更黏你

新智元 2026-06-27 06:03:26
0 跟貼 0

一萬三的華為手機，不慎掉火坑，男子通過官方定位找回！

胡子搞笑君 2026-06-25 11:49:38
2 跟貼 2
啟境GT7正式上市搭載華為六大汽車智能化解決方案

紅星新聞 2026-06-27 09:54:31
0 跟貼 0

價格大漲！有網友曬單：去年不到7000，今年12000了

南方都市報 2026-06-26 09:53:31
3502 跟貼 3502
為了讓平板更像紙，華為把光刻工序搬到屏幕了...

地球村講解員 2026-06-25 08:37:08
0 跟貼 0
中國無人機技術，究竟有多離譜？

愛歌唱的叮當貓 2026-06-25 13:17:58
2 跟貼 2
你說不用華為？可是華為無處不在，手機只是衍生通訊才是看家本領

胖塌塌生活看點 2026-06-26 11:00:57
16 跟貼 16
美國將要拆除華為中興通訊設備！越南網友：中國不需要美國高端

用耳朵聆聽 2026-06-26 13:16:51
1 跟貼 1
共同守住“數字主權”，華為擎云加速落地

華商韜略 2026-06-13 21:01:37
0 跟貼 0
魯比奧稱"美俄在阿拉斯加未達成任何共識" 俄方反駁

環球網資訊 2026-06-26 20:09:24
9112 跟貼 9112
啟境GT7集齊華為“六大利器”？靳玉志：能上的，全都上了

Nice好車 2026-06-26 20:40:03
0 跟貼 0
鎖定最美7系SUV？華為全家桶不缺席，啟境GX7值得等嗎？

蝸牛車志V 2026-06-24 15:31:31
0 跟貼 0
華為聯合湖北移動完成重要測試！全國運營商首個 Token吞吐率大增372%

快科技 2026-06-26 22:15:55
0 跟貼 0
AI 批量造 App，也在批量埋雷

鈦媒體APP 2026-06-27 10:05:13
0 跟貼 0
華為賦能建筑進化:上海設計大廈的數字化改造樣本

海莉in洞見 2026-06-25 10:17:27
4 跟貼 4
高手展示刺繡技術，用這玩意紋身，一天兩個滿背都沒事！

奧力給趣笑堂 2026-06-26 11:36:45
1 跟貼 1
三年虧92億，全球市占第一的智駕龍頭，護城河正在被侵蝕

硅嶼手記 2026-06-27 03:56:31
0 跟貼 0
全球局勢持續動蕩不安，為何中國獨享和平，深度解析背后核心邏輯

清晨的世界 2026-06-26 01:03:21
0 跟貼 0
韓國網友看華為mate70發布會

愛音樂的小偉 2026-06-25 13:26:22
3 跟貼 3
筆記里的奮斗故事！

開屏新聞客戶端 2026-06-26 14:19:06
0 跟貼 0
黃仁勛：請從容接受社會的毒打韌性只能在磨練中擁有

每日經濟新聞 2026-01-08 13:50:38
0 跟貼 0
深圳最狠的地方：每隔十年，就親手“殺死”自己一次

飯統戴老板 2026-01-09 17:54:56
0 跟貼 0
華為AI眼鏡上手！朋友都說帥爆了，都怪我顏值太高

雷科技 2026-04-20 23:25:15
0 跟貼 0
天下苦話費貴久矣

中國新聞周刊 2026-06-26 14:33:02
305 跟貼 305
暴漲150美元+砍2TB機型!XBOX這波是自暴自棄了嗎?

游民星空 2026-06-27 11:08:16
1 跟貼 1
“南枝”畢業了！《給阿嬤的情書》主演李思潼現身廣財畢業典禮；本人回應“金融專業跨界當演員”：金融的理性思維，更能看清現實的復雜

大風新聞 2026-06-26 13:25:20
3527 跟貼 3527
中國建設銀行山東總審計室副主任陳棟被開除黨籍和公職，曾出任建設銀行德州分行行長

感知山東 2026-06-27 10:26:06
0 跟貼 0
高質量的夫妻生活，牢記三要三不要，醫生話只能點到為止！

生活者工廠 2026-06-24 11:39:34
0 跟貼 0
扎克伯格大膽突進：探索與Polymarket和Kalshi合作預測APP

財聯社 2026-06-27 11:11:40
0 跟貼 0
多模態大模型視覺定位難題怎么解？

機器之心Pro 2026-06-10 11:31:45
0 跟貼 0
這渦扇模型真能轉還帶聲？全合金超1000零件！#硬核模型

制造科技 2026-06-22 19:32:06
0 跟貼 0
甜椒產量超珠峰？全靠這些技術！

全球見聞筆記 2026-06-26 08:10:00
0 跟貼 0
工信部就《開源鴻蒙設備統一互聯接入與控制接口》等3項行業標準、9項推薦性國家標準計劃項目意見公開征求意見

每日經濟新聞 2026-06-26 17:14:09
572 跟貼 572
微縮模型之神

一笑到底 2026-06-25 00:49:21
1 跟貼 1
為什么沒全民爆款電視劇了？不是劇變差了，而是時代變了

調侃國際觀點 2026-06-27 00:58:36
1 跟貼 1

“充會電”成最后遺言：33歲父親為家赴泰，再現身已被按頭打電話

“充會電”成最后遺言：33歲父親為家赴泰，再現身已被按頭打電話

奇思妙想草葉君

2026-06-27 03:05:24

難以置信！河北一考生發帖怒斥，班主任在高考結束就刪除家長微信

難以置信！河北一考生發帖怒斥，班主任在高考結束就刪除家長微信

火山詩話

2026-06-27 08:45:13

俄羅斯前國防部長意外去世，死因尚未公布

俄羅斯前國防部長意外去世，死因尚未公布

爆角追蹤

2026-06-26 22:52:14

世界杯32年奇觀!40歲門將半場被撤：70歲老帥氣炸了隊友攤手抱怨

世界杯32年奇觀!40歲門將半場被撤：70歲老帥氣炸了隊友攤手抱怨

風過鄉

2026-06-27 09:45:18

每體:貝爾薩知道無論如何都得離任等開踢再換巴爾韋德將矛盾公開

每體:貝爾薩知道無論如何都得離任等開踢再換巴爾韋德將矛盾公開

畫夕

2026-06-27 10:31:04

令人絕望！連非洲兄弟都來踩一腳，韓國已跌至第7，就怕2場默契球

令人絕望！連非洲兄弟都來踩一腳，韓國已跌至第7，就怕2場默契球

萌蘭聊個球

2026-06-27 08:07:08

又匹配兩對，世界杯1/16決賽：德國vs巴拉圭，法國vs瑞典

又匹配兩對，世界杯1/16決賽：德國vs巴拉圭，法國vs瑞典

懂球帝

2026-06-27 10:44:11

虧大了！安徽考生高考使用修正帶，數學判0分，總分458分超本科線

虧大了！安徽考生高考使用修正帶，數學判0分，總分458分超本科線

火山詩話

2026-06-26 05:41:30

活久見！女子曬出丈夫監獄賬戶收支明細，130元勞動報酬，引熱議

活久見！女子曬出丈夫監獄賬戶收支明細，130元勞動報酬，引熱議

火山詩話

2026-06-26 15:19:53

克林頓爆粗、奧巴馬翻白眼、特朗普開罵…5個美國總統沒一個能收拾內塔尼亞胡

克林頓爆粗、奧巴馬翻白眼、特朗普開罵…5個美國總統沒一個能收拾內塔尼亞胡

可達鴨面面觀

2026-06-26 18:25:33

湖南郴州這家學校老師都是法盲！將沒收來的上百部學生手機當眾砸毀

湖南郴州這家學校老師都是法盲！將沒收來的上百部學生手機當眾砸毀

黃河新聞網呂梁

2026-06-26 17:28:27

中國移動空調歐洲斷貨，免安裝為何能繞過3000歐元安裝費壁壘？

中國移動空調歐洲斷貨，免安裝為何能繞過3000歐元安裝費壁壘？

小柱解說游戲

2026-06-27 03:42:28

世界杯：佛得角0-0創歷史！首次參賽就出線+將戰阿根廷沙特出局

世界杯：佛得角0-0創歷史！首次參賽就出線+將戰阿根廷沙特出局

念洲

2026-06-27 10:09:07

震驚！保時捷車主與三輪車主互毆視頻登熱搜，一年輕美女全程圍觀

震驚！保時捷車主與三輪車主互毆視頻登熱搜，一年輕美女全程圍觀

火山詩話

2026-06-27 05:52:38

這就是赤裸裸的現實！為什么突然要求核查央國企近二三十年工作？

這就是赤裸裸的現實！為什么突然要求核查央國企近二三十年工作？

椰青美食分享

2026-06-26 13:51:31

一場1-0讓兩個國家狂歡！人口60萬小國出線，韓國看到希望！

一場1-0讓兩個國家狂歡！人口60萬小國出線，韓國看到希望！

綠茵舞著

2026-06-27 11:09:17

江西財經大學事件：“把你打到無法行走”、“每延遲一天拔一片指甲”、“讓你懷孕再逼你流產。”

江西財經大學事件：“把你打到無法行走”、“每延遲一天拔一片指甲”、“讓你懷孕再逼你流產。”

貼小君

2026-06-27 01:13:40

動容！佛得角全隊慶祝似奪冠 7萬球迷狂歡 40歲門神激動扛起隊友

動容！佛得角全隊慶祝似奪冠 7萬球迷狂歡 40歲門神激動扛起隊友

我愛英超

2026-06-27 10:56:29

成本20賣3000，555億身家的山東美女富豪，憑什么收割愛美女性？

成本20賣3000，555億身家的山東美女富豪，憑什么收割愛美女性？

青眼財經

2026-06-27 08:00:24

世界杯太殘酷了：隨著西班牙1-0，首支出局的南美球隊誕生

世界杯太殘酷了：隨著西班牙1-0，首支出局的南美球隊誕生

側身凌空斬

2026-06-27 10:03:18

AI產業主平臺領航智能+時代

15543文章數 66938關注度

往期回顧全部

科技要聞

GPT-5.6發布，旗艦模型先向可信伙伴開放

頭條要聞

三戰三平佛得角小組第二晉級下一場挑戰阿根廷

頭條要聞

三戰三平佛得角小組第二晉級下一場挑戰阿根廷

體育要聞

我在世界杯的每次奔跑，都為了證明你沒看錯

娛樂要聞

楊紫獲白玉蘭最佳女主角獎，淚灑現場

財經要聞

OpenAI推遲IPO重創軟銀！

汽車要聞

11.99萬起捷途自由者7 PLUS/山海T1四驅版上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

手機

本地

數碼

公開課

“無糖湯圓”是否隱藏著健康陷阱？

手機要聞

蘋果iOS 27 Beta 2固件代碼出現百度視覺搜索

本地新聞

世界杯球迷節：比球賽更好玩的派對

數碼要聞

雷柏VT7 / VT7s Air MAX V2鼠標發售：雙端nRF54LM20，PAW3955

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
布洛芬是怎么給人止痛的？
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版