網易首頁 > 網易號 > 正文 申請入駐

深化邏輯推理與空間智能,商湯SenseNova U1開啟競速,搶占機器人產業發展先機

0
分享至

今天,商湯科技正式發布并開源日日新SenseNova U1 系列原生理解生成統一模型。它基于商湯于今年三月自主研發的 NEO-unify架構,在單一模型架構上統一了多模態理解、推理與生成。

NEO-unify架構徹底摒棄了主流的拼接式,去除了視覺編碼器(VE)和變分自編碼器(VAE),重新構建了統一的表征空間,并且深入融入每一層計算中,從而實現從模態集成向原生統一的范式跨越。

SenseNova U1系列模型能夠將語言與視覺信息作為統一的復合體直接建模,實現語言和視覺信息的高效協同,讓理解與生成能力同步增強,在保留語義豐富度的同時,維持像素級的視覺保真度。

邏輯推理與空間智能等方向上,它能夠深度理解物理世界的復雜布局與精細關系;在未來,它還能為機器人提供具身大腦,實現在單一模型閉環內完成從復雜環境感知、邏輯推演到精準任務執行的全過程,為推動技術與產業發展提供重要基礎與關鍵引擎。

本次開源發布的是 SenseNova U1 的輕量版系列 SenseNova U1 Lite。它包含兩個不同規格的模型:

?SenseNova-U1-8B-MoT:基于稠密骨干網絡

?SenseNova-U1-A3B-MoT:基于混合專家(MoE) 骨干網絡

訪問GitHub
https://github.com/OpenSenseNova/SenseNova-U1、Hugging Facehttps://huggingface.co/collections/sensenova/sensenova-u1了解更多信息。我們也將在近期公布詳實的技術報告。

01、極致高效,以小搏大:開源 SOTA,比肩商用

效率,是統一模型架構的核心技術優勢。

傳統多模態模型是把視覺編碼器和語言骨干通過適配器拼接在一起的。它像一個“說不同語言的人組成的工作組”:有人專門看圖,把圖像翻譯為語言,有人專門理解文字,進行推理,有人把結果再翻譯為設計指令,把圖畫出來。每完成一次任務,信息都要在不同成員之間來回傳遞。這個過程雖然可行,但難免會有等待、誤解和信息損耗。為了彌補這些損耗,模型往往需要做得更大才能達到好的效果。

SenseNova U1 是基于統一表征空間構建的,更像是一個從一開始就同時掌握多項技能的人。它不是先看懂圖像、再翻譯成文字、再交給另一個系統理解,而是在同一套“思考方式”里直接處理圖像、文字等不同信息。圖像和語言不再是兩套系統之間的接力,而是在同一個大腦中自然融合。這樣帶來的好處是:信息流轉更快捷,理解更直接,生成更高效。模型不需要依賴單純堆大參數來彌補中間轉換的損耗,而是通過統一的內部表征,把不同模態的信息以更緊湊、更高密度的方式組織起來

簡單來說,傳統架構像是“多人協作、層層轉述”;SenseNova U1 更像是“一個全能大腦,直接理解,直接表達”。少了中間轉譯,信息損耗更低,也能在相對更精簡的模型規模下,實現更強的多模態理解與生成能力。

實驗結果驗證了我們的想法。在涵蓋圖像理解、圖像生成與編輯、空間智能和視覺推理的多項基準測試中,SenseNova U1 Lite均達到同量級開源模型SOTA水平,為統一多模態理解與生成樹立了新的標桿。甚至僅憑8B-MoT的較小規格,就能達到甚至超越部分大型商業閉源模型,展現出全維度多領域的統治力。



圖像理解基準測試結果、圖像生成基準測試結果、視覺推理基準測試結果

以下兩組對比圖更直觀地展現了 SenseNova U1 Lite 在效率上的突出優勢。在通用的圖像生成測試中,SenseNova U1 Lite不但在圖像生成質量上比肩 Qwen-Image 2.0 Pro或 Seedream 4.5 等大型閉源模型,達到商業級水準,還在推理響應速度上有顯著優勢。即使在極具挑戰性、開源模型一直做不好的復雜信息圖生成任務中,SenseNova U1 Lite 也表現出商業級的水準,對復雜信息圖的排版和文字有很強的控制力。



Generation Latency vs. Averaging Performance on OneIG (EN, ZH), LongText (EN, ZH), BizGenEval (Easy, Hard), CVTG and IGenBench



Generation Latency vs. Averaging Performance on Infographic Benchmarks, i.e., BizGenEval (Easy, Hard), and IGenBench

以下實際例子,展現了 SenseNova U1 Lite的商業級復雜信息圖生成能力。











我們正在沿著當前的技術路徑繼續 Scale,計劃在未來推出體量更大的模型。我們相信,基于高效的原生架構,可以以低得多的計算成本達到國際頂尖模型的水平。

02、業內首創:連續性圖文創作輸出

憑借NEO-Unify架構的優勢,SenseNova U1在業內首個實現連續性的圖文創作輸出。并且只需要單次單模型調用,就能輸出更高質量的作品,相比傳統范式,實現了效率的大幅提升。

SenseNova U1 所具備的原生圖文理解生成能力,能天然將圖像和文本底層融合信號完整的保留上下文中,區別于過去只能利用多模型串聯勉強實現,它的圖像間風格具備明顯的高一致性,能在統一表征空間進行高效連貫思考。

下面兩個案例中,SenseNova U1 通過連貫高保真度的圖文交錯思考輸出。

任務一:五分熟牛排做法:SenseNova U1 可以通過思考和規劃產生分步的過程,并且給每一步輸出對應的圖像展示。各個步驟的圖示表現出極高的一致性。



任務二:繪制一個鋼鐵俠圖案:它可以從掃描草稿出發,逐步進行連續創作,最終做出一個完成度很高的圖像。每一步創作的過程對于前一步的結構和細節都做了精準的保持 —— 一個統一表征的共享上下文在其中發揮了關鍵作用。



03、全網開源,即刻可用

開源部署

? GitHub:https://github.com/OpenSenseNova/SenseNova-U1

? Hugging Face:https://huggingface.co/collections/sensenova/sensenova-u1

? 歡迎調用 SenseNova U1 Skill
https://github.com/OpenSenseNova/SenseNova-Skills,瀏覽海量樣例庫,獲取Prompt編寫指南,化繁為簡(繁雜文->有趣圖),讓您的Agent成為信息圖生成高手

在線體驗

? 即將上線辦公小浣熊

我們相信,原生統一的多模態智能是通往 AGI 的必經之路。未來,我們還將持續推動開源生態建設,并發布更大參數規模的 U1 系列模型。迎社區廣大用戶和開發者提出寶貴建議,共同定義智能交互的未來。

*NEO-unify技術博客:
https://www.sensetime.com/cn/news-detail/51170548?categoryId=73

關于商湯

作為人工智能軟件公司,商湯科技以“堅持原創,讓AI引領人類進步”為使命,旨在持續引領人工智能前沿研究,持續打造更具拓展性更普惠的人工智能軟件平臺,推動經濟、社會和人類的發展,并持續吸引及培養頂尖人才,共同塑造未來。

商湯科技擁有深厚的學術積累,并長期投入于原創技術研究,不斷增強行業領先的多模態、多任務通用人工智能能力,涵蓋感知智能、自然語言處理、決策智能、智能內容生成等關鍵技術領域,同時包含AI芯片、AI傳感器及AI算力基礎設施在內的關鍵能力。

商湯科技業務涵蓋生成式AI、視覺AI和創新業務,以高效率、低成本、規模化的AI創新和落地,打通商業價值閉環,引領人工智能進入工業化發展階段。商湯前瞻性打造新型人工智能基礎設施——商湯AI大裝置SenseCore,打通算力、算法和平臺,并在此基礎上建立“商湯日日新SenseNova”大模型及研發體系,以低成本解鎖通用人工智能任務的能力。此外,商湯科技持續領跑計算機視覺市場,商湯方舟 SenseFoundry以多年積累計算機視覺能力,輔以前沿多模態大模型,為國內外各行業提供更加穩定高效的視覺Al支撐。

商湯倡導“發展”的人工智能倫理觀,并積極參與有關數據安全、隱私保護、人工智能倫理道德和可持續人工智能的行業、國家及國際標準的制訂,與多個國內及多邊機構就人工智能的可持續及倫理發展開展了密切合作。商湯《AI可持續發展道德準則》被聯合國人工智能戰略資源指南選錄,并于2021年6月發表,是亞洲唯一獲此殊榮的人工智能公司。

目前,商湯科技已于香港交易所主板掛牌上市。商湯在香港、上海、北京、深圳、成都、杭州、西安、新加坡、曼谷、吉隆坡、利雅得、阿布扎比、迪拜、首爾等地設立辦公室。另外,商湯科技在德國、泰國、印度尼西亞、菲律賓等國家均有業務。更多信息,請訪問商湯科技網站、微信、微博和領英。

媒體聯絡及查詢

商湯科技

郵箱:pr@sensetime.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1951年,戴笠獨子被處決的消息傳到臺灣,蔣介石給毛人鳳下了一條命令

1951年,戴笠獨子被處決的消息傳到臺灣,蔣介石給毛人鳳下了一條命令

曉張說
2026-04-27 07:18:18
尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

詭譎怪談
2025-04-30 22:17:42
55歲"紙片人"魯豫,與小19歲男友同居后變樣,如今她令人大跌眼鏡

55歲"紙片人"魯豫,與小19歲男友同居后變樣,如今她令人大跌眼鏡

觀察鑒娛
2026-04-17 09:43:01
女子稱在霸王茶姬中喝出水銀,當地調查組確認,奶茶中異物系購買人投放,涉案人員已被公安機關控制

女子稱在霸王茶姬中喝出水銀,當地調查組確認,奶茶中異物系購買人投放,涉案人員已被公安機關控制

揚子晚報
2026-04-29 17:59:57
“望月鱔劇毒,誤食必死”,望月鱔比毒蛇還要毒?什么是望月鱔?你們有遇到過嗎?

“望月鱔劇毒,誤食必死”,望月鱔比毒蛇還要毒?什么是望月鱔?你們有遇到過嗎?

農夫也瘋狂
2026-04-26 11:01:20
湖南男子買煙炫富,致使一家三口被滅,2歲兒子在遺體邊躺了兩天

湖南男子買煙炫富,致使一家三口被滅,2歲兒子在遺體邊躺了兩天

莫地方
2026-04-24 00:10:03
成都一河道內發現1米多長的鱷魚?市農業農村局工作人員:多次巡檢暫未發現異常,將持續監測

成都一河道內發現1米多長的鱷魚?市農業農村局工作人員:多次巡檢暫未發現異常,將持續監測

極目新聞
2026-04-29 12:23:55
美軍稱在對伊朗港口封鎖行動中已要求39艘船只掉頭

美軍稱在對伊朗港口封鎖行動中已要求39艘船只掉頭

每日經濟新聞
2026-04-29 08:15:50
斯諾克世錦賽1/4決賽前二階段:趙心童8-8平墨菲,2桿破百5桿50+

斯諾克世錦賽1/4決賽前二階段:趙心童8-8平墨菲,2桿破百5桿50+

側身凌空斬
2026-04-29 05:19:11
外媒稱:中國向俄采購84架卡52武裝直升機,今年就可以交付了!

外媒稱:中國向俄采購84架卡52武裝直升機,今年就可以交付了!

泠泠說史
2026-04-29 19:36:52
小S復工臉上多2顆痣遭網友開玩笑替身經紀人松口了

小S復工臉上多2顆痣遭網友開玩笑替身經紀人松口了

通遼火車站
2026-04-29 13:59:05
知名男歌手自曝:癌細胞擴散了

知名男歌手自曝:癌細胞擴散了

浙江之聲
2026-04-29 08:17:50
卡西利亞斯對穆里尼奧可能回歸皇馬的罕見反應

卡西利亞斯對穆里尼奧可能回歸皇馬的罕見反應

綠茵情報局
2026-04-29 18:18:37
076四川艦海試成功攻克飛翼無人機起降難題

076四川艦海試成功攻克飛翼無人機起降難題

明天見灌裝冰塊
2026-04-26 20:14:26
全線爆發!A股兩大板塊,漲停潮!

全線爆發!A股兩大板塊,漲停潮!

證券時報
2026-04-29 12:40:02
嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

阿訊說天下
2026-04-25 11:15:04
前途無量!中國男足15歲神童爆紅,外媒盛贊:他是天才球員

前途無量!中國男足15歲神童爆紅,外媒盛贊:他是天才球員

國足風云
2026-04-29 14:16:59
斯諾克世錦賽:中國雙星不敗!趙心童苦斗墨菲,吳宜澤4-2被追平

斯諾克世錦賽:中國雙星不敗!趙心童苦斗墨菲,吳宜澤4-2被追平

劉姚堯的文字城堡
2026-04-29 08:51:58
你拋美債,我拋中債!外資紛紛減持中國債,大量資金流向美國?

你拋美債,我拋中債!外資紛紛減持中國債,大量資金流向美國?

混沌錄
2026-04-22 20:55:37
1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

寄史言志
2026-01-04 16:34:31
2026-04-29 21:11:00
財天COVER
財天COVER
專業、有價值的商業觀察!
5838文章數 72590關注度
往期回顧 全部

科技要聞

今晨庭審紀實|馬斯克當庭講述OpenAI被偷走

頭條要聞

男子詐騙熟人350萬 朋友圈發文"我跑路了 你們報案吧"

頭條要聞

男子詐騙熟人350萬 朋友圈發文"我跑路了 你們報案吧"

體育要聞

一場九球狂歡,各路神仙批量下凡

娛樂要聞

馬頔一句話,孫楊媽媽怒罵節目組2小時

財經要聞

蘇州,率先進入牛市

汽車要聞

技術天花板再摸高 全能型的奕境X9首秀

態度原創

藝術
手機
游戲
健康
公開課

藝術要聞

這些女神,竟然都是攝影師切爾尼亞季耶夫的復古作品!

手機要聞

手機版DLSS!三星ENSS跑分超競品15%:卻無游戲適配

《GTA6》發售那天太多人請假!T2老板預測

干細胞治燒燙傷能用了么?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版