无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

NOSE:讓AI學會聞,首個統一分子-受體-語義的三模態嗅覺表征框架

0
分享至



作者 | 論文團隊

編輯丨ScienceAI

視覺有像素,聽覺有頻譜,這些物理量與感知之間存在穩定的映射。但嗅覺截然不同,同一個分子可能激活不同的受體組合,同一種氣味在不同人的嘴里可以是「花香」也可以是「肥皂味」。如何讓 AI 理解「分子聞起來是什么味道」,一直是 AI for Science 領域一個獨特而前沿的挑戰。

近日,廈門大學程俊教授團隊與深勢科技合作,提出了 NOSE(Neural Olfactory-Semantic Embedding)框架。該工作首次將分子結構、嗅覺受體序列和自然語言描述三種模態統一到一個連續的表征空間中,在覆蓋三個感知層次的 11 個下游任務上達到 SOTA,并展現出優異的零樣本泛化能力。研究成果已被自然語言處理頂級會議 ACL 2026 主會錄用。



論文鏈接:https://arxiv.org/abs/2604.10452v1

代碼鏈接:https://github.com/Xianyusyy/NOSE

為什么嗅覺數字化這么難?

嗅覺感知始于氣味分子的揮發擴散,與鼻腔中嗅覺受體的結合,經過神經信號傳導,最終在大腦中形成主觀知覺。這條通路天然涉及三種截然不同的信息,包括分子的三維化學結構、嗅覺受體蛋白的序列特征,以及人類用自然語言給出的感知描述(如「花香」「薄荷味」「奶油感」)。

然而,現有方法從未在統一框架中建模這條完整通路。它們要么僅從分子結構出發預測氣味,要么只學習「分子 - 描述」或「分子 - 受體」的局部對應關系。更根本的問題在于,主流方法將氣味預測視為分類問題,即預測分子屬于「花香」還是「果香」。這種離散化處理不僅破壞了氣味空間的連續性(「薄荷」和「清涼」本應相鄰,分類框架下卻是兩個獨立標簽),還迫使模型丟棄那些對分類「無用」但對分子表征至關重要的結構信息,導致泛化能力受限。

正交注入與連續語義流形



NOSE 的關鍵洞察在于,雖然「分子 - 受體 - 描述」三元組數據幾乎不存在,但「分子 - 受體」和「分子 - 描述」雙模態數據可以分別獲取。分子是兩類數據的唯一交集,因此可以作為中樞,將受體信息和語義信息橋接到統一的表征空間。

但如果將受體特征和語義特征同時注入分子表征,三種模態會不會相互干擾、彼此覆蓋?NOSE 給出的解法是正交注入機制。框架采用「硬正交 + 軟正交」雙重策略,利用 Gram-Schmidt 正交化,將受體和描述的適配器輸出投影到分子表征的正交補空間,在幾何層面保證注入的信息與分子結構線性無關;同時引入軟正交損失,在梯度層面驅動受體分支和描述分支的特征子空間保持互不相關。這樣,受體信息和語義信息以相互獨立的增量疊加在分子表征之上,既不丟失分子結構先驗,又實現了隱式的三模態對齊。

在編碼器選擇上,NOSE 采用 Uni-Mol 捕捉分子三維構象、ESM-2 提取受體序列特征、LoRA 微調的 Qwen3 Embedding 處理氣味描述文本,三大預訓練模型各司其職。

在語義端,NOSE 利用大語言模型 DeepSeek 挖掘 1,086 個氣味描述詞之間的語義近鄰關系(如「檸檬」與「柑橘」、「甜」與「蜂蜜」),將這些語義近鄰標記為「弱正樣本」并賦予中間權重。這一策略將離散的標簽空間轉化為連續的語義流形,有效緩解了對比學習中將語義相近的描述錯誤推遠的「假陰性」問題。經過訓練后,原本在通用文本模型中高度重疊的氣味詞在 PCA 可視化中形成了邊界清晰的語義簇,證明模型成功構建了結構化的氣味語義空間。



全面 SOTA 與零樣本泛化

研究團隊整合了 6 個公開數據集,構建了覆蓋三個認知層次的評估基準,涵蓋基礎感知(檢測閾值、強度、愉悅度)、語義描述(138 類多標簽分類和多維度回歸)、以及混合物感知(二元混合物的強度與愉悅度預測)。在全部 11 個任務的關鍵指標上,NOSE 均取得最優表現。







零樣本檢索

為驗證泛化能力,研究團隊從 PubChem 構建了專用測試集。與標準零樣本設置(分子存在于數據集中但分子 - 描述詞配對未見過)不同,嚴格零樣本要求分子完全不存在于訓練集中。團隊使用分子檢索氣味描述詞,采用百分位排名進行評估(數值越低表示精度越高)。除 PubChem 描述詞外,同義術語的排名也被納入評估。例如對于無味分子,模型將「odorless」排在 Top 1(0.092%),并優先排列 slight、weak、neutral 等術語,表明模型真正理解了分子的感知屬性,而非簡單地與高頻詞對齊。



在受體檢索方面,團隊從文獻中選取具有明確「激活」或「非激活」關系報告的分子 - 受體配對作為測試集。模型在已報道的「激活」配對上表現優異,絕大多數排名位于前 2% 以內,涵蓋大環麝香(MCM)及其他化學家族,顯示出良好的跨家族泛化能力。同時,所有「非激活」樣本的排名顯著靠后,主要分布在 30% 至 80% 區間。這種激活與非激活樣本間的排名分離表明,模型構建的潛在空間有效區分了正負樣本對,具備可靠的生物篩選價值。



意義與展望

NOSE 首次為嗅覺通路上的三種模態搭建了統一的表征空間,使分子結構、受體蛋白和人類感知之間的關聯能夠在一個連續、可檢索、可運算的特征流形中被建模。其核心思想,即通過對比學習統一多模態信息以構建連續且結構化的領域分子表征,不局限于氣味分子場景,同樣有望推廣至電解液溶劑、電鍍添加劑等電化學領域,為 AI 驅動的分子設計提供新的表征范式。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

漢史趣聞
2026-05-21 11:05:32
女子在高鐵靜音車廂連打20分鐘電話 乘客:乘務員一直舉牌勸阻卻被忽視

女子在高鐵靜音車廂連打20分鐘電話 乘客:乘務員一直舉牌勸阻卻被忽視

封面新聞
2026-05-21 12:12:47
繼蘿卜崗后,又出來“祖墳”崗?網友:誰能考上,一輩子有的吹了

繼蘿卜崗后,又出來“祖墳”崗?網友:誰能考上,一輩子有的吹了

社會日日鮮
2026-05-21 09:22:29
胡歌被正式確診為早F晚E,粉絲們都痛心不已

胡歌被正式確診為早F晚E,粉絲們都痛心不已

LULU生活家
2026-05-21 08:43:17
19歲男生凌晨2點多騎摩托被殺害,家屬稱兇手已被判處死刑!兇手:長期被噪音影響,想報復;死者父親:他遇害前一個月未騎摩托

19歲男生凌晨2點多騎摩托被殺害,家屬稱兇手已被判處死刑!兇手:長期被噪音影響,想報復;死者父親:他遇害前一個月未騎摩托

都市快報橙柿互動
2026-05-20 17:07:55
普京回去了,給人一種莫名的傷感!

普京回去了,給人一種莫名的傷感!

達文西看世界
2026-05-21 09:48:14
網戀10天奔現4天領證!安徽離異女子攜子與新婚丈夫露營走紅網絡

網戀10天奔現4天領證!安徽離異女子攜子與新婚丈夫露營走紅網絡

火山詩話
2026-05-21 06:43:02
被判賠三家車企共226萬元,知名汽車博主回應:正籌錢賠償,沒收任何黑心錢!律師:批評性言論須有可信證據支撐

被判賠三家車企共226萬元,知名汽車博主回應:正籌錢賠償,沒收任何黑心錢!律師:批評性言論須有可信證據支撐

每日經濟新聞
2026-05-21 00:51:17
楊梅才剛撲街,荔枝又被曝用藥!添加劑包裝曝光,評論區人心惶惶

楊梅才剛撲街,荔枝又被曝用藥!添加劑包裝曝光,評論區人心惶惶

譚談社會
2026-05-21 11:24:12
我定居日本20年,娶過3個妻子,發現日本的女人都有一個共同特點

我定居日本20年,娶過3個妻子,發現日本的女人都有一個共同特點

千秋文化
2026-05-20 20:33:05
職業運動員究竟有多厲害?網友:在天賦面前,努力一文不值!

職業運動員究竟有多厲害?網友:在天賦面前,努力一文不值!

另子維愛讀史
2026-05-21 08:03:05
A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

趨勢清風俠
2026-05-21 11:13:14
越扒瓜越大!交大女學生吞獎金再添猛料,不止想進體制內這么簡單

越扒瓜越大!交大女學生吞獎金再添猛料,不止想進體制內這么簡單

觀史搜尋著
2026-05-21 05:41:15
恐怖!深圳深中通道雨水倒灌、大面積積水,有網友發帖一針見血

恐怖!深圳深中通道雨水倒灌、大面積積水,有網友發帖一針見血

火山詩話
2026-05-21 16:07:16
爭議!國際足聯重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

爭議!國際足聯重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

念洲
2026-05-21 08:02:07
光速失業!禁足名單內10人目前仍為現役球員或在足球行業從事

光速失業!禁足名單內10人目前仍為現役球員或在足球行業從事

懂球帝
2026-05-21 15:41:08
三大元兇引發跳水 后期策略

三大元兇引發跳水 后期策略

趨勢巡航
2026-05-21 14:55:48
上海工大男生課堂喊殺后續:大四重修生,老師道歉,學校回應來了

上海工大男生課堂喊殺后續:大四重修生,老師道歉,學校回應來了

奇思妙想草葉君
2026-05-21 02:23:55
今天直接跌成股災了

今天直接跌成股災了

曹多魚的財經世界
2026-05-21 15:35:37
為了給中國人留下好印象,一生出訪無數的普京,這次終于破了例

為了給中國人留下好印象,一生出訪無數的普京,這次終于破了例

福建睿平
2026-05-20 14:09:24
2026-05-21 18:11:00
ScienceAI incentive-icons
ScienceAI
關注人工智能與其他前沿技術
1307文章數 227關注度
往期回顧 全部

科技要聞

好到離譜也不夠!英偉達交出816億美元營收

頭條要聞

中紀委連打三"虎":一人被指違規核發機動車號牌

頭條要聞

中紀委連打三"虎":一人被指違規核發機動車號牌

體育要聞

常住人口7000的小鎮,擁有了一支德甲球隊

娛樂要聞

反轉!金秀賢與金賽綸未成年時交往不實

財經要聞

英偉達業績超預!指引再新高仍不夠亮眼

汽車要聞

小鵬正在研發"高達" 融合機器人技術的主動懸架

態度原創

手機
家居
本地
藝術
公開課

手機要聞

蘋果史詩級大改!20周年iPhone測試四曲面屏:告別直屏時代

家居要聞

風格碰撞 個性與藝術

本地新聞

用云錦的方式,打開江蘇南京

藝術要聞

崔雪冬 2026年油畫新作

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版