![]()
編輯丨&
在生活、研究之中,我們觸手可及的每一個物品,無論是可見或是不可見,組成它的化合物,在最初都只是分子猜測。在數目龐大的備選庫中,找到合適的組合滿足需求,這種費時費力的勞動在 AI 的幫助下已經漸漸成為了歷史。
流匹配方法近年來在無條件分子生成領域取得了領先(SOTA),超越了基于分數的擴散模型,但它還無法滿足在屬性引導方面的需要。
來自佛羅里達大學(University of Florida)與紐約大學(New York University)等的團隊開發出一種新方法 PropMolFlow,它結合了五種不同的性質嵌入方法,能夠以約 10 倍速度生成分子候選物,且不影響結果的準確性和化學效度。
相關研究內容以「PropMolFlow: property-guided molecule generation with geometry-complete flow matching」為題,于 2026 年 1 月 22 日發布在《Nature Computational Science》。
論文鏈接:https://www.nature.com/articles/s43588-025-00946-y
重寫生成路徑
PropMolFlow 構建在 FlowMol 架構之上,通過對 NN 參數化的條件速度場積分生成樣本。在這一框架中,模型不再學習逐步去噪,而是直接學習一個時間連續的速度場,描述分子從初始噪聲分布演化到目標分布的全過程。
這其中大致可分為三點:
- SE(3) 等變的速度場建模模型在原子坐標與特征空間中構建嚴格滿足旋轉、平移等變性的向量場,確保生成過程中幾何一致性不被破壞。
- 性質條件作為狀態變量嵌入流場與“后驗引導”不同,性質向量被直接作為條件輸入參與速度場預測,意味著性質在每一個時間點都影響分子演化方向
- 確定性推理路徑流匹配允許使用常微分方程(ODE)求解,生成過程不再是隨機采樣,而是穩定、可控的連續演化。
在所有結構指標上,PropMolFlow 始終優于基線模型。由于流動匹配路徑更短且具有確定性路徑且傳輸最優,PropMolFlow 只需 100 步就能完成所需任務。
QM9 數據集測試
研究團隊認識到,如果生成的分子在化學上無意義或未達到目標特性——即滿足特定需求的所需特性——速度是無用的,因此他們通過與其他模型比較來測試 PropMolFlow 的準確性。
他們將重點放在對 PropMolFlow 生成的,具有靶向性質、分子結構效度和推斷速度分子的能力上。團隊主要通過使用密度泛函理論驗證生成分子,這是一種基于物理的量子化學方法,能夠從基本原理計算分子性質——獨立于任何機器學習模型。
表 1:PropMolFlow 在屬性比對方面的性能。
![]()
PropMolFlow 在與 SOTA 模型競爭中取得了良好的表現。據相關報道,PropMolFlow 生成的分子具有正確的鍵模式和合適的幾何形狀,超過90%。同時,PropMolFlow能夠實現科學家所追求的分子性質,在多種分子性質上表現優于現有最佳方法,且計算速度更快。
此外,論文中還提到,當目標性質偏離訓練分布時,擴散模型往往出現構型塌縮,而 PropMolFlow 的結構統計分布仍與真實分子高度一致。
利用性質引導的分子生成
憑借在幾分鐘內生成數千個化學有效、針對性質的候選物的能力,研究人員可以更快地進行迭代。PropMolFlow 展現的速度與精度結合更能突顯產物的強性質比對性,其外推能力也可借由主動學習或強化學習框架來進一步提升。
不過,目前 PropMolFlow 還無法保證它的產物具有足夠的穩定性。團隊表示,包括上述問題在內的挑戰,已經在嘗試引入新技術解決。在當前分子生成模型逐漸走向真實設計場景的背景下,這種結構—性質—效率同時成立的系統,具備繼續向前擴展的價值。
https://phys.org/news/2026-01-scientists-molecules-discovery.html
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.