網易首頁 > 網易號 > 正文申請入駐

上智院等提出鄰接感知細胞實例分割框架Disco，高密度場景PQ提升

2026-02-13 12:17:19　來源: ScienceAI

河北舉報

分享至

作者丨上智院「女媧」團隊、復旦大學人工智能創新與產業研究院、臨港實驗室等

編輯丨ScienceAI

在數字病理分析中，細胞實例分割是不可或缺的基礎工具，其精度直接影響細胞計數、形態分析、空間組織學研究乃至腫瘤分級等關鍵臨床與科研任務的可靠性。生物組織中細胞往往呈現高密度堆疊和形態多樣的特征，精準區分每個細胞實例的邊界與歸屬，是長期困擾領域的核心挑戰。

然而，面對復雜的病理圖像數據，現有基于檢測、輪廓預測或距離映射的方法雖各有進展，卻普遍存在核心局限，難以滿足臨床對高密度重疊場景的分析需求。

為此，上海科學智能研究院（下稱上智院）與復旦大學、上海交通大學、臨港實驗室等機構聯合提出了首個鄰接感知的細胞實例分割框架（Disco）。該框架從細胞鄰接圖的拓撲本質出發，通過「顯式標記」與「隱式消歧」雙機制協同，實現了從特征學習到分割推理的全流程優化。

實驗表明，Disco 方法在四個異質性數據集上平均性能提升達 2.72%，在高密度挑戰性場景中 PQ 指標更是實現 7.08% 的顯著突破，為開發高性能 AI 輔助病理分析工具開辟了新路徑。

現有方法的兩大核心局限

既往細胞實例分割方法雖在特定場景取得進展，但面向真實臨床病理圖像時，存在兩個關鍵短板：

一是缺乏全局拓撲建模：主流方法依賴局部像素或幾何信息推斷細胞歸屬，卻忽視了細胞間的全局拓撲約束。檢測類方法受限于邊界框表示和非極大值抑制的啟發式邏輯，在密集重疊場景易漏檢；輪廓類方法對二值化閾值高度敏感，易出現欠分割或過分割；距離映射類方法則依賴復雜后處理重構實例，易導致誤差傳播。這些方法的決策本質上是局部最優，面對高密度細胞集群的全局復雜性時極易失效。

二是著色方案適配性不足：基于圖著色理論的新方法雖具備全局拓撲感知能力，但存在「Goldilocks 困境」：簡單 2 色著色模型基于二分圖假設，無法處理真實細胞圖中普遍存在的奇環結構；而 4 色著色等高階模型又會引入不必要的表征冗余和優化難題，未能匹配真實細胞拓撲的復雜特性。

為解決這些問題，研究團隊從細胞鄰接拓撲分析和臨床病理需求雙重視角出發，構建了 Disco 框架，實現從信號表征到分割推理的全流程優化。該框架與病理分析的知識體系對齊，使得研究者不僅能獲得精準的分割結果，更能通過沖突圖理解細胞拓撲復雜性，推動病理 AI 分析更具可解釋性。

圖示：主流方法對比。

Disco的雙機制創新設計

Disco 框架以「分而治之」為核心原則，包含「顯式標記」與「隱式消歧」兩大核心機制，形成從拓撲分析到分割優化的完整技術閉環。

1. 顯式標記：拓撲沖突的結構化建模

通過廣度優先搜索（BFS）提取細胞鄰接圖中的最大二分子圖，將絕大多數簡單結構的細胞節點分為兩組，對應兩種基礎顏色；同時將剩余構成「沖突集群」的非二分結構節點整合為沖突集，分配專屬沖突顏色。這種動態適配策略既避免了 2 色著色的理論不足，又摒棄了高階著色的冗余，生成兼具效率與拓撲信息的監督信號。

2. 隱式消歧：連續空間的特征分離

構建解耦的約束損失系統，通過損失組件協同優化，實現復雜場景下的實例清晰分離：

基礎損失：分別監督前景、背景分割和多類著色任務，確保細胞區域識別與標記準確性；
正則化損失：形成「推拉」機制，抑制二分區域的沖突顏色誤用，同時強化沖突區域的精準預測；
鄰接約束損失：通過最小化相鄰細胞實例的特征余弦相似度，在連續特征空間強制實例分離，有效解決沖突節點間的二次沖突問題。

圖示：Disco 雙機制設計。

在四大數據集上超越現有最優方法

研究團隊在 PanNuke、DSB2018、CryoNuSeg 及 GBC-FS 2025 四大異質性數據集開展系統評估，結果全面超越現有最優方法（SOTA），展現出卓越的泛化能力與魯棒性：

平均性能顯著提升：在所有數據集上平均PQ指標提升 2.72%，在高密度復雜場景中 PQ 提升達 7.08%，AJI 指標達到52.09%，較 SOTA 實現 6.91% 的絕對提升，優勢尤為突出；

全場景自適應適配：在完全二分圖的簡單場景中，自動退化為高效2色著色模型，AJI 和 PQ 指標均居首位；在高密度重疊的復雜場景中，仍能精準分離緊密聚類的細胞實例，實現全復雜度場景的高效覆蓋；

多模態高效兼容：在 H&E 染色、熒光成像等不同模態，以及不同組織類型的數據集上均保持領先性能，適配臨床多樣化病理圖像需求；

此外，模型生成的「沖突圖」可直觀呈現不同組織區域的拓撲復雜性，為病理學家量化組織異質性、識別關鍵病變區域提供了全新工具，間接提升了研究的臨床適配價值。

圖示：細胞拓撲結構分析。

核心組件的必要性驗證

為驗證 Disco 框架中各核心組件的貢獻，研究團隊在高密度復雜場景下開展系統消融實驗，遵循控制變量原則量化各模塊貢獻：

拓撲建模的有效性：純 2 色著色基線模型 AJI 僅 37.85%，而 Disco 的顯式標記策略通過沖突集建模，顯著提升了復雜結構的處理能力；

鄰接約束損失的關鍵作用：單獨加入鄰接約束損失即可使 PQ 指標從 42.57% 提升至 48.26%，證明其在解決二次沖突、強化實例分離中的決定性作用；

動態著色的優勢：相較于靜態 3 色著色和 4 色著色方案，Disco 的「2+1」動態策略避免了表征冗余，PQ 指標分別領先 9.65% 和 7.08%，驗證了其適配真實拓撲的合理性。

這些實驗從多個維度證實，顯式標記與隱式消歧兩大核心機制協同發力，共同支撐了模型在各類場景中的性能突破，尤其在高密度重疊場景中展現出不可替代的優勢。

總結與展望

Disco 的成功，核心在于對病理場景本質的深刻洞察與算法創新——通過精準捕捉細胞鄰接拓撲的核心特征，實現了對不同復雜度場景的自適應高效處理。

首先，模型從細胞鄰接拓撲的物理與生物學特性出發，揭示了真實細胞圖「近二分但富含沖突集群」的核心特征，使特征學習更貼合病理本質；其次，通過動態著色與約束損失系統，將模型流程與病理分析的邏輯深度對齊，在提升性能的同時顯著增強了結果的可解釋性；此外，其對高密度、噪聲場景的適應能力，兼顧了效率與臨床實用性。與此同時，團隊也同步開源了 GBC-FS 2025 數據集與相關評測資源，為后續方法迭代與公平對比提供了統一基準。

該研究不僅為細胞實例分割提供了新的技術路徑，也印證了 AI 醫療發展的關鍵方向——唯有將領域知識與人工智能技術深度融合，才能開發出真正賦能臨床的實用工具。

展望未來，研究團隊計劃將本框架擴展至更多病理分析場景，包括多組織類型適配、多模態病理數據融合等，為智能病理的落地持續注入新動力。

論文信息：

該研究成果已被 ICLR 2026 接收。上智院實習生、復旦大學博士生孫瑞和上智院實習生、上海交通大學博士生楊逸文，為共同第一作者。上智院實習生郭凱與、徐東籬，上海交通大學附屬仁濟醫院博士生劉照南，上智院實習生、復旦大學博士生潘覃，復旦大學人工智能創新與產業研究院（下稱復旦大學 AI3 院）副院長韓麗妹，復旦大學生醫工創新學院教授江雪，為共同作者。上智院生命科學方向負責人、復旦大學 AI3 院研究員程遠，臨港實驗室研究員魏武，上智院生命科學方向研究員蔣晨，為共同通訊作者。

研究項目由星河啟智科學智能開放平臺（https://aistudio.ai4s.com.cn/）和復旦大學 CFFF 智算平臺提供技術和算力支持。

論文題目：Disco: Densely-overlapping Cell Instance Segmentation via Adjacency-aware Collaborative Coloring

論文地址：https://arxiv.org/abs/2602.05420

代碼地址：https://github.com/SR0920/Disco

聲明：包含AI生成內容

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.