![]()
作者丨上智院「女媧」團隊、復旦大學人工智能創新與產業研究院、臨港實驗室等
編輯丨ScienceAI
在數字病理分析中,細胞實例分割是不可或缺的基礎工具,其精度直接影響細胞計數、形態分析、空間組織學研究乃至腫瘤分級等關鍵臨床與科研任務的可靠性。生物組織中細胞往往呈現高密度堆疊和形態多樣的特征,精準區分每個細胞實例的邊界與歸屬,是長期困擾領域的核心挑戰。
然而,面對復雜的病理圖像數據,現有基于檢測、輪廓預測或距離映射的方法雖各有進展,卻普遍存在核心局限,難以滿足臨床對高密度重疊場景的分析需求。
為此,上海科學智能研究院(下稱上智院)與復旦大學、上海交通大學、臨港實驗室等機構聯合提出了首個鄰接感知的細胞實例分割框架(Disco)。該框架從細胞鄰接圖的拓撲本質出發,通過「顯式標記」與「隱式消歧」雙機制協同,實現了從特征學習到分割推理的全流程優化。
實驗表明,Disco 方法在四個異質性數據集上平均性能提升達 2.72%,在高密度挑戰性場景中 PQ 指標更是實現 7.08% 的顯著突破,為開發高性能 AI 輔助病理分析工具開辟了新路徑。
![]()
現有方法的兩大核心局限
既往細胞實例分割方法雖在特定場景取得進展,但面向真實臨床病理圖像時,存在兩個關鍵短板:
一是缺乏全局拓撲建模:主流方法依賴局部像素或幾何信息推斷細胞歸屬,卻忽視了細胞間的全局拓撲約束。檢測類方法受限于邊界框表示和非極大值抑制的啟發式邏輯,在密集重疊場景易漏檢;輪廓類方法對二值化閾值高度敏感,易出現欠分割或過分割;距離映射類方法則依賴復雜后處理重構實例,易導致誤差傳播。這些方法的決策本質上是局部最優,面對高密度細胞集群的全局復雜性時極易失效。
二是著色方案適配性不足:基于圖著色理論的新方法雖具備全局拓撲感知能力,但存在「Goldilocks 困境」:簡單 2 色著色模型基于二分圖假設,無法處理真實細胞圖中普遍存在的奇環結構;而 4 色著色等高階模型又會引入不必要的表征冗余和優化難題,未能匹配真實細胞拓撲的復雜特性。
為解決這些問題,研究團隊從細胞鄰接拓撲分析和臨床病理需求雙重視角出發,構建了 Disco 框架,實現從信號表征到分割推理的全流程優化。該框架與病理分析的知識體系對齊,使得研究者不僅能獲得精準的分割結果,更能通過沖突圖理解細胞拓撲復雜性,推動病理 AI 分析更具可解釋性。
![]()
圖示:主流方法對比。
Disco的雙機制創新設計
Disco 框架以「分而治之」為核心原則,包含「顯式標記」與「隱式消歧」兩大核心機制,形成從拓撲分析到分割優化的完整技術閉環。
1. 顯式標記:拓撲沖突的結構化建模
通過廣度優先搜索(BFS)提取細胞鄰接圖中的最大二分子圖,將絕大多數簡單結構的細胞節點分為兩組,對應兩種基礎顏色;同時將剩余構成「沖突集群」的非二分結構節點整合為沖突集,分配專屬沖突顏色。這種動態適配策略既避免了 2 色著色的理論不足,又摒棄了高階著色的冗余,生成兼具效率與拓撲信息的監督信號。
2. 隱式消歧:連續空間的特征分離
構建解耦的約束損失系統,通過損失組件協同優化,實現復雜場景下的實例清晰分離:
- 基礎損失:分別監督前景、背景分割和多類著色任務,確保細胞區域識別與標記準確性;
- 正則化損失:形成「推拉」機制,抑制二分區域的沖突顏色誤用,同時強化沖突區域的精準預測;
- 鄰接約束損失:通過最小化相鄰細胞實例的特征余弦相似度,在連續特征空間強制實例分離,有效解決沖突節點間的二次沖突問題。
圖示:Disco 雙機制設計。
在四大數據集上超越現有最優方法
研究團隊在 PanNuke、DSB2018、CryoNuSeg 及 GBC-FS 2025 四大異質性數據集開展系統評估,結果全面超越現有最優方法(SOTA),展現出卓越的泛化能力與魯棒性:
平均性能顯著提升:在所有數據集上平均PQ指標提升 2.72%,在高密度復雜場景中 PQ 提升達 7.08%,AJI 指標達到52.09%,較 SOTA 實現 6.91% 的絕對提升,優勢尤為突出;
全場景自適應適配:在完全二分圖的簡單場景中,自動退化為高效2色著色模型,AJI 和 PQ 指標均居首位;在高密度重疊的復雜場景中,仍能精準分離緊密聚類的細胞實例,實現全復雜度場景的高效覆蓋;
多模態高效兼容:在 H&E 染色、熒光成像等不同模態,以及不同組織類型的數據集上均保持領先性能,適配臨床多樣化病理圖像需求;
此外,模型生成的「沖突圖」可直觀呈現不同組織區域的拓撲復雜性,為病理學家量化組織異質性、識別關鍵病變區域提供了全新工具,間接提升了研究的臨床適配價值。
![]()
圖示:細胞拓撲結構分析。
核心組件的必要性驗證
為驗證 Disco 框架中各核心組件的貢獻,研究團隊在高密度復雜場景下開展系統消融實驗,遵循控制變量原則量化各模塊貢獻:
拓撲建模的有效性:純 2 色著色基線模型 AJI 僅 37.85%,而 Disco 的顯式標記策略通過沖突集建模,顯著提升了復雜結構的處理能力;
鄰接約束損失的關鍵作用:單獨加入鄰接約束損失即可使 PQ 指標從 42.57% 提升至 48.26%,證明其在解決二次沖突、強化實例分離中的決定性作用;
動態著色的優勢:相較于靜態 3 色著色和 4 色著色方案,Disco 的「2+1」動態策略避免了表征冗余,PQ 指標分別領先 9.65% 和 7.08%,驗證了其適配真實拓撲的合理性。
這些實驗從多個維度證實,顯式標記與隱式消歧兩大核心機制協同發力,共同支撐了模型在各類場景中的性能突破,尤其在高密度重疊場景中展現出不可替代的優勢。
總結與展望
Disco 的成功,核心在于對病理場景本質的深刻洞察與算法創新——通過精準捕捉細胞鄰接拓撲的核心特征,實現了對不同復雜度場景的自適應高效處理。
首先,模型從細胞鄰接拓撲的物理與生物學特性出發,揭示了真實細胞圖「近二分但富含沖突集群」的核心特征,使特征學習更貼合病理本質;其次,通過動態著色與約束損失系統,將模型流程與病理分析的邏輯深度對齊,在提升性能的同時顯著增強了結果的可解釋性;此外,其對高密度、噪聲場景的適應能力,兼顧了效率與臨床實用性。與此同時,團隊也同步開源了 GBC-FS 2025 數據集與相關評測資源,為后續方法迭代與公平對比提供了統一基準。
該研究不僅為細胞實例分割提供了新的技術路徑,也印證了 AI 醫療發展的關鍵方向——唯有將領域知識與人工智能技術深度融合,才能開發出真正賦能臨床的實用工具。
展望未來,研究團隊計劃將本框架擴展至更多病理分析場景,包括多組織類型適配、多模態病理數據融合等,為智能病理的落地持續注入新動力。
論文信息:
該研究成果已被 ICLR 2026 接收。上智院實習生、復旦大學博士生孫瑞和上智院實習生、上海交通大學博士生楊逸文,為共同第一作者。上智院實習生郭凱與、徐東籬,上海交通大學附屬仁濟醫院博士生劉照南,上智院實習生、復旦大學博士生潘覃,復旦大學人工智能創新與產業研究院(下稱復旦大學 AI3 院)副院長韓麗妹,復旦大學生醫工創新學院教授江雪,為共同作者。上智院生命科學方向負責人、復旦大學 AI3 院研究員程遠,臨港實驗室研究員魏武,上智院生命科學方向研究員蔣晨,為共同通訊作者。
研究項目由星河啟智科學智能開放平臺(https://aistudio.ai4s.com.cn/)和復旦大學 CFFF 智算平臺提供技術和算力支持。
論文題目:Disco: Densely-overlapping Cell Instance Segmentation via Adjacency-aware Collaborative Coloring
論文地址:https://arxiv.org/abs/2602.05420
代碼地址:https://github.com/SR0920/Disco
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.