*僅供醫(yī)學專業(yè)人士閱讀參考
將列線圖與先進的機器學習技術結合形成混合模型能夠提升患者個體化管理水平,有望為伴“雙重浸潤”的胃癌病例臨床決策提供參考。
胃癌仍然是全球重大的健康問題。得益于醫(yī)療技術的創(chuàng)新,包括內鏡、手術、放療、化療和免疫治療在內的多種有效治療手段已顯著改善了胃癌患者的預后。在這些治療方式中,根治性切除術作為一種徹底切除腫瘤的手術方法,是可切除非轉移性胃癌患者的首選治療方案。對于手術切除而言,血管和神經浸潤的存在是重要預后指標之一,然而,精確預測伴“雙重浸潤”胃癌病例的預后仍然是一項艱巨挑戰(zhàn)。為滿足這些復雜病例對預后預測的迫切需求,近期一項研究采用機器學習等技術構建預測模型 [1]。該模型的結果與列線圖及第8版AJCC TNM分期系統(tǒng)進行了比較,顯示預測準確性顯著提升。基于精準醫(yī)學原則,這些列線圖與風險分層模型有望優(yōu)化胃癌術后治療策略,為個性化照護提供路線,從而潛在提升患者結局。
患者與方法
數(shù)據來源與研究人群
研究數(shù)據收集始于2005年5月1日,持續(xù)至2022年12月31日。胃癌診斷均經組織學確認,患者具備詳細臨床病理學信息。收集符合特定標準患者的隨訪數(shù)據,排除患有全身性腫瘤、臨床信息不完整或有既往惡性腫瘤史的患者。腫瘤分期基于AJCC第8版TNM分類。研究方法流程見圖1。參與者被隨機分配到訓練隊列(70%患者)用于算法開發(fā),以及驗證隊列(30%患者)用于測試。人口學資料采用頻數(shù)、百分比、均數(shù)和標準差進行描述。
圖1 胃癌訓練隊列和驗證隊列的研究人群入組流程圖
預測變量
機器學習和列線圖模型的變量涵蓋了常用的數(shù)據類別,包括人口統(tǒng)計學、實驗室檢查結果、手術細節(jié)、腫瘤屬性、蛋白質組學數(shù)據和病理報告。研究分析了多種可能與手術結局相關的因素,涵蓋性別、患者手術時年齡、血管和神經浸潤存在與否、腫瘤分期(pT分期)、陽性淋巴結數(shù)目、Lauren分型、腫瘤最大直徑、胃切除術式、腫瘤生物標志物表達(AE1/AE3, CK20, CDX-2, SATB-2, SYN, CGA, CD56, PTEN, FHIT, MLH1, PMS2, Her-2, MSH2, MSH6)以及無復發(fā)生存期(RFS)。
研究終點
本研究模型預測的主要終點是RFS,定義為從手術到疾病復發(fā)(包括局部和遠處復發(fā))或任何原因死亡的時間。
機器學習模型
本研究中采用了三種先進的生存機器學習算法,包括隨機生存森林(RSF)、決策生存樹(DST)和極限梯度提升(XG Boosting)。為了優(yōu)化這些算法的性能,研究在廣泛的參數(shù)設置范圍內進行了隨機搜索,隨后采用十倍交叉驗證方法來準確估計模型性能,目標是最大化一致性指數(shù)(c-index)。
列線圖開發(fā)
本研究旨在通過整合經Cox回歸分析確定的變量,構建能夠準確預測RFS的列線圖。為確保這些列線圖的可靠性,研究團隊對多個RFS相關參數(shù)進行了Cox回歸分析,并重復該過程10,000次以進行驗證。
模型性能、擬合度與驗證評估
采用區(qū)分度、校準度和決策曲線分析(DCA)評估模型性能。校準度用于評估模型預測事件的準確性,通過Brier評分確定。此外,還進行了敏感性分析以探討數(shù)據集大小與模型性能的關系。
研究結果
隊列特征
本研究共納入559例患者。值得注意的是,男性胃癌發(fā)病率約為女性的五倍,這一趨勢在訓練隊列和驗證隊列中均觀察到。患者群體的平均年齡在訓練隊列中為58.94 ± 10.11歲,在驗證隊列中為58.81 ± 9.74歲。平均腫瘤最大直徑在訓練隊列中為5.92 ± 2.51 cm,在驗證隊列中為5.92 ± 2.37 cm。中位隨訪時間為61個月(IQR:12–120個月),共記錄到184例(32.9%)患者發(fā)生復發(fā)事件。訓練隊列和驗證隊列的復發(fā)率分別為32.2%和34.5%。盡管存在這些細微差異,兩組的總生存期和RFS率具有可比性。所有研究變量在訓練隊列和驗證隊列中分布均衡,P值均大于0.05,表明數(shù)據集平衡良好。患者分布情況為:訓練隊列388例,驗證隊列171例,反映了臨床病理特征、隨訪時間和蛋白質組學特征的均衡性。
機器學習模型評估與驗證
機器學習模型表現(xiàn)出不同程度的區(qū)分能力,其中隨機生存森林(RSF)表現(xiàn)最佳,c-index為0.791,其次是XG Boosting(0.788)和決策生存樹(DST)模型(0.728)。曲線下面積(AUC)分析證實了機器學習模型增強的判別能力,RSF再次領先(AUC為0.861),其次是XG Boosting(0.852)和DST(0.771)。考慮到患者病情不斷變化的性質,研究評估了模型在不同時間點的性能。觀察到預測準確性隨時間推移逐漸減弱。對于所有機器學習模型,c-index在60個月時達到峰值,同時預測誤差最小,尤其是RSF和XG Boosting。使用綜合Brier評分評估了60個月內的模型校準度,結果顯示所有模型均具有值得稱贊的校準度,評分極低(均<0.1),表明模型在預測中隨時間推移保持了可靠的穩(wěn)定性。
在所有模型中,預測伴“雙重浸潤”胃癌RFS的前三個重要特征保持一致:陽性淋巴結數(shù)目、腫瘤最大直徑和年齡。鑒于RSF模型的卓越準確性,研究分析集中于此模型。結果顯示,陽性淋巴結數(shù)目、腫瘤最大直徑和年齡是RSF模型中最重要的預測特征。此外,敏感性分析表明,若從模型中排除陽性淋巴結數(shù)目,將導致平均c-index下降0.06。
研究通過決策曲線分析(DCA)探討了不同模型的效用。結果表明,DST模型提供的收益相對較低。相比之下,RSF模型在訓練隊列和驗證隊列中均顯示出最顯著的凈收益優(yōu)勢。RSF模型在風險閾值介于0.2至0.5之間的表現(xiàn)尤其令人印象深刻——校準曲線說明了所有機器學習模型的預測結果與實際結果之間存在強烈的對應關系。
機器學習模型的敏感性分析
為確定構建有效預測模型所需的最佳樣本量,研究進行了敏感性分析,以探討數(shù)據集大小如何影響模型性能。結果顯示,對于兩個隊列,隨著訓練樣本量的變化,準確度分數(shù)存在波動。在評估的模型中,與RSF和DST相比,XG Boosting在敏感性分析中均提供了最高的性能。同樣明顯的是,訓練隊列的敏感度分數(shù)均高于驗證隊列。例如,對于XG Boosting,訓練隊列的敏感度分數(shù)范圍為0.81至0.87,驗證隊列為0.68至0.76。類似地,DST在訓練隊列的敏感度分數(shù)范圍為0.82至0.95,驗證隊列為0.64至0.67。相比之下,RSF在訓練隊列的敏感度分數(shù)范圍為0.85至0.88,驗證隊列為0.69至0.75。此外,隨著樣本量的增加,顯示機器學習模型的預測準確性有所提高,這表明更多的數(shù)據會帶來更穩(wěn)定的模型性能。
設計與驗證用于預測RFS的列線圖模型
研究構建了一個列線圖,用于評估影響胃癌患者RFS的決定因素。該列線圖整合了通過RSF算法確定的九個關鍵變量,包括患者性別、年齡、陽性淋巴結數(shù)目、胃切除術式、腫瘤位置、分子標志物CD56和FHIT的表達譜、Ki67水平以及腫瘤最大直徑。將這些因素整合到列線圖模型中,有助于準確預測3年和5年RFS概率。該模型整合了多種預后因素,可用于估算患者在特定時間點(如3年、5年)的RFS概率,在訓練組中對列線圖性能的評估顯示其具有較強預測能力,C-index為0.654(95% CI: 0.615-0.692),超過了AJCC第8版TNM分期(C-index: 0.543, 95% CI: 0.517–0.569)。內部和外部校準曲線顯示預測結果與觀察結果之間存在穩(wěn)健的相關性。內部驗證期間的時依ROC分析再次確認了列線圖卓越的判別能力,3年RFS的AUC值為0.686(95%CI: 0.69-0.801),5年RFS的AUC值為0.749(95%CI: 0.666–0.838)。外部驗證也產生了有希望的結果,3年RFS的AUC值為0.635(95% CI: 0.559–0.761),5年RFS的AUC值為0.644(95% CI: 0.519–0.824)。
決策分析曲線比較了列線圖與AJCC第8版TNM分期在預測5年和3年RFS方面的臨床效用。列線圖的內部驗證C-index為0.644(95% CI: 0.606–0.682),優(yōu)于AJCC第8版TNM分期(C-index: 0.543, 95% CI: 0.517–0.569)。外部驗證也顯示了列線圖的優(yōu)越性,C-index為0.626(95% CI: 0.564–0.689),而AJCC第8版TNM分期為0.542(95% CI: 0.509–0.575)。這些更高的C-index值凸顯了列線圖卓越的預測準確性。
基于列線圖預測RFS的風險分層系統(tǒng)評估
研究使用復雜的列線圖技術對每位患者進行分類和評分,以確定其疾病復發(fā)風險。X-tile軟件在初始的405例患者隊列中確定了最佳的RFS評分截斷值。隨后的Log-rank檢驗分析闡明了不同風險類別之間生存結局的差異。應用預后列線圖有助于分配總體評分,從而以165.66為閾值,將559名參與者清晰地劃分為低風險組和高風險組。低風險組(評分≤165.66)包括訓練集89例和驗證集40例,而高風險組(評分>165.66)包括訓練集299例和驗證集131例。總隊列、訓練隊列和驗證隊列的RFS生存曲線p值均 < 0.001,表明結果具有統(tǒng)計學顯著性。在整個隊列、訓練隊列和驗證隊列中,低風險組的中位生存期分別為77個月、77個月和51個月,而高風險組分別為24個月、24個月和24個月。風險類別之間預后的顯著差異進一步證明了風險分層模型的有效性。
總結與討論
研究結果表明,RSF算法展現(xiàn)出優(yōu)異的預測準確性,優(yōu)于其他算法方法。該模型在使用RSF技術時辨別患者結局的能力,顯示出超越其他機器學習模型的區(qū)分度水平。這種增強的性能可能歸因于獨特的“雙重浸潤”特征,它模擬了血管和神經浸潤同時存在的情況,這種情況通常預示著較差的臨床生存結局,且其預后難以準確預測。當將RSF與傳統(tǒng)機器學習模型進行比較時,很明顯基于列線圖的方法在識別高危患者方面具有顯著優(yōu)勢。該工具為臨床醫(yī)生提供了寶貴的資產,提供了可以指導術后監(jiān)測策略和個性化治療干預的深刻見解。
機器學習和列線圖方法在預測醫(yī)學結局方面各有優(yōu)劣。具體而言,機器學習算法在準確性和區(qū)分能力方面表現(xiàn)出色,但往往無法有效識別風險最高的患者。相反,列線圖模型擅長進行風險分層,但缺乏機器學習技術的精確性。綜合來看,最佳策略或許是利用兩種方法的互補性:機器學習模型(如RSF)能提供更高的預測精度,而列線圖則更適用于臨床環(huán)境中的快速風險分層。二者結合使用,可為臨床決策提供更全面的信息。
盡管前景廣闊,但必須考慮當前研究的局限性。一個重要的局限性是模型僅使用單一醫(yī)療機構的數(shù)據進行開發(fā)和驗證。這可能會限制模型的更廣泛適用性。為了解決這個問題,需要在多個醫(yī)療中心驗證我們的發(fā)現(xiàn),以確定模型的穩(wěn)健性。此外,研究未按疾病分期進行亞組分析,可能影響模型在不同階段患者中的預測精度。最后,必須指出的是,本研究中探索的所有腫瘤標志物僅進行了定性分析,缺乏定量分析。在未來的研究中,根據患者的疾病階段進行分層將有助于優(yōu)化模型的預測能力。
參考文獻:
[1]Hao Z, et al. Harnessing the machine learning and nomogram models: elevating prognostication in nonmetastatic gastric cancer with "double invasion" for personalized patient care. Eur J Med Res. 2025 Jun 23;30(1):517.
審批編號:CN-171212 有效期至:2026-11-07
本材料由阿斯利康提供,僅供醫(yī)療衛(wèi)生專業(yè)人士參考
*此文僅用于向醫(yī)療衛(wèi)生專業(yè)人士提供科學信息,不代表平臺立場。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.