陈晨基于贝叶斯网络的肝内胆管癌根治术后生

陈晨,吴予涵,张景玮,等.基于贝叶斯网络的肝内胆管癌根治术后生存预测模型的初步探讨[J].中华外科杂志,,59(4):-.

基于贝叶斯网络的肝内胆管癌根治术后生存预测模型的初步探讨

陈晨 李起 耿智敏

{西安医院肝胆外科}

吴予涵 张景玮 司书宾 蔡志强

{西北工业大学机电学院工业工程系}

邱应和

{海军军医医院胆道外科}

吴泓

{医院肝脏外科与肝脏移植中心}

宋天强

{医院肝胆肿瘤科}

何宇

{陆军医院肝胆外科}

毛先海

{医院肝胆外科}

翟文龙

{医院肝胆胰外科}

程张军

{医院肝胆外科}

李敬东

{医院肝胆外科}

汤朝晖

{上海交通大医院普外科}

肝内胆管癌是肝脏第二常见的原发性恶性肿瘤,近年来其发病率呈上升趋势[1]。肝内胆管癌的早期症状不明显,目前根治性切除仍然是其最主要的治疗手段[2],患者术后5年生存率为20%~35%[3,4]。影响肝内胆管癌切除预后的因素较多,如CA19-9、TNM分期、肿瘤最大径、肿瘤分化程度、肝内转移、淋巴转移、血管侵犯及脉管侵犯等[4,5,6]。传统的TNM分期可对患者进行简单分层,以评估患者预后,但未纳入肿瘤标志物、肿瘤分化程度等其他影响预后的因素。因此,明确肝内胆管癌患者的预后因素,建立准确的生存预测模型,对于肝内胆管癌患者的预后评估及治疗方案选择具有重要的指导意义。

列线图模型是目前应用较多的生存预测模型,该模型具有简洁、便于应用的优势。根据Wang等[3]的研究报告,基于癌胚抗原(carcinoembryonicantigen,CEA)、CA19-9、血管侵犯、淋巴结转移、局部侵犯、肿瘤最大径及肿瘤数目的列线图模型的一致性指数(concordanceindex,C-index)可达0.74,优于传统的TNM分期系统。近年来,机器学习方法在医学领域得到初步应用,贝叶斯网络、决策树、支持向量机、随机森林等方法已用于疾病的鉴别、辅助诊断及生存预测[7,8,9,10]。我们既往已将贝叶斯网络模型应用于进展期胆囊癌患者的生存预测与治疗决策指导[11]。在此基础上,我们进一步探讨基于贝叶斯网络建立肝内胆管癌生存预测模型的可行性及应用价值。

资料与方法

一、纳入标准(1)因肝内胆管癌行意向性根治性切除术;(2)术后病理学检查结果为腺癌;(3)不伴其他恶性肿瘤;(4)术前、术中未行其他抗肿瘤治疗;(5)随访资料完整;(6)临床病理学资料完整。二、一般资料通过统一发放病例报告表回顾性收集年1月至年12月于国内10医院肝胆外科中心行意向性根治性切除术的肝内胆管癌患者的临床病理学资料。共回收例病例报告表,根据纳入标准,本研究最终共纳入例患者。上海交通大医院11例、医院2例、海军军医医院例、医院40例、医院10例、医院例、天津医院72例、陆军医院47例、医院11例、西安医院98例。男性例,女性例;年龄58(14)岁。例(22.5%)合并肝内胆管结石,例(27.7%)合并慢性病毒性肝炎。本研究通过上海交通大医院伦理委员会审批(批号:XHEC-JDYXY--)。患者及家属术前均签署手术知情同意书。三、结局指标及研究变量以患者总体生存时间为主要结局指标,选取生存时间、人口学特征(年龄、性别)、临床病理学特征(有无肝炎、有无结石、有无黄疸、分化程度、有无血管侵犯、有无脉管侵犯、有无神经浸润、有无肝包膜侵犯、T分期、N分期、肿瘤位置、有无子灶、切缘情况、术后辅助治疗情况、甲胎蛋白、CEA、CA19-9)共20个指标进行分析。因各中心手术标准及方式差异较大,本研究不涉及具体手术方式对预后的影响,采用切缘情况代表手术特征。将连续变量年龄以50岁、50~70岁、70岁进行离散化分组处理,甲胎蛋白、CEA及CA19-9分别以μg/L、10μg/L及U/ml为分割点进行离散化分组处理。四、随访方法采用门诊和电话方式进行随访,了解患者术后生存情况。五、统计学方法采用SPSS22.0统计学软件进行数据处理及生存分析。计数资料使用χ2检验。正态分布的计量资料以x±s表示,其比较采用独立样本t检验;非正态分布的计量资料以M(QR)表示,其比较使用非参数检验。采用Kaplan-Meier法计算生存率,生存分析中单因素分析采用Log-rank检验,多因素分析使用Cox回归分析。以P0.05为差异有统计学意义。六、生存预测模型建立方法全部数据首先根据8∶2比例经过随机抽样分为测试集和验证集,分别用于建立生存预测模型和内部验证。贝叶斯网络分别采用树增益朴素贝叶斯(treeaugmentednaiveBayes,TAN)算法及朴素贝叶斯算法,应用BayesiaLab软件建模。因患者的随访时间存在差异,选取12个月作为目标时间截点,建立意向性根治切除术后1年的生存预测模型。分别建立基于19个临床病理学因素的TAN模型,基于单因素分析得出的预后因素的TAN模型及基于Cox多因素分析得出的独立预后因素的朴素贝叶斯网络模型。同时使用R语言,基于Cox多因素分析得出的独立预后因素建立列线图模型,并计算C-index。绘制各个生存模型的受试者工作特征曲线,计算曲线下面积(areaundercurve,AUC),以评价模型的优劣性。

结果

一、生存情况及预后影响因素随访截至年6月30日,共例(63.6%)患者因肝内胆管癌死亡。总体中位生存时间为25.0个月,1、3、5年累积总体生存率分别为76.6%、37.9%、21.0%(图1)。图1 肝内胆管癌患者根治性切除术后的总体生存曲线单因素分析结果显示,性别、术前有无黄疸、肿瘤分化程度、有无血管侵犯、有无脉管侵犯、有无肝包膜侵犯、T分期、N分期、切缘情况、有无结石、CEA水平、CA19-9水平是患者的预后因素(P值均0.05)(表1)。进一步的Cox多因素回归模型分析结果显示,性别、肿瘤分化程度、有无肝包膜侵犯、T分期、N分期、有无结石及CA19-9水平为患者的独立预后因素(P值均0.05)(表2)。表1 影响肝内胆管癌患者预后的单因素分析结果表2 影响肝内胆管癌患者预后的多因素分析结果二、生存预测模型χ2检验结果证实,建模组和验证组数据之间性别分布、肿瘤分化程度、有无肝包膜侵犯、T分期、N分期、有无结石及CA19-9水平等临床病理学因素的差异均无统计学意义(P值均0.05)。采用BayesiaLab软件建立贝叶斯网络模型,首先纳入表1中的19个临床病理学因素建立TAN模型(图2A),该模型的AUC为74.5%(图2B);进一步纳入单因素分析得出的12个预后因素建立TAN模型(图3A),该模型的AUC为74.0%(图3B);最后依据Cox回归分析结果,纳入7个独立预后因素建立朴素贝叶斯网络模型(图4A),该模型的AUC为79.5%(图4B)。图2 基于19个临床病理学因素建立的TAN模型(2A)和列线图生存预测模型的受试者工作特征曲线(2B)图3 基于12个预后因素建立的TAN模型(3A)和列线图生存预测模型的受试者工作特征曲线(3B)图4 基于7个独立预后因素建立的朴素贝叶斯网络模型(4A)和列线图生存预测模型的受试者工作特征曲线(4B)图5 基于7个独立预后因素建立的列线图模型(5A)和列线图生存预测模型的受试者工作特征曲线(5B)依据Cox多因素分析结果和7个独立预后因素建立列线图生存预测模型(图5A),该模型的AUC为78.8%(图5B),C-index为0.73。

讨论

列线图是目前肝内胆管癌患者的主要生存预测模型,Wang等[3]基于单中心例患者数据建立的包括CEA、CA19-9、肿瘤最大径、肿瘤数目、血管侵犯、淋巴结转移及直接侵犯(局部肝外转移)7个因素的列线图模型,其C-index为0.74。Hyder等[12]报告了13个中心例肝内胆管癌患者的资料,建立的包括年龄、肿瘤最大径、肿瘤数目、肝硬化、血管侵犯(包括微血管侵犯和大血管侵犯)和淋巴结状态的列线图模型,其C-index为0.69。两个模型不仅在自身队列数据中有良好的预测能力,而且Doussot等[13]使用例肝内胆管癌患者资料对这两个列线图模型进行外部数据验证,结果亦显示两个模型的精确度高于TNM分期。我们依据性别、分化程度、肝包膜侵犯、T分期、N分期、结石及CA19-9共7个独立预后因素建立的列线图的AUC为78.8%,C-index为0.73,亦显示出较好的预测能力。贝叶斯网络作为一种将概率论与图论相结合用以处理不确定性推理和数据分析的有效工具,通过构建有向无环图,结合条件概率,可对问题结构进行分析,同时也可以通过图论的语言来揭示因素间的因果结构。目前,基于贝叶斯网络的肿瘤生存预测模型已显示了较高的准确率[10,11]。我们将贝叶斯网络应用于肝内胆管癌患者的生存预测,结果显示,基于7个独立预后因素建立的朴素贝叶斯网络模型的AUC为79.5%,略高于同组数据所建立的列线图模型。此外,基于19个临床病理学因素建立的TAN模型的AUC为74.5%,基于单因素分析得出的12个预后因素建立的TAN模型的AUC为74.0%,基于不同变量的贝叶斯网络模型均显示了较好的预测能力。通过树增益贝叶斯网络模型可发现变量之间的条件依存关系,本研究结果显示,N分期与CA19-9、神经浸润之间关系密切,肝炎与肿瘤位置相关。与树增益贝叶斯网络比较,朴素贝叶斯模型假设属性之间相互独立。因此,我们基于独立预后因素采用朴素贝叶斯算法进行建模,其AUC高于其他两种TAN模型。通常认为,在因素比较多或因素之间相关性较大时,树增益贝叶斯模型较朴素贝叶斯的有效率更高,而在属性相关性较小时,朴素贝叶斯模型的性能最好[14]。因此,在实际应用中,可根据具体数据情况选择不同的贝叶斯模型以达到最佳预测能力。近年来贝叶斯网络在医学相关领域的应用逐步深入,不仅用于肿瘤患者的个性化生存预测[15,16],还用于肿瘤分子分型[17]、治疗效果评估[18]、诊疗决策[19]等,在Meta分析中的应用更进一步拓展了其在医学研究中的价值[20,21,22]。我们曾基于贝叶斯网络及重要度理论建立了胆囊癌生存预测评分模型,依此对患者的治疗决策进行指导[11]。基于既往研究及本组数据结果,我们认为,贝叶斯网络所建立的生存预测模型具有以下优势:(1)模型以树状图的方式展现,简便直观。(2)建模因素不局限于独立预后因素,可纳入非线性数据,如肿瘤位置、肝炎这类单因素分析无阳性结果的数据。在数据量足够大的情况下,尽可能纳入更多的因素,有望建立更贴近真实世界的预测模型。(3)可以发现变量之间的关联关系,如模型中显示的CA19-9、血管侵犯与N分期之间的关联性。(4)贝叶斯网络的推理功能,有望解决争议问题及指导治疗决策,包括手术指征选择,淋巴结清扫及辅助治疗方案选择。(5)允许缺失值,贝叶斯网络可通过人群数据、基于概率对个体具体缺失数据进行推测,从而做出预测[23]。就本研究结果而言,以图形表示的贝叶斯网络生存模型在实际应用中并不如列线图便捷,为此我们正致力于建立基于贝叶斯网络模型相关的线上应用程序,建立生存、并发症、病因等相关模型,以便进一步进行模型的推广与验证,并期望通过模型结果为治疗决策提供依据。在本研究中,由于多中心回顾性研究所带来的数据缺失及数据量等因素,未纳入肿瘤形态、肿瘤体积、非腺癌患者资料,在扩大数据量、提高数据质量后有望进一步提高模型的准确性及优化模型。因此,建立规范的、全面的疾病数据库显得尤为重要。基于医疗大数据进行数学建模,利用人工智能等学习方法,将有可能实现肝内胆管癌精准的生存预测及个体化治疗方案的优化选择。我们在后续研究中,也将通过前瞻性研究进一步验证模型的应用价值,并通过机器学习不断进行模型的自我完善,为肝内胆管癌的个体化治疗决策提供依据。

参考文献

(在框内滑动手指即可浏览)

[1]RizviS,KhanSA,HallemeierCL,etal.Cholangiocarcinoma-evolvingconceptsandtherapeuticstrategies[J].NatRevClinOncol,,15(2):95-.DOI:10./nrclinonc...

[2]AltmanAM,KizyS,MarmorS,etal.CurrentsurvivalandtreatmenttrendsforsurgicallyresectedintrahepaticcholangiocarcinomaintheUnitedStates[J].JGastrointestOncol,,9(5):-.DOI:10./jgo..11.06.

[3]WangY,LiJ,XiaY,etal.Prognosticnomogramforintrahepaticcholangiocarcinomaafterpartialhepatectomy[J].JClinOncol,,31(9):1-.DOI:10./JCO..41..

[4]JiangWJ,ZengZC,TangZY,etal.Aprognosticscoringsystembasedonclinicalfeaturesofintrahepaticcholangiocarcinoma:theFudanscore[J].AnnOncol,,22(7):-.DOI:10./annonc/mdq.

[5]NathanH,AloiaTA,VautheyJN,etal.Aproposedstagingsystemforintrahepaticcholangiocarcinoma[J].AnnSurgOncol,,16(1):14-22.DOI:10./s---z.

[6]RaoofM,DumitraS,ItuartePHG,etal.Developmentandvalidationofaprognosticscoreforintrahepaticcholangiocarcinoma[J].JAMASurg,,(5):e170.DOI:10.1/jamasurg..0.

[7]高文静,梁会营,钟微,等.基于机器学习的新生儿坏死性小肠结肠炎的鉴别诊断[J].中国数字医学,,14(3):50-52,69.DOI:10./j.issn.-..03..

[8]雷炳业,潘嘉瑜,吴逢春,等.基于机器学习的神经精神疾病辅助诊断研究进展[J].中国医学物理学杂志,,37(2):-.DOI:10./j.issn.5-X..02..

[9]李琳,杨日东,王哲,等.基于机器学习方法的原发性肝癌患者预后预测研究[J].中国数字医学,,14(3):34-37.DOI:10./j.issn.-..03..

[10]尹玢璨,辛世超,张晗,等.基于SEER数据库应用贝叶斯网络构建亚洲肿瘤患者预后模型—以非小细胞肺癌为例[J].数据分析与知识发现,,1(2):41-46.

[11]汤朝晖,耿智敏,陈晨,等.基于贝叶斯网络的进展期胆囊癌生存预测模型多中心临床研究[J].中华外科杂志,,56(5):-.DOI:10./cma.j.issn.-..05..

[12]HyderO,MarquesH,PulitanoC,etal.Anomogramtopredictlong-termsurvivalafterresectionforintrahepaticcholangiocarcinoma:anEasternandWesternexperience[J].JAMASurg,2,(5):-.DOI:10.1/jamasurg..8.

[13]DoussotA,Groot-KoerkampB,WiggersJK,etal.Out


转载请注明:http://www.danguankuozhangdg.com/dzgn/9134.html


当前时间: