当前位置：首页 > article >正文

机器学习文献|基于循环细胞因子特征，通过机器学习算法预测NSCLC免疫治疗结局

article 2025/2/21 11:23:15

今天我们一起学习一篇最近发表在Journal for immunotherapy of cancer （IF 10.9）上的文章，Machine learning for prediction of immunotherapeutic outcome in non-small-cell lung cancer based on circulating cytokine signatures[基于循环细胞因子特征，通过机器学习算法预测NSCLC免疫治疗结局]。

Wei, Feifei et al. “Machine learning for prediction of immunotherapeutic outcome in non-small-cell lung cancer based on circulating cytokine signatures.” Journal for immunotherapy of cancer vol. 11,7 (2023): e006788.

通讯作者Tetsuro Sasada教授

Sasada教授是日本横滨神奈川癌症中心癌症疫苗中心主任，主要研究T细胞免疫，特别是T细胞选择、分化和激活的分子机制。2001年至2006年，他在日本担任外科肿瘤学家。2006年至2010年，他担任波士顿Dana-Farber癌症研究所癌症疫苗中心免疫评估核心主任。2010年至2014年，他担任日本福冈久留姆大学医学院免疫学和免疫治疗系副教授。2014年，他转到日本横滨神奈川癌症中心的癌症疫苗中心，并参与了新型癌症疫苗和免疫疗法的临床前和临床开发。

文章简介：

免疫检查点抑制剂(ICI)显著提高了非小细胞肺癌(NSCLC)患者的总生存率(OS)，但其有效率仍然不高。在这项研究中，作者通过机器学习算法，基于患者的循环细胞因子开发了细胞因子ICI反应指数(CIRI)，以便根据患者外周血细胞因子谱来预测接受ICI治疗的NSCLC患者的总生存期。作者将123例接受抗PD-1/PD-L1单药治疗的NSCLC患者和99例接受联合化疗的NSCLC患者分别纳入训练队列和验证队列。分别于治疗前(Pre)和治疗后6周(治疗早期：EDT)检测患者外周血中93种细胞因子的浓度。最终，作者通过集成学习随机生存森林分类器来选择特征细胞因子并预测接受ICI治疗NSCLC患者的OS。最终，作者分别基于14个基线循环细胞因子和19个治疗后的循环细胞因子建立CIRI模型，并命名为preCIRI14和edtCIRI19。生存分析结果表明这两个基于细胞因子的预测指数在训练队列和验证队列中对研究对象有良好的风险分层能力。就具体的预测性能而言，preCIRI14和edtCIRI19在两个队列中均具有良好的C指数，提示其良好的区分度。在个体水平上，CIRI评分较高的患者表现出更差的OS[风险比(HR)：preCIRI14和EDTCIRI19分别为0.274和0.163，p<0.0001和p=0.0044]。通过包括其他循环和临床特征，作者开发了基于循环细胞因子指数的联合预测模型，preCIRI21和edtCIRI27，他们在预测患者的OS方面均具有良好的预测效果。preCIRI21和edtCIRI27在验证队列中的C指数分别为0.764和0.757，他们对应的HR分别为0.141(p<0.0001)和0.158(p=0.038)。整体而言，作者开发的CIRI模型能狗准确预测长期应用抗PD-1/PD-L1单抗治疗的NSCLC患者的OS，有助于临床治疗前和(或)早期决策。

1、背景

细胞因子是宿主免疫活动的可溶性介质，通过促进肿瘤微环境中肿瘤浸润并重新激活效应淋巴细胞，在癌症免疫疗法中起着关键作用。

一些研究表明，循环细胞因子可以用于评估不同癌症中ICI治疗的预后，如肾细胞癌和黑色素瘤。目前为止，只有少数几种选择性的细胞因子，如IL-6、IL-8、IL-10、IL-11、IFN-γ、TGF-β1和TNFα，在小样本的非小细胞肺癌患者中被评估其与ICI治疗应答的相关性。相比之下，很少有研究探索外周血循环细胞因子在接受ICI治疗的NSCLC患者中的预后价值。

基于机器学习的特征提取结合非线性高维数据已被证明是一种可用于癌症免疫治疗个体化患者分层和治疗选择的灵活而强大的方法。然而，目前尚未有研究通过机器学习算法，基于循环细胞因子水平预测非小细胞肺癌患者ICI治疗的预后。因此，该研究通过机器学习算法提取和结合循环细胞因子特征，以识别接受PD-1/PD-L1单抗治疗后非小细胞肺癌患者总生存期（OS）相关的预后标志物。

2、方法

2.1 研究设计

在这项研究中，作者选择OS作为研究终点，而不是PFS或肿瘤大小变化等指标。作者检测了患者基线（称为“pre”）和接受抗PD-1/PD-L1单抗治疗6周后（称为“edt”）血浆中的93种循环细胞因子浓度。采用集成学习的随机生存森林（RSF）分类器，选择与OS相关的细胞因子作为候选特征。然后，作者将这些选定的细胞因子整合成一个评分，即基于细胞因子的免疫治疗反应指数（CIRI），以反映免疫治疗的结果。为了克服机器学习过拟合问题，作者分别在训练（队列1；n=123）和独立验证队列（队列2；n=99）中进行了内部队列和交叉验证。通过C-指数和时间依赖ROC曲线下面积来评价该指数的区分度。此外，作者还在个体层面上使用生存曲线及Cox回归评价了该指数对患者的风险分层能力和预后价值。该研究的整体研究设计如下图所示。

研究设计

2.2病例选择和数据来源

本研究选择来自日本久留米大学医院和神奈川癌症中心的接受单药抗PD-1/PD-L1单抗治疗或联合化疗治疗的晚期/复发/转移性NSCLC患者作为研究对象。本研究采用了两个队列：队列1（Cohort 1）包括123名患者，入组时间为2016年9月至2020年2月，作为训练集；队列2（Cohort 2）包括99名患者，入组时间为2020年2月至2021年2月，与队列1完全独立，用作验证集。通过IHC在石蜡包埋组织切片中测定患者的PD-L1表达水平（22C3；Agilent Technologies/Dako）。在大多数患者中，PD-L1表达是在首次治疗之前获得的肿瘤组织中测定的。患者治疗后的疗效评价按照RECISTv.1.1来确定。

2.3循环细胞因子分析

在治疗开始前（pre）和治疗开始后6周（edt）采集患者外周血标本，离心分离血浆，测定93种细胞因子的水平（补充表S1）。为了避免潜在的批次效应，作者对细胞因子浓度进行了标准化处理。

93种细胞因子

2.4机器学习算法开发

使用randomForestSRC包用于生存分析的随机生存森林（RSF）构建。细胞因子使用测量浓度。对于特征选择，考虑了包括所有93个细胞因子的数据集，并使用RSF最小深度过滤器对每个细胞因子的特征重要性进行评分：随机森林最小深度评估了在决策树中划分特征（在本例中为细胞因子）的级别。较小的最小深度表示接近决策树的根节点，并对最终预测产生更直接的影响。因此，最小深度越小，细胞因子在确定模型结果方面的重要性就越大。作者选择了最小深度小于整体均值的细胞因子作为重要特征细胞因子，并使用最小深度的倒数（定义为“重要性分数”）来可视化这些细胞因子的重要性。特征选择的超参数如下：k-折交叉验证的分割数为10；树的数量为1000；节点大小为3；划分规则为“logrank”。最终使用随机森林识别的重要细胞因子建立预测模型。作者采用k-折交叉验证进行内部验证。作者将训练集中的所有样本用于模型训练，并使用完全独立的验证队列来测试其预测性能，从而实现交叉验证。

2.5统计分析

使用randomForestSRC和survivalROC计算C-指数和时间依赖性ROC曲线下面积（AUC）。通过survival包，使用Youden方法来确定CIRI的最佳cutoff值，预测时间以1年时间点的生存状态为基准。CIRI得分高于截断值被定义为高风险组，具有较差的治疗反应和预后，否则被视为低风险组，具有良好的治疗反应和预后。

3、研究结果

3.1纳入研究对象一般特征

队列1和队列2之间在年龄、性别、BMI、吸烟状态、驱动基因突变（EGFR和ALK）、脑和肝转移、白蛋白水平（治疗前）、NLR（治疗前后）方面没有差异。在肺癌分期、组织学、肿瘤PD-L1表达水平、治疗线数、PS评分和白蛋白水平（治疗后）方面存在显著差异。队列1的患者大多数接受接受单药治疗（78.1%），而队列2的患者则主要接受联合治疗（65.7%）。两个队列在基于RECIST的免疫治疗应答类型、PFS和OS之间没有显著差异。

基线表

3.2基于基线细胞因子特征预测免疫治疗结局

图2 基于基线循环细胞因子特征的preCIRI14模型的预测性能。(A) 使用RSF最小深度过滤器选择的特征细胞因子：重要性分数定义为1/（最小深度）；(B) preCIRI14模型在训练集和验证集上的一致性指数；(C, E)（C）训练集和（E）验证集每个时间点的时间依赖性曲线下面积（AUC）；（D, F）基于CIRI最佳cutoff值，训练集和验证集中高低CIRI的生存曲线

作者最初开发了一个集成学习的随机森林分类器，使用基线细胞因子预测接受抗PD-1/PD-L1免疫治疗NSCLC患者的OS。首先，根据它们在随机森林算法中的最小深度，对训练集的93个基线细胞因子进行了评分和排序，以确定它们在OS预测模型中的重要性。如图2A所示，作者选择了14个细胞因子（骨岩蛋白、CX3CL1、IL-11、sTNF-R1、IL-21、脑钠肽-3、MMP-1、骨钙素、IL-6Rα、APRIL、IL-1ra、CCL5、sCD163和CCL20）作为特征细胞因子，并用于构建OS预测模型（以下简称“preCIRI14”）。preCIRI14在训练集中表现出优越的性能，其C-指数为0.667，能够预测治疗后患者的生存期（图2B）。接下来，将preCIRI14应用于预测每个时间点的事件发生。ROC曲线的时间依赖AUC估计表明，在治疗后1-2个月内，AUC保持在0.8以上，然后随时间降至约0.7（图2C）。

为了评估个体水平的预测准确性，根据preCIRI14预测的预后风险对患者进行评分。然后，根据治疗后1年时点的ROC曲线，使用Youden方法确定了预测preCIRI14分数的优化截断值（补充图S1），用于将患者分为高风险和低风险组。

补充图1 CIRI最佳cutoff值确定

如图2D所示，训练集中的45名患者和78名患者分别被分类为高风险和低风险组。Kaplan-Meier法估计的OS率和log rank检验显示，高风险组患者的预后明显较低风险组差（风险比0.320；95% CI 0.200至0.511；p<0.0001）。值得注意的是，高风险组患者的中位生存期为180天，而低风险组为732天。最后，在验证集（队列2）的99名NSCLC患者中评估了preCIRI14分数在免疫治疗的风险分层方面的性能。在人群水平上，preCIRI14的C-指数在验证集中为0.700，略高于训练集（图2B）。预测概率的时间依赖ROC曲线估计也证实，在治疗后1.5年内，AUC保持在0.7以上，随后在2年时间点降至0.586（图2E）。在个体水平上，验证集中的29名患者和70名患者分别被分类为高风险和低风险组。Kaplan-Meier生存分析证实，高风险组患者的预后明显较低风险组差（风险比0.274；95% CI 0.150至0.501；p<0.0001）。高风险组患者的中位生存期为161天，而低风险组为682天（图2F）。

由于肿瘤PD-L1表达是FDA批准的用于临床预测NSCLC免疫治疗效果的生物标志物，在治疗前，作者研究了基线肿瘤PD-L1蛋白表达在ICI治疗的风险分层中的应用。如补充图S2所示，在训练集和验证集中，肿瘤PD-L1蛋白质表达与患者抗PD-1/PD-L1免疫治疗响应和生存之间没有明显关联。

补充图2 训练集和验证集中PD-L1与患者OS之间的相关性

3.3基于治疗早期循环细胞因子特征预测免疫治疗结局

图3 edtCIRI19模型的预测性能。（A）使用RSF最小深度过滤器选择的特征细胞因子：重要性分数定义为1/（最小深度）；（B）训练和验证集上的edtCIRI19模型的C指数；每个时间点训练集（C）和验证集（E）中的时间依赖ROC曲线下面积；高低edtCIRI19在（D）训练和（F）验证集中的生存曲线

随后，作者评价了治疗后6周的细胞因子谱在接受ICIs治疗NSCLC患者中的预后作用。类似于基线细胞因子谱分析，作者选择了19个特征细胞因子（骨桥蛋白、IL-23、IL-21、骨钙素、VEGF-A、CX3CL1、IL-16、CCL23、CCL13、IL-1ra、IL-11、IL-15、APRIL、IL-2Rα、BAFF、sTNF-R1、IL-33、IL-17A/F和IL-25）（图3A）来构建基于细胞因子谱的OS预测模型（以下称为'edtCIRI19'）。与preCIRI14的预测性能相比，治疗初始后早期阶段的细胞因子反应与患者对免疫治疗的生存率呈更强的相关性。edtCIRI19模型的C指数在训练集和验证集中分别为0.712和0.751（图3B）。edtCIRI19每个时间点的ROC曲线在训练集和验证集中也表现出类似的预测性能，其中治疗后24个月的AUC保持在0.778和0.725以上（图3C、E）。在个体水平上，根据在训练集中治疗后1年时间点的ROC曲线，根据edtCIRI19模型的预测分数将患者分为预后不良和预后良好组（补充图S3）。Kaplan-Meier分析显示，在训练集和验证集中，高风险组的患者预后明显较差（训练集HR 0.278；95% CI 0.141至0.546；p<0.0001；验证集HR 0.163；95% CI 0.039至0.678；p=0.0044；图3D、F）。

补充图3 edtCIRI19最佳cutoff值确定

作者还探讨了治疗前和治疗后6周循环细胞因子谱的动态变化是否与患者对抗PD-1/PD-L1免疫治疗的生存有关。基于细胞因子浓度的差异（减法）和变化倍数，作者选择了17个特征细胞因子（骨桥蛋白、VEGF-A、IL-33、IL-21、IL-15、IL-31、IL-2Rα、CCL11、IL-17A/F、CCL22、IL-16、CCL7、CX3CL1、IL-11、CXCL11、CXCL5和CCL24；补充图S4）和20个细胞因子（骨桥蛋白、VEGF-A、CXCL5、TGF-β1、骨钙素、CCL22、IL-2Rα、IL-15、IL-31、CCL8、FGF-基本、CCL23、IL-17A、IL-16、IL-33、IL-21、IL-9、IL-27、IL-22和CCL11；补充图S5）来构建OS预测模型（以下称为'diffCIRI17'和'foldCIRI20'）。如在线补充图S4和S5所示，与edtCIRI19相比，diffCIRI17和foldCIRI20在抗PD-1/PD-L1免疫治疗后的OS预测中在预测准确性和可重复性方面表现较差（图3）。

补充图4 diffCIRI17模型预测性能

补充图5 foldCIRI20模型预测性能

3.4联合预测模型

最终，作者通过将细胞因子与其他循环因子以及已在临床研究中被证明与免疫治疗反应相关的临床特征相结合，开发了针对抗PD-1/PD-L1免疫治疗患者生存预测的高级预测模型。作者在高级预测模型（以下称为“preCIRI21”和“edtCIRI27”）中包含了诸如年龄、性别、分期、BMI、血清白蛋白、NLR、肿瘤PD-L1表达和治疗选择（仅适用于edtCIRI模型）等因素，如图4和图5所示，在训练集和验证集中，与仅使用循环细胞因子相比，preCIRI21和edtCIRI27在预测效力方面均有所提升。在验证集中，preCIRI21和edtCIRI27模型的C-指数分别为0.764和0.757。在个体水平上，根据preCIRI21和edtCIRI27模型预测得分将患者分为高风险组的患者，其预后明显较差，低风险组患者的预后较好（preCIRI21模型：HR 0.141，95% CI 0.073至0.273，p<0.0001；edtCIRI27模型：HR 0.158，95% CI 0.021至1.170，p=0.038）。

图4 preCIRI21模型的预测性能。preCIRI14模型的十四个细胞因子特征以及七个临床和循环因子（年龄、性别、分期、体重指数、治疗前血清白蛋白、治疗前NLR以及肿瘤PD-L1表达）被用于preCIRI21模型中。（A）preCIRI21模型在训练集和验证集上的C指数；（B）训练集和（D）验证集每个时间点上的ROC曲线下面积（AUC）；高低风险人权在（C）训练集和（E）验证集中的生存曲线。

图5 edtCIRI27模型的预测性能。edtCIRI21模型的19个细胞因子特征和8个临床及循环因子（年龄、性别、分期、BMI、edt血清白蛋白、edtNLR、肿瘤PD-L1表达和治疗）被用于edtCIRI27模型中。（A）edtCIRI27模型在训练集和验证集上的C-index；（B）训练集和（D）验证集每个时间点的时间依赖ROC下面积；高低风险人群在（C）训练集和（E）验证集中的生存曲线。

3.5循环细胞因子特征与NSCLC病人预后预测之间的相关性

接下来，作者在个体水平上计算了细胞因子与CIRI评分之间的Spearman相关系数。在两个独立队列中观察到了大多数细胞因子水平与CIRI评分之间的显著相关性（图6）。在preCIRI14模型中，基线骨营养素、CX3CL1、IL-11、sTNF-R1、蛋白-3、MMP-1、APRIL、IL-1ra、sCD163和CCL20水平与训练集和验证集中患者的CIRI评分之间存在显著正相关关系（图6A）。在edtCIRI19模型中，治疗后6周的骨营养素、CX3CL1、IL-16、CCL23、IL-1ra、IL-11、APRIL、IL-2Rα、BAFF和sTNF-R1水平与训练集和验证集中患者的CIRI评分之间存在显著正相关关系（图6B）。相反，在治疗后6周的骨钙素与CIRI评分呈负相关（图6B）。此外，在preCIRI21的高风险组中，观察到Alb和BMI水平降低，NLR水平升高以及女性患者比例较高。在edtCIRI27的高风险组中，观察到Alb水平降低，NLR水平升高以及PD-L1水平较高（见补充材料）。

图6 特征细胞因子与CIRI分数之间的关联。特征细胞因子水平与（A）队列1和队列2的preCIRI14模型以及（B）edtCIRI19模型预测的CIRI分数之间的Spearman相关系数。

4、小编有话说

关于类别不平衡的问题我们之前多次说到过。如果作者可以提供不同结局事件组患者的基线比较就会便于读者知道是不是存在该问题。另外，作者也应该在方法学中提到是否存在这一问题并如何解决；
机器学期最初的特征预处理应该更加详细地说明。尽管作者刚开始交代了细胞因子的处理方法。然而，后续模型中作者同样加入了其他临床变量；
模型评价中，作者从整体和个体对模型展开评价，这是值得学习的。如果在模型评价中加入校正曲线和决策曲线以及IDI和NRI将更有说服力。另外，我们之前分享的一篇BMJ的临床预测模型文章是一个很好的范例。如何从整体到个体、再到临床应用情景，全面评价模型将更具说服力和临床实用性。

最后编辑于：2024-09-09 20:06:14