炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:医学界)
转自:医学界
随着表皮生长因子受体酪氨酸激酶抑制剂(EGFR-TKI)在EGFR突变型晚期非小细胞肺癌(NSCLC)治疗中的地位日益巩固,快速、准确地识别EGFR突变状态成为临床实践的关键。尽管组织基因检测仍是金标准,但其侵入性、取样局限性和时空异质性限制了广泛应用。发表于Frontiers in Oncology上一项研究[1],提出一种基于¹⁸F-FDG PET与薄层CT影像组学特征,结合多种机器学习算法构建的预测模型,并进一步整合临床与影像学特征形成可视化列线图,为EGFR突变状态的无创预测提供了新工具。
研究背景与临床问题
肺癌是全球癌症相关死亡的首要原因,其中NSCLC占绝大多数。EGFR突变作为NSCLC中最常见的驱动基因变异之一,尤其在亚洲人群和非吸烟患者中高频出现。EGFR-TKI的应用显著改善了突变患者的生存结局,然而,耐药问题仍是制约疗效的瓶颈。目前,EGFR突变检测主要依赖组织样本,存在侵入性高、样本不足、无法反映肿瘤整体异质性等问题。液体活检虽具便利性,但其敏感性与稳定性仍有待提高。
影像学作为一种非侵入性、可重复的检测手段,展现出预测基因突变的潜力。传统CT征象如毛刺征、胸膜牵拉等与EGFR突变存在一定关联,但依赖主观判断,缺乏量化标准。¹⁸F-FDG PET/CT作为肿瘤代谢显像的重要工具,其代谢参数如SUVmax、TLG等与EGFR突变的关系尚存争议。影像组学通过高通量提取图像特征,将图像转化为可挖掘的数据,已在肿瘤诊断、疗效评估与预后预测中展现出广阔前景。
尽管已有多个研究尝试构建基于影像组学的EGFR预测模型,但多数研究仅采用单一建模方法,可能影响模型的稳健性与泛化能力。本研究在此基础上推进了一步,不仅比较了四种机器学习算法的效能,还进一步将最优影像组学模型与临床、影像学特征整合,构建出具有较高临床实用性的联合预测模型与可视化列线图。
研究设计与方法
本研究回顾性纳入了313例经病理证实且完成EGFR基因检测的NSCLC患者,按8:2比例随机分为训练集(n=250)与验证集(n=63)。所有患者均在治疗前一个月内接受¹⁸F-FDG PET/CT及薄层CT扫描。
图像处理与特征提取
由两名经验丰富的核医学医师盲法勾画肿瘤感兴趣体积。影像组学特征使用Python的PyRadiomics包进行提取,共获得来自PET和CT图像的1888个初始特征。研究团队遵循严格的特征筛选流程:首先通过Pearson相关性分析(|r| ≥ 0.90)去除冗余特征,随后通过方差分析筛选出前60个最具区分度的特征。为保证特征的可重复性,仅保留组内与组间相关系数均大于0.9的特征。最后,采用LASSO回归结合10折交叉验证,进一步筛选出6个最优影像组学特征用于模型构建。
模型构建与验证
研究采用逻辑回归、随机森林、支持向量机与XGBoost四种机器学习算法构建基于影像组学特征的预测模型。通过5折交叉验证评估模型稳健性,并以曲线下面积作为主要性能指标。此外,研究还分别构建了基于临床变量(如吸烟史、性别、病理类型)和影像学特征(如毛刺征、胸膜牵拉、空气支气管征)的预测模型。最终,将最优影像组学模型的Rad-score与筛选出的临床、影像学特征整合,构建联合预测模型,并进一步可视化为列线图。模型性能通过ROC曲线、校准曲线、Hosmer-Lemeshow检验及决策曲线分析进行全面评估。
研究结果:从单一模型到整合工具的效能演进
影像组学模型的比较与优选
在四种机器学习算法中,基于随机森林的影像组学模型表现出最优且稳健的预测性能,其在训练集与验证集中的AUC分别为0.785和0.776。该模型的性能显著优于逻辑回归与支持向量机模型,并与XGBoost模型相当。因此,研究选择RF模型作为最优影像组学模型,并从中衍生出Rad-score用于后续分析。
临床与影像学模型的贡献
单独建立的临床模型(整合了吸烟史、性别、腺癌/鳞癌等变量)在训练集与验证集中的AUC分别为0.711和0.758。而基于CT形态学特征(如毛刺征、胸膜牵拉、空气支气管征)的影像学模型预测效能相对有限,AUC分别为0.632和0.677。这表明,尽管这些特征与EGFR突变存在已知关联,但单独使用时预测能力中等。
联合模型的卓越性能与列线图构建
本研究最核心的发现在于,将Rad-score与临床、影像学特征整合的联合预测模型,取得了最佳的预测效能。该模型在训练集与验证集中的AUC分别高达0.872和0.831。DeLong检验证实,联合模型的AUC显著优于单独的临床模型、影像学模型及RF影像组学模型。基于此联合模型构建的列线图,为临床医生提供了直观、个性化的预测工具。在列线图各预测因子中,Rad-score的贡献权重最高。校准曲线显示预测概率与实际观察结果高度一致,决策曲线分析则进一步证明了该列线图在较大阈值概率范围内具有显著的临床净获益。
讨论与临床启示
超越传统影像:影像组学与机器学习的协同价值
本研究证实,从¹⁸F-FDG PET与薄层CT中提取的影像组学特征,能够有效捕捉与EGFR突变状态相关的肿瘤异质性信息。值得注意的是,最终筛选出的6个关键特征中,有5个来源于小波变换后的图像。小波变换能有效分解图像信息,揭示隐藏在原始数据中的纹理与高频模式,这可能更深刻地反映了肿瘤内部的生物学特性,如细胞排列、代谢异质性等,这些信息是传统视觉评估或单一代谢参数无法提供的。随机森林算法因其能处理高维特征、对异常值不敏感、且能评估变量重要性,在本研究中展现出其作为影像组学建模工具的独特优势。
整合策略:实现“1+1+1>3”的预测效能
本研究的另一重要启示在于“整合”的价值。单纯的临床风险因素、CT形态学征象或影像组学模型均存在预测能力的上限。然而,当将这些不同维度的信息有机结合时,联合模型实现了预测性能的显著提升。这提示我们,EGFR突变的状态受到来自宏观(临床表型)、形态(影像征象)与微观(影像组学所反映的异质性)多个层面的共同影响。这种多维度整合的思路,与现代精准医学所倡导的“全景式”个体化评估理念高度契合。
临床转化与未来展望
该研究所开发的列线图工具,将复杂的机器学习模型转化为可视化的评分系统,极大提升了其在临床实践中的易用性。医生可通过患者的临床信息、CT报告中的关键征象以及自动计算出的Rad-score,快速估算其存在EGFR突变的概率,从而为是否优先进行侵入性组织活检或选择何种基因检测策略提供决策支持。这对于医疗资源受限或患者无法耐受反复活检的情况尤为重要。
结论
该研究表明,基于¹⁸F-FDG PET与薄层CT的影像组学,结合机器学习算法,能够有效预测NSCLC患者的EGFR突变状态。通过整合影像组学、临床及影像学特征所构建的联合模型与列线图,不仅展现了优越的预测准确性,更具备良好的校准度与临床实用性。这一非侵入性、可视化的预测工具,有望成为现有基因检测方法的有力补充,助力临床医生更早、更准地识别EGFR突变人群,优化治疗决策,推动NSCLC的精准诊疗进程。
参考文献:
[1]Li J, et al. Prediction of EGFR mutations in non-small cell lung cancer: a nomogram based on 18F-FDG PET and thin-section CT radiomics with machine learning. Front Oncol. 2025 Apr 2;15:1510386.
审批编号:CN-173111 有效期至:2026-02-27
本材料由阿斯利康提供,仅供医疗卫生专业人士参考