来源:特诺科研
低剂量计算机断层扫描(LDCT)是肺癌早筛的核心手段,但高假阳性率常引发过度诊疗。近日,国家癌症中心团队在《Molecular Biomedicine》(IF=10.1)发表多中心队列研究,首次构建基于 piR-hsa-8393202 和 piR-hsa-8429916 的双 piRNA 诊断模型,不仅对早期肺腺癌(LUAD)诊断 AUC 达 0.918,还能精准区分 LDCT 检出的不确定肺结节良恶性,为肺癌早筛提供了兼具特异性与可及性的分子辅助工具!

文章信息速览
原标题:Identification of PIWI-interacting RNAs based models for lung adenocarcinoma early detection: a multicenter cohort study
期刊:Molecular Biomedicine(IF=10.1)
关键词:肺腺癌、PIWI-interacting RNAs(piRNAs)、液体活检、早诊标志物、不确定肺结节、多中心队列、机器学习
研究目的
针对 LDCT 肺癌筛查假阳性率高、传统血清标志物诊断效能不足的临床痛点,本研究旨在:
筛选肺腺癌组织与血清中一致性高表达的肿瘤源性 piRNA 标志物;
构建并验证基于 piRNA 的机器学习诊断模型,提升早期肺腺癌检出精度;
探索该模型对 LDCT 检出不确定肺结节的良恶性分层价值。
核心研究亮点
1. 多维度筛选锁定双核心 piRNA 标志物(图 2、图 3)
公共数据库挖掘:整合 GEO 数据库 48 对 LUAD 组织 / 癌旁样本及 9 例血清样本的 piRNA 表达谱,筛选出 55 个组织与血清共上调的 piRNA(图 2d),经严格阈值过滤得到 10 个候选分子(图 2e-g)。

院内队列验证:在 48 对 LUAD 组织和 48 例血清样本中验证发现,仅piR-hsa-8393202和piR-hsa-8429916在组织与血清中均显著高表达(图 3a、c),且组织层面 AUC 分别达 0.829 和 0.787,血清层面 AUC 达 0.834 和 0.674(图 3b、d),具备肿瘤源性和临床诊断潜力。

图3
2. 双 piRNA 机器学习模型实现早期肺腺癌精准诊断(图 4)
模型构建与优化:基于国家癌症中心 1028 例样本(711 例 LUAD、72 例良性结节、245 例健康对照),对比 9 种机器学习算法,最终选定随机森林模型,其诊断准确性(0.826)和 AUC 均优于其他算法(图 4c)。
多队列验证效能:
训练集对早期 LUAD(0-II 期)诊断 AUC 达 0.923,灵敏度 78.1%、特异性 91.9%(图 4f);
内部验证集 AUC 为 0.871,外部多中心验证集 AUC 达 0.865(图 4g、h);
对原位腺癌诊断 AUC 高达 0.907,显著优于 CEA、CYFRA21-1 等传统标志物(图 4i-k)。
模型可解释性:SHAP 分析显示,piR-hsa-8429916 是核心贡献因子,年龄、性别对诊断结果影响极小(图 4e)。

图4
3. 双 piRNA 模型实现不确定肺结节精准分层(图 5、图 6)
结节分层模型构建:纳入 350 例 LDCT 检出肺结节患者,结合双 piRNA、年龄、性别及 CEA 构建分类模型,十折交叉验证 AUC 达 0.885(图 5b)。
多亚组验证性能:
训练集区分良恶性结节 AUC 为 0.885,灵敏度 77.5%、特异性 84.1%,显著优于 CEA(AUC=0.573)(图 5f);

图5
外部验证集 AUC 为 0.842,对混合磨玻璃结节诊断 AUC 达 0.906,远高于传统标志物(图 6c);
对≤0.8cm 小结节仍保持 0.796 的 AUC,解决了小病灶良恶性难辨的临床难题(图 6b)。

图6
4. 功能验证证实标志物的肿瘤源性与促癌作用(图 7)
肿瘤源性验证:48 例 LUAD 患者术后血清中双 piRNA 水平较术前显著下降(图 7d、e),且血清表达量与肿瘤体积正相关(图 7h、i);LUAD 细胞系及培养上清中双 piRNA 表达量显著高于正常支气管上皮细胞(图 7j-m),证实其为肿瘤细胞主动分泌的循环标志物。

图7
促癌功能验证:敲低双 piRNA 可显著抑制 LUAD 细胞增殖并促进凋亡,提示其不仅是诊断标志物,还参与肿瘤发生发展的关键通路。
这篇研究从选题角度,锚定“肺癌早筛分子辅助诊断” 这一临床刚需,避开已饱和的 miRNA、lncRNA 领域,聚焦piRNA 这一新兴非编码RNA 类型,既填补了领域空白,又具备独特的临床转化优势;
从技术组合看,采用 “公共数据库挖掘→院内队列验证→多中心大样本模型构建→细胞功能实验” 的四层递进策略,先通过公共组学数据缩小候选范围,再用临床样本完成标志物筛选与模型验证,最后用细胞实验明确生物学功能,实现了 “筛靶标 - 建模型 - 证机制” 的完整逻辑链;
从创新点来说,将piRNA 与机器学习结合,不仅提升了诊断模型的效能,还通过 SHAP 分析实现模型可解释性,同时拓展至肺结节分层场景,让单一标志物具备 “早诊 + 分层” 双重临床价值;
从可复现性来看,研究依赖的 RT-qPCR 技术为常规实验室标配,机器学习模型基于开源R 包构建,且部分数据来自公共数据库,课题组无需高端组学平台即可借鉴该 “公共数据初筛+ 小样本验证+ 大样本建模” 的低成本研究思路。
原文 DOI:10.1186/s43556-025-00368-2
专注期刊投稿、发表十年,任何投稿、写作难题欢迎咨询!

PAPER INFORMATION
快速预审、投刊前指导、专业学术评审,对文章进行评价
校对编辑、深度润色,让稿 件符合学术规范,格式体例等标准
适用于语句和结构尚需完善和调整的中文文章,确保稿件达到要求
数据库包括: 期刊、文书籍、会议、预印章、书、百科全书和摘要等
让作者在期刊选择时避免走弯路,缩短稿件被接收的周期
根据目标期刊格式要求对作者文章进行全面的格式修改和调整
帮助作者将稿件提交至目标期刊投稿系统,降低退稿或拒稿率
按照您提供的稿件内容,指导完成投稿附信(cover letter)
北京总部:北京市海淀区碧桐园 3 号楼 2 层 211 广州办事处:广州市黄埔区科学城国际企业孵化器 E栋306 联系人:客服 / 18163670350
Copyright © 2022-2024 北京特诺科技有限公司 版权所有 备案/许可证编号为: 京 ICP 备 2023007944 号