实用医学杂志 ›› 2026, Vol. 42 ›› Issue (7): 1158-1164.doi: 10.3969/j.issn.1006-5725.2026.07.006
• 专题报道:结核病 • 上一篇
周游1,2,陈纪飞2,何希2,刘爱梅2,杨小兵2,黄一芳1(
)
You ZHOU1,2,Jifei CHEN2,Xi HE2,Aimei LIU2,Xiaobing YANG2,Yifang HUANG1(
)
摘要:
目的 运用机器学习方法构建预测模型,用于肺癌与肺结核的鉴别诊断。 方法 回顾性分析2020年7月至2023年5月在广西壮族自治区胸科医院就诊的585例患者临床资料,年龄14 ~ 90岁,其中男457例,女128例。根据临床最终诊断结果,将585例病例分为肺癌组和肺结核组。比较两组病例肿瘤标志物检测结果的差异。运用Lasso和单因素logistic回归分析筛选肺癌与肺结核鉴别诊断的特征变量。构建随机森林模型,并对重要预测变量因素进行排序。构建Lasso-logistic回归模型;通过ROC曲线分析比较随机森林模型和Lasso-logistic回归模型的预测效能。 结果 肺癌组血清肿瘤标志物CA125、CEA、CYFRA21-1、NSE、SCCA明显高于肺结核组,差异有统计学意义(P < 0.05)。Lasso/单因素logistic回归分析筛选出肺癌与肺结核鉴别诊断的特征变量为性别、年龄、CA125、CEA、CYFRA21-1、NSE、SCCA。通过随机森林模型对特征变量进行重要预测变量排序,依次为CYFRA21-1、CEA、SCCA、NSE、CA125、年龄、性别;Lasso-logistic回归分析结果显示,CYFRA21-1、CEA、NSE水平和年龄是区分肺癌与肺结核的独立危险因素(P <
中图分类号: