研究团队训练了LR、AdaBoost、LightGBM 等6个常用的机器学习模型。在测试集中,LightGBM模型表现较佳,AUROC达到0.960(95% CI 0.937 to 0.977),平均精度为0.482(95% CI 0.470 to 0.494),并且与AI辅助的细胞学家表现相似(AUROC 0.955 [95% CI 0.933 to 0.975])。因此被选为进一步分析的终模型。
各分析模型准确性
如果将模型定义的中度风险和高风险组转介到内窥镜检查,其敏感性为94.5%(95% CI 88.8 to 97.5),特异性为91.9%(95% CI 91.2 to 92.5),预测阳性值为18.4%(95% CI 15.6 to 21.6)。
最后,使用社区2901例参与者的数据对模型进行验证。在这个验证集中,1.2%(36 of 2901) 的参与者经内窥镜诊断为阳性。经验证,LightGBM模型的AUROC为0.964(95% CI 0.920 to 0.990)。使用预定义的PRS,92.8%的参与者被分类为低风险,2.1%被分类为中风险,5.0%被分类为高风险。