修回日期: 2024-09-01
接受日期: 2024-09-30
在线出版日期: 2024-10-28
上消化道癌(胃癌、食管癌)是全球范围内常见的消化系统癌症, 尽管近些年食管癌和胃癌诊断效能有所提高, 但超过80%患者在就诊时处于中晚期, 5年预后生存率分别30.30%、35.10%, 且城市地区食管癌5年生存率明显低于农村地区.
采用分类树构建农民上消化道早癌高危人群筛查依从性的预测模型.
选取2023-02/2023-08嵊州市招募的800名上消化道早癌高危农民, 统计随访依从情况及随访筛查结果, 采用Logistic回归和分类树模型分析农民上消化道早癌高危人群筛查依从性的影响因素, 受试者工作特征曲线评价模型预测效能.
800名中共有463名(57.88%)接受内镜筛查, 慢性浅表性胃炎(61.12%)占比最高, 其次为结直肠息肉(15.98%); 依从组与不依从组年龄、学历、家庭月收入、饮酒史、癌症家族史、健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、健康素养相比, 差异均有统计学意义(P<0.05); Logistic回归分析显示, 家庭月收入、饮酒史、愿意健康体检、癌症防治认知度、具备健康素养、对内镜检查感到害怕、无症状不愿筛查是上消化道早癌高危农民筛查依从性的影响因素(P<0.05); 分类树结果显示, 健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、具备健康素养是上消化道早癌高危农民筛查依从性的影响因素; 分类树模型的曲线下面积(area under the curve, AUC)小于Logistic回归模型的AUC, 提示分类树模型拟合效果较好.
健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、具备健康素养是上消化道早癌高危农民筛查依从性的影响因素, 根据上述构建的分类树模型具有良好的预测效能.
核心提要: 目前关于上消化道内镜筛查依从性的研究对象为城市居民, 关于农村居民的相关研究较为少见. 分类树模型通过对数据集分割和判断生成树状结构, 对纳入因素进行重要性排序, 筛出主要因素, 以实现对研究对象准确预测.
引文著录: 俞珊, 邢玲, 任于晗. 应用分类树构建农民上消化道早癌高危人群筛查依从性的预测模型. 世界华人消化杂志 2024; 32(10): 758-766
Revised: September 1, 2024
Accepted: September 30, 2024
Published online: October 28, 2024
Upper gastrointestinal cancer, including gastric cancer and esophageal cancer, is a group of common digestive system cancers worldwide. Although the diagnostic efficiency for esophageal cancer and gastric cancer has improved in recent years, more than 80% of patients are in the moderate and advanced stages when they seek medical treatment, with 5-year survival rates of 30.30% and 35.10%, respectively. The 5-year survival rate of esophageal cancer in urban areas is significantly lower than that in rural areas.
To construct a predictive model for screening compliance among populations at high risk for early cancer in the upper digestive tract using classification trees.
A total of 800 farmers at high risk for early upper gastrointestinal cancer recruited in Shengzhou City from February to August 2023 were selected. The compliance with follow-up and screening results were statistically analyzed. Logistic regression and classification tree model were used to analyze the influencing factors of screening compliance in farmers at high risk for early upper gastrointestinal cancer, and receiver operating characteristic curve analysis was performed to evaluate the prediction efficiency of the model.
Among the 800 patients, 463 (57.88%) underwent endoscopic screening. Chronic superficial gastritis (61.12%) accounted for the highest proportion, followed by colorectal polyps (15.98%). There were statistically significant differences between the compliance group and non-compliance group in age, education, family monthly income, drinking history, family history of cancer, intention of physical examination, fear of endoscopy, reluctance to screen for being asymptomatic, awareness of cancer prevention and treatment, and health literacy (P < 0.05). Logistic regression analysis showed that factors such as family monthly income, history of alcohol consumption, willingness to undergo health checkups, awareness of cancer prevention and control, health literacy, fear of endoscopy, and unwillingness to screen for being asymptomatic were factors affecting the compliance of farmers at high risk for screening for early cancer in the upper digestive tract (P < 0.05). The classification tree results showed that willingness to undergo health check-ups, fear of endoscopy, unwillingness to screen for asymptomatic conditions, awareness of cancer prevention and control, and having health literacy were factors influencing the compliance of high-risk farmers with screening for early cancer in the upper digestive tract. The area under the curve of the classification tree model was smaller than that of the logistic regression model, suggesting that the fitting effect of the classification tree model was better.
The willingness to undergo health check-ups, fear of endoscopy, unwillingness to screen for asymptomatic conditions, awareness of cancer prevention and control, and having a high level of health literacy are factors that influence the compliance of high-risk farmers with screening for early cancer in the upper digestive tract. The classification tree model constructed based on these factors has good predictive performance.
- Citation: Yu S, Xing L, Ren YH. Application of classification tree to construct a predictive model for screening compliance among populations at high risk for early cancer in the upper digestive tract. Shijie Huaren Xiaohua Zazhi 2024; 32(10): 758-766
- URL: https://www.wjgnet.com/1009-3079/full/v32/i10/758.htm
- DOI: https://dx.doi.org/10.11569/wcjd.v32.i10.758
上消化道癌(胃癌、食管癌)是全球范围内常见的消化系统癌症, 据2020年全球癌症数据库显示, 我国胃癌、食管癌发病率占比分别为5.60%、3.10%, 病死率占比为7.70%、5.50%[1]. 尽管近些年食管癌和胃癌诊断效能有所提高, 但超过80%患者在就诊时处于中晚期, 5年预后生存率分别30.30%、35.10%, 且城市地区食管癌5年生存率明显低于农村地区[2]. 癌症治疗效果、生存时间与癌症发现时期密切相关, 早发现、早诊断、早预防及早治疗是防治恶性癌症的关键[3], 而高危上消化道早癌主要筛查手段为内镜检查, 也是防控上消化道癌症的有效措施[4]. 嵊州市属于县级市, 农村居民为主要群体, 在文化程度、经济收入、健康宣教受教等方面存在一定缺乏, 此类群体主动体检比较低, 胃镜筛查顺应性欠佳, 远低于全国均值60%[5]. 鉴于目前有关上消化道内镜筛查依从性的研究对象为城市居民[6], 关于农村居民的相关研究较为少见. 分类树模型是通过对数据集进行分割和判断生成树状结构, 能处理连续数据的分类问题, 对纳入因素进行重要性排序, 筛出主要因素并进行综合分析, 以实现对研究对象准确预测[7]. 在此基础上, 本研究主要观察农民上消化道早癌高危人群筛查依从性的影响因素, 构建分类树预测模型, 这也是本研究创新所在, 为快速、便捷、准确地筛查需进行依从性强化干预的人群提供参考, 从而提高上消化道早癌检出率或减少上消化道的发生.
选取2023-02/2023-08嵊州市招募的800名上消化道早癌高危农民. 在研究开展前, 向入组受试者阐释本研究目的、意义, 患者可自愿加入, 充分保证受试者了解课题目的及意义后签署知情同意书, 保证每位研究对象选择权或放弃本研究的权利. 本研究为前瞻性研究, 已获得我院伦理委员会审批. 纳入标准: 均为嵊州市农村户口, 在本地居住满3年以上, 从事农业生产超过5年; 有完全行为能力, 自愿参与本研究, 知情同意书; 存在上消化道相关症状, 如胃灼热、胃痛、体重减轻等; 近1 mo内未使用抗炎药、抗凝药、抗生物、抑酸剂或质子泵制剂等药物. 排除标准: 不能配合问卷填写内容; 已确诊为其他系统恶性癌症, 如肺癌、乳腺癌等; 既往存在胃部手术史; 不能配合消化道内镜检查; 严重全身性疾病, 如严重贫血、心肝肾功能不全; 出血倾向或碘过敏史.
1.2.1 调查内容和方法: 本研究采用整群抽样, 选择六个相邻农村常住居民800名, 由经过统一培训的小组成员协助完成问卷调查内容. 调查内容包括性别、婚姻状态、年龄、职业、家庭月收入、学历、癌症家族史、饮酒史、健康体检意愿、吸烟史、对内镜检查感到害怕、无症状不愿筛查、担忧诊断结果为阳性、癌症防治认知度、健康素养等.
吸烟史定义每天吸烟≥1支, 连续超过6 mo, 饮酒史定义男性乙醇摄入量>40 g/d, 女性乙醇摄入量>20 g/d. 癌症防治认知度参考《癌症防治实施方案(2019-2022年)》[8]制定相关问卷内容, 涉及调查对象一般情况、癌症认知、癌症预防行为及态度等. 健康素养[9]内容涉及基本健康知识和理念(22题28分)、健康生活方式与行为(16题22分)及基本技能(12题16分), 健康素养问卷内容共50道题目66分, 调节对象实际得分达总分80%及以上, 视为具备健康素养.
1.2.2 上消化道早癌高危判定[10]: (1)经常吸烟(每天≥15支, 持续10年以上); (2)经常饮酒(白酒每天50 mL, 持续10年以上); (3)喜欢烫热、粗硬食物; (4)常食用霉变、腌晒食物; (5)家族存在消化道癌症史; (6)进行性消瘦; (7)反流性食管炎或胃病; (8)伴有食欲不振、腹胀、胃灼热、反酸等症状; (9)吞咽困难; (10)呕血黑便; (11)进食时伴胸骨后或剑突下疼痛, 可呈烧灼样、针刺样、牵拉样. 凡具备以上(1)-(4)任两项或(5)-(11)任一项视为高危群体, 建议做胃镜检查.
本研究小组成员均经过统一培训, 行消化道内镜的临床医师统一进行技术培训, 统一标准和检查规范. 本研究数据仅限本研究使用, 数据录入采用双人形式录入, 输入完毕后随机抽取20%-40%检查, 确定无误后, 交由数据监察员再次审核全部数据, 保证数据真实性和完整性, 最后锁定数据.
(1)分析上消化道早期高危农民筛查依从性; (2)上消化道早癌高危农民内镜随访结果; (3)比较上消化道早癌高危农民筛查依从性临床资料; (4)采用Logistic回归和分类树模型分析农民上消化道早癌高危人群筛查依从性的影响因素; (5)对比分析分类树模型与Logistic回归模型的预测效能.
统计学处理 使用统计学软件SPSS 24.0分析数据, 计数资料以n(%)表示, 采用χ2检验或校正χ2检验, 等级资料比较用秩和检验; 将上消化道早癌高危农民筛查依从性与否作为因变量, 将单因素分析中有意义的变量作为自变量, 控制年龄、癌症家族史、学历等潜在的混杂因素后进行Logistic回归分析; 采用SPSS软件构建分类树模型, 预测不同影响因素的强度与分层节点, 筛选筛查依从性的影响因素, 分析不同因素间的相互关系, 树的剪枝采用预修剪刀法, 分类规则: 树的生长枝条分割显著性水准α merge = 0.05、α split = 0.05; 绘制受试者工作特征曲线(receiver operating characteristic curve, ROC)、曲线下面积(area under the curve, AUC)评估预测效能. P<0.05为差异有统计学意义.
800名消化道早癌高危农民, 接受内镜筛查随访者有463名, 占57.88%; 未做内镜筛查随访者337名, 占42.13%, 其中拒绝理由为"没必要, 无不舒服症状"者有141名, 理由为"检查费用太高, 经济压力大"者75名, "年纪大, 不想再检查"者57名, "去医院路途远, 就医不方便"者64名, 分别占41.84%、22.26%、16.91%、18.99%.
收集463名消化道早癌高危农民的内镜随访结果, 慢性浅表性胃炎占全部高危人群的63.50%, 其次为胃溃疡, 占13.61%, 筛查出可疑食管癌3例, 食管癌1例, 分别占0.65%、0.22%, 见表1.
检查结果 | 人数 | 构成比(%) |
慢性浅表性胃炎 | 294 | 63.50 |
胃溃疡 | 63 | 13.61 |
慢性萎缩性胃炎 | 42 | 9.07 |
十二指肠球部溃疡 | 20 | 4.32 |
无异常 | 25 | 5.40 |
黏膜下肿物及结节 | 11 | 2.38 |
胃息肉 | 4 | 0.86 |
可疑食管癌 | 3 | 0.65 |
食管癌 | 1 | 0.22 |
根据上消化道早癌高危农民筛查依从性与否分为依从组(已做内镜检查人群)和不依从组(未做内镜检查人群). 年龄、学历、家庭月收入、饮酒史、癌症家族史、健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、健康素养相比, 差异均有统计学意义(P<0.05), 见表2.
资料 | 总例数 | 依从组(n = 463) | 不依从组(n = 337) | Z/χ2值 | P值 |
性别 | 0.456 | 0.499 | |||
男 | 428 | 243(56.78) | 185(43.22) | ||
女 | 372 | 220(59.14) | 152(40.86) | ||
年龄(岁) | 40.596 | <0.05 | |||
<45 | 121 | 100(21.60) | 21(6.23) | ||
45-59 | 129 | 58(12.53) | 71(21.07) | ||
≥60 | 550 | 305(65.87) | 245(72.70) | ||
职业 | 2.642 | 0.267 | |||
全职 | 460 | 257(55.51) | 203(60.24) | ||
兼职 | 168 | 106(22.89) | 62(18.40) | ||
无业/其他 | 172 | 100(21.60) | 72(21.36) | ||
学历 | 18.251 | <0.05 | |||
文盲 | 332 | 163(35.21) | 169(50.15) | ||
小学、初中 | 248 | 156(33.69) | 92(27.30) | ||
高中、中专 | 130 | 85(18.36) | 45(13.35) | ||
大专及以上 | 90 | 59(12.74) | 31(9.20) | ||
婚姻状态 | 0.917 | 0.338 | |||
已婚 | 747 | 429(92.66) | 318(94.36) | ||
未婚 | 53 | 34(7.34) | 19(5.64) | ||
家庭月收入(元) | 33.240 | <0.05 | |||
<2000 | 105 | 34(7.34) | 71(21.07) | ||
2000-3000 | 564 | 343(74.08) | 221(65.58) | ||
≥3001 | 131 | 86(18.57) | 45(13.35) | ||
饮酒史 | 8.819 | 0.003 | |||
有 | 150 | 103(22.25) | 47(13.95) | ||
无 | 650 | 360(77.75) | 290(86.05) | ||
吸烟史 | 0.164 | 0.685 | |||
有 | 121 | 68(14.69) | 53(15.73) | ||
无 | 679 | 395(85.31) | 284(84.27) | ||
癌症家族史 | 38.104 | <0.05 | |||
有 | 203 | 155(33.48) | 48(14.24) | ||
无 | 597 | 308(66.52) | 289(85.76) | ||
健康体检意愿 | 198.381 | <0.05 | |||
愿意 | 423 | 343(74.08) | 80(23.74) | ||
不愿意 | 377 | 120(25.92) | 257(76.26) | ||
对内镜检查感到害怕 | 51.548 | <0.05 | |||
是 | 242 | 94(20.30) | 148(43.92) | ||
否 | 558 | 369(79.70) | 189(56.08) | ||
无症状不愿筛查 | 82.876 | <0.05 | |||
是 | 298 | 111(23.97) | 187(55.49) | ||
否 | 502 | 352(76.03) | 150(44.51) | ||
担忧诊断结果为阳性 | 0.630 | 0.427 | |||
是 | 288 | 172(37.15) | 116(34.42) | ||
否 | 512 | 291(62.85) | 221(65.58) | ||
癌症防治认知度 | 41.000 | <0.05 | |||
低水平 | 184 | 71(15.33) | 113(33.53) | ||
中水平 | 429 | 261(56.37) | 168(49.85) | ||
高水平 | 187 | 131(28.29) | 56(16.62) | ||
健康素养 | 29.386 | <0.05 | |||
具备 | 231 | 168(36.29) | 63(18.69) | ||
不具备 | 569 | 295(63.71) | 274(81.31) |
将上消化道早癌高危农民筛查依从性与否作为因变量(否 = 0, 是 = 1), 将上述分析中有意义的变量作为自变量(赋值见表3). Logistic回归分析结果显示: 家庭月收入、饮酒史、愿意健康体检、癌症防治认知度、具备健康素养是上消化道早癌高危农民筛查依从性的保护因素, 对内镜检查感到害怕、无症状不愿筛查是其危险因素(P<0.05), 见表4.
自变量 | 赋值说明 | |
因变量 | 筛查依从性 | 不依从 = 0, 依从 = 1 |
自变量 | ||
X1 | 家庭月收入 | <2000元 = 1, 2000-3000元 = 2, ≥3001元 = 3 |
X2 | 饮酒史 | 无 = 0, 有 = 1 |
X4 | 对内镜检查感到害怕 | 否 = 0, 是 = 1 |
X5 | 无症状不愿筛查 | 否 = 0, 是 = 1 |
X6 | 癌症防治认知度 | 低水平 = 1, 中水平 = 2, 高水平 = 3 |
X7 | 健康素养 | 不具备 = 0, 具备 = 1 |
变量 | S.E. | β | OR | 95%CI | Wald χ2 | P值 | |
下限 | 上限 | ||||||
家庭月收入 | 0.422 | -1.097 | 0.334 | 0.132 | 0.845 | 6.754 | <0.05 |
饮酒史 | 0.311 | -0.780 | 0.458 | 0.230 | 0.914 | 6.287 | <0.05 |
愿意健康体检 | 0.364 | -1.110 | 0.330 | 0.160 | 0.679 | 9.297 | <0.05 |
对内镜检查感到害怕 | 0.483 | 1.446 | 4.244 | 1.765 | 10.207 | 8.958 | <0.05 |
无症状不愿筛查 | 0.271 | 1.252 | 3.498 | 1.489 | 8.216 | 21.347 | <0.05 |
癌症防治认知度 | 0.296 | -0.779 | 0.459 | 0.216 | 0.975 | 6.924 | <0.05 |
具备健康素养 | 0.267 | -1.194 | 0.303 | 0.113 | 0.812 | 20.008 | <0.05 |
由图1可知, 分类树模型共包含3层11个节点, 终端节点共有7个, 共筛选出5个解释变量, 分别是健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、具备健康素养. 共提取出7条分类规则: (1)不愿意健康体检, 无症状仍愿检查, 筛查依从占该节点构成的70.12%; (2)不愿意健康体检, 无症状不愿检查, 筛查依从占该节点构成的37.25%; (3)愿意健康体检, 对内镜检查不感到害怕, 癌症防治认知度低水平, 筛查依从占该节点构成的38.59%; (4)愿意健康体检, 对内镜检查不感到害怕, 癌症防治认知度中水平, 筛查依从占该节点构成的60.84%; (5)愿意健康体检, 对内镜检查不感到害怕, 癌症防治认知度高水平, 筛查依从占该节点构成的70.05%; (6)愿意健康体检, 对内镜检查感到害怕, 不具备健康素养, 筛查依从占该节点构成的51.85%; (7)愿意健康体检, 对内镜检查感到害怕, 具备健康素养, 筛查依从占该节点构成的72.73%.
绘制ROC曲线, 分类树模型的AUC为0.924(95%CI: 0.903-0.941), 敏感度为80.78%, 特异度为87.24%、阳性预测值43.89%、阴性预测值89.42%; Logistic回归模型的AUC为0.944(95%CI: 0.926-0.959), 敏感度为80.56%, 特异度为81.31%、阳性预测值56.29%、阴性预测值92.36%, 根据判定标准两个模型的区分度均较高, 见图2. 进一步计算分类树模型Risk和错分矩阵, 结果显示: 分类树模型预测上消化道早癌高危农民筛查依从性的正确率为75.63%, Risk统计量估计值为0.261, 标准误差为0.006, 提示分类树模型拟合效果较好.
消化道内镜检查是公认消化道癌诊断、筛查的有效方法, 一项随机对照研究证实, 消化道高危群体行内镜筛查, 不仅能确定食管、胃部是否病变, 还能减少食管癌和胃癌带来的疾病负担[11]. 近年来, 上消化道早癌诊治宣教在全国逐渐普及, 部分患者能早期确诊, 但大部分患者在就诊治疗时处于中晚期, 治疗效果不甚理想, 患者预后效果较差[12].
内镜筛查属于有创操作, 在普通群体中接受度不高, 如日本接受内镜筛查参与率仅为16.00%[13], 我国河南省接受内镜筛查参与率为17.69%[5]. 本研究中, 800名上消化道早癌高危群体接受内镜筛查参与率为57.88%, 可能与本地区饮食习惯多喜欢腌制、高盐食物, 多数患者均伴有不同程度消化不良症状, 如进食后上腹部不适、隐痛、伴嗳气、恶心等. 慢性浅表性胃炎、结直肠息肉、慢性萎缩性胃炎等是引起上消化道癌的主要危险因素[14], 本研究结果此类群体有较高的内镜就诊筛查依从性, 而这些疾病确诊往往需要行内镜检查, 作为高危群体更易接受内镜检查.
Logistic回归常用于疾病诊断、风险因素筛查; 分类树模型用分类和预测的树状图, 更直观展示结果, 更好地分析疾病高风险群体特征, 展现各因素之间的交互作用, 无须考虑变量间共线性问题[15]. 本研究经Logistic回归分析显示, 家庭月收入、饮酒史、愿意健康体检、癌症防治认知度、具备健康素养、对内镜检查感到害怕、无症状不愿筛查是上消化道早癌高危农民筛查依从性的影响因素. 较于普通胃镜、肠镜, 无痛内镜、无痛肠镜是常用的检查工具, 给受试者带来痛苦较小, 但检查费用较高, 家庭收入高群体能承担检查费用, 更愿意接受筛查, 遵医行为更好, 更易接受临床医师建议[16]. 相关研究显示, 低收入家庭, 有时可能因为检查费用高, 若诊断为癌症, 后期治疗成本也可能无力承担, 会直接放弃治疗[17]. 有研究显示, 饮酒史是引发上消化道癌的危险因素, 酒精通常指乙醇, 属于有机化合物, 本身不是致癌物, 乙醇在肠道内经酶类物质分解生成乙醛, 高浓度乙醛长时间留存体内, 可引发黏膜损伤, 从而增加食管癌发生风险[18].
本研究中依从性组与不依从组愿意健康体检、癌症防治认知度存在明显差异, 分析原因可能是本研究纳入群体为农村居民, 受教育程度存在明显差异, 受教育程度低对癌症相关知识了解不多、癌症防治认知度不高, 部分患者可能因家庭收入、高龄、对子女产生负担等原因, 接受健康体检的意愿不高. 健康素养是个人获取和理解基本健康信息、服务, 并运用这些信息和服务作出正确判断, 从而维护和促进健康的能力[19]. 癌症防治认知度是评估居民健康素养、判断癌症防治工作效果的主要指标, 调查数据显示, 居民对癌症防治认知度越高, 具备健康素养水平越高[20], 健康素养水平低居民对健康信息理解弱, 可能对医疗资源利用存在浪费现象, 会频繁就医、过度用药或寻找不合适医疗机构, 增加医疗资源和个人经济负担[21]. 内镜检查作为一种侵入性操作, 会刺激消化系统, 在检查过程中头脑保持清醒, 容易出现喉咙痛, 加上对胃镜检查认知不足、检查可能会造成医源性感染及临床医师操作技术等产生担忧, 一些居民可能会对内镜检查感到害怕[22]. 本研究结果显示, 两组无症状不愿筛查存在明显差异, 部分患者出现恶心呕吐、腹痛及嗳气等症状, 感觉可能是饮食不当、消化不良造成, 且本地居民喜欢腌制、高盐食物, 有时多吃一些不消化食物等原因, 上消化道癌早期症状不明显, 农村居民对癌症知识、防治知识认知、就医意识不强, 所以此患者更不愿意接受检查[10].
本研究经分类树模型分析发现健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、具备健康素养是上消化道早癌高危农民筛查依从性的影响因素, 家庭月收入、饮酒史未纳入该模型, 可能是变量之间存在共线性问题. 分类树模型能避开共线性问题, 避免过度拟合现象, 充分了解各变量之间的相互关系[23]. 本研究中分类树模型分为3层节点, 首层为健康体检意愿, 愿意接受健康体检者筛查依从性较高; 第2层为变量间存在相互关系, 无症状不愿筛查是不愿接受健康体检者筛查依从性的影响因素, 对内镜感到害怕是愿意接受健康体检者筛查依从性的影响因素, 第3层显示, 癌症防治认知度水平是具备健康素养者筛查依从性的影响因素. 通过对比两种模型预测效能显示, 分类树模型预测上消化道早癌高危农民筛查依从性的拟合效果较好.
综上所述, 上消化道早癌高危农民筛查依从性的影响因素包括健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、具备健康素养等, 构建的分类树模型具有良好的预测效能, 针对影响因素采取适当干预措施, 加强癌症相关知识宣教工作, 并开展内镜筛查宣传教育、早癌知识教育等, 有助于促进上消化道癌症高危人群保持良好内镜筛查依从性, 提高人群癌症相关知识知晓率, 对提升癌症综合防治能力有积极作用. 本研究存在不足之处, 患者依从性受多方面主观性和客观性, 样本仅限于嵊州市的农民, 可能存在一定地域局限性, 后续研究考虑扩大样本量、增加不同地区的样本、病例资料.
上消化道癌(胃癌、食管癌)是全球范围内常见的消化系统癌症, 据2020年全球癌症数据库显示, 我国胃癌、食管癌发病率占比分别为5.60%、3.10%, 病死率占比为7.70%、5.50%. 尽管近些年食管癌和胃癌诊断效能有所提高, 但超过80%患者在就诊时处于中晚期, 5年预后生存率分别30.30%、35.10%, 且城市地区食管癌5年生存率明显低于农村地区.
鉴于目前有关上消化道内镜筛查依从性的研究对象为城市居民, 关于农村居民的相关研究较为少见.
本研究主要观察农民上消化道早癌高危人群筛查依从性的影响因素, 构建分类树预测模型.
选取2023-02/2023-08嵊州市800名上消化道早癌高危农民, 统计随访依从情况及随访筛查结果, 采用Logistic回归-分类树模型分析农民上消化道早癌高危人群筛查依从性的影响因素, 受试者工作特征曲线评价模型预测效能.
依从组与不依从组年龄、学历、家庭月收入、饮酒史、癌症家族史、健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、健康素养相比, 差异均有统计学意义(P<0.05); Logistic回归分析显示, 家庭月收入、饮酒史、愿意健康体检、癌症防治认知度、具备健康素养、对内镜检查感到害怕、无症状不愿筛查是上消化道早癌高危农民筛查依从性的影响因素(P<0.05); 分类树结果显示, 健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、具备健康素养是上消化道早癌高危农民筛查依从性的影响因素; 分类树模型的曲线下面积(area under the curve, AUC)小于Logistic回归模型的AUC, 提示分类树模型拟合效果较好.
健康体检意愿、对内镜检查感到害怕、无症状不愿筛查、癌症防治认知度、具备健康素养是上消化道早癌高危农民筛查依从性的影响因素, 根据上述构建的分类树模型具有良好的预测效能.
本研究为快速、便捷、准确地筛查需进行依从性强化干预的人群提供参考, 从而提高上消化道早癌检出率或减少上消化道的发生.
学科分类: 胃肠病学和肝病学
手稿来源地: 浙江省
同行评议报告学术质量分类
A级 (优秀): 0
B级 (非常好): B
C级 (良好): C
D级 (一般): D, D
E级 (差): 0
科学编辑:张砚梁 制作编辑:张砚梁
1. | Sung H, Ferlay J, Siegel RL, Laversanne M, Soerjomataram I, Jemal A, Bray F. Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. CA Cancer J Clin. 2021;71:209-249. [PubMed] [DOI] |
2. | Zeng H, Chen W, Zheng R, Zhang S, Ji JS, Zou X, Xia C, Sun K, Yang Z, Li H, Wang N, Han R, Liu S, Li H, Mu H, He Y, Xu Y, Fu Z, Zhou Y, Jiang J, Yang Y, Chen J, Wei K, Fan D, Wang J, Fu F, Zhao D, Song G, Chen J, Jiang C, Zhou X, Gu X, Jin F, Li Q, Li Y, Wu T, Yan C, Dong J, Hua Z, Baade P, Bray F, Jemal A, Yu XQ, He J. Changing cancer survival in China during 2003-15: a pooled analysis of 17 population-based cancer registries. Lancet Glob Health. 2018;6:e555-e567. [PubMed] [DOI] |
3. | Xia R, Zeng H, Liu W, Xie L, Shen M, Li P, Li H, Wei W, Chen W, Zhuang G. Estimated Cost-effectiveness of Endoscopic Screening for Upper Gastrointestinal Tract Cancer in High-Risk Areas in China. JAMA Netw Open. 2021;4:e2121403. [PubMed] [DOI] |
4. | 陈 继理, 李 学民, 杨 文清, 李 爱芳, 王 伟鹏, 千 美青, 王 琳, 陈 思远, 暴 志芹, 张 云杰. 2005-2010年磁县食管癌早诊早治内镜普查工作总结. 中国肿瘤. 2011;20:640-642. |
5. | 郭 兰伟, 张 韶凯, 刘 曙正, 杨 福娜, 郑 黎阳, 陈 琼, 曹 小琴, 孙 喜斌, 张 建功. 2013-2017年河南省城市地区上消化道癌高危人群内镜随访依从性及相关因素分析. 中华预防医学杂志. 2020;54:523-528. [DOI] |
6. | Ahmed M, Ahmed A. Palm tree disease detection and classification using residual network and transfer learning of inception ResNet. PLoS One. 2023;18:e0282250. [PubMed] [DOI] |
8. | 于 英红, 晏 秋雨, 谢 娟. 中国居民健康素养研究进展. 中国慢性病预防与控制. 2021;29:530-534. [DOI] |
9. | 胡 永建, 吴 慧晴, 李 婧雯, 王 严娜, 李 雪晨, 陈 大笑, 延 怡迪, 刘 玉青. 河南省居民肿瘤防治认知行为及态度调查结果分析. 安徽预防医学杂志. 2022;28:96-100. [DOI] |
10. | 文 进博, 孙 中明, 缪 丹丹, 陈 思红, 何 士林, 孙 维新, 周 金意, 罗 鹏飞, 潘 恩春. 江苏省淮安市高危人群上消化道早期癌影响因素分析. 中国肿瘤. 2019;28:749-756. [DOI] |
11. | Waddingham W, Kamran U, Kumar B, Trudgill NJ, Tsiamoulos ZP, Banks M. Complications of diagnostic upper Gastrointestinal endoscopy: common and rare - recognition, assessment and management. BMJ Open Gastroenterol. 2022;9. [PubMed] [DOI] |
12. | Ono H, Yao K, Fujishiro M, Oda I, Uedo N, Nimura S, Yahagi N, Iishi H, Oka M, Ajioka Y, Fujimoto K. Guidelines for endoscopic submucosal dissection and endoscopic mucosal resection for early gastric cancer (second edition). Dig Endosc. 2021;33:4-20. [PubMed] [DOI] |
13. | Hamashima C, Goto R. Potential capacity of endoscopic screening for gastric cancer in Japan. Cancer Sci. 2017;108:101-107. [PubMed] [DOI] |
14. | Heinemann M, Probst M, Ungeheuer E. [Ultraradical surgery of the shoulder and thoracic wall--indications and prognosis]. Chirurg. 1987;58:149-153. [PubMed] [DOI] |
15. | Joshi RD, Dhakal CK. Predicting Type 2 Diabetes Using Logistic Regression and Machine Learning Approaches. Int J Environ Res Public Health. 2021;18. [PubMed] [DOI] |
16. | Kong Q, Li Y, Li R, Li Z, Zheng X, Wang Z, Song K, Zhang X, Liu J, Han Z, Duan M, Ding Y, Zhang W, Lin M, Wang J, Wan M, Lin B, Wang S, Zuo X, Li Y. Low compliance to post-screening recommendations in a family-based Helicobacter pylori screening and treatment program: A prospective cohort study. Helicobacter. 2022;27:e12912. [PubMed] [DOI] |
18. | Laszkowska M, Rodriguez S, Kim J, Hur C. Heavy Alcohol Use Is Associated With Gastric Cancer: Analysis of the National Health and Nutrition Examination Survey From 1999 to 2010. Am J Gastroenterol. 2021;116:1083-1086. [PubMed] [DOI] |
19. | Moore C, Hassett D, Dunne S. Health literacy in cancer caregivers: a systematic review. J Cancer Surviv. 2021;15:825-836. [PubMed] [DOI] |
20. | He C, Pei C, Ma J. Developing an evaluation indicators of health literacy for cervical cancer among Chinese women: a modified Delphi method study. BMC Cancer. 2023;23:863. [PubMed] [DOI] |
21. | 齐 力, 石 建辉, 徐 露婷, 杜 世昌, 刘 秀荣. 北京市居民健康素养水平影响因素多水平模型分析. 中国慢性病预防与控制. 2022;30:332-335. [DOI] |
22. | Dobashi A, Li DK, Mavrogenis G, Visrodia KH, Bazerbachi F. Endoscopic Management of Esophageal Cancer. Thorac Surg Clin. 2022;32:479-495. [PubMed] [DOI] |
23. | Su Y, Tian X, Gao R, Guo W, Chen C, Chen C, Jia D, Li H, Lv X. Colon cancer diagnosis and staging classification based on machine learning and bioinformatics analysis. Comput Biol Med. 2022;145:105409. [PubMed] [DOI] |