热带病与寄生虫学 ›› 2023, Vol. 21 ›› Issue (4): 223-227.doi: 10.3969/j.issn.1672-2302.2023.04.010
摘要:
目的 分析新型冠状病毒感染病例密切接触者感染的影响因素及影响因素之间的交互作用,为制定精准防控方案提供科学依据。方法 收集2022年3月14日—30日铜陵市报告的新型冠状病毒感染病例及密切接触者数据,采用随机森林算法筛选强相关影响因素,再构建多因素交互logistic回归模型分析密切接触者感染的影响因素及各因素间的交互效应。结果 铜陵市新型冠状病毒感染病例密切接触者总体感染率为1.95%(101/5 168)。随机森林算法筛选出接触方式、接触频率、关联病例关系、接触地点、关联病例临床情况、年龄、性别、职业等8项重要性评分较高的影响因素。多因素交互logistic回归模型分析结果显示,新型冠状病毒感染病例密切接触者感染情况与“共同生活”(r=0.382,P<0.05)和“经常接触”(r=0.139,P<0.05)呈正相关;交互效应方面,与“共同生活”+“家庭”(r=0.761,P<0.05)、“≤10岁”+“亲属”(r=0.252,P<0.05)、“同事朋友”+“经常接触”(r=0.132,P<0.05)等3项交互效应呈正相关,与“同空间但无直接接触”+“偶尔接触”(r=-0.122,P<0.05)以及“>60岁”+“偶尔接触”(r=-0.221,P<0.05)的交互效应呈负相关。相较传统logistic回归模型,多因素交互logistic回归模型准确率提高了8.04%,精确率提高了13.24%,召回率提高了4.44%,F1分数提高了7.45%。结论 将随机森林算法与logistic完全二次交互回归模型相结合,能从样本有限的多因素数据中有效挖掘各因素之间的二次交互效应,为疾病防控提供有力支持。
中图分类号: