采用XGBoost和随机森林探索中国西部女性乳腺癌危险因素
彭佳丽1 刘春容2 李旭1 易芳1 李佳圆1
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

彭佳丽1 刘春容2 李旭1 易芳1 李佳圆1,. 采用XGBoost和随机森林探索中国西部女性乳腺癌危险因素[J]. 预防医学杂志,2020.5. DOI:.
摘要:
目的采用XGBoost和随机森林法探索中国西部女性乳腺癌危险因素。方法 2014-2015年间采用病例对照研究设计序贯收集病例788例,对照801例。问卷调查研究对象乳腺癌相关危险因素信息;采用飞行时间质谱生物芯片技术检测对象乳腺癌易感基因的SNPs突变,并估计多个基因的联合评分(polygenetic risk score,PRS)。按绝经状态为分层因素,分别用XGBoost和随机森林构建绝经前/后乳腺癌风险预测模型,筛选乳腺癌相关危险因素并进重要性排序。结果两种算法筛选的乳腺癌危险因素清单前10位显示,绝经前/后主要的危险因素包括总哺乳时间、人工节育器累积使用时间、PRS、被动吸烟年限、BMI及体重信息和年龄。两种模型在绝经前后AUC值均大于70%。结论通过两种机器学习法筛选的危险因素较为一致,这些因素将有助于筛选中国西部女性的乳腺癌高危因素,以实现乳腺癌风险分级管理。
关键词: 乳腺癌;危险因素;XGBoost;随机森林;多基因评分
DOI:
基金资助:

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。