Please wait a minute...
文章检索
预防医学  2021, Vol. 33 Issue (8): 827-829    DOI: 10.19485/j.cnki.issn2096-5087.2021.08.019
  疾病控制 本期目录 | 过刊浏览 | 高级检索 |
应用C5.0算法决策树模型预测高脂血症
胡美兰1, 阮天音2, 李澔2, 潘教亦3, 何富乐4
1. 浙江大学医学院附属杭州市第一人民医院预防保健科,浙江 杭州 310006;
2. 浙江中医药大学第一临床医学院;
3. 浙江中医药大学第三临床医学院;
4. 浙江中医药大学博物馆
全文: PDF(871 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 目的 评价C5.0决策树模型预测高脂血症的效果,为高脂血症预防及早期干预提供依据。方法 选取2019年8月―2020年7月浙江大学医学院附属杭州市第一人民医院的体检人群为调查对象。通过查阅体检人群的健康管理档案收集人口学情况、体格检查、实验室指标和生活行为方式资料。采用C5.0算法决策树模型分别建立个人水平模型和临床模型预测高脂血症,计算准确率、Kappa值和绘制受试者工作特征曲线(ROC)评价预测效果。结果 共纳入382人,高脂血症232例,占70.73%。个人水平模型预测因素预测精度由高到低依次为高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为84.16%,最低为63.44%。临床模型预测因素预测精度由高到低依次为谷丙转氨酶、谷草转氨酶、空腹血糖、血压、总胆红素、高密度脂蛋白、高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为91.63%,最低为82.38%。个人水平模型训练样本和测试样本的预测准确率分别为80.20%和82.02%;临床模型训练样本和测试样本的预测准确率分别为91.13%和88.76%。个人水平模型的Kappa值为0.623;临床模型的Kappa值为0.803。个人水平模型训练样本和测试样本的AUC值分别为0.824和0.836,均小于临床模型的0.909和0.887(均P<0.05)。结论 C5.0算法建立决策树模型对体检人群中隐匿性高脂血症患者具有较好的预测效果,可在临床应用推广。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
胡美兰
阮天音
李澔
潘教亦
何富乐
关键词 高脂血症决策树模型预测    
收稿日期: 2020-12-31      修回日期: 2021-04-24      出版日期: 2021-08-10
中图分类号:  R195  
通信作者: 何富乐,E-mail:27145261@qq.com   
作者简介: 胡美兰,本科,副主任医师,主要从事预防保健工作
引用本文:   
胡美兰, 阮天音, 李澔, 潘教亦, 何富乐. 应用C5.0算法决策树模型预测高脂血症[J]. 预防医学, 2021, 33(8): 827-829.
链接本文:  
http://www.zjyfyxzz.com/CN/Y2021/V33/I8/827
[1] 刘晶晶,贾连群,吕美君,等.高脂血症中西医结合研究进展[J].中华中医药学刊,2017,35(4):815-818.
[2] 张光,王广银,吴红彦,等.健康管理人群高脂血症风险预测模型[J].山东大学学报(医学版),2017,55(6):72-76.
[3] 黄伟文,祁雷,顾玉慧,等.胸痛中心模式对老年急性非创伤性胸痛患者急救质量的影响[J].中国老年学杂志,2020,40(7):1352-1355.
[4] 郭正军,宋景贵,王静,等.C5.0决策树模型在严重精神障碍患者服药依从性预测中的探讨[J].现代预防医学,2021,48(1):110-113,189.
[5] 中国成人血脂异常防治指南修订联合委员会.中国成人血脂异常防治指南(2016年修订版)[J].中华循环杂志,2016,31(10):937-953.
[6] 陆再英,钟南山.内科学[M].北京:人民卫生出版社,2008:801.
[7] 郑丽丽. 山东大学教师血脂水平及相关因素分析研究[D].济南:山东大学,2014.
[8] 杨洁. 数据挖掘技术在临床疾病诊疗中的应用研究[D].青岛:中国海洋大学,2013.
[9] 罗森林,成华,张铁梅,等.多维2型糖尿病实测数据的预处理技术[J].计算机工程,2004(17):178-181.
[10] 王鲁兴. 数据挖掘技术在肿瘤疾病诊疗中的应用研究[D].青岛:青岛科技大学,2017.
[11] 于长春. 决策树模型在2型糖尿病患者脑梗死风险预测中的应用[J].中国卫生统计,2011,28(6):683-684.
[1] 高梦阳, 娄鹏威, 马丽, 李惠, 黄玉婷, 王璐, 王凯. 甲状腺乳头状癌中央区淋巴结转移预测模型研究[J]. 预防医学, 2023, 35(3): 229-234.
[2] 郁小红, 钱棪梅, 周晨洁, 马越, 唐艳超, 邹玲莉. 应用TreeNet算法建立原发性高血压早期预测模型[J]. 预防医学, 2022, 34(9): 923-927.
[3] 何亚盛, 张红霞, 倪银, 朱越燕, 彭敏, 杨丹红. 急诊重症监护病房住院患者医院感染的预测模型研究[J]. 预防医学, 2022, 34(9): 919-922.
[4] 王冬, 陈基快, 蔡文杰, 陈岳涛, 蒋春燕, 郁小红. 飞行人员高脂血症与肠道菌群分布研究[J]. 预防医学, 2022, 34(7): 665-671.
[5] 余鸽, 娄乐, 徐方忠. 记忆任务指标评估抑郁障碍风险研究[J]. 预防医学, 2022, 34(7): 687-691.
[6] 吴昊澄, 鲁琴宝, 丁哲渊, 王心怡, 傅天颖, 杨珂, 吴晨, 林君芬. 基于百度指数和手足口病的疱疹性咽峡炎预测模型研究[J]. 预防医学, 2022, 34(3): 217-221.
[7] 王迎丹, 高春洁, 王蕾. 5种时间序列模型预测肺结核发病比较[J]. 预防医学, 2022, 34(12): 1194-1200.
[8] 苏银霞, 卢耀勤, 田翔华, 李莉, 姚华. 基于常规体检指标的2型糖尿病风险预测研究进展[J]. 预防医学, 2022, 34(12): 1230-1234.
[9] 吕晓丽, 朱一, 竹军伟. 纳入气象因素的ARIMAX模型预测流行性感冒流行趋势[J]. 预防医学, 2021, 33(8): 780-783.
[10] 孙秀秀, 刘光涛, 刘艳, 沈建勇. ARIMA乘积季节模型预测湖州市手足口病流行趋势[J]. 预防医学, 2021, 33(8): 801-803,807.
[11] 朱周靓, 张世鑫, 郑云燕, 严峻, 孟真, 胡争艳. 决明子提取物对高脂血症大鼠血脂和肝肾功能的影响[J]. 预防医学, 2021, 33(12): 1290-1294.
[12] 尹锡玲, 代文灿, 王松, 周勇, 朱克京, 梁小冬, 李德云, 谭爱军. 传染病综合指数预测研究[J]. 预防医学, 2019, 31(9): 897-900.
[13] 伊曼, 田沛茹, 孙秋红, 时景璞. 凤城市居民伤害死亡趋势分析及预测[J]. 预防医学, 2019, 31(8): 778-781,785.
[14] 姜鹏, 何勇, 李江波, 邵一宇, 楼理洋, 刘庆敏. 富阳区成人伤害病例时间序列分析[J]. 预防医学, 2019, 31(8): 795-797.
[15] 吴琳, 何凡, 周标. 应用灰色模型预测浙江省基层卫生专业技术人员配置[J]. 预防医学, 2019, 31(5): 530-533.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed