Please wait a minute...
文章检索
预防医学  2021, Vol. 33 Issue (8): 827-829    DOI: 10.19485/j.cnki.issn2096-5087.2021.08.019
  疾病控制 本期目录 | 过刊浏览 | 高级检索 |
应用C5.0算法决策树模型预测高脂血症
胡美兰1, 阮天音2, 李澔2, 潘教亦3, 何富乐4
1. 浙江大学医学院附属杭州市第一人民医院预防保健科,浙江 杭州 310006;
2. 浙江中医药大学第一临床医学院;
3. 浙江中医药大学第三临床医学院;
4. 浙江中医药大学博物馆
全文: PDF(871 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 目的 评价C5.0决策树模型预测高脂血症的效果,为高脂血症预防及早期干预提供依据。方法 选取2019年8月―2020年7月浙江大学医学院附属杭州市第一人民医院的体检人群为调查对象。通过查阅体检人群的健康管理档案收集人口学情况、体格检查、实验室指标和生活行为方式资料。采用C5.0算法决策树模型分别建立个人水平模型和临床模型预测高脂血症,计算准确率、Kappa值和绘制受试者工作特征曲线(ROC)评价预测效果。结果 共纳入382人,高脂血症232例,占70.73%。个人水平模型预测因素预测精度由高到低依次为高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为84.16%,最低为63.44%。临床模型预测因素预测精度由高到低依次为谷丙转氨酶、谷草转氨酶、空腹血糖、血压、总胆红素、高密度脂蛋白、高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为91.63%,最低为82.38%。个人水平模型训练样本和测试样本的预测准确率分别为80.20%和82.02%;临床模型训练样本和测试样本的预测准确率分别为91.13%和88.76%。个人水平模型的Kappa值为0.623;临床模型的Kappa值为0.803。个人水平模型训练样本和测试样本的AUC值分别为0.824和0.836,均小于临床模型的0.909和0.887(均P<0.05)。结论 C5.0算法建立决策树模型对体检人群中隐匿性高脂血症患者具有较好的预测效果,可在临床应用推广。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
胡美兰
阮天音
李澔
潘教亦
何富乐
关键词 高脂血症决策树模型预测    
收稿日期: 2020-12-31      修回日期: 2021-04-24      出版日期: 2021-08-10
中图分类号:  R195  
作者简介: 胡美兰,本科,副主任医师,主要从事预防保健工作
通信作者: 何富乐,E-mail:27145261@qq.com   
引用本文:   
胡美兰, 阮天音, 李澔, 潘教亦, 何富乐. 应用C5.0算法决策树模型预测高脂血症[J]. 预防医学, 2021, 33(8): 827-829.
链接本文:  
https://www.zjyfyxzz.com/CN/Y2021/V33/I8/827
[1] 刘晶晶,贾连群,吕美君,等.高脂血症中西医结合研究进展[J].中华中医药学刊,2017,35(4):815-818.
[2] 张光,王广银,吴红彦,等.健康管理人群高脂血症风险预测模型[J].山东大学学报(医学版),2017,55(6):72-76.
[3] 黄伟文,祁雷,顾玉慧,等.胸痛中心模式对老年急性非创伤性胸痛患者急救质量的影响[J].中国老年学杂志,2020,40(7):1352-1355.
[4] 郭正军,宋景贵,王静,等.C5.0决策树模型在严重精神障碍患者服药依从性预测中的探讨[J].现代预防医学,2021,48(1):110-113,189.
[5] 中国成人血脂异常防治指南修订联合委员会.中国成人血脂异常防治指南(2016年修订版)[J].中华循环杂志,2016,31(10):937-953.
[6] 陆再英,钟南山.内科学[M].北京:人民卫生出版社,2008:801.
[7] 郑丽丽. 山东大学教师血脂水平及相关因素分析研究[D].济南:山东大学,2014.
[8] 杨洁. 数据挖掘技术在临床疾病诊疗中的应用研究[D].青岛:中国海洋大学,2013.
[9] 罗森林,成华,张铁梅,等.多维2型糖尿病实测数据的预处理技术[J].计算机工程,2004(17):178-181.
[10] 王鲁兴. 数据挖掘技术在肿瘤疾病诊疗中的应用研究[D].青岛:青岛科技大学,2017.
[11] 于长春. 决策树模型在2型糖尿病患者脑梗死风险预测中的应用[J].中国卫生统计,2011,28(6):683-684.
[1] 卢文海, 孔校杰, 宋丽霞, 卢春如, 于碧鲲, 谢延. SARIMA、Prophet与BSTS模型预测手足口病发病率的效果比较[J]. 预防医学, 2026, 38(1): 79-84.
[2] 龚亮亮, 戎志东. 10~13岁儿童非自杀性自伤行为风险预测模型研究[J]. 预防医学, 2025, 37(6): 546-550.
[3] 白瑞盈, 生海燕. 肺炎住院患者多重耐药菌感染的预测模型研究[J]. 预防医学, 2025, 37(5): 465-470.
[4] 王英杰 综述, 孙高峰, 审校. 2型糖尿病预测模型研究进展[J]. 预防医学, 2025, 37(4): 369-372,377.
[5] 李倩, 杨柏林, 陈积标, 尹寒露, 许祝平, 孟晓军. 无锡市50岁及以上HIV/AIDS抗病毒治疗病例自报慢性病资料分析[J]. 预防医学, 2025, 37(4): 390-394.
[6] 张小乔, 张筱碟, 赵振希, 谢鹏留, 代敏. LSTM、SARIMA和SARIMAX模型预测手足口病发病率的效果比较[J]. 预防医学, 2025, 37(3): 280-284,287.
[7] 潘祥, 童莺歌, 李怡萱, 倪珂, 程雯倩, 辛蒙雨, 胡钰滢. 机器学习方法构建健康素养预测模型的范围综述[J]. 预防医学, 2025, 37(2): 148-153.
[8] 李欣格, 王丽娟, 宋亮, 丁海峰, 高彦杰. 男男性行为人群暴露前预防使用的影响因素分析[J]. 预防医学, 2025, 37(12): 1201-1205.
[9] 周国营, 邢丽丽, 苏颖, 刘宏杰, 刘赫, 王迪, 薛锦峰, 戴威, 汪静, 杨兴华. 35~75岁居民心血管病高危风险预测模型研究[J]. 预防医学, 2025, 37(1): 12-16.
[10] 郑帅印, 李丽丹, 陈佩弟, 谢尔瓦妮古丽·阿卜力米提, 李砥. 2型糖尿病合并非酒精性脂肪肝的预测模型研究[J]. 预防医学, 2024, 36(9): 741-745,749.
[11] 汪琼, 陈丹青, 魏伊丽, 钱芳芳. 早产风险预测模型研究[J]. 预防医学, 2024, 36(8): 663-668.
[12] 贾铭, 赵华, 彭菊意, 刘星宇, 刘宇丹, 侯嘉宁, 杨佳乐. 慢性病共病患者预后预测模型的范围综述[J]. 预防医学, 2024, 36(6): 491-495.
[13] 陈佩弟, 肖婷婷, 李新秀, 郑帅印, 黄芸. 2016—2023年乌鲁木齐市大气PM2.5污染分析及建立预测模型[J]. 预防医学, 2024, 36(6): 510-513.
[14] 高梦阳, 娄鹏威, 马丽, 李惠, 黄玉婷, 王璐, 王凯. 甲状腺乳头状癌中央区淋巴结转移预测模型研究[J]. 预防医学, 2023, 35(3): 229-234.
[15] 武亚星, 刘宏, 冯剑, 杨桂茂, 程雪兵, 徐茜, 孙晓东, 任艳峰. 2型糖尿病患者微血管并发症的影响因素分析[J]. 预防医学, 2023, 35(11): 926-930.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed