Please wait a minute...
文章检索
预防医学  2021, Vol. 33 Issue (8): 827-829    DOI: 10.19485/j.cnki.issn2096-5087.2021.08.019
  疾病控制 本期目录 | 过刊浏览 | 高级检索 |
应用C5.0算法决策树模型预测高脂血症
胡美兰1, 阮天音2, 李澔2, 潘教亦3, 何富乐4
1. 浙江大学医学院附属杭州市第一人民医院预防保健科,浙江 杭州 310006;
2. 浙江中医药大学第一临床医学院;
3. 浙江中医药大学第三临床医学院;
4. 浙江中医药大学博物馆
全文: PDF(871 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 目的 评价C5.0决策树模型预测高脂血症的效果,为高脂血症预防及早期干预提供依据。方法 选取2019年8月―2020年7月浙江大学医学院附属杭州市第一人民医院的体检人群为调查对象。通过查阅体检人群的健康管理档案收集人口学情况、体格检查、实验室指标和生活行为方式资料。采用C5.0算法决策树模型分别建立个人水平模型和临床模型预测高脂血症,计算准确率、Kappa值和绘制受试者工作特征曲线(ROC)评价预测效果。结果 共纳入382人,高脂血症232例,占70.73%。个人水平模型预测因素预测精度由高到低依次为高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为84.16%,最低为63.44%。临床模型预测因素预测精度由高到低依次为谷丙转氨酶、谷草转氨酶、空腹血糖、血压、总胆红素、高密度脂蛋白、高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为91.63%,最低为82.38%。个人水平模型训练样本和测试样本的预测准确率分别为80.20%和82.02%;临床模型训练样本和测试样本的预测准确率分别为91.13%和88.76%。个人水平模型的Kappa值为0.623;临床模型的Kappa值为0.803。个人水平模型训练样本和测试样本的AUC值分别为0.824和0.836,均小于临床模型的0.909和0.887(均P<0.05)。结论 C5.0算法建立决策树模型对体检人群中隐匿性高脂血症患者具有较好的预测效果,可在临床应用推广。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
胡美兰
阮天音
李澔
潘教亦
何富乐
关键词 高脂血症决策树模型预测    
收稿日期: 2020-12-31      出版日期: 2021-08-10
ZTFLH:  R195  
通信作者: 何富乐,E-mail:27145261@qq.com   
作者简介: 胡美兰,本科,副主任医师,主要从事预防保健工作
引用本文:   
胡美兰, 阮天音, 李澔, 潘教亦, 何富乐. 应用C5.0算法决策树模型预测高脂血症[J]. 预防医学, 2021, 33(8): 827-829.
链接本文:  
http://www.zjyfyxzz.com/CN/Y2021/V33/I8/827
[1] 刘晶晶,贾连群,吕美君,等.高脂血症中西医结合研究进展[J].中华中医药学刊,2017,35(4):815-818.
[2] 张光,王广银,吴红彦,等.健康管理人群高脂血症风险预测模型[J].山东大学学报(医学版),2017,55(6):72-76.
[3] 黄伟文,祁雷,顾玉慧,等.胸痛中心模式对老年急性非创伤性胸痛患者急救质量的影响[J].中国老年学杂志,2020,40(7):1352-1355.
[4] 郭正军,宋景贵,王静,等.C5.0决策树模型在严重精神障碍患者服药依从性预测中的探讨[J].现代预防医学,2021,48(1):110-113,189.
[5] 中国成人血脂异常防治指南修订联合委员会.中国成人血脂异常防治指南(2016年修订版)[J].中华循环杂志,2016,31(10):937-953.
[6] 陆再英,钟南山.内科学[M].北京:人民卫生出版社,2008:801.
[7] 郑丽丽. 山东大学教师血脂水平及相关因素分析研究[D].济南:山东大学,2014.
[8] 杨洁. 数据挖掘技术在临床疾病诊疗中的应用研究[D].青岛:中国海洋大学,2013.
[9] 罗森林,成华,张铁梅,等.多维2型糖尿病实测数据的预处理技术[J].计算机工程,2004(17):178-181.
[10] 王鲁兴. 数据挖掘技术在肿瘤疾病诊疗中的应用研究[D].青岛:青岛科技大学,2017.
[11] 于长春. 决策树模型在2型糖尿病患者脑梗死风险预测中的应用[J].中国卫生统计,2011,28(6):683-684.
[1] 郑伟, 戴伊宁, 孙楠楠, 尹乔乔, 吴青青, 惠田辰, 吴文昊, 黄海军, 童永喜, 黄益澄, 汪明珊, 陈美娟, 张家杰, 严蓉, 高海女, 潘红英. 应用随机森林模型和Logistic回归模型分析COVID-19的影响因素[J]. 预防医学, 0, (): 722-725.
[2] 吴位新, 陈强, 王祚懿, 盛微, 郭震. 农村小型集中式供水细菌污染控制效果评价[J]. 预防医学, 0, (): 735-737.
[3] 俞素芬, 陈利强, 厉小英, 王瑛, 张月影. 吴兴区农民健康素养调查[J]. 预防医学, 0, (): 738-741.
[4] 戚小华, 刘碧瑶, 王臻, 张人杰. 浙江省境外输入新型冠状病毒肺炎病例特征[J]. 预防医学, 2021, 33(6): 541-544.
[5] 金元, 景素芬, 郑康杰, 吴晓琳, 施伶俐, 刘梦, 薛俊磊. 宝山区中小学生饮食行为调查[J]. 预防医学, 2021, 33(6): 586-588.
[6] 沈惠良, 王涧, 严丽英, 黄佳, 夏莹烨. 梅毒患者血清固定的影响因素分析[J]. 预防医学, 2021, 33(6): 589-591.
[7] 任帆, 施妍尔, 嵇龙飞, 蔡云祥. 湖州市儿童急性下呼吸道感染病原体流行特征[J]. 预防医学, 2021, 33(6): 595-598.
[8] 冯亚玲, 姜锡能, 洪静. 2013—2019年兰溪市活动性肺结核病例流行特征[J]. 预防医学, 2021, 33(6): 607-608.
[9] 张丹丹, 章群, 王爱红, 张良, 王雪英, 胡群雄. 北仑区医疗机构CT检查的频度及辐射剂量分析[J]. 预防医学, 2021, 33(6): 618-620.
[10] 沈建勇, 张超, 罗小福, 徐秦儿, 陈奕晔. 湖州市1~12岁儿童水痘疫苗接种情况调查[J]. 预防医学, 2021, 33(6): 624-626.
[11] 王惠根, 王丽春, 盛君霞, 姚超民. 南湖区55岁及以上高血压患者合并高血脂的影响因素分析[J]. 预防医学, 2021, 33(6): 627-630.
[12] 叶傲霜, 林颖, 包佳佳, 何静, 杨新军. 2015—2019年温州市青春期妊娠人群特征分析[J]. 预防医学, 2021, 33(5): 438-441.
[13] 蒙家嘉, 李辉, 王永, 纪威, 冯伟, 张瑞洁, 刘杨, 刘世炜, 韩丽媛. 2009—2018年宁波市居民心血管疾病死亡及早死所致疾病负担趋势分析[J]. 预防医学, 2021, 33(5): 451-456.
[14] 赵栋, 苏丹婷, 黄李春, 陈奇, 朱志宏, 刘胜, 顾炜, 邹艳. 居家老年人营养状况及影响因素分析[J]. 预防医学, 2021, 33(5): 468-472.
[15] 陈红丹, 李万仓, 陈镭, 陈贤, 倪建晓, 杨桂丽. 瓯海区中学生伤害的影响因素分析[J]. 预防医学, 2021, 33(5): 490-493.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed