|
|
应用C5.0算法决策树模型预测高脂血症 |
胡美兰1, 阮天音2, 李澔2, 潘教亦3, 何富乐4
|
1. 浙江大学医学院附属杭州市第一人民医院预防保健科,浙江 杭州 310006; 2. 浙江中医药大学第一临床医学院; 3. 浙江中医药大学第三临床医学院; 4. 浙江中医药大学博物馆 |
|
|
摘要 目的 评价C5.0决策树模型预测高脂血症的效果,为高脂血症预防及早期干预提供依据。方法 选取2019年8月―2020年7月浙江大学医学院附属杭州市第一人民医院的体检人群为调查对象。通过查阅体检人群的健康管理档案收集人口学情况、体格检查、实验室指标和生活行为方式资料。采用C5.0算法决策树模型分别建立个人水平模型和临床模型预测高脂血症,计算准确率、Kappa值和绘制受试者工作特征曲线(ROC)评价预测效果。结果 共纳入382人,高脂血症232例,占70.73%。个人水平模型预测因素预测精度由高到低依次为高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为84.16%,最低为63.44%。临床模型预测因素预测精度由高到低依次为谷丙转氨酶、谷草转氨酶、空腹血糖、血压、总胆红素、高密度脂蛋白、高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为91.63%,最低为82.38%。个人水平模型训练样本和测试样本的预测准确率分别为80.20%和82.02%;临床模型训练样本和测试样本的预测准确率分别为91.13%和88.76%。个人水平模型的Kappa值为0.623;临床模型的Kappa值为0.803。个人水平模型训练样本和测试样本的AUC值分别为0.824和0.836,均小于临床模型的0.909和0.887(均P<0.05)。结论 C5.0算法建立决策树模型对体检人群中隐匿性高脂血症患者具有较好的预测效果,可在临床应用推广。
|
|
关键词 :
高脂血症,
决策树模型,
预测
|
收稿日期: 2020-12-31
修回日期: 2021-04-24
出版日期: 2021-08-10
|
|
通信作者:
何富乐,E-mail:27145261@qq.com
|
作者简介: 胡美兰,本科,副主任医师,主要从事预防保健工作 |
[1] 刘晶晶,贾连群,吕美君,等.高脂血症中西医结合研究进展[J].中华中医药学刊,2017,35(4):815-818. [2] 张光,王广银,吴红彦,等.健康管理人群高脂血症风险预测模型[J].山东大学学报(医学版),2017,55(6):72-76. [3] 黄伟文,祁雷,顾玉慧,等.胸痛中心模式对老年急性非创伤性胸痛患者急救质量的影响[J].中国老年学杂志,2020,40(7):1352-1355. [4] 郭正军,宋景贵,王静,等.C5.0决策树模型在严重精神障碍患者服药依从性预测中的探讨[J].现代预防医学,2021,48(1):110-113,189. [5] 中国成人血脂异常防治指南修订联合委员会.中国成人血脂异常防治指南(2016年修订版)[J].中华循环杂志,2016,31(10):937-953. [6] 陆再英,钟南山.内科学[M].北京:人民卫生出版社,2008:801. [7] 郑丽丽. 山东大学教师血脂水平及相关因素分析研究[D].济南:山东大学,2014. [8] 杨洁. 数据挖掘技术在临床疾病诊疗中的应用研究[D].青岛:中国海洋大学,2013. [9] 罗森林,成华,张铁梅,等.多维2型糖尿病实测数据的预处理技术[J].计算机工程,2004(17):178-181. [10] 王鲁兴. 数据挖掘技术在肿瘤疾病诊疗中的应用研究[D].青岛:青岛科技大学,2017. [11] 于长春. 决策树模型在2型糖尿病患者脑梗死风险预测中的应用[J].中国卫生统计,2011,28(6):683-684. |
|
Viewed |
|
|
|
Full text
|
|
|
|
|
Abstract
|
|
|
|
|
Cited |
|
|
|
|
|
Shared |
|
|
|
|
|
Discussed |
|
|
|
|