数据描述
本心脏病数据集精心整合了克利夫兰、匈牙利、瑞士、弗吉尼亚州长滩、Statlog(Heart)这五个曾在 UCI 机器学习库独立发布的数据集,基于 11 个常见临床特征首次合并,是目前用于心脏病研究的最大统一数据集。含 1026 名患者数据,14 个临床和诊断属性,目标变量为是否存在冠状动脉疾病(CAD),助力更可靠的心脏病预测机器学习模型训练评估,为心脏病早期诊断和临床决策提供有力支持。
产品基本信息
- 数据规模:包含 1026 名患者数据。
- 特征数量:具备 14 个临床和诊断属性,如年龄、性别、胸痛类型、静息血压、血清胆固醇等。
- 目标变量:是否存在冠状动脉疾病(CAD),1 表示有心脏病,0 表示正常(无疾病) 。
- 源数据集:克利夫兰、匈牙利、瑞士、弗吉尼亚州长滩、Statlog(Heart)数据集。
- 许可证:CC0 公共领域许可。
- 预期更新频率:从不更新。
- 标签:心脏疾病。
产品使用说明
- 数据预处理:检查数据完整性,处理缺失值(若有),对数值型数据(如年龄、静息血压等)进行标准化,对分类数据(如胸痛类型、性别等)进行编码处理,为建模做准备。
- 模型训练:选择合适的机器学习模型,如逻辑回归、决策树、随机森林、支持向量机等,将处理后的数据按一定比例划分为训练集和测试集,在训练集上训练模型,调整超参数以优化性能。
- 模型评估:使用测试集评估训练好的模型,通过准确率、召回率、F1 值、ROC 曲线下面积(AUC)等指标衡量模型对心脏病预测的准确性、敏感性和特异性等。
- 临床应用辅助:依据模型预测结果,结合临床经验,辅助医生进行心脏病早期诊断和临床决策。
应用场景
- 医学科研机构:科研人员可利用该数据集开发和验证新的心脏病预测算法与模型,探索不同临床特征与心脏病发病的关联,推动心脏病研究进展。
- 医疗机构:医生借助训练好的模型,结合患者实际临床数据,更精准地评估患者患心脏病风险,辅助制定个性化诊疗方案,提高早期诊断准确率。
- 医药企业:用于药物研发过程中,筛选合适患者群体,评估药物对不同特征心脏病患者的疗效,助力临床试验设计和药物疗效评估。
相似产品
产品来源
本数据集由五个曾在 UCI 机器学习库独立发布的心脏病数据集整合而成,基于 11 个常见临床特征进行合并。旨在为心脏病预测的机器学习研究和临床应用提供全面、丰富的数据资源,以促进心脏病早期诊断和临床决策水平提升,采用 CC0 公共领域许可,可自由使用。
验证报告
以下为卖家选择提供的数据验证报告:

心脏骤停数据集 心脏病综合数据集 医学科研必备 整合 5 大 UCI 源数据 14 临床诊断属性 支持心脏病预测模型训练
¥1.99
已售 0
6.21KB
申请报告