## 引言与背景
心血管疾病已成为全球范围内威胁人类健康的主要疾病之一,准确的早期诊断对于提高患者生存率至关重要。心脏磁共振(Cardiac Magnetic Resonance, CMR)作为一种无创、无辐射的成像技术,能够提供高分辨率的心脏结构和功能信息,在心血管疾病诊断中发挥着越来越重要的作用。随着人工智能技术的快速发展,基于深度学习的医学影像分析方法为心脏疾病的自动诊断提供了新的解决方案。然而,高质量、大规模的标注数据集是训练可靠AI模型的基础。
本数据集为多序列心脏磁共振(Multi-Sequence Cardiac Magnetic Resonance, MSCMR)预处理数据集,包含来自多个受试者的延迟增强(Delayed Enhancement, DE)序列影像数据。数据集完整包含训练集切片数据、训练集体积数据和测试集体积数据,所有数据均以HDF5格式存储,便于高效读取和处理。这些数据对于训练和验证心脏疾病自动检测、心肌梗死区域识别、心脏功能评估等AI模型具有重要价值,能够推动心血管疾病辅助诊断技术的发展。
## 数据基本信息
### 数据集概览
本数据集包含经过预处理的心脏磁共振延迟增强序列影像,分为三个主要部分:训练集切片(382个)、训练集体积(5个)和测试集体积(15个),总计包含来自45个不同受试者的影像数据。所有文件均采用HDF5格式存储,便于高效的数据读取和深度学习模型训练。
### 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| :--- | :--- | :--- | :--- | :--- |
| 受试者ID | 字符串 | 唯一标识每个受试者的编号 | subject13、subject27 | 100% |
| 序列类型 | 字符串 | 磁共振成像序列类型 | DE(延迟增强) | 100% |
| 数据类型 | 字符串 | 数据形态描述 | slice(切片)、volume(容积) | 100% |
| 切片编号 | 整数 | 同一受试者内切片的序号 | 0、1、10、15、19 | 100% |
| 影像数据 | 数组 | 存储实际的影像像素数据 | 三维/二维数组 | 100% |
| 文件格式 | 字符串 | 数据存储格式 | HDF5 (.h5) | 100% |
### 数据分布情况
#### 数据集类型分布
| 数据类型 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| 训练集切片 | 382 | 95.5% |
| 训练集体积 | 5 | 1.25% |
| 测试集体积 | 15 | 3.75% |
| 总计 | 402 | 100% |
#### 训练集切片受试者分布(Top 10)
| 受试者ID | 切片数量 | 占比 |
| :--- | :--- | :--- |
| subject27 | 20 | 5.24% |
| subject15 | 18 | 4.71% |
| subject19 | 16 | 4.19% |
| subject20 | 16 | 4.19% |
| subject21 | 16 | 4.19% |
| subject24 | 16 | 4.19% |
| subject37 | 16 | 4.19% |
| subject42 | 16 | 4.19% |
| subject2 | 16 | 4.19% |
| subject13 | 15 | 3.93% |
#### 切片数量分布
| 每受试者切片数 | 受试者数量 | 占比 |
| :--- | :--- | :--- |
| 15片 | 15 | 60% |
| 16片 | 7 | 28% |
| 18片 | 1 | 4% |
| 20片 | 1 | 4% |
| 12片 | 1 | 4% |
| 10片 | 1 | 4% |
| 总计 | 25 | 100% |
### 数据规模与特征
- 总文件数: 402个HDF5文件
- 训练集切片数: 382个(来自25个受试者)
- 训练集体积数: 5个(来自5个受试者)
- 测试集体积数: 15个(来自15个受试者)
- 文件格式: HDF5 (.h5)
- 序列类型: 延迟增强序列(DE)
- 覆盖领域: 心血管医学影像
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
| :--- | :--- | :--- |
| 包含完整原始文件 | 提供完整的HDF5格式影像文件,包含实际像素数据 | 支持基于完整影像的深度学习模型训练,可直接用于图像识别、分割等任务 |
| 数据预处理完善 | 所有影像数据均经过预处理,可直接用于模型训练 | 减少数据预处理工作量,提高研究效率 |
| 切片与容积数据兼备 | 同时提供切片级别和容积级别的数据 | 支持不同粒度的模型训练需求,提高模型泛化能力 |
| 训练测试划分明确 | 清晰划分训练集和测试集,便于模型评估 | 确保模型评估的客观性和准确性 |
| 多受试者覆盖 | 包含45个不同受试者的数据,样本多样性丰富 | 提高模型对不同个体差异的适应能力 |
| HDF5高效存储 | 采用HDF5格式存储,支持快速读写和并行处理 | 提升大规模数据训练的效率和性能 |
## 数据样例
以下展示数据集中的部分文件样例,涵盖不同受试者和切片编号:
元数据样例(文件名列表):1. subject2_DE_slice_0.h5 - 训练集切片
2. subject2_DE_slice_9.h5 - 训练集切片
3. subject13_DE_slice_0.h5 - 训练集切片
4. subject13_DE_slice_14.h5 - 训练集切片
5. subject15_DE_slice_0.h5 - 训练集切片
6. subject15_DE_slice_17.h5 - 训练集切片
7. subject27_DE_slice_0.h5 - 训练集切片
8. subject27_DE_slice_19.h5 - 训练集切片
9. subject1_DE.h5 - 训练集体积
10. subject8_DE.h5 - 训练集体积
11. subject10_DE.h5 - 测试集体积
12. subject11_DE.h5 - 测试集体积
13. subject30_DE.h5 - 测试集体积
14. subject43_DE.h5 - 测试集体积
15. subject45_DE_slice_0.h5 - 训练集切片
- 实际数据集中包含完整的原始影像文件,每个HDF5文件包含可直接用于深度学习的影像数组数据。
- 切片数据命名格式:subject{编号}_DE_slice_{切片序号}.h5
- 容积数据命名格式:subject{编号}_DE.h5
- 训练集切片涵盖编号为2、4、6、7、9、13、14、15、18、19、20、21、22、24、25、26、27、31、32、34、37、39、42、44、45的25个受试者
- 训练集体积涵盖编号为1、8、29、36、41的5个受试者
- 测试集体积涵盖编号为3、5、10、11、12、16、17、23、28、30、33、35、38、40、43的15个受试者
## 应用场景
### 心肌梗死区域自动识别
基于延迟增强序列影像,AI模型可以自动识别心肌梗死区域。延迟增强序列是诊断心肌梗死的重要影像学手段,通过分析影像中强化区域的位置、大小和形态,可以准确判断心肌梗死的范围和程度。本数据集提供的382个训练切片和20个容积数据为训练高精度的分割模型提供了充足的数据支撑。研究人员可以利用这些数据训练深度学习模型,实现对心肌梗死区域的自动分割和定量分析,帮助医生更快速、准确地评估患者病情,为治疗方案的制定提供依据。
### 心脏功能自动评估
心脏磁共振影像包含丰富的心脏结构和功能信息,通过分析心室体积、心肌厚度、心脏运动等参数,可以全面评估心脏功能。本数据集提供的完整容积数据支持三维心脏结构的重建和分析,可用于训练基于三维卷积神经网络的心脏功能评估模型。这类模型能够自动测量左心室射血分数、心室容积变化等关键指标,为心力衰竭等疾病的诊断和预后评估提供客观依据。
### 心血管疾病辅助诊断系统开发
将AI模型集成到临床诊断流程中,可以构建智能化的心血管疾病辅助诊断系统。基于本数据集训练的模型可以作为系统的核心组件,自动分析患者的心脏磁共振影像,提供初步诊断建议和风险评估。这不仅可以提高诊断效率,减轻医生工作负担,还可以降低人为因素导致的诊断误差,提高诊断的一致性和准确性。
### 医学影像分析算法研究
本数据集为医学影像分析算法的研究提供了理想的实验平台。研究人员可以利用这些数据探索新的深度学习架构、优化算法参数、验证新的图像处理方法。数据集同时包含切片和容积数据,支持从二维到三维的多种分析方式,为算法创新提供了灵活的研究空间。
## 结尾
本MSCMR心脏磁共振影像数据集为心血管疾病AI辅助诊断研究提供了宝贵的数据资源。数据集包含382个训练切片、5个训练容积和15个测试容积,涵盖45个不同受试者的延迟增强序列影像。数据采用HDF5格式存储,经过预处理可直接用于模型训练。
数据集的核心优势在于同时提供切片级别和容积级别的完整原始数据,支持多种深度学习任务。这使得研究人员可以灵活选择数据粒度,训练适应不同临床场景的AI模型。无论是心肌梗死区域识别、心脏功能评估还是辅助诊断系统开发,本数据集都能提供坚实的数据支撑。
如果您需要获取更多关于数据集的详细信息或使用授权,欢迎私信联系。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






