# 多导睡眠脑电图数据集:5例受试者35通道国际标准10-20系统完整原始EDF信号助力睡眠障碍诊断与神经科学研究
## 引言与背景
脑电图(Electroencephalography,EEG)是记录大脑神经元电活动的重要非侵入性检测技术,在睡眠医学、神经科学研究、临床诊断及脑机接口技术研发等领域发挥着不可替代的作用。高质量的睡眠脑电数据集对于推动睡眠障碍疾病的智能诊断、深度学习算法在脑电信号分析中的应用,以及人类睡眠机制的研究具有重要价值。
本数据集为多导睡眠图(Polysomnography,PSG)研究中的核心脑电信号部分,包含了完整的原始脑电信号文件而非仅元数据。数据集涵盖5名受试者的睡眠脑电记录,采用国际标准10-20电极系统进行35通道同步采集,每条记录持续1秒,采样频率为100Hz,能够精确捕捉睡眠各阶段的大脑皮层电活动特征。这些数据对于睡眠分期自动识别算法训练、脑电特征提取模型开发、睡眠呼吸暂停综合征筛查以及神经退行性疾病早期预警研究具有重要的支撑作用。
本数据集的核心价值在于提供了可直接用于算法训练的完整原始信号文件。研究人员无需进行复杂的数据预处理即可直接使用这些数据进行模型训练、特征工程或验证研究。同时,数据集的标准化采集格式和多通道设计为跨研究对比分析提供了便利条件。
## 数据基本信息
### 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| 文件名 | 字符串 | EDF格式数据文件名 | PN00-1.edf | 完整 |
| 文件大小 | 数值 | 文件占用存储空间(MB) | 89.73 | 完整 |
| 记录数 | 整数 | 数据记录条目数量 | 2634 | 完整 |
| 记录时长 | 数值 | 单条记录的持续时间(秒) | 1 | 完整 |
| 通道数量 | 整数 | 同步采集的EEG通道数 | 35 | 完整 |
| 采样频率 | 整数 | 信号采样率(Hz) | 100 | 完整 |
| 采集日期 | 日期 | 记录开始的日期 | 01.01.16 | 完整 |
| 采集时间 | 时间 | 记录开始的时间 | 19.39.33 | 完整 |
| 电极系统 | 字符串 | 使用的国际标准10-20系统 | 10-20 | 完整 |
| 数据格式 | 字符串 | EDF标准格式 | EDF | 完整 |
### 数据文件列表
| 文件名 | 文件大小(MB) | 记录数 | 通道数 | 采集日期 | 采集时间 |
|-------|-------------|-------|-------|---------|---------|
| PN00-1.edf | 89.73 | 2634 | 35 | 2016年1月1日 | 19:39:33 |
| PN00-2.edf | 78.69 | 2301 | 35 | 2016年1月1日 | 02:18:17 |
| PN00-3.edf | 85.77 | 2504 | 35 | 2016年1月1日 | 18:15:44 |
| PN00-4.edf | 71.85 | 2102 | 35 | 2016年1月1日 | 20:51:43 |
| PN00-5.edf | 73.26 | 2143 | 35 | 2016年1月1日 | 22:22:04 |
| 合计 | 399.30 | 11684 | 35 | - | - |
### 数据分布情况
#### 数据量分布
| 统计指标 | 数值 |
|---------|------|
| 总文件数量 | 5 |
| 总数据量 | 399.30 MB |
| 总记录数 | 11684 |
| 总时长 | 11684秒(约3.25小时) |
| 每文件平均记录数 | 2336.8 |
| 每文件平均大小 | 79.86 MB |
#### 电极通道分布(国际10-20系统)
| 电极位置类型 | 包含通道 |
|------------|---------|
| 前额区(Fp) | Fp1 |
| 额区(F) | F3, F7, Fz, F9 |
| 中央 区(C) | C3, Cz |
| 顶区(P) | P3, Pz |
| 枕区(O) | O1 |
| 颞区(T) | T3, T5 |
|额中央 区(Fc) | Fc1, Fc5 |
| 中央顶区(Cp) | Cp1, Cp5 |
### 数据规模与特征
本数据集呈现出显著的大规模、多通道特点。数据集总计包含399.30MB的原始脑电信号数据,涵盖5名受试者约3.25小时的连续睡眠脑电记录。35通道的设计遵循国际10-20标准电极布置系统,确保了大脑各区域电活动的全面覆盖,包括前额叶、额叶、中央叶、顶叶、枕叶及颞叶区域。标准100Hz采样频率满足睡眠脑电信号分析的奈奎斯特准则要求,能够准确还原频率最高达50Hz的脑电信号成分。每条记录1秒的时长设计便于数据分帧处理,为后续的特征提取和模型训练提供了合适的时间窗口。
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 完整原始信号 | 包含可直接使用的EDF格式原始脑电数据,非元数据或预处理数据 | 算法训练、全波形分析、原始信号特征提取 |
| 国际标准采集 | 采用10-20系统35通道标准配置,采样率100Hz | 跨研究对比、标准化分析流程复用 |
| 多通道覆盖 | 前额、额、央、顶、枕、颞全区域覆盖 | 全面分析大脑活动、空间定位研究 |
| 睡眠专项数据 | 针对睡眠状态采集,涵盖完整睡眠周期特征 | 睡眠分期识别、睡眠障碍研究 |
| 即用性格式 | EDF为通用生物医学信号标准格式 | 无需转换可直接使用MNE、EEGLAB等工具 |
| 连续记录 | 单次连续记录时长1秒,便于时序分析 | 状态转换检测、瞬态事件捕捉 |
本数据集最重要的优势在于包含了完整的原始脑电信号文件。EDF格式作为一种国际通用的生物医学信号标准,能够完整保留信号的幅值信息和时域特征,用户可以直接使用专业工具进行加载、预处理和深度分析,而无需担心数据转换带来的信息损失。
## 数据样例
本节展示数据集的元数据结构样例,帮助用户理解数据组织方式和信号特征。
文件PN00-1.edf元数据结构样例文件标识:PN00-1.edf
文件格式:EDF(European Data Format)
文件版本:0
患者标识:(未标注)
记录标识:(未标注)
采集日期:2016年1月1日
开始时间:19时39分33秒
头部字节数:9216字节
记录数量:2634条
单条记录时长:1秒
通道数量:35个
采样频率:100Hz
电极系统:国际10-20系统
数据载体:完整的原始脑电信号二进制数据
文件大小:89.73MB
信号持续总时长:2634秒(约43.9分钟)电极通道配置样例(PN00-1.edf前10个通道)| 通道编号 | 电极标签 | 解剖位置 | 采集类型 |
|---------|---------|---------|---------|
| 1 | EEG Fp1 | 左前额极区 | 单极 |
| 2 | EEG F3 | 左额区 | 单极 |
| 3 | EEG C3 | 左中央 区 | 单极 |
| 4 | EEG P3 | 左顶区 | 单极 |
| 5 | EEG O1 | 左枕区 | 单极 |
| 6 | EEG F7 | 左前颞区 | 单极 |
| 7 | EEG T3 | 左颞区 | 单极 |
| 8 | EEG T5 | 左后颞区 | 单极 |
| 9 | EEG Fc1 | 左额中央 区 | 单极 |
| 10 | EEG Cp1 | 左中央顶区 | 单极 |
| 文件 | 大小(MB) | 记录数 | 时长(秒) | 平均每秒(MB) | 数据密度 |
|-----|---------|-------|---------|-------------|---------|
| PN00-1 | 89.73 | 2634 | 2634 | 0.034 | 高 |
| PN00-2 | 78.69 | 2301 | 2301 | 0.034 | 高 |
| PN00-3 | 85.77 | 2504 | 2504 | 0.034 | 高 |
| PN00-4 | 71.85 | 2102 | 2102 | 0.034 | 高 |
| PN00-5 | 73.26 | 2143 | 2143 | 0.034 | 高 |
| 文件 | 采集时间 | 时段类型 | 数据量占比 |
|-----|---------|---------|-----------|
| PN00-1 | 19:39:33 | 晚间时段 | 21.5% |
| PN00-2 | 02:18:17 | 深夜时段 | 18.8% |
| PN00-3 | 18:15:44 | 傍晚时段 | 20.5% |
| PN00-4 | 20:51:43 | 晚间时段 | 18.2% |
| PN00-5 | 22:22:04 | 夜间时段 | 19.0% |
由于本数据集包含完整的原始脑电信号文件(EDF二进制格式),单条记录的数据量较大,无法在文本中直接展示信号波形。但实际数据集中包含了全部35个通道的完整原始信号数据,用户可直接使用EDF读取工具加载这些文件进行深度分析和模型训练。
## 应用场景
### 睡眠分期自动识别研究
睡眠分期是睡眠医学研究的基础性工作,传统上依赖经验丰富的睡眠技师进行人工判读,效率低且主观性强。本数据集提供的35通道睡眠脑电原始信号为开发基于深度学习的睡眠分期自动识别算法提供了理想的数据基础。研究人员可以利用这些完整的原始信号训练卷积神经网络或循环神经网络模型,自动学习睡眠各阶段(清醒期、浅睡期、深睡期、快眼动期)的脑电特征模式。与仅包含元数据的数据集不同,本数据集中的完整原始信号使得研究人员能够进行全波形分析,提取时域、频域和时频域多维特征,从而构建更高精度的睡眠分期模型。此类算法成熟后可应用于睡眠中心的大规模筛查工作,显著提高睡眠医学的诊疗效率。
### 睡眠障碍疾病智能诊断
睡眠呼吸暂停综合征、发作性睡病、不安腿综合征等睡眠障碍疾病的早期诊断对于改善患者生活质量具有重要意义。本数据集记录的睡眠脑电信号包含了丰富的大脑活动信息,可用于训练睡眠障碍疾病的智能诊断模型。通过分析信号中的特征性模式(如呼吸暂停事件对应的脑电变化、微觉醒检测等),研究人员可以开发自动化的筛查工具。与传统仅提供元数据的数据集相比,本数据集的完整原始信号使得模型能够学习到更加精细的病理特征,从而提高诊断的准确性和灵敏度。这种基于人工智能的辅助诊断系统有潜力部署于基层医疗机构,帮助更多患者获得早期诊断和治疗。
### 脑电特征提取与模式识别研究
脑电信号的定量化分析需要提取各种特征参数,如功率谱密度、频段能量比、熵值、相干性等。本数据集提供的完整原始信号为脑电特征工程研究提供了高质量的数据源。研究人员可以系统性地评估不同特征提取方法在睡眠脑电分析中的效果,探索多通道信号的协同特征。研究表明,睡眠脑电的频段分布(如α波、θ波、δ波、梭形波)随睡眠阶段呈现规律性变化,这些特征可作为睡眠质量评估的客观指标。本数据集的多通道设计使得研究人员能够进一步探索大脑不同区域之间的功能连接模式,为理解睡眠机制提供新的视角。
### 脑机接口与神经反馈技术研发
脑机接口(BMI)技术旨在建立大脑与外部设备之间的直接通信通道,在康复医学、智能控制等领域具有广阔的应用前景。本数据集中的35通道全颅脑电信号为脑机接口算法的研发提供了丰富的训练数据。睡眠状态下的脑电信号具有稳定性好、伪迹少的特点,适合作为脑机接口范式的研究素材。科研人员可以利用这些数据开发基于睡眠脑电的异步脑机接口系统,或者探索神经反馈训练对睡眠质量的改善效果。与元数据相比,完整原始信号数据能够支持更复杂的信号处理算法研究,如空间滤波、独立成分分析等。
### 睡眠与认知功能关联研究
睡眠对于记忆巩固、情绪调节、认知功能恢复具有重要作用。本数据集可作为探究睡眠-认知关联机制的研究资源。通过分析睡眠脑电信号与认知表现之间的关系,研究人员可以识别与记忆巩固相关的神经标记物。已有研究表明,睡眠梭形波(sleep spindle)与陈述性记忆巩固密切相关,而慢波睡眠期间的慢波活动与技能学习存在关联。利用本数据集,研究人员可以进行多维度的相关性分析,探索不同睡眠阶段脑电特征与认知任务表现之间的定量关系,为优化睡眠以提升认知功能提供科学依据。
### 跨数据集迁移学习与算法泛化研究
机器学习模型在不同数据集间的泛化能力是临床应用的关键挑战。本数据集采用国际标准10-20系统进行数据采集,与其他采用相同标准的睡眠脑电数据集具有结构可比性。研究人员可以使用本数据集训练模型,然后在其他独立数据集上进行验证,评估算法的迁移能力。完整原始信号的保留使得这种跨数据集的对比研究更加可靠,避免了因预处理流程差异导致的结果偏差。这类研究对于推动睡眠脑电分析算法的临床转化具有重要意义。
## 结尾
本睡眠脑电图数据集提供了5名受试者、35通道、国际标准10-20系统采集的完整原始脑电信号数据,总量约400MB,包含约3.25小时的睡眠记录。该数据集的核心优势在于保留了完整的原始EDF格式信号文件而非仅元数据,用户可直接使用MNE、EEGLAB等主流工具进行加载和分析,无需额外的数据转换步骤。标准化的采集规范和多通道全颅覆盖的设计使本数据集特别适合用于睡眠分期自动识别、睡眠障碍智能诊断、脑电特征提取算法研发等多种科研和应用场景。
如需获取更多关于本数据集的详细信息或讨论合作研究机会,欢迎通过适当方式联系我们。我们期待与睡眠医学、神经科学、人工智能等领域的研究者共同推动相关技术的发展。
---
数据集摘要- 数据类型:睡眠脑电图(EEG)原始信号
- 数据格式:EDF(European Data Format)
- 数据规模:5个文件,总计399.30MB,11684条记录
- 通道配置:35通道,国际10-20电极系统
- 采样频率:100Hz
- 适用领域:睡眠医学、神经科学、人工智能、临床诊断
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






