HM

verify-tagdist

1

已售 0
8.52MB

数据标识:D17684792156304522

发布时间:2026/01/15

# ADHD注意力缺陷多动障碍诊断数据集-103例患者多模态生理信号与认知测试

## 数据集介绍

本数据集是一个专门用于注意力缺陷多动障碍(ADHD)及注意力缺陷障碍(ADD)诊断研究的综合性医学数据集,包含103名受试者的多模态生理信号、认知测试结果和临床诊断信息。数据集整合了活动数据(Actigraphy)、心率变异性数据(HRV)、持续性注意力测试(CPT-II)结果、多种临床量表评分以及详细的用药记录,为ADHD的计算机辅助诊断、生物标志物发现、个性化治疗方案制定等研究提供了丰富的实证数据。

数据集采集自真实临床环境,受试者年龄分布在1-4组(年龄段编码),包含51例ADHD患者、23例ADD患者以及对照组,性别分布基本均衡(男性53例,女性50例)。数据采集涵盖长达数天的连续活动监测、数小时的心率记录,以及标准化的360次试验CPT-II测试,确保了数据的时间连续性和测量精度。此外,数据集还包含从原始生理信号中提取的788维高级特征,为机器学习模型的直接应用提供了便利。

## 数据基本信息

### 字段描述

#### patient_info.csv - 患者基本信息

| 字段名 | 数据类型 | 字段含义 | 示例值 | 完整性 |
|--------|----------|----------|--------|--------|
| ID | 整数 | 患者唯一标识符 | 1, 2, 3 | 100% |
| SEX | 整数 | 性别(0=女,1=男) | 0, 1 | 100% |
| AGE | 整数 | 年龄组编码(1-4) | 1, 2, 3, 4 | 100% |
| ACC | 整数 | 是否有活动数据(0=否,1=是) | 0, 1 | 100% |
| ACC_TIME | 时间 | 活动数据采集时长 | 16:00:00, 10:54:00 | 82.5% |
| ACC_DAYS | 浮点数 | 活动数据采集天数 | 6.0, 6.8, 7.2 | 82.5% |
| HRV | 整数 | 是否有心率变异性数据(0=否,1=是) | 0, 1 | 100% |
| HRV_TIME | 时间 | 心率数据采集时长 | 11:00:00, 15:25:00 | 77.7% |
| HRV_HOURS | 整数 | 心率数据采集小时数 | 21, 15, 18 | 77.7% |
| CPT_II | 整数 | 是否完成CPT-II测试(0=否,1=是) | 0, 1 | 100% |
| ADHD | 整数 | ADHD诊断(0=无,1=有) | 0, 1 | 100% |
| ADD | 整数 | ADD诊断(0=无,1=有) | 0, 1 | 100% |
| BIPOLAR | 整数 | 双相情感障碍诊断(0=无,1=有) | 0, 1 | 100% |
| UNIPOLAR | 整数 | 单相抑郁症诊断(0=无,1=有) | 0, 1 | 100% |
| ANXIETY | 整数 | 焦虑症诊断(0=无,1=有) | 0, 1 | 100% |
| SUBSTANCE | 整数 | 物质滥用诊断(0=无,1=有) | 0, 1 | 100% |
| OTHER | 整数 | 其他精神障碍诊断(0=无,1=有) | 0, 1 | 100% |
| CT | 整数 | 对照组标识(0=非对照,1=对照) | 0, 1 | 100% |
| MDQ_POS | 整数 | 心境障碍问卷阳性(0=阴性,1=阳性) | 0, 1 | 100% |
| WURS | 浮点数 | Wender犹他评定量表得分 | 评分数值 | 95.1% |
| ASRS | 浮点数 | 成人ADHD自评量表得分 | 评分数值 | 93.2% |
| MADRS | 浮点数 | Montgomery-Åsberg抑郁评定量表得分 | 评分数值 | 87.4% |
| HADS_A | 浮点数 | 医院焦虑抑郁量表-焦虑分量表得分 | 评分数值 | 85.4% |
| HADS_D | 浮点数 | 医院焦虑抑郁量表-抑郁分量表得分 | 评分数值 | 85.4% |
| MED | 整数 | 是否用药(0=否,1=是) | 0, 1 | 100% |
| MED_Antidepr | 浮点数 | 抗抑郁药用药(1=使用) | 1.0 | 18.4% |
| MED_Moodstab | 浮点数 | 情绪稳定剂用药(1=使用) | 1.0 | 5.8% |
| MED_Antipsych | 浮点数 | 抗精神病药用药(1=使用) | 1.0 | 2.9% |
| MED_Anxiety_Benzo | 浮点数 | 抗焦虑药/苯二氮䓬类用药(1=使用) | 1.0 | 7.8% |
| MED_Sleep | 浮点数 | 睡眠药物用药(1=使用) | 1.0 | 2.9% |
| MED_Analgesics_Opioids | 浮点数 | 镇痛药/阿片类用药(1=使用) | 1.0 | 1.9% |
| MED_Stimulants | 浮点数 | 兴奋剂用药(1=使用) | 1.0 | 1.0% |
| filter_$ | 整数 | 数据筛选标识 | 0, 1 | 100% |

#### features.csv - 提取的高级特征

| 字段名模式 | 数据类型 | 字段含义 | 完整性 |
|-----------|----------|----------|--------|
| ID | 整数 | 患者标识符 | 100% |
| ACC__* | 浮点数 | 从活动数据提取的788维时间序列特征 | 根据是否有ACC数据 |

特征类别说明: - 统计特征: 均值、中位数、标准差、方差、偏度、峰度等 - 能量特征: 绝对能量、均方根、能量比等 - 频域特征: FFT系数、功率谱密度、频谱熵等 - 时域特征: 自相关系数、时间序列对称性、趋势分析等 - 复杂度特征: 样本熵、排列熵、Lempel-Ziv复杂度等 - 小波特征: 连续小波变换系数(多个尺度) - 分位数特征: 不同分位点的数值分布 - 交叉特征: 滞后相关性、时间反转不对称性等

#### CPT_II_ConnersContinuousPerformanceTest.csv - 持续性注意力测试

| 字段名类型 | 数据类型 | 字段含义 | 完整性 |
|-----------|----------|----------|--------|
| ID | 整数 | 患者标识符 | 100% |
| Assessment Status | 文本 | 测试完成状态 | 100% |
| Assessment Duration | 文本 | 测试持续时间 | 100% |
| Type | 文本 | 测试类型 | 100% |
| LastTrial | 整数 | 最后完成的试验编号(1-360) | 100% |
| Trial1-Trial360 | 整数 | 每次试验的刺激编号 | 根据完成情况 |
| Response1-Response360 | 浮点数 | 每次试验的反应时间(毫秒) | 根据完成情况 |
| General TScore * | 浮点数 | 通用人群T分数标准化得分 | 100% |
| Adhd TScore * | 浮点数 | ADHD人群T分数标准化得分 | 100% |
| Neuro TScore * | 浮点数 | 神经系统疾病人群T分数标准化得分 | 100% |
| Raw Score * | 浮点数 | 原始得分 | 100% |
| Percent * | 浮点数 | 百分位排名 | 100% |

CPT-II测试指标: - Omissions: 遗漏错误(应答但未答) - Commissions: 误答错误(不应答但答了) - HitRT: 正确反应时间 - HitSE: 正确反应时间标准误 - VarSE: 反应时间变异性标准误 - DPrime: 信号检测理论d'值(辨别力) - Beta: 反应偏向 - Perseverations: 重复反应 - HitRTBlock: 按测试区块的反应时间变化 - HitSEBlock: 按测试区块的反应时间标准误变化 - HitRTIsi: 按试验间隔的反应时间变化 - HitSEIsi: 按试验间隔的反应时间标准误变化 - Confidence Index: ADHD诊断置信指数

#### activity_data文件夹 - 原始活动数据

| 文件格式 | 数据内容 | 文件数量 |
|---------|---------|----------|
| patient_activity_XX.csv | 每位患者数天连续活动监测数据,包含时间戳和活动强度 | 85个文件 |
| 记录规模 | 每个文件约8,000-11,000条记录 | 总计约70-90万条时间序列数据点 |

#### hrv_data文件夹 - 心率变异性数据

| 文件格式 | 数据内容 | 文件数量 |
|---------|---------|----------|
| patient_hr_XXX.csv | 每位患者数小时连续心率记录,包含时间戳和RR间期 | 80个文件 |
| 记录规模 | 每个文件约76,000-110,000条记录 | 总计约600-800万条心跳数据点 |

### 数据分布统计

#### 诊断分类分布

| 诊断类别 | 阳性数量 | 阴性数量 | 阳性率 | 累积占比 |
|---------|----------|----------|--------|----------|
| ADHD | 51 | 52 | 49.51% | 49.51% |
| ADD | 23 | 80 | 22.33% | 71.84% |
| BIPOLAR(双相情感障碍) | 部分患者 | - | - | - |
| UNIPOLAR(单相抑郁) | 部分患者 | - | - | - |
| ANXIETY(焦虑症) | 部分患者 | - | - | - |
| SUBSTANCE(物质滥用) | 部分患者 | - | - | - |
| OTHER(其他精神障碍) | 部分患者 | - | - | - |

说明: 数据集包含51例ADHD确诊患者(49.51%)和52例非ADHD受试者(包括其他诊断和健康对照),提供了相对均衡的病例-对照样本,有利于机器学习模型的训练。

#### 性别和年龄分布

| 人口学特征 | 类别 | 数量 | 占比 | 累积占比 |
|-----------|------|------|------|----------|
| 性别 | 男性(SEX=1) | 53 | 51.46% | 51.46% |
| 性别 | 女性(SEX=0) | 50 | 48.54% | 100.00% |
| 年龄组 | 组1 | 约25例 | ~24% | ~24% |
| 年龄组 | 组2 | 约26例 | ~25% | ~49% |
| 年龄组 | 组3 | 约26例 | ~25% | ~74% |
| 年龄组 | 组4 | 约26例 | ~25% | ~99% |

说明: 性别分布基本均衡,年龄分布相对均匀覆盖4个年龄段,确保了样本的代表性。

#### 数据采集完整性

| 数据类型 | 有数据患者数 | 无数据患者数 | 数据完整率 |
|---------|-------------|-------------|-----------|
| 活动数据(ACC) | 85 | 18 | 82.52% |
| 心率数据(HRV) | 80 | 23 | 77.67% |
| CPT-II测试 | 99 | 4 | 96.12% |
| WURS量表 | 98 | 5 | 95.15% |
| ASRS量表 | 96 | 7 | 93.20% |
| MADRS量表 | 90 | 13 | 87.38% |
| HADS量表 | 88 | 15 | 85.44% |

#### 用药情况分布

| 药物类别 | 使用人数 | 占比 |
|---------|---------|------|
| 抗抑郁药(MED_Antidepr) | 19 | 18.45% |
| 抗焦虑药/苯二氮䓬类(MED_Anxiety_Benzo) | 8 | 7.77% |
| 情绪稳定剂(MED_Moodstab) | 6 | 5.83% |
| 抗精神病药(MED_Antipsych) | 3 | 2.91% |
| 睡眠药物(MED_Sleep) | 3 | 2.91% |
| 镇痛药/阿片类(MED_Analgesics_Opioids) | 2 | 1.94% |
| 兴奋剂(MED_Stimulants) | 1 | 0.97% |

#### 数据规模统计

| 文件/文件夹 | 记录数量 | 字段数量 | 文件大小 |
|-----------|----------|----------|----------|
| patient_info.csv | 103 | 33 | 0.01 MB |
| features.csv | 116 | 788 | 0.90 MB |
| CPT_II_ConnersContinuousPerformanceTest.csv | 99 | 786 | 0.90 MB |
| activity_data文件夹 | 约700,000+ | 2-3 | 约15-20 MB |
| hrv_data文件夹 | 约8,000,000+ | 2-3 | 约250-300 MB |
| 总计 | 约8,700,318 | - | 约267-321 MB |

### 数据优势

| 优势特点 | 具体表现 | 应用价值 |
|----------|----------|----------|
| 多模态生理信号 | 整合活动监测、心率变异性、认知测试三种互补数据源 | 支持多模态融合模型开发,提高ADHD诊断准确性和鲁棒性 |
| 长时程连续监测 | 活动数据跨越5.9-7.2天,心率数据持续15-21小时 | 捕捉日常生活中的行为模式和生理节律,提供生态效度高的诊断依据 |
| 标准化认知测试 | 采用临床金标准CPT-II测试,360次试验全记录 | 提供客观的注意力和冲动控制能力评估,支持认知功能量化研究 |
| 高维特征工程 | 提供788维从时间序列提取的特征,包含统计、频域、小波等 | 无需用户进行复杂特征提取,可直接用于机器学习模型训练 |
| 临床多维度诊断 | 包含ADHD/ADD及6种共病诊断,5种标准量表评分 | 支持共病模式研究、症状严重程度预测、多标签分类任务 |
| 详细用药记录 | 记录7类精神科药物使用情况 | 可研究药物对生理信号的影响,支持治疗反应预测和个性化用药 |
| 均衡样本设计 | ADHD与非ADHD比例接近1:1,性别比例均衡 | 减少类别不平衡问题,提高模型训练效率和泛化能力 |
| 原始数据保留 | 提供原始时间序列CSV文件,未经预处理 | 允许研究者自定义特征提取和信号处理流程,灵活性高 |

## 数据样本展示

### 样本1: ADHD确诊患者(ID=1)

基本信息: 女性,年龄组3,有活动数据(6天),有心率数据(21小时),未完成CPT-II测试 诊断: ADHD=1, ADD=0, 共病包括双相情感障碍和焦虑症 量表得分: MDQ阳性,有WURS和ASRS评分 用药情况: 无用药记录 数据特点: 典型ADHD患者,提供长达6天的连续活动监测和21小时心率监测数据,适合研究ADHD患者的日常活动模式和自主神经功能特征

### 样本2: 非ADHD患者(ID=2)

基本信息: 女性,年龄组4,有活动数据(6.8天),无心率数据,完成CPT-II测试 诊断: ADHD=0, ADD=0, 有单相抑郁症诊断 量表得分: MDQ阳性,有WURS评分 用药情况: 无用药记录 数据特点: 对照组样本,提供完整的CPT-II测试数据(360次试验),适合对比ADHD与非ADHD患者的注意力测试表现差异

### 样本3: ADD确诊患者(ID=3)

基本信息: 男性,年龄组2,有活动数据(7.2天),有心率数据(21小时),完成CPT-II测试 诊断: ADHD=1, ADD=0, 有双相情感障碍诊断 量表得分: MDQ阳性,有完整的量表评分 用药情况: 无用药记录 数据特点: 同时拥有三种模态数据的完整样本,适合多模态融合分析和诊断模型训练

### 样本4: 服用抗焦虑药物患者(ID=4)

基本信息: 男性,年龄组3,无活动数据,有心率数据 诊断: ADHD=0, ADD=1 用药情况: 使用抗焦虑药/苯二氮䓬类药物和镇痛药/阿片类药物 数据特点: 适合研究精神科药物对心率变异性的影响,以及ADD患者的生理特征

### 样本5: 活动数据时间序列样本

文件: patient_activity_01.csv 记录数: 8,636条 时间跨度: 约6天 数据格式: 时间戳 + 活动强度值 应用场景: 可分析昼夜节律、活动模式、静息/活动状态转换频率等特征,识别ADHD患者的多动和冲动行为模式

### 样本6: 心率变异性数据样本

文件: patient_hr_1.csv 记录数: 107,474条 时间跨度: 约21小时 数据格式: 时间戳 + RR间期(心跳间隔) 应用场景: 可计算HRV时域指标(SDNN、RMSSD)和频域指标(LF、HF、LF/HF),评估自主神经系统功能,研究ADHD患者的压力反应和情绪调节能力

### 样本7: CPT-II测试完整记录

患者: ID=3 试验总数: 360次 测试时长: 约14分钟 刺激类型: 字母识别任务(目标刺激vs非目标刺激) 反应时间范围: 200-800毫秒 数据特点: 包含每次试验的刺激呈现和反应时间,可分析注意力波动、反应时间趋势、疲劳效应等

### 样本8: CPT-II综合指标

Omissions(遗漏): 反映注意力不集中程度,ADHD患者通常分数较高 Commissions(误答): 反映冲动控制能力,ADHD患者误答率通常较高 HitRT(反应时间): ADHD患者反应时间可能更长且更不稳定 DPrime(辨别力): 信号检测能力指标,ADHD患者通常较低 Confidence Index: ≥60%提示ADHD可能性高,是综合诊断参考指标

### 样本9: 提取特征示例

统计特征: 均值、标准差、偏度、峰度描述活动模式的集中趋势和分散程度 频域特征: FFT系数捕捉活动的周期性规律(如昼夜节律) 熵特征: 样本熵、排列熵量化活动模式的复杂度和不可预测性 自相关特征: 评估活动在不同时间滞后下的相关性,反映行为的持续性 应用: 这788维特征可直接输入随机森林、SVM、神经网络等分类器进行ADHD诊断

### 样本10: 量表评分数据

WURS(Wender犹他评定量表): 回顾性评估儿童期ADHD症状 ASRS(成人ADHD自评量表): 评估成人ADHD当前症状 MADRS(Montgomery-Åsberg抑郁量表): 评估抑郁症状严重程度 HADS_A/HADS_D: 分别评估焦虑和抑郁水平 应用: 量表得分可作为监督学习的附加特征或诊断标签,支持症状严重程度预测

### 样本11: 共病模式样本

ADHD + 双相情感障碍: 研究情绪不稳定对注意力的影响 ADHD + 焦虑症: 研究焦虑对认知表现的调节作用 ADHD + 抑郁症: 研究共病抑郁的ADHD患者的特殊生理和行为特征 应用: 支持多标签分类、共病预测、临床亚型识别研究

### 样本12: 对照组样本

CT=1: 健康对照或非ADHD精神障碍患者 用途: 提供基线对比数据,帮助识别ADHD特异性生物标志物 数据特点: 与ADHD组进行配对比较,可计算效应量,评估诊断模型的特异性和敏感性

### 样本13: 无数据样本处理

部分患者缺失活动数据或心率数据: 可能由于设备故障、患者依从性问题等原因 处理策略: 使用单模态数据进行分析,或采用多任务学习框架利用部分完整数据 研究价值: 反映真实临床数据的不完整性,适合研究缺失数据插补和鲁棒模型开发

### 样本14: 用药影响研究样本

抗抑郁药组(19例): 研究SSRIs等药物对心率变异性和活动水平的影响 兴奋剂组(1例): 研究哌醋甲酯等ADHD治疗药物的生理效应 应用: 支持药物反应预测模型、治疗效果评估、个性化用药决策研究

### 样本15: 长时程行为模式

6-7天连续活动监测: 捕捉工作日和周末的行为差异 日间vs夜间活动: 分析睡眠-觉醒周期的紊乱程度 活动爆发模式: 识别ADHD患者特有的高强度活动爆发和频繁状态转换 应用: 基于真实生活环境的生态瞬时评估(EMA),提高诊断的生态效度

## 应用场景

### 场景1: ADHD计算机辅助诊断系统开发

ADHD的临床诊断主要依赖主观量表评估和行为观察,存在诊断标准不统一、医生经验依赖性强、易受文化和语言差异影响等局限。本数据集提供的多模态客观生理数据为开发计算机辅助诊断(CAD)系统提供了坚实基础。研究人员可以利用已提取的788维特征或自定义特征,训练支持向量机(SVM)、随机森林、梯度提升树、深度神经网络等分类模型,构建基于生理信号的ADHD自动识别系统。通过整合活动数据的运动模式特征、心率变异性数据的自主神经功能指标、CPT-II测试的认知表现参数,多模态融合模型可以从不同维度捕捉ADHD的病理生理特征,显著提升诊断准确率。系统可输出ADHD概率评分和置信区间,为临床医生提供客观的诊断参考依据。此外,通过可解释AI技术(如SHAP值分析、注意力机制可视化),可以识别对诊断贡献最大的特征,揭示ADHD的潜在生物标志物,为理解疾病机制提供新视角。对于资源匮乏地区或初级医疗机构,这种CAD系统可作为筛查工具,辅助非专科医生进行初步评估,提高ADHD的早期识别率,减少漏诊和误诊。

### 场景2: ADHD生物标志物发现与验证研究

尽管ADHD是最常见的儿童神经发育障碍之一,其客观生物标志物尚未明确,导致诊断缺乏金标准。本数据集的多模态生理信号为生物标志物研究提供了丰富素材。研究人员可以对比ADHD组与对照组在活动模式、心率变异性、认知测试表现等方面的差异,识别具有统计显著性的区分性特征。例如,通过分析活动数据的昼夜节律特征,可能发现ADHD患者的生物钟紊乱模式;通过计算HRV的频域指标(如LF/HF比值),可能揭示ADHD患者的自主神经平衡失调;通过分析CPT-II测试中反应时间的变异性和趋势,可能识别注意力波动的特征性模式。利用机器学习的特征选择算法(如LASSO回归、递归特征消除),可以从788维高维特征中筛选出最具诊断价值的特征子集,构建简约而高效的诊断模型。进一步地,通过聚类分析和无监督学习,可能识别ADHD的临床亚型,为精准医疗提供依据。生物标志物的发现不仅有助于提高诊断的客观性和准确性,还为监测疾病进展、评估治疗反应、预测长期预后提供了量化工具,推动ADHD从主观描述性诊断向客观生物医学诊断的转变。

### 场景3: 个性化治疗方案制定与疗效预测

ADHD的治疗方案包括药物治疗(兴奋剂、非兴奋剂)和行为干预,但不同患者对治疗的反应存在显著个体差异。本数据集包含的用药记录和生理信号数据为个性化治疗研究提供了可能。研究人员可以分析服用不同类型药物患者的生理信号特征,建立药物反应预测模型。例如,通过对比用药前后的心率变异性变化,可以评估药物对自主神经系统的影响;通过分析用药患者的活动模式,可以研究兴奋剂对多动症状的抑制效果。利用机器学习算法,可以从基线生理数据中提取预测治疗反应的特征,帮助临床医生在治疗早期识别可能受益于特定药物的患者,避免无效治疗和药物副作用。此外,结合患者的共病信息(双相情感障碍、焦虑症、抑郁症),可以研究共病对治疗选择的影响,制定针对性的联合治疗方案。对于行为干预(如认知行为疗法、神经反馈训练),可以利用长时程活动监测数据评估干预效果,通过前后对比分析验证干预的有效性。这种数据驱动的个性化医疗模式有望提高ADHD治疗的成功率,减少试错成本,改善患者的生活质量和功能预后。

### 场景4: 儿童青少年神经发育障碍跨诊断研究

ADHD常与自闭症谱系障碍(ASD)、学习障碍、对立违抗障碍(ODD)等其他神经发育障碍共存,症状存在重叠,鉴别诊断具有挑战性。本数据集包含的共病信息和多维度评估数据为跨诊断研究提供了基础。研究人员可以比较ADHD与其他神经发育障碍在生理信号特征上的异同,识别各障碍的特异性标志物。例如,通过对比ADHD和ASD患者的活动模式,可能发现ADHD的多动特征更具随机性和冲动性,而ASD的刻板重复行为更具规律性。通过分析共病患者(如ADHD+焦虑症)的生理特征,可以研究共病如何调节核心症状的表现,为临床亚型分类提供依据。此外,利用潜变量模型和因子分析,可以探索不同神经发育障碍背后共享的神经生物学机制,推动从分类诊断向维度诊断的范式转变。数据集中的多种标准化量表(WURS、ASRS、MADRS、HADS)提供了跨障碍的可比性,便于进行横向对比研究。这些研究成果可以完善神经发育障碍的诊断分类系统,提高鉴别诊断的准确性,为制定针对共病患者的综合治疗方案提供科学依据。

### 场景5: 可穿戴设备与远程医疗应用开发

随着可穿戴设备技术的成熟,基于活动监测和心率监测的连续健康追踪成为可能。本数据集为开发面向ADHD的可穿戴医疗设备和远程监测系统提供了数据支持和算法验证平台。研究人员可以基于数据集训练的诊断模型部署到智能手表、活动追踪器等可穿戴设备中,实现ADHD症状的日常监测和预警。例如,当设备检测到异常的活动爆发模式或注意力波动迹象时,可以向患者或家长发送提醒,建议及时采取干预措施或就医。对于已确诊的ADHD患者,可穿戴设备可以长期追踪症状波动,评估药物疗效,为剂量调整提供客观依据。在远程医疗场景中,患者在家中佩戴设备采集的生理数据可以实时传输到云平台,由AI系统进行自动分析,生成健康报告供医生远程审阅,减少线下就诊频率,提高医疗服务的可及性。此外,结合数据集中的多日连续监测经验,可以设计数据采集协议,优化设备续航和用户依从性的平衡。这种技术有望将ADHD的管理从间歇性临床评估转向持续性生活监测,实现从被动诊疗到主动健康管理的转变,特别适用于儿童青少年群体的长期随访和早期干预。

### 场景6: 注意力和执行功能的神经科学研究

ADHD的核心缺陷涉及注意力、抑制控制、工作记忆等执行功能领域,但其神经机制尚未完全阐明。本数据集的CPT-II测试数据为研究注意力的时间动态特性提供了精细化的行为学证据。研究人员可以分析360次试验中反应时间的微观波动,识别注意力集中与分散的转换模式,建立注意力资源分配的计算模型。通过与心率变异性数据联合分析,可以探索自主神经系统活动与认知表现的关联,例如心率减速期(deceleration)是否预示注意力的集中,心率加速期是否反映分心或疲劳。活动数据的昼夜节律分析可以揭示ADHD患者的睡眠-觉醒周期紊乱及其对白天认知功能的影响,为理解ADHD的昼夜节律调节机制提供线索。进一步地,可以整合数据集与神经影像数据(如fMRI、EEG),建立行为-生理-神经的多层次关联模型,追踪从脑区激活到自主神经调节再到外显行为的完整因果链。这些基础研究成果不仅加深对ADHD病理生理的理解,还为开发新型治疗靶点(如经颅磁刺激、神经反馈训练)提供了理论依据,推动转化医学研究的进展。

### 场景7: 时间序列分析与深度学习模型训练

本数据集包含的活动数据和心率数据本质上是高频时间序列,为时间序列分析和深度学习模型训练提供了理想素材。研究人员可以利用循环神经网络(RNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)等序列模型,直接从原始时间序列学习ADHD的特征表示,避免手工特征工程的局限。通过端到端的深度学习,模型可以自动捕捉多尺度的时间依赖关系,例如短期的活动爆发、中期的昼夜节律、长期的趋势变化。注意力机制(Attention Mechanism)可以帮助模型聚焦于时间序列中最具诊断价值的时间段,提高模型的可解释性。对于多模态数据融合,可以采用多流深度学习架构,分别处理活动数据和心率数据,然后在高层特征空间进行融合,充分利用不同模态的互补信息。卷积神经网络(CNN)的一维变体可以提取时间序列的局部模式(如活动峰值、心率下降),Transformer架构可以建模长程依赖关系。此外,自监督学习和对比学习等前沿技术可以利用大量无标签时间序列数据进行预训练,提升模型在小样本场景下的泛化能力。这些深度学习模型不仅在诊断准确率上可能超越传统机器学习,还能为开发实时监测系统和边缘计算应用提供高效算法,推动ADHD诊断技术的智能化升级。

### 场景8: 临床试验设计与疗效评估研究

在ADHD的药物临床试验和行为干预研究中,传统的疗效评估依赖量表评分和临床观察,主观性强且对微小变化不敏感。本数据集展示的客观生理信号监测为临床试验设计提供了新思路。研究人员可以将活动监测和心率监测作为客观终点指标,评估干预措施的效果。例如,在评估兴奋剂药物疗效时,可以对比用药前后的活动水平变化、活动爆发频率减少、昼夜节律规律化程度,这些指标比主观量表更客观、更连续、更敏感。在行为干预研究中,可以通过长期活动监测评估干预的持续效应和远期预后,避免单次门诊评估的片面性。数据集中的多日连续监测数据为确定最小样本量、检验功效分析提供了变异性估计的基础,帮助研究者设计更高效的临床试验。此外,通过机器学习模型预测治疗反应,可以实施适应性试验设计,动态调整分组策略,提高试验效率。客观生理数据还可以作为安全性监测指标,及时发现药物不良反应(如心率异常、睡眠紊乱加重),保障受试者安全。这种数据驱动的临床试验范式有望加速新药和新疗法的开发,降低研发成本,提高研究结果的可靠性和可重复性。

## 结论

本数据集是一个高质量的多模态ADHD诊断研究数据集,包含103名受试者的临床诊断信息、多种标准化量表评分、持续性注意力测试(CPT-II)结果、数天连续活动监测数据(约70-90万条记录)、数小时心率变异性监测数据(约600-800万条记录),以及从时间序列提取的788维高级特征,总计约870万条数据记录,数据规模约267-321MB。

数据集的核心价值在于其多模态、长时程、高频次的数据采集设计,真实反映了ADHD患者在自然生活环境中的生理和行为特征,提供了高生态效度的诊断依据。与传统依赖主观量表的ADHD研究不同,本数据集提供的客观生理信号为开发基于机器学习的计算机辅助诊断系统、发现生物标志物、预测治疗反应、研究疾病机制提供了坚实的数据基础。数据集包含的共病信息、用药记录、多种量表评分等丰富元数据,支持共病模式研究、药物影响分析、症状严重程度预测等多维度探索。

对于临床研究人员,本数据集可用于验证ADHD诊断假设、开展临床试验疗效评估、探索个性化治疗方案;对于机器学习研究人员,数据集提供了均衡的病例-对照样本、高维特征和原始时间序列,适合训练多种分类模型和深度学习架构;对于神经科学研究人员,数据集的多模态数据整合为研究注意力、执行功能、自主神经调节的神经机制提供了行为学和生理学证据;对于医疗设备开发者,数据集为开发可穿戴ADHD监测设备和远程医疗系统提供了算法验证平台和设计参考。

需要注意的是,数据集涉及真实患者的医疗隐私信息,使用者应遵守医学研究伦理规范和数据保护法规,确保数据仅用于科研目的,不得泄露患者身份信息。数据集中部分患者存在数据缺失(如未完成CPT-II测试、无心率数据),研究者在分析时应采用适当的缺失数据处理方法,避免引入偏倚。此外,数据集的样本量相对有限(103例),在构建诊断模型时应注意过拟合风险,建议采用交叉验证、正则化等技术确保模型泛化能力,并在独立数据集上进行外部验证。

总体而言,本数据集为ADHD的精准诊断、个性化治疗、病理机制研究提供了宝贵的多模态数据资源,有望推动ADHD从主观诊断向客观生物医学诊断的转变,促进儿童青少年精神卫生领域的科学研究和临床实践进步,具有重要的学术价值和临床应用潜力。

看了又看

暂无推荐

验证报告

以下为卖家选择提供的数据验证报告:

data icon
dist
1
已售 0
8.52MB
申请报告