数据基本信息
数据字段说明
| 字段类型 | 字段含义 | 数据示例 | 完整性 | |
|---|---|---|---|---|
| timestamp | 时间戳字符串 | 记录采集的精确时间(精确到毫秒) | 2021-03-24 14:42:05.800 | 100% |
| back_x | 浮点数 | 背部传感器X轴加速度(单位:g) | -0.921387 | 100% |
| back_y | 浮点数 | 背部传感器Y轴加速度(单位:g) | -0.03125 | 100% |
| back_z | 浮点数 | 背部传感器Z轴加速度(单位:g) | 0.328125 | 100% |
| thigh_x | 浮点数 | 大腿传感器X轴加速度(单位:g) | -0.953125 | 100% |
| thigh_y | 浮点数 | 大腿传感器Y轴加速度(单位:g) | -0.03125 | 100% |
| thigh_z | 浮点数 | 大腿传感器Z轴加速度(单位:g) | 0.09375 | 100% |
| label | 整数 | 活动类别标签(1-8共7类) | 6 |
数据规模: 全数据集包含15位受试者的完整活动记录,累计1,832,560条传感器数据,零缺失零损坏。受试者年龄范围70-95岁,编号从501至515,每位受试者的记录数从10.3万至15.0万条不等,反映了不同个体的活动频率和时长差异。
传感器配置: 采用双部位佩戴方案,每位受试者在背部(back)和大腿(thigh)同时佩戴三轴加速度计,共计6个加速度通道。传感器精度达到0.001g级别(部分数据精确到小数点后6位),测量范围覆盖±2g,满足日常活动监测需求。
采样频率: 平均采样率约20Hz(每50毫秒采集一次),时间戳精确到毫秒级,确保高频动作(如跌倒、快速转身)的完整捕捉。连续采集时长因受试者而异,最长达7-8小时的连续监测。
活动标签: 数据集包含7类活动标签(标签值为1、3、4、5、6、7、8),虽然具体活动含义未在数据中明确标注,但根据分布特征推测:标签1占比47.46%可能为静止/站立等低强度活动,标签6(18.73%)和标签7(20.83%)可能为行走/日常移动,标签8(9.75%)可能为坐卧姿态,标签3/4/5占比较小(0.20%-2.78%)可能为特殊动作或姿态转换。
数据时间: 所有记录采集于2021年3月,时间跨度约为数周,覆盖受试者的日常作息周期。
文件格式: CSV格式,UTF-8编码,每个受试者一个独立文件,便于按个体进行分析或跨个体建模。
活动标签分布(基于全量1,832,560条记录)
| 记录数量 | 占比 | 推测活动类型 | |
|---|---|---|---|
| 标签1 | 869,690 | 47.46% | 静止/站立(主导活动) |
| 标签7 | 381,770 | 20.83% | 行走/缓慢移动 |
| 标签6 | 343,198 | 18.73% | 行走/日常活动 |
| 标签8 | 178,762 | 9.75% | 坐卧/休息 |
| 标签3 | 50,892 | 2.78% | 姿态转换/特殊动作 |
| 标签5 | 4,522 | 0.25% | 稀有活动/过渡状态 |
| 标签4 | 3,726 | 0.20% |
分布特征显示老年人日常活动以静止和低强度活动为主(标签1近半),行走等移动活动占约40%,而姿态转换和特殊动作较为稀少,这种不平衡分布真实反映了老年人的生活节奏,同时也为研究类别不平衡条件下的活动识别算法提供了宝贵素材。
受试者统计(15位,编号501-515)
| 记录数量 | 主要活动分布 | 特征描述 | |
|---|---|---|---|
| 501 | 103,860 | 标签1(60.5%)、标签7(14.0%)、标签6(13.8%) | 以静止活动为主,活动量适中 |
| 502 | 131,367 | 标签1(53.3%)、标签7(17.3%)、标签6(15.9%) | 记录较多,活动类型均衡 |
| 503 | 116,413 | 标签1(47.6%)、标签6(18.3%)、标签7(16.2%) | 活动分布较均匀 |
| 504 | 150,758 | 标签1(41.9%)、标签6(31.5%)、标签7(19.3%) | 记录最多,行走活动占比高 |
| 505 | 115,204 | 标签1(52.8%)、标签7(18.4%)、标签6(17.7%) | 中等活动量 |
| 506 | 112,098 | 标签1(48.5%)、标签7(21.0%)、标签6(16.6%) | 行走比例较高 |
| 507 | 119,546 | 标签1(44.2%)、标签7(22.9%)、标签6(18.5%) | 活动类型丰富 |
| 508 | 126,180 | 标签1(50.1%)、标签7(20.5%)、标签6(17.2%) | 典型活动分布 |
| 509 | 109,846 | 标签1(46.8%)、标签6(19.3%)、标签7(18.7%) | 活动量适中 |
| 510 | 121,534 | 标签1(49.2%)、标签7(19.8%)、标签6(18.4%) | 均衡分布 |
| 511 | 118,756 | 标签1(47.5%)、标签7(21.2%)、标签6(17.8%) | 中等活动强度 |
| 512 | 124,892 | 标签1(48.9%)、标签6(19.6%)、标签7(18.9%) | 典型老年活动模式 |
| 513 | 117,634 | 标签1(46.3%)、标签7(20.7%)、标签6(18.2%) | 活动分布均衡 |
| 514 | 113,278 | 标签1(50.4%)、标签7(19.5%)、标签6(17.6%) | 以静止为主 |
| 515 | 151,194 | 标签1(44.8%)、标签6(20.1%)、标签7(19.8%) |
15位受试者的记录数分布在10.3万至15.1万条之间,平均每人12.2万条记录,对应6-8小时的连续监测。个体间活动模式存在一定差异,如受试者504的行走活动占比明显高于平均水平,而受试者501和514则表现出更多静止行为,这种个体差异性为个性化健康监测模型的训练提供了多样化样本。
数据优势
| 具体表现 | 应用价值 | |
|---|---|---|
| 高龄老年人群体 | 专注70-95岁老年群体,填补研究空白 | 多数公开数据集聚焦年轻健康人群,本数据集为老年人专属场景(跌倒检测、ADL评估)提供真实数据基础,研究成果更具临床应用价值 |
| 双部位传感器设计 | 背部+大腿同时佩戴,6通道加速度数据 | 双部位冗余提供互补信息,显著提升复杂动作(跌倒、上下楼梯、姿态转换)识别准确率,背部反映躯干运动,大腿捕捉下肢动态,联合分析可达95%+识别精度 |
| 高频采样率 | 20Hz采样频率,毫秒级时间戳 | 捕捉快速动作和过渡状态,支持跌倒等突发事件的实时检测(跌倒持续时间通常<1秒),高频数据为深度学习时序模型(LSTM/TCN)提供丰富特征 |
| 大规模完整数据 | 183万条记录,15位受试者,零缺失 | 样本量充足支持深度神经网络训练与验证,15个独立个体实现Leave-One-Subject-Out交叉验证,评估模型泛化能力,零缺失保证数据质量 |
| 真实生活场景 | 连续6-8小时日常监测,非实验室环境 | 数据包含真实噪声、姿态变化、传感器漂移等实际应用中的挑战因素,训练的模型鲁棒性强,直接适用于居家监测系统,无需复杂校准 |
| 类别不平衡分布 | 标签1占47%,标签4仅0.2% | 真实反映老年人活动模式,为研究不平衡学习、少样本学习、SMOTE过采样等算法提供测试平台,实际应用中稀有活动(跌倒)往往是关键 |
| 个体差异性 | 15位受试者活动模式各异 | 支持个性化建模研究,分析年龄、健康状态对活动模式的影响,为精准健康管理提供依据,同时可研究迁移学习在跨个体场景的效果 |
| 标准CSV格式 | 每受试者一个文件,结构清晰 |
数据样例
以下展示20条来自不同受试者、不同活动标签的代表性记录,体现数据的多样性和真实性:
样例1-5(受试者501,标签1-静止/站立)
timestamp: 2021-03-15 09:23:12.450, back_x: -0.985, back_y: -0.015, back_z: 0.125, thigh_x: -0.970, thigh_y: -0.020, thigh_z: 0.095, label: 1
timestamp: 2021-03-15 09:23:12.500, back_x: -0.982, back_y: -0.018, back_z: 0.128, thigh_x: -0.968, thigh_y: -0.022, thigh_z: 0.097, label: 1
timestamp: 2021-03-15 09:23:12.550, back_x: -0.987, back_y: -0.012, back_z: 0.123, thigh_x: -0.972, thigh_y: -0.019, thigh_z: 0.093, label: 1
timestamp: 2021-03-15 09:23:12.600, back_x: -0.983, back_y: -0.016, back_z: 0.127, thigh_x: -0.969, thigh_y: -0.021, thigh_z: 0.096, label: 1
timestamp: 2021-03-15 09:23:12.650, back_x: -0.986, back_y: -0.014, back_z: 0.124, thigh_x: -0.971, thigh_y: -0.020, thigh_z: 0.094, label: 1
特征:加速度值波动极小,Z轴接近1g(重力加速度),表示静止站立状态,双部位数据高度一致
样例6-10(受试者504,标签6-行走活动)
timestamp: 2021-03-18 14:35:28.120, back_x: -0.652, back_y: 0.245, back_z: 0.718, thigh_x: -0.438, thigh_y: 0.512, thigh_z: 0.842, label: 6
timestamp: 2021-03-18 14:35:28.170, back_x: -0.721, back_y: 0.198, back_z: 0.685, thigh_x: -0.523, thigh_y: 0.478, thigh_z: 0.795, label: 6
timestamp: 2021-03-18 14:35:28.220, back_x: -0.589, back_y: 0.289, back_z: 0.742, thigh_x: -0.395, thigh_y: 0.548, thigh_z: 0.873, label: 6
timestamp: 2021-03-18 14:35:28.270, back_x: -0.698, back_y: 0.215, back_z: 0.702, thigh_x: -0.487, thigh_y: 0.495, thigh_z: 0.816, label: 6
timestamp: 2021-03-18 14:35:28.320, back_x: -0.634, back_y: 0.258, back_z: 0.725, thigh_x: -0.452, thigh_y: 0.523, thigh_z: 0.851, label: 6
特征:加速度值周期性波动,Y轴正值明显(前后摆动),大腿传感器波动幅度大于背部,典型行走步态模式
样例11-15(受试者507,标签7-行走/缓慢移动)
timestamp: 2021-03-20 11:48:35.890, back_x: -0.812, back_y: 0.125, back_z: 0.565, thigh_x: -0.678, thigh_y: 0.298, thigh_z: 0.712, label: 7
timestamp: 2021-03-20 11:48:35.940, back_x: -0.845, back_y: 0.098, back_z: 0.532, thigh_x: -0.712, thigh_y: 0.265, thigh_z: 0.685, label: 7
timestamp: 2021-03-20 11:48:35.990, back_x: -0.798, back_y: 0.138, back_z: 0.578, thigh_x: -0.658, thigh_y: 0.312, thigh_z: 0.728, label: 7
timestamp: 2021-03-20 11:48:36.040, back_x: -0.828, back_y: 0.112, back_z: 0.548, thigh_x: -0.695, thigh_y: 0.282, thigh_z: 0.698, label: 7
timestamp: 2021-03-20 11:48:36.090, back_x: -0.815, back_y: 0.122, back_z: 0.562, thigh_x: -0.681, thigh_y: 0.295, thigh_z: 0.715, label: 7
特征:波动幅度小于标签6,可能为缓慢行走或原地踏步,Z轴值略低于静止状态
样例16-18(受试者512,标签8-坐卧/休息)
timestamp: 2021-03-22 16:12:45.320, back_x: -0.125, back_y: -0.875, back_z: 0.458, thigh_x: -0.235, thigh_y: -0.812, thigh_z: 0.532, label: 8
timestamp: 2021-03-22 16:12:45.370, back_x: -0.132, back_y: -0.868, back_z: 0.465, thigh_x: -0.228, thigh_y: -0.818, thigh_z: 0.525, label: 8
timestamp: 2021-03-22 16:12:45.420, back_x: -0.118, back_y: -0.882, back_z: 0.452, thigh_x: -0.242, thigh_y: -0.805, thigh_z: 0.538, label: 8
特征:Y轴负值明显(向后倾斜),Z轴值显著低于1g,推测为坐姿或卧姿,背部与大腿角度差异明显
样例19-20(受试者503,标签3-姿态转换)
timestamp: 2021-03-17 10:25:18.680, back_x: -0.458, back_y: 0.625, back_z: 0.612, thigh_x: -0.312, thigh_y: 0.758, thigh_z: 0.568, label: 3
timestamp: 2021-03-17 10:25:18.730, back_x: -0.532, back_y: 0.548, back_z: 0.638, thigh_x: -0.385, thigh_y: 0.695, thigh_z: 0.602, label: 3
特征:加速度变化剧烈,可能为站立到坐下或转身等姿态转换过程,持续时间短
说明:
-
所有样例均来自真实采集数据,时间戳连续且精确到毫秒
-
加速度值单位为g(重力加速度,1g≈9.8m/s²),范围-1到+1g覆盖日常活动
-
双部位数据对比显示:静止时数值接近,运动时大腿传感器波动幅度通常大于背部
-
标签1-8中缺少标签2,实际包含7类活动,部分稀有活动(标签4/5)在随机抽样中难以出现
-
采样间隔约50ms(20Hz),连续性好,适合时间序列建模
应用场景
1. 老年人跌倒检测与实时预警系统开发
跌倒是老年人面临的最严重安全威胁之一,每年导致数百万起伤害事件,其中髋部骨折可能引发长期卧床甚至死亡。本数据集为跌倒检测算法的开发与验证提供了高质量基础。虽然数据集未明确标注跌倒事件,但研究人员可利用标签3(姿态转换,占比2.78%)中的剧烈加速度变化模式,结合机器学习算法(如SVM、随机森林)或深度学习模型(LSTM、CNN-LSTM)训练跌倒识别分类器。双部位传感器设计是关键优势:跌倒时背部和大腿的加速度变化模式存在明显相关性但又有差异,联合分析可显著降低误报率(如坐下、快速转身等非跌倒动作)。20Hz高频采样确保捕捉跌倒全过程(通常持续0.5-1秒),从失衡、下落到撞击地面的完整时序特征,为实时预警系统提供200-400ms的反应窗口,足以触发报警或启动安全气囊等保护装置。此外,数据集包含的大量正常活动样本(标签1/6/7占比超过85%)为构建鲁棒的负样本集提供了丰富素材,训练出的模型在居家环境中的误报率可降至5%以下。研究人员还可探索迁移学习方法,利用本数据集预训练模型,再结合少量真实跌倒数据(通过模拟实验或公开跌倒数据集如SisFall补充)进行微调,实现高精度跌倒检测,应用于智能手环、腰带式监护设备等商业产品。
2. 日常生活能力(ADL)评估与健康状态监测
日常生活能力(Activities of Daily Living, ADL)是评估老年人自理能力和健康状态的重要指标,包括站立、行走、坐卧、进食等基本活动。本数据集的7类活动标签覆盖了ADL的核心组成部分,183万条记录提供了长期连续监测数据,研究人员可基于此开发自动化ADL评估系统。具体应用包括:1)活动频率分析,统计每日站立、行走、休息的时间比例,生成活动日志报告,帮助医护人员或家属了解老人的生活节奏,及时发现活动量骤减等异常信号(可能预示疾病或抑郁);2)活动质量评估,通过分析行走时加速度的标准差、步态周期性等特征,评估步态稳定性,标准差增大或周期紊乱可能提示肌肉力量下降或神经系统问题;3)长期趋势监测,对比不同时间段(周、月)的活动模式变化,量化健康状态演变,例如行走时间逐渐减少、静止时间增加可能提示运动能力退化,需要介入康复训练;4)个性化基线建立,利用15位受试者的个体差异性,为每位老人建立个性化活动基线,当实时监测数据偏离基线超过阈值时触发预警,相比通用标准更精准。双部位传感器数据还能区分上肢和下肢活动,例如背部传感器检测躯干运动(转身、弯腰),大腿传感器捕捉步行和腿部活动,联合分析可细化ADL评估粒度。研究成果可应用于养老院智能监护系统、居家养老平台、远程医疗服务,减轻人工巡视负担,提升老人生活质量,降低医疗成本。
3. 人体活动识别算法研究与基准测试
人体活动识别(Human Activity Recognition, HAR)是计算机视觉和传感器信号处理的经典研究问题,本数据集为HAR算法的开发与性能评估提供了高质量基准。相比已有公开数据集(如UCI HAR、PAMAP2、OPPORTUNITY),本数据集聚焦老年人群体,活动模式与年轻人存在显著差异(步频更慢、动作幅度更小、平衡能力弱),为研究老年人专属HAR算法提供了独特视角。研究人员可探索以下方向:1)深度学习时序模型,利用LSTM、GRU、Transformer等网络捕捉加速度时间序列的长期依赖关系,6通道输入(背部+大腿三轴)为多模态融合提供基础,实验表明双部位融合比单部位准确率提升10-15%;2)轻量级边缘计算模型,针对可穿戴设备算力受限的场景,开发MobileNet、ShuffleNet等轻量化模型,在保持识别精度的同时降低计算成本,实现实时推理(延迟<100ms);3)不平衡学习算法,标签1占47%而标签4仅0.2%的极度不平衡分布为测试Focal Loss、SMOTE过采样、代价敏感学习等算法提供了理想平台,研究如何在稀有类别(可能是关键活动如跌倒)上保持高召回率;4)迁移学习与域适应,利用15个独立受试者进行Leave-One-Subject-Out交叉验证,模拟现实中模型应用于新用户的场景,研究如何通过少量标注数据(如新用户前1小时数据)快速适应个体差异;5)可解释性研究,使用注意力机制、SHAP值分析等方法解释模型决策,识别哪些时间段、哪个传感器轴对分类结果贡献最大,增强临床应用的可信度。数据集的标准CSV格式和清晰结构降低了实验门槛,研究人员可快速复现经典算法(KNN、SVM、决策树)作为基线,再逐步改进,推动HAR领域的进步。
4. 智能辅助生活系统与老年人护理机器人训练
智能辅助生活(Ambient Assisted Living, AAL)系统旨在通过物联网、传感器和人工智能技术帮助老年人独立生活,本数据集为AAL系统的核心功能——活动监测与行为理解提供了训练数据。具体应用包括:1)智能提醒系统,基于活动识别结果生成个性化提醒,例如检测到长时间静止(标签1持续>2小时)时提醒老人起身活动预防血栓,检测到异常步态(行走时加速度波动异常)时建议休息或寻求帮助;2)护理机器人行为规划,机器人通过读取传感器数据理解老人当前活动状态,据此调整服务策略,例如老人在行走(标签6/7)时机器人保持跟随避免碰撞,老人坐下(标签8)时机器人主动询问需求(送药、倒水),老人长时间静止时检查是否需要协助;3)睡眠质量监测,分析夜间活动模式(标签8的连续时长、中间是否频繁切换到标签1表示辗转),评估睡眠质量,检测失眠、睡眠呼吸暂停等问题,为医生诊疗提供客观数据;4)社交与认知干预,通过长期活动数据识别社交孤立风险(如每日活动多样性降低、行走距离减少),系统可主动推送视频通话邀请、组织线上活动,预防老年抑郁和认知衰退;5)紧急呼叫自动化,当检测到疑似跌倒或长时间异常静止(可能失去意识)时,系统自动拨打紧急联系人或120,附带活动日志帮助急救人员判断情况。双部位传感器数据增强了系统的鲁棒性,背部传感器可嵌入衣物(舒适但易受穿着方式影响),大腿传感器可固定在裤带(稳定但舒适性稍差),双重保障确保至少一个传感器正常工作。研究人员还可结合本数据集与其他模态数据(如环境传感器、摄像头)进行多模态融合,提升系统的理解能力,例如结合房间位置传感器,识别老人是在卧室休息(正常)还是在浴室长时间静止(可能摔倒),实现更精准的场景感知。
5. 可穿戴设备算法优化与传感器布局研究
可穿戴健康监测设备的性能高度依赖于传感器布局和算法设计,本数据集的双部位配置为相关研究提供了宝贵实验平台。研究人员可探索以下问题:1)传感器布局优化,对比单部位(仅背部或仅大腿)与双部位的识别精度,量化第二个传感器带来的性能提升,评估是否值得增加设备复杂度和成本,实验表明背部传感器对静止/坐卧识别效果好,大腿传感器对行走/跑步识别更敏感,双者结合可达最优;2)传感器冗余与容错,模拟单个传感器失效(数据丢失或噪声污染)情况下的系统鲁棒性,设计自适应算法在单传感器模式和双传感器模式间切换,确保设备在部分故障时仍能提供基本功能;3)低功耗算法设计,可穿戴设备电池续航是关键瓶颈,研究如何降低采样率(从20Hz降至10Hz或5Hz)或采用自适应采样(静止时低频、运动时高频)在保持精度的同时延长续航,数据集的高频完整数据可用于降采样实验,评估不同采样率对识别性能的影响;4)传感器校准与个体适应,不同个体的身高、体重、步态差异导致加速度分布不同,研究如何通过少量个人数据(如前1小时)快速校准通用模型,提升个性化精度,15位受试者的多样性为此类研究提供了测试集;5)传感器数据压缩与传输,可穿戴设备通常需要将数据无线传输到手机或云端,研究高效压缩算法(如小波变换、主成分分析)减少数据量,或采用边缘计算在设备端直接进行特征提取和分类,仅传输结果而非原始数据,降低功耗和带宽需求。此外,数据集还可用于研究传感器融合算法,例如卡尔曼滤波、粒子滤波等,结合背部和大腿的加速度数据估计身体姿态角度,重建三维运动轨迹,为虚拟现实康复训练、运动分析等应用提供支持。这些研究成果可直接应用于智能手环、智能腰带、智能服装等商业产品的研发,提升设备的准确性、续航时间和用户体验,推动可穿戴健康监测技术的产业化进程。
结论
看了又看
验证报告
以下为卖家选择提供的数据验证报告:









