具身智能多样化数据

verify-tag具身智能 12个日常操作视频数据集-含衣物整理-清洁护理-工具使用等生活技能演示-高清1920x1456分辨率-支持行为识别与机器人模仿学习

具身智能

39.9

307.16MB

数据标识:D17824710641590107

发布时间:2026/06/26

# sample示例:日常操作视频数据集

## 引言与背景

在人工智能和机器人技术飞速发展的今天,让机器理解并模仿人类的日常操作行为成为重要的研究方向。然而,高质量的日常操作视频数据相对匮乏,限制了行为识别、动作模仿和机器人学习等领域的发展。sample示例数据集正是为满足这一需求而构建的日常操作视频数据集,旨在为行为识别、机器人模仿学习和动作理解等任务提供丰富的数据支撑。

该数据集包含12个日常操作视频,涵盖衣物整理、清洁护理、工具使用、物品更换、物品收纳等多个生活场景。每个视频都配有详细的任务说明,包括任务编号、任务名称、任务流程、任务要求和所需物品等信息。视频采用高清分辨率拍摄,帧率稳定,能够清晰展示操作细节和动作过程。数据集总时长约7分钟,总大小约307MB,是一套小巧而精美的日常操作行为数据资源。

sample示例数据集不仅包含完整的视频文件,还提供了结构化的任务说明文档,形成了一套完整的行为学习框架。该数据集可用于训练行为识别模型、开发机器人模仿学习算法、构建动作理解系统等多个研究方向。

## 数据基本信息

### 数据字段说明

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| 任务编号 | 整数 | 任务唯一标识 | 2049 | 100% |
| 任务名称 | 字符串 | 任务的中文名称 | "挑选黑色背心并折叠" | 100% |
| 任务流程 | 字符串 | 任务的操作步骤描述 | "桌上有一件背心。双手配合折叠这件黑色背心。" | 100% |
| 任务要求 | 字符串 | 任务完成的标准和条件 | "背心折叠成紧凑形状且边缘整齐" | 100% |
| 任务所需包含物品 | 字符串 | 完成任务所需的物品列表 | "黑色背心铺在桌面且未折叠" | 100% |
| 视频文件名 | 字符串 | 对应视频文件的名称 | "2049 挑选黑色背心并折叠.mp4" | 100% |
| 视频时长 | 浮点数 | 视频持续时间(秒) | 58.8 | 100% |
| 视频分辨率 | 字符串 | 视频画面尺寸 | "1920x1456" | 100% |
| 帧率 | 浮点数 | 视频每秒帧数 | 25.0 | 100% |
| 比特率 | 整数 | 视频编码比特率(kbps) | 5464 | 100% |
| 文件大小 | 整数 | 视频文件大小(MB) | 38 | 100% |

### 任务类型分布

| 任务类别 | 任务数量 | 代表任务 |
|---------|---------|---------|
| 衣物整理 | 2 | 挑选黑色背心并折叠、将鞋子放入防尘袋 |
| 清洁护理 | 3 | 擦拭电脑屏幕、清洁眼镜、挤牙膏 |
| 工具使用 | 2 | 用圆规画一个完美的圆、用打火机点燃蜡烛 |
| 物品更换 | 3 | 更换滤芯、更换电动牙刷刷头、给手机充电 |
| 物品收纳 | 2 | 收纳筷子、打开水杯盖 |

### 视频规格分布

| 规格指标 | 最小值 | 最大值 | 平均值 |
|---------|-------|-------|-------|
| 时长(秒) | 14.0 | 80.2 | 35.2 |
| 分辨率宽度(像素) | 1920 | 3840 | 2080 |
| 分辨率高度(像素) | 1456 | 1456 | 1456 |
| 帧率(fps) | 25.0 | 30.0 | 28.8 |
| 比特率(kbps) | 3932 | 7045 | 5318 |
| 文件大小(MB) | 8 | 57 | 25.6 |

### 数据规模概述

sample示例数据集共包含12个日常操作视频,涵盖5大任务类别。视频总时长约422秒(7分钟),总文件大小约307MB。视频分辨率以1920x1456为主,其中一个视频为3840x1456超宽幅。帧率为25-30fps,保证了动作的流畅性。每个视频都配有详细的任务说明文档,包含任务流程、要求和所需物品等信息,形成了完整的行为数据标注体系。

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 任务多样性 | 涵盖衣物整理、清洁护理、工具使用、物品更换、物品收纳5大类别 | 支持多种行为识别和模仿学习任务 |
| 完整原始视频 | 包含12个完整MP4视频文件,高清分辨率,清晰展示操作细节 | 可直接用于视觉分析和动作理解 |
| 详细任务说明 | Excel文档提供任务编号、名称、流程、要求、所需物品等完整信息 | 支持监督学习和任务理解 |
| 操作流程完整 | 每个视频记录从准备到完成的完整操作过程 | 支持端到端的动作模仿和行为学习 |
| 动作细节丰富 | 视频帧率稳定,能够捕捉手部动作和操作细节 | 支持精细动作识别和模仿 |

## 数据样例

以下为12个视频样例的详细信息(任务描述以Excel文档为准):

### 样例1:挑选黑色背心并折叠

- 任务编号:2049
- 任务名称:挑选黑色背心并折叠
- 任务流程:桌上有一件背心。双手配合折叠这件黑色背心。
- 任务要求:1) 背心折叠成紧凑形状且边缘整齐;2) 背心放入收纳区或指定位置;3) 桌面无多余杂物残留
- 所需物品:黑色背心铺在桌面且未折叠;桌面一侧有收纳区或指定位置;桌面有可用操作空间
- 视频规格:1920x1456,25fps,时长58.8秒,大小38MB

### 样例2:擦拭电脑屏幕

- 任务编号:2062
- 任务名称:擦拭电脑屏幕
- 任务流程:将电脑屏幕、喷剂和毛巾放在桌上。将清洁剂喷在屏幕上,用毛巾擦拭干净。
- 任务要求:1) 屏幕表面无明显指纹或污渍;2) 清洁工具放回指定位置;3) 桌面无明显液体残留或杂物
- 所需物品:电脑屏幕放在桌面且表面有指纹或污渍;清洁喷剂与毛巾放在桌面且可取用;桌面有可用操作空间
- 视频规格:3840x1456,30fps,时长43.2秒,大小57MB

### 样例3:挤牙膏

- 任务编号:2068
- 任务名称:挤牙膏
- 任务流程:牙刷和牙膏放在桌上;双手配合将牙膏挤到牙刷上。
- 任务要求:1) 牙刷刷头上有可见牙膏且未明显溢出;2) 牙膏盖合上或按压口复位;3) 桌面无明显牙膏残留
- 所需物品:牙刷放在桌面且刷头朝上;牙膏放在桌面且开口可用;桌面有可用操作空间
- 视频规格:1920x1456,25fps,时长14.7秒,大小9MB

### 样例4:用圆规画一个完美的圆

- 任务编号:2075
- 任务名称:用圆规画一个完美的圆
- 任务流程:一张纸和一个圆规放在桌上。双手调整圆规间距,然后一只手旋转圆规,画出一个完美的圆。
- 任务要求:1) 圆规间距设定到位且锁紧;2) 圆规尖端与笔端保持对齐且不松动;3) 圆规放在指定位置且桌面整洁
- 所需物品:圆规放在桌面且开合未固定;锁紧结构处于松开状态;桌面有可用操作空间
- 视频规格:1920x1456,30fps,时长55.5秒,大小41MB

### 样例5:更换滤芯

- 任务编号:2101
- 任务名称:更换设备滤芯
- 任务流程:将一个设备滤芯组件放在桌面上,双手配合打开设备并更换滤芯。
- 任务要求:1) 新滤芯安装到位且连接稳固;2) 旧滤芯放入废弃区或指定位置;3) 设备盖合到位且无明显松动;4) 桌面无多余杂物残留
- 所需物品:设备放在桌面且滤芯仓可打开;滤芯组件放在桌面且未安装;设备盖处于闭合或可打开状态
- 视频规格:1920x1456,25fps,时长80.2秒,大小45MB

### 样例6:给手机充电

- 任务编号:2109
- 任务名称:给手机充电
- 任务流程:桌上放有一个模型手机和一根充电线(无需电源)。一只手臂拿起模型手机,另一只手臂拿起数据线,然后将其插入。
- 任务要求:1) 充电线插入手机接口到位且不松动;2) 手机放置稳定且不被线缆拉扯;3) 线缆整理到指定位置;4) 桌面无多余杂物残留
- 所需物品:手机放在桌面且未连接线缆;充电线放在桌面且插头可触达;桌面有可用操作空间
- 视频规格:1920x1456,30fps,时长21.7秒,大小17MB

### 样例7:用打火机点燃蜡烛

- 任务编号:2122
- 任务名称:用打火机点燃蜡烛
- 任务流程:将蜡烛和打火机放在桌上,用打火机点燃蜡烛。
- 任务要求:1) 蜡烛烛芯被点燃且火焰稳定;2) 打火机放回指定位置且不靠近火焰;3) 蜡烛放置稳定且周边无多余杂物残留
- 所需物品:蜡烛放在桌面且烛芯未点燃;打火机放在桌面且可取用;桌面有可用操作空间
- 视频规格:1920x1456,30fps,时长16.5秒,大小8MB

### 样例8:更换电动牙刷刷头

- 任务编号:2140
- 任务名称:更换电动牙刷刷头
- 任务流程:书桌上有一支电动牙刷和一个替换刷头。用双手将它们组装起来。
- 任务要求:1) 新刷头安装到位且连接牢固;2) 旧刷头放在指定位置或废弃区;3) 牙刷放置整齐且桌面无零散部件残留
- 所需物品:电动牙刷本体放在桌面且刷头未安装或已松动;替换刷头放在桌面且未连接;桌面有可用操作空间
- 视频规格:1920x1456,25fps,时长17.5秒,大小10MB

### 样例9:收纳筷子

- 任务编号:2149
- 任务名称:收纳筷子
- 任务流程:书桌上有一双筷子和一个餐具盒。用双手将筷子放入餐具盒内。
- 任务要求:1) 筷子位于餐具盒内且放置到位;2) 餐具盒闭合到位且不松动;3) 餐具盒放置稳定且不占用主要操作区;4) 桌面无多余杂物残留且无散落物
- 所需物品:筷子放在桌面且未收纳;餐具盒放在桌面且内部空置;餐具盒处于打开或可打开状态;桌面有可用操作空间
- 视频规格:1920x1456,30fps,时长38.5秒,大小22MB

### 样例10:清洁眼镜

- 任务编号:2151
- 任务名称:清洁眼镜
- 任务流程:桌上有一副眼镜和一块眼镜布。双手配合清洁眼镜。
- 任务要求:1) 镜片表面污渍或指纹明显减少;2) 眼镜折叠或摆放整齐在指定位置;3) 眼镜布放回指定位置且桌面无明显碎屑残留
- 所需物品:眼镜放在桌面且镜片有污渍或指纹;眼镜布放在桌面且可取用;桌面有可用操作空间
- 视频规格:1920x1456,30fps,时长33.8秒,大小23MB

### 样例11:打开水杯盖

- 任务编号:2161
- 任务名称:打开水杯盖
- 任务流程:桌上放着一个水杯。双手配合拧开杯盖,并将其放在桌面上。
- 任务要求:1) 杯盖从杯身取下且放在指定位置;2) 水杯开口可触达且杯身保持稳定;3) 桌面无水渍或杂物残留
- 所需物品:水杯放在桌面且杯盖旋紧;杯身放置稳定且无外溢;桌面旁侧有空置放置位
- 视频规格:1920x1456,30fps,时长14.0秒,大小9MB

### 样例12:将鞋子放入防尘袋

- 任务编号:2169
- 任务名称:将鞋子放入防尘袋
- 任务流程:将一双鞋和一个防尘袋放在桌上。用双手将鞋子放入袋中,并封好袋口。
- 任务要求:1) 鞋子完全放入防尘袋且不外露;2) 防尘袋袋口闭合到位且不松开;3) 防尘袋放置整齐且桌面无多余杂物残留
- 所需物品:一些鞋放在桌面且未装袋;防尘袋放在桌面且袋口打开或可打开;袋内空间空置
- 视频规格:1920x1456,25fps,时长27.4秒,大小22MB

## 应用场景

### 行为识别与动作分类

sample示例数据集在行为识别和动作分类领域具有重要应用价值。数据集包含12个日常操作视频,涵盖5大任务类别,可以用于训练和测试行为识别模型。研究人员可以利用这些数据开发能够识别不同日常操作行为的算法,实现从视频流中自动检测和分类人类动作。这种技术可以应用于智能家居监控、老年人行为分析、儿童安全监护等场景,帮助系统理解人类的日常活动并提供相应的服务。

### 机器人模仿学习

该数据集为机器人模仿学习提供了宝贵的训练资源。机器人要完成日常操作任务,需要学习人类的操作流程和动作细节。数据集提供了详细的任务说明和完整的操作视频,可以用于训练机器人的动作模仿能力。研究人员可以利用这些数据开发能够观察人类操作并进行模仿学习的算法,使机器人能够学会给手机充电、更换牙刷刷头、清洁物品等日常技能。这种能力在服务机器人、家庭助手等领域具有广泛的应用前景。

### 动作理解与任务规划

sample示例数据集在动作理解和任务规划领域也具有重要应用价值。每个视频都配有详细的任务说明,包括任务流程、要求和所需物品等信息,形成了完整的行为-任务映射。研究人员可以利用这些数据训练能够理解人类动作意图并规划相应任务的模型。例如,模型可以根据视频中的操作流程,生成完成任务所需的步骤序列,或者根据任务要求评估操作的完成质量。这种能力在智能助手、自动化流程设计等领域具有重要应用。

### 人机交互与意图识别

该数据集为人机交互和意图识别研究提供了数据支撑。通过分析视频中的操作行为和任务说明,可以训练能够理解人类意图的模型。这种模型可以应用于智能交互系统,使系统能够根据用户的操作行为推断其意图,并提供相应的响应。例如,当用户开始给手机充电时,系统可以自动提供电源插座;当用户开始清洁眼镜时,系统可以自动提供清洁液。这种智能化的交互方式可以提升用户体验,使系统更加人性化。

### 虚拟现实与增强现实应用

sample示例数据集在虚拟现实(VR)和增强现实(AR)领域也具有应用价值。数据集提供了真实的日常操作视频,可以用于生成虚拟场景中的人物动作,或者为AR应用提供操作指导。例如,在VR购物场景中,可以使用数据集中的收纳视频来展示商品的整理过程;在AR维修指导中,可以使用设备更换视频来演示操作步骤。此外,数据集还可以用于训练虚拟化身的动作生成模型,使虚拟人物的动作更加自然和真实。

## 结尾

sample示例日常操作视频数据集是一套小巧而精美的行为数据资源,包含12个日常操作视频,涵盖衣物整理、清洁护理、工具使用、物品更换和物品收纳5大任务类别。视频采用高清分辨率拍摄,帧率稳定,能够清晰展示操作细节和动作过程。每个视频都配有详细的任务说明文档(以Excel文档为准),形成了完整的行为学习框架。

该数据集的核心优势在于其任务多样性、完整原始视频和详细任务说明,使其不仅适用于行为识别和机器人模仿学习,还可用于动作理解、人机交互和VR/AR应用等多个领域。数据集规模适中,适合作为研究入门和算法验证的基准数据。

数据集包含完整的MP4视频文件和Excel任务说明文档,可直接下载使用。如有需要可私信获取更多信息。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
具身智能 12个日常操作视频数据集-含衣物整理-清洁护理-工具使用等生活技能演示-高清1920x1456分辨率-支持行为识别与机器人模仿学习
39.9
307.16MB
申请报告