数据描述
引言与背景
数据基本信息
数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---|---|---|---|---|
| 图像文件 | PNG图像 | 腹腔镜手术工具图像 | 7201_44751.png | 100%(无缺失) |
| 工具类别 | 目录标签 | 手术工具类型 | clipper/grasper/hook/scissor | 100%(无缺失) |
| 数据集分割 | 目录标签 | 数据集类型 | train/test/validation | 100%(无缺失) |
| 分辨率 | 元数据 | 图像尺寸 | 128x86 | 100%(统一尺寸) |
| 颜色通道 | 元数据 | 图像颜色模式 | RGB | 100%(统一模式) |
数据分布情况
数据集分割分布
| 数据集类型 | 图像数量 | 占比 | 累计占比 |
|---|---|---|---|
| 训练集 | 1200 | 60.03% | 60.03% |
| 测试集 | 600 | 30.02% | 90.05% |
| 验证集 | 199 | 9.95% | 100.00% |
| 总计 | 1999 | 100.00% | 100.00% |
工具类别分布
| 工具类别 | 图像数量 | 占比 |
|---|---|---|
| grasper(抓钳) | 699 | 35.0% |
| hook(钩子) | 699 | 35.0% |
| clipper(夹钳) | 389 | 19.5% |
| scissor(剪刀) | 212 | 10.6% |
| 总计 | 1999 | 100.0% |
各数据集工具类别分布
| 数据集类型 | 工具类别 | 图像数量 | 占该数据集比例 | 占总数据集比例 |
|---|---|---|---|---|
| 训练集 | grasper | 417 | 34.75% | 20.86% |
| 训练集 | hook | 407 | 33.92% | 20.36% |
| 训练集 | clipper | 246 | 20.50% | 12.31% |
| 训练集 | scissor | 130 | 10.83% | 6.50% |
| 测试集 | hook | 229 | 38.17% | 11.46% |
| 测试集 | grasper | 210 | 35.00% | 10.51% |
| 测试集 | clipper | 103 | 17.17% | 5.15% |
| 测试集 | scissor | 57 | 9.50% | 2.85% |
| 验证集 | grasper | 73 | 36.68% | 3.65% |
| 验证集 | hook | 64 | 32.16% | 3.20% |
| 验证集 | clipper | 40 | 20.10% | 2.00% |
| 验证集 | scissor | 23 | 11.56% | 1.15% |
数据规模与类型
Cholec-tinytools数据集包含1999张高清晰度RGB图像,所有图像均采用PNG格式存储,分辨率统一为128x86像素。数据集涵盖了四种常见的腹腔镜手术工具:夹钳、抓钳、钩子和剪刀。图像来源于真实的腹腔镜手术场景,每张图像只包含一个手术工具,确保了标注的准确性和任务的明确性。数据集按照训练集(60.03%)、测试集(30.02%)和验证集(9.95%)进行了合理分割,便于研究人员进行模型训练、测试和验证。
数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---|---|---|
| 高质量医学图像 | 1999张清晰的腹腔镜手术工具图像,分辨率统一为128x86 | 为手术工具识别算法提供高质量训练数据 |
| 标准化标注 | 每张图像仅包含一个工具,通过目录结构清晰标注工具类型和数据集分割 | 确保数据标注的准确性和一致性,便于模型训练和评估 |
| 多工具类别 | 涵盖夹钳、抓钳、钩子和剪刀四种常见腹腔镜手术工具 | 支持多分类模型的开发和测试 |
| 合理数据集分割 | 训练集、测试集、验证集比例约为6:3:1 | 便于研究人员进行模型训练、验证和独立测试 |
| 专业医学来源 | 由CAMMA研究组生成,来源于真实腹腔镜手术场景 | 确保数据的医学专业性和实际应用价值 |
| 完整原始文件 | 提供完整的PNG图像文件,可直接用于算法训练和测试 | 便于研究人员进行图像处理和特征提取 |
数据样例
由于数据集包含完整的PNG图像文件,无法在文章中直接展示图像内容。以下是部分图像文件的路径样例,展示了数据集的结构和命名方式:
训练集样例
-
train/clipper/1000_10001.png
-
train/grasper/1000_10051.png
-
train/hook/1000_10101.png
-
train/scissor/1000_10151.png
-
train/clipper/1000_10201.png
-
train/grasper/1000_10251.png
测试集样例
-
test/clipper/2000_20001.png
-
test/grasper/2000_20051.png
-
test/hook/2000_20101.png
-
test/scissor/2000_20151.png
验证集样例
-
validation/clipper/7201_44751.png
-
validation/grasper/7201_6926.png
-
validation/hook/7201_7001.png
-
validation/scissor/7201_7976.png
所有样例图像均为RGB格式,分辨率为128x86,每张图像仅包含一种手术工具,工具类型通过目录结构明确标注。
应用场景
手术工具识别算法开发与评估
Cholec-tinytools数据集为腹腔镜手术工具识别算法的开发和评估提供了标准化平台。研究人员可以利用该数据集训练深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)或Transformer等,实现对腹腔镜手术视频中工具的自动识别。通过训练集进行模型训练,验证集进行模型调优,测试集进行独立评估,可以全面评估算法的准确性、鲁棒性和实时性。这对于提高手术工具识别的自动化水平,减少人工干预,提高手术安全性具有重要意义。
医学图像分析研究
该数据集可用于医学图像分析领域的多种研究任务,如目标检测、图像分割、特征提取等。研究人员可以基于这些图像开发新的图像处理算法,探索医学图像的特征表示方法,提高计算机对医学图像的理解能力。同时,该数据集也为医学图像分析与计算机视觉的交叉研究提供了数据支持,推动了相关技术在医疗领域的应用。
计算机辅助手术系统开发
Cholec-tinytools数据集为计算机辅助手术系统的开发提供了关键数据支持。通过将手术工具识别算法集成到手术导航系统中,可以实时追踪手术过程中使用的工具类型和位置,为外科医生提供视觉辅助和决策支持。这有助于提高手术精度,减少手术风险,缩短手术时间,改善患者预后。同时,该数据集也为手术过程分析、手术技能评估等研究提供了数据基础。
医疗人工智能教育与培训
该数据集可作为医疗人工智能教育和培训的重要资源。在高校和研究机构的计算机视觉、医学图像处理等课程中,可以使用该数据集进行教学演示、实验和项目开发。学生可以通过实际操作该数据集,学习医学图像分析的基本方法,掌握深度学习算法在医疗领域的应用技巧。这有助于培养医疗人工智能领域的专业人才,推动相关技术的普及和发展。
结尾
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






