きゅがんせん

verify-tag大规模药片目标检测数据集:12067张图像与144111个标注实例的多源融合医学影像数据集

医疗健康药片识别医疗影像诊断

59

已售 0
1.39GB

数据标识:D17790948741196039

发布时间:2026/05/18

# 大规模药片目标检测数据集:12067张图像与144111个标注实例的多源融合医学影像数据集

## 引言与背景

在医疗健康领域,药片识别与检测是一项至关重要的技术任务,广泛应用于药品管理、医疗辅助诊断、智能药房等场景。随着计算机视觉和深度学习技术的发展,基于图像的药片检测系统成为研究热点。本数据集正是为满足这一需求而构建的大规模药片目标检测数据集。

本数据集通过融合12个不同来源的数据,包括NIH-Pill-rximage、VAIPE系列数据集、Personal系列数据集、Ultralytics-medical-pills等,形成了一个包含12067张图像和144111个标注实例的综合性数据集。数据集中不仅包含高质量的药片图像原始文件,还配有完整的YOLO格式标注信息,便于直接用于目标检测模型的训练和评估。

该数据集的构建旨在为药片检测算法的研发提供丰富、多样的训练数据,推动医疗影像分析技术的发展,促进智能医疗系统的创新应用。

## 数据基本信息

### 数据字段说明

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| :--- | :--- | :--- | :--- | :--- |
| 图像文件名 | 字符串 | 图像文件的唯一标识符 | VAIPE-test_TEST_VAIPE_P_45_0.jpg | 100% |
| 标注类别 | 整数 | 目标类别编号(0表示药片) | 0 | 100% |
| 边界框中心点X坐标 | 浮点数 | 归一化的边界框中心点横坐标 | 0.564105 | 100% |
| 边界框中心点Y坐标 | 浮点数 | 归一化的边界框中心点纵坐标 | 0.563705 | 100% |
| 边界框宽度 | 浮点数 | 归一化的边界框宽度 | 0.198562 | 100% |
| 边界框高度 | 浮点数 | 归一化的边界框高度 | 0.166206 | 100% |
| 图像格式 | 字符串 | 图像文件格式 | jpg | 100% |
| 数据集来源 | 字符串 | 图像所属的原始数据集 | VAIPE-test | 100% |
| 数据划分 | 字符串 | 数据所属的集合类型 | train/val | 100% |

### 数据分布情况

#### 数据划分分布

| 数据划分 | 图像数量 | 占比 | 标注实例数 | 实例占比 |
| :--- | :--- | :--- | :--- | :--- |
| 训练集 | 10559 | 87.5% | 126710 | 87.9% |
| 验证集 | 1508 | 12.5% | 17401 | 12.1% |
| 总计 | 12067 | 100% | 144111 | 100% |

#### 文件格式分布

| 文件格式 | 数量 | 占比 |
| :--- | :--- | :--- |
| jpg | 12051 | 99.87% |
| jpeg | 15 | 0.12% |
| png | 1 | 0.01% |
| 总计 | 12067 | 100% |

#### 数据源分布

| 数据源 | 图像数量 | 占比 | 标注实例数 |
| :--- | :--- | :--- | :--- |
| VAIPE-mosaic | 3570 | 29.6% | 23707 |
| VAIPE-reannotated | 2462 | 20.4% | 9603 |
| Personal-251127 | 1250 | 10.4% | 21754 |
| VAIPE-test | 1500 | 12.4% | 4771 |
| NIH-Pill-rximage | 1045 | 8.7% | 26378 |
| pills-2602 | 527 | 4.4% | 16881 |
| Personal_mosaics | 568 | 4.7% | 33146 |
| Personal-251124 | 370 | 3.1% | 2937 |
| Negatives | 439 | 3.6% | 0 |
| Various | 141 | 1.2% | 624 |
| Ultralytics-medical-pills | 102 | 0.8% | 1805 |
| pills-search | 93 | 0.8% | 2505 |
| 总计 | 12067 | 100% | 144111 |

### 数据规模与类型

本数据集共包含12067张药片相关图像,其中训练集10559张,验证集1508张。标注实例总数达144111个,平均每张图像包含约11.9个药片标注。图像格式以JPG为主,占比超过99%。数据集覆盖多种药片类型、拍摄角度和背景环境,具有良好的多样性和代表性。

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
| :--- | :--- | :--- |
| 数据规模庞大 | 12067张图像,144111个标注实例 | 提供充足的训练样本,提升模型泛化能力 |
| 多源数据融合 | 整合12个不同来源数据集 | 增强数据多样性,覆盖多种场景 |
| 完整原始文件 | 包含高质量JPG/JPEG/PNG图像文件 | 支持图像识别、特征提取等多种计算机视觉任务 |
| 高质量标注 | YOLO格式标注,边界框准确 | 可直接用于目标检测模型训练 |
| 合理数据划分 | 训练集与验证集比例约7:1 | 支持模型训练与性能评估 |
| 负样本数据 | 包含439张负样本图像 | 可用于训练背景抑制和误检过滤 |
| 数据来源权威 | 包含NIH、VAIPE等权威机构数据 | 保证数据质量和可靠性 |
| 标注密度高 | 平均每张图像约11.9个标注 | 适合密集目标检测任务 |

## 数据样例

以下为数据集标注文件的样例展示,实际数据集中包含完整的原始图像文件:

### 标注样例

文件:VAIPE-test_TEST_VAIPE_P_45_0.txt
0 0.564105 0.563705 0.198562 0.166206
0 0.681128 0.616432 0.199200 0.109146
0 0.442754 0.730870 0.189934 0.181307
0 0.208890 0.380204 0.191151 0.129435

### 数据样例说明

样例数据展示了YOLO格式的目标检测标注,每行代表一个药片实例,格式为:
类别编号 中心点X 中心点Y 宽度 高度

其中:
- 类别编号0代表药片(pill)
- 坐标值已归一化到[0,1]范围
- 中心点坐标和尺寸均相对于图像宽高

### 不同来源样例文件名

| 序号 | 文件名 | 数据源 | 数据划分 |
| :--- | :--- | :--- | :--- |
| 1 | NIH-Pill-rximage_A_0015.jpg | NIH-Pill-rximage | train |
| 2 | VAIPE-mosaic_mosaic_01893.jpg | VAIPE-mosaic | train |
| 3 | Personal-251127_L0168.jpg | Personal-251127 | train |
| 4 | Ultralytics-medical-pills_Frame_112.jpg | Ultralytics-medical-pills | train |
| 5 | pills-2602_IMG_4234.jpg | pills-2602 | train |
| 6 | VAIPE-reannotated_VAIPE_P_401_5.jpg | VAIPE-reannotated | train |
| 7 | Negatives_I0001.jpg | Negatives | train |
| 8 | Various_tablets(13).jpg | Various | train |
| 9 | pills-search_ya4_0002.jpg | pills-search | train |
| 10 | Personal_mosaics_pm4_85_86_87_88.jpg | Personal_mosaics | train |
| 11 | VAIPE-mosaic_m_00005.jpg | VAIPE-mosaic | val |
| 12 | pills-2602_IMG_4209.jpg | pills-2602 | val |

## 应用场景

### 智能药房药片识别系统

基于本数据集训练的药片检测模型可应用于智能药房系统。在药房场景中,系统可以自动识别药架上的各类药片,实现药品库存管理、过期药品预警、药品分发辅助等功能。通过摄像头实时采集药架图像,检测模型能够准确识别每种药片的位置和数量,帮助药师快速完成药品盘点和配药工作,提高药房工作效率,减少人为错误。

### 医疗影像辅助诊断

药片检测技术在医疗影像领域具有重要应用价值。在临床场景中,医生常常需要对患者服用的药片进行确认和记录。基于本数据集训练的模型可以辅助医生识别患者手中或桌面上的药片,自动生成药品清单,减少人工记录的工作量和错误率。此外,该技术还可用于远程医疗场景,患者通过手机拍摄药片照片即可获得药品信息和用药建议。

### 药品质量检测与防伪

药品质量检测是保障公众用药安全的重要环节。利用药片检测技术,可以对药品的外观特征进行自动分析,识别假冒伪劣药品。本数据集包含多种药片的外观图像,训练出的模型能够识别药片的形状、颜色、标记等特征,帮助质检人员快速判断药品真伪和质量等级,提高检测效率和准确性。

### 机器人配药系统

随着自动化技术的发展,机器人配药系统逐渐成为医院药房的发展趋势。本数据集可用于训练机器人视觉系统,使其能够准确识别药盒中的药片,实现自动取药、分药和包装。通过精确的目标检测,机器人可以快速定位和抓取所需药品,完成配药任务,提高配药速度和准确性,降低人工成本。

### 药品信息检索与推荐

基于药片图像的检索系统可以帮助用户快速获取药品信息。用户只需拍摄药片照片,系统即可识别药片种类,并提供详细的药品说明、用法用量、注意事项等信息。本数据集丰富的图像数据为训练高精度的图像检索模型提供了基础,可应用于医疗App、在线药店等平台,为用户提供便捷的药品查询服务。

## 结尾

本数据集是一个大规模、高质量的药片目标检测数据集,包含12067张图像和144111个标注实例,涵盖多种药片类型和场景。数据集的核心优势在于其庞大的数据规模、多源融合的多样性以及完整的原始图像文件和高质量标注。

该数据集可广泛应用于智能药房、医疗影像诊断、药品质量检测、机器人配药等多个领域,为相关算法的研发和应用提供了坚实的数据基础。数据集采用标准的YOLO标注格式,便于直接用于主流目标检测框架的训练。

如有需要获取更多数据集相关信息或使用权限,请私信联系获取详细说明。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
大规模药片目标检测数据集:12067张图像与144111个标注实例的多源融合医学影像数据集
59
已售 -
1.39GB
申请报告