# PlantDoc植物疾病图像数据集
## 引言与背景
在现代农业领域,植物病害的早期检测与识别对于保障作物产量和质量具有至关重要的意义。传统的病害识别依赖专业农艺师的肉眼观察,效率低且主观性强。随着人工智能技术的发展,基于计算机视觉的植物病害自动识别系统成为研究热点,而高质量的标注数据集是训练精准识别模型的基础。
本数据集(PlantDoc)是一个专门针对植物叶片病害检测的大规模图像数据集,包含2330张高分辨率叶片图像,涵盖30种不同的植物类别,其中既包括健康叶片也包括多种病害叶片。每个图像都配有详细的XML格式标注文件,包含精确的边界框坐标和类别标签,为目标检测算法的训练提供了完整的监督信息。
数据集由图像文件和标注文件两部分组成:图像文件采用PNG格式存储于images目录,尺寸统一为100×100像素;标注文件采用PASCAL VOC格式的XML文件存储于annotations目录,包含图像尺寸、目标对象名称、边界框坐标等元数据。这种完整的数据构成使得该数据集不仅适用于学术研究,也能直接应用于实际的农业病害检测系统开发。
## 数据基本信息
### 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| folder | string | 图像所在文件夹 | images | 100% |
| filename | string | 图像文件名 | plantdoc0.png | 100% |
| width | int | 图像宽度(像素) | 100 | 100% |
| height | int | 图像高度(像素) | 100 | 100% |
| depth | int | 图像通道数 | 3 | 100% |
| segmented | int | 是否分割标注 | 0 | 100% |
| object/name | string | 目标类别名称 | Tomato Septoria leaf spot | 100% |
| object/pose | string | 物体姿态 | Unspecified | 100% |
| object/truncated | int | 是否截断 | 0 | 100% |
| object/occluded | int | 是否遮挡 | 0 | 100% |
| object/difficult | int | 是否难以识别 | 0 | 100% |
| object/bndbox/xmin | int | 边界框左上角x坐标 | 1 | 100% |
| object/bndbox/ymin | int | 边界框左上角y坐标 | 2 | 100% |
| object/bndbox/xmax | int | 边界框右下角x坐标 | 99 | 100% |
| object/bndbox/ymax | int | 边界框右下角y坐标 | 99 | 100% |
### 类别分布情况
| 类别名称 | 标注数量 | 占比 |
|---------|---------|------|
| Blueberry leaf | 816 | 9.72% |
| Tomato leaf yellow virus | 759 | 9.04% |
| Peach leaf | 604 | 7.19% |
| Raspberry leaf | 539 | 6.42% |
| Strawberry leaf | 462 | 5.50% |
| Tomato Septoria leaf spot | 402 | 4.79% |
| Tomato leaf | 373 | 4.44% |
| Corn leaf blight | 356 | 4.24% |
| Bell_pepper leaf | 312 | 3.72% |
| Potato leaf early blight | 301 | 3.58% |
| Tomato mold leaf | 279 | 3.32% |
| Tomato leaf bacterial spot | 266 | 3.17% |
| Squash Powdery mildew leaf | 248 | 2.95% |
| Bell_pepper leaf spot | 248 | 2.95% |
| Soyabean leaf | 246 | 2.93% |
| Apple leaf | 237 | 2.82% |
| Potato leaf late blight | 235 | 2.80% |
| Tomato leaf mosaic virus | 225 | 2.68% |
| Cherry leaf | 220 | 2.62% |
| grape leaf | 205 | 2.44% |
| Tomato leaf late blight | 204 | 2.43% |
| Tomato Early blight leaf | 193 | 2.30% |
| Apple rust leaf | 167 | 1.99% |
| Apple Scab Leaf | 158 | 1.88% |
| grape leaf black rot | 125 | 1.49% |
| Corn rust leaf | 117 | 1.39% |
| Corn Gray leaf spot | 72 | 0.86% |
| Soybean leaf | 15 | 0.18% |
| Potato leaf | 11 | 0.13% |
| Tomato two spotted spider mites leaf | 2 | 0.02% |
### 数据规模统计
- 图像总数: 2330张
- 标注文件数: 2330个
- 标注对象总数: 8397个
- 类别数量: 30个
- 图像格式: PNG
- 图像尺寸: 100×100像素
- 标注格式: PASCAL VOC XML
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 完整原始图像 | 包含2330张完整PNG格式叶片图像,尺寸统一为100×100像素 | 可直接用于图像识别、特征提取、模型训练 |
| 高质量标注 | 每个图像均配有精确的XML标注文件,包含边界框坐标和类别标签 | 支持目标检测、实例分割等监督学习任务 |
| 多类别覆盖 | 涵盖30种植物类别,包含健康叶片和多种病害叶片 | 支持多分类、细粒度识别研究 |
| 标注完整性 | 所有图像均有对应标注,无缺失数据 | 保证模型训练数据的完整性和一致性 |
| 标准格式 | 采用PASCAL VOC格式,兼容主流检测框架 | 便于快速接入现有深度学习训练流程 |
| 多病害类型 | 包含多种常见植物病害,如叶斑病、霉病、病毒病等 | 支持病害诊断算法的综合测试 |
## 数据样例
### 标注文件样例
plantdoc0.xml - Tomato Septoria leaf spot(番茄早疫病叶片)xml
<annotation>
<folder>images</folder>
<filename>plantdoc0.png</filename>
<size>
<width>100</width>
<height>100</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>Tomato Septoria leaf spot</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<occluded>0</occluded>
<difficult>0</difficult>
<bndbox>
<xmin>1</xmin>
<ymin>2</ymin>
<xmax>99</xmax>
<ymax>99</ymax>
</bndbox>
</object>
</annotation>plantdoc10.xml - Peach leaf(桃树叶片,多目标标注)
xml
<annotation>
<folder>images</folder>
<filename>plantdoc10.png</filename>
<size>
<width>100</width>
<height>100</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>Peach leaf</name>
<bndbox><xmin>12</xmin><ymin>1</ymin><xmax>69</xmax><ymax>79</ymax></bndbox>
</object>
<object>
<name>Peach leaf</name>
<bndbox><xmin>33</xmin><ymin>11</ymin><xmax>68</xmax><ymax>99</ymax></bndbox>
</object>
</annotation>### 类别样例列表
1. Blueberry leaf - 蓝莓叶片
2. Tomato leaf yellow virus - 番茄黄化病毒病
3. Peach leaf - 桃树叶片
4. Raspberry leaf - 覆盆子叶片
5. Strawberry leaf - 草莓叶片
6. Tomato Septoria leaf spot - 番茄早疫病
7. Corn leaf blight - 玉米叶枯病
8. Bell_pepper leaf - 甜椒叶片
9. Potato leaf early blight - 马铃薯早疫病
10. Tomato leaf bacterial spot - 番茄细菌性斑点病
11. Squash Powdery mildew leaf - 南瓜白粉病
12. Apple leaf - 苹果叶片
13. Potato leaf late blight - 马铃薯晚疫病
14. Cherry leaf - 樱桃叶片
15. grape leaf black rot - 葡萄黑腐病
> 注:实际数据集中包含完整的原始PNG图像文件,由于格式限制无法在此展示,数据集可直接用于图像识别、特征提取等计算机视觉任务。
## 应用场景
### 植物病害智能检测系统开发
基于本数据集训练的深度学习模型可应用于植物病害智能检测系统。通过对叶片图像的实时分析,系统能够自动识别病害类型并提供诊断建议。这种系统可部署在移动设备或农业监测平台上,帮助农户快速准确地识别作物病害,及时采取防治措施。数据集包含的30种植物类别涵盖了多种重要经济作物,使得训练出的模型具有广泛的适用性。
### 计算机视觉算法研究
该数据集为计算机视觉领域的研究提供了丰富的测试数据。研究人员可利用这些数据开发和验证新的目标检测算法、图像分类算法和实例分割算法。特别是对于细粒度分类任务,数据集包含的多种相似病害类别为算法的鲁棒性测试提供了良好的基准。此外,数据集的标准PASCAL VOC格式便于与现有算法框架对接,降低了研究门槛。
### 农业生产智能辅助决策
在精准农业场景中,基于本数据集训练的模型可与无人机、物联网设备结合,实现大面积农田的病害监测。通过定期采集农田图像并进行自动分析,系统能够生成病害分布热力图,帮助农业管理者制定精准的防治策略,减少农药使用量,提高农产品质量。这种应用模式对于实现可持续农业发展具有重要意义。
### 学术研究与教学
该数据集适合作为高校和研究机构的教学资源。学生可以利用这些数据学习计算机视觉、机器学习等相关知识,实践目标检测、图像分类等任务。同时,数据集也为学术论文提供了标准化的实验基准,便于不同研究成果之间的比较和验证。
### 移动端病害识别App开发
基于本数据集训练的轻量化模型可部署在移动应用中,为普通用户提供便捷的植物病害识别服务。用户只需拍摄叶片照片,App即可自动识别病害类型并提供相应的防治建议。这种应用形式能够有效普及植物病害知识,帮助种植爱好者更好地管理植物健康。
## 结尾
PlantDoc植物疾病图像数据集是一个高质量、多类别、标注完整的植物叶片图像数据集,包含2330张图像和8397个标注对象,涵盖30种植物类别。其完整的原始图像和精确的边界框标注为植物病害检测领域的研究和应用提供了坚实的数据基础。
数据集的核心优势在于其完整性和标注质量:每个图像都配有详细的XML标注文件,包含精确的边界框坐标和类别标签,支持多种计算机视觉任务。这使得该数据集不仅适用于学术研究,也能直接应用于实际的农业病害检测系统开发。
如需获取数据集或了解更多信息,可私信获取详细资料。该数据集可广泛应用于植物病害智能检测、计算机视觉算法研究、农业生产智能辅助决策等多个领域,具有重要的科研价值和应用前景。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:





