数据集简介
本数据集是面向农业智能识别领域的专业图像分类资源,汇集了五大主要粮食与经济作物的高质量图像样本。数据集包含1100张精心采集和处理的作物图像,涵盖小麦、甘蔗、黄麻、玉米、水稻五个类别,每个类别配备完整的数据增强版本,形成原始图像与多种变换图像的组合。所有图像均附带详细的类别标签和路径信息,已预处理为统一格式,适合直接用于深度学习模型训练。该数据集在农业自动化、作物识别、精准农业监测等场景中具有重要应用价值,可支持计算机视觉算法的研发与评估。
字段描述
| 数据类型 | 含义说明 | 示例值 | 完整性 | |
|---|---|---|---|---|
| Unnamed: 0 | 整数 | 记录索引编号 | 174 | 100% |
| path | 字符串 | 图像文件相对路径 | /kaggle/input/kag2/wheat/wheat019ahs.jpeg | 100% |
| crop | 字符串 | 作物类型名称(英文) | wheat, sugarcane, jute, maize, rice | 100% |
| croplabel | 整数 | 作物类别标签(数值编码) | 0-4 | 100% |
| filename | 字符串 | 图像文件名(提取后) | wheat019ahs.jpeg | 100% |
| augmentation | 字符串 | 数据增强类型标识 | original, ahs, ahf, arot |
数据分布统计
作物类别分布
| 图像数量 | 占比 | 累积占比 | 标签编码 | |
|---|---|---|---|---|
| 小麦(wheat) | 203 | 20.32% | 20.32% | 4 |
| 甘蔗(sugarcane) | 199 | 19.92% | 40.24% | 3 |
| 黄麻(jute) | 199 | 19.92% | 60.16% | 0 |
| 玉米(maize) | 199 | 19.92% | 80.08% | 1 |
| 水稻(rice) | 199 | 19.92% | 100.00% |
数据增强类型分布
| 数量 | 占比 | 累积占比 | 说明 | |
|---|---|---|---|---|
| original | 392 | 39.24% | 39.24% | 原始图像 |
| ahs | 196 | 19.62% | 58.86% | 水平移位增强 |
| ahf | 196 | 19.62% | 78.48% | 水平翻转增强 |
| arot | 190 | 19.02% | 97.50% | 旋转变换增强 |
| unknown | 25 | 2.50% | 100.00% |
图像存储目录统计
| 图像数量 | 用途说明 | |
|---|---|---|
| kag2 | 804张 | 主要训练数据集 |
| crop_images | 201张 | 原始作物图像 |
| some_more_images | 50张 | 补充图像样本 |
| test_crop_image | 45张 |
数据优势
| 具体表现 | 应用价值 | |
|---|---|---|
| 类别平衡性优异 | 五类作物分布均衡,每类约200张,最大类与最小类差异仅4张(2%) | 避免模型训练偏向,确保各类别识别精度均衡,提升分类器泛化能力 |
| 多样化数据增强 | 提供原始、水平移位、水平翻转、旋转四种增强类型,覆盖58.86%的数据集 | 显著扩充训练样本多样性,增强模型对图像变换的鲁棒性,减少过拟合风险 |
| 结构化标注完整 | 100%记录包含路径、作物名称、数值标签、增强类型四维度信息 | 支持多种训练框架直接加载,无需额外预处理,降低数据准备成本,加速模型开发 |
| 实际农业场景聚焦 | 聚焦全球主要粮食作物(小麦水稻玉米)与经济作物(甘蔗黄麻) | 直接对接精准农业、作物监测、农田管理实际需求,研究成果可快速落地应用 |
| 图像质量标准化 | 所有图像采用统一JPEG格式,命名规范清晰,路径层级一致 |
数据样本示例
以下展示从数据集中抽取的15个代表性样本,涵盖所有作物类别与多种增强类型:
样本1 - 小麦(水平移位增强)
路径: /kaggle/input/kag2/wheat/wheat019ahs.jpeg
作物: wheat
标签: 4
增强类型: ahs(水平移位)
样本2 - 小麦(水平翻转增强)
路径: /kaggle/input/kag2/wheat/wheat019ahf.jpeg
作物: wheat
标签: 4
增强类型: ahf(水平翻转)
样本3 - 小麦(原始图像)
路径: /kaggle/input/kag2/wheat/wheat036a.jpeg
作物: wheat
标签: 4
增强类型: original(原始)
样本4 - 甘蔗(水平翻转增强)
路径: /kaggle/input/kag2/sugarcane/sugarcane020ahf.jpeg
作物: sugarcane
标签: 3
增强类型: ahf(水平翻转)
样本5 - 甘蔗(旋转变换增强)
路径: /kaggle/input/kag2/sugarcane/sugarcane016arot.jpeg
作物: sugarcane
标签: 3
增强类型: arot(旋转)
样本6 - 甘蔗(旋转变换增强)
路径: /kaggle/input/kag2/sugarcane/sugarcane005arot.jpeg
作物: sugarcane
标签: 3
增强类型: arot(旋转)
样本7 - 黄麻(原始图像)
路径: /kaggle/input/kag2/jute/jute014a.jpeg
作物: jute
标签: 0
增强类型: original(原始)
样本8 - 黄麻(原始图像)
路径: /kaggle/input/kag2/jute/jute018a.jpeg
作物: jute
标签: 0
增强类型: original(原始)
样本9 - 黄麻(旋转变换增强)
路径: /kaggle/input/kag2/jute/jute035arot.jpeg
作物: jute
标签: 0
增强类型: arot(旋转)
样本10 - 玉米(水平移位增强)
路径: /kaggle/input/kag2/maize/maize018ahs.jpeg
作物: maize
标签: 1
增强类型: ahs(水平移位)
样本11 - 玉米(原始图像)
路径: /kaggle/input/kag2/maize/maize0003a.jpeg
作物: maize
标签: 1
增强类型: original(原始)
样本12 - 玉米(水平翻转增强)
路径: /kaggle/input/kag2/maize/maize027ahf.jpeg
作物: maize
标签: 1
增强类型: ahf(水平翻转)
样本13 - 水稻(旋转变换增强)
路径: /kaggle/input/kag2/rice/rice022arot.jpeg
作物: rice
标签: 2
增强类型: arot(旋转)
样本14 - 水稻(水平翻转增强)
路径: /kaggle/input/kag2/rice/rice021ahf.jpeg
作物: rice
标签: 2
增强类型: ahf(水平翻转)
样本15 - 水稻(原始图像)
路径: /kaggle/input/kag2/rice/rice029a.jpeg
作物: rice
标签: 2
增强类型: original(原始)
注:由于数据集为图像文件形式存储,上述样本展示的是CSV元数据记录。实际图像文件需通过路径字段访问对应的JPEG文件。所有图像均位于数据集的四个主目录(kag2、crop_images、some_more_images、test_crop_image)中,按作物类型组织子文件夹存储。
应用场景
场景一:深度学习作物分类模型训练
利用本数据集的1100张标注图像,可构建基于卷积神经网络的作物自动识别系统。数据集提供的四种增强类型(原始、水平移位、翻转、旋转)覆盖了图像采集中常见的角度与位置变化,能够有效提升模型对真实农田环境的适应能力。研究人员可采用迁移学习策略,在ResNet、EfficientNet等预训练模型基础上进行微调,快速构建准确率超过95%的五类作物分类器。训练过程中,可利用数据集的标准化标签(0-4整数编码)直接配置损失函数,无需额外的标签映射处理。该模型可部署于农业无人机、智能农机等设备,实现作物类型的实时识别,为精准施肥、病虫害防治提供基础数据支撑。
场景二:农业遥感图像分析与作物制图
在大规模农田监测中,本数据集可作为遥感影像解译的训练基准。通过将卫星或无人机获取的多光谱图像与数据集中的作物类别进行匹配,可建立区域作物种植分布图。数据集中小麦、水稻、玉米三大粮食作物的图像样本,结合甘蔗、黄麻等经济作物,能够支持混合种植区域的精细识别。研究者可融合光谱特征与纹理特征,构建多模态分类模型,将识别精度从传统方法的70%提升至85%以上。该应用对农业统计部门具有重要价值,可实现作物播种面积的自动化统计,替代传统的人工调查方式,显著降低调查成本并提高数据时效性。生成的作物分布图还可为农业保险、产量预测、政策制定提供科学依据。
场景三:移动端农业知识普及与识别应用
基于本数据集开发的轻量化模型,可集成到农民使用的移动应用中,实现田间作物的即拍即识功能。数据集提供的五类作物涵盖了全球种植面积最广的品种,具有广泛的用户需求。应用可采用MobileNet或ShuffleNet等高效架构,将模型大小压缩至10MB以内,支持离线识别。农民在田间遇到未知作物时,通过手机拍照即可获得种类鉴定、生长特性、栽培要点等知识推送。数据集中的多样化增强样本确保了模型在不同光照、角度条件下的识别稳定性,即使在阴天、逆光等复杂场景下也能保持较高准确率。该应用不仅服务于种植户的技术学习,还可辅助农技推广人员开展培训,通过图像识别结果快速建立沟通话题,提升技术推广效率。
场景四:农业机器人视觉系统开发
本数据集可用于训练农业机器人的视觉感知模块,使其具备作物类型识别能力。在智能除草机器人场景中,通过识别玉米、水稻等作物位置,可实现精准避让,仅对杂草施用除草剂,降低农药使用量50%以上。数据集中的增强样本模拟了机器人移动过程中的视角变化,能够提升视觉系统的鲁棒性。在收获机器人应用中,通过识别小麦、甘蔗等作物,可自动调整收割参数,适应不同作物的物理特性,提高收获效率并减少籽粒损失。此外,数据集的结构化标注支持实时推理,满足机器人视觉系统毫秒级响应的需求。研究团队可基于该数据集构建端到端的视觉-控制系统,推动农业机器人从实验室走向规模化商业应用。
场景五:农业教育与科研实验教学
本数据集为农业院校、计算机科学专业提供了理想的教学案例资源。在机器学习课程中,教师可利用该数据集演示图像分类的完整流程,从数据加载、预处理、模型训练到性能评估,所有环节均可在2-3课时内完成,学生能够快速建立对深度学习应用的直观认识。数据集的五分类任务难度适中,既不像二分类过于简单,也不像ImageNet千分类那样复杂,适合初学者掌握分类算法原理。在科研实验中,研究生可基于该数据集开展对比研究,测试不同网络架构(如VGG、ResNet、Inception)在农业图像识别中的表现差异,或探索数据增强策略对模型泛化能力的影响。数据集提供的增强类型标签,便于分析不同变换对识别精度的贡献度,为学术论文提供实验支撑。此外,该数据集还可用于举办农业AI竞赛,激发学生创新兴趣,培养跨学科人才。
数据集总结
本农作物图像识别数据集以其精心设计的类别平衡、丰富的数据增强和完整的结构化标注,为农业智能化研究提供了高质量的基础资源。数据集包含999条元数据记录对应1100张实际图像文件,覆盖小麦、甘蔗、黄麻、玉米、水稻五大主要作物,每类样本量接近200张,确保了训练数据的均衡性。四种增强类型(原始、水平移位、水平翻转、旋转)的系统化应用,使数据集兼具数量规模与样本多样性,能够支持深度学习模型在实际农业场景中的稳健部署。
数据集的标注体系采用双重编码机制,既提供作物英文名称(crop字段)便于国际学术交流,又配备数值标签(croplabel字段0-4)便于算法直接调用,无需额外映射。所有记录字段完整性达到100%,无缺失值问题,显著降低了数据清洗工作量。图像文件按照作物类型分目录存储(kag2主目录占比73%),路径信息清晰规范,支持批量加载与自动化处理流程。
从应用价值来看,该数据集在精准农业监测、作物自动识别、农业机器人视觉系统、移动端农技服务等领域具有直接的实用性。其聚焦的五类作物占全球粮食产量的重要比重,研究成果可快速转化为实际生产力。对于农业院校和科研机构,该数据集提供了完整的教学实验案例,适合用于机器学习课程演示、毕业设计项目以及算法对比研究。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:









